CN107273985B - 一种地质体的数字特征度量方法及系统 - Google Patents

一种地质体的数字特征度量方法及系统 Download PDF

Info

Publication number
CN107273985B
CN107273985B CN201710307823.2A CN201710307823A CN107273985B CN 107273985 B CN107273985 B CN 107273985B CN 201710307823 A CN201710307823 A CN 201710307823A CN 107273985 B CN107273985 B CN 107273985B
Authority
CN
China
Prior art keywords
sample
variable
calculating
spatial
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710307823.2A
Other languages
English (en)
Other versions
CN107273985A (zh
Inventor
路来君
曹梦雪
辛双
赵海士
谭雨蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201710307823.2A priority Critical patent/CN107273985B/zh
Publication of CN107273985A publication Critical patent/CN107273985A/zh
Application granted granted Critical
Publication of CN107273985B publication Critical patent/CN107273985B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/02Reservations, e.g. for tickets, services or events
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mining & Mineral Resources (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种地质体的数字特征度量方法及系统,方法包括:S1、对地质体的原始地质数据进行变量优选和样本优选,得到优选变量和优选样本,将所有优选样本组成第一样本集合;S2、对第一样本集合进行预处理,得到第二样本集合;S3、对第二样本集合中每个样本进行标度计算,得到每个样本的标度值;S4、对每个标度值进行空间频谱计算,得到地质体的空间谱密度信息和空间变异信息;S5、对空间谱密度信息和空间变异信息进行综合分析,得到地质体的数字频谱特征。本发明的有益效果是:本技术方案通过频谱模型进行系统的、综合性的数据结构与数字特征分析,进而识别地质体、地质体组合及地质建造等不同级别地质体的空间分布与变异特征。

Description

一种地质体的数字特征度量方法及系统
技术领域
本发明涉及地质空间地质体定量分析领域,特别涉及一种地质体的数字特征度量方法及系统。
背景技术
地质体数字特征研究作为一种国内外数学地球科学研究的热点与难点问题,已经引起广大地球科学工作者的高度重视,尤其在以超级计算机为平台的大数据时代,地质过程模拟仿真这一地学顽固堡垒亟待攻破,所依赖的必要性理论模型离不开地质体数字特征的支撑。
地质体具有不同等级,不同规模,不同序次,诸如沉积盆地就可以看作为大型地质体,盆地内部按地层组合关系又可以分为不同的沉积建造,不同的建造又可以细分为不同的沉积相、不同的含矿地层。每一个级别的地质体内某种属性的分布与变异性度量,均可估算其数字频谱特征,小到微观的岩石矿物,大到盆地空间,均可以视为其内部包含的各细分地质体各自的空间谱密度计算合成而来,诸如火山岩建造杂岩体各个组成部分的频谱合成可以表征火山建造的平均频谱信息。而这种函数合成计算过程,理论上仅凭多元统计分析方法计算是无法达到的。
发明内容
本发明提供了一种地质体的数字特征度量方法及系统,解决了现有技术中地质空间复杂堆积条件下地质体模式识别困难的技术问题。
本发明解决上述技术问题的技术方案如下:一种地质体的数字特征度量方法,包括:
S1、对地质体的原始地质数据进行变量优选和样本优选,得到优选变量和优选样本,将所有优选样本组成第一样本集合,每个优选样本均具有相同的变量组,所述变量组包括多个变量,具体包括
S11、将地质体的原始地质数据设为矩阵
Figure GDA0002562007260000021
将变量
Figure GDA0002562007260000022
与变量
Figure GDA0002562007260000023
之间的亲和力F设为
Figure GDA0002562007260000024
其中,dkl为变量
Figure GDA0002562007260000025
与变量
Figure GDA0002562007260000026
之间的差异度量距离,n为样本数量,m为每个样本的变量数量,m和n均为正整数,k,l=1,2,…,m,i=1,2,…,n,j=1,2,…,m;
S12、设置距离矩阵D=(dkl)m×m,给变量
Figure GDA0002562007260000027
赋予权重向量βl,将变量
Figure GDA0002562007260000028
与变量
Figure GDA0002562007260000029
之间亲和力F设为:
Figure GDA00025620072600000210
其中,β'为β的转置矩阵,X'为X的转置矩阵;
S13、当F取最大值时,计算得到所述原始地质数据中每个变量的贡献权重β=(β12,…,βm)',将贡献权重处于预设阈值范围内的变量作为优选变量,将具有所述优选变量的样本作为优选样本;S2、对所述第一样本集合进行预处理,得到统一量纲后的第二样本集合,具体包括:
通过下式对所述第一样本集合中每个样本xij进行预处理,得到统一量纲后的样本x′ij组成的第二样本集合,
Figure GDA0002562007260000031
其中,
Figure GDA0002562007260000032
和σj分别为第i个变量的最小值和样本标准差,s=1,2,…,n;
S3、对所述第二样本集合中每个样本进行标度计算,得到每个样本的标度值;
S4、对每个所述标度值进行空间频谱计算,得到所述地质体的空间谱密度信息和空间变异信息;
S5、对所述空间谱密度信息和所述空间变异信息进行综合分析,得到所述地质体的数字频谱特征。
本发明的有益效果是:本技术方案从地质大数据的融合分析角度构造出综合反映地质体数字特征的频谱模型,通过频谱模型进行系统的、综合性的数据结构与数字特征分析,进而识别地质体、地质体组合及地质建造等不同级别地质体的空间分布与变异特征,便于提取地质异常相关信息,实施空间预测与决策,为资源潜力评价提供一种方法,同时,进一步提高地质体数字特征研究在矿产预测与灾害预警等方面的应用效果及实用价值。
优选地,步骤S1之前,还包括:
S0、为原始地质数据中每个样本建立属性表,所述属性表包括:属性选项、取样间隔确定、定量数据归类、定性数据筛选和变量分类。
优选地,步骤S3包括:
S31、将所述第二样本集合中任一样本中预设属性设为因变量y,将该样本中除该属性外的其他属性设为自变量xj,将已知的因变量y和自变量xj代入:
Figure GDA0002562007260000041
计算得到回归系数b0,b1,b2,…,bm
S32、将所述回归系数输入多元线性回归模型中,计算得到每个属性对应的偏回归平方和V1,V2,…,Vm
S33、当因变量y、自变量xj以及系数α和β均满足:
Figure GDA0002562007260000042
计算得到:
Figure GDA0002562007260000043
S34、将计算得到的系数α和β代入:
Figure GDA0002562007260000044
计算得到当前样本的标度值d;
S35、通过上述步骤计算得到所述第二样本集合中每个样本的标度值。
一种地质体的数字特征度量系统,包括:
优选模块,用于对地质体的原始地质数据进行变量优选和样本优选,得到优选变量和优选样本,将所有优选样本组成第一样本集合,每个优选样本均具有相同的变量组,所述变量组包括多个变量;所述优选模块包括:
第一设置子模块,用于将地质体的原始地质数据设为矩阵
Figure GDA0002562007260000051
将变量
Figure GDA0002562007260000052
与变量
Figure GDA0002562007260000053
之间的亲和力F设为
Figure GDA0002562007260000054
其中,dkl为变量
Figure GDA0002562007260000055
与变量
Figure GDA0002562007260000056
之间的差异度量距离,n为样本数量,m为每个样本的变量数量,m和n均为正整数,k,l=1,2,…,m,i=1,2,…,n,j=1,2,…,m;
第二设置子模块,用于设置距离矩阵D=(dkl)m×m,给变量
Figure GDA0002562007260000057
赋予权重向量βl,将变量
Figure GDA0002562007260000058
与变量
Figure GDA0002562007260000059
之间亲和力F设为:
Figure GDA00025620072600000510
其中,β'为β的转置矩阵,X'为X的转置矩阵;
第一计算子模块,用于当F取最大值时,计算得到所述原始地质数据中每个变量的贡献权重β=(β12,…,βm)',将贡献权重处于预设阈值范围内的变量作为优选变量,将具有所述优选变量的样本作为优选样本。
预处理模块,用于对所述第一样本集合进行预处理,得到统一量纲后的第二样本集合,所述预处理模块中,通过下式对所述第一样本集合中每个样本xij进行预处理,得到统一量纲后的样本x′ij组成的第二样本集合,
Figure GDA0002562007260000061
其中,
Figure GDA0002562007260000062
和σj分别为第i个变量的最小值和样本标准差,s=1,2,…,n。标度计算模块,用于对所述第二样本集合中每个样本进行标度计算,得到每个样本的标度值;
频谱计算模块,用于对每个所述标度值进行空间频谱计算,得到所述地质体的空间谱密度信息和空间变异信息;
分析模块,用于对所述空间谱密度信息和所述空间变异信息进行综合分析,得到所述地质体的数字频谱特征。
建立模块,用于为原始地质数据中每个样本建立属性表,所述属性表包括:属性选项、取样间隔确定、定量数据归类、定性数据筛选和变量分类。
优选地,所述标度计算模块包括:
第二计算子模块,用于将所述第二样本集合中任一样本中预设属性设为因变量y,将该样本中除该属性外的其他属性设为自变量xj,将已知的因变量y和自变量xj代入:
Figure GDA0002562007260000063
计算得到回归系数b0,b1,b2,…,bm
第三计算子模块,用于将所述回归系数输入多元线性回归模型中,计算得到每个属性对应的偏回归平方和V1,V2,…,Vm
第四计算子模块,用于当因变量y、自变量xj以及系数α和β均满足:
Figure GDA0002562007260000071
计算得到:
Figure GDA0002562007260000072
第五计算子模块,用于将计算得到的系数α和β代入:
Figure GDA0002562007260000073
计算得到当前样本的标度值d;
第六计算子模块,用于通过上述步骤计算得到所述第二样本集合中每个样本的标度值。
附图说明
图1为本发明实施例提供的一种地质体的数字特征度量方法的流程示意图;
图2为本发明另一实施例提供的一种地质体的数字特征度量系统的结构示意图;
图3为本发明另一实施例提供的一种地质体的数字特征度量系统的结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,一种地质体的数字特征度量方法,包括:
S1、对地质体的原始地质数据进行变量优选和样本优选,得到优选变量和优选样本,将所有优选样本组成第一样本集合,每个优选样本均具有相同的变量组,变量组包括多个变量,具体包括:
S11、将地质体的原始地质数据设为矩阵
Figure GDA0002562007260000081
将变量
Figure GDA0002562007260000082
与变量
Figure GDA0002562007260000083
之间的亲和力F设为
Figure GDA0002562007260000084
其中,dkl为变量
Figure GDA0002562007260000085
与变量
Figure GDA0002562007260000086
之间的差异度量距离,n为样本数量,m为每个样本的变量数量,m和n均为正整数,k,l=1,2,…,m,i=1,2,…,n,j=1,2,…,m;
S12、设置距离矩阵D=(dkl)m×m,给变量
Figure GDA0002562007260000087
赋予权重向量βl,将变量
Figure GDA0002562007260000088
与变量
Figure GDA0002562007260000089
之间亲和力F设为:
Figure GDA00025620072600000810
其中,β'为β的转置矩阵,X'为X的转置矩阵;
S13、当F取最大值时,计算得到原始地质数据中每个变量的贡献权重β=(β12,…,βm)',将贡献权重处于预设阈值范围内的变量作为优选变量,将具有优选变量的样本作为优选样本;
S2、对第一样本集合进行预处理,得到统一量纲后的第二样本集合;
具体地,步骤S2中,通过下式对第一样本集合中每个样本xij进行预处理,得到统一量纲后的样本x′ij组成的第二样本集合,
Figure GDA0002562007260000091
其中,
Figure GDA0002562007260000092
和σj分别为第i个变量的最小值和样本标准差,s=1,2,…,n,i=1,2,…,n,j=1,2,…,m,其中,
Figure GDA0002562007260000093
收集到的数据信息不是单一类型数据,而是由多类型、多量纲、多源的复杂数据构成的样本数据集合,需要进行预处理化为统一量纲下的数据集合,之后才能进入方法计算。本发明方法中主要采用上述改进标准化法进行原始数据预处理,经平移变换,全部各类数据均处于无量纲的统一坐标尺度下,利于融合分析。此处构造意在避免数据变换后出现负数效应,更好的还原数据原始信息。
S3、对第二样本集合中每个样本进行标度计算,得到每个样本的标度值;
S4、对每个标度值进行空间频谱计算,得到地质体的空间谱密度信息和空间变异信息;
S5、对空间谱密度信息和空间变异信息进行综合分析,得到地质体的数字频谱特征。
应理解,地质体频谱波形合成实质是将各个相关地质体的单一频谱进行叠加计算,形成统一波形谱,以此来表达该地质体的地学综合信息,从而完成整个地质体集合的数字特征计算。这种地质体频谱合成计算实质上是为地质体的空间界面识别、空间组合关系度量及地质体细分提供一种尝试性的新方法,尤其是在岩相分类研究中,通过频谱合成的计算可以识别岩相的边界;在求得每一地质体单元空间谱密度后,可通过傅里叶逆变换的过程获得该地质体内的空间变异信息,利用这种空间变异特征就可以进行矿化品位计算、资源储量计算,进而实施空间预测。具体地,以地质空间“四性”(多元性、异构性、周期性、广延性)、地质体混成堆积特性、地质空间分布与变异性及地质空间“三相”(平稳相、突变相、交互相)结构划分为基础,建立地质空间数字频谱方法。其中,地质空间分布与变异性分析是实现地质异常确定的核心内容。地质空间分布可以解释为“在哪里存在”,地质空间变异可解释为“为什么存在”。
应理解,一般情况下,地学原始数据均存在大量的无效值或伪值,这是形成地质噪音的主要来源,在一定程度上将严重影响模型方法的稳定性;样本与变量优选是空间频谱计算前必须进行的有效工作。关于样本与变量的优选分析利用如下方法,对样本变量进行优选,方法原理具体如下:
对于特定的数据矩阵
Figure GDA0002562007260000101
元素变量
Figure GDA0002562007260000102
与变量
Figure GDA0002562007260000103
之间亲和力应与他们之间相关或匹配成正比,而与他们之间的差异或距离成反比,将变量之间的这种亲和力表达成下式:
Figure GDA0002562007260000104
其中,dij表示为距离,i,j=1,2,…,m,对于度量距离,为优选变量,设D=(dkl)m×m,D为距离矩阵,现对(1)式中的变量赋予变量权向量,为度量变量间亲和力,仿经典力学原理(万有引力定律),亲和力应与承载的两两样本乘积成正比,与两者距离平方成反比,可表达为如下:
Figure GDA0002562007260000111
而对于标准化数据而言,R=X'X为相关矩阵,则(2)式可表达为:
Figure GDA0002562007260000112
而对于样本实现而言,理想情形的F应取最大值,即max(F)。
最终得到样本或变量的贡献权重β=(β12,…,βm)',即亲和力关系,依此关系进行优选。削弱样本与变量携带的噪音,提高模型方法的稳定性,还原更客观的数据结构关系。
将优选后的样本与变量数据组成大数据集合,如:
Figure GDA0002562007260000113
X矩阵反映的信息不是单一类型数据,而是由多类型、多量纲、多源的复杂数据构成的n×m阶样本数据集合。
具体地,步骤S1之前,还包括:
S0、为原始地质数据中每个样本建立属性表,属性表包括:属性选项、取样间隔确定、定量数据归类、定性数据筛选和变量分类。
应理解,首先,需要进行地质数据资料收集,收集的资料主要包括文字资料、方法计算的数据资料及相关图件,为了更好的了解数据的结构与信息,针对数据资料进行属性表设计,包括:属性选项、取样间隔确定、定量数据归类、定性数据筛选、变量分类等内容。
具体地,步骤S3包括:
S31、将第二样本集合中任一样本中预设属性设为因变量y,将该样本中除预设属性外的其他属性设为自变量xj,将已知的因变量y和自变量xj代入:
Figure GDA0002562007260000121
计算得到回归系数b0,b1,b2,…,bm
S32、将回归系数输入多元线性回归模型中,计算得到每个属性对应的偏回归平方和V1,V2,…,Vm
S33、当因变量y、自变量xj以及系数α和β均满足:
Figure GDA0002562007260000122
计算得到:
Figure GDA0002562007260000123
S34、将计算得到的系数α和β代入:
Figure GDA0002562007260000131
计算得到当前样本的标度值d;
S35、通过上述步骤计算得到第二样本集合中每个样本的标度值。
应理解,利用预处理后的原始数据进行标度计算,设某一样本的某一特定意义属性为因变量y,该样本的其他属性则分别为自变量xj,j=1,2,…,m
Figure GDA0002562007260000132
其中,b0和b1,b2,…,bm为回归系数。
其中,每一样本数据点和它在回归直线上相应位置的差异
Figure GDA0002562007260000133
是随机误差的效应,称为残差,
Figure GDA0002562007260000134
称为残差平方和;
Figure GDA0002562007260000135
表示总的效应,称为总偏差平方和。当从多元回归全模型中取消一个自变量后,回归平方和减少的部分,称为这个自变量对因变量的偏回归平方和,即这个自变量对因变量的回归贡献。我们以此原则求取各自变量对应的偏回归平方和V1,V2,…,Vm
使因变量y、自变量xj以及系数α和β满足:
Figure GDA0002562007260000136
则有
Figure GDA0002562007260000141
设d为标度,满足:
Figure GDA0002562007260000142
将求得的α,β代入(7)式,则可求得标度d。
这里需要特别说明的是,在构造标度时,(4)式还可以采取计算复杂程度更高的形式,如:
Figure GDA0002562007260000143
等,但效果依实际需求与测试效果而定。
通过综合标度计算法,计算每个样本的空间标度值(样本的综合值),作为方法计算过程中大样本的初始样本值,而这种综合标度反映了高度浓缩的多要素组合匹配机制,包含多要素的共同信息,保证了每一要素信息不损失,同时在多要素之间还满足一定的相关关系。
计算得到每个样本的标度值后,利用标度值进行空间频谱计算,具体方法如下:
设有平稳序列X(t)样本标度数据,令t2-t1=τ,则Rx(t1,t2)=Rx(t2-t1)=Rx(τ)。X(t)的空间谱密度和自相关函数分别用S(ω)与R(τ)表示。则由平稳定义可知,Rx(t1,t2)与位置t1,t2选择无关,仅与(t2-t1)大小有关。
则有
Figure GDA0002562007260000151
Figure GDA0002562007260000152
(8)、(9)公式中Sx(ω)与RX(τ)实际计算一般采用迭代近似公式,本发明主要采用如下方法:
在某些特定的情况下,变异函数Rx(τ)的傅里叶变换存在,且可被定义为
Figure GDA0002562007260000153
式中,ω=2πf;f为振动频率。通过傅里叶反变换,有如下形式
Figure GDA0002562007260000154
设有T=NTs,τn=nTs,Rn=R(τn),n=0,1,…,N-1;其中N为采样点数,Ts为采样平均间隔,τn是采样坐标。因为空间序列是离散的、不连续的,所以函数S(ω)并不是对每一个ω都有意义,而仅对一些特定的ωm值才有定义,这里设ωm都是
Figure GDA0002562007260000155
的倍数,即:
Figure GDA0002562007260000156
其中m=0,1,…,N-1,则(10)式可扩展到离散域,则有
Figure GDA0002562007260000157
考虑到仅定义在离散的值,也仅定义在离散值,式(12)则可表示为
Figure GDA0002562007260000158
则定义傅里叶反变换,有
Figure GDA0002562007260000161
上式中的X(t)在频谱实际计算中均为样本标度数据,Rxn)即相当于第n个变异值。根据样品标度值d1,d2,…,dn,令τr=rΔt,r=0,1,…,m,m≤n。
则有自相关函数:
Figure GDA0002562007260000162
为消除样品标度值对自相关函数度量的影响,采取无量纲统一尺度如下变换:
Figure GDA0002562007260000163
由上看出,对于不同空间步长的τn,具有不同的空间谱密度S(ωm)与变异函数Rxn),全部的空间谱密度函数集合与变异函数集合构成空间频谱系列计算。
如图2所示,一种地质体的数字特征度量系统,包括:
优选模块1,用于对地质体的原始地质数据进行变量优选和样本优选,得到优选变量和优选样本,将所有优选样本组成第一样本集合,每个优选样本均具有相同的变量组,变量组包括多个变量;
具体地,如图3所示,优选模块1包括:
第一设置子模块11,用于将地质体的原始地质数据设为矩阵
Figure GDA0002562007260000164
将变量
Figure GDA0002562007260000165
与变量
Figure GDA0002562007260000166
之间的亲和力F设为
Figure GDA0002562007260000171
其中,dkl为变量
Figure GDA0002562007260000172
与变量
Figure GDA0002562007260000173
之间的差异度量距离,n为样本数量,m为每个样本的变量数量,m和n均为正整数,k,l=1,2,…,m,i=1,2,…,n,j=1,2,…,m;
第二设置子模块12,用于设置距离矩阵D=(dkl)m×m,给变量
Figure GDA0002562007260000174
赋予权重向量βl,将变量
Figure GDA0002562007260000175
与变量
Figure GDA0002562007260000176
之间亲和力F设为:
Figure GDA0002562007260000177
其中,β'为β的转置矩阵,X'为X的转置矩阵;
第一计算子模块13,用于当F取最大值时,计算得到原始地质数据中每个变量的贡献权重β=(β12,…,βm)',将贡献权重处于预设阈值范围内的变量作为优选变量,将具有优选变量的样本作为优选样本。预处理模块2,用于对第一样本集合进行预处理,得到统一量纲后的第二样本集合;
预处理模块2中,通过下式对第一样本集合中每个样本xij进行预处理,得到统一量纲后的样本x′ij组成的第二样本集合,
Figure GDA0002562007260000178
其中,
Figure GDA0002562007260000179
和σj分别为第i个变量的最小值和样本标准差,s=1,2,…,n。
标度计算模块3,用于对第二样本集合中每个样本进行标度计算,得到每个样本的标度值;
频谱计算模块4,用于对每个标度值进行空间频谱计算,得到地质体的空间谱密度信息和空间变异信息;
分析模块5,用于对空间谱密度信息和空间变异信息进行综合分析,得到地质体的数字频谱特征。
建立模块6,用于为原始地质数据中每个样本建立属性表,属性表包括:属性选项、取样间隔确定、定量数据归类、定性数据筛选和变量分类。
具体地,如图3所示,标度计算模块3包括:
第二计算子模块31,用于将第二样本集合中任一样本中预设属性设为因变量y,将该样本中除该属性外的其他属性设为自变量xj,将已知的因变量y和自变量xj代入:
Figure GDA0002562007260000181
计算得到回归系数b0,b1,b2,…,bm
第三计算子模块32,用于将回归系数输入多元线性回归模型中,计算得到每个属性对应的偏回归平方和V1,V2,…,Vm
第四计算子模块33,用于当因变量y、自变量xj以及系数α和β均满足:
Figure GDA0002562007260000182
计算得到:
Figure GDA0002562007260000191
第五计算子模块34,用于将计算得到的系数α和β代入:
Figure GDA0002562007260000192
计算得到当前样本的标度值d;
第六计算子模块35,用于通过上述步骤计算得到第二样本集合中每个样本的标度值。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种地质体的数字特征度量方法,其特征在于,包括:
S1、对地质体的原始地质数据进行变量优选和样本优选,得到优选变量和优选样本,将所有优选样本组成第一样本集合,每个优选样本均具有相同的变量组,所述变量组包括多个变量,具体包括:
S11、将地质体的原始地质数据设为矩阵
Figure FDA0002562007250000011
将变量
Figure FDA0002562007250000012
与变量
Figure FDA0002562007250000013
之间的亲和力F设为
Figure FDA0002562007250000014
其中,dkl为变量
Figure FDA0002562007250000015
与变量
Figure FDA0002562007250000016
之间的差异度量距离,n为样本数量,m为每个样本的变量数量,m和n均为正整数,k,l=1,2,…,m,i=1,2,…,n,j=1,2,…,m;
S12、设置距离矩阵D=(dkl)m×m,给变量
Figure FDA0002562007250000017
赋予权重向量βl,将变量
Figure FDA0002562007250000018
与变量
Figure FDA0002562007250000019
之间亲和力F设为:
Figure FDA00025620072500000110
其中,β'为β的转置矩阵,X'为X的转置矩阵;
S13、当F取最大值时,计算得到所述原始地质数据中每个变量的贡献权重β=(β12,…,βm)',将贡献权重处于预设阈值范围内的变量作为优选变量,将具有所述优选变量的样本作为优选样本;
S2、对所述第一样本集合进行预处理,得到统一量纲后的第二样本集合,具体包括:
通过下式对所述第一样本集合中每个样本xij进行预处理,得到统一量纲后的样本x′ij组成的第二样本集合,
Figure FDA0002562007250000021
其中,
Figure FDA0002562007250000022
和σj分别为第i个变量的最小值和样本标准差,s=1,2,…,n;
S3、对所述第二样本集合中每个样本进行标度计算,得到每个样本的标度值;
S4、对每个所述标度值进行空间频谱计算,得到所述地质体的空间谱密度信息和空间变异信息;
S5、对所述空间谱密度信息和所述空间变异信息进行综合分析,得到所述地质体的数字频谱特征。
2.根据权利要求1所述的一种地质体的数字特征度量方法,其特征在于,步骤S1之前,还包括:
S0、为原始地质数据中每个样本建立属性表,所述属性表包括:属性选项、取样间隔确定、定量数据归类、定性数据筛选和变量分类。
3.根据权利要求2所述的一种地质体的数字特征度量方法,其特征在于,步骤S3包括:
S31、将所述第二样本集合中任一样本中预设属性设为因变量y,将该样本中除所述预设属性外的其他属性设为自变量xj,将已知的因变量y和自变量xj代入:
Figure FDA0002562007250000023
计算得到回归系数b0,b1,b2,…,bm
S32、将所述回归系数输入多元线性回归模型中,计算得到每个属性对应的偏回归平方和V1,V2,…,Vm
S33、当因变量y、自变量xj以及系数α和β均满足:
Figure FDA0002562007250000031
计算得到:
Figure FDA0002562007250000032
S34、将计算得到的系数α和β代入:
Figure FDA0002562007250000033
计算得到当前样本的标度值d;
S35、通过上述步骤计算得到所述第二样本集合中每个样本的标度值。
4.一种地质体的数字特征度量系统,其特征在于,包括:
优选模块(1),用于对地质体的原始地质数据进行变量优选和样本优选,得到优选变量和优选样本,将所有优选样本组成第一样本集合,每个优选样本均具有相同的变量组,所述变量组包括多个变量,所述优选模块(1)包括,第一设置子模块(11),用于将地质体的原始地质数据设为矩阵
Figure FDA0002562007250000034
将变量
Figure FDA0002562007250000035
与变量
Figure FDA0002562007250000036
之间的亲和力F设为
Figure FDA0002562007250000041
其中,dkl为变量
Figure FDA0002562007250000042
与变量
Figure FDA0002562007250000043
之间的差异度量距离,n为样本数量,m为每个样本的变量数量,m和n均为正整数,k,l=1,2,…,m,i=1,2,…,n,j=1,2,…,m;
第二设置子模块(12),用于设置距离矩阵D=(dkl)m×m,给变量
Figure FDA0002562007250000044
赋予权重向量βl,将变量
Figure FDA0002562007250000045
与变量
Figure FDA0002562007250000046
之间亲和力F设为:
Figure FDA0002562007250000047
其中,β'为β的转置矩阵,X'为X的转置矩阵;
第一计算子模块(13),用于当F取最大值时,计算得到所述原始地质数据中每个变量的贡献权重β=(β12,…,βm)',将贡献权重处于预设阈值范围内的变量作为优选变量,将具有所述优选变量的样本作为优选样本;
预处理模块(2),用于对所述第一样本集合进行预处理,得到统一量纲后的第二样本集合,所述预处理模块(2)中,通过下式对所述第一样本集合中每个样本xij进行预处理,得到统一量纲后的样本x′ij组成的第二样本集合,
Figure FDA0002562007250000048
其中,
Figure FDA0002562007250000049
和σj分别为第i个变量的最小值和样本标准差,s=1,2,…,n;
标度计算模块(3),用于对所述第二样本集合中每个样本进行标度计算,得到每个样本的标度值;
频谱计算模块(4),用于对每个所述标度值进行空间频谱计算,得到所述地质体的空间谱密度信息和空间变异信息;
分析模块(5),用于对所述空间谱密度信息和所述空间变异信息进行综合分析,得到所述地质体的数字频谱特征。
5.根据权利要求4所述的一种地质体的数字特征度量系统,其特征在于,还包括:
建立模块(6),用于为原始地质数据中每个样本建立属性表,所述属性表包括:属性选项、取样间隔确定、定量数据归类、定性数据筛选和变量分类。
6.根据权利要求5所述的一种地质体的数字特征度量系统,其特征在于,所述标度计算模块(3)包括:
第二计算子模块(31),用于将所述第二样本集合中任一样本中预设属性设为因变量y,将该样本中除所述预设属性外的其他属性设为自变量xj,将已知的因变量y和自变量xj代入:
Figure FDA0002562007250000051
计算得到回归系数b0,b1,b2,…,bm
第三计算子模块(32),用于将所述回归系数输入多元线性回归模型中,计算得到每个属性对应的偏回归平方和V1,V2,…,Vm
第四计算子模块(33),用于当因变量y、自变量xj以及系数α和β均满足:
Figure FDA0002562007250000061
计算得到:
Figure FDA0002562007250000062
第五计算子模块(34),用于将计算得到的系数α和β代入:
Figure FDA0002562007250000063
计算得到当前样本的标度值d;
第六计算子模块(35),用于通过上述步骤计算得到所述第二样本集合中每个样本的标度值。
CN201710307823.2A 2017-05-04 2017-05-04 一种地质体的数字特征度量方法及系统 Active CN107273985B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710307823.2A CN107273985B (zh) 2017-05-04 2017-05-04 一种地质体的数字特征度量方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710307823.2A CN107273985B (zh) 2017-05-04 2017-05-04 一种地质体的数字特征度量方法及系统

Publications (2)

Publication Number Publication Date
CN107273985A CN107273985A (zh) 2017-10-20
CN107273985B true CN107273985B (zh) 2020-10-16

Family

ID=60074328

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710307823.2A Active CN107273985B (zh) 2017-05-04 2017-05-04 一种地质体的数字特征度量方法及系统

Country Status (1)

Country Link
CN (1) CN107273985B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110608711A (zh) * 2019-08-08 2019-12-24 广东毓秀科技有限公司 一种通过大数据进行轨交隧道形变预测的方法
CN110766034A (zh) * 2019-08-08 2020-02-07 广东毓秀科技有限公司 一种通过大数据进行轨道形变预测的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2009001365A (es) * 2006-08-09 2009-04-15 Schlumberger Technology Bv Facilidad de desarrollar campo petrolero con analisis de fluidos en la perforacion profunda.
CN105247386A (zh) * 2013-05-15 2016-01-13 界标制图有限公司 用来解释地质断层的地层地震道

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2009001365A (es) * 2006-08-09 2009-04-15 Schlumberger Technology Bv Facilidad de desarrollar campo petrolero con analisis de fluidos en la perforacion profunda.
CN105247386A (zh) * 2013-05-15 2016-01-13 界标制图有限公司 用来解释地质断层的地层地震道

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Integrated spatial and spectrum method for geochemical anomaly separation;Qiuming Cheng等;《Natural Resources Research》;20001231;第9卷(第1期);第43-51页 *
地质空间三化模型与色码理论研究;路来君等;《第十二届全国数学地质与地学信息学术研讨会论文集》;20140531;第3-4页 *
地质空间三重划分理论初探;路来君等;《吉林大学学报(地球科学版)》;20121231;第42卷;第279-284页 *
非线性矿产资源预测定量模型研究;刘文博;《中国博士学位论文全文数据库 基础科学辑A011-98》;20150815(第8期);第21-24页 *

Also Published As

Publication number Publication date
CN107273985A (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
Bray et al. Assessment of point process models for earthquake forecasting
Carranza et al. Geologically constrained probabilistic mapping of gold potential, Baguio district, Philippines
Magalhães et al. Online automatic identification of the modal parameters of a long span arch bridge
Dambon et al. Maximum likelihood estimation of spatially varying coefficient models for large data with an application to real estate price prediction
De Iaco et al. Validation techniques for geological patterns simulations based on variogram and multiple-point statistics
Grombein et al. A wavelet-based assessment of topographic-isostatic reductions for GOCE gravity gradients
Achitouv et al. Improving reconstruction of the baryon acoustic peak: The effect of local environment
CN107273985B (zh) 一种地质体的数字特征度量方法及系统
Matalas et al. Effect of persistence on trend detection via regression
CN114254767A (zh) 基于Stacking集成学习的气象水文特征预测方法及系统
Tinungki Orthogonal iteration process of determining K value on estimator of Jackknife ridge regression parameter
Bagherkhani et al. Enhancing the curvature mode shape method for structural damage severity estimation by means of the distributed genetic algorithm
Sun et al. Organic-matter content prediction based on the random forest algorithm: Application to a Lower Silurian shale-gas reservoir
Lipponen et al. Correction of approximation errors with Random Forests applied to modelling of cloud droplet formation
Borkowski et al. Geostatistical modelling as an assessment tool of soil pollution based on deposition from atmospheric air
CN102830430B (zh) 一种层位速度建模方法
Hu et al. Data assimilation in a multi-scale model
Percival et al. The variance of mean sea‐ice thickness: Effect of long‐range dependence
CN118095607A (zh) 勘探目标的分布范围确定方法及装置
Jayaram Probabilistic seismic lifeline risk assessment using efficient sampling and data reduction techniques
Magali et al. Geodynamic tomography: constraining upper-mantle deformation patterns from Bayesian inversion of surface waves
Kastelic et al. Neotectonic deformation models for probabilistic seismic hazard: a study in the External Dinarides
Sadhu Decentralized ambient system identification of structures
Tennisson Support Vector Machine for real time analysis of rocks and structures
Chatterjee et al. General regression neural network residual estimation for ore grade prediction of limestone deposit

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant