CN117575110B - 一种基于土壤重构的矿山修复效果预测方法及相关设备 - Google Patents

一种基于土壤重构的矿山修复效果预测方法及相关设备 Download PDF

Info

Publication number
CN117575110B
CN117575110B CN202410058456.7A CN202410058456A CN117575110B CN 117575110 B CN117575110 B CN 117575110B CN 202410058456 A CN202410058456 A CN 202410058456A CN 117575110 B CN117575110 B CN 117575110B
Authority
CN
China
Prior art keywords
data
time sequence
value
objective function
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410058456.7A
Other languages
English (en)
Other versions
CN117575110A (zh
Inventor
涂卫国
补春兰
苟小林
樊华
江羊洋
罗雪梅
李森
罗海霞
乐建
黄颉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Xingshu Engineering Survey And Design Group Co ltd
Sichuan Academy Of Natural Resources Sciences Sichuan Productivity Promotion Center
Original Assignee
Sichuan Xingshu Engineering Survey And Design Group Co ltd
Sichuan Academy Of Natural Resources Sciences Sichuan Productivity Promotion Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Xingshu Engineering Survey And Design Group Co ltd, Sichuan Academy Of Natural Resources Sciences Sichuan Productivity Promotion Center filed Critical Sichuan Xingshu Engineering Survey And Design Group Co ltd
Priority to CN202410058456.7A priority Critical patent/CN117575110B/zh
Publication of CN117575110A publication Critical patent/CN117575110A/zh
Application granted granted Critical
Publication of CN117575110B publication Critical patent/CN117575110B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Optimization (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于土壤重构的矿山修复效果预测方法及相关设备,包括获取矿山的土壤理化数据和生态数据,对所述土壤理化数据和所述生态数据进行预处理,对所述土壤理化数据和所述生态数据进行分类排序获得时序数据,对所述时序数据进行因果分析得到恢复变量,对所述时序数据进行提取选择获得变化特征,根据所述变化特征得到第一修复数据,根据所述第一修复数据和所述恢复变量构建矿山修复效果模型,将待预测数据输入所述矿山修复效果模型,输出预测结果。该方法不仅可以提高基于土壤重构的矿山修复效果预测的精度,同时具有较好的可解释性,可以直接应用于矿山修复效果预测系统中。

Description

一种基于土壤重构的矿山修复效果预测方法及相关设备
技术领域
本发明涉及土壤重构领域,尤其涉及一种基于土壤重构的矿山修复效果预测方法及相关设备。
背景技术
预测技术在土壤重构领域的应用越来越广泛,可以帮助基于土壤重构的矿山修复效果预测系统的管理者及时、高效地预测土壤重构的矿山修复效果,实现土壤重构的矿山修复效果预测。目前,基于土壤重构的矿山修复效果预测具有信息量庞大、数据种类多样、信息密度大等特点,矿山修复效果预测方法存在较多的不确定因素,导致矿山修复效果预测方法存在较大的不确定性。虽然已经发明了一些预测系统的矿山修复效果预测方法,但是仍不能有效解决化土壤重构的矿山修复效果预测方法的不确定问题。
发明内容
本发明的目的是要提供一种基于土壤重构的矿山修复效果预测方法及相关设备。
为达到上述目的,本发明是按照以下技术方案实施的:
本发明包括以下步骤:
获取矿山的土壤理化数据和生态数据,对所述土壤理化数据和所述生态数据进行预处理;所述预处理为删除值处理和缺失值、归一化、去重、标准化和数据转换;
对所述土壤理化数据和所述生态数据进行分类排序获得时序数据,对所述时序数据进行因果分析得到恢复变量;
对所述时序数据进行提取选择获得变化特征,根据所述变化特征得到第一修复数据;
根据所述第一修复数据和所述恢复变量构建矿山修复效果模型,将待预测数据输入所述矿山修复效果模型,输出预测结果。
进一步的,对所述土壤理化数据和所述生态数据进行分类排序获得时序数据的方法,包括:
依次输入土壤理化数据和生态数据,设置聚类数,根据数据集的类别数设定聚类数,给定最大迭代次数、模糊指数和目标函数阈值;
计算类簇中心:
其中输入数据集中样本r的数量为e,样本r对类簇i的隶属度为,第r个样本为,模糊系数为a,第i个类簇中心为/>,模糊系数a样本r对类簇i的隶属度为/>,确定聚类的目标函数值,表达式为:
其中类簇中心的数量为m,目标函数值为,计算类簇内的平均距离:
其中第i个类簇中数据样本之间的平均类内距离为,第i个类簇中样本的数量为/>,输入样本属性为y,输入样本属性数量为p,第r个样本的第y个属性值为/>,第i个类簇的第y个属性为/>,样本r与类簇中心i的欧式距离为/>
对初始目标函数值、进行迭代更新,获得迭代目标函数值、迭代平均距离,计算初始目标函数值和迭代目标函数值、平均距离和迭代平均距离的差值,当差值皆大于零时,更新转移概率值,否则更新惩罚方式;惩罚方式表示在目标函数中添加一个与模糊系数绝对值之和成正比的项;
若迭代目标函数小于阈值,则由样本行概率最大值对应的列位置为样本的类簇,否则重新计算类簇中心。
进一步的,对所述时序数据进行因果分析得到恢复变量的方法,包括:
按照时间对生态数据进行排序得到原始时间序列,对原始时间序列进行平稳性检验,表达式为:
其中常数为,趋势项系数为/>,自回归模型的阶数为s,t时刻的误差项为/>,t-1时刻时间序列为/>,第c个趋势项系数为/>,平稳系数为/>,t时刻的原始时间序列变化量为/>,t-c时刻的原始时间序列变化量为/>
如果则表明时间序列是非平稳的,如果时间序列是非平稳的,则采用差分方法实现平稳化;若/>则时间序列平稳;
采用高斯核函数对变量进行非线性映射,表达式为:
其中变量为k、u,变量k的核宽为,变量u的核宽为/>,k的核中心为/>,u的核中心为/>,以自然常数e为底的指数函数为/>,采用目标函数构建回归模型,目标函数的表达式为:
其中矩阵的弗罗贝尼乌斯范数为,第j组的特征维数为/>,维度特征的组数为/>,第i个特征的回归系数为/>,核函数为G、I, 正则化参数为/>,第j个回归系数为/>,范数函数为/>,特征的数量为n,计算惩罚项:
其中似然函数为W,有效参数的个数为r,样本数量为a,惩罚项为Q,根据最小惩罚项确定模型阶数和惩罚系数,建立因果分析模型;
计算时间序列数据的因果相关系数为:
其中时间序列数据为v、y,时间序列数据v和y的协方差为,时间序列数据v的标准差为/>,时间序列数据y的标准差为 />,若因果相关系数大于0.96两者则将时间序列数据输出为时序数据,否则删除。
进一步的,对所述时序数据进行提取选择获得变化特征的方法,包括:
对时序数据进行初步特征提取获得第一特征,计算时序数据的原始特征信息熵:
其中时序数据的数量为,第k个时序数据的数量为/>,时序数据h的信息熵为,使用第一特征划分时序数据熵的差值,计算信息增益率:
其中第一特征y对时序数据h的信息增益率为,使用时序数据的信息增益率选择第一特征得到第二特征,计算基尼指数:
其中第k个时序数据的数量为,特征y对时序数据h的基尼指数为/>,采用基尼指数划分第二特征;
计算划分后第二特征的选取概率:
其中第i个第二特征的权重数值为/>,第t个时序数据的基尼指数值为,将选择概率大于0.63的第二特征输出为变化特征。
进一步的,根据所述变化特征得到第一修复数据的方法,包括:
将时序数据分为子序列,给出子序列内的目标函数,表达式为:
其中第m个变化特征的子序列为,对第i个时刻子序列/>的重构为/>,计算子序列间的目标函数:
其中局部依赖集为,全局依赖集为/>,依赖集为/>,局部依赖集的权重为,全局依赖集的权重为/>,子序列间的目标函数为/>,计算变异得分:
其中异常重构误差的影响程度比例分别为、/>、/>,子序列/>的变异得分为,计算边缘变异候选集:
其中边缘变异候选集为,变异得分的子序列的集合为/>,子序列/>构成的集合/>的变异得分为/>,变异阈值为/>,人工可标注样本数量为Q,局部依赖因子为f,第e个子序列为/>,子序列的个数为j,计算样本权重:
其中第t次的加权误差为,第t-2轮子序列/>的权重为/>,第t-1次第i个子序列的权重为/>,自然常数e的/>指数函数为/>,子序列的数量为z,第次样本的权重为/>,不断迭代直到迭代次数时停止,对时序数据进行降序排序,将小于权重阈值的时序数据输出为阈值异常数据。
进一步的,根据所述第一修复数据和所述恢复变量构建矿山修复效果模型的方法,包括:
矿山修复效果模型采用模糊聚类算法将土壤理化数据和生态数据的时序时间数据进行聚类,根据更新聚类中心的目标函数值和类簇内的平均距离,得到时序数据;对时序数据进行非线性映射,计算非线性映射后的因果相关系数,根据相关系数进行筛选获得恢复变量;提取恢复变量的第一特征,使用基尼指数和选取概率分别对第一特征进行筛选,获得变化特征;计算时序数据的变化特征的变异得分,根据变异得分进行样本权重更新获得第一修复数据;利用已有的第一修复数据和恢复变量训练机器学习模型,预测修复效果。
第二方面,本申请实施例还提供一种电子设备,包括:
处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行第一方面所述的方法步骤。
第三方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行第一方面所述的方法步骤。
本发明的有益效果是:
本发明是一种基于土壤重构的矿山修复效果预测方法,与现有技术相比,本发明具有以下技术效果:
本发明通过预处理、获得时序数据、恢复变量、特征提取、数据优化和模型构建步骤,可以提高矿山修复效果预测评估的准确性,从而提高矿山修复效果预测的精度,将矿山修复效果预测优化,可以大大节省资源和人力成本,提高工作效率,可以实现对土壤重构的矿山修复效果自动预测,实时对土壤重构的矿山修复效果预测数据进行恢复变量和第一修复数据融合,对矿山修复效果预测具有重要意义,可以适应不同标准的矿山修复效果预测、不同土壤重构的矿山修复效果预测需求,具有一定的普适性。
附图说明
图1为本发明一种基于土壤重构的矿山修复效果预测方法的步骤流程图;
图2为本说明书实施例中一种电子设备的结构示意图。
具体实施方式
下面通过具体实施例对本发明作进一步描述,在此发明的示意性实施例以及说明用来解释本发明,但并不作为对本发明的限定。
本发明一种基于土壤重构的矿山修复效果预测方法包括以下步骤:
如图1所示,在本实施例中,包括以下步骤:
获取矿山的土壤理化数据和生态数据,对所述土壤理化数据和所述生态数据进行预处理;所述预处理为删除值处理和缺失值、归一化、去重、标准化和数据转换;
在实际评估中,随机给出某地不同时期的2组土壤理化数据和生态数据:
第一组:土壤理化数据:颗粒大小1.0-2.0mm、孔隙度30%、渗透性10mm/hr、持水能力20%、pH值7.0、有机质含量1%、营养元素含量N-P-K = 0.5-0.4-0.2mg/kg、重金属微量的Cu和Zn、放射性物质未检出、有机污染物少量石油烃;
生态数据:蕨类植物覆盖率20%、生物数量50个/m²、酶活性较低、昆虫种类和数量2条/m²;
第2组:颗粒大小2.0-4.0mm、孔隙度35%、渗透性15mm/hr、持水能力25%、pH值6.8、有机质含量2%、营养元素含量N-P-K = 0.8-0.6-0.3mg/kg、重金属未检出、放射性物质未检出、有机污染物未检出;
生态数据:蕨类植物覆盖率60%、生物数量100个/m²、酶活性中等、昆虫种类和数量6条/m²;
对所述土壤理化数据和所述生态数据进行分类排序获得时序数据,对所述时序数据进行因果分析得到恢复变量;
在实际评估中,时序数据分别为土壤物理组包括颗粒大小、孔隙度、渗透性、持水能力,土壤化学组包括pH值、有机质含量、营养元素含量、重金属、放射性物质、有机污染物;生物组包括微生物数量、酶活性、昆虫种类和数量、蕨类植物覆盖率;恢复变量为颗粒大小、孔隙度、渗透性、持水能力、pH值、有机质含量、营养元素含量、微生物数量、酶活性、昆虫种类和数量、蕨类植物覆盖率;
对所述时序数据进行提取选择获得变化特征,根据所述变化特征得到第一修复数据;
在实际评估中,变化特征为颗粒大小、孔隙度、渗透性、持水能力、重金属、有机污染物、pH值、有机质含量、营养元素含量、微生物数量、酶活性、昆虫种类和数量;第一修复数据为颗粒大小、孔隙度、渗透性、持水能力、重金属、有机污染物、pH值、有机质含量、营养元素含量、微生物数量、酶活性、昆虫种类和数量;
根据所述第一修复数据和所述恢复变量构建矿山修复效果模型,将待预测数据输入所述矿山修复效果模型,输出预测结果;
在实际评估中,待预测数据为土壤理化数据:颗粒大小4.0-6.0mm、孔隙度40%、渗透性20mm/hr、持水能力30%、pH值6.5、有机质含量3%、营养元素含量N-P-K = 1.0-0.8-0.4mg/kg、重金属微量的Pb和As、放射性物质未检出、有机污染物未检出;
预测修复效果为蕨类植物覆盖率53%、生物数量237个/m²、酶活性中等偏上、昆虫种类和数量11条/m²。
在本实施例中,对所述土壤理化数据和所述生态数据进行分类排序获得时序数据的方法,包括:
依次输入土壤理化数据和生态数据,设置聚类数,根据数据集的类别数设定聚类数,给定最大迭代次数、模糊指数和目标函数阈值;
计算类簇中心:
其中输入数据集中样本r的数量为e,样本r对类簇i的隶属度为,第r个样本为,模糊系数为a,第i个类簇中心为/>,模糊系数a样本r对类簇i的隶属度为/>,确定聚类的目标函数值,表达式为:
其中类簇中心的数量为m,目标函数值为,计算类簇内的平均距离:
其中第i个类簇中数据样本之间的平均类内距离为,第i个类簇中样本的数量为/>,输入样本属性为y,输入样本属性数量为p,第r个样本的第y个属性值为/>,第i个类簇的第y个属性为/>,样本r与类簇中心i的欧式距离为/>
对初始目标函数值、进行迭代更新,获得迭代目标函数值、迭代平均距离,计算初始目标函数值和迭代目标函数值、平均距离和迭代平均距离的差值,当差值皆大于零时,更新转移概率值,否则更新惩罚方式;惩罚方式表示在目标函数中添加一个与模糊系数绝对值之和成正比的项;
若迭代目标函数小于阈值,则由样本行概率最大值对应的列位置为样本的类簇,否则重新计算类簇中心。
在本实施例中,对所述时序数据进行因果分析得到恢复变量的方法,包括:
按照时间对生态数据进行排序得到原始时间序列,对原始时间序列进行平稳性检验,表达式为:
其中常数为,趋势项系数为/>,自回归模型的阶数为s,t时刻的误差项为/>,t-1时刻时间序列为/>,第c个趋势项系数为/>,平稳系数为/>,t时刻的原始时间序列变化量为/>,t-c时刻的原始时间序列变化量为/>
如果则表明时间序列是非平稳的,如果时间序列是非平稳的,则采用差分方法实现平稳化;若/>则时间序列平稳;
采用高斯核函数对变量进行非线性映射,表达式为:
其中变量为k、u,变量k的核宽为,变量u的核宽为/>,k的核中心为/>,u的核中心为/>,以自然常数e为底的指数函数为/>,采用目标函数构建回归模型,目标函数的表达式为:
其中矩阵的弗罗贝尼乌斯范数为,第j组的特征维数为/>,维度特征的组数为,第i个特征的回归系数为/>,核函数为G、I, 正则化参数为/>,第j个回归系数为/>,范数函数为/>,特征的数量为n,计算惩罚项:
其中似然函数为W,有效参数的个数为r,样本数量为a,惩罚项为Q,根据最小惩罚项确定模型阶数和惩罚系数,建立因果分析模型;
计算时间序列数据的因果相关系数为:
其中时间序列数据为v、y,时间序列数据v和y的协方差为,时间序列数据v的标准差为/>,时间序列数据y的标准差为 />,若因果相关系数大于0.96两者则将时间序列数据输出为时序数据,否则删除。
在本实施例中,对所述时序数据进行提取选择获得变化特征的方法,包括:
对时序数据进行初步特征提取获得第一特征,计算时序数据的原始特征信息熵:
其中时序数据的数量为,第k个时序数据的数量为/>,时序数据h的信息熵为,使用第一特征划分时序数据熵的差值,计算信息增益率:
其中第一特征y对时序数据h的信息增益率为,使用时序数据的信息增益率选择第一特征得到第二特征,计算基尼指数:
其中第k个时序数据的数量为,特征y对时序数据h的基尼指数为/>,采用基尼指数划分第二特征;
计算划分后第二特征的选取概率:
其中第i个第二特征的权重数值为/>,第t个时序数据的基尼指数值为,将选择概率大于0.63的第二特征输出为变化特征。
在本实施例中,根据所述变化特征得到第一修复数据的方法,包括:
将时序数据分为子序列,给出子序列内的目标函数,表达式为:
其中第m个变化特征的子序列为,对第i个时刻子序列/>的重构为/>,计算子序列间的目标函数:
其中局部依赖集为,全局依赖集为/>,依赖集为/>,局部依赖集的权重为,全局依赖集的权重为/>,子序列间的目标函数为/>,计算变异得分:
其中异常重构误差的影响程度比例分别为、/>、/>,子序列/>的变异得分为,计算边缘变异候选集:
其中边缘变异候选集为,变异得分的子序列的集合为/>,子序列/>构成的集合/>的变异得分为/>,变异阈值为/>,人工可标注样本数量为Q,局部依赖因子为f,第e个子序列为/>,子序列的个数为j,计算样本权重:
其中第t次的加权误差为,第t-2轮子序列/>的权重为/>,第t-1次第i个子序列的权重为/>,自然常数e的/>指数函数为/>,子序列的数量为z,第次样本的权重为/>,不断迭代直到迭代次数时停止,对时序数据进行降序排序,将小于权重阈值的时序数据输出为阈值异常数据。
在本实施例中,根据所述第一修复数据和所述恢复变量构建矿山修复效果模型的方法,包括:
矿山修复效果模型采用模糊聚类算法将土壤理化数据和生态数据的时序时间数据进行聚类,根据更新聚类中心的目标函数值和类簇内的平均距离,得到时序数据;对时序数据进行非线性映射,计算非线性映射后的因果相关系数,根据相关系数进行筛选获得恢复变量;提取恢复变量的第一特征,使用基尼指数和选取概率分别对第一特征进行筛选,获得变化特征;计算时序数据的变化特征的变异得分,根据变异得分进行样本权重更新获得第一修复数据;利用已有的第一修复数据和恢复变量训练机器学习模型,预测修复效果。
图2是本申请的一个实施例电子设备的结构示意图。请参考图2,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图2中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成基于土壤重构的矿山修复效果预测装置。处理器,执行存储器所存放的程序,并具体用于执行前述任意一种矿山修复效果预测方法。
上述如本申请图1所示实施例揭示的基于土壤重构的矿山修复效果预测方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central ProcessingUnit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1中基于土壤重构的矿山修复效果预测方法,并实现图1所示实施例的功能,本申请实施例在此不再赘述。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,执行前述的任意基于土壤重构的矿山修复效果预测方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM) 和/或非易失性内存等形式,如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于土壤重构的矿山修复效果预测方法,其特征在于,包括以下步骤:
获取矿山的土壤理化数据和生态数据,对所述土壤理化数据和所述生态数据进行预处理;所述预处理为删除值处理和缺失值、归一化、去重、标准化和数据转换;所述土壤理化数据包括颗粒大小、孔隙度、渗透性、持水能力、pH值、有机质含量、营养元素含量、重金属微量的Cu和Zn、放射性物质、有机污染物;所述生态数据包括蕨类植物覆盖率、生物数量、酶活性、昆虫种类和数量;
对所述土壤理化数据和所述生态数据进行分类排序获得时序数据,对所述时序数据进行因果分析得到恢复变量;包括:
依次输入土壤理化数据和生态数据,设置聚类数,根据数据集的类别数设定聚类数,给定最大迭代次数、模糊指数和目标函数阈值;
计算类簇中心:
其中输入数据集中样本r的数量为e,样本r对类簇i的隶属度为,第r个样本为/>,模糊系数为a,第i个类簇中心为/>,模糊系数a样本r对类簇i的隶属度为/>,确定聚类的目标函数值,表达式为:
其中类簇中心的数量为m,目标函数值为,计算类簇内的平均距离:
其中第i个类簇中数据样本之间的平均类内距离为,第i个类簇中样本的数量为,输入样本属性为y,输入样本属性数量为p,第r个样本的第y个属性值为/>,第i个类簇的第y个属性为/>,样本r与类簇中心i的欧式距离为/>
对初始目标函数值、进行迭代更新,获得迭代目标函数值、迭代平均距离,计算初始目标函数值和迭代目标函数值、平均距离和迭代平均距离的差值,当差值皆大于零时,更新转移概率值,否则更新惩罚方式;惩罚方式表示在目标函数中添加一个与模糊系数绝对值之和成正比的项;
若迭代目标函数小于阈值,则由样本行概率最大值对应的列位置为样本的类簇,否则重新计算类簇中心;
按照时间对生态数据进行排序得到原始时间序列,对原始时间序列进行平稳性检验,表达式为:
其中常数为,趋势项系数为/>,自回归模型的阶数为s,t时刻的误差项为/>,t-1时刻时间序列为/>,第c个趋势项系数为/>,平稳系数为/>,t时刻的原始时间序列变化量为,t-c时刻的原始时间序列变化量为/>
如果则表明时间序列是非平稳的,如果时间序列是非平稳的,则采用差分方法实现平稳化;若/>则时间序列平稳;
采用高斯核函数对变量进行非线性映射,表达式为:
其中变量为k、u,变量k的核宽为,变量u的核宽为/>,k的核中心为/>,u的核中心为/>,以自然常数e为底的指数函数为/>,采用目标函数构建回归模型,目标函数的表达式为:
其中矩阵的弗罗贝尼乌斯范数为,第j组的特征维数为/>,维度特征的组数为/>,第i个特征的回归系数为/>,核函数为G、I, 正则化参数为/>,第j个回归系数为/>,范数函数为/>,特征的数量为n,计算惩罚项:
其中似然函数为W,有效参数的个数为r,样本数量为a,惩罚项为Q,根据最小惩罚项确定模型阶数和惩罚系数,建立因果分析模型;
计算时间序列数据的因果相关系数为:
其中时间序列数据为v、y,时间序列数据v和y的协方差为,时间序列数据v的标准差为/>,时间序列数据y的标准差为 />,若因果相关系数大于0.96两者则将时间序列数据输出为时序数据,否则删除;
对所述时序数据进行提取选择获得变化特征,根据所述变化特征得到第一修复数据;包括:
对时序数据进行初步特征提取获得第一特征,计算时序数据的原始特征信息熵:
其中时序数据的数量为,第k个时序数据的数量为/>,时序数据h的信息熵为/>,使用第一特征划分时序数据熵的差值,计算信息增益率:
其中第一特征y对时序数据h的信息增益率为u,使用时序数据的信息增益率选择第一特征得到第二特征,计算基尼指数:
其中第k个时序数据的数量为,特征y对时序数据h的基尼指数为/>,采用基尼指数划分第二特征;
计算划分后第二特征的选取概率:
其中第i个第二特征的权重数值为/>,第t个时序数据的基尼指数值为/>,将选择概率大于0.63的第二特征输出为变化特征;
将时序数据分为子序列,给出子序列内的目标函数,表达式为:
其中第m个变化特征的子序列为,对第i个时刻子序列/>的重构为/>,计算子序列间的目标函数:
其中局部依赖集为,全局依赖集为/>,依赖集为/>,局部依赖集的权重为/>,全局依赖集的权重为/>,子序列间的目标函数为/>,计算变异得分:
其中异常重构误差的影响程度比例分别为、/>、/>,子序列/>的变异得分为/>,计算边缘变异候选集:
其中边缘变异候选集为,变异得分的子序列的集合为/>,子序列/>构成的集合的变异得分为/>,变异阈值为/>,人工可标注样本数量为Q,局部依赖因子为f,第e个子序列为/>,子序列的个数为j,计算样本权重:
其中第t次的加权误差为,第t-2轮子序列/>的权重为/>,第t-1次第i个子序列的权重为/>,自然常数e的/>指数函数为/>,子序列的数量为z,第次样本的权重为/>,不断迭代直到迭代次数时停止,对时序数据进行降序排序,将小于权重阈值的时序数据输出为阈值异常数据;
所述第一修复数据为颗粒大小、孔隙度、渗透性、持水能力、重金属、有机污染物、pH值、有机质含量、营养元素含量、微生物数量、酶活性、昆虫种类和数量;
根据所述第一修复数据和所述恢复变量构建矿山修复效果模型,将待预测数据输入所述矿山修复效果模型,输出预测结果;
包括矿山修复效果模型采用模糊聚类算法将土壤理化数据和生态数据的时序时间数据进行聚类,根据更新聚类中心的目标函数值和类簇内的平均距离,得到时序数据;对时序数据进行非线性映射,计算非线性映射后的因果相关系数,根据相关系数进行筛选获得恢复变量;提取恢复变量的第一特征,使用基尼指数和选取概率分别对第一特征进行筛选,获得变化特征;计算时序数据的变化特征的变异得分,根据变异得分进行样本权重更新获得第一修复数据;利用已有的第一修复数据和恢复变量训练机器学习模型,预测修复效果。
2.一种电子设备,其特征在于,包括:处理器;以及:
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行所述权利要求1所述方法。
3.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行所述权利要求1所述方法。
CN202410058456.7A 2024-01-16 2024-01-16 一种基于土壤重构的矿山修复效果预测方法及相关设备 Active CN117575110B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410058456.7A CN117575110B (zh) 2024-01-16 2024-01-16 一种基于土壤重构的矿山修复效果预测方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410058456.7A CN117575110B (zh) 2024-01-16 2024-01-16 一种基于土壤重构的矿山修复效果预测方法及相关设备

Publications (2)

Publication Number Publication Date
CN117575110A CN117575110A (zh) 2024-02-20
CN117575110B true CN117575110B (zh) 2024-03-15

Family

ID=89895888

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410058456.7A Active CN117575110B (zh) 2024-01-16 2024-01-16 一种基于土壤重构的矿山修复效果预测方法及相关设备

Country Status (1)

Country Link
CN (1) CN117575110B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118195179B (zh) * 2024-05-17 2024-07-19 四川省地质调查研究院 基于数据分析的生态系统修复方法
CN118626803B (zh) * 2024-08-12 2024-10-08 四川省自然资源科学研究院(四川省生产力促进中心) 基于土壤和植物耦合的矿山迹地生态修复效果预测方法
CN118628280A (zh) * 2024-08-13 2024-09-10 广东省农业科学院农业资源与环境研究所 一种基于数据分析的重金属土壤修复系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109894470A (zh) * 2019-02-22 2019-06-18 安徽新宇生态产业股份有限公司 一种矿山土壤生态修复方法
CN111047099A (zh) * 2019-12-16 2020-04-21 杭州鲁尔物联科技有限公司 一种区域性山洪风险预测方法及系统
CN116228021A (zh) * 2023-03-06 2023-06-06 广西壮族自治区地质环境监测站 一种基于环境监测的矿山生态修复评价分析方法及系统
CN116228041A (zh) * 2023-03-27 2023-06-06 安徽金联地矿科技有限公司 一种废弃矿山生态修复后碳指标计算方法
CN116956755A (zh) * 2023-09-21 2023-10-27 北京建工环境修复股份有限公司 一种矿山生态修复智能规划方法、系统及介质
CN117057671A (zh) * 2023-10-07 2023-11-14 湖南省自然资源事务中心 一种基于人工智能的矿山生态修复工程验收系统和方法
CN117113830A (zh) * 2023-08-21 2023-11-24 山东省鲁南地质工程勘察院(山东省地质矿产勘查开发局第二地质大队) 一种基于数据分析的山体修复评估预测系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10235631B2 (en) * 2016-07-01 2019-03-19 Deere & Company Methods and apparatus to predict machine failures
WO2021178731A1 (en) * 2020-03-04 2021-09-10 Karl Denninghoff Neurological movement detection to rapidly draw user attention to search results
EP4237939A4 (en) * 2020-10-29 2024-07-17 Veracode Inc ONGOING LEARNING INTEGRATED INTO DEVELOPMENT PIPELINE FOR ASSISTED CODE CORRECTION

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109894470A (zh) * 2019-02-22 2019-06-18 安徽新宇生态产业股份有限公司 一种矿山土壤生态修复方法
CN111047099A (zh) * 2019-12-16 2020-04-21 杭州鲁尔物联科技有限公司 一种区域性山洪风险预测方法及系统
CN116228021A (zh) * 2023-03-06 2023-06-06 广西壮族自治区地质环境监测站 一种基于环境监测的矿山生态修复评价分析方法及系统
CN116228041A (zh) * 2023-03-27 2023-06-06 安徽金联地矿科技有限公司 一种废弃矿山生态修复后碳指标计算方法
CN117113830A (zh) * 2023-08-21 2023-11-24 山东省鲁南地质工程勘察院(山东省地质矿产勘查开发局第二地质大队) 一种基于数据分析的山体修复评估预测系统
CN116956755A (zh) * 2023-09-21 2023-10-27 北京建工环境修复股份有限公司 一种矿山生态修复智能规划方法、系统及介质
CN117057671A (zh) * 2023-10-07 2023-11-14 湖南省自然资源事务中心 一种基于人工智能的矿山生态修复工程验收系统和方法

Also Published As

Publication number Publication date
CN117575110A (zh) 2024-02-20

Similar Documents

Publication Publication Date Title
CN117575110B (zh) 一种基于土壤重构的矿山修复效果预测方法及相关设备
Whittaker et al. Detection of overparameterization and overfitting in an automatic calibration of SWAT
CN109635010B (zh) 一种用户特征及特征因子抽取、查询方法和系统
CN109582741B (zh) 特征数据处理方法和装置
CN109063983B (zh) 一种基于社交媒体数据的自然灾害损失实时评估方法
CN112446441A (zh) 模型训练数据筛选方法、装置、设备及存储介质
CN115526298A (zh) 一种高鲁棒性的大气污染物浓度综合预测方法
CN115978466A (zh) 一种基于类别不平衡改进孪生支持向量机的流体管道泄漏检测方法
CN117557121A (zh) 一种港口建设项目环境影响的评价方法
CN116090710B (zh) 一种企业排污许可的管理方法、系统、电子设备及介质
CN116992602A (zh) 一种基于失效状态表征的可靠性模糊评价方法、电子设备和存储介质
Nourani et al. Using Hybrid Wavelet‐Exponential Smoothing Approach for Streamflow Modeling
CN111598580A (zh) 一种基于XGBoost算法的区块链产品检测方法、系统及装置
Çılgın et al. The Effect of Outlier Detection Methods in Real Estate Valuation with Machine Learning
CN116718890A (zh) 电路故障的检测方法、装置及计算机可读存储介质
CN113610629A (zh) 一种从大规模特征集中筛选客户数据特征的方法及装置
CN114418207A (zh) 一种时间序列趋势预测方法和装置
Juda et al. An attempt to boost posterior population expansion using fast machine learning algorithms
Wang et al. Lightweight land cover classification via semantic segmentation of remote sensing imagery and analysis of influencing factors
Jindal et al. Ensemble Based-Cross Project Defect Prediction
CN117609393B (zh) 一种元数据一致性测试方法
CN118246321B (zh) 一种贝类养殖碳汇评估模型的构建方法
CN118333426A (zh) 一种矿山生态修复效果预测方法
CN118468200B (zh) 一种污染源在线监测数据中的造假数据分析方法
CN117909713B (zh) 基于不平衡学习的海浪数据特征选择方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant