CN112785450B - 一种土壤环境质量分区方法及系统 - Google Patents
一种土壤环境质量分区方法及系统 Download PDFInfo
- Publication number
- CN112785450B CN112785450B CN202011604894.7A CN202011604894A CN112785450B CN 112785450 B CN112785450 B CN 112785450B CN 202011604894 A CN202011604894 A CN 202011604894A CN 112785450 B CN112785450 B CN 112785450B
- Authority
- CN
- China
- Prior art keywords
- soil environment
- environment quality
- soil
- classification
- monitoring points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000002689 soil Substances 0.000 title claims abstract description 291
- 238000000034 method Methods 0.000 title claims abstract description 102
- 238000000638 solvent extraction Methods 0.000 title claims abstract description 61
- 238000012544 monitoring process Methods 0.000 claims abstract description 185
- 239000000203 mixture Substances 0.000 claims abstract description 51
- 238000005192 partition Methods 0.000 claims abstract description 47
- 238000012216 screening Methods 0.000 claims abstract description 20
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 18
- 238000012847 principal component analysis method Methods 0.000 claims abstract description 14
- 230000007613 environmental effect Effects 0.000 claims description 51
- 238000009826 distribution Methods 0.000 claims description 34
- 229910001385 heavy metal Inorganic materials 0.000 claims description 25
- 238000013316 zoning Methods 0.000 claims description 22
- 238000005070 sampling Methods 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 12
- 230000009471 action Effects 0.000 claims description 11
- 238000000513 principal component analysis Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000007689 inspection Methods 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims 1
- 230000003993 interaction Effects 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 19
- 238000005065 mining Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 230000002776 aggregation Effects 0.000 description 6
- 238000004220 aggregation Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 239000010865 sewage Substances 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000003337 fertilizer Substances 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 239000005416 organic matter Substances 0.000 description 4
- 239000000575 pesticide Substances 0.000 description 4
- 239000011435 rock Substances 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 238000013441 quality evaluation Methods 0.000 description 3
- 238000003900 soil pollution Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 201000004569 Blindness Diseases 0.000 description 2
- 238000012271 agricultural production Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000003245 coal Substances 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000003912 environmental pollution Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 244000144972 livestock Species 0.000 description 2
- 239000010871 livestock manure Substances 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 244000144977 poultry Species 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000002912 waste gas Substances 0.000 description 2
- KDPSGIFCBZTBEZ-UHFFFAOYSA-N 1-[2-(1h-benzimidazol-2-ylsulfanyl)ethyl]-3-methylbenzimidazole-2-thione Chemical compound C1=CC=C2NC(SCCN3C4=CC=CC=C4N(C3=S)C)=NC2=C1 KDPSGIFCBZTBEZ-UHFFFAOYSA-N 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000003723 Smelting Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 229910052785 arsenic Inorganic materials 0.000 description 1
- 229910052793 cadmium Inorganic materials 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 239000010840 domestic wastewater Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000010842 industrial wastewater Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 239000003621 irrigation water Substances 0.000 description 1
- 229910052745 lead Inorganic materials 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 229910052753 mercury Inorganic materials 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000010813 municipal solid waste Substances 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 239000003895 organic fertilizer Substances 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005067 remediation Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 239000004016 soil organic matter Substances 0.000 description 1
- 239000002910 solid waste Substances 0.000 description 1
- 238000012732 spatial analysis Methods 0.000 description 1
- 238000000551 statistical hypothesis test Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002351 wastewater Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Tourism & Hospitality (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Marine Sciences & Fisheries (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mining & Mineral Resources (AREA)
- Animal Husbandry (AREA)
- Agronomy & Crop Science (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种土壤环境质量分区方法及系统,该方法包括:基于主成分分析法提取目标区域中监测点的土壤环境质量综合特征;采用地理探测器,筛选出土壤环境质量主要影响指标;建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案;以最佳预分类方案构建高斯混合模型,通过EM算法对高斯混合模型中表示样点类别的隐变量参数进行估算,得到监测点的初始分类;基于监测点相应泰森多边形获得初始分区,并结合目标区域的自然边界信息,对目标区域进行最终分区。本发明以监测点的土壤环境质量综合特征为基础,构建了基于EM算法的高斯混合模型,实现了基于高维属性特征的土壤环境质量的综合分区。
Description
技术领域
本发明涉及农业和计算机技术领域,尤其涉及一种土壤环境质量分区方法及系统。
背景技术
土壤重金属的影响因素分为自然因素和人为因素,自然因素以土壤母质母岩为主,人为因素可分为工业源(如采矿、冶炼、燃煤、交通等)、农业源(肥料、农药、灌溉水等)以及生活源(交通、生活废水、生活垃圾、燃煤等)。土壤母质母岩及成土条件是引起背景值区域差异性的主因。气候、生物、地形地貌等因素在成土过程和搬运转移起到重要作用,影响了土壤重金属的地带性分布。工矿企业生产、农业生产投入是造成土壤污染的主因。工矿企业生产通过工业废水、废气、固体废弃物等形式进入农田土壤,其影响的时空范围与企业场地、河流、风力风向、降水等存在相关性,影响范围以企业位置呈面状扩散分布或者依河流呈条带分布的特征,其作用范围可达数公里。农业生产中由于污水灌溉、化肥农药以及畜禽粪便等施用也带来大量的污染。
污水灌溉的农田空间分布格局与排污河流、污水排放性企业的空间分布特征紧密相关,在空间上往往呈现面片状或宽条带状的空间分布特征。对于一个区域来讲,土壤重金属往往受自然因素或者人为因素的共同或交互作用。土壤环境质量空间分布具有较为明显的分层异质性,表现为受污染耕地环境质量往往区别于其它农田区。
因此,对土壤环境质量分级分类分区符合了土壤污染的客观性和环境质量管理的人为性。充分挖掘土壤监测调查数据中蕴含的分级分类分区信息,有利于土壤环境质量的区域化评价,同时也有利于区域土壤污染的分区治理措施的落实与实行。
目前对于全国尺度上的综合自然区划、农业种植区划、地貌区划、土壤环境质量区划等主要是基于传统的区划理论进行划分。然而,县域尺度上土壤重金属质量分区其目的在于将人为和自然因素作用下的非平稳的区域环境质量变量划分到若干相对均匀的子区域,使得各个子区域内部相对均匀,而子区域之间差异显著,进而为区域环境质量的统计及环境质量的管理措施落实提供技术基础。比如区域土壤重金属均值估计,区域土壤重金属污染分区防治和靶向修复治理、农业产业结构调整等。目前常用分区实现方法主要基于土壤环境质量影响因素分区和基于土壤环境质量监测调查数据的空间聚类等两种分区方法。其中基于多维土壤环境质量影响因素如土壤类型、地形地貌、企业聚集等辅助数据存在数据尺度多变、相似性刻画难、数据空间尺度和时间尺度及数据精度准确度差等问题,往往分区效果不佳。
土壤环境质量监测调查点位数据其自身蕴含了自然因素、人为活动因素的共同或交互作用,本质上是区域环境质量的综合反映结果。因此,在区域土壤环境监测点采样强度较高情况下,直接对监测点上主要污染指标进行空间上和属性值域的聚类分组,确保类内子集之间的紧密性、类间的分离性不失为一种解决方案。常用的空间聚类方法可以分为基于划分的方法、基于层次的方法、基于密度的方法和基于格网的方法。不同空间聚类分析方法适用条件并不相同,在实际应用时各有其优点与不足。基于土壤环境监测点的聚类分析工作中,需结合监测数据的多维属性特征、空间分布特点以及环境影响因素时空特征,选择合适的聚类方法和模型,分析并挖掘土壤环境质量总体的空间分布特征和土壤环境质量分区模式。因此,如何基于土壤环境质量监测调查数据的特征,优选适合的聚类模型和参数解算方法,形成科学、有效且客观准确的质量分区方法,是当前土壤环境质量评价、土壤环境质量防治与修复中的一项重要议题。
目前土壤环境质量分区常用的方法有:(1)局部Moran’s I指数法。该方法是监测点空间聚集和局部异常识别的算法,通过监测点在局部空间范围内其它要素属性值的相关关系,有效识别监测调查点的局部聚集模式,“高-高”集聚,“低-低”集聚,“高-低”异常区,“低-高”异常区四类固定的空间模式,四类空间模式仅表达监测点的污染指标值得高低差异,同时容易将局部噪声当作局部异常区,使得土壤环境质量分层异质性失真,如图1所示。(2)K-均值家族聚类。该方法本质上是根据土壤监测点间的距离作为判定该点划分到某个聚类中心准则,对各聚类中心的监测点在各聚类中心的移动进行迭代求解。由于每个人对研究区环境质量的认识程度并不一致,初始聚类个数的确定存在一定随意性。同时,在环境质量变异系数波动较大的区域聚类时,该方法随机初始化聚类中心也容易使聚类结果陷入局部最优解困境。(3)双重自组织神经网络聚类。该方法在聚类中同时考虑了属性相近和空间相邻,基于自组织特征映射神经网络方法进行空间点的聚类,形成对整个研究区的分层。该聚类方法中的混合距离是由人为对空间距离和属性距离进行加权构成,监测样点向量的相似性计算具有一定的主观性。
因此,以上现有技术均不能很好的满足土壤环境质量分区的需求,亟需一种新的土壤环境质量分区方法。
发明内容
本发明提供一种土壤环境质量分区方法及系统,用以解决现有技术中传统方法无法很好满足土壤环境质量分区的缺陷,实现土壤环境的精确分区。
本发明提供一种土壤环境质量分区方法,包括:
基于主成分分析法提取目标区域中监测点的土壤环境质量综合特征;
采用地理探测器识别所述土壤环境质量综合特征与预设环境影响因素的分层异质性,筛选出土壤环境质量主要影响指标;
根据样点在所述土壤环境质量主要影响指标下的分类关系建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案;
以所述最佳预分类方案对构建的高斯混合模型进行初始化,通过期望最大化(Expectation-Maximum,简称EM)算法对所述高斯混合模型中表示样点类别的隐变量参数进行估算,得到所述监测点的初始分类;
基于所述监测点相应泰森多边形范围及所述监测点的初始分类,并结合所述目标区域的自然边界信息,对所述目标区域进行分区。
根据本发明提供一种的土壤环境质量分区方法,所述根据样点在所述土壤环境质量主要影响指标下的分类关系建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案,包括:
基于所述监测点的土壤环境质量综合特征和所述土壤环境质量主要影响指标,获取所述目标区域的预分类方案,所述预分类方案中包含所述监测点的类别个数;
根据所述预分类方案的贝叶斯信息准则指数,从所有预分类方案中筛选出最佳预分类方案;
将所述最佳预分类方案中的监测点的类别的个数作为所述最佳预分类方案。
根据本发明提供一种的土壤环境质量分区方法,所述基于所述监测点相应泰森多边形范围及所述监测点的初始分类,并结合所述目标区域的自然边界信息,对所述目标区域进行分区,包括:
根据所述监测点的初始分类和泰森多边形划分法,对所述目标区域进行划分,获取初始分区结果;
基于所述初始分区结果、所述目标区域的人为和自然边界,对所述初始分区结果进行优化,获取所述目标区域的最终分区结果。
根据本发明提供一种的土壤环境质量分区方法,所述根据所述监测点的初始分类和泰森多边形划分法,对所述目标区域进行划分,获取初始分区结果,具体包括:
基于泰森多边形划分法对所述目标区域进行划分,获取所述监测点对应的泰森多边形;
将所述监测点的类别作为对应泰森多边形的每条边的聚类属性;
将互为邻域且具有相同聚类属性的泰森多边形进行合并,获取所述初始分区结果,所述邻域为具有相同聚类属性的共享边的泰森多边形。
本发明还提供一种土壤环境质量分区系统,包括:
主成分分析模块,用于基于主成分分析法提取目标区域中监测点的土壤环境质量综合特征;
环境质量影响模块,用于采用地理探测器识别所述土壤环境质量综合特征与预设环境影响因素的分层异质性,筛选出土壤环境质量主要影响指标;
最佳初始化模块,用于根据样点在所述土壤环境质量主要影响指标下的分类关系建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案;
初始分类模块,用于以所述最佳预分类方案对构建的高斯混合模型进行初始化,通过期望最大化(Expectation-Maximum,简称EM)算法对所述高斯混合模型中表示样点类别的隐变量参数进行估算,得到所述监测点的初始分类;
分区模块,用于基于所述监测点相应泰森多边形范围及所述监测点的初始分类,并结合所述目标区域的自然边界信息,对所述目标区域进行分区。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述土壤环境质量分区方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述土壤环境质量分区方法的步骤。
本发明提供了一种土壤环境质量分区方法及系统,基于对人为活动、自然活动影响叠加下的土壤环境格局进行高密度土壤监测,采用主成分分析提取多种土壤重金属类型的含量数据的综合特征,实现了土壤环境质量的综合分区;并综合考虑环境影响因素的效应,对构建的高斯混合模型进行初始化分类,实现土壤监测调查点的稳定、精细分类,从而以泰森多边形划分法实现“由点到面”的区域化土壤环境质量分区。
相比传统的土壤环境质量分区方法,该方法在定量分析手段下实现局部地区上的土壤环境质量精细区划,为土壤环境质量分区提供一种新方案,具有较强的应用普遍性,能为土壤环境质量区划工作中的环境质量评价、土壤环境质量防治与修复提供更有力的技术支撑。同时该方法能很好的应用于实际操作中,为土壤环境质量本地化分区提供了一种可软件化实现的标准方法。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中基于局部莫兰指数的聚类示意图;
图2为本发明提供的一种土壤环境质量分区方法的流程图;
图3为本发明提供的一种土壤环境质量分区方法的技术框图;
图4为本发明中对监测点进行主成分分析法的变换示意图;
图5为本发明中土壤环境质量主要影响指标筛选示意图;
图6为本发明中预分类方案选取最佳预分类方案的示意图;
图7为本发明中高斯分布混合过程示意图;
图8为本发明中利用高斯混合模型对监测点进行聚类的示意图;
图9为本发明中土壤环境质量分区结果示意图;
图10为本发明提供的一种土壤环境质量分区系统的结构示意图;
图11为本发明提供的一种电子设备的实体结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例针对工矿企业集聚性排放、设施农业高投入等高强度人为活动和地质高背景等交互作用引起的复杂区域,提出一种针对农产品产地的土壤环境质量分区方法,基于区域高密度的土壤重金属监测点,采用高斯混合模型对研究区进行分类分区,以其为区域土壤环境质量精准防控、靶向修复治理提供技术依据。
本发明实施例提供的一种土壤环境质量分区方法,如图2所示,该方法包括:
110,基于主成分分析法提取目标区域中监测点的土壤环境质量综合特征;
120,采用地理探测器识别所述土壤环境质量综合特征与预设环境影响因素的分层异质性,筛选出土壤环境质量主要影响指标;
130,根据样点在所述土壤环境质量主要影响指标下的分类关系建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案;
140,以所述最佳预分类方案对构建的高斯混合模型进行初始化,通过期望最大化(Expectation-Maximum,简称EM)算法对所述高斯混合模型中表示样点类别的隐变量参数进行估算,得到所述监测点的初始分类;
150,基于所述监测点相应泰森多边形范围及所述监测点的初始分类,并结合所述目标区域的自然边界信息,对所述目标区域进行分区。
目标区域即为需要进行土壤环境质量分区的区域,本发明实施例针对受工矿企业、农药化肥高投入、土壤高背景单独或综合影响下采样密度高土壤监测点。
在目标区域的不同地方布测监测点,通过监测点提取到的土壤样本来代表该目标区域中的土壤环境质量,一般监测点的数量为多个。
土壤环境质量综合特征是指能够代表目标区域中的土壤环境质量的主要特征,通过该特征向量,可以表示监测点处的土壤环境质量。
由于空间聚类分析可以得到土壤监测点的分类结果。由于区域土壤重金属污染受工矿企业的废水、废气排放,农药化肥过量施用、土壤高背景(土壤成土过程的母质母岩、地形地貌、河流风沙搬运等)等因素影响,在空间上表现为分层分异性,因而表达区域生态环境综合情况的高密度监测点之间也将存在较大的差异性,在人为采样误差、不同环境因素的综合影响下,总体的概率密度图(大样本下近似频率分布图)通常为右偏态分布,该分布难以通过对数转换、Cox-Box等进行正态变换。
假定目标区域内具有相似土壤环境质量状况的分区Z1受同一质量分区环境效应影响,该分区内样点满足的数学期望μ1、方差σ1的正态分布函数。若整个目标区域由上述多个分区组成,则目标区域总体可看作是多个不同数学期望、方差的正态分布环境效应下的组合。土壤环境效应作用下样本点分类情况是隐变量,无法直接获取。
并根据样点在土壤环境质量主要影响指标下的分类关系,建立一系列初始化预分类方案,并计算每个方案的贝叶斯信息准则,从所有的初始化预分类方案中确定最佳预分类方案。
将确定的最佳预分类方案作为构建的高斯混合模型的初始化条件,并以目标区域中监测点的土壤环境质量综合特征为基础,构建高斯混合模型,并利用EM算法对高斯混合模型进行求解,得到监测点的初始分类。
EM算法是最常见的隐变量估计方法,在机器学习中有极为广泛的用途,例如常被用来学习高斯混合模型(Gaussian mixture model,简称GMM)的参数,隐式马尔科夫算法(HMM)、LDA主题模型的变分推断等等。
本发明实施例中将监测点的土壤环境质量综合特征输入到高斯混合模型中,得到监测点的类别。
然后根据监测点的类别,对目标区域进行分区,比如,可以将同一类别的监测点划分为一个区,说明这个区中的土壤环境质量比较相近;还可以先选取监测点周围的一片区域,将相似的类别合并为一个区。
综上,本发明提供了一种土壤环境质量分区方法,基于对人为活动、自然活动影响叠加下的土壤环境格局进行高密度土壤监测,采用主成分分析提取多种土壤重金属类型的含量数据的综合特征,实现了土壤环境质量的综合分区;并综合考虑环境影响因素的效应,对构建的高斯混合模型进行初始化分类,实现土壤监测调查点的稳定、精细分类,从而以泰森多边形划分法实现“由点到面”的区域化土壤环境质量分区。
在上述实施例的基础上,优选地,所述根据样点在所述土壤环境质量主要影响指标下的分类关系建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案,包括:
基于所述监测点的土壤环境质量综合特征和所述土壤环境质量主要影响指标,获取所述目标区域的预分类方案,所述预分类方案中包含所述监测点的类别个数;
根据所述预分类方案的贝叶斯信息准则指数,从所有预分类方案中筛选出最佳预分类方案;
将所述最佳预分类方案中的监测点的类别的个数作为所述最佳预分类方案。
由于土壤环境质量分区本质上是土壤环境质量监测点多次迭代聚类的过程,土壤环境质量受工矿企业、高农业投入以及局部地质异常影响,表现为土壤环境监测点的局部空间变异性高,因此空间聚类是随机初始化聚类中心往往容易陷入局部最优解,导致多次监测点聚类结果存在一定的差异。
土壤监测点是土壤环境影响因素作用的结果反映,因此土壤监测点与环境质量影响因素在空间格局上具有相似性或关联性。在土壤监测点聚类时引入环境影响因素分区概要信息对土壤监测点进行预分类,避免土壤监测点初始化分类的盲目性,增加聚类分组结果的稳定性和一致性,以便得出更为接近客观实际的聚类结果。
传统的分类方法中,监测点的类别个数通常是人为根据经验设定的,因此进行初始化分类的时候具有很大的盲目性,并且聚类分组结果的稳定性较低。
针对该问题,本发明实施例中先对目标区域中的监测点进行预分类,得到预分类的结果,通过预分类的结果来对高斯混合模型进行初始化。
目前很多参数估计问题均采用似然函数作为目标函数,当训练数据足够多时,可以不断提高模型精度,但是以提高模型复杂度为代价的,同时带来一个机器学习中非常普遍的问题—过拟合。所以,模型选择问题在模型复杂度与模型对数据集描述能力(即似然函数)之间寻求最佳平衡。
在本发明实施例也存在类似问题,如果不对高斯混合模型中的监测点的类别个数进行约定,最终会导致分类个数过于多,高斯混合模型表面上看对所有监测点均有较好的拟合效果,但实际上并没有反映区域土壤环境质量总体趋势和局部污染的主体特征。
因此本发明实施例中拟引入贝叶斯信息准则,通过加入模型复杂度的惩罚项来避免过拟合问题。
在高斯混合模型中,以贝叶斯信息准则指数(简称BIC)作为指标辅助选取聚类个数,以多个主要环境影响因素的组合对土壤监测点进行预分类生成分类方案,并根据相应的BIC指标值确定最佳的预分类组合方案,具体步骤如下:
(1)根据各土壤环境质量主要影响指标与土壤环境质量综合特征之间的相似性或解释力的强弱,按照从大到小的规则对集合Qi(q1,q2,…,qr)排序:
Q′=sort(q1,q2,…,qr)=(Q′1,Q′2,…,Q′r),
其中,Q′1≥Q′2≥…≥Q′r。
(2)生成土壤监测点的预分类方案FA,每个预分类方案中包括该监测点的类别的个数。
第一个预分类方案FA1为选取土壤监测点在Q′集合中第一个q值所对应的影响因素下的分类方式F1,根据该影响因素中的影响因子组合方式“F1”将土壤监测点分成A1个类。
第二个预分类方案FA2为选取土壤监测点在Q′集合中前两个q值所对应的影响因素下的分类方式F1与F2,根据该两种影响因素中的影响因子组合方式“F1*F2”将土壤监测点分成A2个类。
第r个预分类方案FAr为选取土壤监测点在Q′集合中前r个q值所对应的影响因素下的分类方式F1、F2、…、Fr根据该所有影响因素中的影响因子组合方式“F1*F2*Fr”将土壤监测点分成Ar个类。
以预分类方案FA2为例,选取土壤监测点在Q′集合中前两个q值所对应的影响因素下的分类方式F1与F2,并假设监测点在分类方式F1中对应的影响因素有3种不同类型影响因子,监测点在分类方式F2中对应的影响因素有2种不同类型影响因子,则最大共可组合成包含3×2=6种类型的综合分类方式“F1*F2”,以便根据监测点所在位置上的综合分类类型属性分成A2(A2≤6)个类。
其中BIC1、BIC2、…、BICr代表预分类方案FA1、FA2、…、FAr中的贝叶斯信息准则指数值,可通过步骤(3)计算。
(3)计算土壤预分类方案的贝叶斯信息准则指数(BIC):
BIC=u·ln(m)-2ln(L),
单个高斯分布包含均值和方差两个参数,其中u=3A指在预分类方案FA下的高斯混合模型的总参数数目,即条件约束的个数;m为监测点数量也即样本的数量;
(4)根据预分类方案和相应的BIC指标值之间关系,为避免人为按某预分类方案聚类出现过拟合、欠拟合,在考虑功能分区个数的基础上,选取当BIC值变化率最小时候的第一个预分类方案作为最佳预分类方案,假设将预分类方案和相应的BIC指标值绘制成图,通过可视化的方法观察可知预分类方案FA4的BIC值变化率较小,即可认为该方案为最佳预分类方案ClassBIC,该最佳预分类方案中包含的监测点的类别的个数即为优化后的高斯混合模型中的聚类个数。
本发明实施例中,考虑到非监督分类随机性,提出了基于主要质量影响指标预分类方案与贝叶斯信息准则指数(BIC)之间的关系,以最佳预分类方案对优化后的高斯混合模型的聚类过程进行初始化,避免聚类的随机性,使得分区更具精确性。同时考虑到聚类算法过拟合问题,采用了贝叶斯信息准则指数作为聚类的惩罚算法,进一步优化聚类结果。
具体地,高斯混合模型的计算公式如下:
a=(a1,a2,…,an),
θ=(α1,α2,…,αK;θ1,θ2,…,θK),
其中,P表示高斯混合模型,ai表示第i个监测点上的土壤环境质量综合特征,K表示子高斯模型的个数,μk表示第k个分布的期望矩阵,σk表示第k个分布的方差矩阵。
假设n个监测点的M个监测指标,总体反映了研究区土壤环境质量,则n个土壤环境监测点的多维土壤环境质量综合特征PC,可由K个高斯模型的线性组合的高斯混合模型P来表征。
实施时,具体步骤如下:
(1)高斯混合模型构建:
模型初始化时假设监测点的观测值ai是由k个环境影响因素综合作用的结果,变量γik表示分类结果,定义如下:
γik初始值由监测点在环境影响因素组合类型分类情况确定。
由于监测点数据从各高斯分量生成这个事件相互独立,因此:
完整数据的对数似然函数为:
(3)M步:求Q对θ的极大值,即求新一轮迭代的模型参数:
θ(i+1)=argmaxQ(θ,θ(i)),
根据上式分别对求偏导数并令其为0求得 是在条件下求偏导数等于0的解,k=1,2,…,K,重复以上计算,直到对数似然函数值不再有明显的变化为止,根据分模型k中观测数据ai的最终响应度确定土壤监测点的分类情况。
以土壤监测点关于主要环境影响因素的最佳预分类情况为初始效应,在E步中基于隐变量的现有估计值计算其最大似然估计值(期望),在M步中最大化计算参数估计值,该过程不断交替进行,直到得出稳定的土壤监测点的分类情况。
在上述实施例的基础上,优选地,所述基于所述监测点相应泰森多边形范围及所述监测点的初始分类,并结合所述目标区域的自然边界信息,对所述目标区域进行分区,包括:
根据所述监测点的类别和泰森多边形划分法,对所述目标区域进行划分,获取初始分区结果;
基于所述初始分区结果、所述目标区域的人为和自然边界,对所述初始分区结果进行优化,获取所述目标区域的最终分区结果。
本发明实施例以土壤监测点分类结果为依据,通过泰森多边形实现土壤监测信息的“由点到面”,对空间共边、内含监测点聚类结果相同的多边形要素进行合并,形成土壤环境质量空间初始分区。结合自然因素和人为因素的物理边界对土壤环境质量分区进行调整,最后形成区域土壤环境质量分区。
土壤环境质量的形成取决于自然、人为及叠加因素。进行分区时必须考虑不同区域土壤环境质量的差异成因与演化过程,并以此确定土壤环境质量分区类型。在土壤环境质量初始分区的基础上,以工矿企业、土壤母质、土壤类型、土地利用方式、主要河流、主干道、行政边界等自然人文要素及主要环境影响因素图作为分区合理评价和分区边界调整依据。
从行政管理的目的出发,为提高环境治理的效率,可按照区域内的行政区划边界、主要道路河流等自然人为边界对进行土壤环境质量初始分区范围进行分割。
具体实现可在软件中构建代表自然人为边界的线状要素与代表分区范围的面状要素之间的拓扑关系,以边界信息对分区范围进行分割。
其次通过对土壤重金属背景值与农业高投入及工矿企业等污染物信息的叠加验证,阐明区域土壤环境质量的空间格局,并考虑各环境影响因素之间的相互影响、表现程度和作用结果,在诸要素中根据已经识别筛选出来的重要和典型环境污染主导作用和综合作用因素,作为区域划分调整的依据,从而结合主要环境因素的影响区和初始分区差异性对初始分区结果进行优化调整。
本发明实施例提出了土壤环境质量初始分区调整的策略和解决方案,结合主要环境因素的影响区和初始分区结果差异性进行优化调整,为了便于分区结果管理中使用,结合河流道路行政区等自然人为边界进行分区动态调整,提高了分区技术结果适用性。
在上述实施例的基础上,优选地,所述根据所述监测点的类别和泰森多边形划分法,对所述目标区域进行划分,获取初始分区结果,具体包括:
基于泰森多边形划分法对所述目标区域进行划分,获取所述监测点对应的泰森多边形;
将所述监测点的类别作为对应泰森多边形的每条边的聚类属性;
将互为邻域且具有相同聚类属性的泰森多边形进行合并,获取所述初始分区结果,所述邻域为具有相同聚类属性的共享边的泰森多边形。
土壤环境质量初始分区步骤如下:
本发明实施例采用泰森多边形划分法构建土壤监测点泰森(Voronoi)多边形,每个Voronoi多边形内仅含有一个土壤监测点,以该监测点的分类属性(高斯混合聚类得到的监测点类别)赋值到该Voronoi多边形。
具体实现方法为:以土壤监测点集F中的几何位置为中心生成Voronoi图,Vr(oi)是土壤监测点oi所在的Voronoi多边形,定义与土壤监测点oi所在的Voronoi多边形有共享边(Rook连接)的其他Voronoi多边形为邻域。
Pv(oi)={oj,Vr(oi)∩Vr(oj)且i≠j},
从而将互为邻域且具有相同聚类属性的的Voronoi多边形要素合并,并将该分类属性值赋值到合并后的多边形要素,作为该初始分区要素的分类属性值。
具体实现可在ARCGIS软件中选取分类后的土壤监测点数据集,通过邻域提取并创建泰森多边形生成Voronoi多边形要素图层,在Voronoi多边形图层中新建“类别”字段,将监测点分类属性值赋值到Voronoi多边形,根据相邻Voronoi多边形要素“类别”字段值判定是否相同进行多边形合并。
Voronoi多边形要素通过ARCGIS软件中要素合并命令Union实现类别相同的Voronoi多边形的聚合。
在上述实施例的基础上,优选地,所述目标区域中监测点的土壤环境质量综合特征具体通过如下方式获得:
获取所述目标区域中监测点的土壤环境质量监测数据,通过主成分分析法,获取所述土壤环境质量综合特征。
实际工作中,对目标区域的土壤环境质量进行监测,得到目标区域中监测点的土壤环境质量检测数据,所谓的对土壤环境质量进行监测,主要是指土壤重金属进行监测,监测数据均经过如下处理:GPS定位记录样点中心位置,对土壤中的杂质进行有效的分离,并按照国家标准分析测定各重金属元素(Cu、Zn、Pb、Cd、As、Hg等),土壤中包含的重金属元素的含量即为土壤环境质量监测数据。
土壤环境质量受人类活动和成土环境因素的共同影响,区域土壤重金属之间往往存在强弱不一的依赖或者伴生关联关系。由多种土壤重金属指标表达的区域土壤环境质量通过主成分分析方法可降维为主要成分向量来组合来表达区域环境。
经过主成分分析法,得到土壤环境质量综合特征,具体步骤如下:
设有n个样本,M个重金属类型构成样本空间X,X=Xij(i=1,2…n;j=1,2…M),主成分分析过程如下:
(1)标准化:
其中,uj,δj分别指第j个指标的均值和标准差。
(2)求矩阵X的相关系数阵R=(Rjj′)M×M;
Rjj′=cov(Xj,Xj′)=E[XjXj′]-E[Xj]E[Xj′],
其中,XjXj′指的是第j,j′(j,j′=1,2,…M)个指标的列向量。
(3)求协方差矩阵R的特征值和相应的特征向量;
Rη=λη,
得特征根λ1,λ2,…,λM及对应的特征向量η1,η2,…,ηM。
(4)根据贡献率T筛选转换矩阵;
将贡献率T按照从大到小的顺序排序,选择总贡献率大于80%的前m个,并根据其相对应的m个特征向量组成的一组转换矩阵Ψ(M×m)。
(5)对所有数据集X进行投影,得出降维后新的m维度矩阵PC;
PC(m)=X·Ψ,
M维度的土壤重金属样本X进行主成分分析,压缩成m维度相互独立的新特征PC(m),能更突出的反映区域土壤环境质量的主要特征,也即研究区监测点中不同重金属指标内在的总体上相似性和差异性的特征水平。
在上述实施例的基础上,优选地,所述土壤环境质量主要影响指标具体通过如下方法获得:
获取预设土壤环境质量影响指标,通过地理探测器,筛选出所述土壤环境质量主要影响指标。
基于经验知识、文献资料查阅,对目标区域中可能影响土壤重金属分布的因素进行收集整理,建立环境影响因素候选集B{B1,B2,…,Bi,…,BR},其中,Bi取值可为影响土壤环境质量的、成土母质、土壤类型、数字高程(DEM)土地利用方式类型、工矿企业聚集度、有机肥施用量、畜禽粪便施用量、有机质含量等。
地理探测器是探测空间分异性,以及解释其背后驱动力的一组统计学方法。其核心思想是基于这样的假设:如果某个自变量对某个因变量有重要影响,那么自变量和因变量的空间分布应具有相似性。
因此,本发明实施例中使用地理探测器分析土壤环境质量与环境因素的空间相似,进而达到探测本目标区域内与环境紧密相关的影响因素。
地理探测器主要用于分析因变量为类别型变量的数据。对于连续变量需将其转换成顺序量、比值量或间隔量,进行适当离散化后对其进行统计分析。主要环境影响因素对土壤重金属含量值的空间分布及格局起一定影响和控制作用,因此可以用地理探测器对主要因素进行探测分析。
影响因素既有连续型变量如有机质含量、高程等,也有类别型如土地利用类型、母质母岩、土壤类型等类别型变量。对于连续型因子变量可参考行业标准对其进行分类分级,将其转换为次序变量后进行统计分析。以有机质含量为例,有机质含量是连续型变量,按第二次全国土壤普查养分分级标准可以离散为6类,表1为本发明实施例中土壤有机质含量分级标准示意表,如表1所示。
表1
根据相关行业标准可将环境影响因素集B中的所有连续型影响因素转换为类别型变量。
假设某个环境影响因素对环境综合特征有显著性影响,则该环境影响因素的空间分布与环境综合特征的空间分布应该具有一定空间格局的相似性或者具有一定程度的归因的可解释性。
由于土壤监测点的重金属含量在经过主成分分析后,其主要成分(环境综合特征PC(m))表征区域的土壤环境质量。因此,依次选取代表环境综合特征的主成分PC,遍历环境影响因素数据集B,通过地理探测器检验Bi与每个PC与之间的空间特征或者属性特征上的相似性或可解释性,建立环境影响因素与环境综合特征分层性检验关系,表2为环境影响因素与环境综合特征分层性检验,如表2所示:
表2
PC<sub>1</sub> | PC<sub>2</sub> | … | PC<sub>j</sub> | … | PC<sub>m</sub> | |
B<sub>1</sub> | q<sub>11</sub> | q<sub>12</sub> | … | q<sub>1j</sub> | … | q<sub>1m</sub> |
B<sub>2</sub> | q<sub>21</sub> | q<sub>22</sub> | … | q<sub>2j</sub> | … | q<sub>2m</sub> |
… | … | … | … | … | … | … |
B<sub>i</sub> | q<sub>i1</sub> | q<sub>i2</sub> | … | q<sub>ij</sub> | … | q<sub>im</sub> |
… | … | … | … | … | … | … |
B<sub>R</sub> | q<sub>R1</sub> | q<sub>R2</sub> | … | q<sub>Rj</sub> | … | q<sub>Rm</sub> |
若存在一个主成分PCj其qij值通过统计学的显著性检验,则该环境影响因素Bi入选主要影响因素,并选取出(qi1,qi2,...,qim)中满足显著性检验的最大q值,作为该环境因素Bi对环境综合特征PC(m)的解释力。具体计算公式及步骤如下:
SST=Nσ2,
式中:h=1,2,……,L为某环境影响因素Bi(z1i,z2i,…,zli)分类或分层;Nh和N分别为层h和全区的监测点数;和σ2分别为层h和全区的PC1特征变量的方差;SSW和SST分别为层内方差之和、全区总方差。
其中q值的简单变换满足非中心F分布,构造检验F统计量,计算出F值并作F检验。根据给定的显著性水平p(p取值为0.01、0.05、0.1)在F分布表中查找相应的临界值F1-p。
通过地理探测器对环境影响因素候选集进行筛选,选择满足检验的环境影响因素作为主要环境影响因素,并可得到主要环境影响因素对应的q值集合Q(q1,q2,…,qr),(r≤R),其中qi表示环境影响因素Bi对环境综合特征PC的解释力,q值越大代表着该因素的解释力越强。主要环境影响因素的筛选过程具体实现通过地理探测器软件(www.geodetector.cn)完成。
本发明一优选实施例提供的一种土壤环境质量分区方法,如图3所示,该实施方案的主要技术路线如下:
(1)对目标区域监测点的土壤中的各重金属元素含量进行检测,得到土壤环境质量监测数据,通过主成分分析法,对土壤环境质量监测数据进行压缩,识别土壤环境质量的主要成分,即以总贡献率大于80%的主成分向量构成的矩阵作为土壤环境质量综合特征,得到土壤环境质量综合特征。
如图4所示,环境综合特征矩阵提取可通过SPSS软件实现,选择“Analyze―Dimension Reduction―Factor”来实现主成分分析。
(2)如图5所示,依据国家、行业技术标准,将连续型预设土壤环境质量影响指标转换为对应类别型变量,并采用地理探测器选取影响土壤环境质量空间分层异质性的土壤环境质量主要影响指标。
(3)如图6所示,以土壤环境质量主要影响指标对土壤监测点的土壤环境质量综合特征进行处理,结合贝叶斯信息准则指数(BIC)变化,确定最佳预分类方案,该最佳预分类方案中包含了监测点的类别的个数。
(4)如图7所示,构建土壤环境质量分类的优化后的高斯混合模型,并将最佳预分类方案中的监测点的类别作为优化后的高斯混合模型的初始化条件,如图8所示,采用EM算法对高斯混合模型的参数进行估计,得到目标区域中监测点的类别。
(5)采用泰森多边形法,由土壤监测点生成泰森多边形,以边—边连接方式合并监测点类型相同的多边形,从而土壤环境质量初始分区,得到初始分区结果。
(6)结合土壤环境质量主要影响因素的空间边界范围、河流道路以及行政区边界等对初步划分的分区进行调整,并根据诱发环境污染主导作用和综合作用因素定义各分区的生态环境类型,从而形成最终的土壤环境质量区,得到最终分区结果。
如图9所示,针对图中Class3类Voronoi多边形聚合形成的土壤环境质量初始分区,以保障土壤环境安全为目标,假设工矿企业是区域污染的主要来源,通过对工矿企业环境风险的污染特征因子、污染企业空间分布密度及风险分布等情况进行分析,测算影响因素的作用域,从而通过空间分析得到优化调整后的分区范围。
综上,本发明实施例提供了一种土壤环境质量分区方法及系统,基于对人为活动、自然活动影响叠加下的土壤环境格局进行高密度土壤监测,采用主成分分析提取多种土壤重金属类型的含量数据的综合特征,实现了土壤环境质量的综合分区;并综合考虑环境影响因素的效应,对构建的高斯混合模型进行初始化分类,实现土壤监测调查点的稳定、精细分类,从而以泰森多边形划分法实现“由点到面”的区域化土壤环境质量分区。
相比传统的土壤环境质量分区方法,该方法在定量分析手段下实现局部地区上的土壤环境质量精细区划,为土壤环境质量分区提供一种新方案,具有较强的应用普遍性,能为土壤环境质量区划工作中的环境质量评价、土壤环境质量防治与修复提供更有力的技术支撑。同时该方法能很好的应用于实际操作中,为土壤环境质量本地化分区提供了一种可软件化实现的标准方法。
本发明实施例提供一种土壤环境质量分区系统,如图10所示,该系统包括主成分分析模块1010、环境质量影响模块1020、最佳初始化模块1030、初始分类模块1040和分区模块1050,其中:
主成分分析模块1010用于基于主成分分析法提取目标区域中监测点的土壤环境质量综合特征;
环境质量影响模块1020用于采用地理探测器识别所述土壤环境质量综合特征与预设环境影响因素的分层异质性,筛选出土壤环境质量主要影响指标;
最佳初始化模块1030用于根据样点在所述土壤环境质量主要影响指标下的分类关系建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案;
初始分类模块1040用于以所述最佳预分类方案对构建的高斯混合模型进行初始化,通过期望最大化(Expectation-Maximum,简称EM)算法对所述高斯混合模型中表示样点类别的隐变量参数进行估算,得到所述监测点的初始分类;
分区模块1050用于基于所述监测点相应泰森多边形范围及所述监测点的初始分类,并结合所述目标区域的自然边界信息,对所述目标区域进行分区。
本实施例为与上述方法对应的系统实施例,详情请参考上述方法实施例,本系统实施例在此不再赘述。
如图11所示,该电子设备可以包括:处理器(processor)1110、通信接口(Communications Interface)1120、存储器(memory)1130和通信总线1140,其中,处理器1110,通信接口1120,存储器1130通过通信总线1140完成相互间的通信。处理器1110可以调用存储器1130中的逻辑指令,以执行土壤环境质量分区方法,该方法包括:
基于主成分分析法提取目标区域中监测点的土壤环境质量综合特征;
采用地理探测器识别所述土壤环境质量综合特征与预设环境影响因素的分层异质性,筛选出土壤环境质量主要影响指标;
根据样点在所述土壤环境质量主要影响指标下的分类关系建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案;
以所述最佳预分类方案对构建的高斯混合模型进行初始化,通过期望最大化(Expectation-Maximum,简称EM)算法对所述高斯混合模型中表示样点类别的隐变量参数进行估算,得到所述监测点的初始分类;
基于所述监测点相应泰森多边形范围及所述监测点的初始分类,并结合所述目标区域的自然边界信息,对所述目标区域进行分区。
此外,上述的存储器1130中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的土壤环境质量分区方法,该方法包括:
基于主成分分析法提取目标区域中监测点的土壤环境质量综合特征;
采用地理探测器识别所述土壤环境质量综合特征与预设环境影响因素的分层异质性,筛选出土壤环境质量主要影响指标;
根据样点在所述土壤环境质量主要影响指标下的分类关系建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案;
以所述最佳预分类方案对构建的高斯混合模型进行初始化,通过期望最大化(Expectation-Maximum,简称EM)算法对所述高斯混合模型中表示样点类别的隐变量参数进行估算,得到所述监测点的初始分类;
基于所述监测点相应泰森多边形范围及所述监测点的初始分类,并结合所述目标区域的自然边界信息,对所述目标区域进行分区。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的土壤环境质量分区方法,该方法包括:
基于主成分分析法提取目标区域中监测点的土壤环境质量综合特征;
采用地理探测器识别所述土壤环境质量综合特征与预设环境影响因素的分层异质性,筛选出土壤环境质量主要影响指标;
根据样点在所述土壤环境质量主要影响指标下的分类关系建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案;
以所述最佳预分类方案对构建的高斯混合模型进行初始化,通过期望最大化(Expectation-Maximum,简称EM)算法对所述高斯混合模型中表示样点类别的隐变量参数进行估算,得到所述监测点的初始分类;
基于所述监测点相应泰森多边形范围及所述监测点的初始分类,并结合所述目标区域的自然边界信息,对所述目标区域进行分区。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.一种土壤环境质量分区方法,其特征在于,包括:
基于主成分分析法提取目标区域中监测点的土壤环境质量综合特征;所述土壤环境质量综合特征用于代表所述目标区域中的土壤环境质量的特征;
采用地理探测器识别所述土壤环境质量综合特征与预设环境影响因素的分层异质性,筛选出土壤环境质量主要影响指标,包括:基于经验知识、文献资料查阅,对所述目标区域中可能影响土壤重金属分布的影响因素进行收集整理,建立环境影响因素候选集B;通过地理探测器对环境影响因素候选集B进行筛选,选择满足检验的环境影响因素作为主要环境影响指标;
根据样点在所述土壤环境质量主要影响指标下的分类关系建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案;
以所述最佳预分类方案对构建的高斯混合模型进行初始化,通过期望最大化算法对所述高斯混合模型中表示样点类别的隐变量参数进行估算,得到所述监测点的初始分类;
所述高斯混合模型的计算公式如下:
a=(a1,a2,…,an),
θ=(α1,α2,…,αK;θ1,θ2,…,θK),
其中,P表示高斯混合模型;ai表示第i个监测点上的土壤环境质量综合特征;μk表示第k个分布的期望矩阵;σk表示第k个分布的方差矩阵;K表示子高斯模型的个数,假设n个监测点的M个监测指标,总体反映了研究区土壤环境质量,则n个土壤环境监测点的多维土壤环境质量综合特征PC,可由K个子高斯模型的线性组合的高斯混合模型P来表征;αk是系数,其概率密度函数在其作用域内的积分之和为1;φ(a|θk)为第k个子高斯模型的高斯分布密度;N为土壤环境监测点的总个数;
基于所述监测点相应泰森多边形范围及所述监测点的初始分类,并结合所述目标区域的自然边界信息,对所述目标区域进行分区。
2.根据权利要求1所述的土壤环境质量分区方法,其特征在于,所述根据样点在所述土壤环境质量主要影响指标下的分类关系建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案,包括:
基于所述监测点的土壤环境质量综合特征和所述土壤环境质量主要影响指标,获取所述目标区域的预分类方案,所述预分类方案中包含所述监测点的类别个数;
根据所述预分类方案的贝叶斯信息准则指数,从所有预分类方案中筛选出最佳预分类方案;
将所述最佳预分类方案中的监测点的类别的个数作为所述最佳预分类方案。
3.根据权利要求1所述的土壤环境质量分区方法,其特征在于,所述基于所述监测点相应泰森多边形范围及所述监测点的初始分类,并结合所述目标区域的自然边界信息,对所述目标区域进行分区,包括:
根据所述监测点的初始分类和泰森多边形划分法,对所述目标区域进行划分,获取初始分区结果;
基于所述初始分区结果、所述目标区域的人为和自然边界,对所述初始分区结果进行优化,获取所述目标区域的最终分区结果。
4.根据权利要求3所述的土壤环境质量分区方法,其特征在于,所述根据所述监测点的初始分类和泰森多边形划分法,对所述目标区域进行划分,获取初始分区结果,具体包括:
基于泰森多边形划分法对所述目标区域进行划分,获取所述监测点对应的泰森多边形;
将所述监测点的类别作为对应泰森多边形的每条边的聚类属性;
将互为邻域且具有相同聚类属性的泰森多边形进行合并,获取所述初始分区结果,所述邻域为具有相同聚类属性的共享边的泰森多边形。
5.一种土壤环境质量分区系统,其特征在于,包括:
主成分分析模块,用于基于主成分分析法提取目标区域中监测点的土壤环境质量综合特征;所述土壤环境质量综合特征用于代表所述目标区域中的土壤环境质量的特征;
环境质量影响模块,用于采用地理探测器识别所述土壤环境质量综合特征与预设环境影响因素的分层异质性,筛选出土壤环境质量主要影响指标,包括:基于经验知识、文献资料查阅,对所述目标区域中可能影响土壤重金属分布的影响因素进行收集整理,建立环境影响因素候选集B;通过地理探测器对环境影响因素候选集B进行筛选,选择满足检验的环境影响因素作为主要环境影响指标;
最佳初始化模块,用于根据样点在所述土壤环境质量主要影响指标下的分类关系建立系列初始化预分类方案,以贝叶斯信息准则确定最佳预分类方案;
初始分类模块,用于以所述最佳预分类方案对构建的高斯混合模型进行初始化,通过期望最大化算法对所述高斯混合模型中表示样点类别的隐变量参数进行估算,得到所述监测点的初始分类;
所述高斯混合模型的计算公式如下:
a=(a1,a2,…,an),
θ=(α1,α2,…,αK;θ1,θ2,…,θK),
其中,P表示高斯混合模型;ai表示第i个监测点上的土壤环境质量综合特征;μk表示第k个分布的期望矩阵;σk表示第k个分布的方差矩阵;K表示子高斯模型的个数,假设n个监测点的M个监测指标,总体反映了研究区土壤环境质量,则n个土壤环境监测点的多维土壤环境质量综合特征PC,可由K个子高斯模型的线性组合的高斯混合模型P来表征;αk是系数,其概率密度函数在其作用域内的积分之和为1;φ(a|θk)为第k个子高斯模型的高斯分布密度;N为土壤环境监测点的总个数;
分区模块,用于基于所述监测点相应泰森多边形范围及所述监测点的初始分类,并结合所述目标区域的自然边界信息,对所述目标区域进行分区。
6.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述土壤环境质量分区方法的步骤。
7.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述土壤环境质量分区方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011604894.7A CN112785450B (zh) | 2020-12-30 | 2020-12-30 | 一种土壤环境质量分区方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011604894.7A CN112785450B (zh) | 2020-12-30 | 2020-12-30 | 一种土壤环境质量分区方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112785450A CN112785450A (zh) | 2021-05-11 |
CN112785450B true CN112785450B (zh) | 2021-12-07 |
Family
ID=75751744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011604894.7A Active CN112785450B (zh) | 2020-12-30 | 2020-12-30 | 一种土壤环境质量分区方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112785450B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113361944B (zh) * | 2021-06-21 | 2022-04-22 | 鑫安利中(北京)科技有限公司 | 基于物联网和人工智能的安全生产指标异常快速感知方法 |
CN113345538B (zh) * | 2021-06-23 | 2022-09-30 | 北京理工大学重庆创新中心 | 一种基于动态选取训练集的材料性能预测方法 |
CN114776304B (zh) * | 2022-05-30 | 2022-11-04 | 广州海洋地质调查局 | 一种深海矿产异常区识别的方法、装置、设备及介质 |
CN114998746A (zh) * | 2022-07-19 | 2022-09-02 | 江西省生态环境科学研究与规划院 | 一种耕地土壤环境质量分区方法及系统 |
CN116206011B (zh) * | 2023-05-05 | 2023-07-25 | 江西有色地质矿产勘查开发院 | 基于多源数据的数字土壤制图方法及系统 |
CN116500240B (zh) * | 2023-06-21 | 2023-12-29 | 江西索立德环保服务有限公司 | 一种土壤环境质量监测方法、系统及可读存储介质 |
CN117606554A (zh) * | 2023-11-23 | 2024-02-27 | 四川中衡检测技术有限公司 | 一种生态环境监测实时反馈系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103559389B (zh) * | 2013-10-21 | 2016-11-23 | 中国农业大学 | 一种县域耕地等级变化监测样点布设的方法 |
CN108416686B (zh) * | 2018-01-30 | 2021-10-19 | 中国矿业大学 | 一种基于煤炭资源开发的生态地质环境类型划分方法 |
CN109541172B (zh) * | 2018-10-25 | 2019-12-17 | 北京农业信息技术研究中心 | 土壤属性值的计算方法及装置 |
CN111815184B (zh) * | 2020-07-13 | 2021-04-16 | 农业农村部农业生态与资源保护总站 | 一种耕地土壤环境质量类别划分方法 |
-
2020
- 2020-12-30 CN CN202011604894.7A patent/CN112785450B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112785450A (zh) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112785450B (zh) | 一种土壤环境质量分区方法及系统 | |
Wadoux et al. | Machine learning for digital soil mapping: Applications, challenges and suggested solutions | |
Naghibi et al. | GIS-based groundwater potential mapping using boosted regression tree, classification and regression tree, and random forest machine learning models in Iran | |
CN109541172B (zh) | 土壤属性值的计算方法及装置 | |
Farsadnia et al. | Identification of homogeneous regions for regionalization of watersheds by two-level self-organizing feature maps | |
Stojanova et al. | Dealing with spatial autocorrelation when learning predictive clustering trees | |
Wan et al. | A knowledge-based decision support system to analyze the debris-flow problems at Chen-Yu-Lan River, Taiwan | |
Beucher et al. | Interpretation of convolutional neural networks for acid sulfate soil classification | |
CN116227692B (zh) | 一种农作物重金属富集风险量化方法、系统及可存储介质 | |
CN104850867A (zh) | 一种基于直觉模糊c均值聚类的目标识别方法 | |
CN112907113A (zh) | 一种考虑空间相关性的植被变化成因识别方法 | |
Ghezelbash et al. | Incorporating the genetic and firefly optimization algorithms into K-means clustering method for detection of porphyry and skarn Cu-related geochemical footprints in Baft district, Kerman, Iran | |
Sotomayor et al. | Implications of macroinvertebrate taxonomic resolution for freshwater assessments using functional traits: The Paute River Basin (Ecuador) case | |
Merufinia et al. | On the simulation of streamflow using hybrid tree-based machine learning models: A case study of Kurkursar basin, Iran | |
Chahouki | Multivariate analysis techniques in environmental science | |
CN112001436A (zh) | 一种基于改进的极限学习机的水质分类方法 | |
CN116933947A (zh) | 一种基于软投票集成分类器的滑坡易发性预测方法 | |
Kiersztyn et al. | Random clustering-based outlier detector | |
Barkataki et al. | Prediction of size of buried objects using ground penetrating radar and machine learning techniques | |
Huang et al. | Clustering Analysis of Integrated Rural Land for Three Industries Using Deep Learning and Artificial Intelligence | |
Kadam et al. | Data mining in finance | |
GUSTI et al. | Oil Palm Plantation Land Suitability Classification using PCA-FCM | |
Kurihana et al. | Identifying Climate Patterns using Clustering Autoencoder Techniques | |
Alijanpour Shalmani et al. | Prediction of daily suspended sediment load using the Genetic Expression Programming and Artificial Neural Network models | |
Fuentes et al. | rassta: Raster-based Spatial Stratification Algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |