CN114548598A - 土壤重金属污染物溯源和浓度预测方法、设备及介质 - Google Patents
土壤重金属污染物溯源和浓度预测方法、设备及介质 Download PDFInfo
- Publication number
- CN114548598A CN114548598A CN202210210650.3A CN202210210650A CN114548598A CN 114548598 A CN114548598 A CN 114548598A CN 202210210650 A CN202210210650 A CN 202210210650A CN 114548598 A CN114548598 A CN 114548598A
- Authority
- CN
- China
- Prior art keywords
- heavy metal
- pollution
- principal component
- pollution source
- source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229910001385 heavy metal Inorganic materials 0.000 title claims abstract description 97
- 239000002689 soil Substances 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 46
- 239000003344 environmental pollutant Substances 0.000 title claims abstract description 16
- 231100000719 pollutant Toxicity 0.000 title claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims abstract description 47
- 238000000513 principal component analysis Methods 0.000 claims abstract description 27
- 238000005070 sampling Methods 0.000 claims abstract description 23
- 238000009826 distribution Methods 0.000 claims description 33
- 230000001419 dependent effect Effects 0.000 claims description 23
- 238000003860 storage Methods 0.000 claims description 16
- 229910052751 metal Inorganic materials 0.000 claims description 13
- 239000002184 metal Substances 0.000 claims description 13
- 230000000694 effects Effects 0.000 claims description 11
- 238000012417 linear regression Methods 0.000 claims description 7
- 238000011109 contamination Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 3
- 239000000356 contaminant Substances 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 10
- 241000196324 Embryophyta Species 0.000 description 9
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 7
- 229910052802 copper Inorganic materials 0.000 description 7
- 239000010949 copper Substances 0.000 description 7
- 238000005065 mining Methods 0.000 description 7
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 6
- 238000011084 recovery Methods 0.000 description 6
- 239000011651 chromium Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 229910052785 arsenic Inorganic materials 0.000 description 3
- RQNWIZPPADIBDY-UHFFFAOYSA-N arsenic atom Chemical compound [As] RQNWIZPPADIBDY-UHFFFAOYSA-N 0.000 description 3
- 229910052793 cadmium Inorganic materials 0.000 description 3
- BDOSMKKIYDKNTQ-UHFFFAOYSA-N cadmium atom Chemical compound [Cd] BDOSMKKIYDKNTQ-UHFFFAOYSA-N 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 3
- 229910052753 mercury Inorganic materials 0.000 description 3
- 229910052759 nickel Inorganic materials 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000003900 soil pollution Methods 0.000 description 3
- 229910052725 zinc Inorganic materials 0.000 description 3
- 239000011701 zinc Substances 0.000 description 3
- 238000003723 Smelting Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 229910052804 chromium Inorganic materials 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 108010074864 Factor XI Proteins 0.000 description 1
- GSEKYIWUAPZIEF-UHFFFAOYSA-N Ismine Chemical compound CNC1=CC=CC=C1C(C(=C1)CO)=CC2=C1OCO2 GSEKYIWUAPZIEF-UHFFFAOYSA-N 0.000 description 1
- 241000149788 Pseudophryne major Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 229910052683 pyrite Inorganic materials 0.000 description 1
- NIFIFKQPDTWWGU-UHFFFAOYSA-N pyrite Chemical compound [Fe+2].[S-][S-] NIFIFKQPDTWWGU-UHFFFAOYSA-N 0.000 description 1
- 239000011028 pyrite Substances 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/24—Earth materials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Remote Sensing (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Environmental & Geological Engineering (AREA)
Abstract
本发明实施例公开了一种土壤重金属污染物溯源和浓度预测方法、设备及介质,其中,溯源方法包括:对一区域内多个采样点的土壤重金属浓度构成的矩阵进行主成分分析;根据主成分分析结果,确定所述区域内多个污染源的名称及地理位置;采用地理探测器,从所述多个污染源中选取最终的污染源。本实施例能够准确识别污染源的名称和位置。
Description
技术领域
本发明实施例涉及土壤污染治理领域,尤其涉及一种土壤重金属污染物溯源和浓度预测方法、设备及介质。
背景技术
随着土壤重金属污染问题日益严重,重金属污染溯源对土壤污染治理尤为重要。目前的研究中,常见的重金属污染物源解析方法主要为稳定素同位素法、主成分分析法、聚类分析和正定矩阵因子法等方法,均对土壤污染源有一定的解释作用。
但稳定同位素方法主要适用于具有稳定同位素的几个重金属元素,并且由于需要比对各种不同形态的重金属,工作量大且成本高,目前常用于小区域定点土壤重金属的溯源解析;主成分和聚类分析则更多的是定性分析,难以定量解析。正定因子矩阵得到的定量源只是粗略的工业农业或者成土母质,在区域内存在多个潜在工业污染源的时候,不能准确判断污染来自哪个工业源,很难准确识别不同污染源的贡献和位置。
发明内容
本发明实施例提供一种土壤重金属污染物溯源和浓度预测方法、设备及介质,采用主成分分析和地理探测器相结合,准确识别污染源的名称和位置。
第一方面,本发明实施例提供了一种土壤重金属污染物溯源方法,包括:
对一区域内多个采样点的土壤重金属浓度构成的矩阵进行主成分分析;
根据主成分分析结果,确定所述区域内多个污染源的名称及地理位置;
采用地理探测器,从所述多个污染源中选取最终的污染源。
第二方面,本发明实施例提供了一种土壤重金属浓度预测方法,包括:
获取待预测的地理位置;
将所述待预测的地理位置输入如权利要求5或6所述的土壤重金属浓度预测模型,得到所述待预测的地理位置的重金属浓度。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述实施例所述的土壤重金属污染物溯源或土壤重金属浓度预测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所述的土壤重金属污染物溯源或土壤重金属浓度预测方法。
本发明实施例的技术效果如下:
1.本发明实施例将主成分分析结果和地理探测器相结合,通过主成分分析确定污染源的初始选取范围,再通过地理探测器确定每个污染源对主成分得分的影响程度,筛选出更精确的污染源,实现了污染源的自动化确定,减少了人为经验对污染源选取的干预。
2.本发明实施例采用因子载荷矩阵确定了污染源的类型,采用因子得分矩阵确定了污染源的空间分布,然后根据污染源的类型和空间分布确定具体的污染源名称及地理位置,突破了正定因子矩阵模型只能识别污染源类型(如工业源、交通源、地质背景等)的缺陷,识别结果更加精细。
3.本发明实施例根据主成分因子得分的空间分布,将贡献最大的污染源定位在主成分因子得分最高的子区域附近;再结合待识别区域的地理信息自动识别出贡献最大的污染源的名称和位置。无需人为参与,实现了污染源的自动化识别,识别结果准确,识别速度快。
4.本发明实施例利用地理探测器中因子探测器的基本原理,将所述主成分因子得分的空间分布为因变量,将采样点到每个污染源的距离的空间分布作为自变量因子,选取出对因变量影响程度最高的污染源,进一步确定出精确的污染源范围。充分利用了主成分分析中得到的变量分布,无需引入其他的变量,简单快捷,准确性高。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种土壤重金属污染物溯源方法的流程图;
图2是本发明实施例提供的两个主成分因子的因子得分的空间分布示意图;
图3是分发明实施例提供的预测模型与正定因子矩阵模型的结果对比图;
图4是本发明实施例提供的一种土壤重金属浓度预测方法的流程图;
图5是本发明实施例提供的本申请提供的预测浓度、与PMF的预测浓度以及真实浓度之间的对比图;
图6是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行清楚、完整的描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
图1是本发明实施例提供的一种土壤重金属污染物溯源方法的流程图,适用于根据部分采样点的重金属浓度确定区域内重金属污染源的情况,本实施例由电子设备执行。结合图1,本实施例提供的方法具体包括:
S110、对一区域内多个采样点的土壤重金属浓度构成的矩阵进行主成分分析。
所述区域指预先选取的地理区域,本实施例将对该区域的重金属污染源进行溯源,确定其名称和地理位置。所述多个采样点为所述地理区域内的部分地理位置,本实施例对这些地理位置处土壤中的的重金属浓度进行采样,形成初始矩阵进行主成分分析,以根据主成分分析结果确定潜在的污染源。
具体来说,首先,根据多个采样点的土壤重金属浓度生成主成分分析的初始矩阵。其中,初始矩阵中的每个元素位置对应一个地理位置的二维空间坐标,每个元素值对应所述地理位置的重金属浓度。本实施例基于这样一个假设,即污染物的总浓度等于所有污染源的贡献之和。
例如,假设预先选取的地理区域为1000m*1000m的正方形区域,对该区域的长和宽分别以500m为步长进行网格划分,得到9个网格点。从所述 9个网格点中选取空间坐标分别为[0,0]、[500,500]、[500,1000]和[1000、500] 的四个网格点作为采样点,采集所述四个采样点处的铬元素(Cr)浓度,分别为47.86mg/kg、53.78mg/kg、68.41mg/kg和46.34mg/kg,则构建如下初始矩阵:
在一具体实施方式中,预先选取安徽铜陵一多工业园区作为所述地理区域。该园区位于安徽省中部某地级市,有较为丰富的矿产资源,对硫铁矿和铜矿等矿产有较长时间的开采历史。园区成立于21世纪初,经过多年的建设发展,初步形成了以铜加工利用、机械制造电子元件为重点的主导产业。园区规划总面积为14.2km2,比邻多条铁路和公路园区西部以河流为界,河流自南向西北方向流动,且上游流经矿区也冶炼厂。园区西南部也有矿区分布。园区主导风向为自西南向东北方向。确定预选区域后,采集园区内多个采样点的土壤重金属浓度,具体的浓度数值不再赘述,表1仅以统计形式显示该园区的土壤重金属浓度概况。
表1
如表1所示,该园区包括8种主要重金属,因此初始矩阵为三维矩阵,第三维度的尺寸为8。
得到初始矩阵后,对所述初始矩阵进行主成分分析,主成分分析结果用于确定所属区域内的潜在污染源。具体来说,主成分分析的本质是将影响重金属浓度的至少一个污染源转换为相互不相关的至少一个主成分因子,每个主成分因子用于表征至少一个污染源的综合体。可选地,出于源识别的目的,主成分分析中采用的旋转方法是方差最大化旋转(varimax),旋转后提取特征值大于1的因子作为主成分因子。
可选地,主成分分析结果包括:主成分因子的因子载荷矩阵和因子得分矩阵。
因子载荷矩阵是指以每个主成分因子为自变量、以每个采样点的重金属浓度为因变量的关系方程的方程系数构成的矩阵,反映了每个主成分因子对每个采样点的重金属浓度的贡献率,用于确定潜在污染源的类型。
因子得分矩阵是指以每个采样点的重金属浓度为自变量、以每个主成分因子为因变量的关系方程的方程系数构成的矩阵,反映了每个采样点的重金属浓度对每个主成分因子的贡献率,用于确定潜在污染源的空间分布。
S120、根据主成分分析结果,确定所述区域内多个污染源的名称及地理位置。
可选地,根据主成分分析结果,确定所述区域内多个污染源的名称及地理位置,具体包括如下步骤:
步骤一、根据因子载荷矩阵,确定所述区域内污染源的类型。
具体来说,首先,根据因子载荷矩阵,得到旋转分量矩阵。旋转分量矩阵是指以每个主成分因子为自变量、以所述区域内每种重金属的浓度为因变量的关系方程的方程系数构成的矩阵,反映了每个主成分因子对每种重金属的浓度的贡献率。在上述工业园区的具体实施方式中,对初始矩阵进行主成分分析后,根据因子载荷矩阵得到如表2所示的旋转分量矩阵。
表2
如表2所示,经过varimax旋转后提取得到2个主成分因子:因子1 和因子2。因子1和因子2相互不相关,每个因子表征了至少一个污染源的综合体。旋转分量矩阵的每一行对应一种重金属,每一列对应一个主成分因子,每个元素值为所在列的主成分因子对所在行的重金属浓度的贡献。例如,第1行、第1列的元素表示因子1对Cr元素浓度的贡献率为0.82。
得到旋转分量矩阵后,根据矩阵中主成分因子对重金属浓度的贡献情况确定潜在污染源的类型(例如,人为源或自然源)。可选地,如果一主成分因子对多种金属(例如3种)中每种金属浓度的贡献率均大于设定阈值(例如0.8),则认为所述主成分因子对应的污染源(一种或多种)为多种重金属的排放源。再结合源解析专业知识和现有研究基础可判断此污染源的类型,例如人为污染源。
在上述工业园区的具体实施方式中,两个主成分因子均能够解释土壤重金属的来源。其中,因子1对铬、铜、锌、汞、砷、铅和镉七种重金属的贡献率分别为0.82、0.97、0.98、0.88、0.98、0.93和0.96,能够解释七种重金属的绝大部分来源;因子2对镍的贡献率为0.95,解释了镍的来源。上述分析表明,该园区土壤中的重金属元素主要来源于因子1,因子1对应的污染源为人为污染源。
步骤二、根据因子得分矩阵,确定主成分因子得分的空间分布。
因子得分矩阵中的元素值称为主成分因子得分,反映了每个采样点的重金属浓度对每个主成分因子的贡献率。根据每个采样点对应的主成分因子得分,以及采样点的空间坐标,可以确定出主成分因子得分的空间分布。
步骤三、根据所述污染源的类型和所述主成分因子得分的空间分布,确定所述区域内多个污染源的名称及地理位置。
可选地,首先,根据所述主成分因子得分的空间分布,确定所述区域内主成分因子得分最高的子区域。
因子得分最高的子区域用于确定污染源的名称及位置,子区域附近是潜在污染源最有可能出现的地方。图2是本发明实施例提供的两个主成分因子的因子得分的空间分布示意图,对应表2所示的具体实施方式。左图为因子1的得分空间分布,右图为因子2的得分空间分布。如图2所示,因子1得分较高的区域主要集中在园区的西侧,则将西侧作为得分最高的子区域。
然后,根据所述污染源的类型和所述子区域,确定多个污染源的名称及地理位置。
具体来说,本实施例提供两种污染源确定策略。一种是从因子得分最高的子区域出发确定污染源。子区域附近是潜在污染源最有可能出现的地方,结合待研究区域的地理信息(例如园区地图),寻找子区域附近的人为污染源。在上述工业园区的具体实施方式中,园区西侧附近的人为污染源有上游流经矿区的河流,因此,该河流被认为是一个污染源。
另一种是不考虑子区域,单纯从污染源类型出发确定其他污染源。在上述工业园区的具体实施方式中,该园区是一个主要用于铜加工的工业园区,园区外的矿山主要用于铜生产,存在其他人为污染源,包括大气沉积 (来自矿区冶炼)、运输(如主要道路运输)和其他人类活动(居民区) 等。
将两种策略的确定结果加以综合,最终得到五个污染源,分别是:金属回收加工厂、河流、主干道、矿区和社区。
S130、采用地理探测器,从所述多个污染源中选取最终的污染源。
为了使上述得到的污染源更加准确,本实施例采用地理探测器,对各污染源的可靠性进行判断。本实施例采用地理探测器的因子探测器。将自变量和因变量输入因子探测器后,输出每个自变量对应的q值来表征每个自变量对因变量的影响程度,以达到自变量筛选的目的。
可选地,以所述主成分因子得分的空间分布为因变量、采样点到每个污染源的距离的空间分布为自变量,采用地理探测器评测每个污染源对因变量的影响程度;根据每个污染源对因变量的影响程度,从所述多个污染源中选取最终的污染源。
在上述工业园区的具体实施方式中,共总结了五个具体的污染源,分别是:金属回收加工厂、河流、主干道、矿区和社区。本实施例将利用地理探测去识别方法,从这五个污染源中选取可靠性更高的污染源,作为最终的污染源。
具体来说,将采样点到每个污染源的最短距离的空间分布X1(金属回收加工厂)、X2(河流)、X3(主干道)、X4(矿区)和X5(社区)作为5个自变量,将每个主成分因子得分的空间分布作为因变量Y1(因子1) 和Y2(因子2),将自变量和因变量输入因子探测器,得到Xi对Yj的q 值,i=1、2、3、4、5,j=1、2。计算原理如下:
其中,qx是用于测量Xi和Yj之间空间关联的索引值,h=1,2,3…,L,L 表示因子Xi的层数(子区域或子类),N和Nh分别表示整个区域和每个地层h中的样本数量。符号σ2和σh 2分别代表整个区域和每个h层中Yj的方差。
公式中的各变量均由地理探测器对输入数据自动统计确定,无需人为参与。最终计算出的q值为0到1中间的某个值,表示Yj受Xi的影响程度。q值越大,Xi和Yj之间的空间关联越强,从而通过因子检测完成主成分因子和污染源的匹配。
经地理探测器计算,金属回收和加工厂(X1)、河流(X2)和社区(X5) 对应于土壤主成分因子1的q值分别为0.52、0.51和0.46,对主成分因子1 的空间分布有一定的解释作用。这表明,除了河流,土壤主成分因子1在空间分布上与其他污染源相关。X1(金属回收加工厂)和X4(矿区)对应于土壤主成分因子2的q值较低,最大值为0.23,对主成分因子2的空间分布有一定的解释作用。此外,X3(主干道)对应于主成分因子1和主成分因子2的q值均小于0.05,对两个主成分因子的解释程度均较低。因此,将主干道排除在污染源范围之外,土壤重金属污染源范围进一步缩小为:金属回收和加工厂(X1)、河流(X2)、矿区(X4)和社区(X5)。
本实施例的技术效果如下:
1.本发明实施例将主成分分析结果和地理探测器相结合,通过主成分分析确定污染源的初始选取范围,再通过地理探测器确定每个污染源对主成分得分的影响程度,筛选出更精确的污染源,实现了污染源的自动化确定,减少了人为经验对污染源选取的干预。
2.本发明实施例采用因子载荷矩阵确定了污染源的类型,采用因子得分矩阵确定了污染源的空间分布,然后根据污染源的类型和空间分布确定具体的污染源名称及地理位置,突破了正定因子矩阵模型只能识别污染源类型(如工业源、交通源、地质背景等)的缺陷,识别结果更加精细。
3.本发明实施例根据主成分因子得分的空间分布,将贡献最大的污染源定位在主成分因子得分最高的子区域附近;再结合待识别区域的地理信息自动识别出贡献最大的污染源的名称和位置。无需人为参与,实现了污染源的自动化识别,识别结果准确,识别速度快。
4.本发明实施例利用地理探测器中因子探测器的基本原理,将所述主成分因子得分的空间分布为因变量,将采样点到每个污染源的距离的空间分布作为自变量因子,选取出对因变量影响程度最高的污染源,进一步确定出精确的污染源范围。充分利用了主成分分析中得到的变量分布,无需引入其他的变量,简单快捷,准确性高。
在上述实施例和下述实施例的基础上,本实施例根据最终确定的污染源建立金属浓度预测模型。可选地,采用地理探测器,从所述多个污染源中选取最终的污染源之后,还包括:根据所述最终的污染源,采用线性回归方法建立重金属浓度预测模型,其中,所述预测模型以所述区域内任一地理位置与所述最终的污染源之间的距离为自变量,以所述地理位置的土壤重金属浓度为因变量。
本实施例以最终的污染源为基础建立回归方程,定量识别污染源对重金属浓度的影响。所述回归方程以任一地理位置到最终的污染源的距离为自变量,以所述地理位置的土壤重金属浓度为因变量。具体来说,考虑到这些重金属从最终的污染源到土壤的传播特性随着距离的增加而减少,因此利用采样点到最终的污染源的距离来量化污染源的的贡献。可选地,构建如下回归方程:
其中,c表示任一地理位置处的重金属浓度,D表示该地理位置距离最终的污染源的距离;A和b为待拟合的常数。
构建回归方程的形式后,利用采样点处的中金属浓度和距离最终的污染源的距离,来拟合回归方程中的待定参数,得到最终的回归模型。对拟合好的回归模型进行拟合度和显著性检验,满足拟合度和显著性要求的模型能够用于预测任一位置处的重金属浓度。
可选地,所述最终的污染源有多个;根据所述最终的污染源,采用线性回归方法建立重金属浓度预测模型,包括:采用多元线性回归方法,根据多个最终的污染源确定金属浓度预测模型的最优自变量组合,其中,所述最优自变量组合包括:所述区域内任一地理位置与至少一个最终的污染源之间的距离;建立以所述最优自变量组合为自变量、以所述地理位置的土壤重金属浓度为因变量的所述预测模型。
当最终的污染源有多个时,预测模型采用多元线性回归方程,自变量为一地理位置与至少一个最终的污染源之间的距离。表3显示了上述工业园区的土壤重金属浓度的回归模型。
表3
其中,Dmine、Dcommunity和Driver分别表示一地理位置与金属矿、河流和加工厂的位置。可以看出,方程的因变量为各种重金属的浓度,方程的自变量因子为Dmine、Dcommunity和Driver。在方程拟合过程中,除了金属加工厂、河流和矿山,回归方程中原本还考虑了主要道路这一最终的污染源。然而,经过计算后,该变量对各种重金属的浓度影响非常小,被排除在回归模型的自变量组合之外。
从表3还可以看出,流经矿山的河流是铜、锌、汞、砷、铅和镉最可能的污染源。矿区是铬的最重要来源,社区对镍和汞的来源有一定的解释作用。R2用于通过回归方程测量变量的解释程度,表3中的八个模型的R2 均高于0.5,其中Pb的回归方程的拟合度最高,为0.89。
与正定因子矩阵(PMF)模型相比,本实施例提供的预测模型能够定量识别污染源。图3是分发明实施例提供的预测模型与正定因子矩阵模型的结果对比图。结合图3,对于某个区域的污染治理而言,如果只知道污染源的类型,而位置不确定,则可能难以实施有效的治理。因为有些地区可能有几个污染源,但都属于同一类别。例如,在上述工业园区的具体实施方式中,矿山和工厂的污染源类型都是工业活动。PMF模型得到的溯源结果难以进一步定位污染源。而本申请的溯源结果和预测模型可以与距离一起使用,以量化可能的污染源(已知位置)是否是主要的源因子,有力对复杂环境下的污染治理。
图4是本发明实施例提供的一种土壤重金属浓度预测方法的流程图,适用于根据建立好的预测模型预测区域内任一位置处的重金属浓度的情况,本实施例由电子设备执行。结合图4,本实施例提供的方法具体包括:
S210、获取待预测的地理位置。
S220、将所述待预测的地理位置输入上述任一实施例所述的土壤重金属浓度预测模型,得到所述待预测的地理位置的重金属浓度。
上述任一实施例构建的预测模型依靠最终的污染源到某一地理位置的距离来量化源贡献。因此,在理论上,该位置处的重金属浓度应该与该位置到主要污染源的距离呈现出负相关特性。
本实施例采用模型预测了多个地理位置处的重金属浓度,预测结果表明,随着离河流距离的增加,土壤中重金属含量明显降低。例如,在铅的含量从300mg/kg(距离河流387m)迅速下降到38mg/kg(距离河流1900m) 后,基本上保持在40mg/kg的水平。此外,铜、锌、砷和镉的变化趋势相同。由此验证了预测模型的有效性。
图5是本发明实施例提供的本申请提供的预测浓度、与PMF的预测浓度以及真实浓度之间的对比图。可以看出,本申请预测的浓度与真实浓度更为接近。
可选地,得到所述待预测的地理位置的重金属浓度之后,还包括:得到多个待预测的地理位置的重金属浓度后,如果两个待预测的地理位置与一最终的污染源之间的距离的变化趋势与所述两个待预测的地理位置的重金属浓度的变化趋势相同,认为所述两个待预测的地理位置之间存在多个污染源的交互效应。
本实施例采用多个地理位置的预测结果对多个污染源的影响效应进行了一定分析。总的来说,重金属浓度随距离的变化与源因子的交互检测功能相结合,验证并分析了已识别污染源的特征。具体来说,以污染源为中心,500米为梯度,大部分种类重金属浓度的变化趋势与预测模型识别的污染源相符,重金属浓度随着与河流、道路和社区等的距离而逐渐降低。而某些种类的重金属出现振荡变化趋势,表明此处存在多个污染源的交互效应。通过类似的污染源特性分析,能够更好地分析污染源对周围地区的影响。
图6为本发明实施例提供的一种电子设备的结构示意图,如图6所示,该设备包括处理器50、存储器51、输入装置52和输出装置53;设备中处理器50的数量可以是一个或多个,图6中以一个处理器50为例;设备中的处理器50、存储器51、输入装置52和输出装置53可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器51作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的一种土壤重金属污染物溯源和浓度预测方法、设备及介质对应的程序指令/模块。处理器50通过运行存储在存储器51中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的一种土壤重金属污染物溯源和浓度预测方法、设备及介质。
存储器51可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器51可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器51可进一步包括相对于处理器50远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置52可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置53可包括显示屏等显示设备。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一实施例的一种土壤重金属污染物溯源和浓度预测方法、设备及介质。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如 Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案。
Claims (10)
1.一种土壤重金属污染物溯源方法,其特征在于,包括:
对一区域内多个采样点的土壤重金属浓度构成的矩阵进行主成分分析;
根据主成分分析结果,确定所述区域内多个污染源的名称及地理位置;
采用地理探测器,从所述多个污染源中选取最终的污染源。
2.根据权利要求1所述的方法,其特征在于,所述主成分分析结果包括:表征污染源的主成分因子的因子载荷矩阵和因子得分矩阵;
根据主成分分析结果,确定所述区域内多个污染源的名称及地理位置,包括:
根据因子载荷矩阵,确定所述区域内污染源的类型;
根据因子得分矩阵,确定主成分因子得分的空间分布;
根据所述污染源的类型和所述主成分因子得分的空间分布,确定所述区域内多个污染源的名称及地理位置。
3.根据权利要求2所述的方法,其特征在于,根据所述污染源的类型和所述主成分因子得分的空间分布,确定所述区域内多个污染源的名称及地理位置,包括:
根据所述主成分因子得分的空间分布,确定所述区域内主成分因子得分最高的子区域;
根据所述污染源的类型和所述子区域,确定多个污染源的名称及地理位置。
4.根据权利要求2所述的方法,其特征在于,采用地理探测器,从所述多个污染源中选取最终的污染源,包括:
以所述主成分因子得分的空间分布为因变量、采样点到每个污染源的距离的空间分布为自变量,采用地理探测器评测每个污染源对因变量的影响程度;
根据每个污染源对因变量的影响程度,从所述多个污染源中选取最终的污染源。
5.根据权利要求1所述的方法,其特征在于,采用地理探测器,从所述多个污染源中选取最终的污染源之后,还包括:
根据所述最终的污染源,采用线性回归方法建立重金属浓度预测模型,其中,所述预测模型以所述区域内任一地理位置与所述最终的污染源之间的距离为自变量,以所述地理位置的土壤重金属浓度为因变量。
6.根据权利要求5所述的方法,其特征在于,所述最终的污染源有多个;
根据所述最终的污染源,采用线性回归方法建立重金属浓度预测模型,包括:
采用多元线性回归方法,根据多个最终的污染源确定金属浓度预测模型的最优自变量组合,其中,所述最优自变量组合包括:所述区域内任一地理位置与至少一个最终的污染源之间的距离;
建立以所述最优自变量组合为自变量、以所述地理位置的土壤重金属浓度为因变量的所述预测模型。
7.一种土壤重金属浓度预测方法,包括:
获取待预测的地理位置;
将所述待预测的地理位置输入如权利要求5或6所述的土壤重金属浓度预测模型,得到所述待预测的地理位置的重金属浓度。
8.根据权利要求7所述的方法,其特征在于,得到所述待预测的地理位置的重金属浓度之后,还包括:
得到多个待预测的地理位置的重金属浓度后,如果两个待预测的地理位置与一最终的污染源之间的距离的变化趋势与所述两个待预测的地理位置的重金属浓度的变化趋势相同,认为所述两个待预测的地理位置之间存在多个污染源的交互效应。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的土壤重金属污染物溯源和如权利要求7或8所述的土壤重金属浓度预测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的土壤重金属污染物溯源和如权利要求7或8所述的土壤重金属浓度预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210210650.3A CN114548598A (zh) | 2022-03-04 | 2022-03-04 | 土壤重金属污染物溯源和浓度预测方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210210650.3A CN114548598A (zh) | 2022-03-04 | 2022-03-04 | 土壤重金属污染物溯源和浓度预测方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114548598A true CN114548598A (zh) | 2022-05-27 |
Family
ID=81660974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210210650.3A Pending CN114548598A (zh) | 2022-03-04 | 2022-03-04 | 土壤重金属污染物溯源和浓度预测方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114548598A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102565774B1 (ko) * | 2022-10-21 | 2023-08-09 | 고려대학교 산학협력단 | 토양의 중금속 오염원 규명 방법 |
-
2022
- 2022-03-04 CN CN202210210650.3A patent/CN114548598A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102565774B1 (ko) * | 2022-10-21 | 2023-08-09 | 고려대학교 산학협력단 | 토양의 중금속 오염원 규명 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114443982B (zh) | 一种大区域土壤重金属检测与时空分布特征分析方法及系统 | |
US9823231B1 (en) | Systems and methods for assembling a collection of peaks characterizing a gas leak source and selecting representative peaks for display | |
CN110242865B (zh) | 一种易于持续优化的燃气泄漏检测判定方法及系统 | |
CN109697221A (zh) | 轨迹规律的挖掘方法、装置、存储介质及电子设备 | |
CN103345566B (zh) | 基于地质内涵的化探异常识别与评价方法 | |
CN115688404B (zh) | 基于svm-rf模型的降雨型滑坡预警方法 | |
CN102044094A (zh) | 线路巡检管理系统及方法 | |
CN103278616B (zh) | 一种土壤腐蚀性快速评价的多因子方法 | |
WO2013009160A2 (en) | A geometric method for predicting landslide disaste | |
Zhang et al. | Mineral prospectivity mapping with weights of evidence and fuzzy logic methods | |
CN116109462B (zh) | 一种自然灾害后饮水水源地污染监测预警方法及系统 | |
Kazemi-Beydokhti et al. | Determination of the physical domain for air quality monitoring stations using the ANP-OWA method in GIS | |
CN114548598A (zh) | 土壤重金属污染物溯源和浓度预测方法、设备及介质 | |
Huang et al. | Ecological risk assessment from the perspective of soil heavy metal accumulations in Xiamen city, China | |
CN115830010B (zh) | 输电导线交叉跨越距离检测方法、装置和计算机设备 | |
CN112163166A (zh) | 检测道路属性的方法、装置、计算机可读介质及电子设备 | |
CN111539904A (zh) | 一种基于降雨量的灾害易发性预测方法 | |
CN114154627B (zh) | 一种基于gis与双层神经网络的土壤剖面测量方法及设备 | |
CN117113038B (zh) | 城市水土流失黄泥水事件溯源方法及系统 | |
Siarkos et al. | Implementation and evaluation of different techniques to modify DRASTIC method for groundwater vulnerability assessment: A case study from Bouficha aquifer, Tunisia | |
Yan et al. | Groundwater quality evaluation using a classification model: a case study of Jilin City, China | |
CN115541834B (zh) | 地下水污染源位置识别方法及装置、电子设备、存储介质 | |
CN116703004A (zh) | 一种基于预训练模型的水系流域智慧巡护方法和装置 | |
CN114611832B (zh) | 一种基于贝叶斯多模型集对分析的海水入侵预测方法 | |
Nasser et al. | Reliability of smart noise pollution map |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |