CN116166923A - 基于地统计分析与apls-mlr的土壤重金属来源解析方法 - Google Patents
基于地统计分析与apls-mlr的土壤重金属来源解析方法 Download PDFInfo
- Publication number
- CN116166923A CN116166923A CN202211587357.5A CN202211587357A CN116166923A CN 116166923 A CN116166923 A CN 116166923A CN 202211587357 A CN202211587357 A CN 202211587357A CN 116166923 A CN116166923 A CN 116166923A
- Authority
- CN
- China
- Prior art keywords
- heavy metal
- representing
- soil
- matrix
- dependent variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229910001385 heavy metal Inorganic materials 0.000 title claims abstract description 81
- 239000002689 soil Substances 0.000 title claims abstract description 67
- 238000004458 analytical method Methods 0.000 title claims abstract description 47
- 208000003343 Antiphospholipid Syndrome Diseases 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 claims abstract description 41
- 238000011160 research Methods 0.000 claims abstract description 36
- 238000009826 distribution Methods 0.000 claims abstract description 27
- 238000012417 linear regression Methods 0.000 claims abstract description 21
- 238000010586 diagram Methods 0.000 claims abstract description 19
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 9
- 238000005070 sampling Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 230000001419 dependent effect Effects 0.000 claims description 42
- 239000011159 matrix material Substances 0.000 claims description 39
- 238000000605 extraction Methods 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 12
- 238000011835 investigation Methods 0.000 claims description 6
- 238000003900 soil pollution Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000002372 labelling Methods 0.000 claims description 2
- 238000007619 statistical method Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 239000000126 substance Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 229910052751 metal Inorganic materials 0.000 description 4
- 239000002184 metal Substances 0.000 description 4
- 238000009792 diffusion process Methods 0.000 description 3
- 229910052745 lead Inorganic materials 0.000 description 3
- 229910052753 mercury Inorganic materials 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 229910052793 cadmium Inorganic materials 0.000 description 2
- 230000002262 irrigation Effects 0.000 description 2
- 238000003973 irrigation Methods 0.000 description 2
- 238000010238 partial least squares regression Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000003621 irrigation water Substances 0.000 description 1
- 238000001948 isotopic labelling Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000003802 soil pollutant Substances 0.000 description 1
- 239000002351 wastewater Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N1/00—Sampling; Preparing specimens for investigation
- G01N1/02—Devices for withdrawing samples
- G01N1/04—Devices for withdrawing samples in the solid state, e.g. by cutting
- G01N1/08—Devices for withdrawing samples in the solid state, e.g. by cutting involving an extracting tool, e.g. core bit
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/24—Earth materials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Databases & Information Systems (AREA)
- Biochemistry (AREA)
- Pathology (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Remote Sensing (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Analytical Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Food Science & Technology (AREA)
- Geology (AREA)
- Software Systems (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Environmental & Geological Engineering (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及基于地统计分析与APLS‑MLR的土壤重金属来源解析方法,包括:对研究区域的土壤进行采样,测量土壤样本中重金属的含量,并进行预处理;利用克里金插值方法分析得到研究区域的土壤重金属空间含量分布特征图;对研究区域的重金属浓度数据采用偏最小二乘法进行分析;建立用于土壤重金属污染源解析的绝对偏最小二乘‑多元线性回归法受体模型;结合土壤重金属空间含量分布特征图和各污染源贡献率,推断确定具体的污染源。本发明方法不仅能计算确定污染源数量以及各个污染源的贡献率,还能准确确定具体的污染源;本发明提出的受体模型的APLS‑MLR方法,解决了APCS‑MLR方法中主成分分析时特征值的分解具有局限性的问题。
Description
技术领域
本发明属于土壤重金属分析领域,具体涉及一种基于地统计分析与APLS-MLR的土壤重金属来源解析方法。
背景技术
随着工业化的快速发展和城市化进程加快,土壤重金属污染愈发严重,2014年发布的《全国土壤污染状况调查公报》指出我国土壤状况总体不容乐观,尤其是耕地土壤环境质量堪忧,全国土壤点位超标率高达16.1%。土壤重金属污染不仅会降低土壤活性,降低农产品产量,还会通过食物链进入人体,对人体健康造成危害。农田土壤污染来源识别是农田土壤重金属污染预防和治理修复的基础。因此开展农田土壤重金属污染来源的定量解析方法,成为解决土壤重金属污染问题的关键和基础。
目前,对于土壤重金属源解析存在两种层次,一是定性的判别主要污染来源类型,即源识别;二是不仅定性的分析污染来源,而且定量的计算不同污染来源的贡献率,即源解析,研究人员通常将两者统称为源解析。目前对于重金属源解析模型主要分为两大类:一是以污染源为研究对象的扩散模型,扩散模型法是从污染源出发,根据污染源排放清单和污染物传输过程来评估不同源类对受体的贡献。但其受到复杂的气象条件和化学过程变化的影响,模型预测结果的误差较大,模型预测的效果往往不尽人意。二是以污染区域为研究对象的受体模型。目前常用的受体模型主要包括绝对主成分-多元线性回归(Absoluteprincipal component multiple linear regression,APCS-MLR)、正定矩阵因子分解法(Positive Matrix Factorization,PMF)、化学质量平衡法(Chemical Mass Balance,CMB)、同位素标记法和Unmix模型等。这些模型在定量源解析上都取得了不错的效果。
源解析的研究最初是针对大气环境中颗粒物来源开展的,现已逐步形成比较完整的大气污染源解析技术体系:污染源清单-空气质量扩散模型-受体模型。与大气污染不同,土壤污染的隐蔽性、累积性、地域性等复杂特征使得土壤污染物来源解析的研究受到较大的限制。壤重金属污染问题具有较高的复杂性和更大的不确定性。
APCS-MLR受体模型法应用在土壤重金属源解析较少见。该模型将主成分分析PCA与多元线性回归分析MLR相结合,可以通过PCA定性的分析每个主成分所对应的污染源,还可以定量确定源对其重金属的平均贡献量和在每个采样点的贡献量。但是APCS-MLR受体模型进行主成分分析时特征值的分解存在一定的局限性,且结果缺乏可视化效果,不能准确预测污染源的指纹谱图,对模型结果的解释准确性不够。难以分析确定具体的污染源或污染源类型。
偏最小二乘回归是一种新型的多元统计分析方法,它利用了因变量和自变量的信息,结合了多元线性回归、主主成分分析和典型相关性分析等多种功能为一体,同时将建模预测类型的数据分析方法与非模式的数据认识性分析方法结合在一起,可以更好地识别污染源,提高源解析的准确率。
因此,研究一种基于地统计分析与受体模型方法相结合的土壤重金属来源解析方法,采偏最小二乘回归对APCS-MLR受体模型方法进行改进。
发明内容
本发明的技术问题是绝对主成分-多元线性回归方法APCS-MLR相比扩散模型法在定量源解析上预测效果更好,但较少用于土壤重金属源解析;同时,APCS-MLR受体模型进行主成分分析时特征值的分解存在一定的局限性,且结果缺乏可视化的直观效果,难以分析确定具体的污染源或污染源类型。
本发明的目的是利用偏最小二乘回归对绝对主成分-多元线性回归方法进行改进,提出绝对偏最小二乘回归-多元线性回归方法(Absolutely Partial Least Squares-Multiple Linear Regression,APLS-MLR),用于土壤重金属来源解析;并将地统计分析重金属空间分布特征图与APLS-MLR方法相结合,提高源解析的准确性和源解析结果的直观性,以便于进一步地分析确定污染源的性质。
本发明的技术方案是基于地统计分析与APLS-MLR的土壤重金属来源解析方法,包括以下步骤:
步骤1:对研究区域的土壤进行采样,测量土壤样本中重金属的含量,对测量得到的原始数据进行预处理;
步骤2:利用克里金插值方法分析得到研究区域的土壤重金属空间含量分布特征图,识别出土壤污染源;
步骤3:对研究区域的重金属浓度数据采用偏最小二乘法进行分析;
步骤4:建立用于土壤重金属污染源解析的绝对偏最小二乘-多元线性回归法受体模型;
步骤4-1:计算每个土壤样本的绝对偏最小二乘法得分;
偏最小二乘法得分是以土壤重金属浓度做为自变量,经偏最小二乘法分析所得到的主因子系数矩阵与标准化后的重金属含量矩阵做矩阵乘法运算得到;
由每个土壤样本的偏最小二乘法得分与0浓度样本的偏最小二乘法得分做减法运算,得到每个样本的绝对偏最小二乘法得分;
步骤4-2:将绝对偏最小二乘法得分作为自变量,重金属浓度作为因变量,做多元线性回归分析得到回归系数与回归常数项;
利用得到的回归系数将样本的绝对偏最小二乘法得分转化为主成分对应的污染源对每个样本的浓度贡献;
步骤4-3:计算得到各个主成分对应的污染源贡献率;
步骤5:结合步骤2的土壤重金属空间含量分布特征图和绝对偏最小二乘-多元线性回归法受体模型解析的污染源数量以及各个污染源的贡献率,推断确定具体的污染源。
优选地,步骤1中,采用EXCEL软件对原始数据进行预处理,剔除明显有误的属性值,原始数据中的缺失值利用平均值填补。
优选地,步骤2中,利用ArcGIS软件创建数据的直方图,对不符合正态分布的数据进行对数变换,应用克里金插值方法绘制土壤重金属空间含量分布特征图,分析出潜在污染源。
进一步地,步骤3具体包括以下子步骤:
步骤3-1;标注化原始数据;
E0=(eij)n×p
F0=(fij)n×q
其中E0为标准化的自变量矩阵,F0为标准化的因变量矩阵,eij表示自变量矩阵的元素值,fij表示因变量矩阵的元素值,n表示样本的数量,p表示自变量的数量,q表示因变量的数量;Xij表示样本的自变量的真实值,μj表示第j个自变量的样本的均值,SXj表示第j个自变量的多样本的方差,Yij表示样本的因变量的真实值,vj表示第j个因变量的多样本的均值,SYj表示第j个因变量的多样本的方差;
步骤3-2:第一轮主成分提取;
步骤3-2-1:提取自变量第一主成分,对矩阵E0 TF0F0 TE0进行特征分解;
t1=E0·w1 (3)
其中t1表示自变量第一个主成分,w1表示最大特征值所对应的单位特征向量;
步骤3-2-2:提取因变量第一主成分,对矩阵F0 TE0E0 TF0进行特征分解;
u1=F0·c1 (4)
其中u1表示因变量第一个主成分,c1表示最大特征值所对应单位特征向量;
步骤3-2-3:求残差矩阵
E1=E0-t1·p1 T (5)
F1=F0-t1·r1 T (6)
其中E1、F1分别表示自变量矩阵、因变量矩阵的残差矩阵;p1表示第一次提取主成分时自变量的回归系数向量;r1表示第一次提取主成分时因变量的回归系数向量。
式(5)中
式(6)中
步骤3-3:新一轮主成分提取;
令E0=E1,F0=F1,利用步骤3-2的主成分提取方式,对残差矩阵进行新一轮的主成分提取;
th=Eh-1·wh (7)
uh=Fh-1·ch (8)
Eh=Eh-1-th·ph T (9)
Fh=Fh-1-th·rh T (10)
式(7)中,下标h表示第h次主成分提取,th表示自变量第h个主成分,wh表示第h次提取主成分时,自变量残差矩阵最大特征值所对应的单位特征向量,Eh-1、Eh分别表示第h、h+1次提取主成分时的自变量残差矩阵。
uh表示因变量第h个主成分,ch表示因变量残差矩阵最大特征值所对应的单位特征向量,Fh-1、Fh分别表示第h、h+1次提取主成分时的因变量残差矩阵;ph表示第h次提取主成分时自变量的回归系数向量;rh表示第h次提取主成分时因变量的回归系数向量。
式(9)中
式(10)中
步骤3-4:完成主成分提取,根据交叉有效性确定所提取的主成分的数量;
其中PRESShk为因变量yk的预测误差平方和,SS(h-1)k为yk的误差平方和;
其中n表示样本的数量,yik为yk在样本点i上的实际值,yhk(-i)为yk在样本点i上的拟合值;y(h-1)ki为第i个样本点的预测值;
式中q表示因变量的数量,PRESSh表示Y的预测误差平方和;SS(h-1)表示Y的误差平方和;
步骤4中,主成分对应的污染源对每个样本的浓度贡献的计算式如下:
式中P表示主成分的数量,ci为第i种重金属的浓度,bio为多元线性回归的常数项,bpi为多元线性回归的回归系数,APLSp为主成分p的绝对偏最小二乘法得分;
bpi×APLSp为主成分p对于ci的含量贡献,所有样本的bpi×APLSp平均值即为主成分p对应的污染源平均绝对贡献量;
主成分p对应的污染源贡献率为其平均绝对贡献量与所有源贡献量的比值。
进一步地,步骤5中,根据步骤2得到的地土壤重金属空间分布特征图和步骤3中基于偏最小二乘法得到的主成分矩阵以及步骤4中得到污染源因子的贡献率,结合对研究区域的实地考察和验证,推断确定研究区域的具体污染源。
相比现有技术,本发明的有益效果包括:
1)本发明方法将受体模型与地统计分析相结合,不仅能计算确定污染源数量以及各个污染源的贡献率,还能准确确定具体的污染源,有利于开展农田土壤重金属污染防治和治理工作。
2)本发明将绝对偏最小二乘法与多元线性回归方法相结合,提出了受体模型的APLS-MLR方法,解决了APCS-MLR方法中主成分分析时特征值的分解具有局限性的问题,本发明的APLS-MLR将绝对偏最小二乘法得分作为自变量,重金属浓度作为因变量,做多元线性回归分析,利用得到的回归系数将样本的绝对偏最小二乘法得分转化为主成分对应的污染源对每个样本的浓度贡献,提高了模型回归效果,计算得到的污染源贡献率准确性更好。
附图说明
下面结合附图和实施例对本发明作进一步说明。
图1为本发明实施例的土壤重金属来源解析方法的流程示意图。
图2为本发明实施例计算得到的研究区域的土壤重金属As含量空间分布图。
图3为本发明实施例计算得到的研究区域土壤重金属Hg含量空间分布图。
图4为本发明实施例计算得到的研究区域土壤重金属Cr含量空间分布图。
图5为本发明实施例计算得到的研究区域土壤重金属Hg含量空间分布图。
图6为本发明实施例计算得到的研究区域土壤重金属Pb含量空间分布图。
图7为本发明实施例计算得到的不同污染因子对重金属累积的贡献率的示意图。
具体实施方式
如图1所示,基于地统计分析与APLS-MLR的土壤重金属来源解析方法,包括以下步骤:
步骤1:对原始数据进行预处理,在研究区域布设采样点后,测量土壤样本中重金属的含量,再通过EXCEL软件对数据进行预处理,剔除存在明显有误的属性值,缺失值通过平均值来代替。
实例数据中发现Hg、Cd和Pb存在少量缺失值,最终用其总金属平均值来代替;发现样本中存在个数的异常值,综合考虑,由于布点采样合理、样品处理步骤严谨、检测仪器精准,所测重金属含量并无差错性,对于个少数的异常值采取保留的方式。
步骤2:利用克里金插值方法分析研究区域土壤重金属空间分布特征,识别出土壤污染源;分析重金属浓度含量在研究区域空间上的变化,识别出土壤重金属潜在的污染来源。
通过采用普通克里金插值生成各总金属的空间分布图,普通克里格插值平均误差(ME)接近于0,证明预测值是精确的。均方根标准误差(RMSSE)值在0.968-1.032之间,表明标准误差是准确的。实施例得到的重金属的空间分布结果如图2-6所示。
步骤3:对研究区域重金属浓度数据进行偏最小二乘法分析,最终经过交叉有效性确定所提取的主成分个数;所得到主成分与五种重金属的系数矩阵如表1所示:
表1 主成分与重金属的系数矩阵表
步骤4:建立土壤重金属污染源解析APLS-MLR受体模型;根据得到的回归系数与回归常数项,通过计算得到各重金属的最终贡献率。实验结果如表2所示:
表2 污染源对重金属的贡献数据表
步骤5:根据地统计分析的重金属空间分布特征识别的污染源及APLS-MLR受体模型解析的污染源及其贡献率,结合对研究区域的实地考察和验证,确定明确的污染源及贡献率。
在主成分1中,As和Pb占较大的占比。根据普通克里金空间插值总金属含量的特征图可以看出,As和Pb空间分布较为相似,根据实际调查,在研究区域的最南部和最北部存在大量的化工企业,且该地区被长江支流由南向北所贯穿,因此可以分析出源1污染源为化工污染;由Pb的含量空间分布图可以看出,高值区域存在研究区域南部,而研究区域南部为交通枢纽中心,故推断源1为交通污染源和化工灌溉水排放源的混合源。
在主成分2中。载荷较大的重金属有Cr,由图4可知研究区域重金属Cr几乎不存在污染,大量研究表明成土母质是造成Cr污染的最主要的原因,故推断源2为“自然源”。
在主成分3中,载荷较大的重金属有Hg和Cd,从空间分布看,由图2可以看出,Hg高值区分布集中,主要分布在研究区域东部,与低值区有明显界限,Hg元素变异系数为75%,属于中高度变异,表明污染区域受人为影响因素较大。调研发现高值区有河流以及灌溉渠经过,河流周边存在排放Hg废水的企业,故推测高值区土壤Hg的累积可能是长期河流污灌所造成的。且Hg和Cd元素常常被用于农药制造和使用,因此可以推断故源3为“农业源”最终研究区域稻田土壤重金属污染源贡献率如图7所示。
本发明通过实用案例进行分析,根据分析所得到的各总金属土壤重金属含量空间分布特征图和主成分矩阵,结合研究区域的实地考察,定性的分析出具体的污染源,最后根据APLS-MLR受体模型,实现对农田土壤重金属的来源解析,得到了各个污染源的贡献率。
Claims (6)
1.基于地统计分析与APLS-MLR的土壤重金属来源解析方法,其特征在于,包括以下步骤:
步骤1:对研究区域的土壤进行采样,测量土壤样本中重金属的含量,对测量得到的原始数据进行预处理;
步骤2:利用克里金插值方法分析得到研究区域的土壤重金属空间含量分布特征图,识别出土壤污染源;
步骤3:对研究区域的重金属浓度数据采用偏最小二乘法进行分析;
步骤4:建立用于土壤重金属污染源解析的绝对偏最小二乘-多元线性回归法受体模型;
步骤4-1:计算每个土壤样本的绝对偏最小二乘法得分;
偏最小二乘法得分是以土壤重金属浓度做为自变量,经偏最小二乘法分析所得到的主因子系数矩阵与标准化后的重金属含量矩阵做矩阵乘法运算得到;
每个土壤样本的偏最小二乘法得分与零浓度样本的偏最小二乘法得分做减法运算,得到每个样本的绝对偏最小二乘法得分;
步骤4-2:将绝对偏最小二乘法得分作为自变量,重金属浓度作为因变量,做多元线性回归分析得到回归系数与回归常数项;
利用得到的回归系数,将样本的绝对偏最小二乘法得分转化为主成分对应的污染源对每个样本的浓度贡献;
步骤4-3:计算得到各个主成分对应的污染源贡献率;
步骤5:结合步骤2的土壤重金属空间含量分布特征图和绝对偏最小二乘-多元线性回归法受体模型解析的污染源数量以及各个污染源的贡献率,推断确定具体的污染源。
2.根据权利要求1所述的土壤重金属来源解析方法,其特征在于,步骤1中,采用EXCEL软件对原始数据进行预处理,剔除明显有误的属性值,原始数据中的缺失值利用平均值填补。
3.根据权利要求2所述的土壤重金属来源解析方法,其特征在于,步骤2中,利用ArcGIS软件创建数据的直方图,对不符合正态分布的数据进行对数变换,应用克里金插值方法绘制土壤重金属空间含量分布特征图,分析出潜在污染源。
4.根据权利要求3所述的土壤重金属来源解析方法,其特征在于,步骤3具体包括以下子步骤:
步骤3-1:标注化原始数据;
E0=(eij)n×p
F0=(fij)n×q
其中E0为标准化的自变量矩阵,F0为标准化的因变量矩阵,eij表示自变量矩阵的元素值,fij表示因变量矩阵的元素值,n表示样本的数量,p表示自变量的数量,q表示因变量的数量;Xij表示样本的自变量的真实值,μj表示第j个自变量的样本的均值,SXj表示第j个自变量的多样本的方差,Yij表示样本的因变量的真实值,vj表示第j个因变量的多样本的均值,SYj表示第j个因变量的多样本的方差;
步骤3-2:第一轮主成分提取;
步骤3-2-1:提取自变量第一主成分,对矩阵E0 TF0F0 TE0进行特征分解;
t1=E0·w1 (3)
其中t1表示自变量第一个主成分,w1表示最大特征值所对应的单位特征向量;
步骤3-2-2:提取因变量第一主成分,对矩阵F0 TE0E0 TF0进行特征分解;
u1=F0·c1 (4)
其中u1表示因变量第一个主成分,c1表示最大特征值所对应单位特征向量;
步骤3-2-3:求残差矩阵
E1=E0-t1·p1 T (5)
F1=F0-t1·r1 T (6)
其中E1、F1分别表示自变量矩阵、因变量矩阵的残差矩阵;p1表示第一次提取主成分时自变量的回归系数向量;r1表示第一次提取主成分时因变量的回归系数向量;
式(5)中
式(6)中
步骤3-3:新一轮主成分提取;
令E0=E1,F0=F1,利用步骤3-2的主成分提取方式,对残差矩阵进行新一轮的主成分提取;
th=Eh-1·wh (7)
uh=Fh-1·ch (8)
Eh=Eh-1-th·ph T(9)
Fh=Fh-1-th·rh T(10)
式(7)中,下标h表示第h次主成分提取,th表示自变量第h个主成分,wh表示第h次提取主成分时自变量残差矩阵最大特征值所对应的单位特征向量,Eh-1、Eh分别表示第h、h+1次提取主成分时的自变量残差矩阵;
yh表示因变量第h个主成分,ch表示因变量残差矩阵最大特征值所对应的单位特征向量,Fh-1、Fh分别表示第h、h+1次提取主成分时的因变量残差矩阵;ph表示第h次提取主成分时自变量的回归系数向量;rh表示第h次提取主成分时因变量的回归系数向量;
式(9)中
式(10)中
步骤3-4:完成主成分提取,根据交叉有效性确定所提取的主成分的数量;
其中PRESShk为因变量yk的预测误差平方和,SS(h-1)k为yk的误差平方和;
其中n表示样本的数量,yik为yk在样本点i上的实际值,yhk(-i)为yk在样本点i上的拟合值;y(h-1)ki为第i个样本点的预测值;
式中q表示因变量的数量,PRESSh表示因变量Y的预测误差平方和;SS(h-1)表示因变量Y的误差平方和;
6.根据权利要求5所述的土壤重金属来源解析方法,其特征在于,步骤5中,根据步骤2得到的地土壤重金属空间分布特征图和步骤3中基于偏最小二乘法得到的主成分矩阵以及步骤4中得到污染源因子的贡献率,结合对研究区域的实地考察和验证,推断确定研究区域的具体污染源。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211587357.5A CN116166923A (zh) | 2022-12-11 | 2022-12-11 | 基于地统计分析与apls-mlr的土壤重金属来源解析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211587357.5A CN116166923A (zh) | 2022-12-11 | 2022-12-11 | 基于地统计分析与apls-mlr的土壤重金属来源解析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116166923A true CN116166923A (zh) | 2023-05-26 |
Family
ID=86410309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211587357.5A Pending CN116166923A (zh) | 2022-12-11 | 2022-12-11 | 基于地统计分析与apls-mlr的土壤重金属来源解析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116166923A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117541071A (zh) * | 2023-10-26 | 2024-02-09 | 生态环境部土壤与农业农村生态环境监管技术中心 | 一种场地土壤重金属损害基线计算方法和装置 |
CN118349863A (zh) * | 2024-05-10 | 2024-07-16 | 江苏省环境科学研究院 | 基于重金属相似性勾勒土壤重金属污染迁移路径的方法 |
-
2022
- 2022-12-11 CN CN202211587357.5A patent/CN116166923A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117541071A (zh) * | 2023-10-26 | 2024-02-09 | 生态环境部土壤与农业农村生态环境监管技术中心 | 一种场地土壤重金属损害基线计算方法和装置 |
CN118349863A (zh) * | 2024-05-10 | 2024-07-16 | 江苏省环境科学研究院 | 基于重金属相似性勾勒土壤重金属污染迁移路径的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116166923A (zh) | 基于地统计分析与apls-mlr的土壤重金属来源解析方法 | |
Lu et al. | MODELING ACTUAL EVAPOTRANSPIRATION FROM FORESTED WATERSHEDS ACROSS THE SOUTHEASTERN UNITED STATES 1 | |
Moral et al. | Site-specific management zones based on the Rasch model and geostatistical techniques | |
Zhang et al. | Applying the first-order error analysis in determining the margin of safety for total maximum daily load computations | |
De Rosa et al. | Predicting pasture biomass using a statistical model and machine learning algorithm implemented with remotely sensed imagery | |
Keller et al. | Assessment of uncertainty and risk in modeling regional heavy‐metal accumulation in agricultural soils | |
Muenich et al. | The Wabash sampling blitz: a study on the effectiveness of citizen science | |
CN101699317A (zh) | 利用地震参量进行短期地震预测的神经网络方法 | |
CN109142650A (zh) | 一种蔬菜中镉含量预测模型的建模方法及其应用 | |
CN103605878B (zh) | 一种基于数据建模和模型移植的通用血糖预测方法 | |
CN113567439A (zh) | 一种基于色泽和气味数据融合的猪肉新鲜度检测方法 | |
Salas et al. | Assessing the effectiveness of ground truth data to capture landscape variability from an agricultural region using Gaussian simulation and geostatistical techniques | |
Mittelbach et al. | What is the observed relationship between species richness and productivity? Reply | |
Bourgeron et al. | Ecological theory in relation to landscape and ecosystem characterization | |
Rubio-Cuadrado et al. | Applying climwin to dendrochronology: A breakthrough in the analyses of tree responses to environmental variability | |
CN118067960A (zh) | 一种基于多源数据的土壤环境污染监测系统及方法 | |
Yuan et al. | Combining national and state data improves predictions of microcystin concentration | |
Aitkenhead et al. | Digital mapping of soil ecosystem services in Scotland using neural networks and relationship modelling. Part 2: Mapping of soil ecosystem services | |
CN116720610A (zh) | 一种用于住宅建筑的碳排放预测方法及系统 | |
CN102831320A (zh) | 流域水环境有机污染物监测全过程质控指标评价方法系统 | |
Colburn Jr | Soil doctor multi‐parameter, real‐time soil sensor and concurrent input control system | |
WO2023240509A1 (zh) | 一种基于降水预报与遥相关对应关系的空间概率分析方法及系统 | |
Ransom | Evaluating and improving corn nitrogen fertilizer recommendation tools across the US Midwest | |
Cox et al. | Combining environmental information: environmetric research in ecological monitoring, epidemiology, toxicology, and environmental data reporting | |
CN117874616B (zh) | 基于综合偏离度的污染物溯源方法及装置、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |