CN117789975A - 一种基于pmf和机器学习的水源地重金属健康风险评价方法 - Google Patents

一种基于pmf和机器学习的水源地重金属健康风险评价方法 Download PDF

Info

Publication number
CN117789975A
CN117789975A CN202310448807.0A CN202310448807A CN117789975A CN 117789975 A CN117789975 A CN 117789975A CN 202310448807 A CN202310448807 A CN 202310448807A CN 117789975 A CN117789975 A CN 117789975A
Authority
CN
China
Prior art keywords
water
heavy metal
health risk
water source
sources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310448807.0A
Other languages
English (en)
Inventor
林曼利
彭位华
余浩
江雅琪
陈松
桂和荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN202310448807.0A priority Critical patent/CN117789975A/zh
Priority to NL2034997A priority patent/NL2034997A/en
Publication of CN117789975A publication Critical patent/CN117789975A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种基于PMF模型和机器学习的水源地重金属健康风险评价方法,其涉及环境科学与工程技术领域。该方法包括:首先基于PMF模型和机器学习(自组织神经网络)对重金属的来源进行定量解析;其次,利用蒙特卡洛模拟结合健康风险评价模型评估各污染源对人体所产生的概率健康风险。本方法不仅可实现对水源地重金属来源的定量解析,同时基于源解析结果进行健康风险评估,还可定量识别不同污染源对人体健康所产生的健康风险,从而为水源地优控污染物筛选等环境管理工作提供方法参考。

Description

一种基于PMF和机器学习的水源地重金属健康风险评价方法
技术领域
本发明涉及环境科学与工程技术领域,特别涉及一种基于PMF和机器学习的水源地重金属健康风险评价方法。
背景技术
重金属因具有不可降解、持久性和生物毒性的特点,而受到广泛关注,即使其含量很低也会对人体及水环境质量产生深远的影响。长期饮用重金属含量较高的饮用水,重金属会在人体内逐渐累积并对靶器官产生伤害(As,Cd,Cr和Pb会对肾、肺、骨骼,神经系统和心血管系统的正常功能产生影响,甚至可能会引发癌症等严重疾病)。因此对水源地水中重金属污染水平,来源及健康风险进行研究是十分必要的。
饮用水中重金属通常以直接摄入和皮肤接触两种途径进入人体。故对这两种途径进入人体的重金属分别进行健康风险评价,可以全面地反映出重金属对人体健康所产生的风险总和。
但是,传统的风险评估过程多以固定的参数(如:平均体重和重金属平均浓度等)进行风险值的计算,从而无法准确地计算出健康风险值,进而无法准确地进行健康风险评价。
发明内容
基于此,有必要针对上述技术问题:如何准确地进行健康风险评价,提供一种基于PMF和机器学习的水源地重金属健康风险评价方法。
本发明实施例提供一种基于PMF和机器学习的水源地重金属健康风险评价方法,包括:
获取不同水源地水样中各重金属元素的浓度和含量;
根据不同水源地水样中各重金属元素的含量,利用自组织神经网络SOM分析验证PMF模型,获得最终PMF模型;
将不同水源地水样中各重金属元素的浓度及水样中各重金属元素浓度的不确定度输入至最终PMF模型,得出不同污染源对水源地重金属的贡献;
利用蒙特卡洛分布拟合库拟合不同污染源对水源地重金属的贡献,获得不同污染源重金属含量的概率分布;
利用概率分布代替待测水源地中重金属的含量,并将概率分布带入至健康风险评价模型以评估待测水源地不同污染源重金属对人体所产生的概率健康风险。
进一步地,所述获取不同水源地水样中各重金属元素的含量,其具体包括:
在不同水源地设置若干采样点,利用取水器对水样进行采集,将采集后的水样放置含有冰袋的保温箱内;
水样运回实验室后于24小时之内,用0.22μm玻璃纤维滤膜进行过滤,在过滤后水样中加入ln内标元素,使得ln浓度为10ng/mL,最后加入适量2%的稀硝酸稀释至80mL,密封保存,使用电感耦合等离子体质谱仪ICP-MS测定不同水源地水样中各重金属含量。
进一步地,其特征在于,所述重金属元素包括:As、Cr、Cu、Pb、Zn、Cd中的一种或多种。
进一步地,所述污染源包括:工业污染源、农业污染源和自然污染源。
进一步地,所述PMF模型包括:
式中,Xij为第i个水样中j元素的含量,单位为μg/L;Aij为元素j在源i中的含量;Bij为源i对第j个土壤水样的贡献;eij为残差矩阵;eij根据定义目标函数计算得到,所述目标函数Q计算如下:
式中,uij是水样i中第j个重金属元素的不确定度,n为水源地总数,m为重金属元素总数;uij的计算如下:
当c≤MDL,uij=5/6×MDL
当c>MDL,
式中,c是水样中重金属元素的浓度;MDL是测定方法检出限;EF是测定精密度。
进一步地,所述自组织神经网络SOM的计算包括:
根据经验公式M=5N0.5计算自组织神经网络SOM神经元的输出数量;其中,M为输出神经元数目,N为样品个数;
根据输出神经元数目M和样品个数N生成一个数据矩阵。
进一步地,所述健康风险评价模型包括:
式中,ADDingestion为日平均直接摄入剂量;ADDDermal为每天皮肤吸收的平均剂量;Cw为水样中不同来源重金属的含量,单位为μg/L;IR为每日饮水量;EF为暴露频率;ED为暴露时间;BW是指体重;AD为平均时间,单位为天;SA是皮肤暴露面积;Kp为皮肤渗透系数;ET为暴露时间;CF为转换因子;
HQ=ADD/RfD
HI=∑HQ
CR=∑ADD×SF
式中,HQ为危害熵;HI为总的危害熵;RfD为参考剂量,SF代表重金属的斜率因子;CR为经直接消化和皮肤接触所导致的总的致癌风险。
本发明实施例提供的上述基于PMF和机器学习的水源地重金属健康风险评价方法,与现有技术相比,其有益效果如下:
本发明实施例提供一种基于来源为导向的水源地重金属健康风险评价方法;该方法首先通过PMF模型和机器学习识别出水样中重金属的潜在来源,将有利于确定水源地周边首先防控的污染源头,进而为水源地环境保护工作的开展提供数据支撑;然后以污染源为导向计算各个污染源所产生的健康风险,即利用蒙特卡洛模拟结合健康风险评估,定量解析各污染源所产生的概率健康风险,从而可以很好地解决因参数的不确定性而无法得出准确地结果。
附图说明
图1为一个实施例中提供的基于机器学习得出各重金属元素之间关系图;
图2为一个实施例中提供的基于PMF模型解析得出各污染源所占比例图;
图3为一个实施例中提供的各污染源对儿童所产生的总的致癌风险累积频率直方图;其中,(a)图是工业源的重金属对儿童所产生的总的致癌风险累积频率直方图;(b)图是农业源的重金属对儿童所产生的总的致癌风险累积频率直方图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
实施例1
本发明实施例提供的一种基于PMF和机器学习的水源地重金属健康风险评价方法,该方法包括:
步骤一:选取水源地(地表水和地下水),根据《水和废水监测》第四版对样品进行采集:设置若干采样点,利用取水器对水样进行采集,将采集后的水样放置含有冰袋的保温箱内。
步骤二:水样中重金属检测。
步骤三:利用PMF模型和机器学习定量解析重金属来源。
步骤四:由PMF运行结果提取每个样品中不同来源重金属含量,并利用蒙特卡洛分布拟合库确定每个样品中不同来源重金属含量的分布参数,最后利用蒙特卡洛结合健康风险评价计算出每个污染源所贡献出的健康风险。
上述技术方案,基于PMF模型识别水样中不同污染源重金属含量,基于蒙特卡洛模拟并结合健康风险评价,定量解析各污染源所产生的概率健康风险,有助于了解各污染源对人体所产生的健康风险,从而有针对性的防控各污染源所产生的风险。
具体地,以上步骤一至步骤四的具体分析如下:
步骤一:样品采集与测试:以某地区水源地为例,共布置9个采样点,连续采集12月。水样运回实验室后于24小时之内,用0.22μm玻璃纤维滤膜进行过滤,在过滤后水样中加入ln内标元素,使得ln浓度为10ng/mL,最后加入适量2%的稀硝酸稀释至80mL,密封保存,使用ICP-MS进行测定。
步骤二:利用机器学习(自组织神经网络)识别出各重金属元素之间的组分矩阵图,结果如图1所示。利用自组织神经网络SOM分析进一步验证PMF模型的可靠性,从而提高重金属源解析的可靠性。
步骤三:利用PMF模型和机器学习对水源地中重金属来源进行解析,解析结果如图2所示。
将步骤一中所到的的重金属浓度数据及不确定数据导入至PMF5.0软件中,开始利用PMF模型定量解析各污染源。PMF模型原理见公式(1)至(4):
式中,Xij为第i个样品中j元素的含量(μg/L);Aij为元素j在源i中的含量;Bij为源i对第j个土壤样品的贡献;eij为残差矩阵。eij式根据定义目标函数计算得到。目标函数Qi计算如式(2)所示:
式中,uij是样品i中第j个重金属元素的不确定度。
PMF模型的最大优势在于利用不确定性对样品中各元素的浓度数据分别进行分析,它需要两个输入文件,一个是样本物种的浓度,另一个是样本物种浓度的不确定性。利用下面公式来计算浓度的不确定度:
当c≤MDL,uij=5/6×MDL (3)
当c>MDL,
式中,c是样品中重金属元素的浓度;MDL是测定方法检出限;EF是测定精密度。
Kohonen’s自组织神经网络(SOM)是一种模拟人脑对数据进行降维、挖掘和规则总结的生物过程的人工神经网络技术。由于SOM非常适合处理复杂的推理、判别和分类问题,因此越来越多地应用于水文、环境等相关领域的分区研究。它可以将高维数据投射到低维数据地图中,因此SOM压缩了原始信息,但是同时保留了原始数据最为重要的拓扑关系,故它可以看作是一种抽象的度量,同时自组织神经网络具有较好可视化效果。SOM的计算过程如下:首先生成一个数据矩阵。第二步根据经验公式M=5N0.5计算神经元的输出数量(其中M为输出神经元数目,N为样品个数)利用机器学习(自组织神经网络)结合PMF模型运行结果识别出人为活动(工业源和农业源)和自然来源影响。首先根据自组织神经网络探究各参数(重金属)之间的内在联系:具有相同颜色变化梯度的重金属被识别为同一来源,从而进一步验证PMF模型的运行结果,同时可实现污染源的有效识别。
步骤四:首先由步骤二和步骤三对污染源进行识别,利用Excel中Crystal Bll插件中分布拟合库分别拟合不同来源重金属的最优拟合参数(借助拟合优度检验(Anderson-Daring(AD)、Kolmogorov-Smirnov(KS)和Chi-square(CS))进行确定,常见的拟合分布包括:对数正态、Weibull等)。即,由PMF运行结果提取每个样品中不同来源重金属含量,并利用蒙特卡洛分布拟合库确定每个样品中不同来源重金属含量的分布参数。
步骤五:利用蒙特卡洛结合健康风险评价计算出每个污染源所贡献出的健康风险,健康风险评估公式见公式(5)至(9),以儿童为例得出不同来源重金属对儿童所产生的致癌风险(如图3):
式中,ADDingestion为日平均直接摄入剂量;ADDDermal为每天皮肤吸收的平均剂量;Cw为水样中不同来源重金属的含量(μg/L);IR为每日饮水量;EF为暴露频率;ED为暴露时间;BW是指体重;AD为平均时间(day);SA是皮肤暴露面积;Kp为皮肤渗透系数;ET为暴露时间;CF为转换因子。
HO=ADD/RfD (7)
HI=∑HQ (8)
CR=∑ADD×SF (9)
式中,RfD为参考剂量,SF代表重金属的斜率因子;CR为经直接消化和皮肤接触所导致的总的致癌风险。
总之,本发明实施例的有益效果如下:
(1)本发明实施例提供一种以重金属源解析技术为导向进行健康风险评估的方法,并将蒙特卡洛模拟引入健康风险评估模型中,从而可以实现定量解析有污染源到人类健康风险这一抽象过程,为水源地环境管理工作的开展提供参考。
(2)本发明实施例提供一种基于源解析技术的健康风险评估方法,并且将蒙特卡洛模拟引入健康风险评估中,可以较为真实的反映出重金属所产生的风险;且该方法适用性强,可用于各种介质中对人体有害物质的源解析和概率健康风险评估过程中。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (7)

1.一种基于PMF模型和机器学习的水源地重金属健康风险评价方法,其特征在于,包括:
获取不同水源地水样中各重金属元素的浓度和含量;
根据不同水源地水样中各重金属元素的含量,利用自组织神经网络SOM分析验证PMF模型,获得最终PMF模型;
将不同水源地水样中各重金属元素的浓度及水样中各重金属元素浓度的不确定度输入至最终PMF模型,得出不同污染源对水源地重金属的贡献;
利用蒙特卡洛分布拟合库拟合不同污染源对水源地重金属的贡献,获得不同污染源重金属含量的概率分布;
利用概率分布代替待测水源地中重金属的含量,并将概率分布带入至健康风险评价模型以评估待测水源地不同污染源重金属对人体所产生的概率健康风险。
2.如权利要求1所述的基于PMF模型和机器学习的水源地重金属健康风险评价方法,其特征在于,所述获取不同水源地水样中各重金属元素的含量,其具体包括:
在不同水源地设置若干采样点,利用取水器对水样进行采集,将采集后的水样放置含有冰袋的保温箱内;
水样运回实验室后于24小时之内,用0.22μm玻璃纤维滤膜进行过滤,在过滤后水样中加入ln内标元素,使得ln浓度为10ng/mL,最后加入适量2%的稀硝酸稀释至80mL,密封保存,使用电感耦合等离子体质谱仪ICP-MS测定不同水源地水样中各重金属含量。
3.如权利要求1所述的基于PMF模型和机器学习的水源地重金属健康风险评价方法,其特征在于,所述重金属元素包括:As、Cr、Cu、Pb、Zn、Cd中的一种或多种。
4.如权利要求1所述的基于PMF模型和机器学习的水源地重金属健康风险评价方法,其特征在于,所述污染源包括:工业污染源、农业污染源和自然污染源。
5.如权利要求1所述的基于PMF模型和机器学习的水源地重金属健康风险评价方法,其特征在于,所述PMF模型包括:
式中,Xij为第i个水样中j元素的含量,单位为μg/L;Aij为元素j在源i中的含量;Bij为源i对第j个水样的贡献;eij为残差矩阵;eij根据定义目标函数计算得到,所述目标函数Q计算如下:
式中,uij是水样i中第j个重金属元素的不确定度,n为水源地总数,m为重金属元素总数;uij的计算如下:
当c≤MDL,uij=5/6×MDL
当c>MDL,
式中,c是水样中重金属元素的浓度;MDL是测定方法检出限;EF是测定精密度。
6.如权利要求1所述的基于PMF模型和机器学习的水源地重金属健康风险评价方法,其特征在于,所述自组织神经网络SOM的计算包括:
根据经验公式M=5N0.5计算自组织神经网络SOM神经元的输出数量;其中,M为输出神经元数目,N为样品个数;
根据输出神经元数目M和样品个数N生成一个数据矩阵。
7.如权利要求1所述的基于PMF模型和机器学习的水源地重金属健康风险评价方法,其特征在于,所述健康风险评价模型包括:
式中,ADDingestion为日平均直接摄入剂量;ADDDermal为每天皮肤吸收的平均剂量;Cw为水样中不同来源重金属的含量,单位为μg/L;IR为每日饮水量;EF为暴露频率;ED为暴露时间;BW是指体重;AD为平均时间,单位为天;SA是皮肤暴露面积;Kp为皮肤渗透系数;ET为暴露时间;CF为转换因子;
HQ=ADD/RfD
HI=∑HQ
CR=∑ADD×SF
式中,HQ为危害熵;HI为总的危害熵;RfD为参考剂量,SF代表重金属的斜率因子;CR为经直接消化和皮肤接触所导致的总的致癌风险。
CN202310448807.0A 2023-04-24 2023-04-24 一种基于pmf和机器学习的水源地重金属健康风险评价方法 Pending CN117789975A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202310448807.0A CN117789975A (zh) 2023-04-24 2023-04-24 一种基于pmf和机器学习的水源地重金属健康风险评价方法
NL2034997A NL2034997A (en) 2023-04-24 2023-06-05 Health risk assessment method of heavy metals in water source location based on pmf and machine learning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310448807.0A CN117789975A (zh) 2023-04-24 2023-04-24 一种基于pmf和机器学习的水源地重金属健康风险评价方法

Publications (1)

Publication Number Publication Date
CN117789975A true CN117789975A (zh) 2024-03-29

Family

ID=87378603

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310448807.0A Pending CN117789975A (zh) 2023-04-24 2023-04-24 一种基于pmf和机器学习的水源地重金属健康风险评价方法

Country Status (2)

Country Link
CN (1) CN117789975A (zh)
NL (1) NL2034997A (zh)

Also Published As

Publication number Publication date
NL2034997A (en) 2023-07-27

Similar Documents

Publication Publication Date Title
Metwally et al. Soil properties spatial variability and delineation of site-specific management zones based on soil fertility using fuzzy clustering in a hilly field in Jianyang, Sichuan, China
CN105608324B (zh) 基于毒性效应的流域沉积物中重金属生态风险评估方法
López et al. A tutorial on the validation of qualitative methods: From the univariate to the multivariate approach
CN110675036B (zh) 一种基于随机森林优化微生物指数的高原河流生态健康评价方法
Wang et al. A back propagation neural network model optimized by mind evolutionary algorithm for estimating Cd, Cr, and Pb concentrations in soils using Vis-NIR diffuse reflectance spectroscopy
WO2016179864A1 (zh) 一种基于金属定量构效关系的淡水急性基准预测方法
Fan et al. Analysis and assessment of heavy metals pollution in soils around a Pb and Zn smelter in Baoji City, Northwest China
CN105631203A (zh) 识别土壤中重金属污染源的方法
Besmer et al. Evaluating monitoring strategies to detect precipitation-induced microbial contamination events in karstic springs used for drinking water
CN111678969A (zh) 利用土壤剖面表层重金属累积比例解析重金属污染来源的方法
CN110033133A (zh) 一种河湖系统中泥沙溯源方法
Wells et al. New approach to analysis of voltammetric ligand titration data improves understanding of metal speciation in natural waters
CN116362570A (zh) 一种基于大数据平台的多维度污染分析方法及系统
CN110781225B (zh) 一种环境介质污染物浓度水平的诊断方法
Chen et al. Sources and uncertainties of health risks for PM2. 5-bound heavy metals based on synchronous online and offline filter-based measurements in a Chinese megacity
Chen et al. Integrated application of multivariate statistical methods to source apportionment of watercourses in the Liao River Basin, Northeast China
CN116187861A (zh) 基于同位素的水质溯源监测方法及相关装置
Duan et al. A revised method of surface water quality evaluation based on background values and its application to samples collected in Heilongjiang Province, China
CN117875573B (zh) 一种基于生物毒性和生物有效性的水环境评价方法和系统
CN116166923A (zh) 基于地统计分析与apls-mlr的土壤重金属来源解析方法
CN111863142A (zh) 一种湖泊营养状态评价方法及其应用
CN104915563A (zh) 基于金属定量构效关系的淡水慢性基准预测方法
Garmendia et al. Testing the usefulness of a simple automatic method for particles abundance and size determination to derive cost-effective biological indicators in large monitoring networks
Zhou et al. A new method for continuous monitoring of black and odorous water body using evaluation parameters: a case study in baoding
de Azevedo et al. Taxonomic and functional approaches to phytoplankton in ecosystems with different coverage of aquatic plants

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination