CN114295749B - 一种水体有机污染智能化溯源方法及系统 - Google Patents
一种水体有机污染智能化溯源方法及系统 Download PDFInfo
- Publication number
- CN114295749B CN114295749B CN202111650481.7A CN202111650481A CN114295749B CN 114295749 B CN114295749 B CN 114295749B CN 202111650481 A CN202111650481 A CN 202111650481A CN 114295749 B CN114295749 B CN 114295749B
- Authority
- CN
- China
- Prior art keywords
- pollutants
- pollution
- organic
- water
- pollution source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 129
- 238000000034 method Methods 0.000 title claims abstract description 33
- 239000003344 environmental pollutant Substances 0.000 claims abstract description 120
- 231100000719 pollutant Toxicity 0.000 claims abstract description 120
- 239000002957 persistent organic pollutant Substances 0.000 claims abstract description 40
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 34
- 238000004458 analytical method Methods 0.000 claims abstract description 25
- 238000001514 detection method Methods 0.000 claims abstract description 25
- 238000013145 classification model Methods 0.000 claims abstract description 14
- 238000010801 machine learning Methods 0.000 claims abstract description 14
- 238000013537 high throughput screening Methods 0.000 claims abstract description 13
- 238000003012 network analysis Methods 0.000 claims abstract description 12
- 238000011109 contamination Methods 0.000 claims abstract description 10
- 239000005416 organic matter Substances 0.000 claims abstract description 10
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 claims abstract description 9
- 239000000356 contaminant Substances 0.000 claims description 11
- 238000007637 random forest analysis Methods 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 9
- 238000003911 water pollution Methods 0.000 claims description 9
- 238000001819 mass spectrum Methods 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000000589 high-performance liquid chromatography-mass spectrometry Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000011835 investigation Methods 0.000 abstract description 3
- 238000003891 environmental analysis Methods 0.000 abstract description 2
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 18
- 150000002500 ions Chemical class 0.000 description 13
- 230000009467 reduction Effects 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 239000012634 fragment Substances 0.000 description 5
- 238000012216 screening Methods 0.000 description 4
- 239000010865 sewage Substances 0.000 description 4
- 238000010828 elution Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002414 normal-phase solid-phase extraction Methods 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N Formic acid Chemical compound OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 239000012084 conversion product Substances 0.000 description 2
- 239000003480 eluent Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005507 spraying Methods 0.000 description 2
- 239000002351 wastewater Substances 0.000 description 2
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- CBHOOMGKXCMKIR-UHFFFAOYSA-N azane;methanol Chemical compound N.OC CBHOOMGKXCMKIR-UHFFFAOYSA-N 0.000 description 1
- GHQPBDDZGPAVJP-UHFFFAOYSA-N azanium;methanol;hydroxide Chemical compound N.O.OC GHQPBDDZGPAVJP-UHFFFAOYSA-N 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000003063 flame retardant Substances 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- SVWLIIFHXFGESG-UHFFFAOYSA-N formic acid;methanol Chemical compound OC.OC=O SVWLIIFHXFGESG-UHFFFAOYSA-N 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000003365 glass fiber Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 239000010842 industrial wastewater Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000005040 ion trap Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 239000004014 plasticizer Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 239000002352 surface water Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/18—Water
- G01N33/1826—Water organic contamination in water
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/04—Preparation or injection of sample to be analysed
- G01N30/06—Preparation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8624—Detection of slopes or peaks; baseline correction
- G01N30/8631—Peaks
- G01N30/8637—Peak shape
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/18—Water
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8693—Models, e.g. prediction of retention times, method development and validation
Abstract
本发明公开了一种水体有机污染智能化溯源方法及系统,属于环境分析化学技术领域。包括获取受污染水体自上游至下游的若干水样的高效液相色谱‑串联质谱的有机物分析检测数据;根据所述分析检测数据,对水样中的有机物进行高通量筛查,确认水体中的污染物;根据所确定的污染物,通过网络分析识别污染源;根据所识别的污染源以及所述污染源的受纳水体中的有机污染物,利用机器学习分类模型,确定污染源中的关键污染物,量化其污染贡献。本发明能够在未知污染源的情况下,实现对污染源及其中关键污染物的智能化追溯,为水环境中有机污染的调查和管控提供技术支撑。
Description
技术领域
本发明属于环境分析化学技术领域,具体涉及一种水体有机污染智能化溯源方法及系统。
背景技术
随着社会经济发展,各类有机污染物层出不穷,包括但不限于农药及其转化产物、药物及其转化产物、表面活性剂、增塑剂和阻燃剂等有毒有害在产在用化学物质。这些有机污染物不断进入水环境中,其数量庞大、种类繁多,并造成潜在的生态和健康风险,因此需要对水环境中的有机污染物加以关注。
有机污染物进入水环境中的途径多种多样,已有研究表明,通过污水厂出水、工业废水排放、地表径流和地下径流等方式污染物流入地表水中,导致来源广泛且复杂的水环境有机污染问题,因此水环境的污染溯源工作是一项巨大的挑战。根据文献调研,目前对水环境中的有机污染溯源工作,一方面基于在水体和污染源间三维荧光信号的比较来追溯污染排放源,另一方面基于污染源本身独特的质谱信号所指示的特征污染物来开发源指纹追踪技术,除此之外,水生微生物群落对污染排放源引起的水质变化的响应也被用于追溯污染源。值得注意的是,目前这些溯源方法仍在明显的不足:首先,需要预先设定可能的污染来源,根据污染源本身的特征来确定水体污染的来源;其次,对污染来源中的关键污染因子及其贡献程度的识别工作仍较少。
鉴于现有方法的缺陷,需要开发一种在未知任何污染排放源的条件下,对水环境中大量有机污染物进行来源追溯的方法。
发明内容
技术问题:针对目前水环境中有机污染物数量和种类繁多,来源广泛且复杂,导致溯源困难,且目前溯源技术依赖于预先知道污染来源的问题,本发明提供一种水体有机污染智能化溯源方法及系统,能够在未知污染源的情况下,实现对污染源及其中关键污染物的智能化追溯,为水环境中有机污染的调查和管控提供技术支撑。
技术方案:第一方面,本发明提供一种水体有机污染智能化溯源方法,包括:
获取受污染水体自上游至下游的若干水样的高效液相色谱-串联质谱的有机物分析检测数据;
根据所述分析检测数据,对水样中的有机物进行高通量筛查,确认水体中的污染物;
根据所确定的污染物,通过网络分析识别污染源;
根据所识别的污染源以及所述污染源的受纳水体中的有机污染物,利用机器学习分类模型,确定污染源中的关键污染物,量化其污染贡献。
进一步地,根据所述分析检测数据,对水样中的有机物进行高通量筛查,确认水体中的污染物包括:
将分析检测得到的数据文件导入分析软件,例如MS-DIAL、PeakView、CompoundDiscover等,进行峰提取和对齐,使用公开的大型质谱数据库对水样中的有机物进行高通量筛查,手动检查二级谱图的匹配情况去除假阳性,根据PubChem提供的物质分类信息确认其中的污染物。
进一步地,所述根据所确定的污染物,通过网络分析识别污染源包括:
计算有机污染物的峰面积的相关性,并根据所述相关性构建基于相关性的污染物网络,对污染物网络进行类群划分;
根据污染物类群,绘制各类群中污染物的峰面积的变化曲线以及各类群污染物的平均峰面积的变化曲线;
根据大型类群中污染物的平均峰面积的变化曲线从上游至下游剧烈增加的点位确定潜在污染源位置区间,同时考虑该类群污染物峰面积在此点位剧烈增加的一致性,结合实际地理信息,确定污染源。
进一步地,所述计算有机污染物的峰面积的相关性,并根据所述相关性构建基于相关性的污染物网络,对污染物网络进行类群划分包括:
计算从上游至下游的受纳水体水样中有机污染物峰面积的相关性,保留显著性p<0.05且为正值的相关关系,将其作为边、将污染物作为节点输入网络分析软件,例如Gephi、Cytoscape,构建基于相关性的污染物网络,进行模块化分析,得到污染物网络的类群划分结果。
进一步地,所述根据污染物类群划分,绘制各类群中污染物的峰面积的变化曲线以及各类群污染物的平均峰面积的变化曲线包括:
将上游至下游的水样中污染物的峰面积标准化,根据污染物类群划分,绘制各类群中污染物的峰面积的变化曲线图;
根据污染物类群划分,计算各点位污染物峰面积的平均值,获得各类群污染物的平均峰面积的变化曲线。
进一步地,所述机器学习分类模型为随机森林模型。
进一步地,根据所识别的污染源以及所述污染源处受纳水体中的有机污染物,利用机器学习分类模型,确定污染源中关键的污染物,量化其污染贡献包括:
针对确定的污染源,测定其汇入受纳水体的水样中的有机污染物;选择同时在污染源和受纳水体中存在的有机污染物,将其在受纳水体各点位的峰面积作为输入;
构建随机森林分类模型,将受纳水体样本相对于污染源的上游或下游作为样本二分类的标准;
训练随机森林分类模型;
输出表征变量重要性的指标,并根据所述重要性指标的数值大小确定关键的污染物及其污染贡献。
进一步地,输出表征变量重要性的指标,并根据所述重要性指标的数值大小确定关键的污染物及其污染贡献包括:
对平均准确率的减少值大于设定阈值的变量,认为其是潜在的污染贡献因子,判断其峰面积在受纳水体距离污染源最近的下游样本和所有上游样本的最大值之间的大小关系;
若潜在污染贡献因子的峰面积在距离污染源最近的下游样本中比在上游样本中大,即其相对丰度发生增加,则认为是污染源中关键污染物,基于这些关键污染物的平均准确率的减少值的大小量化它们的污染贡献。
进一步地,获取受污染水体自上游至下游的若干水样的高效液相色谱-串联质谱的有机物分析检测数据包括:
采集接受污染的水体从上游至下游的水样;
对水样进行处理,尽可能全面地提取和富集其中的有机物,得到待测液;
使用高效液相色谱-串联质谱对样品进行有机物的分析检测。
第二方面,本发明提供一种水体有机污染智能化溯源系统,利用本发明提供的任一项所述的水体有机污染智能化溯源方法对水体污染进行溯源,包括:
数据获取单元,用于获取受污染水体自上游至下游的若干水样的高效液相色谱-串联质谱的有机物分析检测数据;
污染物确定单元,用于根据所述分析检测数据,对水样中的有机物进行高通量筛查,确认水体中的污染物;
污染源识别单元,用于根据所确定的污染物,通过网络分析识别污染源;
污染源评价单元,用于根据所识别的污染源以及所述污染源的受纳水体中的有机污染物,利用机器学习分类模型,确定污染源中的关键污染物,量化其污染贡献。
有益效果:本发明与现有技术相比,具有以下优点:
本发明利用有机污染物在受纳水体中峰面积,即相对丰度的相关关系,构建污染物的相关性网络图,可以将在受纳水体中相对丰度变化趋势相似的污染物进行可视化聚类,高效、快速找到大量污染物中具有相似分布趋势的类群,同时可以快速聚焦至污染物数量较多的类群,根据类群平均相对丰度的变化趋势,有效追踪到污染源所在的地理位置区间,结合地理信息,实现污染源的识别。以受纳水体水样相对于污染源位置的上游和下游进行样本分类,构建机器学习分类模型,发现潜在的污染贡献因子,根据其在上游和下游的相对丰度进行筛选,可以在大量污染物中找到对受纳水体的关键污染贡献因子,在识别污染源的基础上有效识别其中的关键污染物,同时依据重要性指标数值实现对污染物污染贡献的量化。
整个过程综合利用了高通量筛查、网络分析以及机器学习技术,从而能够在未知污染源的情况下,实现对污染源及其中关键污染物的智能化追溯,为水环境中有机污染的调查和管控提供技术支撑。
附图说明
图1为本发明的实施例中水体有机污染智能化溯源方法的流程图;
图2本发明实施例中网络分析得到的基于相关性的污染物网络图;
图3为发明实施例中网络分析得到的8个类群的污染物峰面积的变化曲线图;
图4为发明实施例中机器学习模型输出的污染物的重要性指标数值图。
具体实施方式
下面结合实施例和说明书附图对本发明作进一步的说明。
第一方面,本发明提供一种水体有机污染智能化溯源方法,图1示出了本发明的实施例中水体有机污染智能化溯源方法的流程图,结合图1所示,实施例中该方法包括:
步骤S100:获取受污染水体自上游至下游的若干水样的高效液相色谱-串联质谱的有机物分析检测数据。在本发明的实施例中,结合具体实例,该步骤可按照分步骤S110~S140进行:
步骤S110:水样的收集。采集从上游至下游共11个点位的河流水样。
步骤S120:河流水样中有机物的提取。使用1μm的玻璃纤维滤膜对1L河流水样进行过滤,随后采用固相萃取(SPE)法富集样品中的有机物,水样依次流经Oasis MAX、MCX、HLB固相萃取小柱,控制过柱流速保持约3mL/min。使用小柱前需进行活化:对于MAX小柱,依次加入10ml 2%甲酸甲醇溶液、10ml甲醇、10ml Fisher水;对于MCX小柱,依次加入10ml 5%氨水甲醇溶液、10ml甲醇、10ml Fisher水;对于HLB小柱,依次加入10ml甲醇、10ml Fisher水。过完水样后,先使用离心机对萃取小柱进行离心脱水(3000rpm,5min),再进行洗脱:对MAX柱,加入12ml 2%甲酸甲醇溶液;对MCX柱,加入12ml 5%氨水甲醇溶液;对HLB柱,加入12ml甲醇。合并同一个水样的洗脱液得到最终的萃取洗脱液。
步骤S130:浓缩与定容。将洗脱液氮吹至近干,用甲醇定容至1ml,随后离心取上清液,保存至进样小瓶。
步骤S140:上机检测。通过高效液相色谱-组合型四极杆轨道离子阱质谱仪联用对样品进行有机物的分析检测,仪器条件如下:
高效液相色谱仪:Thermo UltiMate 3000;
色谱柱:Acquity UPLC BEH C18柱(2.1×150mm,1.7μm);
柱温:40℃;
流速:0.3ml/min;
流动相:(A相)2mM乙酸铵水溶液、(B相)甲醇;
洗脱梯度:
质谱仪:Q Exactive Focus,Thermo Fisher;
离子源:电喷雾;
离子模式:正离子模式和负离子模式;
一级(MS)全扫描范围:80-1000m/z;
一级(MS)分辨率:70000
二级(MS/M)分辨率:17500;
喷雾电压:3500V(正离子模式);2500V(负离子模式);
碰撞能量:35±15eV(正离子模式);-35±15eV(负离子模式);
步骤S200:根据所述分析检测数据,对水样中的有机物进行高通量筛查,确认水体中的污染物。具体的,在本发明的实施例中,将步骤S100中所获得的数据文件导入MS-DIAL软件,进行峰提取和对齐,使用公开的大型质谱数据库对水样中的有机物进行高通量筛查,手动检查二级谱图的匹配情况去除假阳性,根据PubChem提供的物质分类信息确认其中的污染物。在本发明的其他实施例中,也可以利用PeakView、Compound Discover等软件进行,公开的大型质谱数据库如MS-DIAL、NIST、MassBank、GNPS质谱数据库等。
参数设置如下:提峰响应:≥30000;对齐保留时间误差:≤0.2min;对齐质量误差:≤0.01Da;筛查质量误差:一级≤0.01Da,二级≤0.002Da。
手动检查去除假阳性的标准如下:若数据库中二级谱图只有一个碎片离子信息,去除没有碎片离子匹配上的物质;若数据库中二级谱图有两个及以上碎片离子信息,去除少于两个碎片离子匹配上的物质;若数据库中二级谱图没有碎片离子信息,去除该物质。
最终筛查鉴定出了河流中132种有机污染物。
步骤S300:根据所确定的污染物,通过网络分析识别污染源。具体的,该步骤包括:
步骤S310:计算有机污染物的峰面积的相关性,并根据所述相关性构建基于相关性的污染物网络,对污染物网络进行类群划分。在本发明的实施例中,计算从上游至下游的受纳水体水样中有机污染物峰面积的皮尔逊相关性,保留显著性p<0.05且为正值的相关关系,将其作为边、将污染物作为节点输入Gephi软件中,构建基于相关性的污染物网络,进行模块化分析,得到污染物网络的类群划分结果。在本发明所提供的示例中,基于相关性的污染物网络如图2所示,污染物网络被划分为8个不同的类群,如图3所示。在本发明的其他实施例中,也可以采用Cytoscape软件,来构建基于相关性的污染物网络。
步骤S320:根据污染物类群,绘制各类群中污染物的峰面积的变化曲线以及各类群污染物的平均峰面积的变化曲线;具体的,可将上游至下游的水样中污染物的峰面积标准化,根据污染物类群划分,绘制各类群中污染物的峰面积的变化曲线图。在此基础上,计算各点位污染物峰面积的平均值,获得各类群污染物的平均峰面积的变化曲线。在所提供的示例中,如图3所示。
步骤S330:根据大型类群中污染物的平均峰面积的变化曲线从上游至下游剧烈增加的点位确定潜在污染源位置区间,同时考虑该类群污染物峰面积在此点位剧烈增加的一致性,结合实际地理信息,确定污染源。
如果追溯到受纳水体的支流是污染来源,则应重复步骤S100~S300,直到识别到具体的污染点源。
具体的,结合图3,黑色的曲线为污染物的平均峰面积的变化曲线。灰色的曲线为污染物的峰面积的变化曲线,在确定污染源时,可以看到,污染物的平均峰面积的变化曲线陡增的地方,大多数的污染物的峰面积的变化曲线也发生陡增的情况,然后结合实际的地理信息,可以确定污染源。所提供示例中,根据前3个大型类群中该曲线从上游至下游剧烈增加的点位确定2个潜在污染源的位置区间,同时考虑这3个类群污染物峰面积在这2个点位剧烈增加的一致性,结合实际地理信息,确定附近的污水处理厂和一条支流是其污染来源。
步骤S400:根据所识别的污染源以及所述污染源的受纳水体中的有机污染物,利用机器学习分类模型,确定污染源中的关键污染物,量化其污染贡献。
在本发明的一个实施例中,采用的机器学习分类模型为随机森林模型,当然,在其他的实施例中,也可以采用其他的分类模型,例如决策树、支撑向量机等等。此处结合随机森林模型进行具体说明,具体的,可按照步骤S410~S440进行。
步骤S410:针对确定的污染源,测定其汇入受纳水体的水样中的有机污染物;选择同时在污染源和受纳水体中存在的有机污染物,将其在受纳水体各点位的峰面积作为输入。测定污染源汇入受纳水体中的有机污染物时,可按照步骤S110~S140的方法进行检测,然后按照步骤S200的方法筛查鉴定其中有机污染物。在所提供的示例中,最终筛查鉴定出了污水处理厂的废水样中76种有机污染物。选择同时在废水和河流中存在的71种有机污染物,将其在河流各点位的峰面积作为输入。
步骤S420:构建随机森林分类模型,将受纳水体样本相对于污染源的上游或下游作为样本二分类的标准。
在所提供示例中,利用R语言构建随机森林分类模型,将河流样本划分为相对于污染源的8个上游和3个下游样本。
步骤S430:训练随机森林分类模型。在所提供的示例中,通过循环计算袋外错误率(OOB)的平均值来确定模型参数mtry的最佳值为16,混淆矩阵评估模型分类错误率为0%。
步骤S440:输出表征变量重要性的指标,并根据所述重要性指标的数值大小确定关键的污染物及其污染贡献。在所提供的示例中,采用的指标为平均准确率的减少值。对平均准确率的减少值大于0(设定阈值)的32种污染物,判断它们在距离污染源最近的下游河流样本中的峰面积是否大于所有上游河流样本中的最大值,最终找到25种污染物是污水处理厂这一污染点源中关键污染贡献因子,基于它们的平均准确率的减少值的大小量化它们的污染贡献,如图4所示。
第二方面,本发明提供一种水体有机污染智能化溯源系统,该系统可根据上述水体有机污染溯源方法对水体污染进行溯源,该系统包括:
数据获取单元,用于获取受污染水体自上游至下游的若干水样的高效液相色谱-串联质谱的有机物分析检测数据;
污染物确定单元,用于根据所述分析检测数据,对水样中的有机物进行高通量筛查,确认水体中的污染物;
污染源识别单元,用于根据所确定的污染物,通过网络分析识别污染源;
污染源评价单元,用于根据所识别的污染源以及所述污染源的受纳水体中的有机污染物,利用机器学习分类模型,确定污染源中的关键污染物,量化其污染贡献。
上述各个单元实现相应的功能,与本发明所提供的方法中相应的步骤对应,此处就不再赘述。
上述实施例仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和等同替换,这些对本发明权利要求进行改进和等同替换后的技术方案,均落入本发明的保护范围。
Claims (8)
1.一种水体有机污染智能化溯源方法,其特征在于,包括:
获取受污染水体自上游至下游的若干水样的高效液相色谱-串联质谱的有机物分析检测数据;
根据所述分析检测数据,对水样中的有机物进行高通量筛查,确认水体中的污染物;
根据所确定的污染物,通过网络分析识别污染源;
根据所识别的污染源以及所述污染源的受纳水体中的有机污染物,利用机器学习分类模型,确定污染源中的关键污染物,量化其污染贡献;
所述根据所确定的污染物,通过网络分析识别污染源包括计算有机污染物的峰面积的相关性,并根据所述相关性构建基于相关性的污染物网络,对污染物网络进行类群划分;根据污染物类群,绘制各类群中污染物的峰面积的变化曲线以及各类群污染物的平均峰面积的变化曲线;根据大型类群中污染物的平均峰面积的变化曲线从上游至下游剧烈增加的点位确定潜在污染源位置区间,同时考虑该类群污染物峰面积在此点位剧烈增加的一致性,结合实际地理信息,确定污染源;
所述计算有机污染物的峰面积的相关性,并根据所述相关性构建基于相关性的污染物网络,对污染物网络进行类群划分包括计算从上游至下游的受纳水体水样中有机污染物峰面积的相关性,将其作为边、将污染物作为节点输入网络分析软件中,构建基于相关性的污染物网络,进行模块化分析,得到污染物网络的类群划分结果;
所述根据污染物类群,划分绘制各类群中污染物的峰面积的变化曲线以及各类群污染物的平均峰面积的变化曲线包括将上游至下游的水样中污染物的峰面积标准化,根据污染物类群划分,绘制各类群中污染物的峰面积的变化曲线图;根据污染物类群划分,计算各点位污染物峰面积的平均值,获得各类群污染物的平均峰面积的变化曲线。
2.根据权利要求1所述的方法,其特征在于,根据所述分析检测数据,对水样中的有机物进行高通量筛查,确认水体中的污染物包括:
将分析检测得到的数据文件导入分析软件,进行峰提取和对齐,使用公开的大型质谱数据库对水样中的有机物进行高通量筛查,手动检查二级谱图的匹配情况去除假阳性,根据PubChem提供的物质分类信息确认其中的污染物。
3.根据权利要求1所述的方法,其特征在于,所述计算从上游至下游的受纳水体水样中有机污染物峰面积的相关性,保留显著性p<0.05且为正值的相关关系。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述机器学习分类模型为随机森林模型。
5.根据权利要求1所述的方法,其特征在于,根据所识别的污染源以及所述污染源处受纳水体中的有机污染物,利用机器学习分类模型,确定污染源中的关键污染物,量化其污染贡献包括:
针对确定的污染源,测定其汇入受纳水体的水样中的有机污染物;选择同时在污染源和受纳水体中存在的有机污染物,将其在受纳水体各点位的峰面积作为输入;
构建随机森林分类模型,将受纳水体样本相对于污染源的上游或下游作为样本二分类的标准;
训练随机森林分类模型;
输出表征变量重要性的指标,并根据所述指标的数值大小确定关键的污染物及其污染贡献。
6.根据权利要求5所述的方法,其特征在于,输出表征变量重要性的指标,并根据所述指标的数值大小确定关键污染物及其污染贡献包括:
对所述指标的数值大于设定阈值的变量,认为其是潜在的污染贡献因子,判断其峰面积在受纳水体相对于污染源的下游样本和上游样本之间的大小关系;
若潜在污染贡献因子的峰面积在下游样本中比在上游样本中大,则认为是污染源中关键污染物,基于这些关键污染物的重要性的指标的数值的大小量化它们的污染贡献。
7.根据权利要求1所述的方法,其特征在于,获取受污染水体自上游至下游的若干水样的高效液相色谱-串联质谱的有机物分析检测数据包括:
采集接受污染的水体从上游至下游的水样;
对水样进行处理,尽可能全面地提取和富集其中的有机物,得到待测液;
使用高效液相色谱-串联质谱对样品进行有机物的分析检测。
8.一种水体有机污染智能化溯源系统,利用权利要求1-7任一项所述的水体有机污染智能化溯源方法对水体污染进行溯源,其特征在于,包括:
数据获取单元,用于获取受污染水体自上游至下游的若干水样的高效液相色谱-串联质谱的有机物分析检测数据;
污染物确定单元,用于根据所述分析检测数据,对水样中的有机物进行高通量筛查,确认水体中的污染物;
污染源识别单元,用于根据所确定的污染物,通过网络分析识别污染源;
污染源评价单元,用于根据所识别的污染源以及所述污染源的受纳水体中的有机污染物,利用机器学习分类模型,确定污染源中的关键污染物,量化其污染贡献。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111650481.7A CN114295749B (zh) | 2021-12-30 | 2021-12-30 | 一种水体有机污染智能化溯源方法及系统 |
PCT/CN2022/077587 WO2023024463A1 (zh) | 2021-12-30 | 2022-02-24 | 一种水体有机污染智能化溯源方法及系统 |
US18/005,565 US11965871B2 (en) | 2021-12-30 | 2022-02-24 | Method and system for intelligent source tracing of organic pollution of water body |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111650481.7A CN114295749B (zh) | 2021-12-30 | 2021-12-30 | 一种水体有机污染智能化溯源方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114295749A CN114295749A (zh) | 2022-04-08 |
CN114295749B true CN114295749B (zh) | 2022-10-25 |
Family
ID=80973790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111650481.7A Active CN114295749B (zh) | 2021-12-30 | 2021-12-30 | 一种水体有机污染智能化溯源方法及系统 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11965871B2 (zh) |
CN (1) | CN114295749B (zh) |
WO (1) | WO2023024463A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115309845B (zh) * | 2022-08-23 | 2023-05-02 | 北京万维盈创科技发展有限公司 | 基于水系编译器与机器学习处理的水污染溯源方法及系统 |
CN116263444B (zh) * | 2023-04-20 | 2023-07-07 | 北京大学 | 高分辨质谱非靶向分析水体污染源识别与溯源方法 |
CN116148400B (zh) * | 2023-04-20 | 2023-06-27 | 北京大学 | 基于污染源和污染受体高分辨质谱数据的定量源解析方法 |
CN116340723B (zh) * | 2023-05-22 | 2023-08-01 | 安徽中科大国祯信息科技有限责任公司 | 基于大数据的乡村水污染快速溯源方法及系统 |
CN116735276A (zh) * | 2023-06-25 | 2023-09-12 | 深圳市汉宇环境科技有限公司 | 一种废水中新污染物采样方法 |
CN116630812B (zh) * | 2023-07-21 | 2023-09-26 | 四川发展环境科学技术研究院有限公司 | 基于可见光图像分析的水体特征检测方法及系统 |
CN116881749B (zh) * | 2023-09-01 | 2023-11-17 | 北京建工环境修复股份有限公司 | 一种污染场地施工监测方法及系统 |
CN117272070B (zh) * | 2023-11-21 | 2024-02-02 | 北京大学 | 一种同时利用有机和无机污染物的定量源解析方法 |
CN117373557B (zh) * | 2023-12-05 | 2024-02-27 | 山东清控生态环境产业发展有限公司 | 基于多维数据的溯源方法及系统 |
CN117649156B (zh) * | 2024-01-30 | 2024-04-12 | 水利部交通运输部国家能源局南京水利科学研究院 | 高城镇化河网全自动水环境监测方法及系统 |
CN117709208B (zh) * | 2024-02-05 | 2024-04-16 | 四川国蓝中天环境科技集团有限公司 | 一种人为排放污染物的大气环境容量计算方法 |
CN117808173B (zh) * | 2024-02-29 | 2024-04-30 | 四川省水利科学研究院 | 水田肥度检测方法、相关产品及基于其的种植方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110004239A (zh) * | 2019-04-03 | 2019-07-12 | 河海大学 | 一种基于微生物溯源解析水体污染源的方法 |
CN112613675A (zh) * | 2020-12-29 | 2021-04-06 | 南开大学 | 一种分析污染源与气象因素对不同程度pm2.5污染影响贡献和效应的机器学习模型 |
CN112986497A (zh) * | 2021-02-09 | 2021-06-18 | 浙江大学 | 基于气体传感器阵列指纹识别的污染气体溯源方法 |
WO2021174751A1 (zh) * | 2020-03-02 | 2021-09-10 | 平安国际智慧城市科技股份有限公司 | 基于大数据的污染源定位方法、装置、设备及存储介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102661939B (zh) | 2012-05-15 | 2013-12-04 | 北京化工大学 | 一种快速实现水污染溯源的方法 |
KR101697183B1 (ko) * | 2015-01-29 | 2017-01-17 | 계명대학교 산학협력단 | 인공위성 영상과 랜덤포레스트 분류기 결합을 이용한 자동 하천 검출 시스템 및 방법 |
US20190065674A1 (en) * | 2017-08-22 | 2019-02-28 | Noblis, Inc. | Nucleic acid sample analysis |
CN107480839A (zh) * | 2017-10-13 | 2017-12-15 | 深圳市博安达信息技术股份有限公司 | 基于主成分分析和随机森林的高危污染源的分类预测方法 |
CN108008048A (zh) * | 2017-12-08 | 2018-05-08 | 环境保护部华南环境科学研究所 | 一种地下水系统中新型污染物的污染源识别方法与应用 |
JP6889096B2 (ja) * | 2017-12-12 | 2021-06-18 | 株式会社東芝 | 学習モデル製造方法、汚染密度算出方法および汚染密度算出装置 |
CN110308255B (zh) * | 2019-05-08 | 2021-11-02 | 宁波大学 | 一种基于污染指示菌群对近海水体污染程度定量预测方法 |
AU2020290793A1 (en) * | 2019-06-12 | 2021-12-23 | B.G. Negev Technologies & Applications Ltd., At Ben-Gurion University | System and method for determining aqueous nitrate concentration in solution containing dissolved organic carbon |
CN111161802A (zh) * | 2020-01-06 | 2020-05-15 | 华东理工大学 | 一种利用微生物生物标记的湖泊水体污染来源解析方法 |
CN111118128A (zh) * | 2020-01-06 | 2020-05-08 | 华东理工大学 | 一种利用微生物群落图谱解析河流水体污染来源的方法 |
US20220157408A1 (en) * | 2020-11-13 | 2022-05-19 | Wynd Technologies, Inc. | Pollution type sensing |
CN113128129B (zh) * | 2021-05-07 | 2023-03-24 | 大连理工大学 | 一种突发水污染正逆耦合溯源方法及系统 |
US20230176027A1 (en) * | 2021-12-08 | 2023-06-08 | Maytronics Ltd. | Apparatus for measuring characteristics of a water facility |
-
2021
- 2021-12-30 CN CN202111650481.7A patent/CN114295749B/zh active Active
-
2022
- 2022-02-24 WO PCT/CN2022/077587 patent/WO2023024463A1/zh active Application Filing
- 2022-02-24 US US18/005,565 patent/US11965871B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110004239A (zh) * | 2019-04-03 | 2019-07-12 | 河海大学 | 一种基于微生物溯源解析水体污染源的方法 |
WO2021174751A1 (zh) * | 2020-03-02 | 2021-09-10 | 平安国际智慧城市科技股份有限公司 | 基于大数据的污染源定位方法、装置、设备及存储介质 |
CN112613675A (zh) * | 2020-12-29 | 2021-04-06 | 南开大学 | 一种分析污染源与气象因素对不同程度pm2.5污染影响贡献和效应的机器学习模型 |
CN112986497A (zh) * | 2021-02-09 | 2021-06-18 | 浙江大学 | 基于气体传感器阵列指纹识别的污染气体溯源方法 |
Non-Patent Citations (3)
Title |
---|
Machine learning-based source identification and spatial prediction of heavy metals in soil in a rapid urbanization area, eastern China;zhang H et al;《JOURNAL OF CLEANER PRODUCTION》;20201110;1-10 * |
Spatial distribution pattern analysis of groundwater nitrate nitrogen pollutionin Shandong intensive farming regions of China using neural net work method;JianxiHuang et al;《Mathematical and Computer Modelling》;20111231;995-1004 * |
基于伴随状态方法的地下水污染源识别研究;曹彤彤 等;《高效地质学报》;20160930;第22卷(第3期);563-571 * |
Also Published As
Publication number | Publication date |
---|---|
WO2023024463A1 (zh) | 2023-03-02 |
CN114295749A (zh) | 2022-04-08 |
US11965871B2 (en) | 2024-04-23 |
US20240027419A1 (en) | 2024-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114295749B (zh) | 一种水体有机污染智能化溯源方法及系统 | |
Hawkes et al. | Evaluation of the Orbitrap mass spectrometer for the molecular fingerprinting analysis of natural dissolved organic matter | |
CN112505282A (zh) | 一种环境水体污染实时精准溯源预警方法及其系统 | |
CN111368401A (zh) | 污染源的溯源方法、装置和存储介质 | |
CN111707741A (zh) | 环境介质中微量有机污染物转化产物的非靶向识别方法 | |
CN111562327A (zh) | 一种基于分子网络的废水中致毒有机污染物非目标筛查分析的方法 | |
Wang et al. | Suspect, non-target and target screening of pharmaceuticals and personal care products (PPCPs) in a drinking water system | |
CN114414689A (zh) | 一种基于超高效液相色谱高分辨率质谱的全氟化合物非靶向定量方法 | |
Donaldson | Trace organics in water | |
CN113155939A (zh) | 一种挥发性有机物在线来源解析方法、系统、设备及介质 | |
Minkus et al. | Spotlight on mass spectrometric non‐target screening analysis: Advanced data processing methods recently communicated for extracting, prioritizing and quantifying features | |
CN115389690A (zh) | 环境中苯并三唑紫外线吸收剂类污染物的全面识别方法 | |
Yi et al. | Will various interpretation strategies of the same ultrahigh‐resolution mass spectrometry data tell different biogeochemical stories? A first assessment based on natural aquatic dissolved organic matter | |
CN114563381A (zh) | 一种水体污染溯源方法 | |
CN116263444B (zh) | 高分辨质谱非靶向分析水体污染源识别与溯源方法 | |
Kutlucinar et al. | Non-targeted analysis with high-resolution mass spectrometry for investigation of riverbank filtration processes | |
CN116148400A (zh) | 基于污染源和污染受体高分辨质谱数据的定量源解析方法 | |
CN115855898A (zh) | 一种基于大数据的水质指纹溯源方法和系统 | |
Di Lecce et al. | Online wastewater monitoring system using solid state sensor | |
López-Kleine et al. | UV-vis in situ spectrometry data mining through linear and non linear analysis methods | |
Knobloch et al. | Selective and fast analysis of chlorinated paraffins in the presence of chlorinated mono-, di-, and tri-olefins with the R-based automated spectra evaluation routine (RASER) | |
CN116908361A (zh) | 一种工业园区流域水环境新污染物识别与溯源方法 | |
Kashyap et al. | QA/QC aspects of GC-MS analytical instrument for environmental analysis | |
CN117272070B (zh) | 一种同时利用有机和无机污染物的定量源解析方法 | |
CN115950864A (zh) | 一种基于三维荧光光谱法的水污染溯源检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |