CN111380787A - 一种基于lstm-nn时序预测的pm2.5中重金属健康风险评价方法 - Google Patents

一种基于lstm-nn时序预测的pm2.5中重金属健康风险评价方法 Download PDF

Info

Publication number
CN111380787A
CN111380787A CN202010417099.0A CN202010417099A CN111380787A CN 111380787 A CN111380787 A CN 111380787A CN 202010417099 A CN202010417099 A CN 202010417099A CN 111380787 A CN111380787 A CN 111380787A
Authority
CN
China
Prior art keywords
heavy metal
concentration
lstm
heavy metals
bioavailable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010417099.0A
Other languages
English (en)
Other versions
CN111380787B (zh
Inventor
王雨轩
孙明洋
于江华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN202010417099.0A priority Critical patent/CN111380787B/zh
Publication of CN111380787A publication Critical patent/CN111380787A/zh
Application granted granted Critical
Publication of CN111380787B publication Critical patent/CN111380787B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/3103Atomic absorption analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/71Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light thermally excited
    • G01N21/73Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light thermally excited using plasma burners or torches
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Electrochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plasma & Fusion (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Dispersion Chemistry (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating Or Analyzing Non-Biological Materials By The Use Of Chemical Means (AREA)

Abstract

本发明公开了一种基于LSTM‑NN时序预测的PM2.5中重金属健康风险评价方法。本发明对当前常用的PM2.5中重金属健康风险评价方法与模型中不合理、不准确的参数取值方式提出改进方法,充分提取、分析和考虑了隐含在PM2.5中重金属日均浓度时间序列中被以往研究所忽略的变化趋势信息,对PM2.5中重金属健康风险评价结论正确性与可靠性的提高有重要意义,给污染控制有关部门提供更全面、更准确的PM2.5中重金属浓度变化趋势信息,使其环境管理策略更有针对性与时效性。

Description

一种基于LSTM-NN时序预测的PM2.5中重金属健康风险评价 方法
技术领域
本发明属于环境科学与工程、环境健康风险评价、环境管理领域,具体涉及一种基于LSTM-NN时序预测的PM2.5中重金属健康风险评价方法。
背景技术
由于社会经济发展与人类活动,以PM2.5等大气颗粒物为代表的大气污染日益严重。研究表明,大气颗粒物尤其是PM2.5细颗粒物浓度的大幅增加与引发呼吸道类疾病、以及死亡等病症发生率的增加有密切关系。
研究表明,大气颗粒物的等效直径越小,重金属浓度越高。PM2.5因其粒径小且有着较其他微粒更大的比表面积,更容易吸附大气中的各种重金属等有害物质。其中Cr、Ni、Cd、As属于致癌物质,Pb会损害人体的血液循环系统以及神经系统,Cu会导致记忆力衰退等病症,As会损害人体呼吸道黏膜,诱发呼吸系统疾病。虽然PM2.5中重金属的暴露途径较多,包括呼吸摄入、皮肤接触等,但呼吸途径更值得关注,富集在PM2.5表面的重金属更容易随呼吸进入人体,进而危害人体健康。
以往的研究表明,我国城市PM2.5等大气颗粒物中重金属的污染情况较严重,如下表所示,部分城市的Cd和Pb年平均浓度严重超过国家环境空气质量标准规定的限值,大气颗粒物中较高的重金属浓度对当地人群造成重大健康威胁。PM2.5中重金属的健康风险评价方法,可详细、深入、定量地了解PM2.5中重金属对当地人群造成健康危害,并为当地污染控制部门制定污染控制措施以及污染管理提供充实的数据支持。
Figure BDA0002495423300000011
环境健康风险评价的模式很多,但目前更多采用美国科学院提出的四步法为范式。该健康风险评价模式,基本流程包括危害识别→剂量—反应评估→暴露评价→风险表征。危害识别,通过收集和分析相关资料定性判断包括重金属元素在内的环境风险源的性质、强度以及可能危害性;剂量—反应评估,通过一定数学模型建立和估算污染物的暴露水平或剂量与暴露人群的不良反应(健康效应)发生率之间的关系,从而定量评估污染物毒性。暴露评估,定量或定性估算和评价暴露量、暴露频率、暴露途径和暴露时间,估算整个社会或一定区域内人群接触某种化学物质的程度或可能性。风险表征,利用上述三个阶段所获数据,估算不同暴露途径下污染物(包括重PM2.5中的重金属元素)对人体健康可能产生危害的强度或某种健康效应发生的概率。其中前两步危害识别与剂量—反应评估侧重于重金属等有害化学物质本身物理、化学性质及其对人体的危害,而与实际研究区域的污染状况无关,且前人的研究较充分与翔实,因此在前人关于危害识别、剂量—反应评估的研究结论基础上,当前研究更关注于暴露评估以及风险表征的研究。
暴露评价,即定量评估重金属元素在呼吸摄入等暴露途径下的暴露剂量,致癌物质用LADD(Lifetime Average Daily Dose,终身日平均暴露剂量)表示,非致癌物质用ADD(Average Daily Dose,日平均暴露剂量)表示,量纲均为mg/(kg·day)。LADD与ADD的计算公式为ADD(LADD)=(C·IR·ED·ET·AF)/(BW·AT)。其中C(mg/m3)表示一定时间内人群接触的PM2.5中重金属元素的日平均浓度;IR(m3/day)表示人群的呼吸速率;ED(day/year)表示持续暴露天数;ET(year)表示暴露年限;AF(无量纲)表示吸入率;BW(kg)表示人群的平均体重;AT(day)表示人群的平均寿命。除了C以外的参数可借鉴前人的研究成果以及中、美等国的环保部推荐值。
风险表征,具体内容则是定量评价致癌与非致癌风险。非致癌风险,用HI定量表示,计算公式为HI=ADD/RfD,其中Rfd表示该重金属元素的参考剂量(mg/(kg·day));致癌风险以R作为定量评价指标,其计算公式为R=LADD×SF,其中SF表示该重金属元素的致癌斜率因子((kg·day)/mg)。一般研究认为若HI小于1则该重金属元素非致癌风险较小,若HI大于1则该重金属有非致癌风险;当R小于10-6时该重金属无致癌风险,当R在10-6到10-4之间时该种金属有潜在致癌风险,当R大于10-4时该重金属有显著的致癌风险。
当前PM2.5中重金属健康风险评价的方法,存在以下问题:1)仅考虑了重金属元素总量浓度的暴露剂量与健康风险,对PM2.5中重金属不同赋存形态考虑不足;研究表明,重金属元素不同赋存形态对人体健康造成的风险具有显著差异;2)研究表明大气PM2.5中重金属浓度的时空变异较大,而当前研究多以监测站点所得PM2.5重金属浓度数据作为健康风险评价的依据,忽略了不同暴露环境下人群接触的PM2.5中重金属的实际浓度与监测站点所得浓度的差异;3)实际研究表明PM2.5中重金属日平均浓度变化是非平稳的,即有限时间段测得PM2.5中重金属日均浓度的平均值不足以代表未来相当长一段时间(30年或70年)内PM2.5中重金属日均浓度的平均值。而公开号为CN201910460147、CN110164556A的专利虽然考虑了上述问题(2),但包括其在内大多数研究仅仅用当前有限时间段测量所得的重金属浓度值的平均值作为健康风险评价的依据,忽略了隐含在时间序列中的丰富变化趋势信息。这些不足之处,对健康风险评价的最终结论以及准确性、可靠性有至关重要的影响。
发明内容
本发明的目的在于克服当前PM2.5中重金属健康风险评价方法中存在的对PM2.5中重金属不同赋存形态考虑不足以及忽略了隐含在时间序列中的丰富变化趋势信息的问题,提供一种基于LSTM-NN时序预测的PM2.5中重金属健康风险评价方法。
本发明上述目的通过如下技术方案实现:
一种基于LSTM-NN时序预测的PM2.5中重金属健康风险评价方法,包括以下步骤:
步骤1,PM2.5石英滤膜样品的获取:在现有的大气PM2.5采样监测站点获取一定数量的承载有PM2.5的石英滤膜样品,并记录采样时间等相关采样信息,样品送实验室保存、待测;
步骤2,提取各形态重金属并测定其浓度:根据形态划分方法及其所用化学试剂,分别提取、稀释、定容每种重金属元素4种赋存形态,即水溶态、可还原态、可氧化态、残渣态的液态样品;利用电感耦合等离子体发射光谱仪或电感耦合等离子体质谱仪等痕量化学元素分析仪器测定液态样品中重金属元素每一种赋存形态的浓度;
步骤3,处理仪器所得原始浓度数据:1)计算PM2.5中重金属每一种赋存形态的浓度;2)认定水溶态、可还原态、可氧化态三种形态为生物可利用形态,并计算PM2.5中重金属的生物可利用形态的浓度;
步骤4,数据预处理,填充PM2.5中生物可利用形态重金属日均浓度组成的时间序列存在缺失值以及估计其真实值,并将数据归一化:分别利用1)插值方法填充缺失值;2)利用频率域滤波的方法估计测量值的真实值,减少误差以及一部分无规律随机变化干扰,得到经过真实值统计估计的PM2.5中生物可利用形态重金属的浓度时间序列;3)将该序列数据做归一化处理;
步骤5,利用长短期记忆神经网络学习、分析、提取PM2.5中生物可利用形态重金属浓度时间序列变化趋势:1)利用主流的深度学习框架,构建包含输入层、输出层以及隐含层的长短期记忆神经网络(LSTM-NN)并确定其初始参数以及训练参数;2)以前一定天数的的PM2.5中生物可利用形态重金属日均浓度序列作为该长短期记忆神经网络的输入,后几天的重金属日均浓度作为输出,训练、筛选出能够反应浓度变化趋势的神经网络;
步骤6,PM2.5中生物可利用形态重金属日均浓度时间序列预测,并计算暴露剂量以及致癌风险与非致癌风险:1)利用步骤5中经过训练、能够充分反映变化趋势的长短期记忆神经网络,以及步骤4所得的PM2.5中生物可利用形态重金属到的日均浓度数据,向后预测未来一定天数内每一天的PM2.5中生物可利用形态重金属日均浓度;2)确定健康风险评价模型中的30年或70年PM2.5中重金属日均浓度平均值的估计值;3)计算PM2.5中各重金属元素的暴露剂量以及致癌风险值与非致癌风险值;
步骤7,给出PM2.5中各重金属元素的致癌风险与非致癌风险定性评价结论。
进一步地,步骤2在提取各形态重金属并测定其浓度前,将PM2.5石英滤膜样品裁剪成2cm2的大小。
进一步地,步骤3中计算PM2.5中重金属每一种赋存形态的浓度公式为:C=C0RDVsolSΣ/(VgasS),式中C0表示仪器测得液态样品中重金属的浓度,RD表示稀释倍数,Vsol表示溶液体积,S表示滤膜总面积,Vgas表示采样气体体积,S表示剪取滤膜的面积。
进一步地,步骤3中计算PM2.5中重金属的生物可利用形态的浓度公式为:Cbio=CF1+CF2+CF3,式中Cbio表示可利用形态重金属浓度,CF1、CF2、CF3表示F1态、F2态、F3态重金属的浓度。
进一步地,步骤4中,归一化处理选用的具体计算公式为:
Figure BDA0002495423300000041
式中Cbio表示生物可利用形态重金属浓度,Cnorm表示生物可利用形态重金属浓度归一化结果值,min与max函数分别表示求取Cbio序列最小、最大值的函数。
有益效果:
本发明对当前常用的PM2.5中重金属健康风险评价方法与模型中不合理、不准确的参数取值方式提出改进方法,充分提取、分析和考虑了隐含在PM2.5中重金属日均浓度时间序列中被以往研究所忽略的变化趋势信息,对PM2.5中重金属健康风险评价结论正确性与可靠性的提高有重要意义,给污染控制有关部门提供更全面、更准确的PM2.5中重金属浓度变化趋势信息,使其环境管理策略更有针对性与时效性。
附图说明
图1为PM2.5中所得各形态重金属Pb浓度图;
图2为PM2.5中生物可利用形态重金属Pb的浓度时间序列归一化图;
图3为实施例1中所用长短期记忆神经网络(LSTM-NN)的具体结构示意图,其中输入层为Input Layer,由于深度学习框架的限制输入层的激活函数需要图3中额外的激活层Activation Layer实现,隐含层为LSTM层,输出层为Output Layer;
图4为利用长短期记忆神经网络得到的PM2.5中生物可利用形态各重金属元素浓度时间序列变化趋势图。
具体实施方式
下面结合附图和实施例具体介绍本发明实质性内容,但并不以此限定本发明的保护范围。
实施例1:
步骤1,从监测站点获取PM2.5样品,具体操作为:从PM2.5采样监测站点获取一定数量采集有PM2.5及其中重金属的石英滤膜样品,并记录其采样编号等采样信息,将其用锡箔纸包好放入干燥器中保存待测。
步骤2,实验提取各形态重金属并测定其浓度,具体操作包括以下步骤:
1)前处理,首先记录石英滤膜的采样编号并赋予其对应的提取操作顺序编号,其次用带刻度尺的裁纸刀以及搪瓷剪刀剪取2cm2的滤膜,然后放入精度万分之一克的电子分析天平称重,并记录滤膜的质量,最后将剪取的滤膜放入50mL离心管中,并在离心管外壁粘贴写有提取操作顺序编号的标签;
2)水溶态(F1)重金属样品的提取,具体操作包括:①向步骤1)的离心管中加入15mL去离子水或超纯水;②离心管封口,放入温度设置为25℃的摇床振荡提取3-16小时,再利用离心机在4000-5000rpm条件下离心10-20分钟;③用0.22μm过滤头以及5mL或10mL注射器抽取并过滤离心管中的10mL上清液,加入25mL容量瓶中,再加入0.5mL硝酸、稀释定容至25mL待测;④洗涤残渣;
3)可还原态(F2)重金属样品的提取,具体操作包括:①往上一步存放残渣的离心管中加入10mL氯化羟胺溶液(NH2OH·HCl,0.25mol/L,用浓硝酸调节pH至1.5左右);②离心管封口,放入温度设置为25℃的摇床振荡提取5-16小时,再利用离心机在4000-5000rpm条件下离心10-20分钟;③用0.22μm过滤头以及5mL或10mL注射器抽取并过滤离心管中的8mL上清液,加入25mL容量瓶中,再加入0.5mL硝酸、稀释定容至25mL待测;④洗涤残渣;
4)可氧化态(F3)重金属样品的提取,具体操作包括:①往上一步存放残渣的离心管中加入5mL过氧化氢溶液(质量分数30%,用适量硝酸调节pH至2到3之间);②将离心管放入温度设置为95℃的水浴摇床振荡1-2小时,使其在酸性条件下与H2O2充分反应;③将离心管放入温度设置为95℃的水浴锅蒸发溶液至近干;⑤离心管冷却后加入10mL去离子水或超纯水;⑥离心管封口,放入温度设置为25℃的摇床振荡提取5-16小时,再利用离心机在4000-5000rpm条件下离心10-20分钟;⑨用0.22μm过滤头以及10mL注射器抽取并过滤离心管中的8mL上清液,加入25mL容量瓶中,加入硝酸,稀释定容至25mL待测;⑩洗涤残渣;
5)残渣态(F4)重金属样品的提取,具体操作包括:①并往上一步存放残渣的离心管中依次中加入3.25mL浓盐酸、1.25mL浓硝酸,在离心管中完成王水的配置;②将离心管放入温度设置为95℃的水浴锅中水浴消解2小时;③离心管开盖,在95℃条件下将王水蒸发至近干(赶酸);④往离心管中加入10mL去离子水或超纯水;⑤离心管封口,放入温度设置为25℃的摇床振荡5-16小时,再利用离心机在4000-5000rpm条件下离心10-20分钟;⑥用0.22μm过滤头以及5mL或10mL注射器抽取并过滤离心管中的8mL上清液,加入25mL容量瓶中,再加入硝酸,稀释定容至25mL待测;
6)利用电感耦合等离子体发射光谱仪或电感耦合等离子体质谱仪或原子吸收光谱仪等分析仪器测定上述各步骤提取所得样品的重金属浓度;
其中洗涤残渣的具体步骤包括①往存放经过上一步提取的残渣的离心管中加入10mL去离子水或超纯水;②将离心管放入温度设置为25℃的摇床中振荡15分钟;④将离心管放入温度设置在80℃以上的水浴锅中水浴蒸至近干;⑤剩余残渣即可进入下一步提取。
上述提取步骤所用硝酸、盐酸应为分析纯、有机纯、光谱纯或更高纯度且重金属杂质更少的化学试剂。
步骤3,处理仪器所得原始浓度数据,具体操作如下:
1)计算PM2.5中重金属每一种赋存形态的浓度:据上述实验提取操作中各形态样品溶液的稀释倍数、溶液体积、剪取滤膜的面积以及滤膜的总面积、采样气体体积以及最终仪器测定的液态样品浓度换算出大气颗粒物中重金属各形态的浓度,计算公式为:C=C0RDVsolSΣ/(VgasS),式中C0表示仪器测得液态样品中重金属的浓度,RD表示稀释倍数,Vsol表示溶液体积,S表示滤膜总面积,Vgas表示采样气体体积,S表示剪取滤膜的面积。利用Python脚本及其第三方工具包(NumPy、SciPy、Pandas、TensorFlow、Keras等),计算上述公式。经过上述计算,大气颗粒物中所得各形态重金属Pb浓度结果如图1所示。
2)计算PM2.5中重金属的生物可利用形态的浓度:公式为Cbio=CF1+CF2+CF3,式中Cbio表示可利用形态重金属浓度,CF1、CF2、CF3表示F1态、F2态、F3态重金属的浓度,利用Python脚本完成上述公式的计算。
步骤4,数据预处理,结果如图2所示,具体操作如下:
1)缺失值填补——利用SciPy.interpolate插值工具包的三次样条分段多项式插值方法填充缺失值;
2)频率域滤波的真实值统计估计——具体实施方案为①利用NumPy.fft快速傅立叶变换方法将PM2.5中生物可利用形态重金属日均浓度测量值序列变换到频率域空间;②逐频率预先删除某个频率分量并计算该序列删除某频率分量前后1阶、二阶甚至更高阶数的自相关系数,如果提高则删除该频率分量,否则恢复该频率风量;③重复步骤②直到没有频率分量被删除为止;④对经过上述步骤①②③所得频率域序列做快速傅里叶逆变换,即得到对PM2.5中生物可利用形态重金属浓度真实值的估计值。或可利用小波变换减少误差并去除以及一部分无规律随机变化干扰,从而得到经过校正的PM2.5中生物可利用形态重金属的浓度时间序列。
3)将上述步骤2)所得真实值统计估计的PM2.5中重金属生物可利用形态日均浓度值序列做归一化处理,本发明选用的具体计算公式为
Figure BDA0002495423300000071
式中Cbio表示生物可利用形态重金属浓度,Cnorm表示生物可利用形态重金属浓度归一化结果值,min与max函数分别表示求取Cbio序列最小、最大值的函数,归一化处理的计算公式亦有其他形式。
步骤5,利用长短期记忆神经网络学习、分析、提取某种重金属元素浓度变化趋势,具体操作如下所示:
1)利用主流的深度学习框架(包括TensorFlow、PyTorch等底层深度学习框架以及Keras等深度学习框架高级API)并确定神经网络的初始参数——①本发明采用TensorFlow+Keras组合的深度学习框架来构建包含输入层、输出层以及隐含层的长短期记忆神经网络(LSTM-NN),本发明采用LSMT-NN的结构示意图如图3所示,隐含层仅包含1层LSTM层,并确定每一层的激活函数——输入层以及LSTM层主体采用tanh激活函数、LSTM层循环体采用sigmoid激活函数、输出层采用线性激活函数;②由Keras框架自动完成神经网络的连接权重以及偏置参数的初始化,由经验确定神经网络的训练参数,包括初始化学习率0.04、学习率衰减系数0.998,最大训练步长3000、终止训练最大忍受步长800、学习率衰减最大忍受步长100、损失函数mse(均方根)、训练优化算法Adam随机梯度优化算法;③神经网络的超参数,即输入层、输出层的神经元个数由经验确定,本发明采用5和1分别作为输入层、输出层神经元的个数,表示用前5天PM2.5中重金属生物可利用形态浓度作为输入,第6天的浓度作为输出,而LSTM层主体神经元个数需利用验证数据集来筛选,初始个数在5到15之间,总计11组LSMT层主体神经元个数参数,同时为了避免过拟合的现象本发明具体采用L1正则项、L2正则项以及Dropout方法,具体参数分别为0.0012、0.012、0.24;
2)训练、并筛选出满足条件的神经网络——①对每一组LSTM层神经元个数参数,分别构建8到10个神经网络,从步骤4所得PM2.5中重金属生物可利用形态浓度数据随机选取一部分数据作为神经网络的训练数据、剩余数据作为验证数据集来训练并验证这些神经网络,每一个神经网络经过训练均得到其最佳的神经网络连接权重以及偏置参数,并将学习到的变化趋势信息保存于神经网络中各神经元的连键权重以及偏置当中;②利用训练数据集以及验证数据集估计这些神经网络的输出值与真实值的相关系数,并筛选出训练数据集以及验证数据集上相关系数都比较高的神经网络。结果如图4所示。
步骤6,PM2.5中生物可利用形态重金属日均浓度时间序列预测,并计算暴露剂量以及致癌风险与非致癌风险,结果如表1和表2所示,具体操作如下:
1)利用步骤5中经过训练、能够充分反映变化趋势的长短期记忆神经网络,以及步骤4所得的PM2.5中生物可利用形态重金属到的日均浓度数据,向后预测未来一定天数内每一天的PM2.5中生物可利用形态重金属日均浓度;
2)以包括未来一定天数在内的所有PM2.5中生物可利用形态重金属日均浓度的平均值或其浓度最后的趋势稳定值,作为健康风险评价模型中的30年或70年PM2.5中重金属日均浓度平均值的估计值;
3)将当地人群分为未成年人、成年女性、成年男性三类人群,分别从①中美两国环保部对人群相关生理参数推荐值以及②前人研究结论中各重金属元素参考剂量以及致癌斜率因子参数的取值中确定背景技术方案中相关人群生理参数以及参考剂量、致癌斜率因子,从而计算出PM2.5中各重金属元素的暴露剂量以及致癌风险值与非致癌风险值。
表1
Figure BDA0002495423300000081
表2
Figure BDA0002495423300000082
步骤7,将步骤6中计算所得致癌风险值与非致癌风险值与背景技术方案体积的对应风险临界值相比,从而给出PM2.5中各重金属元素的致癌风险与非致癌风险定性评价结论。
由此得到如下结论:
非致癌风险,Mn风险最高,且有缓慢上升的趋势;Cd、Cr风险较高……
致癌风险,风险最高的是Cr,其次As、Cd致癌风险较低……
上述实施例的作用在于具体介绍本发明的实质性内容,但本领域技术人员应当知道,不应将本发明的保护范围局限于该具体实施例。

Claims (5)

1.一种基于LSTM-NN时序预测的PM2.5中重金属健康风险评价方法,其特征在于,包括以下步骤:
步骤1,PM2.5石英滤膜样品的获取:在现有的大气PM2.5采样监测站点获取一定数量的承载有PM2.5的石英滤膜样品,并记录采样时间等相关采样信息,样品送实验室保存、待测;
步骤2,提取各形态重金属并测定其浓度:根据形态划分方法及其所用化学试剂,分别提取、稀释、定容每种重金属元素4种赋存形态,即水溶态、可还原态、可氧化态、残渣态的液态样品;利用电感耦合等离子体发射光谱仪或电感耦合等离子体质谱仪等痕量化学元素分析仪器测定液态样品中重金属元素每一种赋存形态的浓度;
步骤3,处理仪器所得原始浓度数据:1)计算PM2.5中重金属每一种赋存形态的浓度;2)认定水溶态、可还原态、可氧化态三种形态为生物可利用形态,并计算PM2.5中重金属的生物可利用形态的浓度;
步骤4,数据预处理,填充PM2.5中生物可利用形态重金属日均浓度组成的时间序列存在缺失值以及估计其真实值,并将数据归一化:分别利用1)插值方法填充缺失值;2)利用频率域滤波的方法估计测量值的真实值,减少误差以及一部分无规律随机变化干扰,得到经过真实值统计估计的PM2.5中生物可利用形态重金属的浓度时间序列;3)将该序列数据做归一化处理;
步骤5,利用长短期记忆神经网络学习、分析、提取PM2.5中生物可利用形态重金属浓度时间序列变化趋势:1)利用主流的深度学习框架,构建包含输入层、输出层以及隐含层的长短期记忆神经网络(LSTM-NN)并确定其初始参数以及训练参数;2)以前一定天数的的PM2.5中生物可利用形态重金属日均浓度序列作为该长短期记忆神经网络的输入,后几天的重金属日均浓度作为输出,训练、筛选出能够反应浓度变化趋势的神经网络;
步骤6,PM2.5中生物可利用形态重金属日均浓度时间序列预测,并计算暴露剂量以及致癌风险与非致癌风险:1)利用步骤5中经过训练、能够充分反映变化趋势的长短期记忆神经网络,以及步骤4所得的PM2.5中生物可利用形态重金属到的日均浓度数据,向后预测未来一定天数内每一天的PM2.5中生物可利用形态重金属日均浓度;2)确定健康风险评价模型中的30年或70年PM2.5中重金属日均浓度平均值的估计值;3)计算PM2.5中各重金属元素的暴露剂量以及致癌风险值与非致癌风险值;
步骤7,给出PM2.5中各重金属元素的致癌风险与非致癌风险定性评价结论。
2.根据要求1所述的基于LSTM-NN时序预测的PM2.5中重金属健康风险评价方法,其特征在于:步骤2在提取各形态重金属并测定其浓度前,将PM2.5石英滤膜样品裁剪成2cm2的大小。
3.根据权利要求1所述的基于LSTM-NN时序预测的PM2.5中重金属健康风险评价方法,其特征在于:步骤3中计算PM2.5中重金属每一种赋存形态的浓度公式为:C=C0RDVsolSΣ/(VgasS),式中C0表示仪器测得液态样品中重金属的浓度,RD表示稀释倍数,Vsol表示溶液体积,S表示滤膜总面积,Vgas表示采样气体体积,S表示剪取滤膜的面积。
4.根据权利要求1所述的基于LSTM-NN时序预测的PM2.5中重金属健康风险评价方法,其特征在于:步骤3中计算PM2.5中重金属的生物可利用形态的浓度公式为:Cbio=CF1+CF2+CF3,式中Cbio表示可利用形态重金属浓度,CF1、CF2、CF3表示F1态、F2态、F3态重金属的浓度。
5.根据权利要求1所述的基于LSTM-NN时序预测的PM2.5中重金属健康风险评价方法,其特征在于:步骤4中,归一化处理选用的具体计算公式为:
Figure FDA0002495423290000021
式中Cbio表示生物可利用形态重金属浓度,Cnorm表示生物可利用形态重金属浓度归一化结果值,min与max函数分别表示求取Cbio序列最小、最大值的函数。
CN202010417099.0A 2020-05-18 2020-05-18 一种基于lstm-nn时序预测的pm2.5中重金属健康风险评价方法 Active CN111380787B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010417099.0A CN111380787B (zh) 2020-05-18 2020-05-18 一种基于lstm-nn时序预测的pm2.5中重金属健康风险评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010417099.0A CN111380787B (zh) 2020-05-18 2020-05-18 一种基于lstm-nn时序预测的pm2.5中重金属健康风险评价方法

Publications (2)

Publication Number Publication Date
CN111380787A true CN111380787A (zh) 2020-07-07
CN111380787B CN111380787B (zh) 2022-04-01

Family

ID=71217738

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010417099.0A Active CN111380787B (zh) 2020-05-18 2020-05-18 一种基于lstm-nn时序预测的pm2.5中重金属健康风险评价方法

Country Status (1)

Country Link
CN (1) CN111380787B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112029813A (zh) * 2020-08-26 2020-12-04 四川大学 一种评价城市垃圾焚烧飞灰浸出毒性的方法
CN112649337A (zh) * 2020-12-21 2021-04-13 张家口市杰星电子科技有限公司 一种油烟在线监控方法及装置
CN116870639A (zh) * 2023-08-25 2023-10-13 湖北鼎信成套设备有限公司 多级酸雾净化系统及其方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880800A (zh) * 2012-09-25 2013-01-16 常州大学 基于健康风险的区域土壤环境优先控制污染物筛选方法
US20140188495A1 (en) * 2012-12-30 2014-07-03 Nanjing University Method for assessing and managing health risks associated with heavy metal pollution
CN107300550A (zh) * 2017-06-21 2017-10-27 南京大学 一种基于bp神经网络模型预测大气重金属浓度的方法
CN107832579A (zh) * 2017-11-08 2018-03-23 中科宇图科技股份有限公司 一种参数本地化的水环境健康经济损害评价方法及系统
KR20210075593A (ko) * 2019-12-13 2021-06-23 서울대학교산학협력단 토양의 중금속 이온의 생태독성학적 환경허용농도를 결정하는 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880800A (zh) * 2012-09-25 2013-01-16 常州大学 基于健康风险的区域土壤环境优先控制污染物筛选方法
US20140188495A1 (en) * 2012-12-30 2014-07-03 Nanjing University Method for assessing and managing health risks associated with heavy metal pollution
CN107300550A (zh) * 2017-06-21 2017-10-27 南京大学 一种基于bp神经网络模型预测大气重金属浓度的方法
CN107832579A (zh) * 2017-11-08 2018-03-23 中科宇图科技股份有限公司 一种参数本地化的水环境健康经济损害评价方法及系统
KR20210075593A (ko) * 2019-12-13 2021-06-23 서울대학교산학협력단 토양의 중금속 이온의 생태독성학적 환경허용농도를 결정하는 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112029813A (zh) * 2020-08-26 2020-12-04 四川大学 一种评价城市垃圾焚烧飞灰浸出毒性的方法
CN112649337A (zh) * 2020-12-21 2021-04-13 张家口市杰星电子科技有限公司 一种油烟在线监控方法及装置
CN116870639A (zh) * 2023-08-25 2023-10-13 湖北鼎信成套设备有限公司 多级酸雾净化系统及其方法
CN116870639B (zh) * 2023-08-25 2024-05-24 湖北鼎信成套设备有限公司 多级酸雾净化系统及其方法

Also Published As

Publication number Publication date
CN111380787B (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
CN111380787B (zh) 一种基于lstm-nn时序预测的pm2.5中重金属健康风险评价方法
Kos et al. Evaluation of discrepancy between measured and modelled oxidized mercury species
Molinara et al. An end to end indoor air monitoring system based on machine learning and sensiplus platform
Chen et al. Size-resolved exposure risk of persistent free radicals (PFRs) in atmospheric aerosols and their potential sources
Grange et al. Linking Switzerland's PM 10 and PM 2.5 oxidative potential (OP) with emission sources
CN103389323B (zh) 一种快速无损评定名贵药材年限的方法
Li et al. Heavy metals in submicronic particulate matter (PM1) from a Chinese metropolitan city predicted by machine learning models
Hodzic et al. Response of surface ozone over the continental United States to UV radiation declines from the expected recovery of stratospheric ozone
Salazar-Rojas et al. Comparison between machine linear regression (MLR) and support vector machine (SVM) as model generators for heavy metal assessment captured in biomonitors and road dust
Matavulj et al. Integration of reference data from different Rapid-E devices supports automatic pollen detection in more locations
Obunadike et al. Application of Regularized Logistic Regression and Artificial Neural Network model for Ozone Classification across El Paso County, Texas, United States
CN111929285A (zh) 一种激光诱导荧光红酒掺杂酒精的光谱识别方法
CN110823966A (zh) 一种基于电子鼻的葡萄酒so2浓度的快速测定方法
Reshma Analysis and prediction of air quality
CN108051428B (zh) 一种水质测试方法、装置、在线毒性监测仪
Wonaschuetz et al. Collection of soot particles into aqueous suspension using a particle-into-liquid sampler
CN106770477A (zh) 一种优化传感数据及模式识别对蜜源鉴别及掺假快检方法
Chaudhari et al. Predicting Mumbai's Air Quality Index by Machine Learning
Iyer et al. Analysis and prediction of air quality index in India during Pre and Post COVID pandemic using machine learning algorithms
Khalil et al. Atmospheric carbontetrafluoride (CF4): Sources and trends
Wang et al. A Research of Neural Network Optimization Technology for Apple Freshness Recognition Based on Gas Sensor Array
Dinu et al. Advanced analytical methods for mercury determination in slightly contaminated water samples
Saravanan et al. Improving air pollution detection accuracy and status monitoring based‎ on supervised learning systems and Internet of Things
Ma et al. Seasonal variations in photooxidant formation and light absorption in aqueous extracts of ambient particles
CN111735782A (zh) 一种测定大气沉降重金属在沉积物中的转移的系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant