CN116297375A - 一种气溶胶有机物化学特性和粒径分布的检测方法 - Google Patents
一种气溶胶有机物化学特性和粒径分布的检测方法 Download PDFInfo
- Publication number
- CN116297375A CN116297375A CN202310428522.0A CN202310428522A CN116297375A CN 116297375 A CN116297375 A CN 116297375A CN 202310428522 A CN202310428522 A CN 202310428522A CN 116297375 A CN116297375 A CN 116297375A
- Authority
- CN
- China
- Prior art keywords
- particle size
- aerosol
- chemical characteristics
- size distribution
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002245 particle Substances 0.000 title claims abstract description 109
- 239000000443 aerosol Substances 0.000 title claims abstract description 54
- 239000000126 substance Substances 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 title claims description 21
- 210000002345 respiratory system Anatomy 0.000 claims abstract description 24
- 238000004088 simulation Methods 0.000 claims abstract description 21
- 230000008021 deposition Effects 0.000 claims abstract description 19
- 238000003064 k means clustering Methods 0.000 claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims abstract description 15
- 238000003066 decision tree Methods 0.000 claims abstract description 13
- 238000002189 fluorescence spectrum Methods 0.000 claims abstract description 13
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 238000013507 mapping Methods 0.000 claims abstract description 9
- 239000013618 particulate matter Substances 0.000 claims abstract description 7
- 150000002894 organic compounds Chemical class 0.000 claims description 7
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000002790 cross-validation Methods 0.000 claims description 4
- 230000005284 excitation Effects 0.000 claims description 4
- AKYHKWQPZHDOBW-UHFFFAOYSA-N (5-ethenyl-1-azabicyclo[2.2.2]octan-7-yl)-(6-methoxyquinolin-4-yl)methanol Chemical compound OS(O)(=O)=O.C1C(C(C2)C=C)CCN2C1C(O)C1=CC=NC2=CC=C(OC)C=C21 AKYHKWQPZHDOBW-UHFFFAOYSA-N 0.000 claims description 3
- 239000001576 FEMA 2977 Substances 0.000 claims description 3
- LOUPRKONTZGTKE-UHFFFAOYSA-N cinchonine Natural products C1C(C(C2)C=C)CCN2C1C(O)C1=CC=NC2=CC=C(OC)C=C21 LOUPRKONTZGTKE-UHFFFAOYSA-N 0.000 claims description 3
- 229960003110 quinine sulfate Drugs 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 4
- 230000007613 environmental effect Effects 0.000 abstract description 4
- 238000012544 monitoring process Methods 0.000 abstract description 3
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 31
- 238000000295 emission spectrum Methods 0.000 description 18
- 210000002569 neuron Anatomy 0.000 description 16
- 238000005070 sampling Methods 0.000 description 13
- 239000012528 membrane Substances 0.000 description 12
- 230000008569 process Effects 0.000 description 6
- 239000011362 coarse particle Substances 0.000 description 5
- 239000010419 fine particle Substances 0.000 description 5
- 230000036541 health Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 239000008277 atmospheric particulate matter Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000005416 organic matter Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000012800 visualization Methods 0.000 description 4
- 238000003915 air pollution Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 229910001385 heavy metal Inorganic materials 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 239000012496 blank sample Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000000556 factor analysis Methods 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 231100000614 poison Toxicity 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 239000003440 toxic substance Substances 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 239000013566 allergen Substances 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000010668 complexation reaction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000002284 excitation--emission spectrum Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000003365 glass fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 244000000010 microbial pathogen Species 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000006068 polycondensation reaction Methods 0.000 description 1
- 125000005575 polycyclic aromatic hydrocarbon group Chemical group 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 210000003456 pulmonary alveoli Anatomy 0.000 description 1
- 239000010453 quartz Substances 0.000 description 1
- 239000003642 reactive oxygen metabolite Substances 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012306 spectroscopic technique Methods 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
- 238000002137 ultrasound extraction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/02—Investigating particle size or size distribution
- G01N15/0205—Investigating particle size or size distribution by optical means
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6428—Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6428—Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
- G01N21/643—Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" non-biological material
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/80—Data visualisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Immunology (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Pathology (AREA)
- Artificial Intelligence (AREA)
- Biochemistry (AREA)
- Evolutionary Computation (AREA)
- Analytical Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Software Systems (AREA)
- Optics & Photonics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Engineering & Computer Science (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Dispersion Chemistry (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
一种气溶胶有机物化学特性和粒径分布的检测方法,属于环境监测技术和数据分析领域,具体包括以下步骤:步骤一、使用粒径分级颗粒物采集器采集大气颗粒物,利用荧光分光光度计获取粒径分级的大气颗粒物的三维荧光光谱;步骤二、对三维荧光光谱数据集进行PARAFAC分析,将三维荧光光谱数据集分解为若干个最优组分,并获得各组分的荧光强度值;步骤三、将各组分荧光强度值作为SOM模拟的输入数据,模拟得到统一距离矩阵、样本映射分布、组分平面和k‑means聚类;步骤四、根据粒径分级的大气颗粒物SOM的k‑means聚类结果将样本分为若干组进行决策树分析,建立气溶胶粒径范围和人体呼吸道沉积位置的预测模型。
Description
技术领域
本发明属于环境监测技术和数据分析领域,具体涉及一种气溶胶有机物化学特性和粒径分布的检测方法。
背景技术
气溶胶中有机物由于对气候、生物地球化学循环和人体健康的潜在影响而被广泛关注,例如,其可吸收太阳辐射导致辐射收支失衡、与重金属络合影响重金属迁移转化过程、产生活性氧影响细胞氧化还原平衡从而导致心血管和呼吸道疾病。然而,由于组成复杂,阐明气溶胶中有机物的化学特性、来源和转化过程仍存在挑战。作为一种高效的光谱技术,三维荧光光谱可为复杂体系提供高分辨率信息,近年来被应用于气溶胶特性研究领域,在表征大气颗粒物中有机物的物质组成、化学特性、潜在来源、大气化学反应机制方面展现出优势。鉴于三维荧光光谱提供的数据丰富且复杂,利用气溶胶领域现有的研究方法例如区域积分、平行因子分析、荧光指数所获得的分析结果显示不同样本间荧光强度差异不显著,荧光指数数值变化不明显,难以准确识别不同季节、来源以及大气化学过程中荧光团特性的差异,限制了EEM在识别气溶胶化学性质方面的应用,EEM数据在气溶胶领域仍具有较大的开发潜力,EEM数据的深度挖掘以及荧光团化学特性的可视化问题亟待解决。
获得准确的气溶胶粒径分布特征可为解析气溶胶污染源、探究气溶胶环境行为、评估呼吸系统暴露健康风险水平提供科学依据。根据粒径大小在人体呼吸系统的沉积部位,通常把大气颗粒物划分为三类,分别为沉积在头部气道(HA,>4.7μm)、气管支气管(TB,1.1-4.7μm)和肺泡(AR,<1.1μm)区域的大气颗粒物。其中,粒径小于2.5μm的细颗粒物在大气中停留时间长,具有大的比表面积,可载带更多的有毒物质,对人体危害程度较高。附着在大气颗粒物上的有毒物质例如多环芳烃、重金属、病原微生物和过敏原等作用于人体呼吸系统进而导致潜在的人体健康风险。开发快捷而有效的识别大气颗粒物粒径分布的方法对解译大气污染成因和识别气溶胶在人体呼吸道沉积位置进而评估人体健康风险水平具有重要意义。
发明内容
针对目前气溶胶研究领域中EEM数据获取繁琐和EEM数据应用与信息提取不充分而导致的无法准确反映气溶胶有机物化学特性和粒径分布的问题,本发明提供一种气溶胶有机物化学特性和粒径分布的检测方法。
为了实现上述目的,本发明采取以下技术方案:
一种气溶胶有机物化学特性和粒径分布的检测方法,包括以下步骤:
步骤一、使用粒径分级颗粒物采集器采集大气颗粒物,利用荧光分光光度计获取粒径分级的大气颗粒物的三维荧光光谱;
步骤二、对三维荧光光谱数据集进行PARAFAC分析,将三维荧光光谱数据集分解为若干个最优组分,并获得各组分的荧光强度值;
步骤三、将各组分荧光强度值作为SOM模拟的输入数据,模拟得到统一距离矩阵、样本映射分布、组分平面和k-means聚类,对荧光团化学特性和样本之间荧光团差异进行可视化;
步骤四、根据粒径分级的大气颗粒物SOM的k-means聚类结果将样本分为若干组进行决策树分析,每组中荧光组分比值作为自变量,颗粒物粒径范围即颗粒物在人体呼吸道的沉积位置为因变量,建立气溶胶粒径范围和人体呼吸道沉积位置的预测模型。
步骤五、基于建立的气溶胶粒径范围和人体呼吸道沉积位置的预测模型来预测非粒径分级颗粒物样本的气溶胶粒径分布和人体呼吸道沉积位置。
进一步的,步骤一中,荧光分光光度计设置的参数为激发波长范围220-450nm,发射波长范围250-550nm,扫描速度2000nm/min。
进一步的,步骤二中,各组分的最大荧光强度值用硫酸奎宁校正。
进一步的,步骤三中,对SOM模拟的输入数据进行标准化处理。
进一步的,步骤四中,对建立的预测模型进行交叉验证。
进一步的,步骤四中,交叉验证样本数量为建立预测模型样本数的10%。
与现有技术相比,本发明的有益效果是:
针对目前气溶胶研究领域中EEM数据获取繁琐以及EEM数据的应用和信息提取不充分而导致的无法准确反映气溶胶有机物化学特性和粒径分布的问题,本发明对环境大气颗粒物EEM检测分析,联合PARAFAC、SOM和决策树模拟对EEM数据进行数据挖掘,演示了不同样本间荧光团特性差异的可视化过程,在无需其他监测仪器条件下即可实现气溶胶化学特性、粒径分布和人体呼吸道沉积位置信息的快速获取,同时该方法避免了滤膜样本预处理过程和化学试剂的使用,操作方法简单、快捷、经济,具有推广价值。本发明对气溶胶物理化学特性、人体健康风险的综合探究以及EEM在气溶胶研究领域的应用起到了推进作用。
附图说明
图1是气溶胶有机物化学特性和粒径分布检测方法流程图;
图2是PARAFAC分析得到的荧光组分图;
图3是基于PARAFAC组分的SOM模拟可视化结果,包括U-matrix(a),Hit图(b),样本映射分布(c),k-means聚类(d)和组分平面(e);图a中神经元用圆点进行标记;图b表示各神经元中样本数量;图c中数字表示样本编号,1-180为按采样时间排列的20组粒径分级颗粒物样本,其中数字1-9代表第一个采样日的日间样本组,数字10-18代表第一个采样日的夜间样本组,数字19-27代表第二个采样日的日间样本组,以此类推进行排列;每组样品按颗粒物粒径从大到小排序,即9.0-10μm、5.8-9.0μm、4.7-5.8μm、3.3-4.7μm、2.1-3.3μm、1.1-2.1μm、0.65-1.1μm、0.43-0.65μm和<0.43μm;每个神经元按照从上到下,从左到右的顺序编号,例如,神经元1包含样本126、153和162,神经元2无样本,神经元18包含样本132、133和134,神经元19包含样本1、27、36和108;
图4是基于PARAFAC组分的所有样本的决策树结构;
图5是k-means聚类后聚类Ⅰ(a)和聚类Ⅱ(b)样本决策树结构。
具体实施方式
下面将结合附图和实施例,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明获取气溶胶激发发射光谱(EEM)数据集并对EEM数据进行数据挖掘探究气溶胶有机物化学特性,并实现大气颗粒物粒径分布和呼吸系统沉积位置信息的快速获取。首先,测试气溶胶的EEM数据;其次,平行因子分析(PARAFAC)模拟EEM数据获得最优荧光组分,利用自组织映射(SOM)模拟解译大气颗粒物有机物化学特性;再次,基于粒径分级颗粒物样本的SOM模拟的k-means聚类结果对样本进行分组,以荧光组分比值为自变量,颗粒物粒径范围为因变量,利用决策树工具建立气溶胶在人体呼吸系统沉积位置的预测模型;最后,根据已建立的模型对非粒径分级颗粒物样本进行粒径大小预测。本发明为揭示气溶胶环境归趋和评估人体呼吸系统暴露风险提供科学依据。
具体方案如下:
一种气溶胶有机物化学特性和粒径分布的检测方法,如图1所示,此方法包括以下步骤:
步骤一、气溶胶样品采集和三维荧光光谱测试:为排除不同大气环境中气溶胶荧光团的时空分布特征和环境行为的差异,以不同城市的空间分布特征为依据选取采样地点,根据不同采样地点实际季节划分区间来确定采样时间,使用粒径分级颗粒物采集器采集大气颗粒物至滤膜上。滤膜被固定在荧光分光光度计的固体测试台上,因此可直接测试滤膜上采集的大气颗粒物的三维荧光光谱;
步骤二、PARAFAC模拟:为避免不同地区和季节样本数据集PARAFAC分析差异,对来自不同采样点和季节的样本EEM数据集分别进行PARAFAC分析,将EEM分解为若干个最优组分,并获得各组分荧光强度值;
步骤三、SOM模拟:将各组分荧光强度值作为SOM模拟的输入数据,模拟得到统一距离矩阵(U-matrix)、样本映射分布、组分平面和k-means聚类,对荧光团化学特性和样本之间荧光团差异进行可视化;
步骤四、基于粒径分级颗粒物样本EEM数据集建立气溶胶粒径分布预测模型:根据粒径分级颗粒物样本SOM的k-means聚类结果对样本进行分类,荧光组分比值作为自变量,颗粒物粒径范围即颗粒物在人体呼吸道的沉积位置为因变量进行决策树模拟和交叉验证,建立气溶胶粒径范围和人体呼吸道沉积位置的预测模型;
步骤五、非粒径分级颗粒物样本的气溶胶粒径分布和人体呼吸道沉积位置预测:基于步骤四建立的气溶胶粒径范围和人体呼吸道沉积位置的预测模型来预测非粒径分级颗粒物样本的气溶胶粒径分布和人体呼吸道沉积位置。
进一步的,步骤一中,气溶胶采集滤膜为玻璃纤维滤膜或石英滤膜,滤膜在使用之前被铝箔包裹,置于马弗炉中在450℃预先烘烤6-8h以去除污染物,烘烤过的滤膜在使用之前需置于干燥器中24-48h,干燥器条件为相对湿度30%-35%,温度19-25℃。荧光分光光度计设置参数为激发波长范围220-450nm,发射波长范围250-550nm,扫描速度2000nm/min;每批采样至少采集1个场地空白样本。
进一步的,步骤二中,执行PARAFAC需去除大部分的瑞利和拉曼散射并修正内滤波效应,各组分的最大荧光强度值用硫酸奎宁校正,模型在非负约束下进行,实际样本荧光强度应扣除场地空白样本的荧光强度,为保证模拟结果准确性每次模拟样本数不少于20;粒径分级颗粒物样本和非粒径分级颗粒物样本进行同一PARAFAC分析,以确保得到的荧光组分的一致性。
进一步的,步骤三SOM模拟中:将各组分荧光强度值作为SOM模拟的输入数据,数据标准化避免浓度效应,模拟得到统一距离矩阵(U-matrix)、样本映射分布、组分平面和k-means聚类,对荧光团化学特性和样本之间荧光团差异进行可视化。考虑到大气颗粒物中有机物组成的复杂性,荧光组分和荧光指数仅能部分描述荧光团特性,因此,本发明将适合于分析未知且复杂系统的SOM用于可视化大气颗粒物有机物的荧光团特性,SOM可以将EEM通过非线性变换映射到二维空间,具有高度的可视化特性。其中,PARAFAC得到的荧光组分强度作为SOM的输入数据,荧光强度进行标准化以减少浓度效应,模拟结果包括统一距离矩阵(U-matrix)、样本映射分布、组分平面和k-means聚类。其中,U-matrix用于表示样本荧光特性差异,某一神经元与相邻神经元之间的荧光差异用神经元本身的颜色代表,颜色对应欧氏距离的平均值,若神经元之间存在空神经元表示神经元之间荧光团特性差异较大,U-matrix中距离远的神经元之间通常具有大的荧光特性差异。样本映射分布对应样本在U-matrix中的位置。组分平面为每个荧光组分在样本中的分布情况,不同组分之间若具有相似的组分平面说明这些组分之间具有强的相关性。k-means聚类用于识别荧光特性的相似程度,通常在同一聚类中的样本具有相似的荧光团特性,用三种荧光指数(HIX、FI和BIX)验证各聚类间荧光特性差异,HIX、FI和BIX计算公式如下:
式中F为Ex=i,Em=j时的荧光强度;
HIX值的增加与溶解性有机物缩聚反应的增加有关,也用于代表溶解性有机物的腐殖化或芳香程度,老化过程也会导致HIX值增加。FI可用于确定溶解性有机物前体物来源,FI值为1.2和1.8分别表示陆源和微生物活动。BIX与溶解性有机物新鲜程度有关。
进一步的,步骤四中按照粒径分级颗粒物样本SOM的k-means聚类结果将样本分为若干组进行决策树分析,每组中将荧光组分比值作为自变量,并剔除分母为零的自变量,颗粒物粒径范围为因变量,基于不同粒径颗粒物进入人体呼吸系统位置的差异,粒径范围设置为头部气道(HA)(>4.7μm)、气管支气管(TB)(1.1-4.7μm)和肺泡区域(AR)(<1.1μm),交叉验证样本数量为建立预测模型样本数的10%。
实施例1
(1)于哈尔滨市一建筑楼顶进行大气颗粒物样本采集,采集地点为商业区和居民区混合。利用粒径分级颗粒物采集器采集粒径分级颗粒物样本,各级采集的颗粒物粒径范围为级0:9.0-10μm、级1:5.8-9.0μm、级2:4.7-5.8μm、级3:3.3-4.7μm、级4:2.1-3.3μm、级5:1.1-2.1μm、级6:0.65-1.1μm、级7:0.43-0.65μm和级F:<0.43μm。其中,人体呼吸时可沉积在HA的颗粒物粒径范围包括级0、级1和级2,可沉积在TB的颗粒物粒径范围包括级3、级4和级5,可沉积在AR的颗粒物粒径范围包括级6、级7和级F,此外,在本实施例中粒径≤2.1μm和2.1-10μm的颗粒物分别定义为细颗粒物和粗颗粒物。此实施例中连续采集颗粒物样本10天,每日采集2套样本,分别为日间和夜间样本,根据采样点冬季昼夜规律分配日间和夜间样本采样时长,日间采样时长为8h,夜间采样时长为15h,共获得20套粒径分级颗粒物样本,每套样本包含9张玻璃滤膜,共计180个样本。每次采样后用75%酒精消毒采样器,待酒精完全挥发后再进行采样器的组装和采样工作。超纯水超声提取滤膜上的水溶性物质用于三维荧光光谱测试,荧光分光光度计测试参数设置为激发波长范围220-450nm,发射波长范围250-550nm,扫描速度2000nm/min。
(2)利用PARAFAC处理样本的EEM数据,处理过程中未发现离群样本,如图2所示,得到了5个最优组分。
(3)考虑到大气颗粒物中水溶性有机物(WSOC)荧光特性的复杂性,执行SOM用于可视化大气颗粒物WSOC的荧光团特性。PARAFAC得到的荧光组分强度值作为SOM的输入数据,模拟结果包括U-matrix、样本映射分布、组分平面、k-means聚类。计算聚类Ⅰ和聚类Ⅱ中样本的三种荧光指数(HIX、FI和BIX)用于指示两聚类间WSOC的化学特性差异性,结果显示两聚类之间三种荧光指数均存在显著差异(t检验,p<0.05),证实了SOM在识别荧光团化学特性差异方面的有效性。聚类Ⅰ中FI(1.95)和BIX(1.08)值均显著高于聚类Ⅱ(FI:1.82,BIX:0.992),说明聚类Ⅱ中WSOC主要源于微生物活动,聚类Ⅰ中WSOC新鲜程度高于聚类Ⅱ。聚类Ⅱ(2.28)中HIX显著高于聚类Ⅰ(0.719),说明聚类Ⅱ中WSOC芳香性更强。
利用SOM探讨不同粒径颗粒物和大气污染过程中WSOC荧光团分布的差异,如图3所示,k-means聚类结果显示,荧光团分为2簇(簇Ⅰ和簇Ⅱ),簇Ⅰ全部由细颗粒物样本组成,簇Ⅱ主要由粗颗粒物样本组成,占比高于74%。在U-matrix中图例值从小到大的变化表明荧光性质差异增加,因此,细颗粒中WSOC荧光团之间的差异大于粗颗粒荧光团。此外,在聚类Ⅰ中我们观察到左下部分神经元间荧光差异更大,这些神经元中的样本均来自严重空气污染天气(平均AQI:215),鉴于聚类Ⅰ中均为细颗粒物样本,因此排除了颗粒物粒径大小的影响,说明空气污染过程增加了细颗粒物中WSOC荧光特性差异。
组分平面可以显示出各组分之间的相关性,从整体上看,5个组分平面的分布特征相似,均有荧光强度从上到下逐渐增大的趋势,说明各组分之间存在一定的相关性。C1和C3的组分平面值从右上到左下逐渐增大,说明C1和C3之间具有很强的相关性。对各组分荧光强度进行相关性分析,结果显示各组分荧光强度之间存在显著相关性,其中C1与C3的相关系数最大,证实了组分平面得出的结论。总之,PARAFAC-SOM是进一步探究有机气溶胶环境行为的有力工具,它可以很好地表征气溶胶溶解性有机物的荧光特性以及粒径和空气污染过程对荧光团的影响。
(4)本实例首先对全部样本的颗粒物粒径范围进行了决策树模拟,如图4所示,荧光组分比值为自变量,舍弃了分母为零的组分比值,颗粒物粒径范围为因变量,基于不同粒径颗粒物进入人体呼吸系统位置的差异,粒径范围设置为HA(>4.7μm)、TB(1.1-4.7μm)和AR(<1.1μm),选取样本数的10%进行交叉验证。结果显示HA、TB和AR预测准确性分别为91.7%、85.0%和95.0%。其次,针对决策树对TB预测准确率低的问题,我们基于SOM的k-means聚类结果将样本分为簇Ⅰ和簇Ⅱ两组,在此基础上基于两组中荧光组分比值利用决策树对颗粒物粒径范围进行预测。如图5所示,结果表明以粗颗粒物样本为主的簇Ⅰ在预测HA(88.3%)和TB(91.7%)颗粒物粒径大小时表现出高的准确率,以细颗粒物为主的簇Ⅱ在预测AR(100%)颗粒物粒径大小时表现出高的准确率,即在经过SOM的k-means聚类后进行决策树模拟能够明显提高大气颗粒物粒径大小预测的准确性,证实了本发明在预测颗粒物粒径大小方面的有效性。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (7)
1.一种气溶胶有机物化学特性和粒径分布的检测方法,其特征在于,包括以下步骤:
步骤一、使用粒径分级颗粒物采集器采集大气颗粒物,利用荧光分光光度计获取粒径分级的大气颗粒物的三维荧光光谱;
步骤二、对三维荧光光谱数据集进行PARAFAC分析,将三维荧光光谱数据集分解为若干个最优组分,并获得各组分的荧光强度值;
步骤三、将各组分荧光强度值作为SOM模拟的输入数据,模拟得到统一距离矩阵、样本映射分布、组分平面和k-means聚类,对荧光团化学特性和样本之间荧光团差异进行可视化;
步骤四、根据粒径分级的大气颗粒物SOM的k-means聚类结果将样本分为若干组进行决策树分析,每组中荧光组分比值作为自变量,颗粒物粒径范围即颗粒物在人体呼吸道的沉积位置为因变量,建立气溶胶粒径范围和人体呼吸道沉积位置的预测模型。
2.根据权利要求1所述的一种气溶胶有机物化学特性和粒径分布的检测方法,其特征在于:基于建立的气溶胶粒径范围和人体呼吸道沉积位置的预测模型来预测非粒径分级颗粒物样本的气溶胶粒径分布和人体呼吸道沉积位置。
3.根据权利要求1所述的一种气溶胶有机物化学特性和粒径分布的检测方法,其特征在于:步骤一中,荧光分光光度计设置的参数为激发波长范围220-450nm,发射波长范围250-550nm,扫描速度2000nm/min。
4.根据权利要求1所述的一种气溶胶有机物化学特性和粒径分布的检测方法,其特征在于:步骤二中,各组分的最大荧光强度值用硫酸奎宁校正。
5.根据权利要求1所述的一种气溶胶有机物化学特性和粒径分布的检测方法,其特征在于:步骤三中,对SOM模拟的输入数据进行标准化处理。
6.根据权利要求1所述的一种气溶胶有机物化学特性和粒径分布的检测方法,其特征在于:步骤四中,对建立的预测模型进行交叉验证。
7.根据权利要求6所述的一种气溶胶有机物化学特性和粒径分布的检测方法,其特征在于:步骤四中,交叉验证样本数量为建立预测模型样本数的10%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310428522.0A CN116297375A (zh) | 2023-04-20 | 2023-04-20 | 一种气溶胶有机物化学特性和粒径分布的检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310428522.0A CN116297375A (zh) | 2023-04-20 | 2023-04-20 | 一种气溶胶有机物化学特性和粒径分布的检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116297375A true CN116297375A (zh) | 2023-06-23 |
Family
ID=86790732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310428522.0A Pending CN116297375A (zh) | 2023-04-20 | 2023-04-20 | 一种气溶胶有机物化学特性和粒径分布的检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116297375A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117782916A (zh) * | 2024-02-28 | 2024-03-29 | 北京英视睿达科技股份有限公司 | 大气颗粒物浓度检测系统、方法、计算机设备及存储介质 |
-
2023
- 2023-04-20 CN CN202310428522.0A patent/CN116297375A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117782916A (zh) * | 2024-02-28 | 2024-03-29 | 北京英视睿达科技股份有限公司 | 大气颗粒物浓度检测系统、方法、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fröhlich-Nowoisky et al. | Bioaerosols in the Earth system: Climate, health, and ecosystem interactions | |
Li et al. | Forecasting of bioaerosol concentration by a Back Propagation neural network model | |
CN110489785B (zh) | 一种大气污染物在线源解析方法及系统 | |
Wu et al. | Urban aerosol size distributions: a global perspective | |
CN110082283B (zh) | 一种大气颗粒物sem图像识别方法及系统 | |
CN116297375A (zh) | 一种气溶胶有机物化学特性和粒径分布的检测方法 | |
CN108052486B (zh) | 基于颗粒物无机组分和有机标识物的精细化源解析方法 | |
CN113008806B (zh) | 一种农产品产地重金属空间分布确定方法 | |
CN111289486A (zh) | 一种利用溶解性有机物荧光特征定量测定点源污染和面源污染贡献率的方法 | |
Attanayaka et al. | Corticolous lichen diversity, a potential indicator for monitoring air pollution in tropics | |
CN104915563B (zh) | 基于金属定量构效关系的淡水慢性基准预测方法 | |
Yin et al. | Identification and classification of atmospheric particles based on SEM images using convolutional neural network with attention mechanism | |
CN101561395A (zh) | 一种浮游植物群落组成快速测定方法 | |
CN104568691A (zh) | 一种超细微粒数量排放因子的测试系统及方法 | |
Fattah et al. | Multi-sensor system and Internet of Things (IoT) technologies for air pollution monitoring | |
Malik et al. | Impact of economic capabilities and population agglomeration on PM 2.5 emission: empirical evidence from sub-Saharan African countries | |
CN115758270A (zh) | 基于随机森林与环境变量的土壤矿物结合态有机碳预测方法及装置 | |
CN115115940A (zh) | 一种蓝藻水华监测方法及该方法的监测预警系统 | |
CN113658640B (zh) | 一种淡水生态系统健康评价方法 | |
CN114252463A (zh) | 一种城市大气颗粒物来源解析方法 | |
CN102967557B (zh) | 基于近红外光谱的生物气溶胶含水量测定及其分类方法 | |
CN116930423A (zh) | 一种空气质量模型模拟效果的自动验证评估方法及系统 | |
CN114965300B (zh) | 基于光学水体类型和bp神经网络算法构建bp-turb的湖泊浊度制图方法 | |
CN114062478B (zh) | 一种可实现自验证的颗粒污染物来源解析的方法 | |
CN113555059B (zh) | 环境变化下有机碳和微生物耦合关系的定量方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |