CN116504327A - 近地面o3人群暴露的时空精细化分析评估方法及系统 - Google Patents
近地面o3人群暴露的时空精细化分析评估方法及系统 Download PDFInfo
- Publication number
- CN116504327A CN116504327A CN202211174562.9A CN202211174562A CN116504327A CN 116504327 A CN116504327 A CN 116504327A CN 202211174562 A CN202211174562 A CN 202211174562A CN 116504327 A CN116504327 A CN 116504327A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- time
- space
- exposure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 83
- 238000011156 evaluation Methods 0.000 title claims abstract description 50
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 claims abstract description 105
- 238000000034 method Methods 0.000 claims abstract description 77
- 238000009826 distribution Methods 0.000 claims abstract description 47
- 238000010801 machine learning Methods 0.000 claims abstract description 19
- 238000010276 construction Methods 0.000 claims abstract description 15
- 238000013210 evaluation model Methods 0.000 claims abstract description 8
- 230000007774 longterm Effects 0.000 claims abstract description 8
- 230000001502 supplementing effect Effects 0.000 claims abstract description 5
- 238000004088 simulation Methods 0.000 claims description 75
- 238000012795 verification Methods 0.000 claims description 60
- 238000012544 monitoring process Methods 0.000 claims description 48
- 230000008569 process Effects 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 30
- 238000012360 testing method Methods 0.000 claims description 29
- 239000000047 product Substances 0.000 claims description 26
- 238000007637 random forest analysis Methods 0.000 claims description 24
- 238000011160 research Methods 0.000 claims description 20
- 230000015572 biosynthetic process Effects 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 18
- 239000003570 air Substances 0.000 claims description 17
- 238000012952 Resampling Methods 0.000 claims description 15
- 239000012080 ambient air Substances 0.000 claims description 13
- 239000000126 substance Substances 0.000 claims description 11
- 230000005855 radiation Effects 0.000 claims description 10
- 238000005520 cutting process Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 101100074187 Caenorhabditis elegans lag-1 gene Proteins 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013213 extrapolation Methods 0.000 claims description 7
- 230000007246 mechanism Effects 0.000 claims description 7
- 101100510615 Caenorhabditis elegans lag-2 gene Proteins 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000007613 environmental effect Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000013499 data model Methods 0.000 claims description 4
- 238000010200 validation analysis Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 3
- 230000008021 deposition Effects 0.000 claims description 3
- 239000006185 dispersion Substances 0.000 claims description 3
- 238000001704 evaporation Methods 0.000 claims description 3
- 230000008020 evaporation Effects 0.000 claims description 3
- 230000004907 flux Effects 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 229910044991 metal oxide Inorganic materials 0.000 claims description 3
- 150000004706 metal oxides Chemical class 0.000 claims description 3
- 238000001556 precipitation Methods 0.000 claims description 3
- 238000002310 reflectometry Methods 0.000 claims description 3
- 239000004065 semiconductor Substances 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 3
- 208000028523 Hereditary Complement Deficiency disease Diseases 0.000 claims description 2
- 201000002388 complement deficiency Diseases 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 claims 1
- 238000012502 risk assessment Methods 0.000 abstract description 6
- 206010072082 Environmental exposure Diseases 0.000 abstract description 2
- 238000007670 refining Methods 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 14
- 238000003915 air pollution Methods 0.000 description 8
- 239000003344 environmental pollutant Substances 0.000 description 8
- 231100000719 pollutant Toxicity 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 239000000809 air pollutant Substances 0.000 description 5
- 231100001243 air pollutant Toxicity 0.000 description 5
- 208000006673 asthma Diseases 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 210000002345 respiratory system Anatomy 0.000 description 4
- 230000001932 seasonal effect Effects 0.000 description 4
- 208000024172 Cardiovascular disease Diseases 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000004199 lung function Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- MWUXSHHQAYIFBG-UHFFFAOYSA-N nitrogen oxide Inorganic materials O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 description 3
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 231100000727 exposure assessment Toxicity 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 230000029058 respiratory gaseous exchange Effects 0.000 description 2
- 208000023504 respiratory system disease Diseases 0.000 description 2
- 239000005437 stratosphere Substances 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 206010008190 Cerebrovascular accident Diseases 0.000 description 1
- 206010008469 Chest discomfort Diseases 0.000 description 1
- 208000014085 Chronic respiratory disease Diseases 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 206010043521 Throat irritation Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 239000013566 allergen Substances 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 230000006793 arrhythmia Effects 0.000 description 1
- 206010003119 arrhythmia Diseases 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 208000037976 chronic inflammation Diseases 0.000 description 1
- 230000006020 chronic inflammation Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000010252 digital analysis Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000008821 health effect Effects 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000007794 irritation Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002850 nasal mucosa Anatomy 0.000 description 1
- 230000009965 odorless effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 238000002640 oxygen therapy Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000006552 photochemical reaction Methods 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000012855 volatile organic compound Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于环境暴露风险分析技术领域,公开了一种近地面O3人群暴露的时空精细化分析评估方法及系统,该方法包括如下步骤:S1:构建区域环境近地面O3人群暴露的时空精细化分析评估模型;S2:获取多区域、长周期的O3时空精细化全范围覆盖信息,汇总已有浓度数据并补齐缺失的历史浓度数据;S3:将O3时空精细化全范围覆盖信息代入模型公式,计算各区域内近地面臭氧时间变化趋势与空间分布特征,得到汇总的大区域内总的人口加权O3暴露值。本发明通过基于多维数据、多模型、多参数和机器学习的方法补齐历史缺失数据,可支持大区域、长期高精度的时空变化趋势评估与分析,可为小区域、短期高精度的时空变化趋势预测提供预测基准依据。
Description
技术领域
本发明属于环境暴露风险分析技术领域,具体涉及一种近地面O3人群暴露的时空精细化分析评估方法。
背景技术
臭氧(Ozone),化学分子式为O3,在常温、常压下无色,低浓度下无味,但是在高浓度下会刺激鼻粘膜产生腥味,具有强氧化作用。大气层中超过90%的臭氧处于平流层内,剩余不到10%的臭氧处于对流层内。平流层的臭氧层能够吸收210~290nm波段的太阳紫外辐射,从而保护地球上的生命免受强紫外辐射的影响,但是当对流层臭氧特别是近地面臭氧超过本底水平时,会对人体健康产生显著影响。
现有研究成果表明,人群瞬时或长时间暴露于高浓度臭氧,会引发哮喘、呼吸道感染等呼吸系统疾病。臭氧能够刺激呼吸系统产生大量的发炎细胞激素,并引起有毒脂质氧化产物的积累,最终导致呼吸系统局部慢性炎症。当呼吸系统受到臭氧刺激时,可能会开始咳嗽,感觉喉咙发炎,和/或感到胸部不舒服。这些症状在接触臭氧后会持续几个小时,甚至会变得疼痛。当臭氧水平较高时,更多的哮喘患者会出现哮喘发作。发生这种情况的原因之一是臭氧使人们对过敏原更敏感,过敏原是哮喘发作的最常见诱因。臭氧还可以通过血液进入循环系统,造成中风、心律失常等心血管疾病,阻碍血液的输氧功能,造成组织缺氧。臭氧会降低肺功能,即降低深呼吸时吸入的空气量和吹出气的速度,使得难以像平时一样深呼吸和用力呼吸,此时开始感到呼吸不舒服。如果在户外锻炼和工作,可能会注意到比平时呼吸得更快、更浅。对于户外工作者、竞技运动员和其他在户外锻炼的人来说,肺功能下降更为严重。臭氧污染水平越高,对于患有心血管疾病和慢性呼吸疾病的患者来说,因心血管疾病和呼吸疾病的死亡风险越高。此外,哮喘患者受臭氧在呼吸系统中引起的肺功能下降和刺激的影响更为严重。
因此,对近地面环境空气中O3的监测及人群暴露的风险趋势分析、提前发出预警,就变得非常重要。但是,进行目前进行的环境空气O3人群暴露的风险分析评估过程,由于缺少历史监测数据,大多集中在短期(1-3年)的分析及研究,包括本发明人团队2016年发表的研究文献《北京市不同度量方式下臭氧短期暴露人群急性健康效应研究》([J].环境与健康杂志,2016,33(04):287-291.DOI:10.16241/j.cnki.1001-5914.2016.04.002.),以及其他研究学者2021年发表的研究文献《大气臭氧长期暴露对社区自然人群抑郁、焦虑和压力状况的影响》([J].医学新知,2021,31(01):5-13.),其研究周期均小于3年。同时,由于我国国土面积巨大,现有的研究对象及成果也多集中在北京、上海等超大型城市,其研究方法及成果针对性较强,无法应用于其他城市或者区域;此外,由于近地面环境空气O3的监测及人群暴露的风险趋势分析的专业程度很高,目前均为高级别的专业研究人员手工完成。而由于空气污染暴露风险评价需要采用空气质量监测站点的污染物浓度指标,同时也引入了气象数据、人口数据等进行多元化评估和分析,属于专业性极强的工作,只有高级别的专家,利用其专业能力和经验、人工分析才能进行,费时、费力,并且预测结果容易受到主观因素的影响,并且只能进行静态的定期分析,不能动态随时分析,时效性差,不能实现根据监测站、气象站等动态采集数据的变化进行动态预测预警;例如中国发明申请CN202010553734.8公开的一种空气污染暴露风险评价方法及系统,该方法包括:根据目标区域的遥感影像对居住用地进行分类,得到多个不同类别的居住用地;将目标区域的人口数据展布在居住用地上得到人口空间分布数据;选择关键地理变量,构建LUR模型;根据LUR模型对空气污染物模拟数据进行网格分布计算,获取目标区域中的空气污染物模拟数据;对人口空间分布数据和空气污染物分布数据进行数据叠加分析,得到空气污染暴露风险分区图。
目前,由于存在着大量技术困难和多方面的条件限制,我国尚未制定近地面环境空气O3的暖季标准限值。现有研究大都停留在O3浓度的时空模拟,或仅匹配研究对象个体暴露,或结合人口分布进行定性分析,未能结合大区域内人口分布,估算人口加权暴露和空间分布特征和不同类型人口的加权暴露情况。此外,现有的近地面环境空气O3人群暴露评估与分析,必须由本领域技术专家人工进行评估和分析,虽然也能够在其中的部分步骤或者环节引入特定的软件分析工具加以辅助,但是整体上仍然必要由专家团队分步骤、分工配合才能完成此项工作;由于在评估分析过程中,涉及大量的数据、分析模型和运算,现有的近地面环境空气O3人群暴露评估分析工作,往往被局限在短期、小区域(例如2-3年、某个特定的城市)的时空内,而且其能够纳入的相关性参数和数据也较少;此外,由于现有的近地面环境空气O3人群暴露评估与分析模型数据类型少、参数少、分析模型不合理,预测可靠性较低,不准确,也不能通过机器学习以不断提高结果的准确性,只能对特定的城市进行分析,不具有普适性,其算法、算力也无法支持中长期、大区域(省域、流域或全国)的近地面环境空气O3人群暴露评估与趋势预测分析,即高时空下、高精度的近地面环境空气O3人群暴露风险分析与评价,不能对近地面臭氧时间变化趋势与空间分布特征进行高精度、动态化分析,无法为我国制定近地面环境空气O3的暖季标准限值等提供数据和方法支持。
发明内容
为克服上述现有技术所存在的上述不足之处,本发明提供一种基于多维数据、多参数和机器学习的近地面O3人群暴露的时空精细化分析评估方法及系统,该方法及系统不再依赖专家人工分析,而是采用计算机系统和程序而自动运行、并且可以不断提升分析预测结果准确性;本发明可以在缺乏历史浓度监测数据的情况下,支持中长期、大区域(省域、流域或全国)的近地面O3人群暴露评估与趋势预测分析,有系统自动进行高时空下、高精度的近地面O3人群暴露风险分析与评价,并输出相应的数字化分析结果,并且通用性强,可以应用于全国范围内的目标区域分析。
为实现上述发明目的,本发明提供如下技术方案:
一种近地面O3人群暴露的时空精细化分析评估方法,其特征在于,其包括如下步骤:
S1:构建区域近地面O3人群暴露的时空精细化分析评估模型,用于近地面O3时间变化趋势与空间分布特征分析
构建区域近地面O3人群暴露的时空精细化分析评估模型,基于每个区县的区县代码,匹配每个区县的O3暴露浓度,区域内总的人口加权O3暴露浓度分析模型为公式(1):
式中:Pi为每个区县的人口数或各区县、各年龄段人口数,Ci为每个区县对应的臭氧浓度,μg/m3;
S2:获取多区域、长周期的O3时空精细化全范围覆盖信息,汇总已有浓度数据并补齐缺失的历史浓度数据
通过远程服务器或者终端机自动采集、运算,获取公式(1)中的Pi数据,获得多区域内、5年以上的每个区县对应的O3历史浓度数据Ci,其中包括高时空O3历史浓度模拟数据;
S3:将O3时空精细化全范围覆盖信息代入模型公式(1),计算各区域内近地面O3时间变化趋势与空间分布特征,进行O3人群暴露分析评估,使其更接近人群的真实暴露水平,最终得到汇总的大区域内总的人口加权O3暴露值。
一种实施前述方法的近地面O3人群暴露的时空精细化分析评估系统,其特征在于,其包括一基于网络的计算机系统,该系统包括一远程服务器及多个终端机,所述的远程服务器内置有所述公式(1)-(2)的计算机程序;所述远程服务器内置的程序包括依次连接并交互通讯的数据采集单元、数据处理单元及人群暴露分析单元;所述的数据处理单元包括Pi数据模块、Ci数据更新模块及Ci历史数据模块;所述的Pi数据模块、Ci数据更新模块分别与外部动态图更新数据源连接并定时更新数据;所述的Ci历史数据模块包括已有Ci历史数据程序、历史浓度参数选择程序、标准数据集构建程序、历史浓度模拟程序及机器学习与模型验证程序,各程序交互通讯,由机器学习与模型验证程序运算后获得缺少Ci历史模拟数据,并且与已有Ci历史数据汇总后,输出给人群暴露分析评估单元,得到基于多参数和机器学习而补齐历史缺失数据的大区域、长期高精度的时空变化趋势,并进一步为小区域、短周期高精度的时空变化趋势预测提供预测依据。
本发明提供的近地面O3人群暴露的时空精细化分析评估方法及系统,其有益效果包括:
1、本发明基于已知的多维数据、多模型、多参数和机器学习的方法,解决2012年及之前的近地面O3分布数据和信息缺少的问题,通过基于多维数据、多模型、多参数和机器学习的方法而补齐历史缺失数据,从而能够支持大区域、长期高精度的时空变化趋势评估与分析,并且能够进一步为小区域、短期高精度的时空变化趋势预测提供预测基准依据。
2、本发明基于计算机网络系统和程序,解决了现有技术中对专家的依赖和不能采用计算机系统自动运行的问题,将专家的专业能力和经验转化为对应的模型、程序,并且优化算法和提高算力,使系统能够根据设定的条件自动采集和更新数据,自动进行评估和分析,并且输出数字化、可视化的评估结果,省时、省力;
3、本发明通过构建高时空暴露评估模型、程序和系统,进行标准化的数据采集和处理,再进行系统化、自动化的分析评估,优化了算法、提高了算力,解决了高时空、高精度、大区域的评估和分析问题,使该方法及系统可以独立于专家而运行,从而搭建出同类任务的通用性、普适性公共服务平台。非专业人员通过终端机上传数据、设定条件等简单操作,即可快速得到本区域的短期、中期或者长期的趋势分析结果。
4、本发明以近地面O3人群暴露时空模拟为对象,在高时空展示缺乏历史浓度监测数据的情况下,基于可得信息(数据),通过系统化、多参数和机器学习,获得虚实相互补充并验证的空气污染物人群暴露高时空高精度信息和评估分析方法,以进行高时空、高精度、大区域的空气污染物人群暴露风险分析与评价。
5、本发明提供的基于机器学习的分析模型,可能够同时满足在空间尺度上外推和在时间尺度上回溯的需求,在常用的评估模型性能方法的基础上,本发明还进行了空间尺度和时间尺度的精度验证,这两种验证方法的实施基础是在划分数据集时进行了不同的定义,能够满足对大区域、长周期的近地面臭氧浓度数据的精细化补缺需求,实现全国范围的区域覆盖。
6、本发明通过对分析模型的调整、优化和验证,使其应用于臭氧人群暴露时空精细化模拟分析时,能够在高时间分辨率和高空间分辨率的基础上取得更佳的模型性能。与既往机器学习研究相比,本发明中模型参数的选择更为优越:首次将气象变量滞后的形式(lag1和lag2)纳入,充分考虑了气象变量对臭氧的滞后影响;GEOS-Chem模型产出也弥补了数据模型对近地面臭氧形成消散化学过程拟合的不足。与其他基于LUR模型的研究相比,本实例在更高的时间分辨率上模型性能相对优越,这是由于LUR本身的局限性造成的:LUR模型在空间尺度上的迁移和外推能力较弱,并且常常受到土地利用变量的时间分辨率的限制,对短期变化不敏感;在先前对相关文献的综述中也发现LUR模型更常见于对区域范围的模拟而不是整个国家尺度。因此在较大区域内且高时间分辨率的大气污染物模拟中,充分考虑污染物形成消散过程的多参数的机器学习模型能够取得更好的效果。
7、本发明的分析评估方法,从空间尺度上对模型性能进行了验证,取得了较好的结果。空间验证的高性能意味着在从监测站点数据外推至高分辨率网格数据时,模型性能较好,间尺度验证的结果验证了本发明网格数据的可信度,其通用性好,可以广泛应用于多个目标地区近地面臭氧时间变化趋势与空间分布特征分析评估。
附图说明
通过参考以下结合附图的说明,并且随着对本发明的更全面理解,本发明的其他目的及结果将更加明白和易于理解。
图1是本发明实施例分析评估系统的网络组成结构示意图;
图2是本发明实施例分析评估系统中远程服务器内置程序的部分模块结构示意图;
图3为环境空气臭氧浓度的时空精细化模拟的流程示意图;
图4(a)、图4(b)、图4(c)分别为O3-8hmax,O3-mean和O3-1hmax模型拟合散点图;
图5(a)-图5(e)分别为2013-2017年O3-8hmax模型在各个不同年份的拟合散点图;
图6(a)-图6(e)分别为2013-2017年O3-mean模型在各个不同年份的拟合散点图;
图7(a)-图7(e)分别为2013-2017年O3-1hmax模型在各个不同年份的拟合散点图;
图8(a)、图8(b)、图8(c)、图8(d)分别为2013-2017年O3-8hmax模型在春夏秋冬四个不同季节的拟合散点图;
图9(a)、图9(b)、图9(c)、图9(d)为2013-2017年O3-mean模型在春夏秋冬四个不同季节的拟合散点图;
图10(a)、图10(b)、图10(c)、图10(d)分别为2013-2017年O3-1hmax模型在春夏秋冬四个不同季节的拟合散点图;
图11(a)、图11(b)、图11(c)分别为O3-8hmax、O3-mean和O3-1hmax模型空间验证拟合散点图;
图12(a)、图12(b)、图12(c)分别为O3-8hmax、O3-mean和O3-1hmax模型时间验证拟合散点图;
图13(a)-(h)分别为2010-2017年京津冀地区O3-8hmax模拟值分布图;
图14(a)-(h)分别为2010-2017年京津冀地区O3-mean模拟值分布图;
图15(a)-(h)分别为2010-2017年京津冀地区O3-1hmax模拟值分布图;
图16(a)-(c)分别为2010-2017年京津冀地区O3-8hmax、O3-mean及O3-1hmax浓度变化的空间分布情况示意图;
图17为京津冀地区的人口加权O3暴露分析输出的结果;
图18为京津冀地区各年龄段的人口加权O3暴露分析输出的结果。
具体实施方式
请参见图1至图18,以下通过实施例和附图对本发明的技术方案进行细致说明。
实施例1:
本发明实施例提供的近地面O3人群暴露的时空精细化分析评估方法,其包括如下步骤:
S1:构建区域近地面O3人群暴露的时空精细化分析评估模型,用于近地面O3时间变化趋势与空间分布特征分析
构建区域近地面O3人群暴露的时空精细化分析评估模型,基于每个区县的区县代码,匹配每个区县的O3暴露浓度,区域内总的人口加权O3暴露浓度分析模型为公式(1):
式中:Pi为每个区县的人口数(或各区县、各年龄段人口数),Ci为每个区县对应的臭氧浓度,μg/m3;
其具体包括如下步骤:
S11:构建一基于网络的计算机系统,该系统包括一远程服务器及多个终端机,所述的远程服务器内置有公式(1)-(2)的计算机程序;
S12:所述的计算机系统,自动从外部获取信息,并根据内置的计算机程序进行运算,并将步骤S2获取的数据自动代入到公式(1)中,最终输出大区域内总的人口加权O3暴露值;
S2:获取多区域、长周期的O3时空精细化全范围覆盖信息,汇总已有浓度数据并补齐缺失的历史浓度数据
通过远程服务器或者终端机自动采集、运算,获取公式(1)中的Pi数据,获得多区域内、5年以上的每个区县对应的O3历史浓度数据Ci,其中包括高时空O3历史浓度模拟数据;
所述的步骤S2中汇总已有浓度数据并补齐缺失的历史浓度数据,具体包括如下步骤:
S21:参数数据收集与预处理
收集的数据包括:O3站点监测的浓度数据;气象数据;全球化学传输模型(Globalchemical transport model,GEOS-Chem)输出数据;土地利用数据;道路数据;归一化植被指数(Normalized Difference Vegetation Index,NDVI);高程数据;人口数据;虚拟变量;
对上述所有数据、参数进行预处理,形成跨年度目标区域0.01°×0.01°分辨率下逐日参数数据集;
S22:构建近地面臭氧浓度的精细化数据模拟模型并验证
抽取步骤S1参数数据集中监测站点数据所在的网格点位的参数数据,形成数据集;在R软件中设定种子数,随机抽取90%的数据作为训练集,其余10%的数据作为测试集;对训练集建立随机森林模型,测试集作为模型精度验证数据;构建近地面臭氧浓度的精细化数据模型为随机森林模型公式(2):
O3i,j=METEi,j+lag1METEi,j+lag2METEi,j+GEOSi,j+LDj+ROADj+NDVIj+ELEj+POPj+SEASONi,j+MONi,j (2)
其中:O3i,j是第i天网格单元j中的O3浓度;METEi,j,lag1 METEi,j和lag2METEi,j是气象变量在网格单元j中第i天的当天、一日滞后和两日滞后值;GEOSi,j是第i天在网格单元j中的GEOS-Chem模型产出值;LDj,ROADj,NDVIj,ELEj和POPj分别是土地利用类型比例,道路长度,NDVI,高程和人口在网格单元j中的值。SEASONi,j和MONi,j分别是季节和月份在网格单元j中第i天的值;在建模过程中,通过十折交叉验证结果、模型变量重要性排序合理性评估以及模拟产品合理性评估来对模型进行调整;
然后采用测试集验证、监测值与模拟值对比、时间尺度验证和空间尺度验证四个方法评估模型优越性;
S23:随机森林模型数据精度验证
测试集验证,对占全部数据集10%比重的测试集进行模拟从而评估模型性能。这部分数据从未参与模型构建与调整,因此对于衡量模型性能有较高的可信度。测试集验证的常规指标包括:R2、均方根误差(Root Mean Squared Error,RMSE)和平均绝对误差(MeanAbsolute Error,MAE);
监测值与模拟值对比,对站点监测值以及站点模拟值分别作描述性分析,从而对模型模拟性能进行评估。在年值水平和区域分布上对监测值和模拟值的差异进行对比;
从空间尺度,分区县评估模型性能时,分别验证O3-8hmax、O3-mean、O3-1hmax三个模型的模型性能分布趋势的一致性;
从时间尺度,分别验证三个模型性能分布趋势的一致性;
S24:补齐缺失的O3历史浓度数据Ci
根据得到的高时空O3历史浓度模拟数据,汇总已有的O3历史浓度数据Ci,通过随机森林模型运算补齐缺失的O3历史浓度数据Ci,获得大区域内、连续5年以上的每个区县对应的O3历史浓度数据Ci,其中包括高时空Os历史浓度模拟信息,并分析其时空分布特征;
S3:将O3时空精细化全范围覆盖信息代入模型公式(1),计算各区域内近地面臭氧时间变化趋势与空间分布特征,进行O3人群暴露分析评估,使其更接近人群的真实暴露水平,最终得到汇总的大区域内总的人口加权O3暴露值;其具体包括如下步骤:
S31:所述的任一终端机向远程服务器上传局部区域的Pi、Ci信息;
S32:向远程服务器发出请求,返回该局部区域内的总的人口加权O3暴露值。
更为具体的,所述的步骤S21还进一步包括如下内容:
O3站点监测的浓度数据:处理为连续的监测年度站点数据逐日网格文件;
气象数据:纳入各项参数包括:2m气温、总降水量、气压、10mV风速、10mU风速、2m湿度、下行短波辐射通量、反射率、总蒸发量、大气边界层高度、高云覆盖量、中云覆盖量及低云覆盖量,以及所有气象参数的两天滞后值(lag1和lag2);对原始数据进行裁剪和重采样,将气象数据最后处理为标准化点文件即CSV格式文件;
全球化学传输模型(Global chemical transport model,GEOS-Chem)输出数据:结合气象、排放清单和大气化学反应来模拟近地面臭氧的形成、分散和沉积的信息,最终形成模拟臭氧浓度的逐日网格数据集;
土地利用数据:对所需的土地类型覆盖率进行了重分类:对土地类型的比例进行处理,对指定网格的土地利用覆盖率缓冲区计算某类型的土地覆盖率,统计该类型数据的比例,并提取至标准化点文件即CSV格式文件;
道路数据:数据时间分辨率为年值数据,数据坐标系为WGS84坐标系,产品格式为线矢量文件,切分道路数据长度并提取最终数据,匹配至标准化文件即CSV格式文件;
归一化植被指数(Normalized Difference Vegetation Index,NDVI):提取NDVI指数来衡量植被覆盖程度对近地面臭氧形成消散的影响,利用重采样将空间分辨率为500m的NDVI数据处理至0.01°×0.01°,并进行数据提取;
高程数据:数据格式为grid格式栅格文件,基于裁剪工具将全国高程数据裁剪至模拟区域,随后基于栅格重采样处理至标准网格并进行数据提取;
人口数据:数据产品中每个栅格的值为该平方km的人口数,基于栅格重采样处理至标准网格并进行数据提取;
时空虚拟变量:基于环境臭氧浓度的时间变化模式,设置季节和月份作为虚拟变量;然后对于月值及年值分辨率的参数数据,即人口、NDVI、道路、土地利用数据和高程数据,进行时间分辨率的统一;
对上述所有参数数据进行预处理后,形成2010-2017年目标地区0.01°×0.01°分辨率下逐日参数数据集。
更为具体的,所述的步骤S22和S23还进一步包括如下内容:
将重要性排序与近地面臭氧本身形成消散机制以及以往相关研究进行对比,判断各变量贡献度分布情况合理性,判断是否需要调整模型变量;
在获得随机森林模型产出的PKL文件后,对某一年0.01°×0.01°分辨率下近地面臭氧浓度进行模拟,形成模拟产品年均值、季均值、月均值和日值数据文件,在ArcGIS软件中进行可视化,产出栅格图;在调整模型变量的过程中,通过逐步判断近地面臭氧浓度模拟产品在年值水平、季均值水平、月值水平和日值水平上分布是否合理,以评估当前模型应用于模拟时的合理性;
获得最优模型后,对模型精度进行验证的步骤,为分别采用测试集验证、监测值与模拟值对比、时间尺度验证和空间尺度验证四个不同的方法来评估模型优越性;
其中的空间尺度的精度验证,是在模拟区域的合格监测站点中随机抽选90%的站点,抽取这些点位所在格网点的监测数据及其参数数据作为训练集,其余10%的站点的监测数据及参数数据作为测试集;模型的建立和调整过程与主模型一致:基于训练集建立随机森林模型并调整模型至性能最优,对测试集进行验证并产出R2、拟合直线与拟合散点图;通过空间尺度的精度验证,可以进一步判断模型在外推至站点以外模拟区域时的合理性与准确性;
其中的时间尺度的精度验证,是在1-30中随机设定10个数字,根据选定的数字在研究期间的1月,4月,7月和10月中分别抽取这10天,将监测数据及参数数据作为测试集,剩余天数的监测数据及参数数据作为训练集。模型的建立和调整过程与主模型一致:基于训练集建立随机森林模型并调整模型至性能最优,对测试集进行验证并产出R2、拟合直线与拟合散点图。通过时间尺度的精度验证,可以进一步判断模型在模拟未参与模型构建时期的近地面臭氧浓度时的合理性与准确性。
更为具体的,所述的步骤S24,分别验证O3-8hmax、O3-mean、O3-1hmax三个模型的模型性能分布趋势的一致性,还进一步包括如下内容:
分别验证三个的R2、RMSE、MAE值以及拟合直线方程;
分别从空间尺度及时间尺度上,根据分区县评估模型性能,评价三个模型的模型性能分布趋势一致性;
对空间尺度验证结果进行分析,通过随机划定参与或不参与模型建立过程的监测站点,以判断模型在空间尺度上外推的合理性;
对时间尺度验证结果进行分析,时间尺度验证中随机抽取的天数均匀分布在能够代表当季典型气候现象的月份,从而验证模型在时间尺度上模拟近地面臭氧浓度的性能,尤其是对历史时期近地面臭氧浓度进行模拟时的可信度。
参见附图1-2,本实施例提供的实施前述方法的近地面O3人群暴露的时空精细化分析评估系统,其包括一个基于网络的计算机系统,该系统包括至少一台远程服务器及多个终端机,所述的远程服务器内置有所述公式(1)-(2)的计算机程序;所述远程服务器内置的程序包括依次连接并交互通讯的数据采集单元、数据处理单元及人群暴露分析单元;所述的数据处理单元包括Pi数据模块、Ci数据更新模块及Ci历史数据模块;所述的Pi数据模块、Ci数据更新模块分别与外部动态图更新数据源连接并定时更新数据;所述的Ci历史数据模块包括已有Ci历史数据程序、历史浓度参数选择程序、标准数据集构建程序、历史浓度模拟程序及机器学习与模型验证程序,各程序交互通讯,由机器学习与模型验证程序运算后获得缺少Ci历史模拟数据,并且与已有Ci历史数据汇总后,输出给人群暴露分析评估单元,得到基于多参数和机器学习而补齐历史缺失数据的大区域、长期高精度的时空变化趋势,并进一步为小区域、短周期高精度的时空变化趋势预测提供预测依据。所述的远程服务器,通过互联网与外部数据源连接,定时获取新数据,进行计算并输出新的分析评估结果。所述的外部数据源为动态更新的数据源,包括:O3站点监测的浓度数据;气象数据;全球化学传输模型(Global chemical transport model,GEOS-Chem)输出数据;土地利用数据;道路数据;归一化植被指数(Normalized Difference Vegetation Index,NDVI);高程数据;人口数据;虚拟变量数据。
实施例2
本发明实施例提供的近地面O3人群暴露的时空精细化分析评估方法及系统,是在实施例1的基础上的具体应用,本实施例分析评估区域(京津冀地区)的经纬度范围为东经113.45°~东经119.85°和北纬36.03°~北纬42.62°,时间范围为2015年1月1日至2017年12月31日,共计2992天。时间分辨率为日分辨率,将各变量时间分辨率处理至日值水平,建立模型并模拟京津冀地区2010-2017年近地面臭氧的日值数据;本实例的空间分辨率为0.01°×0.01°(约1km×1km),采用多种方法将各参数空间分辨率处理至0.01°×0.01°分辨率,模拟京津冀地区近地面臭氧在0.01°×0.01°分辨率下的分布情况。
本发明实施例提供的近地面O3人群暴露的时空精细化分析评估方法,其在实施例1的基础上,进一步包括如下的详细步骤:
(1)数据收集与预处理
1)O3站点监测数据。出于对数据可信度的考虑,本实例对监测站点设定了数据清理原则:合格站点被定义为在整个模拟期间缺失率低于25%的站点。本实例中使用的暴露指标包括三个指标:每日最大8小时平均浓度(O3-8hmax),每日最大1小时浓度(O3-1hmax)和日均浓度(O3-mean)。对日值数据,仅当每个站点的原始小时值数据≥6条时才进行计算。经过筛选,本实例共计包含95个合格站点。数据时间分辨率为日值,时间跨度为2010-2017年;数据格式为CSV数据。经过对原始站点数据的清理与计算,得到了包括O3-8hmax、O3-1hmax与O3-mean三个指标的京津冀地区2013-2017年监测站点臭氧浓度数据。为了数据处理方便,将所有数据按照日期形成逐日文件。本实例基于两个步骤完成站点数据转换工作:首先,根据各监测站点经纬度,使用coordinates函数将站点数据转换为空间数据,并使用proj4string函数定义站点数据坐标系与网格文件坐标系一致;其次,基于rasterize函数实现点数据进网格,最终使得每个站点获得对应网格的ID号。整个过程中基于for循环实现对逐日站点数据的处理与转换,最终形成2013-2017年站点数据逐日网格文件。
2)气象数据。在考虑了近地面臭氧的形成机理和以往研究结果后,纳入的各项参数包括:2m气温、总降水量、气压、10mV风速、10mU风速、2m湿度、下行短波辐射通量、反射率、总蒸发量、大气边界层高度、高云覆盖量、中云覆盖量及低云覆盖量,共计12种。出于对气象因素滞后效应的考虑,除了当天数据,还纳入了所有气象参数的两天滞后值(lag1和lag2)。气象数据处理首先通过裁剪工具将全球气象数据裁剪至模拟区域,随后利用重采样将空间分辨率为0.125°×0.125°的气象数据处理至0.01°×0.01°,重采样方式为双线性插值法,最后将重采样后的数据提至标准化点文件即CSV格式文件。整个过程中基于Arcpy实现批量处理。
3)全球化学传输模型(Global chemical transport model,GEOS-Chem)输出数据。该数据结合了气象、排放清单和大气化学反应来模拟近地面臭氧的形成、分散和沉积。GEOS-Chem模型产品为逐日多层多波段数据文件,数据集中包括臭氧浓度、气压及云量三种变量;根据海拔高度分成37层,以2小时作为一个波段对多个变量分布情况进行统计;数据的空间分辨率为2°×2.5°,坐标系为WGS84坐标系;产品格式为NetCDF文件。本实例模拟中采用的数据为近地面臭氧浓度数据,将2小时时间分辨率数据计算指日均值分辨率水平;时间跨度为2010-2016年(表1)。GEOS-Chem数据处理首先通过raster函数对数据进行栅格化,在此过程中通过varname、level和band参数分别定义所需的变量、层数及波段。对同一日文件,提取每2小时近地面臭氧数据层,对12个2小时数据文件取均值,形成近地面臭氧日均值栅格文件。根据数据本身分辨率提取数据至CSV文件。随后在Python中调用idw库基于反距离权重方法对原始数据进行插值。最终形成京津冀地区0.01°×0.01°GEOS-Chem模拟臭氧浓度的逐日网格数据集。整个过程基于R软件和Python软件中的for循环完成2010-2016年数据的处理与产出。
4)土地利用数据。首先通过裁剪工具将全球土地利用数据裁剪至模拟区域,随后利用重采样将空间分辨率为300m的土地利用数据处理至0.01°×0.01°;由于原始数据采用非常详尽的土地利用类型分类方法,为提高数据使用效率,本实例对所需的土地类型覆盖率进行了重分类:对土地类型的比例进行了相应的规定,对指定网格的土地利用覆盖率采用0.03°×0.03°缓冲区计算某类型的土地覆盖率,统计该类型数据的比例,并提取至标准化点文件即CSV格式文件。整个处理过程基于Arcpy实现批量处理。
5)道路数据。数据时间分辨率为年值数据,数据坐标系为WGS84坐标系,产品格式为线矢量文件。本实例采用了国家公路长度,高速公路长度,省级公路长度,铁路长度,县级公路长度和乡村公路长度等六个道路长度指标来衡量道路网对近地面臭氧的影响(表1)。本实例中道路数据处理首先通过裁剪工具将全国各道路类型数据裁剪至模拟区域,由于每一种道路类型的数据均为不连续的线矢量数据,因此使用融合工具将每一种道路类型数据融合为整体,随后与京津冀地区0.01°×0.01°标准网格进行相交处理,最终切分道路数据长度并提取最终数据。不同的道路数据被单独记录,匹配至标准化文件即CSV格式文件。整个过程在ArcMap中进行。
6)归一化植被指数(NormalizedDifference Vegetation Index,NDVI)。本实例提取NDVI指数来衡量植被覆盖程度对近地面臭氧形成消散的影响,时间跨度为2010-2016年(表2-1)。NDVI数据处理涉及到两个ArcGIS中的常用功能:“裁剪”及“重采样”。首先基于裁剪工具将全国NDVI数据裁剪至模拟区域,随后利用重采样将空间分辨率为500m的NDVI数据处理至0.01°×0.01°,并进行数据提取。整个过程基于ArcMap进行。
7)高程数据。原始高程产品的时间分辨率为年值数据,空间分辨率为1km×1km;数据坐标系为Krasovsky_1940_Albers坐标系;数据格式为grid格式栅格文件(表1)。高程数据处理涉及到两个ArcGIS中的常用功能:“裁剪”及“重采样”。首先将数据坐标系统一于WGS_84坐标系,基于裁剪工具将全国高程数据裁剪至模拟区域,随后基于栅格重采样处理至标准网格并进行数据提取。整个过程基于ArcMap进行。
8)人口数据。数据产品中每个栅格的值为该平方km的人口数。产品的时间分辨率为年值产品,空间分辨率为1km×1km;数据坐标系为Krasovsky_1940_Albers坐标系;数据格式为grid格式栅格文件(表2)。人口数据处理涉及到两个ArcGIS中的常用功能:“裁剪”及“重采样”。首先将数据坐标系统一于WGS_84坐标系,基于裁剪工具将全国人口数据裁剪至模拟区域,随后基于栅格重采样处理至标准网格并进行数据提取。整个过程基于ArcMap进行。
9)虚拟变量。考虑到环境臭氧浓度的时间变化模式,本实例设置了季节和月份作为虚拟变量:对于季节变量,设置上一年份12月、当年的1月和2月为冬季,使用1表示;3月-5月为春季,使用2表示;6-8月为夏季,使用3表示;9-11月为秋季,使用4表示。对于月份变量,使用1-12分别代表1-12月(表1)。
对于月值及年值分辨率的参数数据,即人口、NDVI、道路、土地利用数据和高程数据,需要进行时间分辨率的统一。由于所有模型变量在处理过程中都基于标准网格,因此拥有唯一索引(网格ID号)。因此对于粗时间分辨率数据,本实例在形成逐日模型参数集的过程中根据日期直接进行重复匹配,完成时间分辨率的统一。基于R软件中bind函数,使用for循环完成2010-2017年逐日参数集的处理。将每日站点数据、气象数据、GEOS-Chem模型产出合并至同一CSV,网格基本信息、地理类变量、社会经济变量以及哑变量以日期为索引重复赋值,合并至CSV文件。
表1模型参数基本信息表
(2)模型建立与验证
对所有参数数据进行预处理后,形成了2010-2017年京津冀地区0.01°×0.01°分辨率下逐日参数数据集。抽取数据集中监测站点数据所在的网格点位的参数数据,形成数据集。在R软件中设定种子数,随机抽取90%的数据作为训练集,其余10%的数据作为测试集。对训练集建立随机森林模型,测试集作为模型精度验证数据,于下节中详述。时间尺度和空间尺度的数据集划分方法在下节中详述。本实例中基于如下公式构建随机森林模型:
O3i,=METEi,+lag1METEi,j+lag2METEi,j+GEOSi,j+LDj+ROADj+NDVIj+ELEj+POPi+SEASONi,j+MONi,j (2)
其中O3i,j是第i天网格单元j中的O3浓度;METEi,j,lag1 METEi,j和lag2 METEi,j是气象变量在网格单元j中第i天的当天、一日滞后和两日滞后值;GEOSi,j是第i天在网格单元j中的GEOS-Chem模型产出值;LDj,ROADj,NDVIj,ELEj和POPj分别是土地利用类型比例,道路长度,NDVI,高程和人口在网格单元j中的值。SEASONi,j和MONi,j分别是季节和月份在网格单元j中第i天的值。
在整个建模过程中,通过十折交叉验证结果、模型变量重要性排序合理性评估以及模拟产品合理性评估来对模型进行调整。
随机森林可以产出模型中变量对模型构建的贡献度,这是随机森林算法的一大优势。模型变量重要性排序的可解释性对于讨论目前模型是否合理有重要的意义。本实例在模型调整过程中,不断将重要性排序与近地面臭氧本身形成消散机制以及以往相关研究进行对比,判断各变量贡献度分布情况合理性,从而调整模型变量。
获得随机森林模型产出的PKL文件后,对某一年0.01°×0.01°分辨率下近地面臭氧浓度进行模拟,形成模拟产品年均值、季均值、月均值和日值数据文件,在ArcGIS软件中进行可视化,产出栅格图。本实例在调整模型过程中,通过逐步判断近地面臭氧浓度模拟产品在年值水平、季均值水平、月值水平和日值水平上分布是否合理,以评估当前模型应用于模拟时的合理性。获得最优模型后,需对模型精度进行验证。本实例采用测试集验证、监测值与模拟值对比、时间尺度验证和空间尺度验证四个方法来评估模型优越性。
本发明关注对现阶段近地面臭氧浓度的精细化,模型是否能够同时满足在空间尺度上外推和在时间尺度上回溯的需求至关重要。因此,在常见评估模型性能方法的基础上,本发明还进行了空间尺度和时间尺度的精度验证。这两种验证方法的实施基础是在划分数据集时进行了不同的定义。
空间尺度的精度验证是指在模拟区域的合格监测站点中随机抽选90%的站点(85个站点),抽取这些点位所在格网点的监测数据及其参数数据作为训练集,其余10%的站点(10个站点)的监测数据及参数数据作为测试集。模型的建立和调整过程与主模型一致:基于训练集建立随机森林模型并调整模型至性能最优,对测试集进行验证并产出R2、拟合直线与拟合散点图。通过空间尺度的精度验证,可以进一步判断模型在外推至站点以外模拟区域时的合理性与准确性。
时间尺度的精度验证是指在1-30中随机设定10个数字,根据选定的数字在2013-2017年间的1月,4月,7月和10月中分别抽取这10天,将共计200天的监测数据及参数数据作为测试集,剩余天数的监测数据及参数数据作为训练集。模型的建立和调整过程与主模型一致:基于训练集建立随机森林模型并调整模型至性能最优,对测试集进行验证并产出R2、拟合直线与拟合散点图。通过时间尺度的精度验证,可以进一步判断模型在模拟未参与模型构建时期的近地面臭氧浓度时的合理性与准确性。
(3)模型变量重要性排序
随机森林模型在建立过程中会产出模型中各参数对拟合因变量的贡献度,并形成不同参数的重要性排序。从三个指标的变量重要性排序来看,不同变量对拟合近地面臭氧的贡献度排序与其作为典型大气二次污染物的形成消散机制密切相关,并且在三个指标中存在些许不同:在O3-8hmax和O3-1hmax模型中,温度显示出最高的贡献度,高达47%和49%;在O3-mean模型中,GEOS-Chem模型产出显示了最高的贡献度42%。在三个模型中,气象变量都显示出对近地面臭氧浓度的极大影响:下行短波辐射,V风分量,低云覆盖量都处于重要性排序的前列。作为长期变量的高程数据在本实例中也显示出对近地面臭氧模拟值的极大影响。三个指标模型中重要性前20位的变量及其重要性见表2。
表2 O3-8hmax、O3-mean和O3-1hmax模型变量重要性排序
通过将多个参数标准化并集成到分辨率为0.01°×0.01°的标准网格中,模型性能得到了很大提升。本发明中气象参数,特别是温度和光照,对模型有很大贡献。此外下行短波辐射,V风分量,低云覆盖量等变量也对模型构建有很大影响。这与近地表臭氧的形成机理一致:近地表臭氧作为一种典型的大气二次污染物,是由氮氧化物和挥发性有机化合物在适当的温度下在紫外线下进行的一系列光化学反应形成的。
根据对以往研究的对比分析,本发明是首次将气象滞后因素纳入模型的基于统计模型的近地面臭氧模拟方法,而模型重要性排序也证实了气象因素的滞后影响确实存在:滞后1天的10m V风速、10m U风速、边界层高度、下行短波辐射、低云覆盖量、2m露点温度、高云覆盖量和2m温度对近地面臭氧产生影响;而下行短波辐射、2m露点温度、边界层高度和10m V风速在滞后2天时仍会对近地面臭氧形成产生影响。三个指标的模型中,滞后1天的10m V风速的影响均最大,其次是滞后1天的边界层高度:这充分证明了前一日污染物扩散和输送情况对当日臭氧形成消散的影响。滞后1天的下行短波辐射也处于重要性排序前列:前一日的天气晴朗程度直接影响夜间气象条件,对近地面臭氧消散产生影响。不可否认的是,近地面臭氧在一日间变化剧烈,目前以日为时间分辨率的模拟方法还不足以完全模拟O3的变化、各参数与O3确切关系的变化。未来更高时间分辨率的模拟是关注重点。
此外,CTM的输出中也显示出很高的重要性。先前的研究已经证明了CTM模拟产品对近地面臭氧形成和消散过程的影响。本实例还发现臭氧浓度年均值的分布趋势与地形变化趋势十分类似。海拔高度与光照、风向、风压和边界层高度等气象变化密切相关,此外,由于地形差异引起的热力和动力效应的变化也对臭氧的形成和消散产生巨大影响,先前的研究也证明了这一点。
在先前的研究中显示出较高影响力的土地利用变量在本实例中并未体现出高贡献度。这可能是由于土地利用变量难以提供有关时间变化的大量信息。与各种气象因素和污染物排放相比,土地利用变量的影响相对较小,并由于更新不及时导致时间R2降低。此外,与发达国家相比,我国的近地面臭氧浓度水平更高,且受到密集排放源的影响,动态变化范围极大,土地利用变量很难在大规模时空模拟中很难解释这一点。土地利用类型数据在不同模拟研究中并无一个标准的分类体系,这对模型中变量的贡献有一定影响,也是可能的原因之一。综合来看,土地利用信息未能展示其有力影响,未来研究尤其是应用在较大研究区域内的模拟研究,应进一步考虑气象因素和排放信息。
(4)模型精度
本实例模型性能较好:对于O3-8hmax的模型,R2达到0.84,RMSE为23.74,MAE为15.41,拟合直线方程为y=0.83x+15.63;对于O3-mean的模型,R2达到0.84,RMSE为15.37,MAE为10.33,拟合直线方程为y=0.81x+10.92;对于O3-1hmax的模型,R2达到0.81,RMSE为30.17,MAE为18.78,拟合直线方程为y=0.8x+22.27(图4)。
从空间尺度上来看,分区县评估模型性能时,三个模型的模型性能分布趋势一致:在省级水平上,北京市的模型性能高于天津市和河北省;在市级水平上,模型R2在0.63-0.92之间,衡水市,廊坊市和唐山市在11个市中模型性能最好,秦皇岛市性能相对较低(表3)。
表3 O3-8hmax、O3-1hmax及O3-mean在不同水平上的模型性能分布情况
/>
从时间尺度上来看,O3-8hmax、O3-mean和O3-1hmax模型性能分布趋势较为一致:随着年份的增加,2013-2017每年的模型R2也不断增加(图5~图7)。从季节分布趋势上来看,三个模型均在秋季获得最佳的模型性能:O3-8hmax、O3-mean和O3-1hmax模型R2分别为0.83、0.81和0.79。O3-8hmax、O3-mean在春季和冬季模型性能次之,O3-8hmax为0.74和0.75,O3-mean为0.75和0.77;夏季最差,R2均为0.69。O3-1hmax则在春季和夏季模型性能次之,冬季最差,模型R2分别为0.71、0.66和0.54(图8~图10)。
从空间尺度验证结果来看,三个指标模型性能均较好:O3-8hmax模型R2为0.87,拟合直线方程为y=0.84x+12.84;O3-mean模型R2为0.79,拟合直线方程为y=0.81x+14.87;O3-1hmax模型R2为0.84,拟合直线方程为y=0.81x+19.3(图11)。通过随机划定参与或不参与模型建立过程的监测站点,可以判断模型在外推过程中的合理性。三个指标的模型性能与全站点数据建模时模型性能较为相似,在证明模型在空间尺度上的稳定性的同时,也在一定程度上佐证了本实例对无监测站点地区模拟时的可信度。
从时间尺度验证结果来看,三个指标的时间验证结果较为稳定:O3-8hmax模型R2为0.71,拟合直线方程为y=0.69x+28.52;O3-mean模型R2为0.70,拟合直线方程为y=0.67x+18.91;O3-1hmax模型R2为0.68,拟合直线方程为y=0.66x+37.18(图12)。模拟区域内全年气候变化趋势多样,时间尺度验证中随机抽取的天数均匀分布在能够代表当季典型气候现象的月份,能够很好的验证模型在时间尺度上模拟近地面臭氧浓度的性能。从模拟结果可以看出,当前模型在对长期且连续时间序列下近地面臭氧进行模拟时性能优越,尤其是对历史时期近地面臭氧浓度进行模拟时,模拟产品可信度高。
通过选择合适的变量并不断调整模型参数,本实例建立的高时空分辨率随机森林模型具有稳定的模型性能:三个指标的R2值均高于0.80;并在时间尺度验证和空间尺度验证中都取得了较好的结果。与我国开展的其他臭氧模拟研究相比,本实例模型性能更佳。
本发明在高时间分辨率和高空间分辨率的基础上够取得了更佳的模型性能。与既往机器学习研究相比,本发明中模型参数的选择更为优越:首次将气象变量滞后的形式(lag1和lag2)纳入,充分考虑了气象变量对臭氧的滞后影响;GEOS-Chem模型产出也弥补了数据模型对近地面臭氧形成消散化学过程拟合的不足。与其他基于LUR模型的研究相比,本实例在更高的时间分辨率上模型性能相对优越,这是由于LUR本身的局限性造成的:LUR模型在空间尺度上的迁移和外推能力较弱,并且常常受到土地利用变量的时间分辨率的限制,对短期变化不敏感;在先前对相关文献的综述中也发现LUR模型更常见于对区域范围的模拟而不是整个国家尺度。因此在较大区域内且高时间分辨率的大气污染物模拟中,充分考虑污染物形成消散过程的多参数的机器学习模型能够取得更好的效果。
本发明从空间尺度上对模型性能进行了验证,取得了较好的结果。空间验证的高性能意味着在从监测站点数据外推至高分辨率网格数据时,模型性能较好。间尺度验证的结果验证了本发明网格数据的可信度。
(5)京津冀地区近地面臭氧时间变化趋势与空间分布特征
针对近地面臭氧三个指标,本实例分别模拟了2010-2017年京津冀地区逐日高时空分辨率的近地面O3-8hmax,O3-mean和O3-1hmax浓度(图13(a)-(h)、图14(a)-(h)及图15(a)-(h))。从时间分布趋势来看,2010-2017年京津冀地区的O3-8hmax、O3-mean以及O3-1hmax浓度值整体呈现上升趋势,这种趋势自2016年开始尤为明显。通过对205年和2017年模拟数据的直接对比,不难发现近地面臭氧增长主要集中在经济较为发达的沿海地区(图16(a)-(c))。
其中,图13(a)为2010年京津冀地区O3-8hmax模拟值分布图,图13(b)2011年京津冀地区O3-8hmax模拟值分布图,如此类推,每幅图显示一个年份,图13(h)为2017年京津冀地区O3-8hmax模拟值分布图。图14(a)为2010年京津冀地区O3-mean模拟值分布图,(b)-(h)各自显示一个年份的京津冀地区O3-mean模拟值分布图;图15(a)为2010年京津冀地区O3-1hamx模拟值分布图,(b)-(h)各自显示一个年份的京津冀地区O3-1hamx模拟值分布图;图16(a)为2017年与2010年O3-8hmax浓度差值图,图16(b)为2017年与2010年O3-mean浓度差值图,图16(c)为2017年与2010年O3-1hmax浓度差值图。
从季节分布趋势上来看,近地面臭氧模拟值呈现明显的季节趋势:夏季臭氧水平最高,春季和秋季次之,冬季最低,这与近地面臭氧本身的形成机制和分布情况一致。
(6)代入数据,进行京津冀地区近地面臭氧人口暴露特征分析,并输出结果
随着我国大气污染防治行动计划的实施,PM2.5污染得到改善,但O3污染呈现上升态势,2015-2017年我国O3日8h最大质量浓度年均值每年增长4.6μg/m3,我国74个关键城市的O3质量浓度2017年年均为164μg/m3,相较于2013年增长了23μg/m3。因此评估O3污染及人群暴露特征的变化可以为空气污染控制及人群健康防护策略制定提供重要科学依据。
1)京津冀地区总人口暴露浓度
臭氧浓度数据为基于上述随机森林模型模拟的2005-2017年全国范围的1km网格的O3浓度,人口数据来源于第六次人口普查数据,为分区县分年龄段的人口数。基于每个区县的区县代码,匹配每个区县的人群臭氧暴露浓度。京津冀地区近地面臭氧人口加权暴露见计算公式(5):
式中:Pi为每个区县的人口数(或各区县、各年龄段人口数),Ci为每个区县对应的臭氧浓度,μg/m3。
京津冀地区的人口加权O3暴露如图17、表4所示,从2005至2017年,京津冀地区的人口加权O3暴露呈波动势上升,2015至2017年人口加权O3暴露大幅上升。
表4京津冀地区人口加权O3暴露浓度
/>
2)分年龄段的人口加权O3暴露浓度
各区县人口数据的年龄分为0-4、5-9、10-14、15-19、20-24、25-29、30-34、35-39、40-44、45-49、50-54、55-59、60-64、65-69、70-74、75-79及80共17个等级,每5岁组计算一次,基于上述17个岁数等级的区县代码,分别匹配京津冀地区各年龄段人口对应的臭氧浓度,使用公式(5)计算分年龄段的人口加权O3暴露,见表5。
表5分年龄段的人口加权O3暴露
/>
/>
京津冀地区各年龄段人口加权O3暴露如图18所示,从2005至2017年,京津冀地区臭氧的人口加权O3暴露呈波动势上升,各年龄段的人口加权O3暴露浓度趋势一致,差异较小在2017年,5-9岁年龄段儿童的人口加权O3暴露最高,25-29岁年龄段青年的人口加权O3暴露最低。
以上所述仅为本发明的示例性实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种近地面O3人群暴露的时空精细化分析评估方法,其特征在于,其包括如下步骤:
S1:构建区域近地面O3人群暴露的时空精细化分析评估模型,用于近地面O3时间变化趋势与空间分布特征分析
构建区域近地面O3人群暴露的时空精细化分析评估模型,基于每个区县的区县代码,匹配每个区县的O3暴露浓度,区域内总的人口加权O3暴露浓度分析模型为公式(1):
式中:Pi为每个区县的人口数或各区县、各年龄段人口数,Ci为每个区县对应的臭氧浓度,μg/m3;
S2:获取多区域、长周期的O3时空精细化全范围覆盖信息,汇总已有浓度数据并补齐缺失的历史浓度数据
通过远程服务器或者终端机自动采集、运算,获取公式(1)中的Pi数据,获得多区域内、5年以上的每个区县对应的O3历史浓度数据Ci,其中包括高时空O3历史浓度模拟数据;
S3:将O3时空精细化全范围覆盖信息代入模型公式(1),计算各区域内近地面O3时间变化趋势与空间分布特征,进行O3人群暴露分析评估,使其更接近人群的真实暴露水平,最终得到汇总的大区域内总的人口加权O3暴露值。
2.根据权利要求1所述的近地面O3人群暴露的时空精细化分析评估方法,其特征在于,所述的步骤S2中汇总已有浓度数据并补齐缺失的历史浓度数据,具体包括如下步骤:
S21:参数数据收集与预处理
收集的数据包括:O3站点监测的浓度数据;气象数据;全球化学传输模型输出数据;土地利用数据;道路数据;归一化植被指数;高程数据;人口数据;时空虚拟变量;
对上述所有数据、参数进行预处理,形成跨年度目标区域0.01°×0.01°分辨率下逐日参数数据集;
S22:构建近地面O3浓度的精细化数据模拟模型并验证
抽取步骤S1参数数据集中监测站点数据所在的网格点位的参数数据,形成数据集;在R软件中设定种子数,随机抽取90%的数据作为训练集,其余10%的数据作为测试集;对训练集建立随机森林模型,测试集作为模型精度验证数据;构建近地面臭氧浓度的精细化数据模型为随机森林模型公式(2):
O3i,j=METEi,j+lag1METEi,j+lag2METEi,j+GEOSi,j+LDj+ROADj+MDVIj+ELEj+POPj+SEASONi,j+MONi,j (2)
其中:O3i,j是第i天网格单元j中的O3浓度;METEi,j,lag1 METEi,j和lag2 METEi,j是气象变量在网格单元j中第i天的当天、一日滞后和两日滞后值;GEOSi,j是第i天在网格单元j中的GEOS-Chem模型产出值;LDj,ROADj,NDVIj,ELEj和POPj分别是土地利用类型比例,道路长度,NDVI,高程和人口在网格单元j中的值;SEASONi,j和MONi,j分别是季节和月份在网格单元j中第i天的值;在建模过程中,通过十折交叉验证结果、模型变量重要性排序合理性评估以及模拟产品合理性评估来对模型进行调整;
然后采用测试集验证、监测值与模拟值对比、时间尺度验证和空间尺度验证四个方法评估模型优越性;
S23:随机森林模型数据精度验证
测试集验证,对占全部数据集10%比重的测试集进行模拟从而评估模型性能:这部分数据从未参与模型构建与调整,对于衡量模型性能有较高的可信度;测试集验证的常规指标包括:R2、均方根误差和平均绝对误差;
监测值与模拟值对比,对站点监测值以及站点模拟值分别作描述性分析,从而对模型模拟性能进行评估,在年值水平和区域分布上对监测值和模拟值的差异进行对比;
从空间尺度,分区县评估模型性能时,分别验证O3-8hmax、O3-mean、O3-1hmax三个模型的模型性能分布趋势的一致性;
从时间尺度,分别验证三个模型性能分布趋势的一致性;
S24:补齐缺失的O3历史浓度数据Ci
根据得到的高时空O3历史浓度模拟数据,汇总已有的O3历史浓度数据Ci,通过随机森林模型运算补齐缺失的O3历史浓度数据Ci;
补齐缺失的O3历史浓度数据Ci,汇总已有的O3历史浓度数据Ci,获得大区域内、连续5年以上的每个区县对应的O3历史浓度数据Ci,其中包括高时空O3历史浓度模拟信息,并分析其时空分布特征。
3.根据权利要求2所述环境空气O3人群暴露的时空精细化分析评估方法,其特征在于,所述的步骤S21还进一步包括如下内容:
制作标准化网格,统一数据的时空间分辨率和研究地区范围,网格的创建主要借助ArcGIS10.2中的创建渔网功能完成;
由于各参数的格式、时空分辨率不统一,无法直接将参数放入标准化网格中,因此需要对所有参数进行坐标系统、格式、时间、空间标准统一化,再将统一化后的数据按照格网坐标匹配至格网点文件:
O3站点监测的浓度数据:处理为连续的监测年度站点数据逐日网格文件;
气象数据:纳入各项参数包括:2m气温、总降水量、气压、10mV风速、10mU风速、2m湿度、下行短波辐射通量、反射率、总蒸发量、大气边界层高度、高云覆盖量、中云覆盖量及低云覆盖量,以及所有气象参数的两天滞后值;对原始数据进行裁剪和重采样,将气象数据最后处理为标准化点文件即CSV格式文件;
全球化学传输模型输出数据:结合气象、排放清单和大气化学反应来模拟近地面臭氧的形成、分散和沉积的信息,最终形成模拟臭氧浓度的逐日网格数据集;
土地利用数据:对所需的土地类型覆盖率进行了重分类:对土地类型的比例进行处理,对指定网格的土地利用覆盖率缓冲区计算某类型的土地覆盖率,统计该类型数据的比例,并提取至标准化点文件即CSV格式文件;
道路数据:数据时间分辨率为年值数据,数据坐标系为WGS84坐标系,产品格式为线矢量文件,切分道路数据长度并提取最终数据,匹配至标准化文件即CSV格式文件;
归一化植被指数:提取NDVI指数来衡量植被覆盖程度对近地面臭氧形成消散的影响,利用重采样将空间分辨率为500m的NDVI数据处理至0.01°×0.01°,并进行数据提取;
高程数据:数据格式为grid格式栅格文件,基于裁剪工具将全国高程数据裁剪至模拟区域,随后基于栅格重采样处理至标准网格并进行数据提取;
人口数据:数据产品中每个栅格的值为该平方km的人口数,基于栅格重采样处理至标准网格并进行数据提取;
时空虚拟变量:基于环境臭氧浓度的时间变化模式,设置季节和月份作为虚拟变量;然后对于月值及年值分辨率的参数数据,即人口、NDVI、道路、土地利用数据和高程数据,进行时间分辨率的统一;
对上述所有参数数据进行预处理后,形成目标地区0.01°×0.01°分辨率下逐日参数数据集。
4.根据权利要求2所述的近地面O3人群暴露的时空精细化分析评估方法,其特征在于,所述的步骤S22还进一步包括如下内容:
将重要性排序与近地面臭氧本身形成消散机制以及以往相关研究进行对比,判断各变量贡献度分布情况合理性,判断是否需要调整模型变量;
在获得随机森林模型产出的PKL文件后,对某一年0.01°×0.01°分辨率下近地面臭氧浓度进行模拟,形成模拟产品年均值、季均值、月均值和日值数据文件,在ArcGIS软件中进行可视化,产出栅格图;在调整模型变量的过程中,通过逐步判断近地面臭氧浓度模拟产品在年值水平、季均值水平、月值水平和日值水平上分布是否合理,以评估当前模型应用于模拟时的合理性;
获得最优模型后,对模型精度进行验证的步骤,为分别采用测试集验证、监测值与模拟值对比、时间尺度验证和空间尺度验证四个不同的方法来评估模型优越性;
所述的S23还进一步包括如下内容:
监测值与模拟值对比,对站点监测值以及站点模拟值分别作描述性分析,从而对模型模拟性能进行评估,在年值水平和区域分布上对监测值和模拟值的差异进行对比;
其中的空间尺度的精度验证,是在模拟区域的合格监测站点中随机抽选90%的站点,抽取这些点位所在格网点的监测数据及其参数数据作为训练集,其余10%的站点的监测数据及参数数据作为测试集;模型的建立和调整过程与主模型一致:基于训练集建立随机森林模型并调整模型至性能最优,对测试集进行验证并产出R2、拟合直线与拟合散点图;通过空间尺度的精度验证,可以进一步判断模型在外推至站点以外模拟区域时的合理性与准确性;
其中的时间尺度的精度验证,是在1-30中随机设定10个数字,根据选定的数字在研究期间每年的1月,4月,7月和10月中分别抽取这10天,将监测数据及参数数据作为测试集,剩余天数的监测数据及参数数据作为训练集;模型的建立和调整过程与主模型一致:基于训练集建立随机森林模型并调整模型至性能最优,对测试集进行验证并产出R2、拟合直线与拟合散点图;通过时间尺度的精度验证,可以进一步判断模型在模拟未参与模型构建时期的近地面臭氧浓度时的合理性与准确性。
5.根据权利要求2所述环境空气O3人群暴露的时空精细化分析评估方法,其特征在于,所述的步骤S24,分别验证O3-8hmax、O3-mean、O3-1hmax三个模型的模型性能分布趋势的一致性,还进一步包括如下内容:
分别验证三个的R2、RMSE、MAE值以及拟合直线方程;
分别从空间尺度及时间尺度上,根据分区县评估模型性能,评价三个模型的模型性能分布趋势一致性;
对空间尺度验证结果进行分析,评估模型在空间尺度上外推的合理性;
对时间尺度验证结果进行分析,评估模型进行历史回溯的合理性。
6.根据权利要求1所述的近地面O3人群暴露的时空精细化分析评估方法,其特征在于,所述的步骤S1,具体包括如下步骤:
S11:构建一基于网络的计算机系统,该系统包括一远程服务器及多个终端机,所述的远程服务器内置有公式(1)-(2)的计算机程序;
S12:所述的计算机系统,自动从外部获取信息,并根据内置的计算机程序进行运算,并将步骤S2获取的数据自动代入到公式(1)中,最终输出大区域内总的人口加权O3暴露值。
7.根据权利要求1所述的环境空气O3人群暴露的时空精细化分析评估方法,其特征在于,所述的步骤S3,具体包括如下步骤:
S31:所述的任一终端机向远程服务器上传局部区域的Pi、Ci信息;
S32:向远程服务器发出请求,返回该局部区域内的总的人口加权O3暴露值。
8.一种实施权利要求1-7任一项所述方法的近地面O3人群暴露的时空精细化分析评估系统,其特征在于,其包括一基于网络的计算机系统,该系统包括一远程服务器及多个终端机,所述的远程服务器内置有所述公式(1)-(2)的计算机程序;所述远程服务器内置的程序包括依次连接并交互通讯的数据采集单元、数据处理单元及人群暴露分析单元;所述的数据处理单元包括Pi数据模块、Ci数据更新模块及Ci历史数据模块;所述的Pi数据模块、Ci数据更新模块分别与外部动态图更新数据源连接并定时更新数据;所述的Ci历史数据模块包括已有Ci历史数据程序、历史浓度参数选择程序、标准数据集构建程序、历史浓度模拟程序及机器学习与模型验证程序,各程序交互通讯,由机器学习与模型验证程序运算后获得缺少Ci历史模拟数据,并且与已有Ci历史数据汇总后,输出给人群暴露分析评估单元,得到基于多参数和机器学习而补齐历史缺失数据的大区域、长期高精度的时空变化趋势,并进一步为小区域、短周期高精度的时空变化趋势预测提供预测依据。
9.根据权利要求8所述的环境空气O3人群暴露的时空精细化分析评估系统,其特征在于,所述的远程服务器,通过互联网与外部数据源连接,定时获取新数据,进行计算并输出新的分析评估结果。
10.根据权利要求8所述的环境空气O3人群暴露的时空精细化分析评估系统,其特征在于,所述的外部数据源为动态更新的数据源,包括:O3站点监测的浓度数据;气象数据;全球化学传输模型输出数据;土地利用数据;道路数据;归一化植被指数;高程数据;人口数据;虚拟变量数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211174562.9A CN116504327B (zh) | 2022-09-26 | 2022-09-26 | 近地面o3人群暴露的时空精细化分析评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211174562.9A CN116504327B (zh) | 2022-09-26 | 2022-09-26 | 近地面o3人群暴露的时空精细化分析评估方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116504327A true CN116504327A (zh) | 2023-07-28 |
CN116504327B CN116504327B (zh) | 2024-01-30 |
Family
ID=87321909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211174562.9A Active CN116504327B (zh) | 2022-09-26 | 2022-09-26 | 近地面o3人群暴露的时空精细化分析评估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116504327B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446401A (zh) * | 2016-09-22 | 2017-02-22 | 天津大学 | 一种基于gis的pm2.5可视化动态扩散仿真系统 |
CN107832910A (zh) * | 2017-09-30 | 2018-03-23 | 东南大学 | 一种评价道路交通特征对一氧化碳排放浓度影响的方法 |
CN110503348A (zh) * | 2019-09-09 | 2019-11-26 | 中南大学 | 一种基于位置匹配的个体空气污染暴露模拟测量方法 |
CN110555545A (zh) * | 2019-07-25 | 2019-12-10 | 南京大学 | 一种基于时空特征的生活污水产污负荷量测算方法 |
CN113298439A (zh) * | 2021-06-22 | 2021-08-24 | 中国平安财产保险股份有限公司 | 基于人口分布的环境风险评估方法、装置及计算机设备 |
CN113888381A (zh) * | 2021-09-24 | 2022-01-04 | 中科三清科技有限公司 | 污染物浓度预报方法及装置 |
CN113919227A (zh) * | 2021-10-15 | 2022-01-11 | 中国矿业大学(北京) | 一种矿区生态时间累积效应点与空间累积范围识别方法 |
CN114004514A (zh) * | 2021-11-04 | 2022-02-01 | 四川省气象灾害防御技术中心 | 一种大气臭氧污染发生气象条件等级判别方法 |
CN114021436A (zh) * | 2021-10-26 | 2022-02-08 | 武汉大学 | 一种基于近地面紫外辐射的近地面臭氧反演方法 |
CN114926749A (zh) * | 2022-07-22 | 2022-08-19 | 山东大学 | 基于遥感图像的近地面大气污染物反演方法及系统 |
-
2022
- 2022-09-26 CN CN202211174562.9A patent/CN116504327B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446401A (zh) * | 2016-09-22 | 2017-02-22 | 天津大学 | 一种基于gis的pm2.5可视化动态扩散仿真系统 |
CN107832910A (zh) * | 2017-09-30 | 2018-03-23 | 东南大学 | 一种评价道路交通特征对一氧化碳排放浓度影响的方法 |
CN110555545A (zh) * | 2019-07-25 | 2019-12-10 | 南京大学 | 一种基于时空特征的生活污水产污负荷量测算方法 |
CN110503348A (zh) * | 2019-09-09 | 2019-11-26 | 中南大学 | 一种基于位置匹配的个体空气污染暴露模拟测量方法 |
CN113298439A (zh) * | 2021-06-22 | 2021-08-24 | 中国平安财产保险股份有限公司 | 基于人口分布的环境风险评估方法、装置及计算机设备 |
CN113888381A (zh) * | 2021-09-24 | 2022-01-04 | 中科三清科技有限公司 | 污染物浓度预报方法及装置 |
CN113919227A (zh) * | 2021-10-15 | 2022-01-11 | 中国矿业大学(北京) | 一种矿区生态时间累积效应点与空间累积范围识别方法 |
CN114021436A (zh) * | 2021-10-26 | 2022-02-08 | 武汉大学 | 一种基于近地面紫外辐射的近地面臭氧反演方法 |
CN114004514A (zh) * | 2021-11-04 | 2022-02-01 | 四川省气象灾害防御技术中心 | 一种大气臭氧污染发生气象条件等级判别方法 |
CN114926749A (zh) * | 2022-07-22 | 2022-08-19 | 山东大学 | 基于遥感图像的近地面大气污染物反演方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116504327B (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Eliasson et al. | Spatial air temperature variations and urban land use-a statistical approach | |
Yang et al. | Quantifying air pollution removal by green roofs in Chicago | |
Yu et al. | Investigating impacts of urban morphology on spatio-temporal variations of solar radiation with airborne LIDAR data and a solar flux model: a case study of downtown Houston | |
Hassan | Climate change impact on groundwater recharge of Umm er Radhuma unconfined aquifer Western Desert, Iraq | |
Xiao et al. | Climate-adaptive landscape design: Microclimate and thermal comfort regulation of station square in the Hokuriku Region, Japan | |
Shinzato et al. | Calibration process and parametrization of tropical plants using ENVI-met V4–Sao Paulo case study | |
Roshan et al. | Evaluating the wind cooling potential on outdoor thermal comfort in selected Iranian climate types | |
Alijani et al. | A new approach of urban livability in Tehran: Thermal comfort as a primitive indicator. Case study, district 22 | |
Dorigon et al. | Spatial modeling of an urban Brazilian heat island in a tropical continental climate | |
Ebrahimabadi et al. | Microclimate assessment method for urban design–A case study in subarctic climate | |
Romanic et al. | Wind and tornado climatologies and wind resource modelling for a modern development situated in “Tornado Alley” | |
Li et al. | Evaluating the improvements of thermal comfort by different natural elements within courtyards in Singapore | |
Dunichkin et al. | Studies and evaluation of bioclimatic comfort of residential areas for improving the quality of environment | |
Stocco et al. | Evaluation of design schemes for urban squares in arid climate cities, Mendoza, Argentina | |
CN115952702A (zh) | 一种基于forcchn模型和遥感数据的森林nep的计算方法 | |
Bal et al. | Temporal analysis of thermal bioclimate conditions between Kolkata (India) and its three neighbouring suburban sites | |
Zhang et al. | Landscape Configuration Effects on Outdoor Thermal Comfort across Campus—A Case Study | |
CN116504327B (zh) | 近地面o3人群暴露的时空精细化分析评估方法及系统 | |
Hargy | Objectively mapping accumulated temperature for Ireland | |
Cilek et al. | The effects of 2-D and 3-D urban landscape metrics on mean radiant temperature in hot-arid Phoenix and Tempe, Arizona, USA | |
KR20200001969A (ko) | 피톤치드 정보 제공시스템 | |
Heisler et al. | J2. 7 EMPIRICAL MODELING AND MAPPING OF BELOW-CANOPY AIR TEMPERATURES IN BALTIMORE, MD AND VICINITY | |
CN114564517A (zh) | 一种结合气候数据与社会感知数据的康养气候评价方法 | |
Savić et al. | Urban climate issues in complex urbanized environments: A review of the literature for Novi Sad (Serbia) | |
Baruti et al. | Spatial and temporal variations of microclimate and outdoor thermal comfort in informal settlements of warm humid Dar es Salaam, Tanzania |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |