CN114611706B - 基于Stacking多模型融合设计的空气污染物缺失值补充方法 - Google Patents
基于Stacking多模型融合设计的空气污染物缺失值补充方法 Download PDFInfo
- Publication number
- CN114611706B CN114611706B CN202210155739.4A CN202210155739A CN114611706B CN 114611706 B CN114611706 B CN 114611706B CN 202210155739 A CN202210155739 A CN 202210155739A CN 114611706 B CN114611706 B CN 114611706B
- Authority
- CN
- China
- Prior art keywords
- data
- model
- value
- hyperopt
- air
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000809 air pollutant Substances 0.000 title claims abstract description 35
- 231100001243 air pollutant Toxicity 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000001502 supplementing effect Effects 0.000 title claims abstract description 21
- 238000013461 design Methods 0.000 title claims abstract description 15
- 230000004927 fusion Effects 0.000 title claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 44
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 238000012360 testing method Methods 0.000 claims description 26
- 238000003066 decision tree Methods 0.000 claims description 12
- 238000003915 air pollution Methods 0.000 claims description 8
- 238000002790 cross-validation Methods 0.000 claims description 6
- 230000007812 deficiency Effects 0.000 claims description 6
- 239000003344 environmental pollutant Substances 0.000 claims description 4
- 231100000719 pollutant Toxicity 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000007637 random forest analysis Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 5
- 239000000356 contaminant Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 208000019693 Lung disease Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000020477 pH reduction Effects 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/06—Investigating concentration of particle suspensions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/0004—Gaseous mixtures, e.g. polluted air
- G01N33/0009—General constructional details of gas analysers, e.g. portable test equipment
- G01N33/0062—General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display
- G01N33/0063—General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display using a threshold to release an alarm or displaying means
- G01N33/0065—General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display using a threshold to release an alarm or displaying means using more than one threshold
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/0004—Gaseous mixtures, e.g. polluted air
- G01N33/0009—General constructional details of gas analysers, e.g. portable test equipment
- G01N33/0062—General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display
- G01N33/0068—General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display using a computer specifically programmed
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Immunology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Food Science & Technology (AREA)
- Combustion & Propulsion (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Dispersion Chemistry (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于Stacking多模型融合设计的空气污染物缺失值补充方法。该方法包括:获取各个国控站点监测的空气污染物数据和地理数据;针对每个国控站点,遍历其上的所有空气污染物数据,找到缺失值,并将缺失值所在位置处的数值补充为0;再次遍历其上的所有空气污染物数据,将数值非0的数据加入至训练集中,将数值为0的数据加入预测集中;将所有国控站点的训练集和预测集分别组合在一起,记作数据集Air‑data;使用Hyperopt分别对ET、RF、GBDT、XGBOOST和LGBM进行参数优化;将上述优化后的五种模型分别作为五个基学习器,将岭回归模型作为元学习器,基于数据集Air‑data对基学习器和元学习器进行融合得到Stacking集成模型;采用Stacking集成模型实现对空气污染物数据中的缺失值的估算。
Description
技术领域
本发明涉及空气污染物应用技术领域,尤其涉及一种基于Stacking多模型融合设计的空气污染物缺失值补充方法。
背景技术
过去的几十年里,随着工业化和城市化的快速发展,空气污染物浓度水平的不断上升已成为全球关注的焦点。根据世界卫生组织的数据,世界上每10人中就有9人生活在被污染的空气中。常见的空气污染物包括NO2,O3,PM10,PM2.5 等,它们不仅会导致环境问题,如土壤酸化,雾和霾,还会导致健康问题,如心脏病和肺部疾病。为了提前做好预防大气污染的准备,从而减轻大气污染对人体健康和经济的影响,我国已设立多个空气监测站,监测和收集空气污染数据,以便进一步研究。然而,由于收集传感器的损坏、设计不良的收集过程以及人为的错误等种种因素,各个国控站点观测到的数据总会有缺失。这些缺失的数据对后续时序数据的预测和分析带来了极大的困难。所以时序数据补缺是一个需要迫切解决的重要难题。
从数据缺失的性质而言,缺失数据的处理主要分为两种方案,一种是在尽量不影响研究结果的前提下将缺失记录删除,另一种就是研究如何按照采集数据的性质,规律等因素对缺失的数据进行补充。当只有极少量数据发生缺失时,可以在研究中使用删除少量缺失记录的方式来处理缺失数据。相比于删除法的大量使用限制,使用各种方式对由于不可控因素导致的采集数据缺失进行补充可以说是一种较为通用的方式。相关研究人员尝试使用均值,上一个有效记录等数据来对缺失数据进行填补,但是原始的均值填补法由于填补的数据为均值数据忽略了原始采集数据的变化趋势。
发明内容
针对现有技术存在的精度低、分析程序复杂和时序性差的问题,本发明提供一种基于Stacking多模型融合设计的空气污染物缺失值补充方法。
本发明提供一种基于Stacking多模型融合设计的空气污染物缺失值补充方法,包括:
步骤1:获取各个国控站点监测的空气污染物数据和地理数据;
步骤2:针对每个国控站点,遍历其上的所有空气污染物数据,找到每个类型污染物的缺失值,并将缺失值所在位置处的数值补充为0;然后,再次遍历其上的所有空气污染物数据,将数值非0的数据加入至训练集中,将数值为0的数据加入预测集中;将所有国控站点的训练集和预测集分别组合在一起,记作数据集Air-data;
步骤3:使用贝叶斯优化法Hyperopt分别对极端决策树模型ET、随机森林模型RF、迭代决策树模型GBDT、分布式梯度增强树模型XGBOOST和分布式梯度决策树模型LGBM进行参数优化,将优化后的模型分别记作Hyperopt-ET、 Hyperopt-RF、Hyperopt-GBDT、Hyperopt-XGBOOST和Hyperopt-LGBM;
步骤4:将Hyperopt-ET、Hyperopt-RF、Hyperopt-GBDT、Hyperopt-XGBOOST 和Hyperopt-LGBM五种模型分别作为五个基学习器,将岭回归模型作为元学习器,基于所述数据集Air-data对所述基学习器和所述元学习器进行融合得到 Stacking集成模型;
步骤5:采用所述Stacking集成模型实现对空气污染物数据中的缺失值的估算。
进一步地,所述方法还包括:
若在某个国控站点上找到的缺失值的数量与其上的所有数据量的比值大于设定阈值,则认为该国控站点上的缺失值较多;
将缺失值较多的国控站点对应的数据从数据集Air-data中进行剔除。
进一步地,步骤4具体包括:
步骤4.1:将数据集Air-data中的训练集按照设定比例重新划分为训练集A 和测试集B;
步骤4.2:根据训练集A采用5折交叉验证方式分别对五个所述基学习器进行训练,采用训练好的五个所述基学习器分别生成五个数据集A1、A2、A3、 A4和A5;所述数据集A1、A2、A3、A4和A5的数据量均与训练集A的数据量相同;
步骤4.3:将所述数据集A1、A2、A3、A4和A5组合在一起作为岭回归模型的训练集,使得所述岭回归模型学习得到五个所述基学习器的输出结果与真实的空气污染物数据之间的关系,即为Stacking集成模型。
进一步地,所述方法还包括:
在对五个所述基学习器采用5折交叉验证方式进行训练的过程中,将测试集 B划分为五部分,选择其中的四部分用来训练,并对剩下的一部分进行预测,并将五次预测结果进行平均得到新的测试集B1;所述测试集B1的数据量与所述测试集B的数据量相同;
采用所述测试集B1验证所述Stacking集成模型的性能。
进一步地,所述空气污染物数据包括:小时NO2浓度、小时PM10浓度、小时PM2.5浓度和小时O3浓度。
进一步地,所述地理数据包括:经度和纬度。
进一步地,验证所述Stacking集成模型的性能时所用的指标包括:决定系数、平均绝对误差和均方根误差。
本发明的有益效果:
本发明采用Hyperopt-ET、Hyperopt-RF、Hyperopt-GBDT、 Hyperopt-XGBOOST和Hyperopt-LGBM五种模型作为基学习器,通过交叉验证训练基学习器,岭回归作为元学习器;其中,第一层的多个基学习器以原始训练集为输入,第二层的岭回归模型再以第一层的输出作为特征来训练元学习器,最终得到完整的模型,之后用于估算缺失的空气污染物浓度。Stacking集成方法集成了多种学习器的估算与预测结果,克服了单个模型的缺陷,优化了线性回归的输入,提升了模型整体性能。
附图说明
图1为本发明实施例提供的基于Stacking多模型融合设计的空气污染物缺失值补充方法的流程示意图;
图2为本发明实施例提供的对基学习器和元学习器进行融合得到Stacking 集成模型的示意图;
图3为本发明实施例提供的Stacking集成模型使用测试集进行估算后,取前 300个测试样本估算结果与真实结果的对比图;
图4为本发明实施实例提供的同一地点的实际污染物浓度值与模型估算污染物浓度值的散点图;
图5为本发明实施例提供的Stacking集成模型与其他模型在数据集Air-data上的训练效果对比图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供的基于Stacking多模型融合设计的空气污染物缺失值补充方法,包括以下步骤:
S101:获取各个国控站点监测的空气污染物数据和地理数据;
具体地,所述空气污染物数据包括:小时NO2浓度、小时PM10浓度、小时 PM2.5浓度和小时O3浓度;所述地理数据包括:经度和纬度。
S102:针对每个国控站点,遍历其上的所有空气污染物数据,找到每个类型污染物的缺失值,并将缺失值所在位置处的数值补充为0;然后,再次遍历其上的所有空气污染物数据,将数值非0的数据加入至训练集中,将数值为0的数据加入预测集中;将所有国控站点的训练集和预测集分别组合在一起,记作数据集 Air-data;
具体地,国控站点监测的空气污染物数据是以CSV格式存储的,为了便于数据处理,可以使用python读取CSV文件,然后将该CSV文件数据导入MySQL 中进行整理。
需要说明的是,一般而言,在现实中,NO2、PM10、PM2.5和O3的浓度值不会为0,所以浓度为0的数据同样当作缺失值。
S103:使用贝叶斯优化法Hyperopt分别对极端决策树模型ET、随机森林模型RF、迭代决策树模型GBDT、分布式梯度增强树模型XGBOOST和分布式梯度决策树模型LGBM进行参数优化,将优化后的模型分别记作Hyperopt-ET、 Hyperopt-RF、Hyperopt-GBDT、Hyperopt-XGBOOST和Hyperopt-LGBM;
具体地,Hyperopt-ET模型为基于贝叶斯算法优化的极端决策树模型、 Hyperopt-RF模型为基于贝叶斯算法优化的随机森林模型;Hyperopt-GBDT模型为基于贝叶斯算法优化的迭代决策树模型;Hyperopt-XGBOOST模型为基于贝叶斯算法优化的分布式梯度增强树、Hyperopt-LGBM模型为基于贝叶斯算法优化的分布式梯度决策树。
S104:将Hyperopt-ET、Hyperopt-RF、Hyperopt-GBDT、Hyperopt-XGBOOST 和Hyperopt-LGBM五种模型分别作为五个基学习器,将岭回归模型作为元学习器,基于所述数据集Air-data对所述基学习器和所述元学习器进行融合得到 Stacking集成模型;
作为一种可实施方式,如图2所示,本步骤包括以下子步骤:
S1041:将数据集Air-data中的训练集按照设定比例重新划分为训练集A和测试集B;
例如,将数据集Air-data按4:1的比例划分为训练集和测试集,然后对数据进行归一化,消除奇异样本数据的不良影响。
S1042:根据训练集A采用5折交叉验证方式分别对五个所述基学习器进行训练,采用训练好的五个所述基学习器分别生成五个数据集A1、A2、A3、A4 和A5;所述数据集A1、A2、A3、A4和A5的数据量均与训练集A的数据量相同;
S1043:将所述数据集A1、A2、A3、A4和A5组合在一起作为岭回归模型的训练集,使得所述岭回归模型学习得到五个所述基学习器的输出结果与真实的空气污染物数据之间的关系,即为Stacking集成模型。
S105:采用所述Stacking集成模型实现对空气污染物数据中的缺失值的估算。
若某一国控站点上的缺失值较多,即使进行数据的补缺,对后续空气污染物的预测和分析也会产生极大的影响,因此在上述实施例的基础上,本发明实施例在步骤S102之后,还包括:对数据集Air-data进行数据清理;主要包括以下内容:若在某个国控站点上找到的缺失值的数量与其上的所有数据量的比值大于设定阈值,则认为该国控站点上的缺失值较多;将缺失值较多的国控站点对应的数据从数据集Air-data中进行剔除。
例如,对某一国控站点监测到的小时浓度值缺失数量超过总数量的10%时,可以判定为该国控站点缺失值较多。
本发明实施例中,采用Hyperopt-ET、Hyperopt-RF、Hyperopt-GBDT、Hyperopt-XGBOOST和Hyperopt-LGBM五种模型作为基学习器,通过交叉验证训练基学习器,岭回归作为元学习器;其中,第一层的多个基学习器以原始训练集为输入,第二层的岭回归模型再以第一层的输出作为特征来训练元学习器,最终得到完整的模型,之后用于估算缺失的空气污染物浓度。Stacking集成方法集成了多种学习器的估算与预测结果,克服了单个模型的缺陷,优化了线性回归的输入,提升了模型整体性能。
在上述各实施例的基础上,本发明还包括:
在对五个所述基学习器采用5折交叉验证方式进行训练的过程中,将测试集 B划分为五部分,选择其中的四部分用来训练,并对剩下的一部分进行预测,并将五次预测结果进行平均得到新的测试集B1;所述测试集B1的数据量与所述测试集B的数据量相同;
采用所述测试集B1验证所述Stacking集成模型的性能。
作为一种可实施方式,验证所述Stacking集成模型的性能时所用的指标包括:决定系数、平均绝对误差和均方根误差。
具体地,在预测回归问题中,决定系数R2是用来衡量回归结果的好坏,也是回归拟合曲线的拟合优度。决定系数的取值在0到1之间,值越大越好,其中p为预测值,m为真实值,具体公式如下:
平均绝对误差MAE是绝对误差的平均值,能够更好的反映出预测值与真实值的误差实际情况,具体公式如下:
均方根误差RMSE主要衡量预测值和真实值之间的偏差,具体公式如下:
为了验证本发明所提供的方法的有效性,本发明还提供下述实验数据。
如图3、图4和图5所示,四种污染物NO2、PM10、PM2.5、O3的测试样本分别为16919、16358、16689和16900个,估算值与真实值决定系数R2分别为0.87、0.941、0.979和0.948。计算得测试集样本平均绝对误差MAE分别为4.236、 8.28、4.542和7.903,均方根误差RMSE为6.531、14.22、6.965和10.831。
相比于基学习器模型,Stacking集成模型表现出了更好的预测性能,并且有更高的斜率,说明低值高估和高值低估的现象相对不严重。Stacking集成模型的平均绝对误差(MAE)和均方根误差(RMSE)要小于其他五种模型的MAE和 RMSE,说明利用Stacking集成模型进行补缺时,其估算值与国控站点的观测值之间的误差和偏差更小,可以认为Stacking集成模型的估算结果更加接近真值,回归模型表现更好的性能。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.基于Stacking多模型融合设计的空气污染物缺失值补充方法,其特征在于,包括:
步骤1:获取各个国控站点监测的空气污染物数据和地理数据;
步骤2:针对每个国控站点,遍历其上的所有空气污染物数据,找到每个类型污染物的缺失值,并将缺失值所在位置处的数值补充为0;然后,再次遍历其上的所有空气污染物数据,将数值非0的数据加入至训练集中,将数值为0的数据加入预测集中;将所有国控站点的训练集和预测集分别组合在一起,记作数据集Air-data;
步骤3:使用贝叶斯优化法Hyperopt分别对极端决策树模型ET、随机森林模型RF、迭代决策树模型GBDT、分布式梯度增强树模型XGBOOST和分布式梯度决策树模型LGBM进行参数优化,将优化后的模型分别记作Hyperopt-ET、Hyperopt-RF、Hyperopt-GBDT、Hyperopt-XGBOOST和Hyperopt-LGBM;
步骤4:将Hyperopt-ET、Hyperopt-RF、Hyperopt-GBDT、Hyperopt-XGBOOST和Hyperopt-LGBM五种模型分别作为五个基学习器,将岭回归模型作为元学习器,基于所述数据集Air-data对所述基学习器和所述元学习器进行融合得到Stacking集成模型;
步骤5:采用所述Stacking集成模型实现对空气污染物数据中的缺失值的估算。
2.根据权利要求1所述的基于Stacking多模型融合设计的空气污染物缺失值补充方法,其特征在于,还包括:
若在某个国控站点上找到的缺失值的数量与其上的所有数据量的比值大于设定阈值,则认为该国控站点上的缺失值较多;
将缺失值较多的国控站点对应的数据从数据集Air-data中进行剔除。
3.根据权利要求1所述的基于Stacking多模型融合设计的空气污染物缺失值补充方法,其特征在于,步骤4具体包括:
步骤4.1:将数据集Air-data中的训练集按照设定比例重新划分为训练集A和测试集B;
步骤4.2:根据训练集A采用5折交叉验证方式分别对五个所述基学习器进行训练,采用训练好的五个所述基学习器分别生成五个数据集A1、A2、A3、A4和A5;所述数据集A1、A2、A3、A4和A5的数据量均与训练集A的数据量相同;
步骤4.3:将所述数据集A1、A2、A3、A4和A5组合在一起作为岭回归模型的训练集,使得所述岭回归模型学习得到五个所述基学习器的输出结果与真实的空气污染物数据之间的关系,即为Stacking集成模型。
4.根据权利要求3所述的基于Stacking多模型融合设计的空气污染物缺失值补充方法,其特征在于,还包括:
在对五个所述基学习器采用5折交叉验证方式进行训练的过程中,将测试集B划分为五部分,选择其中的四部分用来训练,并对剩下的一部分进行预测,并将五次预测结果进行平均得到新的测试集B1;所述测试集B1的数据量与所述测试集B的数据量相同;
采用所述测试集B1验证所述Stacking集成模型的性能。
5.根据权利要求1所述的基于Stacking多模型融合设计的空气污染物缺失值补充方法,其特征在于,所述空气污染物数据包括:小时NO2浓度、小时PM10浓度、小时PM2.5浓度和小时O3浓度。
6.根据权利要求1所述的基于Stacking多模型融合设计的空气污染物缺失值补充方法,其特征在于,所述地理数据包括:经度和纬度。
7.根据权利要求4所述的基于Stacking多模型融合设计的空气污染物缺失值补充方法,其特征在于,验证所述Stacking集成模型的性能时所用的指标包括:决定系数、平均绝对误差和均方根误差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210155739.4A CN114611706B (zh) | 2022-02-21 | 2022-02-21 | 基于Stacking多模型融合设计的空气污染物缺失值补充方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210155739.4A CN114611706B (zh) | 2022-02-21 | 2022-02-21 | 基于Stacking多模型融合设计的空气污染物缺失值补充方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114611706A CN114611706A (zh) | 2022-06-10 |
CN114611706B true CN114611706B (zh) | 2023-04-25 |
Family
ID=81858504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210155739.4A Active CN114611706B (zh) | 2022-02-21 | 2022-02-21 | 基于Stacking多模型融合设计的空气污染物缺失值补充方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114611706B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116698688A (zh) * | 2023-04-20 | 2023-09-05 | 兰州大学 | 一种基于风云4号双星协同估算大气颗粒物浓度的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10733515B1 (en) * | 2017-02-21 | 2020-08-04 | Amazon Technologies, Inc. | Imputing missing values in machine learning models |
CN112884079A (zh) * | 2021-03-30 | 2021-06-01 | 河南大学 | 一种基于Stacking集成模型的近地面二氧化氮浓度估算方法 |
CN113984969A (zh) * | 2021-10-26 | 2022-01-28 | 西安交通大学 | 一种基于多源时空数据融合的空气质量预测方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112598134A (zh) * | 2020-12-23 | 2021-04-02 | 南京三眼精灵信息技术有限公司 | 融合人工经验和集成学习策略的机器学习方法及装置 |
CN112817954A (zh) * | 2021-01-27 | 2021-05-18 | 胡安民 | 一种基于多种方法集成学习的缺失值插补方法 |
CN113987912A (zh) * | 2021-09-18 | 2022-01-28 | 陇东学院 | 一种基于地理信息的污染物在线监测系统 |
-
2022
- 2022-02-21 CN CN202210155739.4A patent/CN114611706B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10733515B1 (en) * | 2017-02-21 | 2020-08-04 | Amazon Technologies, Inc. | Imputing missing values in machine learning models |
CN112884079A (zh) * | 2021-03-30 | 2021-06-01 | 河南大学 | 一种基于Stacking集成模型的近地面二氧化氮浓度估算方法 |
CN113984969A (zh) * | 2021-10-26 | 2022-01-28 | 西安交通大学 | 一种基于多源时空数据融合的空气质量预测方法及系统 |
Non-Patent Citations (1)
Title |
---|
Julia Friend等.Handling Missing Values in Multivariate Time Series Classification.2018 IEEE MIT Undergraduate Research Tecknology Conference(URTC).2018,第1-3页. * |
Also Published As
Publication number | Publication date |
---|---|
CN114611706A (zh) | 2022-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112529240B (zh) | 一种大气环境数据的预测方法、系统、装置及存储介质 | |
Cael et al. | The size-distribution of Earth’s lakes | |
Andres et al. | Monthly, global emissions of carbon dioxide from fossil fuel consumption | |
Mateo et al. | Do stacked species distribution models reflect altitudinal diversity patterns? | |
CN112766454B (zh) | 一种空气pm2.5浓度预测方法、系统、终端及存储介质 | |
CN114611706B (zh) | 基于Stacking多模型融合设计的空气污染物缺失值补充方法 | |
Aguilar et al. | Accuracy assessment of digital elevation models using a non‐parametric approach | |
CN115269675A (zh) | 工业园区大气污染时空解析方法 | |
Osborn et al. | Performance of pattern-scaled climate projections under high-end warming. Part I: surface air temperature over land | |
CN115438848A (zh) | 基于深度混合图神经网络的pm2.5浓度长期预测方法 | |
Reza Koohkan et al. | Accounting for representativeness errors in the inversion of atmospheric constituent emissions: application to the retrieval of regional carbon monoxide fluxes | |
Erickson et al. | Accounting for imperfect detection in data from museums and herbaria when modeling species distributions: combining and contrasting data‐level versus model‐level bias correction | |
CN115526298A (zh) | 一种高鲁棒性的大气污染物浓度综合预测方法 | |
CN116415730A (zh) | 一种预测水位的融合自注意力机制时空深度学习模型 | |
Wang et al. | Narrowing the spread in CMIP5 model projections of air-sea CO2 fluxes | |
Fletcher et al. | Quantifying uncertainty from aerosol and atmospheric parameters and their impact on climate sensitivity | |
Wu et al. | Can changes in the distributions of resident birds in China over the past 50 years be attributed to climate change? | |
CN116776073B (zh) | 一种污染物浓度的评估方法和装置 | |
Ståhl et al. | Informative plot sizes in presence‐absence sampling of forest floor vegetation | |
CN113486295A (zh) | 基于傅里叶级数的臭氧总量变化预测方法 | |
Bird et al. | Sensitivity of extreme precipitation to climate change inferred using artificial intelligence shows high spatial variability | |
Gill et al. | Context aware model-based cleaning of data streams | |
Snell Taylor et al. | Using temporal occupancy to predict avian species distributions | |
Grieser | Interpolation of global monthly rain gauge observations for climate change analysis | |
Clifton | Constraints on Ozone Removal by Land and Implications for 21 th Century Ozone Pollution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |