CN115796402A - 一种基于组合模型的空气质量指数预测方法 - Google Patents

一种基于组合模型的空气质量指数预测方法 Download PDF

Info

Publication number
CN115796402A
CN115796402A CN202310076823.1A CN202310076823A CN115796402A CN 115796402 A CN115796402 A CN 115796402A CN 202310076823 A CN202310076823 A CN 202310076823A CN 115796402 A CN115796402 A CN 115796402A
Authority
CN
China
Prior art keywords
model
aqi
air quality
prediction
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310076823.1A
Other languages
English (en)
Other versions
CN115796402B (zh
Inventor
高嵩
张恒升
何卓骏
刘子岳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Univeristy of Technology
Original Assignee
Chengdu Univeristy of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Univeristy of Technology filed Critical Chengdu Univeristy of Technology
Priority to CN202310076823.1A priority Critical patent/CN115796402B/zh
Publication of CN115796402A publication Critical patent/CN115796402A/zh
Application granted granted Critical
Publication of CN115796402B publication Critical patent/CN115796402B/zh
Priority to US18/206,100 priority patent/US11816556B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Atmospheric Sciences (AREA)
  • Environmental Sciences (AREA)
  • Ecology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于组合模型的空气质量指数预测方法,提出了基于RF和CLA的差异融合季节性预测模型DF‑SPM,在预测过程中,在不同季节使用最佳阈值区间搜寻算法,学习搜寻到四个季节的最佳阈值区间,并在此基础上,从RF和CLA预测值中选择得到最终预测结果。该模型充分考虑了AQI的季节性周期特征,以四季作为时间尺度划分每一年的数据集,来搜寻最佳阈值区间,可精细得到不同时段的阈值区间,以获得更高的预测精度。该模型使用最佳阈值区间的确定策略优于单一阈值策略,减少最优解搜寻难度,用于提取AQI历史波动特征,实现更高精度的预测。

Description

一种基于组合模型的空气质量指数预测方法
技术领域
本发明属于空气污染技术领域,具体涉及一种基于组合模型的空气质量指数预测方法。
背景技术
空气质量指数(Air Quality Index, AQI)是定量描述空气质量状况的无量纲指标,它能够直观评价大气的环境污染水平,在预防和减少空气污染方面发挥着至关重要的作用。在中国,空气质量指数被分为六个不同级别(I~VI),对应于六个不同的空气质量类别。AQI的等级和数值越大,空气中污染物浓度就越高,对健康的伤害就越大,人体舒适程度就越低。空气质量指数预测可以为减少环境污染和向旅行者发出预警提供有价值的理论依据。受人类活动和气象因素的重大影响,大气是一个复杂的多层次系统,这使得AQI预测的准确性难以保证。因此,人们已经提出了一些统计模型和机器学习模型来解决空气质量指数和空气污染物预测带来的困难。
现有的利用机器学习模型来进行空气质量指数预测的方法包括:
(1)基于空气质量和气象数据利用基于门控单元的循环神经网络进行预测,该方法采用了单一的模型,其预测能力对时间序列的处理存在瓶颈,无法提升预测准确率,其在预测过程中仅考虑时间序列数据间的依赖关系,未考虑AQI序列空间特征,模型对于不同地区预测,泛化能力弱,预测性能不足,无法应用多地区检测,实用性受到限制;另一方面,该方法局限于短期预测,无法针对长期空气质量指数序列进行预测。
(2)基于注意力的图卷积神经网络和长短期记忆神经网络结合的预测方法,该方法中网络训练与预测能力之间存在矛盾,容易导致过度拟合的问题,当达到极限时,预测能力会随着训练能力的提高而下降;另外,网络模型的层数本身有限,特征提取和权重分配效果可能不佳,预测精度提升受到限制;两种模型的输入变量的参数较多,在预测过程中存在较大的运算压力。
(3)基于卷积神经网络、门控循环单元和注意力机制结合建立的空气质量指数预测模型,该预测方法与前面一样,仅考虑时间序列数据间的依赖关系,未考虑AQI序列空间特征,模型对于不同地区预测泛化能力较弱,预测性能不足,无法应用多地区预测,实用性限制;同时,该方法局限于短期预测,无法针对长期空气质量指数序列进行预测。
发明内容
针对现有技术中的上述不足,本发明提供的基于组合模型的空气质量指数预测方法解决了现有的预测方法中采用单一模型预测精度不足、预测过程中容易受到各种随机因素的干扰、未充分考虑空气质量指数的时间和空间特征,使得预测模型局限于特定地区和短期预测的问题。
为了达到上述发明目的,本发明采用的技术方案为: 一种基于组合模型的空气质量指数预测方法,包括以下步骤:
S1、采集历史空气质量数据,并进行预处理;
其中,空气质量数据包括空气质量指数AQI和污染物项目指标;
S2、构建差异融合季节性预测模型,利用历史空气质量数据对其进行训练,并确定各季节的AQI最佳阈值区间;
所述差异融合季节性预测模型包括并列的RF模型和CLA模型;
S3、将待预测日之前的污染物项目指标作为差异融合季节性预测模型的输入,根据待预测日所在季节的AQI最佳阈值区间选择RF模型或CLA模型的预测空气质量指数AQI作为差异融合季节性预测模型的输出,得到待预测日的空气质量指数AQI预测结果。
进一步地,所述步骤S1中污染物项目指标包括CO、NO2、O3、PM10、PM2.5和SO2的每日平均监测浓度数据;
所述步骤S1中,对历史空气质量数据进行预处理为补全缺失数据,补全缺失数据的方法为:
当缺少连续i日的空气质量数据时,将前i日和后i日空气质量数据的平均值X AVG 作为缺失数据X M ;当i=1时,缺失数据X M =X AVG /2,当2≤i≤5时,缺失数据X M =(X M-1+X AVG )/2;其中,
Figure SMS_1
X P 为前i日空气质量数据,X N 为后i日空气质量数据,下标M=n,…,n+i-1,P=n-i,…,n-1,N=n+i,…,n+2i-1。
进一步地,所述步骤S2中,所述RF模型和CLA模型的输入数据均为前7日的空气质量数据,输出标签为后一日的空气质量指数AQI;
所述CLA模型包括依次连接的CNN模块、LSTM模块、ATTENTION模块以及全连接层;
所述CNN模块用于提取输入数据的特征,并将其展平成一维的时间序列;
所述LSTM模块用于分析输入时间序列的时间序列特征;
所述ATTENTION模块用于分析并突出输入时间序列特征中的关键信息。
进一步地,所述CNN模块输出时间序列的公式为:
Figure SMS_2
式中,
Figure SMS_3
为输出时间序列的第i行第j列中的值,
Figure SMS_4
为输入7
Figure SMS_5
7矩阵的行i和列j中的值,
Figure SMS_6
为ReLU激活函数,
Figure SMS_7
为卷积核的行m和列n中的权重,b为卷积核的偏差;
所述LSTM模块为双向长短期记忆模型Bi-LSTM,其对输入时间序列的分析公式为:
Figure SMS_8
Figure SMS_9
Figure SMS_10
Figure SMS_11
Figure SMS_12
Figure SMS_13
Figure SMS_14
Figure SMS_15
Figure SMS_16
Figure SMS_17
Figure SMS_18
Figure SMS_19
Figure SMS_20
式中,参数上的左右箭头表示输入时间序列的正向和反向顺序;
Figure SMS_33
为CNN模块的输出
Figure SMS_24
在LSTM模块的表达形式;
Figure SMS_30
为输入门,
Figure SMS_22
为Sigmoid激活函数,
Figure SMS_38
分别为输入门的当前时刻输入和上一时刻输出的权重矩阵,
Figure SMS_25
为上一时刻输出结果,
Figure SMS_40
为输入门的偏置;
Figure SMS_26
为遗忘门,
Figure SMS_34
分别为遗忘门的当前时刻输入和上一时刻输出的权重矩阵,
Figure SMS_21
为遗忘门偏置;
Figure SMS_29
为输出门,
Figure SMS_23
分别为遗忘门的当前时刻输入和上一时刻输出的权重矩阵,
Figure SMS_31
为输出门偏置;
Figure SMS_27
为神经元,
Figure SMS_32
为激活函数,
Figure SMS_35
分别为自循环状态的当前时刻输入和上一时刻输出的权重矩阵,
Figure SMS_39
为自循环状态偏置;
Figure SMS_36
为LSTM模块中的存储单元;
Figure SMS_37
为LSTM模块的最终隐藏元素,为前向输出和后向输出的连接向量;符号
Figure SMS_28
为相乘运算符;
所述LSTM模块的正反输出结果通过乘法连接得到其输出的时间序列特征;
所述ATTENTION模块嵌入所述LSTM模块的时间序列特征分析过程中,采用Softmax激活函数突出时间序列特征中的关键信息。
进一步地,所述步骤S2中,对差异融合季节性预测模型进行训练的方法具体为:
S2-1、将预处理的数据划分为训练集和测试集;
S2-2、利用训练集对RF模型和CLA模型分别进行训练;
S2-3、利用训练的RF模型和CLA模型对测试集进行AQI预测,得到对应的预测结果;
S2-4、将RF模型预测结果、CLA模型预测结果与测试集中真实AQI数据按季节进行分类;
S2-5、基于各季节的数据,利用最佳阈值区间搜索方法确定每个季节的AQI最佳阈值区间。
进一步地,所述步骤S2-1中,对RF模型或CLA模型进行训练时,将MAE值最小时对应的模型参数作为RF模型或CLA模型的最佳参数;
所述MAE值的计算公式为:
Figure SMS_41
式中,
Figure SMS_42
为第i日的AQI实际值,
Figure SMS_43
为第i日的AQI预测值。
进一步地,所述步骤S2-5中,确定任一季节的AQI最佳阈值区间的方法为:
S2-51、初始化阈值区间[Down,Up],并设置最大阈值区间及变化步长,Down为区间最小值,Up为区间最大值;
S2-52、遍历同一季节下RF模型预测结果
Figure SMS_44
、CLA模型预测结果
Figure SMS_45
与测试集中真实AQI数据;
Figure SMS_46
Figure SMS_47
均在当前阈值区间内时,将
Figure SMS_48
作为当前模型预测结果;
Figure SMS_49
Figure SMS_50
同时比Up大或比Down小时,将
Figure SMS_51
作为当前模型预测结果;
S2-53、将当前模型预测结果存入当前阈值区间下的预测集合
Figure SMS_52
中,并在遍历结束后,计算
Figure SMS_53
的MAE值存入集合
Figure SMS_54
S2-54、按设置变化步长修改阈值区间,并返回步骤S2-52,直到满足最大阈值区间;
S2-55、在集合
Figure SMS_55
中选择最小MAE值,将其对应的阈值区间作为当前季节的AQI最佳阈值区间。
进一步地,所述步骤S3中,确定差异融合季节性预测模型的输出的方法具体为:
当RF模型和CLA模型的预测空气质量指数AQI均在AQI最佳阈值区间内时,选择CLA模型的预测空气质量指数AQI作为差异融合季节性预测模型的输出;
当RF模型和CLA模型的预测空气质量指数AQI均不在AQI最佳阈值区间内时,选择RF模型的预测空气质量指数AQI作为差异融合季节性预测模型的输出;
当RF模型和CLA模型的预测空气质量指数AQI中任意一个处于AQI最佳阈值区间内,另一个处于AQI最佳阈值外时,根据待预测日所处区域中AQI变化特点分析的模型置信度,选择模型置信度更高的一个预测空气质量指数AQI作为差异融合季节性预测模型的输出。
本发明的有益效果为:
本发明技术将两种模型预测技术融合,结合最佳的选择策略,主要针对空气质量指数进行精准预测,具体有益效果包括:
(1)本发明中的基于组合模型的预测方法解决了单一模型预测精度不足问题,有效地提取单个预测模型的样本信息,综合利用CNN-LSTM-ATTENTION模型和RF模型的优势,从而提高预测模型的预测精度。同时,该融合模型预测提供两种模型预测值,增加模型容错性,减少了单个CNN-LSTM-ATTENTION模型和RF预测模型容易受各种随机因素的干扰,以及本身存在的问题,从而提高预测模型的预测精度。
(2)本发明中的差异融合季节性预测模型参数减少,且单一模型CNN-LSTM-ATTENTION的设计引入了dropout和注意力机制,对数据中的关键信息给予足够的关注,提高模型预测效率,降低了卷积计算压力和对模型运行时的算力需求。
(3)本发明是一种适用于多地区的长期空气质量指数预测方法,融合预测有效利用RF和CNN-LSTM-ATTENTION具有的预测性能的差异性,适用于AQI表现不同的多个空间站点的预测,同时充分考虑空气质量指数的季节性特征,季节性预测又保证了融合模型在长期预测中的性能。
(4)本发明方法中考虑了AQI四季有明显变化特征,将全年数据按四季分成四段时序数据,使得不同季节能够获得最好的最佳阈值区间。以往模型融合策略采用单一阈值方法,受AQI波动的影响大,往往最优解无法正确判断最终AQI预测结果或者甚至无法搜寻到最优解,本发明采用最佳阈值空间的方法能够有效解决该问题,提升预测精度。
附图说明
图1为本发明提供的基于组合模型的空气质量指数预测方法流程图。
图2为本发明提供的CLA模型示意图。
图3为本发明提供的DF-SPM和基线模型的MAE值在中国珠海市的预测对比图;(a)冬;(b)春;(c)夏;(d)秋。
图4为本发明提供的中国8个区域年度AQI季节均值变化曲线;(a)2019年;(b)2020年;(c)2021年。
图5为本发明提供的DF-SPM和基准模型的MAE在264个城市的预测对比图。
图6为本发明提供的DF-SPM和消融模型的MAE在264个城市的预测对比图。
图7为本发明提供的DF-SPM与RF、CLA模型在8个AQI不同区域的MAE评估结果统计图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
实施例1:
本发明实施例提供了一种基于组合模型的空气质量指数预测方法,如图1所示,包括以下步骤:
S1、采集历史空气质量数据,并进行预处理;
其中,空气质量数据包括空气质量指数AQI和污染物项目指标;
S2、构建差异融合季节性预测模型,利用历史空气质量数据对其进行训练,并确定各季节的AQI最佳阈值区间;
所述差异融合季节性预测模型包括并列的RF模型和CLA模型;
S3、将待预测日前的污染物项目指标作为差异融合季节性预测模型的输入,根据待预测日所在季节的AQI最佳阈值区间选择RF模型或CLA模型的预测空气质量指数AQI作为差异融合季节性预测模型的输出,得到待预测日的空气质量指数AQI预测结果。
本发明实施例的步骤S1中污染物项目指标包括CO、NO2、O3、PM10、PM2.5和SO2的每日平均监测浓度数据;
所述步骤S1中,对历史空气质量数据进行预处理为补全缺失数据,补全缺失数据的方法为:
当缺少连续i日的空气质量数据时,将前i日和后i日空气质量数据的平均值X AVG 作为缺失数据X M ;当i=1时,缺失数据X M =X AVG /2,当2≤i≤5时,缺失数据X M =(X M-1+X AVG )/2;其中,
Figure SMS_56
X P 为前i日空气质量数据,X N 为后i日空气质量数据,下标M=n,…,n+i-1,P=n-i,…,n-1,N=n+i,…,n+2i-1。
本发明实施例的步骤S2中,所述RF模型和CLA模型的输入数据均为前7日的空气质量数据,输出标签为后一日的空气质量指数AQI。
本实施例中的RF(随机森林)模型是一种集成监督学习算法,基于其有集成学习思想,故RF模型能很好防止过度拟合问题,建模难度小,成本低,且预测结果稳定有效。本实施例中的RF模型相较于传统的Naïve Bayes, Logistic Regression, single decisiontree and ANN学习模型具有更高的精度。
RF模型将决策树用作bagging中的模型,首先用bootstrap方法生成m个训练集,然后,对于每个训练集,构造一颗决策树,在节点寻找特征进行分裂时,不针对所有特征找到能使得指标(如信息增益)最大的,而是在特征中随机抽取一部分特征,在抽到的特征中间找到最优解,应用于节点,进行分裂。随机森林采用了bagging方法,也就是集成的思想,实际上相当于对于样本和特征都进行了采样,所以可以避免过拟合。
本实施例中的CLA(CNN-LSTM-ATTENTION,基于注意力机制的卷积神经网络和长短期记忆力模型)模型如图2所示, 包括依次连接的CNN模块、LSTM模块、ATTENTION模块以及全连接层;
其中,CNN模块用于提取输入数据的特征,并将其展平成一维的时间序列;LSTM模块用于分析输入时间序列的时间序列特征;ATTENTION模块用于分析并突出输入时间序列特征中的关键信息;本实施例中的CLA模型中还设置了Dropout,其作用是防止模型训练过拟合。
具体地,在本实施例中,CNN模块输出时间序列的公式为:
Figure SMS_57
式中,
Figure SMS_58
为输出时间序列的第i行第j列中的值,
Figure SMS_59
为输入7
Figure SMS_60
7矩阵的行i和列j中的值,
Figure SMS_61
为ReLU激活函数,
Figure SMS_62
为卷积核的行m和列n中的权重,b为卷积核的偏差;其中,ReLU激活函数的表达式为ReLU=max(0,x);
本实施例中的CNN模块中,输入数据使用64个1
Figure SMS_63
7一维卷积核进行卷积运算,且采用dropout操作;每个一维卷积核将从输入矩阵中提取特征并生成一维特征向量
Figure SMS_64
本实施例中LSTM模块为双向长短期记忆模型Bi-LSTM,其同样加入了dropout操作;传统LSTM的一个缺点是它们只能利用序列数据的先前上下文,双向LSTM可以通过两个独立的隐藏层同时处理两个方向上的时间序列数据。这些数据被级联并转发到输出层,这种方式可以为网络提供额外的上下文,并导致更快、更充分的学习问题。基于此,本实施例中的LSTM模块对输入时间序列的分析公式为:
Figure SMS_65
Figure SMS_66
Figure SMS_67
Figure SMS_68
Figure SMS_69
Figure SMS_70
Figure SMS_71
Figure SMS_72
Figure SMS_73
Figure SMS_74
Figure SMS_75
Figure SMS_76
Figure SMS_77
式中,参数上的左右箭头表示输入时间序列的正向和反向顺序,正向中LSTM 模块使用遗忘门ft、输入门it、输出门ot 来控制长期状态S,S将决定什么信息会被留下来或是被遗忘;
Figure SMS_82
为CNN模块的输出
Figure SMS_79
在LSTM模块的表达形式;
Figure SMS_89
为输入门, 用于决定应传输到下一时间步或输出的信息量,
Figure SMS_80
为Sigmoid激活函数,
Figure SMS_92
分别为输入门的当前时刻输入和上一时刻输出的权重矩阵,
Figure SMS_87
为上一时刻输出结果,
Figure SMS_94
为输入门的偏置;
Figure SMS_83
为遗忘门,确定当前单元状态 St 中有多少是上一时刻单元状态 St-1中传递过来的,并且由
Figure SMS_91
和 St-1 共同决定丢失什么信息,
Figure SMS_78
分别为遗忘门的当前时刻输入和上一时刻输出的权重矩阵,
Figure SMS_88
为遗忘门偏置;
Figure SMS_84
为输出门,
Figure SMS_86
分别为遗忘门的当前时刻输入和上一时刻输出的权重矩阵,
Figure SMS_85
为输出门偏置;
Figure SMS_93
为神经元,具有类似RNN的自循环细胞,
Figure SMS_95
为激活函数,
Figure SMS_98
分别为自循环状态的当前时刻输入和上一时刻输出的权重矩阵,
Figure SMS_96
为自循环状态偏置;
Figure SMS_97
为LSTM模块中的存储单元,由两部分相加,第一部分由先前的内部存储器状态和遗忘门计算,第二部分通过自递归状态和输入门的逐元素乘法来计算;
Figure SMS_81
表示LSTM模块的最终隐藏元素,为前向输出和后向输出的连接向量;符号
Figure SMS_90
为相乘运算符。
本实施例中的ATTENTION模块嵌入所述LSTM模块的时间序列特征分析过程中,采用Softmax激活函数突出时间序列特征中的关键信息。
基于上述过程,LSTM模块的正反输出结果通过乘法连接得到其输出的时间序列特征;映射关系为
Figure SMS_99
,其中St为Bi-LSTM分析得出的时间序列特征。
最后,将时间序列特征展平成一维特征,Qt=flatten(St),Qt接入全连接层(激活函数为Sigmoid),得到CLA模型最后的输出。
本发明实施例的步骤S2中,对差异融合季节性预测模型进行训练的方法具体为:
S2-1、将预处理的数据划分为训练集和测试集;
S2-2、利用训练集对RF模型和CLA模型分别进行训练;
S2-3、利用训练的RF模型和CLA模型对测试集进行AQI预测,得到对应的预测结果;
S2-4、将RF模型预测结果、CLA模型预测结果与测试集中真实AQI数据按季节进行分类;
S2-5、基于各季节的数据,利用最佳阈值区间搜索方法确定每个季节的AQI最佳阈值区间。
在本实施例的步骤S2-1中,对RF模型或CLA模型进行训练时,将MAE值最小时对应的模型参数作为RF模型或CLA模型的最佳参数;
本实施例中将MAE值作为衡量指标,通过随机搜索确定MAE值最小时RF模型的最佳参数,随机搜索表示以随机的方式在参数空间中进行采样搜索;对于连续变量的参数,随机搜索会进行分布式采样,采样完成后进行交叉验证(cross validation, CV),通过比较每一种设置的参数下的训练器精度,最终选择最优的参数值。在训练时,初始树的最大深度设置为20,允许分枝时一个节点必须包含的最小训练样本数值设置为20,分枝后的子节点的训练样本数的最低数目设置为5。
本实施例中的CLA模型训练采用Adma优化器,初始学习率设置0.001,其同样采用MAE值作为模型训练衡量指标(即模型的损失函数)。
本实施例中的MAE值的计算公式为:
Figure SMS_100
式中,
Figure SMS_101
为第i日的AQI实际值,
Figure SMS_102
为第i日的AQI预测值。
本发明实施例的步骤S2-5中,确定任一季节的AQI最佳阈值区间的方法为:
S2-51、初始化阈值区间[Down,Up],并设置最大阈值区间及变化步长,Down为区间最小值,Up为区间最大值;
S2-52、遍历同一季节下RF模型预测结果
Figure SMS_103
、CLA模型预测结果
Figure SMS_104
与测试集中真实AQI数据;
Figure SMS_105
Figure SMS_106
均在当前阈值区间内时,将
Figure SMS_107
作为当前模型预测结果;
Figure SMS_108
Figure SMS_109
同时比Up大或比Down小时,将
Figure SMS_110
作为当前模型预测结果;
S2-53、将当前模型预测结果存入当前阈值区间下的预测集合
Figure SMS_111
中,并在遍历结束后,计算
Figure SMS_112
的MAE值存入集合
Figure SMS_113
S2-54、按设置变化步长修改阈值区间,并返回步骤S2-52,直到满足最大阈值区间;
S2-55、在集合
Figure SMS_114
中选择最小MAE值,将其对应的阈值区间作为当前季节的AQI最佳阈值区间。
本发明实施例的步骤S3中,在确定四个季节时间段的AQI最佳阈值区间后,通过已知的季节性最佳阈值区间进行选择,产生最终差异融合季节性预测模型的输出,即通过比较每日的RF和CLA模型预测值处于最佳阈值区间内外情况,从RF和CLA模型预测值中选择一种作为当日的预测结果;基于此,本实施例步骤S3中确定融合预测模型的输出的方法具体为:
当RF模型和CLA模型的预测空气质量指数AQI均在AQI最佳阈值区间内时,选择CLA模型的预测空气质量指数AQI作为差异融合季节性预测模型的输出;
当RF模型和CLA模型的预测空气质量指数AQI均不在AQI最佳阈值区间内时,选择RF模型的预测空气质量指数AQI作为差异融合季节性预测模型的输出;
当RF模型和CLA模型的预测空气质量指数AQI中任意一个处于AQI最佳阈值区间内,另一个处于AQI最佳阈值外时,根据待预测日所处区域中AQI变化特点分析的模型置信度,选择模型置信度更高的一个预测空气质量指数AQI作为差异融合季节性预测模型的输出。
实施例2:
本发明实施例提供了利用实施例1中方法与单一模型(RF模型和CLA模型)进行空气质量指数预测对比的具体实例:
图3为采用本发明中的差异融合季节性预测(DF-SPM,Differential fusionseasonal forecasting model)方法对中国珠海市2020-2021年日AQI数据进行长期预测,为了更直观清晰的进行数据分析,图3中分别对4个季节(分别为(a)冬,(b)春,(c)夏,(d)秋)的预测过程进行展示,同时采用最佳阈值搜索方法事先搜索得到AQI最佳阈值区间分别为冬季[44,70],春季[28,38],夏季[12,38],秋季区间[30,46];然后进一步将三种模型在每个季节OTI(最佳阈值区间)内外的预测点分类统计,并计算它们的MAE值(见表1)。
在图3中各图的最佳阈值区间内,DF-SPM的日AQI预测值与CLA模型的日AQI预测值相同;相反在最佳阈值区间外,与RF模型的日AQI预测值相同。 DF-SPM每个季节时区预测结果由RF和CLA预测融合形成。因此,本发明提供的DF-SPM是以季节性和多模型融合预测为机理运作的新型预测模型。
表1:三种模型在每个季节OTI内外的预测点MAE分类统计
Figure SMS_115
观测图3的(a),(b),(c),(d)可知,DF-SPM预测中大部分的点,均通过OTI成功的选择了此时的最佳模型预测值,从数据上反映,四个季节DF-SPM的MAE均小于RF与CNN-LSTM-Attention模型的MAE;更进一步,从表1中可知,同一季节OTI内的预测点,CLA的MAE均小于RF,OTI外的预测点,RF的MAE均小于CLA,完全符合基准模型预测性能差异的特点,而DF-SPM不论是在OTI内还是之外的点,其MAE均与两种基准模型中的最佳MAE数据相近似。最后,珠海全年使用DF-SPM预测的MAE相较于CNN-LSTM-Attention下降了6.3%,相较于RF下降了18.12%。这表明运用OTISA算法得出OTI的预测机制有效利用了不同模型的优势,取得良好融合预测效果。
实施例3:
本发明实施例提供了利用实施例1中方法进行中国264个城市的AQI预测结果评估实例:
本实施例旨在得出DF-SPM的普适性,所以搜集了中国264个城市的空气质量数据,同时采用聚类分析方法分析了中国264个城市的空气质量时空分布特征,并使用实施例1中方法对这些城市进行长期AQI预测测试。
本实施例中对数据样本进行了空间特征和时间特征分析;对于空间特征分析,我们通过计算264个研究城市的数据样本的总体AQI均值和六个污染物均值作为表征空气质量的变量,运用K-Means聚类算法对中国264个处于不同空间区域城市进行空气质量聚类,聚类结果如表2所示;
表2:中国264个城市空气质量聚类结果
Figure SMS_116
对于上述表2中所展示的264个城市,每个区域内的具体城市如下:
区域-1:威海,烟台,石家庄,承德,秦皇岛,廊坊,青岛,沧州,张家口,天津,日照,济南,潍坊,北京,衡水,邯郸,滨州,邢台,淄博,德州,临沂,即墨,寿光,运城,枣庄。
区域-2:安康,呼伦贝尔,兴安,锡林郭勒盟,赤峰,通辽,商洛,信阳,铜川,临汾,乌兰察布,宝鸡,晋中,晋城,延安,大同,平顶山,阿拉善盟,阳泉,鹤壁,焦作,南阳,朔州,西安,许昌,周口,洛阳,呼和浩特,太原,漯河,渭南,安阳,濮阳,新乡,三门峡,榆林,咸阳,运城,长治,忻州。
区域-3:黑河,大兴安岭地区,通化,白山,齐齐哈尔,鹤岗,伊春,双鸭山,丹东,大庆,辽源,松原,本溪,大连,延边州,铁岭,佳木斯,四平,长春,吉林,鸡西,哈尔滨,营口,沈阳,绥化,抚顺,白城,阜新,盘锦,鞍山,辽阳。
区域-4:日喀则,阿里地区,中卫,山南,拉萨,那曲地区,林芝,喀什地区,昌都,黄南州,伊犁哈萨克州,阿克苏地区,天水,平凉,武威,定西,海西州,固原,石河子,果洛州,西宁,银川,阿拉善盟,吐鲁番地区,石嘴山,哈密地区。
区域-5:黄山,景德镇,新余,吉安,上饶,抚州,湘西州,赣州,鹰潭,怀化,张家界,马鞍山,宣城,铜陵,常德,恩施州,九江,咸宁,池州,鄂州,岳阳,十堰,黄石,安庆,合肥,孝感,娄底,衡阳,南昌,荆州,武汉,萍乡,滁州,宜昌,湘潭,长沙,淮南,蚌埠,荆门,阜阳,淮北,宿州,襄阳,亳州。
区域-6:阿坝州,临沧,普洱,六盘水,曲靖,昆明,遵义,昭通,黔东南州,攀枝花,玉溪,贵阳,防城港,大理州,铜仁地区,黔南州,南宁,丽江,贺州,玉林,安顺,贵港,黔西南州,毕节,百色,北海,广元,钦州,河池,崇左,迪庆州,柳州,雅安,重庆,随州,德宏州,巴中,遂宁,眉山,桂林,资阳,绵阳,南充,来宾,乐山,内江,德阳,成都,达州,泸州,宜宾,自贡。
区域-7:舟山,丽水,温州,宁波,台州,南通,衢州,湖州,金华,绍兴,杭州,上海,苏州,无锡,南京,常州,镇江,泰州,淮安,徐州,宿迁,扬州。
区域8:三亚,厦门,梅州,潮州,江门,河源,泉州,三明,汕尾,汕头,莆田,宁德,惠州,深圳,肇庆,阳江,珠海,茂名,广州,清远,东莞,韶关,湛江,佛山。
对于时间特征分析,本实施例中对八个区域的城市空气质量分析了时间的分布特征;中国处于北半球,冬季是从12月到次年2月,次年的3-5月为春季,6-8月为夏季,9-11月为秋季。我们将某一个区域所有城市的每一年度AQI数据分成四季,分别计算四季的AQI季节均值,并用折线将四季的AQI季节均值连接起来,得到一年的AQI总体变化趋势,分析结果如图4(a)~(c),分别是2019-2021年的年度AQI季节均值变化曲线。
由此,我们得到研究区域的时空分布特征为:空间维度上,8个不同聚类之间的空气质量水平存在明显差异,其空气质量水平按照从低到高顺序排列,分别为北部沿海, 黄河中游,东北,西北,长江中游,西南,东部沿海,南部沿海地区(区域1-区域8),同时同一区域中的城市间拥有相似的空气质量表现,在空气质量数据表征上具有相似性。
时间维度上,发现这些区域内城市的2019-2021年AQI均值具有明显特征,即AQI季节均值以年为周期循环,每年从春季先下降至夏季,夏、秋季基本平稳,秋季后急剧上升至冬季,总体趋势呈左低右高的倾斜浴盆状。
基于以上264个城市时空特征分析结果,我们对提出的预测方法进行了相应的基准实验和消融实验。
将DF-SPM与基准模型RF,CNN-LSTM-Attention对264个城市测试集预测结果的MAE制作成图5,而将DF-SPM与消融模型DFA(差异融合分Differential fusion analysis),DF-PM(差异融合预测模型Differential fusion prediction model)对264个城市测试集预测结果的MAE制作成图6。横坐标上述264个城市按测试集的AQI年均值从小到大排列的城市序号,纵坐标是MAE值。同时将DFA 、DF-PM、DF-SPM与基准模型RF,CNN-LSTM-Attention的MAE对比统计的结果制作成表3。
基准实验结果:
从图5中可以看出,DF-SPM随着AQI均值增加,所有模型的MAE呈现逐渐增加的趋势,AQI均值较低的城市(左下角矩形框),所有模型的MAE较小,预测精度均较高,且DF-SPM、CNN-LSTM-Attention、RF的MAE从小到大排列;AQI均值较高的城市(右上角矩形框),所有模型的MAE相对较大,预测精度降低,且DF-SPM、CNN-LSTM-Attention、RF的MAE从小到大排列。因此,对于空气质量差异明显地区的AQI预测,DF-SPM有效的融合了RF与CNN-LSTM-Attention显著差异特征,均获得了更高精度的预测,而从总体上看,黑色点(DF-SPM)基本处于所有散点条带的下边缘,从数据上反映,在264个城市中,有186个城市DF-SPM的MAE最小,占比约70.5%,仅有30个城市CLA的MAE误差最小,占比约11.3%,有48个城市RF模型MAE误差最小,占比约18.2%。基准实验表明DF-SPM较基准模型,对全国大多数城市具有更高的预测精度,因此具有更好的适用性。
结合图5,本实施例中观察了DF-SPM与RF、CNN-LSTM-Attention三种模型对分布在八个区域的264个城市的预测效果,对每个区域的三种模型的MAE评估结果区别统计,制作了柱状图(图7)以进一步评估模型性能。横坐标是区域-1到区域-8的空气质量水平差异明显的八个区域,左侧纵轴是城市数目,右侧纵轴是DF-SPM预测MAE最低(结果为最优)城市的占比。不同灰度的柱形分别表示RF、CLA、DF-SPM三种模型预测结果最优的城市数目,圆点为某一区域DF-SPM预测MAE最低(结果为最优)城市的占比。
由图7中8个区域的柱形看出,DF-SPM预测MAE为最低的城市数目均明显多于基准模型RF与CNN-LSTM-Attention的数目,从折线看到8个区域样本城市DF-SPM预测MAE为最低的城市数目占比从62.5%~83.3%,其平均占比为70.5% ,这表明DF-SPM对于不同空气质量水平区域中样本城市的AQI预测,其显著性能具有空间均匀性,进一步验证了DF-SPM对多地区预测具有较高的的适用性。
消融实验结果:
从图6中可以看出,DFA、DF-PM、DF-SPM三种模型预测有效的城市数目从少到多排列,结果分别是49、132、264。其原因如下:DFA模型采用了单一阈值搜寻算法,当应用于大量样本城市预测时,不能通过训练成功搜寻到该城市的最佳阈值(最优解),故选择预测结果时只能固定为某单一模型的值。DF-PM模型使用了阈值区间策略,相较于使用单一阈值的DFA模型,选择预测结果更合理有效,一定程度上增加了模型的稳定性,但是该模型未考虑AQI季节分布的特征(先验结果表明不同季节AQI水平差异明显),在全年预测时未做季节性预测,数据集内只有单一阈值区间,导致算法对AQI波动趋势衡量不准确,难以搜寻到最优解,故其也在部分城市中未成功搜寻到相应城市的OTI。因此,针对大量样本城市的预测,DF-SPM模型的有效性明显高于DF-PM和DFA模型。
表3:消融实验——三种模型MAE值统计结果
Figure SMS_117
表3是通过消融实验,DFA、DF-PM、DF-SPM三种模型的预测MAE值的统计结果,在264个样本城市中,DFA、DF-PM、DF-SPM模型有效预测且优于基准模型(MAE小于基准模型)的城市数目分别有27个、88个、186个,占比分别为10.20%、33.33%、70.50%,从该结果对比分析可知,DF-SPM采用最佳阈值区间确定模型选择的策略和根据季节性特征分时区进行预测的方法都取得了显著效果,对于大量的不同城市进行AQI预测,其有效性和准确性显著优于消融模型。
在本发明的描述中,需要理解的是,术语“中心”、“厚度”、“上”、“下”、“水平”、“顶”、“底”、“内”、“外”、“径向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或隐含指明的技术特征的数量。因此,限定由“第一”、“第二”、“第三”的特征可以明示或隐含地包括一个或者更多个该特征。

Claims (8)

1.一种基于组合模型的空气质量指数预测方法,其特征在于,包括以下步骤:
S1、采集历史空气质量数据,并进行预处理;
其中,空气质量数据包括空气质量指数AQI和污染物项目指标;
S2、构建差异融合季节性预测模型,利用历史空气质量数据对其进行训练,并确定各季节的AQI最佳阈值区间;
所述差异融合季节性预测模型包括并列的RF模型和CLA模型;
S3、将待预测日之前的污染物项目指标作为差异融合季节性预测模型的输入,根据待预测日所在季节的AQI最佳阈值区间选择RF模型或CLA模型的预测空气质量指数AQI作为差异融合季节性预测模型的输出,得到待预测日的空气质量指数AQI预测结果。
2.根据权利要求1所述的基于组合模型的空气质量指数预测方法,其特征在于,所述步骤S1中污染物项目指标包括CO、NO2、O3、PM10、PM2.5和SO2的每日平均监测浓度数据;
所述步骤S1中,对历史空气质量数据进行预处理为补全缺失数据,补全缺失数据的方法为:
当缺少连续i日的空气质量数据时,将前i日和后i日空气质量数据的平均值X AVG 作为缺失数据X M ;当i=1时,缺失数据X M =X AVG /2,当2≤i≤5时,缺失数据X M =(X M-1+ X AVG )/2;其中,
Figure QLYQS_1
X P 为前i日空气质量数据,X N 为后i日空气质量数据,下标M=n,…,n+i-1,P=n-i,…,n-1,N=n+i,…,n+2i-1。
3.根据权利要求2所述的基于组合模型的空气质量指数预测方法,其特征在于,所述步骤S2中,所述RF模型和CLA模型的输入数据均为前7日的空气质量数据,输出标签为后一日的空气质量指数AQI;
所述CLA模型包括依次连接的CNN模块、LSTM模块、ATTENTION模块以及全连接层;
所述CNN模块用于提取输入数据的特征,并将其展平成一维的时间序列;
所述LSTM模块用于分析输入时间序列的时间序列特征;
所述ATTENTION模块用于分析并突出输入时间序列特征中的关键信息。
4.根据权利要求3所述的基于组合模型的空气质量指数预测方法,其特征在于,所述CNN模块输出时间序列的公式为:
Figure QLYQS_2
式中,
Figure QLYQS_3
为输出时间序列的第i行第j列中的值,
Figure QLYQS_4
为输入7
Figure QLYQS_5
7矩阵的行i和列j中的值,
Figure QLYQS_6
为ReLU激活函数,
Figure QLYQS_7
为卷积核的行m和列n中的权重,b为卷积核的偏差;
所述LSTM模块为双向长短期记忆模型Bi-LSTM,其对输入时间序列的分析公式为:
Figure QLYQS_8
Figure QLYQS_9
Figure QLYQS_10
Figure QLYQS_11
Figure QLYQS_12
Figure QLYQS_13
Figure QLYQS_14
Figure QLYQS_15
Figure QLYQS_16
Figure QLYQS_17
Figure QLYQS_18
Figure QLYQS_19
Figure QLYQS_20
式中,参数上的左右箭头表示输入时间序列的正向和反向顺序;
Figure QLYQS_35
为CNN模块的输出
Figure QLYQS_23
在LSTM模块的表达形式;
Figure QLYQS_29
为输入门,
Figure QLYQS_33
为Sigmoid激活函数,
Figure QLYQS_38
分别为输入门的当前时刻输入和上一时刻输出的权重矩阵,
Figure QLYQS_37
为上一时刻输出结果,
Figure QLYQS_40
为输入门的偏置;
Figure QLYQS_26
为遗忘门,
Figure QLYQS_32
分别为遗忘门的当前时刻输入和上一时刻输出的权重矩阵,
Figure QLYQS_21
为遗忘门偏置;
Figure QLYQS_27
为输出门,
Figure QLYQS_25
分别为遗忘门的当前时刻输入和上一时刻输出的权重矩阵,
Figure QLYQS_31
为输出门偏置;
Figure QLYQS_30
为神经元,
Figure QLYQS_36
为激活函数,
Figure QLYQS_24
分别为自循环状态的当前时刻输入和上一时刻输出的权重矩阵,
Figure QLYQS_28
为自循环状态偏置;
Figure QLYQS_34
为LSTM模块中的存储单元;
Figure QLYQS_39
为LSTM模块的最终隐藏元素,为前向输出和后向输出的连接向量;符号
Figure QLYQS_22
为相乘运算符;
所述LSTM模块的正反输出结果通过乘法连接得到其输出的时间序列特征;
所述ATTENTION模块嵌入所述LSTM模块的时间序列特征分析过程中,采用Softmax激活函数突出时间序列特征中的关键信息。
5.根据权利要求3所述的基于组合模型的空气质量指数预测方法,其特征在于,所述步骤S2中,对差异融合季节性预测模型进行训练的方法具体为:
S2-1、将预处理的数据划分为训练集和测试集;
S2-2、利用训练集对RF模型和CLA模型分别进行训练;
S2-3、利用训练的RF模型和CLA模型对测试集进行AQI预测,得到对应的预测结果;
S2-4、将RF模型预测结果、CLA模型预测结果与测试集中真实AQI数据按季节进行分类;
S2-5、基于各季节的数据,利用最佳阈值区间搜索方法确定每个季节的AQI最佳阈值区间。
6.根据权利要求5所述的基于组合模型的空气质量指数预测方法,其特征在于,所述步骤S2-1中,对RF模型或CLA模型进行训练时,将MAE值最小时对应的模型参数作为RF模型或CLA模型的最佳参数;
所述MAE值的计算公式为:
Figure QLYQS_41
式中,
Figure QLYQS_42
为第i日的AQI实际值,
Figure QLYQS_43
为第i日的AQI预测值。
7.根据权利要求6所述的基于组合模型的空气质量指数预测方法,其特征在于,所述步骤S2-5中,确定任一季节的AQI最佳阈值区间的方法为:
S2-51、初始化阈值区间[Down,Up],并设置最大阈值区间及变化步长,Down为区间最小值,Up为区间最大值;
S2-52、遍历同一季节下RF模型预测结果
Figure QLYQS_44
、CLA模型预测结果
Figure QLYQS_45
与测试集中真实AQI数据;
Figure QLYQS_46
Figure QLYQS_47
均在当前阈值区间内时,将
Figure QLYQS_48
作为当前模型预测结果;
Figure QLYQS_49
Figure QLYQS_50
同时比Up大或比Down小时,将
Figure QLYQS_51
作为当前模型预测结果;
S2-53、将当前模型预测结果存入当前阈值区间下的预测集合
Figure QLYQS_52
中,并在遍历结束后,计算
Figure QLYQS_53
的MAE值存入集合
Figure QLYQS_54
S2-54、按设置变化步长修改阈值区间,并返回步骤S2-52,直到满足最大阈值区间;
S2-55、在集合
Figure QLYQS_55
中选择最小MAE值,将其对应的阈值区间作为当前季节的AQI最佳阈值区间。
8.根据权利要求7所述的基于组合模型的空气质量指数预测方法,其特征在于,所述步骤S3中,确定差异融合季节性预测模型的输出的方法具体为:
当RF模型和CLA模型的预测空气质量指数AQI均在AQI最佳阈值区间内时,选择CLA模型的预测空气质量指数AQI作为差异融合季节性预测模型的输出;
当RF模型和CLA模型的预测空气质量指数AQI均不在AQI最佳阈值区间内时,选择RF模型的预测空气质量指数AQI作为差异融合季节性预测模型的输出;
当RF模型和CLA模型的预测空气质量指数AQI中任意一个处于AQI最佳阈值区间内,另一个处于AQI最佳阈值外时,根据待预测日所处区域中AQI变化特点分析的模型置信度,选择模型置信度更高的一个预测空气质量指数AQI作为差异融合季节性预测模型的输出。
CN202310076823.1A 2023-02-08 2023-02-08 一种基于组合模型的空气质量指数预测方法 Active CN115796402B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202310076823.1A CN115796402B (zh) 2023-02-08 2023-02-08 一种基于组合模型的空气质量指数预测方法
US18/206,100 US11816556B1 (en) 2023-02-08 2023-06-06 Method for predicting air quality index (AQI) based on a fusion model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310076823.1A CN115796402B (zh) 2023-02-08 2023-02-08 一种基于组合模型的空气质量指数预测方法

Publications (2)

Publication Number Publication Date
CN115796402A true CN115796402A (zh) 2023-03-14
CN115796402B CN115796402B (zh) 2023-05-12

Family

ID=85430340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310076823.1A Active CN115796402B (zh) 2023-02-08 2023-02-08 一种基于组合模型的空气质量指数预测方法

Country Status (2)

Country Link
US (1) US11816556B1 (zh)
CN (1) CN115796402B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117689167B (zh) * 2023-12-13 2024-09-24 杭州师范大学 一种基于时空协同的混合模型光伏发电功率预测方法
CN118015049B (zh) * 2024-04-09 2024-06-21 湖南大学 一种结合yolo和gcn的海上目标追踪方法及其模型
CN118064197B (zh) * 2024-04-23 2024-07-30 新疆凯龙清洁能源股份有限公司 一种天然气脱烃的方法和系统
CN118514287B (zh) * 2024-07-22 2024-10-18 宁波江东联达机械科技有限公司 一种轻量化注塑机设备的控制方法及轻量化注塑机设备
CN118735082A (zh) * 2024-09-03 2024-10-01 南京信息工程大学 一种基于3D-TimesNet的次季节气温预报订正方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751242A (zh) * 2015-03-27 2015-07-01 北京奇虎科技有限公司 预测空气质量指数的方法与装置
CN106682381A (zh) * 2015-11-10 2017-05-17 中国科学院沈阳计算技术研究所有限公司 一种面向环境空气质量的动态数据模拟预报方法
CN111339392A (zh) * 2020-03-27 2020-06-26 中国科学院大气物理研究所 一种基于气象要素的天空蓝指数确定方法及系统
CN113240170A (zh) * 2021-05-10 2021-08-10 中国地质大学(武汉) 一种基于季节性循环神经网络的空气质量预测方法
US20210291614A1 (en) * 2019-07-25 2021-09-23 Central South University Health protection system for passengers on a train in a polluted indoor environment and method thereof
US20220011284A1 (en) * 2019-07-25 2022-01-13 Central South University Health early warning system for passengers on a train in an outdoor air polluted environment and method thereof
CN114240000A (zh) * 2021-12-31 2022-03-25 北京工业大学 一种基于时空图卷积网络的空气质量预测方法
WO2022266451A1 (en) * 2021-06-17 2022-12-22 Research Products Corporation Whole building air quality control system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11074269B2 (en) * 2018-01-10 2021-07-27 Reservoir Labs, Inc. Systems and methods for configuring system memory for extraction of latent information from big data

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751242A (zh) * 2015-03-27 2015-07-01 北京奇虎科技有限公司 预测空气质量指数的方法与装置
CN106682381A (zh) * 2015-11-10 2017-05-17 中国科学院沈阳计算技术研究所有限公司 一种面向环境空气质量的动态数据模拟预报方法
US20210291614A1 (en) * 2019-07-25 2021-09-23 Central South University Health protection system for passengers on a train in a polluted indoor environment and method thereof
US20220011284A1 (en) * 2019-07-25 2022-01-13 Central South University Health early warning system for passengers on a train in an outdoor air polluted environment and method thereof
CN111339392A (zh) * 2020-03-27 2020-06-26 中国科学院大气物理研究所 一种基于气象要素的天空蓝指数确定方法及系统
CN113240170A (zh) * 2021-05-10 2021-08-10 中国地质大学(武汉) 一种基于季节性循环神经网络的空气质量预测方法
WO2022266451A1 (en) * 2021-06-17 2022-12-22 Research Products Corporation Whole building air quality control system
CN114240000A (zh) * 2021-12-31 2022-03-25 北京工业大学 一种基于时空图卷积网络的空气质量预测方法

Non-Patent Citations (12)

* Cited by examiner, † Cited by third party
Title
ANURAG BARTHWAL, 等: "Prediction and analysis of particulate matter (PM2.5 and PM10) concentrations using machine learning techniques", 《JOURNAL OF AMBIENT INTELLIGENCE AND HUMANIZED COMPUTING》 *
BIN CHEN: "Air Quality Index Forecasting via Deep Dictionary Learning", 《IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS》 *
K. KUMAR, 等: "Air pollution prediction with machine learning: a case study of Indian cities", 《INTERNATIONAL JOURNAL OF ENVIRONMENTAL SCIENCE AND TECHNOLOGY》 *
SEIJI SUGATA, 等: "Development of air pollution forecast system (VENUS) and its validation", 《JOURNAL OF JAPAN SOCIETY FOR ATMOSPHERIC ENVIRONMENT / TAIKI KANKYO GAKKAISHI》 *
YOSHIO SAIKI, 等: "Evaluation of Air Quality by Pollution Index A Proposal of New Index AQI and the Application to Kanagawa Prefecture", 《NIPPON KAGAKU KAISHI》 *
ZICHENG WANG, 等: "Double decomposition and optimal combination ensemble learning approach for interval-valued AQI forecasting using streaming data", 《ENVIRONMENTAL SCIENCE AND POLLUTION RESEARCH》 *
卢彬: "统计分析和机器学习方法在银川市空气质量预测中的应用研究", 《中国优秀硕士学位论文全文数据库工程科技Ⅰ辑》 *
周须文, 等: "基于Bayes判别分析的大气污染潜势定量预报", 《气象》 *
张波,等: "一种卷积自编码深度学习的空气污染多站点联合预测模型" *
揣小明,等: "焦作市大气污染与经济发展之间的关系研究", 《环境科学与管理》 *
高嵩,等: "基于机器学习的差异融合分析在空气质量预测中的应用" *
高帅, 等: "基于改进的思维进化算法与BP神经网络的AQI预测", 《数学的实践与认识》 *

Also Published As

Publication number Publication date
CN115796402B (zh) 2023-05-12
US11816556B1 (en) 2023-11-14

Similar Documents

Publication Publication Date Title
CN115796402A (zh) 一种基于组合模型的空气质量指数预测方法
CN106529814B (zh) 基于Adaboost聚类和马尔科夫链的分布式光伏超短期预测方法
CN111178611B (zh) 一种日电量预测的方法
CN116937579B (zh) 一种考虑时空相关性的风电功率区间预测及其可解释方法
CN110415071B (zh) 一种基于观点挖掘分析的汽车竞品对比方法
CN112465251A (zh) 一种基于最简门控神经网络的短期光伏出力概率预测方法
CN115115125B (zh) 基于深度学习融合模型的光伏功率区间概率预测方法
CN107748940B (zh) 一种节电潜力量化预测方法
CN110020712A (zh) 一种基于聚类的优化粒子群bp网络预测方法和系统
CN112491891B (zh) 物联网环境下基于混合深度学习的网络攻击检测方法
Zhuang et al. Long-lead prediction of extreme precipitation cluster via a spatiotemporal convolutional neural network
CN115964932A (zh) 基于EMD-BiLSTM-Attention机制变压器数字孪生模型的气体预测方法
CN116826737A (zh) 一种光伏功率的预测方法、装置、存储介质及设备
CN112200209A (zh) 一种基于日差分用电量的贫困用户识别方法
CN118070229A (zh) 一种基于多模态数据挖掘的设备故障预警模型及方法
CN114065335A (zh) 基于多尺度卷积循环神经网络的建筑物能耗预测方法
CN115048873B (zh) 一种用于飞机发动机的剩余使用寿命预测系统
Chen et al. Feature selection based on BP neural network and adaptive particle swarm algorithm
CN112685461A (zh) 一种基于预判模型的窃电用户判断方法
Li et al. Short-term LOAD Forecasting Method of TPA-LSTNet Model Based on Time Series Clustering
Lyu et al. Intelligent clustering analysis model for mining area mineral resource prediction
Xie et al. Ultra-short-term Forecasting Method of Photovoltaic Power Generation Based on Combined Deep Neural Network
Bose Early performance estimation of super scalar machine models
Zhou et al. Prediction model of coal consumption based on random forest variable selection and random-grid hyperparametric optimization algorithm
CN118551169A (zh) 一种基于机器学习的生物炭吸附率预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant