CN116307212A - 一种新型空气质量预测方法及系统 - Google Patents

一种新型空气质量预测方法及系统 Download PDF

Info

Publication number
CN116307212A
CN116307212A CN202310295951.5A CN202310295951A CN116307212A CN 116307212 A CN116307212 A CN 116307212A CN 202310295951 A CN202310295951 A CN 202310295951A CN 116307212 A CN116307212 A CN 116307212A
Authority
CN
China
Prior art keywords
data
air quality
model
gcrvfl
quality prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310295951.5A
Other languages
English (en)
Other versions
CN116307212B (zh
Inventor
宋世豪
彭甜
王业琴
孙文
张凯诚
张楚
索雷明
李正波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaiyin Institute of Technology
Original Assignee
Huaiyin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaiyin Institute of Technology filed Critical Huaiyin Institute of Technology
Priority to CN202310295951.5A priority Critical patent/CN116307212B/zh
Publication of CN116307212A publication Critical patent/CN116307212A/zh
Application granted granted Critical
Publication of CN116307212B publication Critical patent/CN116307212B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Biophysics (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种新型空气质量预测方法及系统,具体步骤如下:收集某地区的化工园区空气质量数据集利用其空气质量数据(PM2.5、PM10、SO2、NO2、O3和CO)和气象数据(湿度、温度、风速、能见度和气压)以及相邻站点的AQI作为输入,AQI作为输出;对采集到的数据使用主成分分析法PCA进行特征选择;将处理好的数据送入空气质量预测模型中进行训练;构建基于图卷积网络GCN和随机向量函数链神经网络RVFL的图卷积随机向量函数链神经网络GCRVFL;利用改进均衡优化算法IEO对GCRVFL模型参数进行寻优,找到模型参数最优解。并通过云平台展示历史数据以及预测结果。与现有技术相比,本发明能够得到高精度、泛化能力强的空气质量预测模型,提高了空气质量预测精度。

Description

一种新型空气质量预测方法及系统
技术领域
本发明属于空气质量预测技术领域,尤其涉及一种全新的空气质量预测方法及系统。
背景技术
目前的空气质量预测主要有数值模拟与人工智能算法两种方法。数值模拟方法在考虑大气中多种污染物质之间的在大气中的转化作用基础上对气象排放化学变化建立模型,通过建立复杂的数值模型对物质之间转化进行模拟,在可模拟范围内考虑各种污染物浓度对大气变化的影响,模型利用大气中的动态过程,找出大气中污染物的积累和消散机制,利用大量空气质量变化实时信息来监控污染物的在区域内产生、交换、扩散和排出过程。常见的有通用多尺度空气质量模型、天气研究与预测模型等,这种方法适应性强,专业性强,但需要大量的先验知识对大气变化规律进行模拟。且由于污染物数据不规则、基础大气条件复杂、理论信息不足,导致预测精度不高。
人工智能算法使用统计建模方法预测空气质量,利用历史数据训练预测模型,常用的有支持向量机、人工神经网络等。然而,空气质量过程的空间分布和时间趋势受大气污染物排放和沉降、天气条件、人类活动等多种因素的影响,过程复杂,并且不同站点之间存在空间联系。传统机器学习模型在处理复杂、庞大的空气质量数据时存在一定的局限性,无法有效的捕获空气质量数据集中的特征分布,导致使用传统机器学习模型来完成预测空气质量的难度增加。
因此,本发明将深度学习应用到空气质量预测中,利用图卷积神经网络(GCN)提取空气质量数据中的空间特征,挖掘不同站点之间的内在联系,再利用随机向量函数链神经网络(RVFL)强大的非线性拟合能力,提出GCRVFL这种高精度的预测模型。
发明内容
发明目的:针对背景技术中指出的问题,本发明公开了一种新型空气质量预测方法及系统,使用GCRVFL对空气质量进行预测,并且使用智能算法对模型参数进行寻优,最终能够得到高精度、泛化能力强的空气质量预测模型。
技术方案:本发明提供一种新型空气质量预测方法,包括如下步骤:
步骤1:收集某地区空气质量数据,并对数据异常点、缺失点进行合理的优化,得到完整的空气质量数据集,利用某地区的空气质量数据和气象数据以及相邻站点的AQI作为输入,AQI作为输出;所述空气质量数据包括PM2.5、PM10、SO2、NO2、O3和CO;所述气象数据包括湿度、温度、风速、能见度和气压;
步骤2:对原始数据使用主成分分析法PCA特征选择,最终确定每个分量的输入维度,为接下来模型的搭建做好准备;
步骤3:建立图卷积随机向量函数链神经网络GCRVFL的空气质量预测模型,所述空气质量预测模型利用改进的均衡优化算法优化GCRVFL的权值、阈值,所述改进的均衡优化算法包括利用混沌初始化替换原本的随机初始化、多元学习提高均衡优化算法的全局搜索能力、利用混沌局部搜索对最优解进一步优化;
步骤4:通过步骤2的空气质量历史数据与改进的均衡优化算法对建立的基于GCRVFL的空气质量预测模型进行训练,求出模型最优参数、最小化损失函数误差;
步骤5:利用训练好的的模型对未来数据进行预测,并输出预测结果。
进一步地,所述步骤2中主成分分析法PCA特征选择对数据矩阵的协方差矩阵进行特征值分解,PCA主要分为4个步骤:
原始数据矩阵如式(1)所示:
Figure BDA0004143109340000021
式中:n为数据个数;p为特征数。
1)数据标准化(中心化)的矩阵X*表示如式(2):
Figure BDA0004143109340000022
式中:
Figure BDA0004143109340000024
为X*的第i行第j列的数据;
2)计算标准化后的协方差矩阵R,如式(3)所示:
Figure BDA0004143109340000023
3)求R的特征值和特征向量;
根据特征方程|λI-R|=0,得到特征值并排序:λ1≥λ2≥…≥λp≥0。求出海个特征值的特征向量ei(i=1,2,…,p),要求||ei||=1;
4)计算主成分贡献率及累计贡献率,贡献率计算如式(4),累计贡献率计算如式(5)所示:
Figure BDA0004143109340000031
Figure BDA0004143109340000032
选取累积方差贡献率在75%~95%时,对应的前q个主成分包含原始p个变量所能提供的绝大部分信息。
进一步地,所述步骤3中图卷积随机向量函数链神经网络GCRVFL将RVFL扩展到非欧几里得域,首先通过考虑相邻关系将常规欧几里得数据转换为图数据,然后由图卷积诱导的嵌入层和回归层嵌入;其具体步骤如下:
将RVFL的随机映射和回归相应地转换为RGConv嵌入和GConv回归层;
1)RGConv层的目标是为输入
Figure BDA0004143109340000033
生成随机嵌入矩阵H;/>
Figure BDA0004143109340000034
是包含L个过滤器的滤波器参数矩阵,W的所有元素都是根据随机概率分布生成,因此,定义RGConv嵌入如下:
Figure BDA0004143109340000035
这里A=D-1/2AD-1/2表示归一化的相邻矩阵,σ是一个非线性激活函数:
Figure BDA0004143109340000036
根据谱图理论,
Figure BDA0004143109340000037
的非零元素可以通过/>
Figure BDA0004143109340000038
计算得到,其中Dii表示第i个对角元素D;因此,RGConv嵌入可以进一步表示为:
Figure BDA0004143109340000039
hi是嵌入的第i个节点,依赖于i节点特征向量本身;直观地说,这些相邻节点具有相当高的概率属于同一类,hi通过RGConv嵌入被嘈杂数据损坏的风险较小;
2)基于RGConv嵌入矩阵H,在GCRVFL模型中引入了GConv回归层,将输出层权重矩阵表示为β,GConv回归可以写成如下:
Figure BDA0004143109340000041
方程(9)的解可以通过求解最小范数问题来获得,即
Figure BDA0004143109340000042
这里H和Y包含已标记和未标记的条目;让
Figure BDA0004143109340000043
进一步修改方程(10),将两者除法/>
Figure BDA0004143109340000044
和Y分为两部分,即指/>
Figure BDA0004143109340000045
和YT作为标记的条目,/>
Figure BDA0004143109340000046
和YU作为未标记的条目,这将获得以下可解决的问题:
Figure BDA0004143109340000047
通过计算方程(11)关于β,很容易证明方程(11)具有全局最优解,方程(11)的闭式解可以表示如下:
Figure BDA0004143109340000048
然后,将输入层与输出层的直连结构也替换成GConv回归结构。
进一步地,步骤3中改进的均衡优化算法步骤如下所示:
1)在均衡优化算法中加入了混沌初始化;使用迭代映射来初始化EO:
X(i)=sin(0.7π/X(i-1)) (13)
X=((X(i)-a)×(d-c))/(b-a) (14)
其中a=-1b=1c=0d=1,X是通过混沌初始化获得的粒子群;
2)引入多元学习策略来更新粒子群中每个粒子的位置;具体改进如下:
粒子群随机分为两部分,一部分粒子从当前种群和历史种群中学习,其余粒子从当前粒子群中的最优粒子中学习,如方程(15)所示:
Figure BDA0004143109340000051
其中h是小于粒子群大小的正整数,并且h≠i;Xh,j表示当前粒子群中h个粒子的第j个变量;a和b是从0到1的随机数;Cbest,j是当前粒子群最优解的第j个变量;
3)使用混沌局部搜索来获得最优解,通过围绕混沌序列生成新的解来进一步优化粒子群中的最优粒子;利用方程(16)和方程(17)搜索最佳粒子附近的位置,然后,如果新粒子的适应度值低于原始粒子的适应值,则用新粒子替换旧粒子:
zm+1=4×zm(1-zm) (16)
Figure BDA0004143109340000052
其中,zm是第m次迭代的结果;z0其初始值是范围为[0,1]的随机生成值;tcurrent和tmax并且分别表示当前迭代和最大迭代;Xbest,j表示最优解的第j个元素。
本发明还公开一种新型空气质量预测系统,包括数据采集模块、数据处理模块、模型训练模块、智能优化模块、云平台模块;
数据采集模块,用于收集空气质量中的数据,包括PM2.5、PM10、SO2、NO2、O3和CO;
数据处理模块,用于对采集到的空气质量数据进行特征选择;将原始数据作为主成分分析PCA模型的输入,通过PCA对重构的高维度数据集进行特征降维,确定模型的输入;
模型训练模块,将GCN与RVFL模型相结合,建立基于GCRVFL的空气质量预测模型,并通过空气质量的历史数据与智能优化模块对建立的GCRVFL模型进行训练,得到最优网络参数;
智能优化模块,利用多元学习、混沌局部搜索、混沌初始化对于均衡优化算法EO进行改进,提出一种全新的改进均衡优化算法IEO用于模型参数寻优;
云平台模块,通过云平台实时显示历史数据以及未来一段时间的空气质量预测结果。
有益效果:
(1)本发明通过对空气质量指数(Air Quality Index,简称AQI)序列与湿度、温度、风速、能见度和相邻站点AQI等因素使用PCA特征选择,从而得到了AQI与气象因素之间的关联程度,确定模型输入维度,能够在不减少预测精度的前提下简化计算。
(2)本发明所提GCRVFL结合了GCN和RVFL各自的优点,GCN处理图数据非常有效,能够对同时学习图结构的结构信息和节点的属性信息,考虑到了节点之间的关联性,进而能够挖掘数据的空间信息,RVFL拥有良好的泛化能力,并且其设计简单、训练效率高。
(3)本发明提出IEO-GCRVFL模型对于空气质量进行预测研究。首先建立图卷积随机向量函数链神经网络(GCRVFL)模型,然后对EO算法进行改进,并利用改进EO算法对GCRVFL中的权值和偏置进行优化,最后为了充分的验证模型的优越性,本文对单站点和多站点数据进行预测。
附图说明
图1是空气质量预测流程图;
图2是GCRVFL结构图;
图3是空气质量预测模型与系统流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明公开了一种新型空气质量预测方法,以化工园区空气质量预测为例进行说明,参见图3,具体包括如下步骤:
步骤1:收集某地区空气质量数据,并对数据异常点、缺失点进行合理的优化,得到完整的空气质量数据集,利用某地区的空气质量数据(PM2.5、PM10、SO2、NO2、O3和CO)和气象数据(湿度、温度、风速、能见度和气压)以及相邻站点的AQI作为输入,AQI作为输出。
步骤2:对收集到的空气质量原始数据使用PCA特征选择,最终确定每个分量的输入维度,为接下来模型的搭建做好准备。
主成分分析是处理高维数据的1种统计学习方法,对数据矩阵的协方差矩阵进行特征值分解,达到降维的目的。PCA主要分为4个步骤:
原始数据矩阵如式(1)所示:
Figure BDA0004143109340000071
式中:n为数据个数;p为特征数。
1)数据标准化(中心化)的矩阵X*表示如式(2):
Figure BDA0004143109340000072
式中:
Figure BDA0004143109340000076
为X*的第i行第j列的数据。
2)计算标准化后的协方差矩阵R,如式(3)所示:
Figure BDA0004143109340000073
3)求R的特征值和特征向量。
根据特征方程|λI-R|=0,得到特征值并排序:λ1≥λ2≥…≥λp≥0。求出海个特征值的特征向量ei(i=1,2,…,p),要求||ei||=1。
4)计算主成分贡献率及累计贡献率。贡献率计算如式(4),累计贡献率计算如式(5)所示:
Figure BDA0004143109340000074
Figure BDA0004143109340000075
选取累积方差贡献率在75%~95%时,对应的前q个主成分包含原始p个变量所能提供的绝大部分信息。
步骤3:建立GCRVFL的空气质量预测模型,利用改进的均衡优化算法优化GCRVFL的模型参数。其中改进的均衡优化算法包括,混沌初始化替换原本的随机初始化、多元学习来提高算法的全局搜索能力、混沌局部搜索对最优解进一步优化。
本发明提出了一种基于图表示学习的新型RVFL模型,即图卷积随机向量函数链神经网络(GCRVFL)。该模型背后的核心思想是将RVFL扩展到非欧几里得域。从技术上讲,首先通过考虑相邻关系将常规欧几里得数据转换为图数据,然后由图卷积诱导的嵌入层和回归层嵌入。GCRVFL框架不仅继承了经典RVFL和GCN的优点,而且还赋予RVFL处理图形结构化数据的能力。图卷积随机向量函数链神经网络的具体步骤如下:
GCRVFL方法的关键是在图域中重塑经典RVFL,但保留其骨干。为此,将RVFL的随机映射和回归相应地转换为RGConv嵌入和GConv回归层。参见图2,GCRVFL模型的细节如下所述。
RGConv层的目标是为输入
Figure BDA0004143109340000081
生成随机嵌入矩阵H。/>
Figure BDA0004143109340000082
是包含L个过滤器的滤波器参数矩阵。W的所有元素都是根据随机概率分布生成。因此,定义RGConv嵌入如下:
Figure BDA0004143109340000083
这里A=D-1/2AD-1/2表示归一化的相邻矩阵,σ是一个非线性激活函数:
Figure BDA0004143109340000084
根据谱图理论,
Figure BDA0004143109340000085
的非零元素可以通过/>
Figure BDA0004143109340000086
计算得到,其中Dii表示第i个对角元素D。因此,RGConv嵌入可以进一步表示为:
Figure BDA0004143109340000087
可以看出,hi是嵌入的第i个节点,依赖于i节点特征向量本身。直观地说,这些相邻节点具有相当高的概率属于同一类。因此hi通过RGConv嵌入被嘈杂数据损坏的风险较小。
与经典RVFL相比,随机映射和RGConv嵌入之间存在一些差异。首先,RGConv嵌入同时利用邻域关系和节点特征,使其能够对图结构化数据进行操作。而随机映射认为数据点彼此独立。得益于图结构不容易受到噪声数据点的影响,RGConv嵌入往往会产生更健壮的转换。其次,方程(6)可以看作是一个随机映射乘以成对样本权重矩阵
Figure BDA0004143109340000091
并忽略偏见。因此,RGConv嵌入在理论上不会降低随机映射的性能。
基于RGConv嵌入矩阵H,在GCRVFL模型中引入了GConv回归层。将输出层权重矩阵表示为β,GConv回归可以写成如下:
Figure BDA0004143109340000092
方程(9)的解可以通过求解最小范数问题来获得,即
Figure BDA0004143109340000093
这里H和Y包含已标记和未标记的条目。但是,未标记的目标在训练阶段不可用。为了规避困境,让
Figure BDA0004143109340000094
进一步修改方程(10),将两者除法/>
Figure BDA0004143109340000095
和Y分为两部分,即指/>
Figure BDA0004143109340000096
和YT作为标记的条目,/>
Figure BDA0004143109340000097
和YU作为未标记的条目。这将获得以下可解决的问题:
Figure BDA0004143109340000098
通过计算方程(11)关于β,很容易证明方程(11)具有全局最优解,方程(11)的闭式解可以表示如下:
Figure BDA0004143109340000099
然后,将输入层与输出层的直连结构也替换成GConv回归结构。
在均衡优化算法中加入了混沌初始化。在原始EO中,粒子浓度是通过随机初始化产生的。随机性太大,导致颗粒浓度分布不均匀。基于混沌理论的混沌序列具有随机性和边界性。本文使用迭代映射来初始化EO:
X(i)=sin(0.7π/X(i-1)) (13)
X=((X(i)-a)×(d-c))/(b-a) (14)
其中a=-1b=1c=0d=1。X是通过混沌初始化获得的粒子群。
引入了多元学习策略来更新粒子群中每个粒子的位置。具体改进如下,粒子群随机分为两部分,一部分粒子从当前种群和历史种群中学习,其余粒子从当前粒子群中的最优粒子中学习,如方程(15)所示。
Figure BDA0004143109340000101
其中h是小于粒子群大小的正整数,并且h≠i。Xh,j表示当前粒子群中h个粒子的第j个变量。a和b是从0到1的随机数。Cbest,j是当前粒子群最优解的第j个变量。
为了进一步提高最优解的质量,使用混沌局部搜索来获得最优解。该方法通过围绕混沌序列生成新的解来进一步优化粒子群中的最优粒子。因此,在本文中,方程(16)和方程(17)用于搜索最佳粒子附近的位置。然后,如果新粒子的适应度值低于原始粒子的适应值,则用新粒子替换旧粒子。
zm+1=4×zm(1-zm) (16)
Figure BDA0004143109340000102
其中zm是第m次迭代的结果;z0其初始值是范围为[0,1]的随机生成值;tcurrent和tmax并且分别表示当前迭代和最大迭代;Xbest,j表示最优解的第j个元素。
步骤4:通过空气质量的历史数据与上述改进的均衡优化算法对建立的基于GCRVFL的空气质量预测模型进行训练,求出模型最优参数、最小化损失函数误差。
步骤5:利用训练好的的模型对未来数据进行预测,并将预测结果显示到云平台。
针对上述的新型空气质量预测方法,本发明公开了新型空气质量预测系统,包括数据采集模块、数据处理模块、模型训练模块、智能优化模块、云平台模块。
数据采集模块,用于收集空气质量中的数据,包括PM2.5、PM10、SO2、NO2、O3和CO。
数据处理模块,用于对采集到的空气质量数据进行特征选择;将原始数据作为主成分分析(PCA)模型的输入,通过PCA对重构的高维度数据集进行特征降维,确定模型的输入。
模型训练模块,将GCN与RVFL模型相结合,建立基于GCRVFL的空气质量预测模型,并通过空气质量的历史数据与智能优化模块对建立的GCRVFL模型进行训练,得到最优网络参数。
智能优化模块,利用多元学习,混沌局部搜索,混沌初始化对于均衡优化算法(EO)进行改进,提出一种全新的改进型均衡优化算法(IEO)用于模型参数寻优。
云平台模块,通过云平台实时显示历史数据以及未来一段时间的空气质量预测结果。
本发明并不局限于上述具体实施案例,在本领域技术人员所具备的知识范围内,任何根据本发明的技术方案及其发明构思加以等同替换或改变,均应包含在本发明保护范围之内。

Claims (5)

1.一种新型空气质量预测方法,其特征在于,包括如下步骤:
步骤1:收集某地区空气质量数据,并对数据异常点、缺失点进行合理的优化,得到完整的空气质量数据集,利用某地区的空气质量数据和气象数据以及相邻站点的AQI作为输入,AQI作为输出;所述空气质量数据包括PM2.5、PM10、SO2、NO2、O3和CO;所述气象数据包括湿度、温度、风速、能见度和气压;
步骤2:对原始数据使用主成分分析法PCA特征选择,最终确定每个分量的输入维度,为接下来模型的搭建做好准备;
步骤3:建立图卷积随机向量函数链神经网络GCRVFL的空气质量预测模型,所述空气质量预测模型利用改进的均衡优化算法优化GCRVFL的权值、阈值,所述改进的均衡优化算法包括利用混沌初始化替换原本的随机初始化、多元学习提高均衡优化算法的全局搜索能力、利用混沌局部搜索对最优解进一步优化;
步骤4:通过步骤2的空气质量历史数据与改进的均衡优化算法对建立的基于GCRVFL的空气质量预测模型进行训练,求出模型最优参数、最小化损失函数误差;
步骤5:利用训练好的的模型对未来数据进行预测,并输出预测结果。
2.根据权利要求1所述的新型空气质量预测方法,其特征在于,所述步骤2中主成分分析法PCA特征选择对数据矩阵的协方差矩阵进行特征值分解,PCA主要分为4个步骤:
原始数据矩阵如式(1)所示:
Figure FDA0004143109330000011
式中:n为数据个数;p为特征数。
1)数据标准化(中心化)的矩阵X*表示如式(2):
Figure FDA0004143109330000012
式中:
Figure FDA0004143109330000013
为X*的第i行第j列的数据;
2)计算标准化后的协方差矩阵R,如式(3)所示:
Figure FDA0004143109330000021
3)求R的特征值和特征向量;
根据特征方程|λI-R|=0,得到特征值并排序:λ1≥λ2≥…≥λp≥0。求出海个特征值的特征向量ei(i=1,2,…,p),要求||ei||=1;
4)计算主成分贡献率及累计贡献率,贡献率计算如式(4),累计贡献率计算如式(5)所示:
Figure FDA0004143109330000022
Figure FDA0004143109330000023
选取累积方差贡献率在75%~95%时,对应的前q个主成分包含原始p个变量所能提供的绝大部分信息。
3.根据权利要求1所述的新型空气质量预测方法,其特征在于,所述步骤3中图卷积随机向量函数链神经网络GCRVFL将RVFL扩展到非欧几里得域,首先通过考虑相邻关系将常规欧几里得数据转换为图数据,然后由图卷积诱导的嵌入层和回归层嵌入;其具体步骤如下:
将RVFL的随机映射和回归相应地转换为RGConv嵌入和GConv回归层;
1)RGConv层的目标是为输入
Figure FDA0004143109330000024
生成随机嵌入矩阵H;/>
Figure FDA0004143109330000025
是包含L个过滤器的滤波器参数矩阵,W的所有元素都是根据随机概率分布生成,因此,定义RGConv嵌入如下:
Figure FDA0004143109330000026
这里A=D-1/2AD-1/2表示归一化的相邻矩阵,σ是一个非线性激活函数:
Figure FDA0004143109330000027
根据谱图理论,
Figure FDA0004143109330000031
的非零元素可以通过/>
Figure FDA0004143109330000032
计算得到,其中Dii表示第i个对角元素D;因此,RGConv嵌入可以进一步表示为:
Figure FDA0004143109330000033
hi是嵌入的第i个节点,依赖于i节点特征向量本身;直观地说,这些相邻节点具有相当高的概率属于同一类,hi通过RGConv嵌入被嘈杂数据损坏的风险较小;
2)基于RGConv嵌入矩阵H,在GCRVFL模型中引入了GConv回归层;将输出层权重矩阵表示为β,GConv回归可以写成如下:
Figure FDA0004143109330000034
方程(9)的解可以通过求解最小范数问题来获得,即
Figure FDA0004143109330000035
这里H和Y包含已标记和未标记的条目;让
Figure FDA0004143109330000036
进一步修改方程(10),将两者除法/>
Figure FDA0004143109330000037
和Y分为两部分,即指/>
Figure FDA0004143109330000038
和YT作为标记的条目,/>
Figure FDA0004143109330000039
和YU作为未标记的条目,这将获得以下可解决的问题:
Figure FDA00041431093300000310
通过计算方程(11)关于β,很容易证明方程(11)具有全局最优解,方程(11)的闭式解可以表示如下:
Figure FDA00041431093300000311
然后,将输入层与输出层的直连结构也替换成GConv回归结构。
4.根据权利要求1所述的新型空气质量预测方法,其特征在于,步骤3中改进的均衡优化算法步骤如下所示:
1)在均衡优化算法中加入了混沌初始化;使用迭代映射来初始化EO:
X(i)=sin(0.7π/X(i-1))(13)
X=((X(i)-a)×(d-c))/(b-a) (14)
其中a=-1b=1c=0d=1,X是通过混沌初始化获得的粒子群;
2)引入多元学习策略来更新粒子群中每个粒子的位置;具体改进如下:
粒子群随机分为两部分,一部分粒子从当前种群和历史种群中学习,其余粒子从当前粒子群中的最优粒子中学习,如方程(15)所示:
Figure FDA0004143109330000041
其中h是小于粒子群大小的正整数,并且h≠i;Xh,j表示当前粒子群中h个粒子的第j个变量;a和b是从0到1的随机数;Cbest,j是当前粒子群最优解的第j个变量;
3)使用混沌局部搜索来获得最优解,通过围绕混沌序列生成新的解来进一步优化粒子群中的最优粒子;利用方程(16)和方程(17)搜索最佳粒子附近的位置,然后,如果新粒子的适应度值低于原始粒子的适应值,则用新粒子替换旧粒子:
zm+1=4×zm(1-zm) (16)
Figure FDA0004143109330000042
其中,zm是第m次迭代的结果;z0其初始值是范围为[0,1]的随机生成值;tcurrent和tmax并且分别表示当前迭代和最大迭代;Xbest,j表示最优解的第j个元素。
5.一种新型空气质量预测系统,其特征在于,包括数据采集模块、数据处理模块、模型训练模块、智能优化模块、云平台模块;
数据采集模块,用于收集空气质量中的数据,包括PM2.5、PM10、SO2、NO2、O3和CO;
数据处理模块,用于对采集到的空气质量数据进行特征选择;将原始数据作为主成分分析PCA模型的输入,通过PCA对重构的高维度数据集进行特征降维,确定模型的输入;
模型训练模块,将GCN与RVFL模型相结合,建立基于GCRVFL的空气质量预测模型,并通过空气质量的历史数据与智能优化模块对建立的GCRVFL模型进行训练,得到最优网络参数;
智能优化模块,利用多元学习、混沌局部搜索、混沌初始化对于均衡优化算法EO进行改进,提出一种全新的改进均衡优化算法IEO用于模型参数寻优;
云平台模块,通过云平台实时显示历史数据以及未来一段时间的空气质量预测结果。
CN202310295951.5A 2023-03-24 2023-03-24 一种空气质量预测方法及系统 Active CN116307212B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310295951.5A CN116307212B (zh) 2023-03-24 2023-03-24 一种空气质量预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310295951.5A CN116307212B (zh) 2023-03-24 2023-03-24 一种空气质量预测方法及系统

Publications (2)

Publication Number Publication Date
CN116307212A true CN116307212A (zh) 2023-06-23
CN116307212B CN116307212B (zh) 2023-12-19

Family

ID=86818532

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310295951.5A Active CN116307212B (zh) 2023-03-24 2023-03-24 一种空气质量预测方法及系统

Country Status (1)

Country Link
CN (1) CN116307212B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117151285A (zh) * 2023-08-29 2023-12-01 淮阴工学院 一种基于多要素注意力时空图卷积网络的径流预报方法
CN117350175A (zh) * 2023-12-04 2024-01-05 河北东医生物科技有限公司 人工智能生态因子空气环境质量监测方法及系统
CN117482770A (zh) * 2023-12-29 2024-02-02 赛悟德半导体科技(上海)股份有限公司 一种基于浓度的气体混配控制方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113011660A (zh) * 2021-03-23 2021-06-22 上海应用技术大学 空气质量预测方法、系统及存储介质
CN114240000A (zh) * 2021-12-31 2022-03-25 北京工业大学 一种基于时空图卷积网络的空气质量预测方法
CN114493017A (zh) * 2022-01-28 2022-05-13 南京邮电大学 基于参数迁移的水质预测方法
US20220214322A1 (en) * 2021-01-07 2022-07-07 Tsinghua University Air pollutants concentration forecasting method and apparatus and storage medium
CN114781538A (zh) * 2022-05-07 2022-07-22 东莞理工学院 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统
CN114841400A (zh) * 2022-03-25 2022-08-02 哈尔滨工程大学 基于多任务时空图卷积的空气质量预测方法
CN115096357A (zh) * 2022-06-07 2022-09-23 大连理工大学 一种基于ceemdan-pca-lstm的室内环境质量预测方法
CN115359857A (zh) * 2022-08-22 2022-11-18 盐城工学院 一种基于cart模型和优化rvflnn模型预测pm2.5浓度的方法
CN115372550A (zh) * 2022-07-20 2022-11-22 淮阴工学院 基于二次eemd分解结合gafsa-lstm的空气质量预测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220214322A1 (en) * 2021-01-07 2022-07-07 Tsinghua University Air pollutants concentration forecasting method and apparatus and storage medium
CN113011660A (zh) * 2021-03-23 2021-06-22 上海应用技术大学 空气质量预测方法、系统及存储介质
CN114240000A (zh) * 2021-12-31 2022-03-25 北京工业大学 一种基于时空图卷积网络的空气质量预测方法
CN114493017A (zh) * 2022-01-28 2022-05-13 南京邮电大学 基于参数迁移的水质预测方法
CN114841400A (zh) * 2022-03-25 2022-08-02 哈尔滨工程大学 基于多任务时空图卷积的空气质量预测方法
CN114781538A (zh) * 2022-05-07 2022-07-22 东莞理工学院 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统
CN115096357A (zh) * 2022-06-07 2022-09-23 大连理工大学 一种基于ceemdan-pca-lstm的室内环境质量预测方法
CN115372550A (zh) * 2022-07-20 2022-11-22 淮阴工学院 基于二次eemd分解结合gafsa-lstm的空气质量预测方法
CN115359857A (zh) * 2022-08-22 2022-11-18 盐城工学院 一种基于cart模型和优化rvflnn模型预测pm2.5浓度的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHANG, ZIJIA等: "Evolution Driven Randomized Graph Convolutional Networks", 《IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS: SYSTEMS》, vol. 52, no. 12, pages 7516 - 7526 *
朱国畅: "基于深度学习的空气质量指数预测算法研究与应用", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》, no. 03, pages 027 - 648 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117151285A (zh) * 2023-08-29 2023-12-01 淮阴工学院 一种基于多要素注意力时空图卷积网络的径流预报方法
CN117350175A (zh) * 2023-12-04 2024-01-05 河北东医生物科技有限公司 人工智能生态因子空气环境质量监测方法及系统
CN117350175B (zh) * 2023-12-04 2024-03-12 河北东医生物科技有限公司 人工智能生态因子空气环境质量监测方法及系统
CN117482770A (zh) * 2023-12-29 2024-02-02 赛悟德半导体科技(上海)股份有限公司 一种基于浓度的气体混配控制方法及系统
CN117482770B (zh) * 2023-12-29 2024-03-19 赛悟德半导体科技(上海)股份有限公司 一种基于浓度的气体混配控制方法及系统

Also Published As

Publication number Publication date
CN116307212B (zh) 2023-12-19

Similar Documents

Publication Publication Date Title
CN116307212B (zh) 一种空气质量预测方法及系统
CN111091233A (zh) 一种基于小波分析和多模型AdaBoost深度网络的风电场短期风电预测建模方法
CN114240000A (zh) 一种基于时空图卷积网络的空气质量预测方法
CN111369057A (zh) 一种基于深度学习的空气质量预测优化方法及系统
Xia et al. Traffic prediction based on ensemble machine learning strategies with bagging and lightgbm
WO2020143253A1 (zh) 一种基于Sparse Autoencoder的电力系统运行方式聚类方法
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
Kosana et al. A novel hybrid framework for wind speed forecasting using autoencoder‐based convolutional long short‐term memory network
CN114882373A (zh) 基于深度神经网络的多特征融合沙尘暴预测方法
CN112418504B (zh) 一种基于混合变量选择优化深度信念网络风速预测方法
CN117272195A (zh) 基于图卷积注意力网络的区块链异常节点检测方法及系统
CN117113054A (zh) 一种基于图神经网络和Transformer的多元时间序列预测方法
CN116565863A (zh) 一种基于时空相关性的短期光伏出力预测方法
CN114265954B (zh) 基于位置与结构信息的图表示学习方法
CN116187508A (zh) 一种融合知识图谱和深度学习的风电机组故障预测方法
CN116090635A (zh) 一种气象驱动的新能源发电功率预测方法
CN115766504A (zh) 一种周期时间序列异常检测方法
CN111126645A (zh) 一种基于数据挖掘技术和改进支持向量机的风电预测算法
Saif-ul-Allah et al. Convolutional neural network approach for reduction of nitrogen oxides emissions from pulverized coal-fired boiler in a power plant for sustainable environment
CN115620038A (zh) 共性知识约束的遥感样本迁移方法
CN113537573A (zh) 基于双重时空特征提取的风电功率运行趋势预测方法
CN117633449B (zh) 基于Spark-Cassandra框架的DE-DOA改进RRDBNet降水数据降尺度方法
CN117633456B (zh) 基于自适应焦点损失的海上风电天气事件辨识方法和装置
CN116662903A (zh) 基于图神经网络的电网终端设备识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant