CN114781538A - 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 - Google Patents
一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 Download PDFInfo
- Publication number
- CN114781538A CN114781538A CN202210493233.4A CN202210493233A CN114781538A CN 114781538 A CN114781538 A CN 114781538A CN 202210493233 A CN202210493233 A CN 202210493233A CN 114781538 A CN114781538 A CN 114781538A
- Authority
- CN
- China
- Prior art keywords
- neural network
- air quality
- decision tree
- prediction
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 51
- 238000003066 decision tree Methods 0.000 title claims abstract description 43
- 230000008878 coupling Effects 0.000 title claims abstract description 7
- 238000010168 coupling process Methods 0.000 title claims abstract description 7
- 238000005859 coupling reaction Methods 0.000 title claims abstract description 7
- 239000003344 environmental pollutant Substances 0.000 claims abstract description 30
- 231100000719 pollutant Toxicity 0.000 claims abstract description 30
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 24
- 230000002068 genetic effect Effects 0.000 claims abstract description 15
- 238000003062 neural network model Methods 0.000 claims abstract description 7
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 238000000513 principal component analysis Methods 0.000 claims abstract description 7
- 210000002569 neuron Anatomy 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 210000000349 chromosome Anatomy 0.000 claims description 9
- 238000011160 research Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims description 3
- 230000035772 mutation Effects 0.000 claims description 3
- 239000011541 reaction mixture Substances 0.000 claims description 3
- 238000012549 training Methods 0.000 abstract description 9
- 238000003915 air pollution Methods 0.000 abstract description 5
- 230000002265 prevention Effects 0.000 abstract description 4
- 238000007689 inspection Methods 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 10
- 239000013618 particulate matter Substances 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000013508 migration Methods 0.000 description 4
- 230000005012 migration Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 239000000809 air pollutant Substances 0.000 description 3
- 231100001243 air pollutant Toxicity 0.000 description 3
- 230000006378 damage Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000003916 acid precipitation Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Physiology (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种GA‑BP神经网络耦合决策树的空气质量预测方法,首先获取大量气象数据以及污染物排放数据,随后进行主成分分析,确定主要影响因子;构建一种8‑6‑5结构的BP神经网络模型,引入遗传算法进行优化,获取神经网络最优初始权值和阈值,进而对训练数据集进行学习,预测未来污染物排放浓度并进行准确度检验,其次运用基尼指数法确定空气质量指数级别预测决策树模型的根结点、内部结点和叶节点,构建决策树模型,对未来空气质量指数级别进行预测分类。本发明提供了一种预测速度快、系统性强、精确度高的空气质量预测方法,为区域的空气质量预测、空气质量指数等级分类预测开辟新途径,同时可为区域采取空气污染预防措施提供指导和参考。
Description
技术领域
本发明属于空气质量预测领域,特别涉及一种基于GA-BP神经网络耦合决策树的空气质量预测方法。
背景技术
随着科技的发展、工业的进步以及全球人口急剧增多,大量污染物被排放到空气中对环境产生巨大的破坏的同时使得生态也不断恶化。城市大气污染物体量大、种类多已严重危害到居民的身体健康,同时也直接影响社会的可持续发展。目前,大部分的空气质量预测方法主要依赖于空气质量模拟软件对过去的天气状况以及污染物迁移过程进行模拟,其预测结果为精细化的大气污染物浓度数据,预测结果专业性较强,不易于被居民所理解。除此之外,传统的空气质量预测方法还存在预测过程复杂、预测时间短、预测结果不准确等问题。
空气中的污染物主要为PM2.5、PM10、SO2、NOX、O3、CO等物质。众多研究表明,空气中污染物的过量存在已造成了诸如酸雨、光化学烟雾等一系列环境问题。因此,为了更好的进行大气污染防治工作,指导相关部门以及城市居民采取相应的防护措施,开展空气质量的预测研究工作成为必然。
基于以上分析,设计出一种预测速度快、系统性强、预测精确度高的空气质量预测技术是本领域技术人员亟待解决的技术问题。
发明内容
有鉴于现有技术的上述缺陷,一方面,本发明提供了一种GA-BP神经网络耦合决策树的空气质量预测方法,其特征在于,包括以下步骤:
S1、获取研究对象区域历史气相数据及污染物排放数据;
S2、主成分分析识别确定8项输入变量;
S3、确定8-6-5的网络拓扑结构及构建BP神经网络;
S4、通过遗传算法优化得到GA-BP神经网络并进行预测;
S5、基于CART算法划分数据属性;
S6、构建决策树模型预测空气质量指数级别;
优选的,所述步骤S1中,所述气相数据包括气温、风速、风向、相对湿度、气压和降雨量,所述污染物排放数据包括PM2.5、PM10、NO2、NO、CO和O3,所述气相数据和污染物排放数据通过卫星遥感技术和地面监测站点获取。
优选的,所述步骤S2中,输入变量包括风速、降雨量、相对湿度、PM2.5、PM10、SO2、O3和NO2。
优选的,所述步骤S3中,网络拓扑结构的输出层包括PM2.5、PM10、SO2、O3和NO2合计5项预测浓度数据,其中,隐含层神经元数目设置为6,隐含层神经元个数通过如下公式确定:
其中,H为隐含层神经元数目,I为输入层神经元数目,O为输出层神经元数目,α为整数,取值范围1~10。
优选的,所述步骤S4中,编码及初始化初始群体生成数组作为染色体,通过如下公式确定:
L=I×H+H×O+H+O
L表示染色体长度,I为输入层神经元数目,H为隐含层神经元数目,O为输出层神经元数目。该染色体用于遗传算法的选择、交叉、变异操作;
其中,F表示个体i的适应度值,n为输出层神经元数目,k为系数,abs为绝对值函数,yi为第i个神经元的输出期望值,oi为第i个神经元的输出预测值。
优选的,所述步骤S5中,通过CART算法中的基尼指数法对GA-BP神经网络输出层中5项输出指标的数据属性进行划分,采用如下公式:
其中,Gini表示基尼指数,P(i)表示label=i的概率,n表示label类别的总和;式(5)中,表示基尼指数加权平均值,Gini1表示label=1的基尼指数,Gini2表示label=2的基尼指数,T表示所有label类别包含的个体总个数,a表示label=1的个体数,b表示label=2的个体数。
更优的,所述步骤S6中,通过基尼指数法对所述输出层5项数据的基尼指数加权平均值进行对比确定决策树模型根节点、内部节点和叶节点,并逐层构建决策树模型,空气质量指数级别包括I优、II良、III轻度污染、IV中度污染、V重度污染以及VI严重污染。
第二方面,本发明还提供了一种实施上述方法的GA-BP神经网络耦合决策树的空气质量预测系统,包括:
数据采集模块:用于获取研究对象区域历史气相数据及污染物排放数据;
主成分分析模块:用于确定输入变量;
神经网络模块:用于构建GA-BP神经网络模型;
算法优化模块:基于遗传算法对GA-BP神经网络模型进行优化;
数据划分模块:用于确定基尼指数加权平均值最小的指标为决策树的根节点、内部节点和叶节点;
分类预测模块:用于将计算得出结果对应分类于相应空气质量指数。
第三方面,本发明还提供了一种GA-BP神经网络耦合决策树的空气质量预测设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序实现如前述所公开的实施上述方法的步骤。
第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述所公开的GA-BP神经网络耦合决策树的空气质量预测方法步骤。
本发明提供了一种预测速度快、系统性强、精确度高的空气质量预测方法,与传统的软件相比,传统软件方法模拟污染物迁移过程耗时较长、过程较复杂。而本发明预测方法不需要进行空气污染物迁移过程模拟,耗时短,直接通过对数据的训练,达到预测的目的。可为我国城市(或区域)空气质量预测、空气质量指数等级分类预测开辟新途径,同时可为我国城市(或区域)采取空气污染预防措施提供指导和参考。
附图说明
图1是本发明GA-BP神经网络耦合决策树空气质量预测方法流程图;
图2是本发明的8-6-5三层BP神经网络结构图;
图3是本发明空气质量指数级别预测决策树模型图。
具体实施方式
下面对本发明的实施例作详细说明,下述的实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
一方面,本发明提供了一种GA-BP神经网络耦合决策树的空气质量预测方法,其特征在于,请参阅图1,包括以下步骤:
S1、获取研究对象区域历史气相数据及污染物排放数据;
首先通过使用卫星遥感技术以及地面监测站点获取目标城市(或区域)具有连续性的历史气相数据以及污染物排放数据,并对数据有效性进行判定,剔除数据缺失样本。本发明所需获取的气相数据(日均值)有:气温、风速、风向、相对湿度、气压和降雨量;所需获取的污染物数据类别(日均排放浓度)有:PM2.5、PM10、NO2、NO、CO和O3。
S2、主成分分析识别确定8项输入变量;
主成分分析可实现量化识别关键影响因素,通过Matlab 2019b矩阵工厂软件对影响空气质量的因素进行主成分分析,分析结果即可作为输入层输入变量。该步骤包括使用PCA函数(Principal Component Analysis,主成分分析)对影响空气质量的各个影响因素进行相关性分析得出主成分贡献率,对主成分贡献率进行排序筛选可作为BP神经网络输入变量的指标。经分析,本发明选定的输入变量包括以下8项,分别是风速、降雨量、相对湿度、PM2.5、PM10、SO2、O3和NO2。
S3、确定8-6-5的网络拓扑结构及构建BP神经网络;
基于步骤S2中主成分分析结果可以确定BP神经网络输入层结构,本发明将输出层的输出变量设置为5个预测污染物浓度,包括PM2.5、PM10、SO2、O3和NO2合计5项预测浓度数据。
隐含层神经元个数需要根据公式确定,采用的公式如下:
其中,H为隐含层神经元数目,I为输入层神经元数目,O为输出层神经元数目,α为整数,取值范围1~10。
综合上述分析,已确定输入层输入变量8项,输出层输出变量5项,通过计算,隐含层神经元潜在个数为5~14个。通过试凑实验对不同数量的神经元个数进行误差分析,计算相对误差及相关系数,最终将隐含层神经元数目设置为6。综上分析可构造一种8-6-5结构的BP神经网络,如附图2所示。此外,在传递函数的选择中,隐含层采用了Matlab 2019b矩阵工厂软件中传统的tansig函数,输出层则为purelin函数;训练数据集的学习函数为LM(Levenberg-Marquardt)算法,可实现数据集训练、学习和预测。
请参阅图2,根据图2所示的神经网络结构,将步骤2中所确定的8项输入变量(风速、降雨量、相对湿度、PM2.5、PM10、SO2、O3和NO2。)输入输入层,经过隐含层函数和输出层函数的学习、训练和预测,最终在输出层中输出5项输出变量,实现PM2.5、PM10、SO2、O3和NO2五项污染物浓度的预测。
S4、通过遗传算法优化得到GA-BP神经网络并进行预测;
基于步骤S3中的BP神经网络不同层的神经元之间的初始权值和阈值为随机生成,这种随机产生的方式无法确保输出结果的准确性。为此,在BP神经网络初始权值、阈值的确定流程中耦合遗传算法,使其能够具备全局搜索功能,并通过遗传操作迭代筛选最优的初始权值、阈值以提高神经网络输出结果的准确性。
遗传算法首先通过编码初始群体和初始化,生成一个数组作为染色体,通过如下公式确定:
L=I×H+H×O+H+O
其中,L表示染色体长度,I为输入层神经元数目,H为隐含层神经元数目,O为输出层神经元数目。该染色体用于遗传算法的选择、交叉、变异操作。
其次是确定适应度函数计算个体适应度值,采用的公式如下:
其中,F表示个体i的适应度值,n为输出层神经元数目,k为系数,abs为绝对值函数,yi为第i个神经元的输出期望值,oi为第i个神经元的输出预测值。
随后设置遗传算法迭代次数、交叉率以及变异率,对产生的各个初始权值和阈值进行适应度检验,筛选适应度最佳的个体,在本发明中即为适应度值F最小的个体。该个体可作为最优初始权值、阈值返回BP神经网络模拟程序;
综合上述分析操作,经遗传算法优化BP神经网络得到GA-BP神经网络,并通过选取训练数据样本进行训练和学习并预测污染物浓度数据,再由测试样本进行检验。进一步计算预测数据与测试样本数据的网络误差,网络误差通过神经元反向传播到各层神经节点更新各对相连接的神经元的权值,再重新根据神经网络进行推演,直到网络误差符合预测精度要求方可进行输出层输出预测污染物浓度。
S5、基于CART算法划分数据属性;
以BP神经网络的训练数据集为对象,通过CART算法中的基尼指数法对步骤S3中的P神经网络输出层中的5项输出指标的数据属性进行划分。计算各项指标的基尼指数加权平均值,根据大小排序,确定基尼指数加权平均值最小的指标为决策树的根节点、内部节点和叶节点。
采用的公式如下:
其中,Gini表示基尼指数,P(i)表示label=i的概率,n表示label类别的总和;式(5)中,表示基尼指数加权平均值,Gini1表示label=1的基尼指数,Gini2表示label=2的基尼指数,T表示所有label类别包含的个体总个数,a表示label=1的个体数,b表示label=2的个体数。
在一实施例中,经计算分析后确定PM2.5≤150为决策树的根节点;内部节点包括:PM10≤150、PM2.5≤250、SO2≤3、PM2.5≤75、NO2≤40、O3≤160、NO2≤180、O3≤100、O3≤215;叶节点包括:label=I、label=II、label=III、label=IV、label=V、label=VI。
S6、构建决策树模型预测空气质量指数级别;
根据步骤5对BP神经网络各项输出指标的基尼指数加权平均值进行排序确定决策树根节点、内部节点、叶节点,可逐层构建用于空气质量指数级别预测分类的决策树模型,如附图3所示。根据附图3决策树模型结构,将GA-BP神经网络输出层输出结果中的五项污染物浓度预测值在决策树中自上而下的根据逻辑条件代入根节点以及每一个内部节点进行推演,跟随决策树模型引导最终可将每个污染物浓度预测样本分类到六个空气污染指数级别,分别为(I)优、(II)良、(III)轻度污染、(IV)中度污染、(V)重度污染以及(VI)严重污染。
以附图3为例,在一实施例中,某地某日大气污染物浓度值(单位:μg/m3)如下:PM2.5为33、PM10为38、SO2为3、NO2为33、O3为78。首先判定PM2.5浓度值小于150,进一步判定PM10浓度值小于150,接着判定SO2浓度值小于等于3,决策树模型输出结果为“该日空气质量指数级别为I级”。经验证,该日空气质量指数级别为I级,模型预测结果准确,其他预测样本预测流程以此类推。
在一实施例中,实验人员可通过准确率、空报率、漏报率三项评价指标综合评估检验该模型预测结果的有效性,并与传统预报方式进行对比。
在本实施例中,若预测准确率达90%,则默认该模型为可靠模型;若准确率低于90%,则通过调整权值、阈值重启程序进行重新预测,故本发明的空气预测结果精确度较高。具体采用的公式如下:
综上,通过本发明GA-BP神经网络耦合决策树构建的空气质量预测及级别分类方法,与传统的软件相比,传统软件方法模拟污染物迁移过程耗时较长、过程较复杂。而本发明预测方法不需要进行空气污染物迁移过程模拟,耗时短,直接通过对数据的训练,达到预测的目的。可为我国城市(或区域)空气质量预测、空气质量指数等级分类预测开辟新途径,同时可为我国城市(或区域)采取空气污染预防措施提供指导和参考。可以通过历史气象数据及污染物排放数据进行训练、学习,预测未来污染物排放水平,进而达到预测空气质量状况以及预测空气质量指数级别的目的。
第二方面,本发明还提供了一种实施上述方法的GA-BP神经网络耦合决策树的空气质量预测系统,包括:
数据采集模块:用于获取研究对象区域历史气相数据及污染物排放数据;
主成分分析模块:用于确定输入变量;
神经网络模块:用于构建GA-BP神经网络模型;
算法优化模块:基于遗传算法对GA-BP神经网络模型进行优化;
数据划分模块:用于确定基尼指数加权平均值最小的指标为决策树的根节点、内部节点和叶节点;
分类预测模块:用于将计算得出结果对应分类于相应空气质量指数。
第三方面,本发明还提供了一种GA-BP神经网络耦合决策树的空气质量预测设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序实现如前述所公开的实施上述方法的步骤。
第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述所公开的GA-BP神经网络耦合决策树的空气质量预测方法步骤。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的试验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (10)
1.一种GA-BP神经网络耦合决策树的空气质量预测方法,其特征在于,包括以下步骤:
S1、获取研究对象区域历史气相数据及污染物排放数据;
S2、主成分分析识别确定8项输入变量;
S3、确定8-6-5的网络拓扑结构及构建BP神经网络;
S4、通过遗传算法优化得到GA-BP神经网络并进行预测;
S5、基于CART算法划分数据属性;
S6、构建决策树模型预测空气质量指数级别。
2.根据权利要求1所述的一种GA-BP神经网络耦合决策树的空气质量预测方法,其特征在于,所述步骤S1中,所述气相数据包括气温、风速、风向、相对湿度、气压和降雨量,所述污染物排放数据包括PM2.5、PM10、NO2、NO、CO和O3,所述气相数据和污染物排放数据通过卫星遥感技术和地面监测站点获取。
3.根据权利要求1所述的一种GA-BP神经网络耦合决策树的空气质量预测方法,其特征在于,所述步骤S2中,输入变量包括风速、降雨量、相对湿度、PM2.5、PM10、SO2、O3和NO2。
7.根据权利要求4所述的一种GA-BP神经网络耦合决策树的空气质量预测方法,其特征在于,所述步骤S6中,通过基尼指数法对所述输出层5项数据的基尼指数加权平均值进行对比确定决策树模型根节点、内部节点和叶节点,并逐层构建决策树模型,空气质量指数级别包括I优、II良、III轻度污染、IV中度污染、V重度污染以及VI严重污染。
8.一种GA-BP神经网络耦合决策树的空气质量预测系统,其特征在于,包括:
数据采集模块:用于获取研究对象区域历史气相数据及污染物排放数据;
主成分分析模块:用于确定输入变量;
神经网络模块:用于构建GA-BP神经网络模型;
算法优化模块:基于遗传算法对GA-BP神经网络模型进行优化;
数据划分模块:用于确定基尼指数加权平均值最小的指标为决策树的根节点、内部节点和叶节点;
分类预测模块:用于将计算得出结果对应分类于相应空气质量指数。
9.一种GA-BP神经网络耦合决策树的空气质量预测设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的GA-BP神经网络耦合决策树的空气质量预测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的GA-BP神经网络耦合决策树的空气质量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210493233.4A CN114781538B (zh) | 2022-05-07 | 2022-05-07 | 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210493233.4A CN114781538B (zh) | 2022-05-07 | 2022-05-07 | 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114781538A true CN114781538A (zh) | 2022-07-22 |
CN114781538B CN114781538B (zh) | 2024-08-23 |
Family
ID=82434628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210493233.4A Active CN114781538B (zh) | 2022-05-07 | 2022-05-07 | 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114781538B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115656446A (zh) * | 2022-12-26 | 2023-01-31 | 沃客森信息科技(常州)有限公司 | 一种基于物联网的空气质量检测系统及方法 |
CN115796707A (zh) * | 2023-02-02 | 2023-03-14 | 浪潮通用软件有限公司 | 一种pvb树脂产品质量指标预测方法及装置 |
CN116307212A (zh) * | 2023-03-24 | 2023-06-23 | 淮阴工学院 | 一种新型空气质量预测方法及系统 |
CN116431999A (zh) * | 2023-06-13 | 2023-07-14 | 湖南工商大学 | 基于自适应主成分分析及神经网络的pm2.5浓度预测方法 |
CN117852717A (zh) * | 2024-01-10 | 2024-04-09 | 中国气象局气象发展与规划院 | 基于遗传算法优化反向传播神经网络的台风灾害预测方法 |
CN117852318A (zh) * | 2024-03-07 | 2024-04-09 | 中汽研汽车检验中心(昆明)有限公司 | 一种汽车尾气净化装置耦合系统的性能仿真方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190114509A1 (en) * | 2016-04-29 | 2019-04-18 | Microsoft Corporation | Ensemble predictor |
CN111259601A (zh) * | 2020-01-16 | 2020-06-09 | 南华大学 | 基于随机ga-bp神经网络群的爆破块度预测方法、装置及介质 |
CN112116145A (zh) * | 2020-09-15 | 2020-12-22 | 东北农业大学 | 基于遗传算法优化bp神经网络的奶牛采食量评估方法 |
CN113011660A (zh) * | 2021-03-23 | 2021-06-22 | 上海应用技术大学 | 空气质量预测方法、系统及存储介质 |
CN113052353A (zh) * | 2019-12-27 | 2021-06-29 | 中移雄安信息通信科技有限公司 | 空气质量预测与预测模型训练方法、装置及存储介质 |
-
2022
- 2022-05-07 CN CN202210493233.4A patent/CN114781538B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190114509A1 (en) * | 2016-04-29 | 2019-04-18 | Microsoft Corporation | Ensemble predictor |
CN113052353A (zh) * | 2019-12-27 | 2021-06-29 | 中移雄安信息通信科技有限公司 | 空气质量预测与预测模型训练方法、装置及存储介质 |
CN111259601A (zh) * | 2020-01-16 | 2020-06-09 | 南华大学 | 基于随机ga-bp神经网络群的爆破块度预测方法、装置及介质 |
CN112116145A (zh) * | 2020-09-15 | 2020-12-22 | 东北农业大学 | 基于遗传算法优化bp神经网络的奶牛采食量评估方法 |
CN113011660A (zh) * | 2021-03-23 | 2021-06-22 | 上海应用技术大学 | 空气质量预测方法、系统及存储介质 |
Non-Patent Citations (1)
Title |
---|
尤游;王蒙;: "基于GA-BP神经网络的自建点PM2.5浓度校准研究", 佳木斯大学学报(自然科学版), no. 04, 15 July 2020 (2020-07-15) * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115656446A (zh) * | 2022-12-26 | 2023-01-31 | 沃客森信息科技(常州)有限公司 | 一种基于物联网的空气质量检测系统及方法 |
CN115796707A (zh) * | 2023-02-02 | 2023-03-14 | 浪潮通用软件有限公司 | 一种pvb树脂产品质量指标预测方法及装置 |
CN116307212A (zh) * | 2023-03-24 | 2023-06-23 | 淮阴工学院 | 一种新型空气质量预测方法及系统 |
CN116307212B (zh) * | 2023-03-24 | 2023-12-19 | 淮阴工学院 | 一种空气质量预测方法及系统 |
CN116431999A (zh) * | 2023-06-13 | 2023-07-14 | 湖南工商大学 | 基于自适应主成分分析及神经网络的pm2.5浓度预测方法 |
CN117852717A (zh) * | 2024-01-10 | 2024-04-09 | 中国气象局气象发展与规划院 | 基于遗传算法优化反向传播神经网络的台风灾害预测方法 |
CN117852318A (zh) * | 2024-03-07 | 2024-04-09 | 中汽研汽车检验中心(昆明)有限公司 | 一种汽车尾气净化装置耦合系统的性能仿真方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114781538B (zh) | 2024-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111832814B (zh) | 一种基于图注意力机制的空气污染物浓度预测方法 | |
CN114781538A (zh) | 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 | |
Khajavi et al. | Predicting the carbon dioxide emission caused by road transport using a Random Forest (RF) model combined by Meta-Heuristic Algorithms | |
CN111915059B (zh) | 基于注意力机制的Seq2seq泊位占有率预测方法 | |
CN108426812B (zh) | 一种基于记忆神经网络的pm2.5浓度值预测方法 | |
CN113468803B (zh) | 一种基于改进的woa-gru洪水流量预测方法及系统 | |
CN110555551B (zh) | 一种智慧城市的空气质量大数据管理方法及系统 | |
Wu et al. | A hybrid support vector regression approach for rainfall forecasting using particle swarm optimization and projection pursuit technology | |
CN110610209A (zh) | 一种基于数据挖掘的空气质量预测方法及系统 | |
Cacciola et al. | Aspects about air pollution prediction on urban environment | |
Song et al. | Study on turbidity prediction method of reservoirs based on long short term memory neural network | |
Cabaneros et al. | Methods used for handling and quantifying model uncertainty of artificial neural network models for air pollution forecasting | |
CN113240201A (zh) | 一种基于gmm-dnn混合模型预测船舶主机功率方法 | |
Ao et al. | Hybrid model of air quality prediction using k-means clustering and deep neural network | |
Kavyanifar et al. | Coastal solid waste prediction by applying machine learning approaches (Case study: Noor, Mazandaran Province, Iran) | |
CN115948964A (zh) | 一种基于ga-bp神经网络的路面平整度预测方法 | |
Wang et al. | Research on air pollution gases recognition method based on lstm recurrent neural network and gas sensors array | |
CN116933946A (zh) | 一种基于客流去向结构的轨道交通od客流预测方法及系统 | |
Sharma et al. | Forecasting and prediction of air pollutants concentrates using machine learning techniques: the case of India | |
CN115096357A (zh) | 一种基于ceemdan-pca-lstm的室内环境质量预测方法 | |
Asaei-Moamam et al. | Air quality particulate-pollution prediction applying GAN network and the Neural Turing Machine | |
CN117808214A (zh) | 水利工程数据分析系统 | |
CN114596726A (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
CN117370813A (zh) | 一种基于k线模式匹配算法的大气污染深度学习预测方法 | |
Li et al. | A data-driven rutting depth short-time prediction model with metaheuristic optimization for asphalt pavements based on RIOHTrack |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |