CN111079973A - 一种基于改进粒子群优化svm的空气质量预测算法 - Google Patents
一种基于改进粒子群优化svm的空气质量预测算法 Download PDFInfo
- Publication number
- CN111079973A CN111079973A CN201911088403.5A CN201911088403A CN111079973A CN 111079973 A CN111079973 A CN 111079973A CN 201911088403 A CN201911088403 A CN 201911088403A CN 111079973 A CN111079973 A CN 111079973A
- Authority
- CN
- China
- Prior art keywords
- particle swarm
- air quality
- svm
- particle
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002245 particle Substances 0.000 title claims abstract description 90
- 238000005457 optimization Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 15
- 239000013598 vector Substances 0.000 claims abstract description 9
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000007418 data mining Methods 0.000 abstract description 2
- 230000007547 defect Effects 0.000 abstract description 2
- 238000001556 precipitation Methods 0.000 abstract 1
- 238000012706 support-vector machine Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Feedback Control In General (AREA)
Abstract
本发明涉及一种基于改进粒子群优化SVM的空气质量预测算法,属于数据挖掘以及进化算法领域。该算法首先考虑气温、湿度、日照、降水量等多种气象要素,选择与空气质量相关性较强的气象要素构成特征向量,接着利用特征向量与空气质量数据作为SVM预测模型的输入,针对现有的粒子群算法存在的收敛速度慢以及易陷入局部最优解的缺点提出改进的粒子群算法,并用改进的粒子群算法对SVM模型参数进行优化找出最优参数,最后利用最优参数模型对空气质量进行预测。本算法利用改进的粒子群算法充分挖掘SVM模型的潜力,与其他现有预测方法相比具有精度高等优点。
Description
技术领域
本发明涉及数据挖掘以及进化算法领域,具体的涉及一种基于改进粒子群优化SVM的空气质量预测算法。
背景技术
近年来,随着工业生产的发展与人类活动的增加,造成大量能源消耗与废物排放,空气质量问题日益突出,尤其是可吸入颗粒物(PM2.5)严重影响人体健康。因此空气质量的精准预测对人们的生产、生活、培养保护环境意识等具有重要的指导意义。
目前对空气质量预测的研究多采用机器学习。目前的主要预测方法有神经网络、支持向量机(SVM)、时空数据模型等,这些方法的预测精度大都和其参数的选取有关,目前的主流研究大都靠建模者本身的经验进行参数选取,这就造成难以推广的难点。
发明内容
为了弥补先有技术的不足,本发明以改进的粒子群算法寻找最优SVM模型参数为中心点提出一种基于改进粒子群优化SVM的空气质量预测算法
为实现上述目的,设计了三个部分:确定SVM模型的输入量、改进现有的粒子群算法以及利用改进的粒子群算法找出SVM模型的最优参数。
其各个部分的方法如下:
确定模型的输入量首先对空气质量数据以及各种气象数据做归一化处理,利用灰色关联法对空气质量数据以及气温、湿度、温度等气象因素进行分析,找出关联系数在0.4以上的气象因素作为特征向量,利用特征向量与空气质量数据作为SVM模型的输入。
改进现有的粒子群算法所做的工作是:
粒子群算法是基于粒子迭代寻找解空间的最优值的一种全局动态寻优计算方法,该算法通过在每次迭代过程中追寻全局极值和个体极值Pibest来不断的调整自己的位置与速度。其迭代公式为:
上式中(1)为速度更新公式,(2)为位置更新公式,w称为惯性因子,C1和C2称为加速常数,一般选取C1,C2∈[0,4]。r1,r2表示在0到1之间随机的数值。基于粒子群算法的原理w应该随着搜索的进行而不断减小。w的变化规律表示为:
式(3)中:wmax、wmin分别为最大、最小惯性权重;Tmax、Ti分别为最大迭代次数和当前迭代次数。
基本的粒子群算法存在两个问题:1)算法后期,粒子多集中在最优解的一边导致粒子寻优速度下降,迭代速度变慢;2)算法容易早熟,陷入局部最优解。针对现有的问题提出增加动量项以及用余弦函数来自适应权重的改进粒子群算法。
首先在基本的粒子群算法的速度更新公式中加入动量项:
接着采用0~π之间的余弦函数控制惯性权值的变化:
w=[(wmax-wmin)/2]cos(πTi/Tmax)+(wmax+wmin)/2 (5)
改进后新的速度以及位置公式为:
利用改进的粒子群算法找出SVM模型的最优参数部分所做的工作是:利用改进的粒子群算法对SVM模型的优化步骤如下:
Step0:初始化算法的参数c1,c2,w,α以及粒子群规模以及最大的迭代次数 Tmax。随机初始化SVM参数组合(C,σ,ε,λ)在解的空间中的位置以及粒子初始速度和位置,设置粒子的最大速度Vmax、惯性权重w取值范围以及SVM各参数的取值范围。
Step1:将粒子的个体极值Pibest设置为粒子当前的位置。计算各个粒子的适应度值,取适应度最小的粒子的Pibest作为开始的全局极值Pgbest。
Step2:根据公式(12)(13)重新确定粒子的速度以及位置,根据公式(14) 确定新的适应度值,令pipresent=Ffitness。
Step3:比较更新后的适应度值pipresent和粒子当前最优的Pibest,若 pipresent>Pibest,则更新Pibest。
Step4:比较更新后的pipresent和全局最优解Pgbest。若pipresent>Pgbest,则更新Pgbest。
Step5:判断收敛条件是否满足若满足则输出最优SVM参数组合,否则回到 Step1
附图说明
图1是本发明的算法流程图。
图2是本发明的改进粒子群算法优化SVM模型流程图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图说明本发明的具体实施方式。
图1是本发明的算法流程图:
第一步:对空气质量数据进行预处理,剔除异常数据,对缺少的数据进行插补。
第二步:分析空气质量与气象要素的相关性,找出与空气质量相关性较强的气象要素作为特征向量。首先对空气质量数据以及各种气象数据做归一化处理,利用灰色关联法对空气质量数据以及气温、湿度、温度等气象因素进行分析,找出关联系数在0.4以上的气象因素作为特征向量。
第三步:划分训练样本与测试样本,训练样本用来寻找模型参数,测试样本用来实验模型性能。
第四步:改进的粒子群算法优化并设置初始化参数。粒子群算法是基于粒子迭代寻找解空间的最优值的一种全局动态寻优计算方法,该算法通过在每次迭代过程中追寻全局极值Pgbest和个体极值Pibest来不断的调整自己的位置与速度。其迭代公式为:
上式中(1)为速度更新公式,(2)为位置更新公式,w称为惯性因子,C1和C2称为加速常数,一般选取C1,C2∈[0,4]。r1,r2表示在0到1之间随机的数值。基于粒子群算法的原理w应该随着搜索的进行而不断减小。w的变化规律表示为:
式(3)中:wmax、wmin分别为最大、最小惯性权重;Tmax、Ti分别为最大迭代次数和当前迭代次数。
基本的粒子群算法存在两个问题:1)算法后期,粒子多集中在最优解的一边导致粒子寻优速度下降,迭代速度变慢;2)算法容易早熟,陷入局部最优解。针对现有的问题提出增加动量项以及用余弦函数来自适应权重的改进粒子群算法。
首先在基本的粒子群算法的速度更新公式中加入动量项:
接着采用0~π之间的余弦函数控制惯性权值的变化:
w=[(wmax-wmin)/2]cos(πTi/Tmax)+(wmax+wmin)/2 (5)
改进后新的速度以及位置公式为:
初始化参数如下:c1=1.5,c2=1.7,α=0.4,最大迭代次数Tmax=300,种群规模m=20,w∈[0.4,0.95],Vmax=50,C∈[1,100],ε∈[0.001,10],λ∈[0.50,0.99],σ∈(0,10]。
第五步:利用改进的粒子群算法寻找SVM模型的最优参数。把训练样本输入支持向量机建立回归模型,利用改进的粒子群算法对SVM模型的优化步骤如下:
Step0:初始化算法的参数c1,c2,w,α以及粒子群规模以及最大的迭代次数 Tmax。随机初始化SVM参数组合(C,σ,ε,λ)在解的空间中的位置以及粒子初始速度和位置,设置粒子的最大速度Vmax、惯性权重w取值范围以及SVM各参数的取值范围。
Step1:将粒子的个体极值Pibest设置为粒子当前的位置。计算各个粒子的适应度值,取适应度最小的粒子的Pibest作为开始的全局极值Pgbest。
Step2:根据公式(12)(13)重新确定粒子的速度以及位置,根据公式(14) 确定新的适应度值,令pipresent=Ffitness。
Step3:比较更新后的适应度值pipresent和粒子当前最优的Pibest,若 pipresent>Pibest,则更新Pibest。
Step4:比较更新后的pipresent和全局最优解Pgbest。若pipresent>Pgbest,则更新Pgbest。
Step5:判断收敛条件是否满足若满足则输出最优SVM参数组合,否则回到 Step1。
第六步:利用得到的最优模型进行回归预测分析。
图2是本发明的改进粒子群算法优化SVM模型流程图
第一步:初始化算法的参数c1,c2,w,α以及粒子群规模以及最大的迭代次数 Tmax。随机初始化SVM参数组合(C,σ,ε,λ)在解的空间中的位置以及粒子初始速度和位置,设置粒子的最大速度Vmax、惯性权重w取值范围以及SVM各参数的取值范围。
第二步:将粒子的个体极值Pibest设置为粒子当前的位置。计算各个粒子的适应度值,取适应度最小的粒子的Pibest作为开始的全局极值Pgbest。
第三步:根据公式(12)(13)重新确定粒子的速度以及位置,根据公式(14) 确定新的适应度值,令pipresent=Ffitness。
第四步:比较更新后的适应度值pipresent和粒子当前最优的Pibest,若 pipresent>Pibest,则更新Pibest。
第五步:比较更新后的pipresent和全局最优解Pgbest。若pipresent>Pgbest,则更新Pgbest。
第六步:判断收敛条件是否满足若满足则输出最优SVM参数组合,否则回到Step1。
Claims (4)
1.一种基于改进粒子群优化SVM的空气质量预测算法,其特征在于:所述一种基于改进粒子群算法的空气质量预测方法的具体步骤如下:
第一步:对空气质量数据进行预处理;
第二步:分析空气质量与气象要素的相关性,找出与空气质量相关性较强的气象要素作为特征向量;
第三步:利用特征向量与空气质量数据作为SVM模型的输入;
第四步:对现有的粒子群算法进行改进;
第五步:利用改进的粒子群算法找出SVM模型的最优参数;
第六步:利用优化后的SVM模型对空气质量浓度进行分析预测。
2.根据权利要求1所述的一种基于改进粒子群优化SVM的空气质量预测算法,其特征在于:首先对空气质量数据以及各种气象数据做归一化处理,利用灰色关联法对空气质量数据以及气温、湿度、温度等气象因素进行分析,找出关联系数在0.4以上的气象因素作为特征向量。
3.根据权利要求1所述的一种基于改进粒子群优化SVM的空气质量预测算法,其特征在于:在第四步中,粒子群算法是基于粒子迭代寻找解空间的最优值的一种全局动态寻优计算方法,该算法通过在每次迭代过程中追寻全局极值Pgbest和个体极值Pibest来不断的调整自己的位置与速度。其迭代公式为:
上式中(1)为速度更新公式,(2)为位置更新公式,w称为惯性因子,C1和C2称为加速常数,一般选取C1,C2∈[0,4]。r1,r2表示在0到1之间随机的数值。基于粒子群算法的原理w应该随着搜索的进行而不断减小。w的变化规律表示为:
式(3)中:wmax、wmin分别为最大、最小惯性权重;Tmax、Ti分别为最大迭代次数和当前迭代次数。
基本的粒子群算法存在两个问题:1)算法后期,粒子多集中在最优解的一边导致粒子寻优速度下降,迭代速度变慢;2)算法容易早熟,陷入局部最优解。针对现有的问题提出增加动量项以及用余弦函数来自适应权重的改进粒子群算法。
首先在基本的粒子群算法的速度更新公式中加入动量项:
接着采用0~π之间的余弦函数控制惯性权值的变化:
w=[(wmax-wmin)/2]cos(πTi/Tmax)+(wmax+wmin)/2 (5)
改进后新的速度以及位置公式为:
4.根据权利要求1所述的一种基于改进粒子群优化SVM的空气质量预测算法,其特征在于:利用改进的粒子群算法对SVM模型的优化步骤如下:
Step0:初始化算法的参数c1,c2,w,α以及粒子群规模以及最大的迭代次数Tmax。随机初始化SVM参数组合(C,σ,ε,λ)在解的空间中的位置以及粒子初始速度和位置,设置粒子的最大速度Vmax、惯性权重w取值范围以及SVM各参数的取值范围。
Step1:将粒子的个体极值Pibest设置为粒子当前的位置。计算各个粒子的适应度值,取适应度最小的粒子的Pibest作为开始的全局极值Pgbest。
Step2:根据公式(12)(13)重新确定粒子的速度以及位置,根据公式(14)确定新的适应度值,令pipresent=Ffitness。
Step3:比较更新后的适应度值pipresent和粒子当前最优的Pibest,若pipresent>Pibest,则更新Pibest。
Step4:比较更新后的pipresent和全局最优解Pgbest。若pipresent>Pgbest,则更新Pgbest。
Step5:判断收敛条件是否满足若满足则输出最优SVM参数组合,否则回到Step1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911088403.5A CN111079973A (zh) | 2019-11-08 | 2019-11-08 | 一种基于改进粒子群优化svm的空气质量预测算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911088403.5A CN111079973A (zh) | 2019-11-08 | 2019-11-08 | 一种基于改进粒子群优化svm的空气质量预测算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111079973A true CN111079973A (zh) | 2020-04-28 |
Family
ID=70310740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911088403.5A Pending CN111079973A (zh) | 2019-11-08 | 2019-11-08 | 一种基于改进粒子群优化svm的空气质量预测算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111079973A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113140309A (zh) * | 2021-04-14 | 2021-07-20 | 五邑大学 | 中医面色诊断方法及装置 |
-
2019
- 2019-11-08 CN CN201911088403.5A patent/CN111079973A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113140309A (zh) * | 2021-04-14 | 2021-07-20 | 五邑大学 | 中医面色诊断方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Buche et al. | Accelerating evolutionary algorithms with Gaussian process fitness function models | |
CN108399201B (zh) | 一种基于循环神经网络的Web用户访问路径预测方法 | |
CN102072922B (zh) | 基于粒子群优化神经网络模型的木材含水率检测方法 | |
CN110020712B (zh) | 一种基于聚类的优化粒子群bp网络预测方法和系统 | |
CN110784455B (zh) | 基于线性递减权重粒子群算法优化Xgboost模型方法 | |
CN106934074B (zh) | 全局最优涡扇发动机进气道减噪设计方法 | |
CN113095550A (zh) | 基于变分递归网络和自注意力机制的空气质量预测方法 | |
CN105701572A (zh) | 一种基于改进高斯过程回归的光伏短期出力预测方法 | |
CN110766222A (zh) | 基于粒子群参数优化和随机森林的pm2.5浓度预测方法 | |
CN111461286A (zh) | 基于进化神经网络的Spark参数自动优化系统和方法 | |
CN116796141A (zh) | 一种基于gbdt回归模型的办公建筑能耗预测方法 | |
CN105913078A (zh) | 改进自适应仿射传播聚类的多模型软测量方法 | |
CN116757057A (zh) | 基于pso-ga-lstm模型的空气质量预测方法 | |
CN111832839A (zh) | 基于充分增量学习的能耗预测方法 | |
CN111079973A (zh) | 一种基于改进粒子群优化svm的空气质量预测算法 | |
CN112884222B (zh) | 一种面向时间段的lstm交通流密度预测方法 | |
CN112836902B (zh) | 一种基于改进型bp神经网络的煤燃烧发热量预测方法 | |
CN117370766A (zh) | 一种基于深度学习的卫星任务规划方案评估方法 | |
CN111260029A (zh) | 一种面向空气质量数据的可信度分析方法 | |
Gajjala et al. | Human activity recognition based on lstm neural network optimized by pso algorithm | |
CN110163437B (zh) | 基于DPK-means的日前光伏发电功率预测方法 | |
CN110276478B (zh) | 基于分段蚁群算法优化svm的短期风电功率预测方法 | |
CN109187898B (zh) | 水产养殖环境中水质氨氮含量的软测量方法及装置 | |
Wu et al. | Optimization and improvement based on K-Means Cluster algorithm | |
CN116662893A (zh) | 一种基于改进的樽海鞘算法优化svm的水质预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200428 |