CN110766237A - 基于spgapso-svm算法的公交客流量预测方法及系统 - Google Patents
基于spgapso-svm算法的公交客流量预测方法及系统 Download PDFInfo
- Publication number
- CN110766237A CN110766237A CN201911049432.0A CN201911049432A CN110766237A CN 110766237 A CN110766237 A CN 110766237A CN 201911049432 A CN201911049432 A CN 201911049432A CN 110766237 A CN110766237 A CN 110766237A
- Authority
- CN
- China
- Prior art keywords
- fitness
- population
- individual
- passenger flow
- spgapso
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 93
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000002245 particle Substances 0.000 claims description 48
- 230000006870 function Effects 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 20
- 238000005457 optimization Methods 0.000 claims description 18
- 230000002068 genetic effect Effects 0.000 claims description 7
- 230000035772 mutation Effects 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 210000000349 chromosome Anatomy 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000012706 support-vector machine Methods 0.000 description 26
- 238000004364 calculation method Methods 0.000 description 15
- 238000011160 research Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000002790 cross-validation Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012067 mathematical method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Genetics & Genomics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Physiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于公交客流量预测技术领域,尤其涉及基于SPGAPSO‑SVM算法的公交客流量预测方法及系统,其包括通过基于大规模数据处理的快速通用计算引擎平台的弹性分布式数据集进行种群的构建、切分和并行化处理,并输出最优系统参数,本发明解决了现有技术存在现有预测模型计算适应度消耗时间过长的问题,具有较高的预测准确率、较快的运行速度和良好的可扩展性的有益技术效果。
Description
技术领域
本发明属于公交客流量预测技术领域,尤其涉及基于SPGAPSO-SVM算法的公交客流量预测方法及系统。
背景技术
准确预测城市公交客流量对于科学地进行城市公交车运营调度决策、提高公交车运营效率具有十分重要的意义,在现代交通系统中,城市公交车发挥着重要职能,相对于其他出行方式,公共交通具有载客量大、排污量小、成本较低等特点,为了保障城市公交高效有序的运营,不仅需要良好的公交运营管理方案,有效的运营调度同样必不可少,利用公交相关信息数据进行准确公交客流量预测可以为城市公交车的运营调度提供有效的决策支持;
目前国内外学者在公交客流量预测领域已经取得了一定的研究成果,研究成果可分为两类,一类是用数学方法建立数学规划模型或线性预测模型来实现对城市公交客流量的预测,如文献1《利用多元线性回归方法建立公交各时间段客流量模型》,并通过城市一卡通数据对模型进行了验证,如文献2提出了《基于卡尔曼滤波的短时客流量预测方法》,首先基于卡尔曼滤波原理对地铁换乘客流系统构建状态方程,然后运用灰色关联分析来确定该状态转移矩阵的值,进而实现客流量的预测,另一类是通过机器学习或人工智能中的相关算法构建预测模型,利用训练数据对模型进行训练,从而预测出客流量,如文献3构造了支持向量机(Support-Vector-Machine,SVM)预测模型并运用粒子群算法优化模型,实现了地铁站点客流量预测,如文献4采用基于黄金分割的粒子群对SVM的参数进行寻优,构建了混合核SVM客流量预测模型4,如文献5基于深度信念网络和支持向量回归机提出了城市轨道交通短时客流深层预测模型DBN-P/GSVM,同时基于嵌入式遗传算法和粒子群算法实现SVM的参数寻优;
当前大数据时代,传统的数学方法消耗时间过长,已不能应对庞大的数据量增长,SVM作为经典的机器学习算法之一,其优秀的泛化能力和对数据的低要求使它成为客流量预测的主流方法,针对传统SVM预测模型准确率不高的问题;
传统的预测模型,如SVM客流量预测模型、遗传算法优化、粒子群算法优化、GAPSO-SVM算法、GAPSO-SVM算法等,其中,GAPSO-SVM算法是本发明最接近的现有技术,该算法通过GAPSO-SVM算法的GA操作和PSO操作可分为初始化种群,种群更新,计算适应度3部分,初始化种群包括参数初始化、随机生成初始化种群、计算初始化种群适应度,种群更新包括选择操作、交叉操作、变异操作、速度更新、位置更新、种群更新,计算适应度包括遍历种群中的所有个体,并调用svm_train函数计算个体适应度。分别运行GA操作和PSO操作20次,其中最大迭代次数为50,种群规模为20,计算并记录各部分消耗时间的平均值,针对GAPSO-SVM算法而言,种群内所有个体适应度的计算约占总体算法运行时间的91.4%,逻辑较为复杂的种群更新耗时约占总体算法运行时间的5.72%,初始化种群约占总体算法运行时间的3.4%,计算适应度耗时过长是因为每个个体都需要进行一次交叉验证来计算样本均方误差(Mean Square Error,MSE),如最大迭代次数为50,种群规模为20,交叉验证参数为5,则要进行5000次交叉验证;
现有技术存在现有预测模型计算适应度消耗时间过长的问题。
发明内容
本发明提供基于SPGAPSO-SVM算法的公交客流量预测方法及系统,以解决上述背景技术中提出了现有技术存在现有预测模型计算适应度消耗时间过长的问题。
本发明所解决的技术问题采用以下技术方案来实现:基于SPGAPSO-SVM算法的公交客流量预测方法,包括:通过基于大规模数据处理的快速通用计算引擎平台的弹性分布式数据集进行种群的构建、切分和并行化处理,并输出最优系统参数。
进一步,所述子种群的构建、切分和并行化处理包括将构建的种群切分为多个子种群,并将多个子种群通过适应度函数分别并行计算子种群内每个个体的适应度,将每个个体的适应度合并形成个体的适应度数据集,将个体的适应度数据集分别进行基于SPARK并行遗传算法SPGA操作和基于SPARK并行粒子群优化算法SPPSO操作更新种群,将更新的两个种群比较优劣,并保留两个种群最优值,若满足终止条件,则输出最优智能算法优化SVM参数。
进一步,所述适应度函数优选SVM的样本均方误差MSE函数,所述MSE函数为:
所述N为种群大小;
所述m为种群分组数;
所述si 2是第i组的样本方差。
进一步,所述SPGA操作包括在SPGA操作开始阶段,设置平台配置参数,通过二进制编码将参数变量编码成染色体随机初始化种群,将初始化的种群转化为弹性分布式数据集Rdd,分别并行计算种群内个体的适应度,并合并所有个体适应度形成个体的适应度数据集,并比较出最优适应度,对个体的适应度数据集通过轮盘赌方法对当前种群进行选择操作、交叉操作和变异操作以更新新的种群,若满足终止条件,则结束SPGA操作。
进一步,对当前种群进行选择操作、交叉操作和变异操作中每个个体进入下一代的概率等于它的适应度值与整个种群中个体适应度值和的比例。
进一步,所述SPPSO操作包括在SPPSO操作开始阶段,设置平台配置参数,并随机初始化个体位置和速度,将初始化的种群转化为弹性分布式数据集Rdd,分别并行计算种群内个体的适应度,并合并所有个体适应度形成个体的适应度数据集,以当前种群为基础,通过个体极值函数和全局极值函数更新个体位置和速度,随后比较出个体最优适应度和全局最优适应度,若满足终止条件,则结束SPPSO。
进一步,所述更新粒子速度函数为:
v=vi+c1r1(pbest-xi)+c2r2(gbest-xi);
所述v为更新后粒子速度;
所述x为更新后粒子位置;
所述vi是粒子当前速度;
所述xi是粒子当前位置;
所述c1和c2分别为学习因子;
所述r1和r2为(0,1)之间的随机数;
所述pbest为个体极值;
所述gbest为全局极值;
进一步,所述更新粒子位置函数为:
x=xi+vi;
所述x为更新后粒子位置;
所述vi是粒子当前速度;
所述xi是粒子当前位置。
进一步,所述大规模数据处理的快速通用计算引擎平台优选采用Spark平台。
同时,本发明还提供基于SPGAPSO-SVM算法的公交客流量预测方法系统,包括安保信息评估模块;
所述安保信息评估模块基于上述公交客流量预测方法构建。
有益技术效果:
本专利采用通过基于大规模数据处理的快速通用计算引擎平台的弹性分布式数据集进行种群的构建、切分和并行化处理,并输出最优系统参数,由于对公交客流量预测领域相关研究成果进行深入分析研究的基础上,在传统SVM预测模型的参数寻优阶段采用了基于GA和PSO的GAPSO-SVM算法,解决了传统SVM预测模型预测准确率较低的问题;针对GAPSO-SVM算法复杂度较高和运行速度过慢的问题,对GAPSO-SVM算法基于Spark平台进行了并行化处理,提出SPGAPSO-SVM算法,该算法有效提高了运行速度和效率,选取广州市6路和11路公交车5个月的IC卡交易数据作为实验数据,并根据实际需求对该开放数据集进行了预处理,设计GAPSO-SVM算法耗时分析、SPGAPSO-SVM算法准确率和效率、算法可扩展性、客流量预测等多组实验对SPGAPSO-SVM算法进行了验证,实验结果表明,SPGAPSO-SVM算法具有较高的预测准确率、较快的运行速度和良好的可扩展性。
附图说明
图1是本发明基于SPGAPSO-SVM算法的公交客流量预测方法的总流程图;
图2是本发明基于SPGAPSO-SVM算法的公交客流量预测方法的具体流程图;
图3是本发明基于SPGAPSO-SVM算法的公交客流量预测方法的SPGA操作伪代码的流程图;
图4是本发明基于SPGAPSO-SVM算法的公交客流量预测方法的SPPSO操作伪代码的流程图。
具体实施方式
以下结合附图对本发明做进一步描述:
图中:
S101-通过基于大规模数据处理的快速通用计算引擎平台的弹性分布式数据集;
S102-进行种群的构建、切分和并行化处理;
S103-输出最优系统参数;
S201-将构建的种群切分为多个子种群;
S202-将多个子种群通过适应度函数分别并行计算子种群内每个个体的适应度;
S203-将每个个体的适应度合并形成个体的适应度数据集;
S204-将个体的适应度数据集分别进行基于SPARK并行遗传算法SPGA操作更新种群;
S205-将个体的适应度数据集分别进行基于SPARK并行粒子群优化算法SPPSO操作更新种群;
S206-将更新的两个种群比较优劣,并保留两个种群最优值;
S207-若满足终止条件,则输出最优智能算法优化SVM参数;
实施例:
本实施例:如图1所示,基于SPGAPSO-SVM算法的公交客流量预测方法,包括:通过基于大规模数据处理的快速通用计算引擎平台的弹性分布式数据集S101进行种群的构建、切分和并行化处理S102,并输出最优系统参数S103。
由于采用通过基于大规模数据处理的快速通用计算引擎平台的弹性分布式数据集进行种群的构建、切分和并行化处理,并输出最优系统参数,由于对公交客流量预测领域相关研究成果进行深入分析研究的基础上,在传统SVM预测模型的参数寻优阶段采用了基于GA和PSO的GAPSO-SVM算法,解决了传统SVM预测模型预测准确率较低的问题;针对GAPSO-SVM算法复杂度较高和运行速度过慢的问题,对GAPSO-SVM算法基于Spark平台进行了并行化处理,提出SPGAPSO-SVM算法,该算法有效提高了运行速度和效率,选取广州市6路和11路公交车5个月的IC卡交易数据作为实验数据,并根据实际需求对该开放数据集进行了预处理,设计GAPSO-SVM算法耗时分析、SPGAPSO-SVM算法准确率和效率、算法可扩展性、客流量预测等多组实验对SPGAPSO-SVM算法进行了验证,实验结果表明,SPGAPSO-SVM算法具有较高的预测准确率、较快的运行速度和良好的可扩展性。
如图2所示,所述子种群的构建、切分和并行化处理包括将构建的种群切分为多个子种群S201,并将多个子种群通过适应度函数分别并行计算子种群内每个个体的适应度S202,将每个个体的适应度合并形成个体的适应度数据集S203,将个体的适应度数据集分别进行基于SPARK并行遗传算法SPGA操作和基于SPARK并行粒子群优化算法SPPSO操作更新种群S204、S205,将更新的两个种群比较优劣,并保留两个种群最优值S206,若满足终止条件,则输出最优智能算法优化SVM参数S207。
由于采用所述子种群的构建、切分和并行化处理包括将构建的种群切分为多个子种群,并将多个子种群通过适应度函数分别并行计算子种群内每个个体的适应度,将每个个体的适应度合并形成个体的适应度数据集,将个体的适应度数据集分别进行同步扰动随机梯度遗传算法SPGA操作和小种群粒子群优化算法SPPSO操作更新种群,将更新的两个种群比较优劣,并保留两个种群最优值,若满足终止条件,则输出最优智能算法优化SVM参数,由于SPGAPSO-SVM算法设计主要是依赖Spark所特有的弹性分布式数据集(ResilientDistributed Datasets,RDD)来进行种群的构建、切分和并行化处理。针对计算适应度耗时过长的问题,将种群切分为多个子种群,并行计算子种群内个体的适应度,当次迭代所有个体适应度计算完后,合并计算结果,再分别进行SPGA操作和SPPSO操作来更新种群。比较种群优劣后判断是否满足终止条件,与GA-SVM、PSO-SVM等单一算法优化SVM相比,本发明提出的GAPSO-SVM算法计算逻辑更加复杂,计算量必然更大,算法运行时间也必然更长,尤其是计算适应度阶段,因此,本发明将GAPSO-SVM算法基于Spark平台进行并行化处理,提出SPGAPSO-SVM算法,以提高算法的运行速度。
所述适应度函数优选SVM的样本均方误差MSE函数,所述MSE函数为:
所述N为种群大小;
所述m为种群分组数;
所述si 2是第i组的样本方差。
由于采用所述适应度函数优选SVM的样本均方误差MSE函数,所述MSE函数为:
由于本发明采用SVM的MSE作为适应度函数,适应度函数的计算公式如上所示,其中,N为种群大小,m为种群分组数,Si2是第组的样本方差。当次迭代所有个体适应度计算完后,合并计算结果,再分别进行SPGA操作和SPPSO操作来更新种群。
所述SPGA操作包括在SPGA操作开始阶段,设置平台配置参数,通过二进制编码将参数变量编码成染色体随机初始化种群,将初始化的种群转化为弹性分布式数据集Rdd,分别并行计算种群内个体的适应度,并合并所有个体适应度形成个体的适应度数据集,并比较出最优适应度,对个体的适应度数据集通过轮盘赌方法对当前种群进行选择操作、交叉操作和变异操作以更新新的种群,若满足终止条件,则结束SPGA操作。
由于采用所述SPGA操作包括在SPGA操作开始阶段,设置平台配置参数,通过二进制编码将参数变量编码成染色体随机初始化种群,将初始化的种群转化为弹性分布式数据集Rdd,分别并行计算种群内个体的适应度,并合并所有个体适应度形成个体的适应度数据集,并比较出最优适应度,对个体的适应度数据集通过轮盘赌方法对当前种群进行选择操作、交叉操作和变异操作以更新新的种群,若满足终止条件,则结束SPGA操作,由于如图3所示,SPGA操作伪代码,在SPGA操作开始阶段,首先设置SparkConf参数,用于Spark集群应用提交。使用二进制编码将变量编码成染色体用于随机初始化种群。将种群转化为Rdd,通过map(getFitness())并行计算种群内个体的适应度。通过collect()合并所有个体适应度,随后比较出最优适应度。使用轮盘赌方法对当前种群进行选择操作、交叉操作和变异操作以产生新的种群,每个个体进入下一代的概率等于它的适应度值与整个种群中个体适应度值和的比例。反复以上操作直至满足终止条件。
对当前种群进行选择操作、交叉操作和变异操作中每个个体进入下一代的概率等于它的适应度值与整个种群中个体适应度值和的比例。
由于采用对当前种群进行选择操作、交叉操作和变异操作中每个个体进入下一代的概率等于它的适应度值与整个种群中个体适应度值和的比例,由于使用轮盘赌方法对当前种群进行选择操作、交叉操作和变异操作以产生新的种群,每个个体进入下一代的概率等于它的适应度值与整个种群中个体适应度值和的比例。
所述SPPSO操作包括在SPPSO操作开始阶段,设置平台配置参数,并随机初始化个体位置和速度,将初始化的种群转化为弹性分布式数据集Rdd,分别并行计算种群内个体的适应度,并合并所有个体适应度形成个体的适应度数据集,以当前种群为基础,通过个体极值函数和全局极值函数更新个体位置和速度,随后比较出个体最优适应度和全局最优适应度,若满足终止条件,则结束SPPSO。
由于采用所述SPPSO操作包括在SPPSO操作开始阶段,设置平台配置参数,并随机初始化个体位置和速度,将初始化的种群转化为弹性分布式数据集Rdd,分别并行计算种群内个体的适应度,并合并所有个体适应度形成个体的适应度数据集,以当前种群为基础,通过个体极值函数和全局极值函数更新个体位置和速度,随后比较出个体最优适应度和全局最优适应度,若满足终止条件,则结束SPPSO,由于如图4所示,SPPSO操作伪代码,SPPSO操作的流程和SPGA操作的流程相似,首先设置SparkConf参数,并随机初始化个体位置和速度。将种群转化为Rdd,再通过map(getFitness())并行计算种群内个体的适应度。SPPSO中适应度函数与SPGA中适应度函数相同,这样便于比较两种算法产生的解集种群。通过collect()合并所有个体适应度。以当前种群为基础,据公式更新粒子速度函数和更新粒子位置函数更新个体位置和速度,随后比较出个体最优适应度和全局最优适应度,反复以上操作直至满足终止条件。
所述更新粒子速度函数为:
v=vi+c1r1(pbest-xi)+c2r2(gbest-xi);
所述v为更新后粒子速度;
所述x为更新后粒子位置;
所述vi是粒子当前速度;
所述xi是粒子当前位置;
所述c1和c2分别为学习因子;
所述r1和r2为(0,1)之间的随机数;
所述pbest为个体极值;
所述gbest为全局极值;
所述更新粒子位置函数为:
x=xi+vi;
所述x为更新后粒子位置;
所述vi是粒子当前速度;
所述xi是粒子当前位置。
由于采用个体极值函数和全局极值函数,由于PSO是Eberhart博士和Kennedy博士于1995年提出的一种元启发式算法,该算法的思路源于鸟群捕食行为,通过群体中个体之间的信息传递和信息共享来寻找最优解,粒子群算法在辅助SVM参数寻优上已经取得了很好的效果。相较于其他优化算法,PSO参数选取简单、收敛速度快。但是PSO也存在着精度较低,易发散等缺点,PSO同样由适应度评价粒子的优劣程度,通过适应度函数寻找个体极值和全局极值,随后根据个体极值公式、全局极值公式更新各粒子的速度及位置,其公式为:
v=vi+c1r1(pbest-xi)+c2r2(gbest-xi)
x=xi+vi
在公式上述中,v是更新后粒子速度;x是更新后粒子位置;vi是粒子当前速度;xi是粒子当前位置;c1和c2分别为学习因子;r1和r2为(0,1)之间的随机数;pbest为个体极值;gbest为全局极值。个体极值公式中三项相加反映了粒子间的信息共享,通过个体的经验和种群的经验来决定下一步活动,更新粒子的速度及位置后,重新计算更新后粒子的适应度,重复以上操作直至满足终止条件
所述大规模数据处理的快速通用计算引擎平台优选采用Spark平台。
由于本发明将GAPSO-SVM算法基于Spark平台进行并行化处理,提出SPGAPSO-SVM算法,以提高算法的运行速度,Spark平台是专为大规模数据处理而设计的快速通用的计算引擎。Spark拥有MapReduce所具有的优点,并且中间输出结果可以保存在内存中。因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。在内存计算下,Spark比Hadoop快100倍;在硬盘计算下,Spark比Hadoop快10倍。
基于SPGAPSO-SVM算法的公交客流量预测方法系统,包括安保信息评估模块;
所述安保信息评估模块基于上述的公交客流量预测方法构建。
同时,本发明提出基于SPGAPSO-SVM算法的公交客流量预测系统,该系统将基于SPGAPSO-SVM算法的公交客流量预测方法实体化,具有较好的实用性的特点。
实验原理:
本系统实验包括实验环境搭建、数据预处理、实验结果分析、算法准确率和效率、收敛曲线对比实验、算法可扩展性验证,客流量预测结果分析,最终得出SPGAPSO-SVM算法对高峰期客流量预测有较高的准确率,对低谷期客流量预测存在一定偏差。整体预测准确率为86.16%。本次参数寻优后最优C为0.5692,最优g为15.896。;
工作原理:
本专利通过基于大规模数据处理的快速通用计算引擎平台的弹性分布式数据集进行种群的构建、切分和并行化处理,并输出最优系统参数,由于对公交客流量预测领域相关研究成果进行深入分析研究的基础上,在传统SVM预测模型的参数寻优阶段采用了基于GA和PSO的GAPSO-SVM算法,解决了传统SVM预测模型预测准确率较低的问题;针对GAPSO-SVM算法复杂度较高和运行速度过慢的问题,对GAPSO-SVM算法基于Spark平台进行了并行化处理,提出SPGAPSO-SVM算法,该算法有效提高了运行速度和效率,选取广州市6路和11路公交车5个月的IC卡交易数据作为实验数据,并根据实际需求对该开放数据集进行了预处理,设计GAPSO-SVM算法耗时分析、SPGAPSO-SVM算法准确率和效率、算法可扩展性、客流量预测等多组实验对SPGAPSO-SVM算法进行了验证,实验结果表明,SPGAPSO-SVM算法具有较高的预测准确率、较快的运行速度和良好的可扩展性,本发明解决了现有技术存在现有预测模型计算适应度消耗时间过长的问题,具有较高的预测准确率、较快的运行速度和良好的可扩展性的有益技术效果。
利用本发明的技术方案,或本领域的技术人员在本发明技术方案的启发下,设计出类似的技术方案,而达到上述技术效果的,均是落入本发明的保护范围。
Claims (10)
1.基于SPGAPSO-SVM算法的公交客流量预测方法,其特征在于,包括:通过基于大规模数据处理的快速通用计算引擎平台的弹性分布式数据集进行种群的构建、切分和并行化处理,并输出最优系统参数。
2.根据权利要求1所述的基于SPGAPSO-SVM算法的公交客流量预测方法,其特征在于,所述子种群的构建、切分和并行化处理包括将构建的种群切分为多个子种群,并将多个子种群通过适应度函数分别并行计算子种群内每个个体的适应度,将每个个体的适应度合并形成个体的适应度数据集,将个体的适应度数据集分别进行基于SPARK并行遗传算法SPGA操作和基于SPARK并行粒子群优化算法SPPSO操作更新种群,将更新的两个种群比较优劣,并保留两个种群最优值,若满足终止条件,则输出最优智能算法优化SVM参数。
4.根据权利要求2所述的基于SPGAPSO-SVM算法的公交客流量预测方法,其特征在于,所述SPGA操作包括在SPGA操作开始阶段,设置平台配置参数,通过二进制编码将参数变量编码成染色体随机初始化种群,将初始化的种群转化为弹性分布式数据集Rdd,分别并行计算种群内个体的适应度,并合并所有个体适应度形成个体的适应度数据集,并比较出最优适应度,对个体的适应度数据集通过轮盘赌方法对当前种群进行选择操作、交叉操作和变异操作以更新新的种群,若满足终止条件,则结束SPGA操作。
5.根据权利要求4所述的基于SPGAPSO-SVM算法的公交客流量预测方法,其特征在于,对当前种群进行选择操作、交叉操作和变异操作中每个个体进入下一代的概率等于它的适应度值与整个种群中个体适应度值和的比例。
6.根据权利要求2所述的基于SPGAPSO-SVM算法的公交客流量预测方法,其特征在于,所述SPPSO操作包括在SPPSO操作开始阶段,设置平台配置参数,并随机初始化个体位置和速度,将初始化的种群转化为弹性分布式数据集Rdd,分别并行计算种群内个体的适应度,并合并所有个体适应度形成个体的适应度数据集,以当前种群为基础,通过个体极值函数和全局极值函数更新个体位置和速度,随后比较出个体最优适应度和全局最优适应度,若满足终止条件,则结束SPPSO。
7.根据权利要求6所述的基于SPGAPSO-SVM算法的公交客流量预测方法,其特征在于,所述更新粒子速度函数为:
v=vi+c1r1(pbest-xi)+c2r2(gbest-xi);
所述v为更新后粒子速度;
所述x为更新后粒子位置;
所述vi是粒子当前速度;
所述xi是粒子当前位置;
所述c1和c2分别为学习因子;
所述r1和r2为(0,1)之间的随机数;
所述pbest为个体极值;
所述gbest为全局极值。
8.根据权利要求6所述的基于SPGAPSO-SVM算法的公交客流量预测方法,其特征在于,所述更新粒子位置函数为:
x=xi+vi;
所述x为更新后粒子位置;
所述vi是粒子当前速度;
所述xi是粒子当前位置。
9.根据权利要求1所述的基于SPGAPSO-SVM算法的公交客流量预测方法,其特征在于,所述大规模数据处理的快速通用计算引擎平台优选采用Spark平台。
10.基于SPGAPSO-SVM算法的公交客流量预测方法系统,其特征在于,包括安保信息评估模块;
所述安保信息评估模块基于如权利要求1~权利要求9任一项的公交客流量预测方法构建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911049432.0A CN110766237A (zh) | 2019-10-31 | 2019-10-31 | 基于spgapso-svm算法的公交客流量预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911049432.0A CN110766237A (zh) | 2019-10-31 | 2019-10-31 | 基于spgapso-svm算法的公交客流量预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110766237A true CN110766237A (zh) | 2020-02-07 |
Family
ID=69334652
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911049432.0A Pending CN110766237A (zh) | 2019-10-31 | 2019-10-31 | 基于spgapso-svm算法的公交客流量预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110766237A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508220A (zh) * | 2020-09-22 | 2021-03-16 | 内蒙古工业大学 | 车流预测方法和装置 |
CN112598036A (zh) * | 2020-12-14 | 2021-04-02 | 湖北工业大学 | 一种网络流量分类方法和系统 |
CN113704220A (zh) * | 2021-09-01 | 2021-11-26 | 内蒙古工业大学 | 一种基于LSTM和遗传算法的Ceph参数调优方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599935A (zh) * | 2016-12-29 | 2017-04-26 | 重庆邮电大学 | 基于Spark大数据平台的三支决策不平衡数据过采样方法 |
CN110084442A (zh) * | 2019-05-16 | 2019-08-02 | 重庆大学 | 一种联合公交和轨道交通刷卡数据进行客流od计算的方法 |
-
2019
- 2019-10-31 CN CN201911049432.0A patent/CN110766237A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599935A (zh) * | 2016-12-29 | 2017-04-26 | 重庆邮电大学 | 基于Spark大数据平台的三支决策不平衡数据过采样方法 |
CN110084442A (zh) * | 2019-05-16 | 2019-08-02 | 重庆大学 | 一种联合公交和轨道交通刷卡数据进行客流od计算的方法 |
Non-Patent Citations (2)
Title |
---|
查敏: "基于Spark平台的公交客流预测方法的研究", 《中国优秀硕士学位论文全文数据库》 * |
王谦等: "改进GA-PSO优化SVM的行人检测算法", 《测控技术》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508220A (zh) * | 2020-09-22 | 2021-03-16 | 内蒙古工业大学 | 车流预测方法和装置 |
CN112598036A (zh) * | 2020-12-14 | 2021-04-02 | 湖北工业大学 | 一种网络流量分类方法和系统 |
CN113704220A (zh) * | 2021-09-01 | 2021-11-26 | 内蒙古工业大学 | 一种基于LSTM和遗传算法的Ceph参数调优方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Issa et al. | ASCA-PSO: Adaptive sine cosine optimization algorithm integrated with particle swarm for pairwise local sequence alignment | |
CN108197739B (zh) | 一种城市轨道交通乘客流量预测方法 | |
CN110766237A (zh) | 基于spgapso-svm算法的公交客流量预测方法及系统 | |
CN103942419B (zh) | 一种混合智能优化方法 | |
CN108985515B (zh) | 一种基于独立循环神经网络的新能源出力预测方法及系统 | |
CN110164129B (zh) | 基于gernn的单交叉口多车道交通流量预测方法 | |
CN110059875A (zh) | 基于分布式鲸鱼优化算法的公共自行车需求量预测方法 | |
CN106910337A (zh) | 一种基于萤火虫算法与rbf神经网络的交通流预测方法 | |
CN109086926B (zh) | 一种基于组合神经网络结构的短时轨道交通客流预测方法 | |
Yu et al. | A dynamic holding strategy in public transit systems with real-time information | |
CN111160622A (zh) | 基于混合神经网络模型的景区客流预测方法和装置 | |
CN105185106B (zh) | 一种基于粒计算的道路交通流参数预测方法 | |
CN105205052A (zh) | 一种数据挖掘方法及装置 | |
CN110442143A (zh) | 一种基于组合多目标鸽群优化的无人机态势数据聚类方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
Liu et al. | A quantum computing based numerical method for solving mixed-integer optimal control problems | |
Lin et al. | Traffic Flow Prediction Using SPGAPSO-CKRVM Model. | |
CN117093885A (zh) | 融合分层聚类和粒子群的联邦学习多目标优化方法 | |
CN114463978B (zh) | 一种基于轨道交通信息处理终端的数据监测方法 | |
Liu et al. | Efficient bus arrival time prediction based on spark streaming platform | |
CN112508220A (zh) | 车流预测方法和装置 | |
Karim et al. | Long-Term Traffic Prediction Based on Stacked GCN Model. | |
CN110852505B (zh) | 基于量子遗传优化lvq神经网络的智慧城市交通流预测方法 | |
Wang et al. | A Second-Order HMM Trajectory Prediction Method based on the Spark Platform. | |
Zhu et al. | Effective clustering analysis based on new designed clustering validity index and revised K-means algorithm for big data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200207 |