CN107220724B - 客流量预测方法及装置 - Google Patents
客流量预测方法及装置 Download PDFInfo
- Publication number
- CN107220724B CN107220724B CN201710266573.2A CN201710266573A CN107220724B CN 107220724 B CN107220724 B CN 107220724B CN 201710266573 A CN201710266573 A CN 201710266573A CN 107220724 B CN107220724 B CN 107220724B
- Authority
- CN
- China
- Prior art keywords
- passenger
- passengers
- passenger flow
- algorithm
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 134
- 241000272201 Columbiformes Species 0.000 claims abstract description 96
- 238000012706 support-vector machine Methods 0.000 claims abstract description 69
- 230000006870 function Effects 0.000 claims description 65
- 238000011156 evaluation Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 4
- 244000144992 flock Species 0.000 claims description 3
- 238000005457 optimization Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Computation (AREA)
- Quality & Reliability (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Operations Research (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Development Economics (AREA)
- Biomedical Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种客流量预测方法及装置,其中方法包括:获取待预测线路的乘客刷卡信息,乘客刷卡信息包括乘客标识信息以及刷卡时间;根据乘客标识信息以及刷卡时间,确定每个乘客的总乘车次数;根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客;针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测;根据规律乘客的客流量预测值、中型乘客的客流量预测值和随机乘客的客流量预测值,确定待预测线路的客流量预测值。本发明提供的客流量预测方法及装置,能够及时、准确地预测未来时段的公交客流量。
Description
技术领域
本发明涉及智能交通技术,尤其涉及一种客流量预测方法及装置。
背景技术
随着城市交通的不断发展,越来越多的人选择公交出行,公交的费用更低,比汽车更环保,通勤速度更快。然而,目前的公交系统存在一个严重的问题:某些线路的公交特别拥挤,而另外一些线路的公交基本上是空载,这造成了资源的浪费。
客流量是影响公交运行效率的重要因素,公交公司可以根据客流量的变化情况最优地调度公交车辆,节省运营成本,市民也可以参考公交线路客流量信息制定出行计划,从而节省出行时间。因此,及时准确预测未来时段的客流量成为目前亟待解决的问题。
发明内容
本发明提供一种客流量预测方法及装置,用以解决目前无法及时准确预测公交客流量的技术问题。
本发明提供一种客流量预测方法,包括:
获取待预测线路的乘客刷卡信息,所述乘客刷卡信息包括乘客标识信息以及刷卡时间;
根据乘客标识信息以及刷卡时间,确定每个乘客的总乘车次数;
根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客;
针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测;
根据规律乘客的客流量预测值、中型乘客的客流量预测值和随机乘客的客流量预测值,确定所述待预测线路的客流量预测值。
进一步地,根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客,包括:
判断乘客的总乘车次数与第一阈值、第二阈值的关系;
若乘客的总乘车次数大于第一阈值,则判断所述乘客为规律乘客;
若乘客的总乘车次数小于第二阈值,则判断所述乘客为随机乘客;
若乘客的总乘车次数小于第一阈值且大于第二阈值,则判断所述乘客为中型乘客;
其中,所述第一阈值大于所述第二阈值。
进一步地,针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测,包括:
根据历史数据,计算前N天中,每一天每种类型乘客的客流量;
根据鸽群算法,选择支持向量机算法中核函数的参数的值;
在选定核函数的参数的值后,将每一种类型乘客前N天的客流量输入到支持向量机算法,得到每一种类型乘客第N+1天的客流量预测值。
进一步地,根据鸽群算法,选择支持向量机算法中核函数的参数的值,包括:
选择支持向量机算法需要用到的核函数,并确定所述核函数中的参数的范围;
将所述核函数的参数的范围进行分割,确定参数在每一段范围内对应的初始值;
根据参数在每一段范围内对应的初始值,对参数进行正交化;
将参数对应的正交化阵列输入至鸽群算法,确定核函数的参数的值。
进一步地,在将参数对应的正交化阵列输入至鸽群算法,确定核函数的参数的值之后,还包括:
将鸽群算法确定的参数值输入至支持向量机算法;
利用支持向量机算法对参数值进行评价,并将评价结果输入至鸽群算法;
利用鸽群算法根据评价结果对参数的值进行修正。
本发明还提供一种客流量预测装置,包括:
获取模块,用于获取待预测线路的乘客刷卡信息,所述乘客刷卡信息包括乘客标识信息以及刷卡时间;
确定模块,用于根据乘客标识信息以及刷卡时间,确定每个乘客的总乘车次数;
分类模块,用于根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客;
预测模块,用于针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测;
处理模块,用于根据规律乘客的客流量预测值、中型乘客的客流量预测值和随机乘客的客流量预测值,确定所述待预测线路的客流量预测值。
进一步地,所述分类模块具体用于:
判断乘客的总乘车次数与第一阈值、第二阈值的关系;
若乘客的总乘车次数大于第一阈值,则判断所述乘客为规律乘客;
若乘客的总乘车次数小于第二阈值,则判断所述乘客为随机乘客;
若乘客的总乘车次数小于第一阈值且大于第二阈值,则判断所述乘客为中型乘客;
其中,所述第一阈值大于所述第二阈值。
进一步地,所述预测模块具体用于:
根据历史数据,计算前N天中,每一天每种类型乘客的客流量;
根据鸽群算法,选择支持向量机算法中核函数的参数的值;
在选定核函数的参数的值后,将每一种类型乘客前N天的客流量输入到支持向量机算法,得到每一种类型乘客第N+1天的客流量预测值。
进一步地,所述预测模块具体用于:
根据历史数据,计算前N天中,每一天每种类型乘客的客流量;
选择支持向量机算法需要用到的核函数,并确定所述核函数中的参数的范围;
将所述核函数的参数的范围进行分割,确定参数在每一段范围内对应的初始值;
根据参数在每一段范围内对应的初始值,对参数进行正交化;
将参数对应的正交化阵列输入至鸽群算法,确定核函数的参数的值;
在选定核函数的参数的值后,将每一种类型乘客前N天的客流量输入到支持向量机算法,得到每一种类型乘客第N+1天的客流量预测值。
进一步地,所述预测模块还用于:
在将参数对应的正交化阵列输入至鸽群算法,确定核函数的参数的值之后,将鸽群算法确定的参数值输入至支持向量机算法;
利用支持向量机算法对参数值进行评价,并将评价结果输入至鸽群算法;
利用鸽群算法根据评价结果对参数的值进行修正。
本发明提供的客流量预测方法及装置,通过获取待预测线路的乘客刷卡信息,所述乘客刷卡信息包括乘客标识信息以及刷卡时间,根据乘客标识信息以及刷卡时间,确定每个乘客的总乘车次数,根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客,针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测,根据规律乘客的客流量预测值、中型乘客的客流量预测值和随机乘客的客流量预测值,确定所述待预测线路的客流量预测值,能够及时、准确地预测未来时段的公交客流量,发现不同类型乘客的出行规律,提高预测的效率和准确率,对公交的调度有一定的参考价值。
附图说明
图1为本发明实施例一提供的客流量预测方法的流程图;
图2为本发明实施例一提供的客流量预测方法中乘客刷卡信息的存储方式示意图;
图3为本发明实施例一提供的客流量预测方法中乘客刷卡信息的原始数据示意图;
图4为本发明实施例一提供的客流量预测方法中统计出的总乘车次数的示意图;
图5为本发明实施例二提供的客流量预测装置的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本申请实施例中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
实施例一
本发明实施例一提供一种客流量预测方法。图1为本发明实施例一提供的客流量预测方法的流程图。如图1所示,本实施例中的方法,可以包括:
步骤101、获取待预测线路的乘客刷卡信息,所述乘客刷卡信息包括乘客标识信息以及刷卡时间。
其中,待预测线路可以是需要进行客流量预测的公交线路,例如公交1路等。本实施例中,可以获取待预测线路的一段时间例如四个月内的乘客刷卡信息,对四个月的乘客刷卡信息进行处理,预测未来时段的客流量。当然,所述一段时间也可以是一周或一个月等。
乘客刷卡信息可以包括乘客标识信息以及刷卡时间,乘客标识信息可以为乘客乘坐公交所用的公交卡的标识信息,例如公交卡的卡号等,刷卡时间可以精确到小时。
进一步地,除了乘客标识信息和刷卡时间以外,还可以采集其它信息,共同存储在数据库中,方便对乘客出行记录进行综合维护。
图2为本发明实施例一提供的客流量预测方法中乘客刷卡信息的存储方式示意图。如图2所示,每条记录包括:Use_city代表使用地,本数据针对的是广东地区;Line_name代表的是线路位置,有两方面用途,一方面是在做线路预测的时候需要用到此信息,另外一方面是在可视化的时候方便在地图上面查找;Terminal_id代表刷卡终端ID,每一辆公交车都有一个刷卡终端ID,所以可以按照此数据对不同的公交车分类;Card_id代表卡片ID,可以作为乘客标识信息,每一个出行乘客有一个ID,按照这个ID可以对不同类型乘客分类。Deal_time代表交易时间,可以作为刷卡时间,精度具体到小时;最后一个Card_type代表的是乘客的类型,当考虑到天气状况时,乘客类型可能会对客流量有影响,因为如果是学生和成人,受天气影响不大,如果是老人,天气会影响他们的出行。
步骤102、根据乘客标识信息以及刷卡时间,确定每个乘客的总乘车次数。
基于历史数据,运用结构化查询语言(Structured Query Language,SQL)统计每个乘客在一段时间内的出行总次数,并将得到的结果存到新表中。
图3为本发明实施例一提供的客流量预测方法中乘客刷卡信息的原始数据示意图。图4为本发明实施例一提供的客流量预测方法中统计出的总乘车次数的示意图。
如图3所示,原始数据中包括每个乘客每次乘车的刷卡时间。如图4所示,第一栏代表乘客的ID,一个乘客公交卡有唯一的ID,第二栏代表该段时间内乘客的总乘车次数。
步骤103、根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客。
其中,规律乘客为总乘车次数较多的乘客,规律乘客法定工作日客流量上升,周末客流量下降,可能多为上班族。由于规律乘客的规律性比较强,一般算法的拟合效果会很好。
随机乘客为总乘车次数较少的乘客,随机乘客法定工作日客流量下降,周末客流量增加,因此可能多为出来游玩的乘客。随机乘客的规律性不是特别明显。
优选的是,根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客,可以包括:
判断乘客的总乘车次数与第一阈值、第二阈值的关系;若乘客的总乘车次数大于第一阈值,则判断所述乘客为规律乘客;若乘客的总乘车次数小于第二阈值,则判断所述乘客为随机乘客;若乘客的总乘车次数小于第一阈值且大于第二阈值,则判断所述乘客为中型乘客;其中,所述第一阈值大于所述第二阈值。
所述第一阈值和所述第二阈值可以根据实际需要来设置。例如,所述第一阈值可以为各乘客的总乘车次数的平均值的50%左右,第二阈值可以为各乘客的总乘车次数的平均值的20%左右。
进一步地,由于采集到的乘客刷卡信息可能存在数据缺失等问题,在进行分类之前,可以首先进行数据预处理。预处理可以包括:
判断乘客刷卡信息中的某一项数据是否缺失,若存在缺失,则以缺失数据的对应的前后两个数据的平均值,或者缺失数据对应的整体平均值,作为缺失数据的值;判断乘客刷卡信息中是否存在错误数据,错误数据可以是同一时间在不同线路出现的刷卡信息,若出现错误数据,则将错误数据删除。
步骤104、针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测。
我们假定第i个时间段规律乘客的客流为regulari,第i个时间段中型乘客的客流为mediumi,第i个时间段随机乘客的客流为randomi,我们以前n个时间段的客流量预测第n+1个时间段的客流,以规律乘客为例,以前n个时间段的客流regulari+1,regulari+2,regulari+3……regulari+n作为输入来预测第i+n+1时刻的客流regulari+n+1。
本步骤中,对于每种类型的乘客,都可以采用鸽群算法加支持向量机算法来确定其对应的客流量预测值。
支持向量机是一种机器学习方法,能够用来预测不同领域的数据并且有一定的准确性。由于固有的多输入性质,支持向量机算法在多变量或时空域空间求解是有利的。尽管支持向量机已经得到了全世界研究机构的关注,但关于支持向量机输入参数的优化设计还存在收敛速度慢,容易陷入局部收敛等缺点。怎样防止调参过程中局部收敛是有意义的改进方法。
鸽群算法是一种通过模仿鸽子群体行为而提出的新颖的群体智能算法,目前已经被用在图像恢复,三维路径规划,目标分配,模型预测控制等方面。我们将改进的鸽群算法用来调节支持向量机的参数,从而进行客流预测。
优选的是,针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测,可以包括:
步骤1041、根据历史数据,计算前N天中,每一天每种类型乘客的客流量。
步骤1042、根据鸽群算法,选择支持向量机算法中核函数的参数的值。
步骤1043、在选定核函数的参数的值后,将每一种类型乘客前N天的客流量输入到支持向量机算法,得到每一种类型乘客第N+1天的客流量预测值。
下面以规律乘客为例进行说明。首先计算出规律乘客在第1天、第2天、……、第N天的客流量,以便根据前N天的客流量预测第N+1天的客流量。其中N为自然数。
然后,根据鸽群算法对支持向量机的参数进行优化。
鸽群算法的数学模型主要包括以下两个算子:
地图罗盘算子:鸽子可以使用磁性物体感知地磁场,然后在头脑中形成地图。它们把太阳高度作为罗盘来调整飞行方向,当它们接近目的地的时候,它们对太阳和磁性物体的依赖性便减小,即将执行地标算子。
地标算子:当鸽子飞近它们的目的地的时候,它们将更多依赖附近的地标。如果它们对地标熟悉,它们将直接飞向目的地。当它们对地标不熟悉,它们将跟随那些对地标熟悉的鸽子。
下面详细介绍两个算子:
(1)地图罗盘算子:在鸽群算法模型中,将使用虚拟的鸽子。在地图罗盘算子中,Xi和Vi被定义为第i只鸽子的坐标和速度,并且多维搜索空间中的坐标和速度在每一代都得到更新。第t代新鸽子的坐标Xi和速度Vi被定义为第i只鸽子的坐标和速度,并且多维搜索空间的坐标和速度在每一代都得到更新。第t代新的鸽子的坐标Xi和速度Vi可以根据公式(1)进行计算。
其中,R是地图罗盘算子,rand是随机数,Xg是当前最优位置,通过比较所有鸽子的位置得到。
(2)地标算子:在地标算子中,每一代鸽子的数量都会减少一半。那些远离目的地的鸽子对地标不熟悉,便跟着熟悉地标的鸽子飞,它们将不再有分辨路径的能力。Xc(t)是第t代所有鸽子位置的中心,假设每个鸽子可以直接飞向这个中心,第t代第i只鸽子的位置更新规律可以由公式(2)给出:
其中,fitness()是鸽子个体的评价函数。对于最小值优化问题,我们可以选择对于最大值优化问题,我们可以选择fitness(Xi(t))=fmax(Xi(t))。对每一个鸽子个体,第N代的最优位置可以定义为Xi,并且XP=min(Xi1,Xi2,....,XiN),所有鸽子的中心是每一代的目的地。远离目的地的一半鸽子(圆外)将跟随离目的地近的鸽子飞行,即两只鸽子共用一个位置坐标。离目的地近的鸽子将直接很快地飞向目的地。
支持向量机是是一种使特征空间间隔最大的分类器。支持向量机中很重要的概念叫核函数,所谓的核函数就是将输入从输入空间映射到特征空间得到的特征向量之间的内积。
支持向量机常用的核函数如表1所示。
表1支持向量机核函数定义
我们可以从中选择需要用到的核函数,然后通过鸽群算法对核函数中的参数进行优化,以根据优化后的核函数进行客流量预测。假设我们选定高斯核函数和参数C,则可以通过鸽群算法对高斯核函数中的参数σ和参数C进行优化。
鸽群算法是一种群体智能搜索算法,它源自对鸽子迁徙群体行为的模拟,不仅有极强的全局搜索能力,而且可以避免算法陷入局部收敛。
优选的是,在采用鸽群算法进行优化之前,还可以首先对参数进行正交化。智能优化算法的初始化是值得研究的问题,如果随机产生初始种群数量过少,个体缺乏代表性,容易陷入局部收敛,而产生种群数量过多,影响算法的运行速度,我们在初始化时,尽量使得粒子均匀分布在可行域,那么算法便能在整个可行空间上搜索,提高了算法求解最优解的概率。而鸽群算法自2014年被首次提出后,目前的研究主要集中在高斯算子和飞机编队、卡尔曼滤波等应用场合,对初始种群的改进至今没有提出过,所以我们提出一种改进正交算子的鸽群算法,用来解决实际优化问题。
正交化初始种群策略可以有效提高收敛的效率,解决种群数量过多带来的复杂度问题,提高算法准确度。
下面具体介绍正交算子的求解过程,假设初始粒子的表达式为a=(a1,a2,a3...an),(i=1,2…n)代表粒子的第i项变量的值。假设ai变量的范围为[mi,ni],由于正交是对离散变量而言的,所以我们首先要将变量离散化,假设将[mi,ni]分成R段,其中R为奇数,R的值是事先给定的,可以根据实际情况,在11至19之间取值。我们假定将ai分解得到的R项数值由ci=(ci,1,ci,2,ci,3,...ci,R)构成,ci可以由公式(3)计算得到:
其中,mi代表下确界,ni代表上确界,由于每个变量ai有R项数值,有n个变量,所以可行域为R的n次方,即为Rn。可行域与R和n都有关系,由于是幂次方,呈发散变化,复杂度会很大,速度会降低。而正交设计正好克服这个缺陷。既能够使得初始化的例子均匀分布,又能够避免复杂度过大。
下面介绍正交设计的构造方法。我们定义正交表的形式为LM(Rn),其中,M=RJ,J是满足(RJ-1)/(R-1)≥n的最小正整数。
表2正交算子流程
表2是正交化的流程,公式(3)是分割流程。为了更好的提高速度和收敛性,我们可以采用分割空间的方法。基本思想是将空间分解为多个子空间,每个子空间中分别正交化,然后分别找出最优解。这就是子空间分割正交鸽群算法。
按照子空间分割正交鸽群算法,步骤1042中的根据鸽群算法,选择支持向量机算法中核函数的参数的值,可以包括:
选择支持向量机算法需要用到的核函数,并确定所述核函数中的参数的范围;将所述核函数的参数的范围进行分割,确定参数在每一段范围内对应的初始值;根据参数在每一段范围内对应的初始值,对参数进行正交化;将参数对应的正交化阵列输入至鸽群算法,确定核函数的参数的值。
以高斯核函数为例,参数σ的范围可以为0到5,参数C的范围可以为1-到1。按照公式(3)对参数的范围进行分割,并确定参数在每一段范围内对应的初始值。将初始值按照表2中的流程进行正交化,既能保留初始值的全部信息,又能够有效压缩数量量,提高处理效率。正交化完成后,可以根据鸽群算法对参数进行优化。
进一步地,在将参数对应的正交化阵列输入至鸽群算法,确定核函数的参数的值之后,还可以执行优化步骤:将鸽群算法确定的参数值输入至支持向量机算法;利用支持向量机算法对参数值进行评价,并将评价结果输入至鸽群算法;利用鸽群算法根据评价结果对参数的值进行修正。为了获取更优的结果,可以重复执行上述优化步骤,直到执行次数达到预设值,或者对参数值的评价结果满足预设条件。
评价结果可以由核函数对应的分类决策函数来确定。如表1所示,我们可以构造公式(4)所示的决策函数。
这样就可以确定决策函数的表达式,并根据决策函数来对参数的值进行评价。
在最终选定参数的值之后,可以将选定的参数值代入到支持向量机的核函数中,从而完成支持向量机的优化。将每一种类型乘客前N天的客流量输入到支持向量机算法,就可以得到每一种类型乘客第N+1天的客流量预测值。
在实际应用中,在正交化阶段,可以首先给出参数的范围、初始值以及两个算子代数nc1max和nc2max。
在鸽群算法阶段,初始时nc=1,评价每一个鸽子个体适应度,得到参数的全局最优与局部最优解,然后执行罗盘算子,更新每个鸽子的位置和速度,评价适应度,并根据适应度更新全局最优与局部最优,此时,若nc≤nc1max,则nc+1并重复执行罗盘算子,若nc>nc1max,则按照适应度大小排序,提出排名靠后的一半鸽子个体。
提出排名靠后的一半鸽子个体之后,执行地标算子,更新每个鸽子的位置和速度,评价适应度,并根据适应度更新全局最优与局部最优,此时,若nc≤nc2max,则nc+1并重复执行地标算子,若nc>nc2max,则可以输出最优化的参数。
最后,将最优化的参数输入到支持向量机,预测各类型的乘客的客流量。
步骤105、根据规律乘客的客流量预测值、中型乘客的客流量预测值和随机乘客的客流量预测值,确定所述待预测线路的客流量预测值。
在通过步骤104得到规律乘客的客流量预测值、中型乘客的客流量预测值和随机乘客的客流量预测值之后,可以综合各预测值来确定待预测线路在第N+1天的客流量预测值。
具体地,可以将规律乘客的客流量预测值、中型乘客的客流量预测值以及随机乘客的客流量预测值加权求和,作为待预测线路的客流量预测值。优选的是,本实施例中,选择将三种类型的结果运用非线性拟合的方法合成起来,采用BP神经网络,得到最终的客流预测结果。首先根据以往的预测结果对神经网络进行训练,得到最佳的网络参数,然后,将待预测线路的规律乘客的客流量预测值、中型乘客的客流量预测值以及随机乘客的客流量输入到神经网络中,即可得到待预测线路的客流量预测值。
针对规律乘客、中型乘客、随机乘客三种类型的客流量采用本实施例中的子空间分割鸽群支持向量机算法进行预测,并与传统的算法比较表明改进算法的优越性。
表3本实施例的预测结果与传统算法的预测结果的比较
如表3所示,将通过本实施例中的子空间分割鸽群支持向量机算法(SOPIO-SVM)得到的预测结果与通过微粒群支持向量机(PSO-SVM)、梯度下降支持向量机(Grid-SVM)、遗传支持向量机(GA-SVM)、BP神经网络得到的预测结果进行了比较,本实施例中的方法,针对规律乘客(Regular Passenger),中型乘客(Medium Passenger),随机乘客(RandomPassenge),综合乘客(Synthesize Passenger)等各个类型的乘客,预测结果相对于实际客流量的平均相对误差(MRE)、平均绝对误差(MAE)和均方根误差(RMSE)均优于其他算法。
本实施例提供的客流量预测方法,通过获取待预测线路的乘客刷卡信息,所述乘客刷卡信息包括乘客标识信息以及刷卡时间,根据乘客标识信息以及刷卡时间,确定每个乘客的总乘车次数,根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客,针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测,根据规律乘客的客流量预测值、中型乘客的客流量预测值和随机乘客的客流量预测值,确定所述待预测线路的客流量预测值,能够及时、准确地预测未来时段的公交客流量,发现不同类型乘客的出行规律,提高预测的效率和准确率,对公交的调度有一定的参考价值。
实施例二
本发明实施例二提供一种客流量预测装置。图5为本发明实施例二提供的客流量预测装置的结构框图。如图5所示,本实施例中的装置,可以包括:
获取模块201,用于获取待预测线路的乘客刷卡信息,所述乘客刷卡信息包括乘客标识信息以及刷卡时间;
确定模块202,用于根据乘客标识信息以及刷卡时间,确定每个乘客的总乘车次数;
分类模块203,用于根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客;
预测模块204,用于针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测;
处理模块205,用于根据规律乘客的客流量预测值、中型乘客的客流量预测值和随机乘客的客流量预测值,确定所述待预测线路的客流量预测值。
本实施例中的客流量预测装置,可以用于执行实施例一所述的客流量预测方法,其具体实现原理与实施例一类似,此处不再赘述。
本实施例提供的客流量预测装置,通过获取待预测线路的乘客刷卡信息,所述乘客刷卡信息包括乘客标识信息以及刷卡时间,根据乘客标识信息以及刷卡时间,确定每个乘客的总乘车次数,根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客,针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测,根据规律乘客的客流量预测值、中型乘客的客流量预测值和随机乘客的客流量预测值,确定所述待预测线路的客流量预测值,能够及时、准确地预测未来时段的公交客流量,发现不同类型乘客的出行规律,提高预测的效率和准确率,对公交的调度有一定的参考价值。
进一步地,所述分类模块203具体用于:
判断乘客的总乘车次数与第一阈值、第二阈值的关系;
若乘客的总乘车次数大于第一阈值,则判断所述乘客为规律乘客;
若乘客的总乘车次数小于第二阈值,则判断所述乘客为随机乘客;
若乘客的总乘车次数小于第一阈值且大于第二阈值,则判断所述乘客为中型乘客;
其中,所述第一阈值大于所述第二阈值。
进一步地,所述预测模块204具体用于:
根据历史数据,计算前N天中,每一天每种类型乘客的客流量;
根据鸽群算法,选择支持向量机算法中核函数的参数的值;
在选定核函数的参数的值后,将每一种类型乘客前N天的客流量输入到支持向量机算法,得到每一种类型乘客第N+1天的客流量预测值。
进一步地,所述预测模块204具体用于:
根据历史数据,计算前N天中,每一天每种类型乘客的客流量;
选择支持向量机算法需要用到的核函数,并确定所述核函数中的参数的范围;
将所述核函数的参数的范围进行分割,确定参数在每一段范围内对应的初始值;
根据参数在每一段范围内对应的初始值,对参数进行正交化;
将参数对应的正交化阵列输入至鸽群算法,确定核函数的参数的值;
在选定核函数的参数的值后,将每一种类型乘客前N天的客流量输入到支持向量机算法,得到每一种类型乘客第N+1天的客流量预测值。
进一步地,所述预测模块204还用于:
在将参数对应的正交化阵列输入至鸽群算法,确定核函数的参数的值之后,将鸽群算法确定的参数值输入至支持向量机算法;
利用支持向量机算法对参数值进行评价,并将评价结果输入至鸽群算法;
利用鸽群算法根据评价结果对参数的值进行修正。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (4)
1.一种客流量预测方法,其特征在于,包括:
获取待预测线路的乘客刷卡信息,所述乘客刷卡信息包括乘客标识信息以及刷卡时间;
根据乘客标识信息以及刷卡时间,运用结构化查询语言确定每个乘客的总乘车次数;
根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客;
针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测;
根据规律乘客的客流量预测值、中型乘客的客流量预测值和随机乘客的客流量预测值,确定所述待预测线路的客流量预测值;
所述针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测,包括:
根据历史数据,计算前N天中,每一天每种类型乘客的客流量;
根据鸽群算法,选择支持向量机算法中核函数的参数的值;
在选定核函数的参数的值后,将每一种类型乘客前N天的客流量输入到支持向量机算法,得到每一种类型乘客第N+1天的客流量预测值;
其中,所述根据鸽群算法,选择支持向量机算法中核函数的参数的值,包括:
选择支持向量机算法需要用到的核函数,并确定所述核函数中的参数的范围;
将所述核函数的参数的范围进行分割,确定参数在每一段范围内对应的初始值;
根据参数在每一段范围内对应的初始值,对参数进行正交化;
将参数对应的正交化阵列输入至鸽群算法,确定核函数的参数的值;
其中,在所述将参数对应的正交化阵列输入至鸽群算法,确定核函数的参数的值之后,还包括:
将鸽群算法确定的参数值输入至支持向量机算法;
利用支持向量机算法对参数值进行评价,并将评价结果输入至鸽群算法;
利用鸽群算法根据评价结果对参数的值进行修正。
2.根据权利要求1所述的方法,其特征在于,所述根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客,包括:
判断乘客的总乘车次数与第一阈值、第二阈值的关系;
若乘客的总乘车次数大于第一阈值,则判断所述乘客为规律乘客;
若乘客的总乘车次数小于第二阈值,则判断所述乘客为随机乘客;
若乘客的总乘车次数小于第一阈值且大于第二阈值,则判断所述乘客为中型乘客;
其中,所述第一阈值大于所述第二阈值。
3.一种客流量预测装置,其特征在于,包括:
获取模块,用于获取待预测线路的乘客刷卡信息,所述乘客刷卡信息包括乘客标识信息以及刷卡时间;
确定模块,用于根据乘客标识信息以及刷卡时间,运用结构化查询语言确定每个乘客的总乘车次数;
分类模块,用于根据每个乘客的总乘车次数,将乘客分为规律乘客、中型乘客和随机乘客;
预测模块,用于针对规律乘客、中型乘客和随机乘客,分别采用鸽群算法加支持向量机算法进行相应的客流量预测;
处理模块,用于根据规律乘客的客流量预测值、中型乘客的客流量预测值和随机乘客的客流量预测值,确定所述待预测线路的客流量预测值;
所述预测模块具体用于:
根据历史数据,计算前N天中,每一天每种类型乘客的客流量;
根据鸽群算法,选择支持向量机算法中核函数的参数的值;
在选定核函数的参数的值后,将每一种类型乘客前N天的客流量输入到支持向量机算法,得到每一种类型乘客第N+1天的客流量预测值;
其中,所述预测模块具体用于:
根据历史数据,计算前N天中,每一天每种类型乘客的客流量;
选择支持向量机算法需要用到的核函数,并确定所述核函数中的参数的范围;
将所述核函数的参数的范围进行分割,确定参数在每一段范围内对应的初始值;
根据参数在每一段范围内对应的初始值,对参数进行正交化;
将参数对应的正交化阵列输入至鸽群算法,确定核函数的参数的值;
在选定核函数的参数的值后,将每一种类型乘客前N天的客流量输入到支持向量机算法,得到每一种类型乘客第N+1天的客流量预测值;
其中,所述预测模块还用于:
在将参数对应的正交化阵列输入至鸽群算法,确定核函数的参数的值之后,将鸽群算法确定的参数值输入至支持向量机算法;
利用支持向量机算法对参数值进行评价,并将评价结果输入至鸽群算法;
利用鸽群算法根据评价结果对参数的值进行修正。
4.根据权利要求3所述的装置,其特征在于,所述分类模块具体用于:
判断乘客的总乘车次数与第一阈值、第二阈值的关系;
若乘客的总乘车次数大于第一阈值,则判断所述乘客为规律乘客;
若乘客的总乘车次数小于第二阈值,则判断所述乘客为随机乘客;
若乘客的总乘车次数小于第一阈值且大于第二阈值,则判断所述乘客为中型乘客;
其中,所述第一阈值大于所述第二阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710266573.2A CN107220724B (zh) | 2017-04-21 | 2017-04-21 | 客流量预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710266573.2A CN107220724B (zh) | 2017-04-21 | 2017-04-21 | 客流量预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107220724A CN107220724A (zh) | 2017-09-29 |
CN107220724B true CN107220724B (zh) | 2020-12-08 |
Family
ID=59944830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710266573.2A Active CN107220724B (zh) | 2017-04-21 | 2017-04-21 | 客流量预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107220724B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109034449A (zh) * | 2018-06-14 | 2018-12-18 | 华南理工大学 | 基于深度学习和乘客行为模式的短期公交客流预测方法 |
CN109391515A (zh) * | 2018-11-07 | 2019-02-26 | 武汉烽火技术服务有限公司 | 基于鸽群算法优化支持向量机的网络故障预测方法及系统 |
CN110459050B (zh) * | 2019-05-27 | 2021-07-20 | 华南理工大学 | 一种基于混合决策树的短期公交客流预测方法 |
CN110796301B (zh) * | 2019-10-23 | 2022-11-11 | 广东岭南通股份有限公司 | 一种基于ic卡数据的乘客流量预测方法及装置 |
CN113393355B (zh) * | 2021-04-29 | 2024-01-16 | 中国铁道科学研究院集团有限公司电子计算技术研究所 | 轨道交通相对客流分布计算方法、系统、电子设备及介质 |
CN113778094A (zh) * | 2021-09-14 | 2021-12-10 | 北京航空航天大学 | 车辆路径规划方法、装置、可读存储介质及电子设备 |
CN114912683B (zh) * | 2022-05-13 | 2024-05-10 | 中铁第六勘察设计院集团有限公司 | 一种智慧城市轨道交通异常大客流预测系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102324128A (zh) * | 2011-05-24 | 2012-01-18 | 北京交通大学 | 基于ic卡记录的公交站间od客流预测方法及装置 |
CN103310287A (zh) * | 2013-07-02 | 2013-09-18 | 北京航空航天大学 | 基于svm预测乘客出行概率的轨道交通客流预测方法 |
JP2013210753A (ja) * | 2012-03-30 | 2013-10-10 | Hitachi Ltd | 旅客流動情報生成システムおよび旅客流動情報生成方法 |
CN105206040A (zh) * | 2015-08-07 | 2015-12-30 | 北京航空航天大学 | 一种基于ic卡数据的公交串车预测方法 |
CN106530680A (zh) * | 2016-12-02 | 2017-03-22 | 东南大学 | 一种基于大站快车的公交线路组合服务方法 |
-
2017
- 2017-04-21 CN CN201710266573.2A patent/CN107220724B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102324128A (zh) * | 2011-05-24 | 2012-01-18 | 北京交通大学 | 基于ic卡记录的公交站间od客流预测方法及装置 |
JP2013210753A (ja) * | 2012-03-30 | 2013-10-10 | Hitachi Ltd | 旅客流動情報生成システムおよび旅客流動情報生成方法 |
CN103310287A (zh) * | 2013-07-02 | 2013-09-18 | 北京航空航天大学 | 基于svm预测乘客出行概率的轨道交通客流预测方法 |
CN105206040A (zh) * | 2015-08-07 | 2015-12-30 | 北京航空航天大学 | 一种基于ic卡数据的公交串车预测方法 |
CN106530680A (zh) * | 2016-12-02 | 2017-03-22 | 东南大学 | 一种基于大站快车的公交线路组合服务方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107220724A (zh) | 2017-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107220724B (zh) | 客流量预测方法及装置 | |
US11899411B2 (en) | Hybrid reinforcement learning for autonomous driving | |
CN107918753B (zh) | 点云数据处理方法及装置 | |
KR101638368B1 (ko) | 다변수 패턴 인식모델을 이용한 도시 교통 예측 시스템 및 그 방법 | |
Li et al. | Road risk modeling and cloud-aided safety-based route planning | |
CN106198049A (zh) | 真实车辆在环测试系统和方法 | |
CN105892471A (zh) | 汽车自动驾驶方法和装置 | |
CN110262563A (zh) | 多无人机协同搜索水上目标的方法 | |
Völz et al. | Feature relevance estimation for learning pedestrian behavior at crosswalks | |
WO2016096226A1 (en) | A traffic data fusion system and the related method for providing a traffic state for a network of roads | |
CN108268483A (zh) | 生成用于无人车导航控制的网格地图的方法 | |
CN114023062B (zh) | 一种基于深度学习和边缘计算的交通流信息监测方法 | |
CN110889444B (zh) | 一种基于卷积神经网络的驾驶轨迹特征分类方法 | |
Luo et al. | Online multiple maneuvering vehicle tracking system based on multi-model smooth variable structure filter | |
CN110674674A (zh) | 一种基于yolo v3的旋转目标检测方法 | |
CN110021161B (zh) | 一种交通流向的预测方法及系统 | |
JP2023523350A (ja) | 乗り物に基づくデータ処理方法、データ処理装置、コンピュータ機器、及びコンピュータプログラム | |
Schnitzler et al. | Combining a Gauss-Markov model and Gaussian process for traffic prediction in Dublin city center. | |
Arefnezhad et al. | Modeling of double lane change maneuver of vehicles | |
CN110008899A (zh) | 一种可见光遥感图像候选目标提取与分类方法 | |
CN115143950A (zh) | 一种智能汽车局部语义栅格地图生成方法 | |
Ma et al. | A spatiotemporal neural network model for estimated-time-of-arrival prediction of flights in a terminal maneuvering area | |
US20220230450A1 (en) | Method, data processing apparatus and computer program product for determining road intersections | |
Liu et al. | A novel trail detection and scene understanding framework for a quadrotor UAV with monocular vision | |
Wei | Small object detection based on deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |