CN105574137A - 一种基于公共交通多源数据融合的ic卡刷卡站点匹配方法 - Google Patents
一种基于公共交通多源数据融合的ic卡刷卡站点匹配方法 Download PDFInfo
- Publication number
- CN105574137A CN105574137A CN201510937332.7A CN201510937332A CN105574137A CN 105574137 A CN105574137 A CN 105574137A CN 201510937332 A CN201510937332 A CN 201510937332A CN 105574137 A CN105574137 A CN 105574137A
- Authority
- CN
- China
- Prior art keywords
- card
- time
- website
- margin
- passage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000004927 fusion Effects 0.000 title claims abstract description 16
- 230000008569 process Effects 0.000 claims description 43
- 230000008034 disappearance Effects 0.000 claims description 36
- 238000012937 correction Methods 0.000 claims description 35
- 238000012360 testing method Methods 0.000 claims description 27
- 238000004080 punching Methods 0.000 claims description 12
- 230000008878 coupling Effects 0.000 claims description 11
- 238000010168 coupling process Methods 0.000 claims description 11
- 238000005859 coupling reaction Methods 0.000 claims description 11
- 230000002123 temporal effect Effects 0.000 claims description 6
- 230000002068 genetic effect Effects 0.000 claims description 5
- 239000002245 particle Substances 0.000 claims description 5
- 230000013011 mating Effects 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000007418 data mining Methods 0.000 abstract description 6
- 230000003044 adaptive effect Effects 0.000 abstract description 5
- 238000010845 search algorithm Methods 0.000 abstract description 2
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- DMBHHRLKUKUOEG-UHFFFAOYSA-N diphenylamine Chemical compound C=1C=CC=CC=1NC1=CC=CC=C1 DMBHHRLKUKUOEG-UHFFFAOYSA-N 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2308—Concurrency control
- G06F16/2315—Optimistic concurrency control
- G06F16/2322—Optimistic concurrency control using timestamps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C5/00—Registering or indicating the working of vehicles
- G07C5/08—Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
- G07C5/0841—Registering performance data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/835—Timestamp
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Devices For Checking Fares Or Tickets At Control Points (AREA)
Abstract
本发明提供了一种基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于:融合刷卡系统和GPS行车记录系统的数据资源,基于自适应随机搜索算法获取最佳时间推移量,以消除刷卡系统与GPS行车记录系统之间的时间差,从而实现IC卡刷卡站点匹配。该IC卡刷卡站点匹配方法既不需要调整和更改设备也不需要添加设备,运算量少,运算速度快,可有效实现IC卡号与刷卡发生站点相互匹配,有利于客流量统计和数据挖掘。
Description
技术领域
本发明涉及智能化公共交通技术领域,更具体地说,涉及一种基于公共交通多源数据融合的IC卡刷卡站点匹配方法。
背景技术
近年来,公交IC卡得到了广泛应用,提高了持卡乘客的上车效率和支付的便捷性。随着持卡乘客数量的增加,公交IC卡的刷卡记录成为低成本获取客流信息的新途径,受到了国内外公交研究者的高度关注。
当前,针对刷卡记录较为热门的应用有:在指定的一个或多个时间尺度下,针对特定线路,获取每个站点的上车客流量、下车客流量以及站点之间的OD客流量;针对指定的某些线路,获取其各站点之间的换乘客流量;针对特定区域内的所有线路,获取其各站点的上车客流量、下车客流量以及站点之间的OD客流量;针对特定区域内的所有线路,可以按照另行划定的交通小区,获取各小区的上车客流量、下车客流量以及小区之间的OD客流量。由此可见,刷卡记录对数据统计、挖掘和分析有重要作用。
但是,刷卡系统往往将设计重点放在运营清分功能上,而忽视记录刷卡站点。因此,在上述数据处理过程中,往往需要先要将刷卡记录结合GPS行车记录系统的报站记录进行时间匹配来推断刷卡站点。现阶段国内大部分城市公交运营公司,GPS(或北斗)行车记录系统(AVL系统)与刷卡系统(AFC系统)相互独立,没有时间同步机制,不可避免产生时间误差,严重者可能超过30min。时间误差对刷卡站点匹配及其它数据挖掘精度带来严重影响。
此外,刷卡站点匹配还存在着另一个需要解决的问题:由于GPS(或北斗)行车记录系统中的GPS(或北斗)接收机信号受到城市建筑物阴影或恶劣天气的影响,定位失败,造成站点信息缺失,直接导致刷卡记录无法与站点匹配。
发明内容
本发明的目的在于克服现有技术中的缺点与不足,提供一种基于公共交通多源数据融合、既不需要调整和更改设备也不需要添加设备、运算量少、运算速度快的IC卡刷卡站点匹配方法。IC卡刷卡站点匹配方法可有效实现IC卡号与刷卡发生站点相互匹配,有利于客流量统计和数据挖掘。
为了达到上述目的,本发明通过下述技术方案予以实现:一种基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,包括以下步骤:
第一步,获取刷卡系统中待匹配公交车的刷卡记录,刷卡记录包括IC卡号和刷卡时间戳;对刷卡时间戳进行处理获得刷卡时间样本集合;
获取GPS行车记录系统中待匹配公交车的报站记录,报站记录包括站点标识码a、进站时间戳tja和出站时间戳tca;分别获取各个站点标识码的停站时间区间[tja-tmargin,tca+tmargin];其中,tmargin为刷卡站点匹配算法允许的时间误差量;
第二步,设定时间推移量解空间;在时间推移量解空间中生成第一批k个时间推移量t1,t2,...,tk;
第三步,分别按时间推移量t1,t2,...,tk对刷卡时间样本集合进行时间推移,得到k个刷卡时间样本推移集合;依次判断k个刷卡时间样本推移集合中的各元素是否属于任一个停站时间区间[tja-tmargin,tca+tmargin]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;分别计算k个刷卡时间样本推移集合中匹配成功的元素数量占元素总数的比率,获得匹配成功率r1,r2,...,rk;
比较k个匹配成功率r1,r2,...,rk的大小,获得最大值并记录为最大匹配成功率rm;其中,m≤k;并将rm对应的时间推移量记录为tm;
第四步,计算rm对应的时间推移测试量tt:tt=tm±Δ;其中,Δ为偏移测试值;将刷卡时间样本集合按时间推移测试量tt进行时间推移,得到刷卡时间样本测试集合;判断刷卡时间样本测试集合中的各元素是否属于任一个停站时间区间[tja-tmargin,tca+tmargin]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;计算刷卡时间样本测试集合中匹配成功的元素数量占元素总数的比率,获得匹配测试成功率rt;
第五步,判断匹配测试成功率rt与最大匹配成功率rm的大小:若rt=rm,则判定tm为最优时间推移量,跳至第六步;否则将rm进行衰减;在时间推移量解空间中生成下一批k个时间推移量,t1,t2,...,tk,跳至第三步;
第六步,按最优时间推移量将所有刷卡时间戳进行时间推移,获得刷卡校正时间戳,以消除刷卡时间戳与报站时间戳的时间误差;将刷卡校正时间戳与停站时间区间[tja-tmargin,tca+tmargin]进行匹配,以实现IC卡号与站点标识码a之间的匹配。
本发明IC卡刷卡站点匹配方法,以刷卡系统和GPS行车记录系统为基础,实现刷卡记录和报站记录相互匹配,有利于后续统计客流量并进行数据挖掘。本发明IC卡刷卡站点匹配方法的原理是,在同一天同一线路同一公交车中,GPS行车记录系统与刷卡系统之间的时间差保持恒定,从而可通过寻找最优时间推移量来消除GPS行车记录系统与刷卡系统之间的时间差;消除时间差后,可将刷卡校正时间戳对应的IC卡号与对应的站点标识码a相匹配,从而可得知该刷卡记录发生的站点。本发明IC卡刷卡站点匹配方法采用自适应随机搜索策略,可加快运算速度。
本发明IC卡刷卡站点匹配方法以匹配成功率和辅助条件为评价体系。通过搜索最大匹配成功率来获取最优时间推移量,可避免由于站点信息缺失带来的误差导致搜索过程进入死循环。辅助条件是指通过判断匹配测试成功率rt与最大匹配成功率rm的大小来判别是否遇到噪声点,可避免获取错误的最优时间推移量,可提高算法的准确程度。
进一步的方案是,所述第一步中,对刷卡时间戳进行处理获得刷卡时间样本集合是指,利用聚类算法对刷卡时间戳进行处理形成若干个时间簇,将每个时间簇中最早的刷卡时间戳形成刷卡时间样本集合。采用聚类算法形成刷卡时间样本集合来寻找最佳时间推移量,可极大降低运算量,有利于算法的推广和应用。
所述第五步中,在时间推移量解空间中生成下一批k个时间推移量,t1,t2,...,tk是指,采用遗传算法或差分进化算法或粒子群算法在时间推移量解空间中生成下一批k个时间推移量,t1,t2,...,tk。采用遗传算法或差分进化算法或粒子群算法,有效降低运算量,加快运算速度,有利于快速获取最优时间推移量。
所述第六步中,将刷卡校正时间戳与停站时间区间[tja-tmargin,tca+tmargin]进行匹配是指,判断各个刷卡校正时间戳是否属于任一个停站时间区间[tja-tmargin,tca+tmargin]:若属于,则将该刷卡校正时间戳对应的IC卡号与停站时间区间[tja-tmargin,tca+tmargin]对应的站点标识码a相匹配;否则将该刷卡校正时间戳记录为失效刷卡校正时间戳。
第六步之后还包括:
第七步,获取GPS行车记录系统中待匹配公交车的站点缺失信息表;站点缺失信息表包括发生站点缺失前一正常站点的出站时间戳、站点缺失结束后第一个正常站点的进站时间戳,以及发生站点缺失前一正常站点的出站时间戳至站点缺失结束后第一个正常站点的进站时间戳之间的站点缺失时间区间对应的缺失站点标识码;
将所述失效刷卡校正时间戳与所述站点缺失时间区间相匹配,以实现失效刷卡校正时间戳对应的IC卡号与站点缺失时间区间对应的缺失站点标识码相匹配。本发明IC卡刷卡站点匹配方法可解决站点信息缺失而无法进行IC卡刷卡匹配的问题;有效实现IC卡号与站点缺失时间区间对应的缺失站点标识码相匹配,有利于对缺失信息的站点进行客流量统计。
所述第七步中,获取GPS行车记录系统中待匹配公交车的站点缺失信息表是指,将待匹配公交车的报站记录按上行路线和下行路线进行分割形成子集;遍历子集获取GPS行车记录系统中待匹配公交车的站点缺失信息表。
所述第七步中,实现失效刷卡校正时间戳对应的IC卡号与站点缺失时间区间对应的缺失站点标识码相匹配是指,统计各个站点缺失时间区间对应的缺失站点标识码数量;采用如下两种方式之一进行匹配:
一、缺失站点标识码数量仅为一个,将缺失站点标识码与属于站点缺失时间区间的失效簇中的IC卡号相匹配;
二、缺失站点标识码数量为两个以上,采用聚类算法将失效刷卡校正时间戳进行处理形成若干个失效簇,失效簇数量与缺失站点标识码数量相同;将缺失站点标识码按次序与失效簇一一对应,以实现缺失站点标识码与失效簇对应的IC卡号相匹配。
所述Δ取值范围为:Δ≤tmargin。
优选的方案是,所述tmargin取值范围为:90s≤tmargin≤120s。
与现有技术相比,本发明具有如下优点与有益效果:
1、本发明IC卡刷卡站点匹配方法,以刷卡系统和GPS行车记录系统为基础,实现刷卡记录和报站记录相互匹配,有利于后续统计客流量并进行数据挖掘;不需要调整、更改和添加硬件设备,可节省成本;
2、本发明IC卡刷卡站点匹配方法以匹配成功率和辅助条件为评价体系;通过搜索最大匹配成功率来获取最优时间推移量,可避免由于站点信息缺失带来的误差导致搜索过程进入死循环;辅助条件是指通过判断匹配测试成功率rt与最大匹配成功率rm的大小来判别是否遇到噪声点,可避免获取错误的最优时间推移量,可提高算法的准确程度;
3、本发明IC卡刷卡站点匹配方法有效降低运算量,加快运算速度,有利于快速获取最优时间推移量,有利于算法的推广和应用;
4、本发明IC卡刷卡站点匹配方法可解决站点信息缺失而无法进行IC卡刷卡匹配的问题;有效实现IC卡号与站点缺失时间区间对应的缺失站点标识码相匹配,有利于对缺失信息的站点进行客流量统计。
附图说明
图1是本发明IC卡刷卡站点匹配方法的整体工作流程图;
图2是本发明IC卡刷卡站点匹配方法中基于自适应随机搜索算法获取最佳时间推移量的流程图;
图3是以某一天某线路某公交车为例计算所得的时间推移量与匹配成功率图对应表。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细的描述。
实施例
一种基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其流程如图1和图2所示,包括以下步骤:
第一步,获取刷卡系统中待匹配公交车的刷卡记录,刷卡记录包括IC卡号和刷卡时间戳;对刷卡时间戳进行处理获得刷卡时间样本集合;
获取GPS行车记录系统中待匹配公交车的报站记录,报站记录包括站点标识码a、进站时间戳tja和出站时间戳tca;分别获取各个站点标识码的停站时间区间[tja-tmargin,tca+tmargin];其中,tmargin为刷卡站点匹配算法允许的时间误差量;用户可自行设置tmargin的值;优选地,90s≤tmargin≤120s;
第二步,设定时间推移量解空间;在时间推移量解空间中生成第一批k个时间推移量t1,t2,...,tk;第一批k个时间推移量t1,t2,...,tk为自动随机生成;
第三步,分别按时间推移量t1,t2,...,tk对刷卡时间样本集合进行时间推移,得到k个刷卡时间样本推移集合;依次判断k个刷卡时间样本推移集合中的各元素是否属于任一个停站时间区间[tja-tmargin,tca+tmargin]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;分别计算k个刷卡时间样本推移集合中匹配成功的元素数量占元素总数的比率,获得匹配成功率r1,r2,...,rk;
比较k个匹配成功率r1,r2,...,rk的大小,获得最大值并记录为最大匹配成功率rm;其中,m≤k;并将rm对应的时间推移量记录为tm;
第四步,计算rm对应的时间推移测试量tt:tt=tm±Δ;其中,Δ为偏移测试值,Δ≤tmargin;将刷卡时间样本集合按时间推移测试量tt进行时间推移,得到刷卡时间样本测试集合;判断刷卡时间样本测试集合中的各元素是否属于任一个停站时间区间[tja-tmargin,tca+tmargin]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;计算刷卡时间样本测试集合中匹配成功的元素数量占元素总数的比率,获得匹配测试成功率rt;
第五步,判断匹配测试成功率rt与最大匹配成功率rm的大小:若rt=rm,则判定tm为最优时间推移量,跳至第六步;否则将rm进行衰减;在时间推移量解空间中生成下一批k个时间推移量,t1,t2,...,tk,跳至第三步;
第六步,按最优时间推移量将所有刷卡时间戳进行时间推移,获得刷卡校正时间戳,以消除刷卡时间戳与报站时间戳的时间误差;将刷卡校正时间戳与停站时间区间[tja-tmargin,tca+tmargin]进行匹配,以实现IC卡号与站点标识码a之间的匹配。
其中,时间推移量解空间为用户自行设定,例如设定为-3600s~+3600s。Δ也是用户自行设定,只需要满足Δ≤tmargin,例如Δ=10s。
本发明IC卡刷卡站点匹配方法,以刷卡系统和GPS行车记录系统为基础,实现刷卡记录和报站记录相互匹配,有利于后续统计客流量并进行数据挖掘。本发明IC卡刷卡站点匹配方法的原理是,在同一天同一线路同一公交车中,GPS行车记录系统与刷卡系统之间的时间差保持恒定,从而可通过寻找最优时间推移量来消除GPS行车记录系统与刷卡系统之间的时间差;消除时间差后,可将刷卡校正时间戳对应的IC卡号与对应的站点标识码a相匹配,从而可得知该刷卡记录发生的站点。本发明IC卡刷卡站点匹配方法采用自适应随机搜索策略,可加快运算速度。
本发明IC卡刷卡站点匹配方法以匹配成功率和辅助条件为评价体系。通过搜索最大匹配成功率来获取最优时间推移量,可避免由于站点信息缺失带来的误差导致搜索过程进入死循环。辅助条件是指通过判断匹配测试成功率rt与最大匹配成功率rm的大小来判别是否遇到噪声点,可避免获取错误的最优时间推移量,可提高算法的准确程度。例如图3是以某一天某线路某公交车为例计算所得的时间推移量与匹配成功率图对应表,最优时间推移量应该位于A处,B处为噪声点,通过辅助条件可将B排除。
优选地,所述第一步中,对刷卡时间戳进行处理获得刷卡时间样本集合是指,利用聚类算法对刷卡时间戳进行处理形成若干个时间簇,将每个时间簇中最早的刷卡时间戳形成刷卡时间样本集合。采用聚类算法形成刷卡时间样本集合来寻找最佳时间推移量,可极大降低运算量,有利于算法的推广和应用。
所述第五步中,在时间推移量解空间中生成下一批k个时间推移量,t1,t2,...,tk是指,采用遗传算法或差分进化算法或粒子群算法在时间推移量解空间中生成下一批k个时间推移量,t1,t2,...,tk。采用遗传算法或差分进化算法或粒子群算法,形成自适应随机搜索,有效降低运算量,加快运算速度,有利于快速获取最优时间推移量。优选地,在第三步中应记录已计算的时间推移量和对应的匹配成功率,在第五步中,生成下一批时间推移量时应避免选取已计算的时间推移量。
所述第六步中,将刷卡校正时间戳与停站时间区间[tja-tmargin,tca+tmargin]进行匹配是指,判断各个刷卡校正时间戳是否属于任一个停站时间区间[tja-tmargin,tca+tmargin]:若属于,则将该刷卡校正时间戳对应的IC卡号与停站时间区间[tja-tmargin,tca+tmargin]对应的站点标识码a相匹配;否则将该刷卡校正时间戳记录为失效刷卡校正时间戳。
第六步之后还包括:
第七步,获取GPS行车记录系统中待匹配公交车的站点缺失信息表;站点缺失信息表包括发生站点缺失前一正常站点的出站时间戳、站点缺失结束后第一个正常站点的进站时间戳,以及发生站点缺失前一正常站点的出站时间戳至站点缺失结束后第一个正常站点的进站时间戳之间的站点缺失时间区间对应的缺失站点标识码;
将所述失效刷卡校正时间戳与所述站点缺失时间区间相匹配,以实现失效刷卡校正时间戳对应的IC卡号与站点缺失时间区间对应的缺失站点标识码相匹配。本发明IC卡刷卡站点匹配方法可解决站点信息缺失而无法进行IC卡刷卡匹配的问题;有效实现IC卡号与站点缺失时间区间对应的缺失站点标识码相匹配,有利于对缺失信息的站点进行客流量统计。
所述第七步中,获取GPS行车记录系统中待匹配公交车的站点缺失信息表是指,将待匹配公交车的报站记录按上行路线和下行路线进行分割形成子集;遍历子集获取GPS行车记录系统中待匹配公交车的站点缺失信息表。
所述第七步中,实现失效刷卡校正时间戳对应的IC卡号与站点缺失时间区间对应的缺失站点标识码相匹配是指,统计各个站点缺失时间区间对应的缺失站点标识码数量;采用如下两种方式之一进行匹配:
一、缺失站点标识码数量仅为一个,将缺失站点标识码与属于站点缺失时间区间的失效簇中的IC卡号相匹配;
二、缺失站点标识码数量为两个以上,采用聚类算法将失效刷卡校正时间戳进行处理形成若干个失效簇,失效簇数量与缺失站点标识码数量相同;将缺失站点标识码按次序与失效簇一一对应,以实现缺失站点标识码与失效簇对应的IC卡号相匹配。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (9)
1.一种基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,包括以下步骤:
第一步,获取刷卡系统中待匹配公交车的刷卡记录,刷卡记录包括IC卡号和刷卡时间戳;对刷卡时间戳进行处理获得刷卡时间样本集合;
获取GPS行车记录系统中待匹配公交车的报站记录,报站记录包括站点标识码a、进站时间戳tja和出站时间戳tca;分别获取各个站点标识码的停站时间区间[tja-tmargin,tca+tmargin];其中,tmargin为刷卡站点匹配算法允许的时间误差量;
第二步,设定时间推移量解空间;在时间推移量解空间中生成第一批k个时间推移量t1,t2,...,tk;
第三步,分别按时间推移量t1,t2,...,tk对刷卡时间样本集合进行时间推移,得到k个刷卡时间样本推移集合;依次判断k个刷卡时间样本推移集合中的各元素是否属于任一个停站时间区间[tja-tmargin,tca+tmargin]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;分别计算k个刷卡时间样本推移集合中匹配成功的元素数量占元素总数的比率,获得匹配成功率r1,r2,...,rk;
比较k个匹配成功率r1,r2,...,rk的大小,获得最大值并记录为最大匹配成功率rm;其中,m≤k;并将rm对应的时间推移量记录为tm;
第四步,计算rm对应的时间推移测试量tt:tt=tm±Δ;其中,Δ为偏移测试值;将刷卡时间样本集合按时间推移测试量tt进行时间推移,得到刷卡时间样本测试集合;判断刷卡时间样本测试集合中的各元素是否属于任一个停站时间区间[tja-tmargin,tca+tmargin]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;计算刷卡时间样本测试集合中匹配成功的元素数量占元素总数的比率,获得匹配测试成功率rt;
第五步,判断匹配测试成功率rt与最大匹配成功率rm的大小:若rt=rm,则判定tm为最优时间推移量,跳至第六步;否则将rm进行衰减;在时间推移量解空间中生成下一批k个时间推移量,t1,t2,...,tk,跳至第三步;
第六步,按最优时间推移量将所有刷卡时间戳进行时间推移,获得刷卡校正时间戳,以消除刷卡时间戳与报站时间戳的时间误差;将刷卡校正时间戳与停站时间区间[tja-tmargin,tca+tmargin]进行匹配,以实现IC卡号与站点标识码a之间的匹配。
2.根据权利要求1所述的基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,所述第一步中,对刷卡时间戳进行处理获得刷卡时间样本集合是指,利用聚类算法对刷卡时间戳进行处理形成若干个时间簇,将每个时间簇中最早的刷卡时间戳形成刷卡时间样本集合。
3.根据权利要求1所述的基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,所述第五步中,在时间推移量解空间中生成下一批k个时间推移量,t1,t2,...,tk是指,采用遗传算法或差分进化算法或粒子群算法在时间推移量解空间中生成下一批k个时间推移量,t1,t2,...,tk。
4.根据权利要求1所述的基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,所述第六步中,将刷卡校正时间戳与停站时间区间[tja-tmargin,tca+tmargin]进行匹配是指,判断各个刷卡校正时间戳是否属于任一个停站时间区间[tja-tmargin,tca+tmargin]:若属于,则将该刷卡校正时间戳对应的IC卡号与停站时间区间[tja-tmargin,tca+tmargin]对应的站点标识码a相匹配;否则将该刷卡校正时间戳记录为失效刷卡校正时间戳。
5.根据权利要求4所述的基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,第六步之后还包括:
第七步,获取GPS行车记录系统中待匹配公交车的站点缺失信息表;站点缺失信息表包括发生站点缺失前一正常站点的出站时间戳、站点缺失结束后第一个正常站点的进站时间戳,以及发生站点缺失前一正常站点的出站时间戳至站点缺失结束后第一个正常站点的进站时间戳之间的站点缺失时间区间对应的缺失站点标识码;
将所述失效刷卡校正时间戳与所述站点缺失时间区间相匹配,以实现失效刷卡校正时间戳对应的IC卡号与站点缺失时间区间对应的缺失站点标识码相匹配。
6.根据权利要求5所述的基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,所述第七步中,获取GPS行车记录系统中待匹配公交车的站点缺失信息表是指,将待匹配公交车的报站记录按上行路线和下行路线进行分割形成子集;遍历子集获取GPS行车记录系统中待匹配公交车的站点缺失信息表。
7.根据权利要求5所述的基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,所述第七步中,实现失效刷卡校正时间戳对应的IC卡号与站点缺失时间区间对应的缺失站点标识码相匹配是指,统计各个站点缺失时间区间对应的缺失站点标识码数量;采用如下两种方式之一进行匹配:
一、缺失站点标识码数量仅为一个,将缺失站点标识码与属于站点缺失时间区间的失效簇中的IC卡号相匹配;
二、缺失站点标识码数量为两个以上,采用聚类算法将失效刷卡校正时间戳进行处理形成若干个失效簇,失效簇数量与缺失站点标识码数量相同;将缺失站点标识码按次序与失效簇一一对应,以实现缺失站点标识码与失效簇对应的IC卡号相匹配。
8.根据权利要求1至7中任一项所述的基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,所述Δ取值范围为:Δ≤tmargin。
9.根据权利要求1至7中任一项所述的基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,所述tmargin取值范围为:90s≤tmargin≤120s。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510937332.7A CN105574137B (zh) | 2015-12-15 | 2015-12-15 | 一种基于公共交通多源数据融合的ic卡刷卡站点匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510937332.7A CN105574137B (zh) | 2015-12-15 | 2015-12-15 | 一种基于公共交通多源数据融合的ic卡刷卡站点匹配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105574137A true CN105574137A (zh) | 2016-05-11 |
CN105574137B CN105574137B (zh) | 2018-12-11 |
Family
ID=55884268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510937332.7A Expired - Fee Related CN105574137B (zh) | 2015-12-15 | 2015-12-15 | 一种基于公共交通多源数据融合的ic卡刷卡站点匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105574137B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106781467A (zh) * | 2016-12-07 | 2017-05-31 | 华南理工大学 | 一种基于协同过滤的公交乘客刷卡站点信息提取方法 |
CN108230724A (zh) * | 2018-01-31 | 2018-06-29 | 华南理工大学 | 一种基于极大概率估计的城市公交系统车载报站缺失数据修补方法 |
CN108491932A (zh) * | 2018-01-31 | 2018-09-04 | 华南理工大学 | 一种城市公交多源数据时间误差消除方法 |
CN109523819A (zh) * | 2018-11-20 | 2019-03-26 | 湖南智慧畅行交通科技有限公司 | 一种基于公交到离站的乘客ic卡数据与站点匹配方法 |
CN115691128A (zh) * | 2022-10-27 | 2023-02-03 | 大连海事大学 | 一种基于多源公交数据联合挖掘的公交站点客流推算方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101540098A (zh) * | 2009-04-30 | 2009-09-23 | 北京工业大学 | 基于公交ic卡线路的匹配方法 |
CN102097002A (zh) * | 2010-11-22 | 2011-06-15 | 东南大学 | 一种基于ic卡数据获取公交站点od的方法及系统 |
CN102156732A (zh) * | 2011-04-11 | 2011-08-17 | 北京工业大学 | 基于特征站点的公交ic卡数据站点匹配方法 |
CN103198565A (zh) * | 2013-04-12 | 2013-07-10 | 王铎源 | 一种公交ic卡收费与客流信息采集方法 |
US20140074757A1 (en) * | 2012-09-07 | 2014-03-13 | International Business Machines Corporation | Estimating taxi fare |
-
2015
- 2015-12-15 CN CN201510937332.7A patent/CN105574137B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101540098A (zh) * | 2009-04-30 | 2009-09-23 | 北京工业大学 | 基于公交ic卡线路的匹配方法 |
CN102097002A (zh) * | 2010-11-22 | 2011-06-15 | 东南大学 | 一种基于ic卡数据获取公交站点od的方法及系统 |
CN102156732A (zh) * | 2011-04-11 | 2011-08-17 | 北京工业大学 | 基于特征站点的公交ic卡数据站点匹配方法 |
US20140074757A1 (en) * | 2012-09-07 | 2014-03-13 | International Business Machines Corporation | Estimating taxi fare |
CN103198565A (zh) * | 2013-04-12 | 2013-07-10 | 王铎源 | 一种公交ic卡收费与客流信息采集方法 |
Non-Patent Citations (2)
Title |
---|
呙娟: "基于公交数据的乘客出行特征分析", 《中国优秀硕士学位论文全文数据库 工程科技II辑》 * |
陈绍辉 等: "基于GPS与IC卡数据的公交站点匹配方法", 《公路交通科技》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106781467A (zh) * | 2016-12-07 | 2017-05-31 | 华南理工大学 | 一种基于协同过滤的公交乘客刷卡站点信息提取方法 |
CN108230724A (zh) * | 2018-01-31 | 2018-06-29 | 华南理工大学 | 一种基于极大概率估计的城市公交系统车载报站缺失数据修补方法 |
CN108491932A (zh) * | 2018-01-31 | 2018-09-04 | 华南理工大学 | 一种城市公交多源数据时间误差消除方法 |
CN108230724B (zh) * | 2018-01-31 | 2020-05-22 | 华南理工大学 | 一种基于极大概率估计的城市公交系统车载报站缺失数据修补方法 |
CN109523819A (zh) * | 2018-11-20 | 2019-03-26 | 湖南智慧畅行交通科技有限公司 | 一种基于公交到离站的乘客ic卡数据与站点匹配方法 |
CN109523819B (zh) * | 2018-11-20 | 2021-04-06 | 湖南智慧畅行交通科技有限公司 | 一种基于公交到离站的乘客ic卡数据与站点匹配方法 |
CN115691128A (zh) * | 2022-10-27 | 2023-02-03 | 大连海事大学 | 一种基于多源公交数据联合挖掘的公交站点客流推算方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105574137B (zh) | 2018-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105574137A (zh) | 一种基于公共交通多源数据融合的ic卡刷卡站点匹配方法 | |
CN103678613B (zh) | 一种计算影响力数据的方法与装置 | |
CN109039646A (zh) | 一种基于节点能力的区块链区块打包和验证方法及系统 | |
CN103208660B (zh) | 基于电动汽车充电履历挖掘充电站的方法 | |
CN107719160A (zh) | 一种充电桩枪口转换系统 | |
CN104123757A (zh) | 基于车辆实时位置和路链匹配的拥堵收费方法及系统 | |
CN104880720A (zh) | 一种弱信号卫星导航系统的位同步方法 | |
CN102194312B (zh) | 一种道路合并方法及道路合并装置 | |
CN106844607A (zh) | 一种适用于非整型主键与空闲块合并的SQLite数据恢复方法 | |
CN115643528A (zh) | 一种基于手机信令数据的出行者活动—出行链重构方法 | |
CN103488683A (zh) | 一种微博数据管理系统及其实现方法 | |
CN107563031B (zh) | 基于标准功能编码的智能变电站虚端子自动关联方法 | |
CN101488148A (zh) | 一种从多个数据库中进行数据整理归集的方法 | |
CN106781467B (zh) | 一种基于协同过滤的公交乘客刷卡站点信息提取方法 | |
CN109783784A (zh) | 一种基于最小表单组合的数据处理方法和表单生成器 | |
CN109360096B (zh) | 一种基于公有链的私有链的记账方法及系统 | |
CN106448116A (zh) | 以用户手机作为中继的互动开放式抄表方法 | |
CN109697219B (zh) | 一种基于区块链的电力分布式系统及其块链记录方法 | |
CN105302889A (zh) | 数据存储结构的转换方法及装置 | |
Chadha et al. | Critical minerals for India: Assessing their criticality and projecting their needs for green technologies | |
CN105119961A (zh) | 基于本体的语义Web服务自动组合方法 | |
CN112380732B (zh) | 一种电力-交通-信息系统交互影响的配电网cps评估方法 | |
CN107609701A (zh) | 一种基于ic卡数据的公共自行车出行链提取方法 | |
CN110019972A (zh) | 电子发票的存储方法、记账链的恢复方法及电子装置 | |
CN110445594A (zh) | 一种数据传输辅助的非正交导频设计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20181211 |