CN114363842A - 基于手机信令数据的公交乘客下车站点预测方法及装置 - Google Patents
基于手机信令数据的公交乘客下车站点预测方法及装置 Download PDFInfo
- Publication number
- CN114363842A CN114363842A CN202111678626.4A CN202111678626A CN114363842A CN 114363842 A CN114363842 A CN 114363842A CN 202111678626 A CN202111678626 A CN 202111678626A CN 114363842 A CN114363842 A CN 114363842A
- Authority
- CN
- China
- Prior art keywords
- signaling
- user
- card swiping
- track
- bus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011664 signaling Effects 0.000 title claims abstract description 272
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000013507 mapping Methods 0.000 claims abstract description 144
- 230000011218 segmentation Effects 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000012216 screening Methods 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Mobile Radio Communication Systems (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了基于手机信令数据的公交乘客下车站点预测方法及装置,方法包括:获取目标数据集;根据所述目标数据集,构建所述手机信令用户与所述公交刷卡用户之间的对应关系;根据所述目标数据集,对所述公交刷卡用户的相邻上车时间进行时段划分,确定信令轨迹和GPS轨迹;计算所述信令轨迹对应的直接映射点集和所述GPS轨迹对应的时空分段映射点集;根据所述直接映射点集和所述时空分段映射点集之间的位置偏移程度,确定下车映射点;根据所述下车映射点的时空信息,结合公交路线的站点信息,预测刷卡用户的下车站点。本发明提高了预测的准确率,可广泛应用于交通数据处理技术领域。
Description
技术领域
本发明涉及交通数据处理技术领域,尤其是基于手机信令数据的公交乘客下车站点预测方法及装置。
背景技术
随着城市现代化进程的不断加快,城市人口和车辆不断增长,城市交通拥堵问题日益突出,而优先发展城市公共交通是解决这一问题的重要手段。但目前国内城市公交系统存在着许多问题:如城市道路设计与线网规划不合理、公共交通出行设施不完善等。因此,要改善交通拥堵现状,需要对现状城市公交出行特征进行分析,优化城市公交线网。而准确获取公交客流起讫点对公交出行特征分析、城市公交线网优化、提高城市公交服务水平等具有重要意义。然而,在“一票制”刷卡制度下,乘客在乘坐公交时,仅在上车时刷卡,产生刷卡记录,但乘客何时下车不得而知,因此下车站点推断是目前的一大研究难点。
在手机信令数据兴起前,针对下车站点推断,根据研究对象和出行链是否断裂的不同,国内外研究主要有三类解决方案。第一类下车站点推断方案针对群体出行对象,该类方法利用IC卡和公交线路数据,结合土地利用等因素赋予各个站点不同的吸引力,从而得到下车站点。该类方法无法针对个体对象进行分析,不能体现一天中不同时段乘客的选择差异。第二类下车站点推断方案针对个体出行对象,且出行链闭合的情况。该类方法主要是通过启发式规则和出行链分析方法进行推断。该类方法受其假设条件影响较大,且在出行链断裂时无法推断。第三类下车站点推断方法是目前国内外学者的主要研究方向,其主要针对个体出行对象,且出行链断裂的情况。主要有结合个体历史出行记录的方法、机器学习方法以及多源数据融合等方法。目前此类方法的主要问题是缺少个体的历史出行记录,数据不平衡导致识别精度较低。
近年来,智能手机普及,手机用户使用手机(如打电话、发送短信和连接网络)时会与基站连接通信,同时通信后台系统会记录手机设备的编号、通信时间和基站位置信息,这些信息记录构成手机信令数据。手机信令数据具有观测周期长和跟随性强特点。在生活智能化的今天,手机常伴随于城市居民的社会活动,城市居民使用手机的频率大幅度提高。如何借助手机信令数据进行下车站点预测成为亟待解决的技术问题。
发明内容
有鉴于此,本发明实施例提供一种准确率高的,基于手机信令数据的公交乘客下车站点预测方法及装置。
本发明的一方面提供了一种基于手机信令数据的公交乘客下车站点预测方法,包括:
获取目标数据集,所述目标数据集包括手机信令用户的时空信令轨迹和公交刷卡用户所乘车辆的GPS轨迹;
根据所述目标数据集,构建所述手机信令用户与所述公交刷卡用户之间的对应关系;
根据所述目标数据集,对所述公交刷卡用户的相邻上车时间进行时段划分,确定信令轨迹和GPS轨迹;
计算所述信令轨迹对应的直接映射点集和所述GPS轨迹对应的时空分段映射点集;
根据所述直接映射点集和所述时空分段映射点集之间的位置偏移程度,确定下车映射点;
根据所述下车映射点的时空信息,结合公交路线的站点信息,预测刷卡用户的下车站点。
可选地,所述获取目标数据集,包括:
获取原始数据集,所述原始数据集包括手机信令数据、公交刷卡数据、公交GPS数据以及公交线路站点信息;
对所述原始数据集进行数据预处理,得到手机信令用户的时空信令轨迹和公交刷卡用户所乘车辆的GPS轨迹,构建得到所述目标数据集。
可选地,所述根据所述目标数据集,构建所述手机信令用户与所述公交刷卡用户之间的对应关系,包括:
对所有手机信令数据进行去重处理,得到所有信令轨迹点的唯一位置,进而构建基站信息表;其中,所述基站信息表包括基站编号信息和经纬度信息;
对所有公交线路站点信息进行去重处理,得到所有站点信息;
根据所述基站信息表和所述站点信息,构建站点与基站之间的映射关系表;其中,所述映射关系表包括站点编号信息和基站标号信息;
根据时空约束从所述公交刷卡用户中筛选候选信令用户;
根据时空相似度,确定所述候选信令用户中公交刷卡用户与对应的手机信令用户之间的匹配对应关系。
可选地,所述根据时空约束从所述公交刷卡用户中筛选候选信令用户,包括:
根据所述映射关系表和所述公交刷卡数据,匹配得到上车站点对应的基站编号;
根据所述基站编号,将所述公交刷卡数据与所述手机信令数据按预设的时间匹配规则进行匹配,得到刷卡用户可能对应的信令用户;
按照刷卡用户编号和刷卡时间,将匹配了信令用户的公交刷卡数据进行分组,确定公交刷卡用户与手机信令用户之间的第一对应表以及候选匹配用户集;
根据所述第一对应表和所述候选匹配用户集,确定公交刷卡用户与手机信令用户之间的第一对应关系集;其中,所述第一对应关系集包含每个公交刷卡用户对应的多个候选信令用户。
可选地,所述根据时空相似度,确定所述候选信令用户中公交刷卡用户与对应的手机信令用户之间的匹配对应关系,包括:
构建所述公交刷卡用户从上车点到公交终点站之间的GPS轨迹;
根据刷卡时间,查找在预设的时间范围内,所述候选信令用户的信令轨迹;
根据基站的覆盖范围大小,构建信令轨迹点的缓冲区;
计算每个所述候选信令用户的所述信令轨迹与对应的公交刷卡用户的所述GPS轨迹之间的时空相似度;
根据计算得到的所有所述时空相似度,计算每个所述候选信令用户在不同刷卡时间下的相似度均值;
将相似度均值最大的候选信令用户确定为对应的公交刷卡用户的唯一匹配对象。
可选地,所述计算所述信令轨迹对应的直接映射点集,包括:
获取一个公交刷卡时段内的信令轨迹和GPS轨迹,并按照时间顺序对所述信令轨迹和所述GPS轨迹进行排序,确定信令轨迹点和GPS轨迹点;
将所述信令轨迹和所述GPS轨迹中的经纬度坐标转换为直角坐标;
根据所述信令轨迹,计算每个所述信令轨迹点在所述信令轨迹中对应的直接映射点,构建得到直接映射点集。
可选地,所述计算所述GPS轨迹对应的时空分段映射点集,包括:
获取一个公交刷卡时段内的信令轨迹和GPS轨迹,并按照时间顺序对所述信令轨迹和所述GPS轨迹进行排序,确定信令轨迹点和GPS轨迹点;
将所述信令轨迹和所述GPS轨迹中的经纬度坐标转换为直角坐标;
根据所述GPS轨迹,计算每个所述信令轨迹点在所述GPS轨迹中对应的时空映射点,构建得到时空分段映射点集。
可选地,所述根据所述直接映射点集和所述时空分段映射点集之间的位置偏移程度,确定下车映射点,包括:
计算所述直接映射点集和所述时空分段映射点集中轨迹点之间的直接距离,构建距离矩阵;
判断所述距离矩阵中各个距离值与距离阈值之间的大小关系,当所述距离值小于所述距离阈值时,判定在对应的轨迹点时用户在车上;反之,则判定在所述对应的轨迹点时用户不在车上;
查找最后一个所述距离值小于所述距离阈值时对应的直接映射点,将所述直接映射点确定为用户下车时对应的映射点;
获取用户所有下车时的映射点,确定所述用户的下车映射点集合。
可选地,所述根据所述下车映射点的时空信息,结合公交路线的站点信息,预测刷卡用户的下车站点,包括:
获取待预测用户的待预测刷卡数据,所述待预测刷卡数据包括线路名、线路方向和上车站点;
获取公交线路站点信息,所述公交线路站点信息包括线路名、线路方向、线路途经站点和站点经纬度;
根据所述待预测刷卡数据,筛选所述待预测用户的候选下车站点集合;
计算所述待预测用户在当前下车映射点与候选下车站点集合中各个站点之间的距离;
将距离最小时对应的站点作为所述待预测用户的下车站点,并将所述下车站点对应的下车映射点的时间作为所述待预测用户的下车时间。
本发明实施例的另一方面还提供了一种基于手机信令数据的公交乘客下车站点预测装置,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如前面所述的方法。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
本发明的实施例获取目标数据集,所述目标数据集包括手机信令用户的时空信令轨迹和公交刷卡用户所乘车辆的GPS轨迹;根据所述目标数据集,构建所述手机信令用户与所述公交刷卡用户之间的对应关系;根据所述目标数据集,对所述公交刷卡用户的相邻上车时间进行时段划分,确定信令轨迹和GPS轨迹;计算所述信令轨迹对应的直接映射点集和所述GPS轨迹对应的时空分段映射点集;根据所述直接映射点集和所述时空分段映射点集之间的位置偏移程度,确定下车映射点;根据所述下车映射点的时空信息,结合公交路线的站点信息,预测刷卡用户的下车站点。本发明提高了预测的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的整体步骤流程图;
图2为本发明实施例提供的基站缓冲区示意图;
图3为本发明实施例提供的某刷卡时段的信令轨迹和GPS轨迹示意图;
图4为本发明实施例提供的直接映射点集计算示意图;
图5为本发明实施例提供的时空分段映射点集示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
针对现有技术存在的问题,本发明的一方面提供了一种基于手机信令数据的公交乘客下车站点预测方法,包括:
获取目标数据集,所述目标数据集包括手机信令用户的时空信令轨迹和公交刷卡用户所乘车辆的GPS轨迹;
根据所述目标数据集,构建所述手机信令用户与所述公交刷卡用户之间的对应关系;
根据所述目标数据集,对所述公交刷卡用户的相邻上车时间进行时段划分,确定信令轨迹和GPS轨迹;
计算所述信令轨迹对应的直接映射点集和所述GPS轨迹对应的时空分段映射点集;
根据所述直接映射点集和所述时空分段映射点集之间的位置偏移程度,确定下车映射点;
根据所述下车映射点的时空信息,结合公交路线的站点信息,预测刷卡用户的下车站点。
可选地,所述获取目标数据集,包括:
获取原始数据集,所述原始数据集包括手机信令数据、公交刷卡数据、公交GPS数据以及公交线路站点信息;
对所述原始数据集进行数据预处理,得到手机信令用户的时空信令轨迹和公交刷卡用户所乘车辆的GPS轨迹,构建得到所述目标数据集。
可选地,所述根据所述目标数据集,构建所述手机信令用户与所述公交刷卡用户之间的对应关系,包括:
对所有手机信令数据进行去重处理,得到所有信令轨迹点的唯一位置,进而构建基站信息表;其中,所述基站信息表包括基站编号信息和经纬度信息;
对所有公交线路站点信息进行去重处理,得到所有站点信息;
根据所述基站信息表和所述站点信息,构建站点与基站之间的映射关系表;其中,所述映射关系表包括站点编号信息和基站标号信息;
根据时空约束从所述公交刷卡用户中筛选候选信令用户;
根据时空相似度,确定所述候选信令用户中公交刷卡用户与对应的手机信令用户之间的匹配对应关系。
可选地,所述根据时空约束从所述公交刷卡用户中筛选候选信令用户,包括:
根据所述映射关系表和所述公交刷卡数据,匹配得到上车站点对应的基站编号;
根据所述基站编号,将所述公交刷卡数据与所述手机信令数据按预设的时间匹配规则进行匹配,得到刷卡用户可能对应的信令用户;
按照刷卡用户编号和刷卡时间,将匹配了信令用户的公交刷卡数据进行分组,确定公交刷卡用户与手机信令用户之间的第一对应表以及候选匹配用户集;
根据所述第一对应表和所述候选匹配用户集,确定公交刷卡用户与手机信令用户之间的第一对应关系集;其中,所述第一对应关系集包含每个公交刷卡用户对应的多个候选信令用户。
可选地,所述根据时空相似度,确定所述候选信令用户中公交刷卡用户与对应的手机信令用户之间的匹配对应关系,包括:
构建所述公交刷卡用户从上车点到公交终点站之间的GPS轨迹;
根据刷卡时间,查找在预设的时间范围内,所述候选信令用户的信令轨迹;
根据基站的覆盖范围大小,构建信令轨迹点的缓冲区;
计算每个所述候选信令用户的所述信令轨迹与对应的公交刷卡用户的所述GPS轨迹之间的时空相似度;
根据计算得到的所有所述时空相似度,计算每个所述候选信令用户在不同刷卡时间下的相似度均值;
将相似度均值最大的候选信令用户确定为对应的公交刷卡用户的唯一匹配对象。
可选地,所述计算所述信令轨迹对应的直接映射点集,包括:
获取一个公交刷卡时段内的信令轨迹和GPS轨迹,并按照时间顺序对所述信令轨迹和所述GPS轨迹进行排序,确定信令轨迹点和GPS轨迹点;
将所述信令轨迹和所述GPS轨迹中的经纬度坐标转换为直角坐标;
根据所述信令轨迹,计算每个所述信令轨迹点在所述信令轨迹中对应的直接映射点,构建得到直接映射点集。
可选地,所述计算所述GPS轨迹对应的时空分段映射点集,包括:
获取一个公交刷卡时段内的信令轨迹和GPS轨迹,并按照时间顺序对所述信令轨迹和所述GPS轨迹进行排序,确定信令轨迹点和GPS轨迹点;
将所述信令轨迹和所述GPS轨迹中的经纬度坐标转换为直角坐标;
根据所述GPS轨迹,计算每个所述信令轨迹点在所述GPS轨迹中对应的时空映射点,构建得到时空分段映射点集。
可选地,所述根据所述直接映射点集和所述时空分段映射点集之间的位置偏移程度,确定下车映射点,包括:
计算所述直接映射点集和所述时空分段映射点集中轨迹点之间的直接距离,构建距离矩阵;
判断所述距离矩阵中各个距离值与距离阈值之间的大小关系,当所述距离值小于所述距离阈值时,判定在对应的轨迹点时用户在车上;反之,则判定在所述对应的轨迹点时用户不在车上;
查找最后一个所述距离值小于所述距离阈值时对应的直接映射点,将所述直接映射点确定为用户下车时对应的映射点;
获取用户所有下车时的映射点,确定所述用户的下车映射点集合。
可选地,所述根据所述下车映射点的时空信息,结合公交路线的站点信息,预测刷卡用户的下车站点,包括:
获取待预测用户的待预测刷卡数据,所述待预测刷卡数据包括线路名、线路方向和上车站点;
获取公交线路站点信息,所述公交线路站点信息包括线路名、线路方向、线路途经站点和站点经纬度;
根据所述待预测刷卡数据,筛选所述待预测用户的候选下车站点集合;
计算所述待预测用户在当前下车映射点与候选下车站点集合中各个站点之间的距离;
将距离最小时对应的站点作为所述待预测用户的下车站点,并将所述下车站点对应的下车映射点的时间作为所述待预测用户的下车时间。
本发明实施例的另一方面还提供了一种基于手机信令数据的公交乘客下车站点预测装置,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如前面所述的方法。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
下面结合说明书附图,对本发明的具体实现原理进行详细说明:
一种基于手机信令数据的公交乘客下车站点推断方法,包含以下步骤(a)-(f):
(a)数据预处理,获取手机信令数据、公交刷卡数据、公交GPS数据以及公交线路站点信息数据,并对数据进行预处理,得到手机信令用户的时空信令轨迹和公交刷卡用户所乘车辆的GPS轨迹。
(b)用户匹配,基于强时空规则构建信令用户与刷卡用户的对应关系集。
(c)数据分段,基于刷卡用户相邻的上车时间划分时段,根据时段划分信令轨迹和GPS轨迹。
(d)计算直接映射点集与时空分段映射点集。
(e)根据映射点集间的位置偏移程度确定下车映射点。
(f)根据下车映射点的时空信息,结合公交线路站点信息,基于就近原则推断得到刷卡用户的下车站点。
优选地,所述步骤(b)中,“强时空规则”是指一种针对信令用户与刷卡用户在时空关系上的约束关系。若某刷卡用户与某信令用户同时满足时间范围和空间范围内的约束关系,则认为这两个用户为同一个体。
优选地,所述步骤(b)中,构建信令用户与刷卡用户的对应关系集,具体方法见步骤(b)附图,具体过程包括以下(1)-(4):
(1)对输入的所有手机信令数据进行去重,得到所有信令轨迹点的唯一位置,构建对应的基站信息表Base_info_table,表中字段包括基站编号BaseID和经纬度BaseLng、BaseLat。
(2)对输入的公交站点信息数据进行去重,提取出所有的站点信息,结合(1)所述的基站信息表Base_info_table,基于站点与基站之间的距离关系,构建站点与基站的映射关系表Station_base_table,表中字段包括站点编号StationID和基站标号BaseID。
(3)基于时空约束初步筛选刷卡用户对应的候选信令用户,该步骤具体包括以下步骤①-④:
①输入刷卡数据,根据建立的Station_base_table,将其与刷卡数据匹配,得到上车站点对应的基站编号。
②基于基站编号,将公交刷卡数据与手机信令数据按同一小时进行匹配,得到刷卡用户可能对应的信令用户。
③将匹配了信令用户的刷卡数据基于刷卡用户编号和时间分组,进一步按刷卡时间前后T1分钟细粒度地筛选满足条件的信令用户,从而得到初始的刷卡用户与信令用户的对应表。
④根据刷卡用户分组,取信令用户出现次数排名前N的N个用户作为刷卡用户的候选匹配用户集,从而得到初步的刷卡用户与信令用户对应关系集(1个刷卡用户对应N个候选信令用户)。
(4)基于轨迹时空相似度确定刷卡用户与信令用户的唯一匹配,该步骤具体包括以下步骤①-⑤
①筛选出刷卡用户乘坐车辆从用户上车时间后至终点站的GPS轨迹。
②基于刷卡时间,筛选出一定时间范围T内的候选信令用户的信令轨迹;T的取值如下:
T=[boardingTime,ArriveFinalStationTime+t]
其中,boardingTime为刷卡上车时间,ArriveFinalStationTime为车辆到达终点站的时间,t取值10分钟。
③基于基站覆盖范围的大小构建信令轨迹点的缓冲区。首先,基于维诺图生成所有信令基站的基站小区,然后找出基站小区的外接矩形,假设矩形的长边距离为X,将外接矩形向外扩张X的大小,形成该基站的缓冲区范围。
④计算信令轨迹与GPS轨迹的时空相似度。计算公式如下:
similarityCSD-GPS=sim/NCSD
其中,NCSD表示信令轨迹点的总数;sim表示GPS轨迹与信令轨迹的相似性。sim的计算方式为:判断①GPS轨迹点是否在信令轨迹点的时间范围内,②GPS轨迹点是否在信令轨迹点的覆盖范围内,同时满足上述①②两个条件,则说明该信令轨迹点与GPS轨迹点相似,相似性sim加1,逐个判断信令轨迹中所有轨迹点与GPS轨迹点的时空关系,得到总相似性sim。
⑤基于上述步骤(4)④所述的相似度计算方法,结合步骤(3)④得到的刷卡用户对应的候选信令用户集,计算每个信令用户与刷卡用户的轨迹时空相似度。对同一信令用户在不同刷卡时间下的相似度取均值,得到最终的相似度值,取相似度最大值对应的信令用户作为刷卡用户的唯一匹配。
优选地,所述步骤(c)中,数据分段包括信令轨迹分段和GPS数据分组,其中,信令轨迹分段是指基于一天内用户的多次上车刷卡时间,利用相邻刷卡时间形成时段[boardingTimei,boardingTimei+1],将手机信令数据划分为若干段,得到若干个信令轨迹点集合;GPS数据分组是指将刷卡用户一天内所乘坐车辆的GPS轨迹按刷卡用户和上车刷卡时间进行分组,得到刷卡用户不同刷卡时段的车辆GPS轨迹。
优选地,所述步骤(d)中,计算直接映射点集的具体过程包括以下(1)-(5):
(1)输入某上车刷卡时段内的信令轨迹和车辆GPS轨迹,并对输入的信令轨迹和GPS轨迹按时间大小排序Ti=[t1,t2,…,tn],其中n为输入的信令轨迹点的数量。
(2)将输入的信令轨迹和GPS轨迹中的经纬度坐标转换为直角坐标。
(3)从第1个信令轨迹点CSD1开始计算,将输入的GPS轨迹转化为线L1,计算CSD1到L1的距离最近的映射点directPoint1:[lng1,lat1,time1]。
(4)删除GPS轨迹中time1之前的轨迹点,将剩余的GPS轨迹点转化为线L2,然后计算第2个信令轨迹点CSD2到L2的映射点directPoint2。
(5)重复上述步骤,直至计算完所有信令轨迹点的直接映射点,得到直接映射点集DirectPointSet:[(lng1,lat1,time1),(lng2,lat2,time2)…(lngn,latn,timen)]。
优选地,所述步骤(d)中,计算时空分段映射点集的具体过程包括以下(1)-(4):
(1)输入某上车刷卡时段内的信令轨迹和车辆GPS轨迹,并对输入的信令轨迹和GPS轨迹按时间大小排序Ti=[t1,t2,…,tn],其中n为输入的信令轨迹点的数量。
(2)将输入的信令轨迹和GPS轨迹中的经纬度坐标转换为直角坐标。
(3)假设从第i个信令轨迹点CSDi开始计算,首先获取CSDi的记录开始时间starttimei和结束时间endtimei,然后,通过时段[starttimei,endtimei]筛选对应时段内的GPS轨迹,并将GPS轨迹转化为线Li。
(4)计算信令轨迹点CSDi与对应线Li之间的时空映射点,得到时空分段映射点集SegmentPointSet:[(lng1,lat1,time1),(lng2,lat2,time2)…(lngn,latn,timen)]。
优选地,所述步骤(e)中,根据映射点集间的位置偏移程度确定下车映射点的具体过程包括以下(1)-(5):
(1)计算映射点集SegmentPointSet与DirectPointSet中轨迹点直接的距离,得到距离矩阵DistanceArray:[d1,d2,…dn],其中n为轨迹点数量。
(2)判断距离矩阵中的距离值dn与距离阈值Dmax之间的大小关系。
(3)若dn<Dmax,则说明在第n个点时乘客在车上,反之,则表明乘客已不在车上。
(4)找出最后一个距离值小于距离阈值Dmax的直接映射点,该点即为下车对应的映射点。
(5)对用户当天的所有刷卡记录都按照上述步骤计算下车映射点,可以得到用户该天的下车映射点集合AlightingMappingPointSet:
{point1[lng1,lat1,time1],point2[lng2,lat2,time2],…,pointn[lngn,latn,timen]}
优选地,所述步骤(f)中,基于就近原则推断得到刷卡用户的下车站点的具体过程包括以下(1)-(5):
(1)输入某刷卡用户某天的刷卡数据,主要字段包括线路名、线路方向、上车站点。
(2)输入公交线路站点信息数据,主要字段包括线路名,线路方向,线路途经站点,站点经纬度。
(3)根据线路名和线路方向,筛选刷卡用户上车之后的候选下车站点集合CandidateAlightingStops:
{station1[lng1,lat1],station2[lng2,lat2],…,stationn[lngn,latn]}
(4)计算该刷卡用户当前下车映射点pointi与候选下车站点集合CandidateAlightingStops中各站点之间的距离di:[di-1,di-2,…di-n]。
(5)取距离di中最小值di-min所对应的站点作为刷卡用户的下车站点,下车时间为下车映射点所对应的时间。
下面以具体的应用场景为例,详细说明本发明的实施过程:
如图1所示,本发明提供一种基于手机信令数据的公交乘客下车站点推断方法。通过以下步骤实现:
步骤S1:获取手机信令数据、公交刷卡数据、公交GPS数据以及公交线路站点信息数据。
本实施例中,所使用的手机信令数据是通过自主研发的数据采集APP获取,其主要字段格式如表1。所使用的公交GPS数据、公交刷卡数据以及公交线路站点信息数据均由某市交通局提供,公交GPS数据主要字段格式如表2,公交刷卡数据主要字段格式如表3,公交线路站点信息数据主要字段格式如表4。
表1手机信令数据主要字段及其数据示意表
表1中,isdn代表每个手机用户的唯一识别号,base_lng和base_lat分别表示手机用户当前所连接的基站的经度和纬度,Time表示手机与基站发生信令交换时的时间戳。
表2公交GPS数据主要字段及其数据示意表
字段名 | 字段释义 | 数据记录 |
BUSRDID | 唯一号 | 86379162396 |
ROUTEID | 线路编号 | 6009 |
PRODUCTID | 车载机编号 | 61009735 |
ACTDATETIME | 记录时间 | 2021/05/25 00:00:01 |
LONGITUDE | 经度 | 112.874673 |
LATITUDE | 纬度 | 23.173756 |
表2中,线路编号唯一对应线路名,车载机编号唯一对应车牌号。经纬度为公交车辆运行过程中记录的GPS经纬度。
表3公交刷卡数据主要字段及其数据示意表
字段名 | 字段释义 | 数据记录 |
CARDID | 刷卡编号 | 5100001191585450 |
LineCode | 线路编号 | 9205 |
BusCode | 车辆编号 | 32992 |
TxnDateTime | 交易时间 | 2020-11-01 00:00:02 |
LatitudeCode | 纬度编号 | 8BE66001 |
LongitudeCode | 经度编号 | 057BBF06 |
表3中,线路编号唯一对应线路名,并与GPS中线路名对应;车辆编号唯一对应车牌号,并与GPS中车牌号对应;交易时间为乘客刷卡上车时间;经纬度编号为用户刷卡时上车定位对应的GPS经纬度。
表4公交线路站点信息数据主要字段及其数据示意表
步骤S2:对步骤S1中获取的手机信令数据、公交GPS数据、公交刷卡数据进行数据预处理。
手机信令数据预处理具体包括步骤S2-1-1至步骤S2-1-5。
步骤S2-1-1:数据缺失处理:如果某一条记录中某个字段的内容缺失,删除整条记录。
步骤S2-1-2:数据去重:如果某几条记录的字段内容完全一致,仅保留一条记录。
步骤S2-1-3:合并同位置点数据:将手机信令数据按时间记录排序,如果相邻记录的基站经纬度一致,则合并这几条数据记录,仅保留一条,同时新增字段记录在该基站的记录开始时间和结束时间,以及记录数。
步骤S2-1-4:漂移数据处理:计算相邻记录之间的距离和速度,剔除速度大于120km/h的数据记录。
步骤S2-1-5:乒乓切换数据处理:根据乒乓数据来回切换的特点,当相邻三条记录出现了来回切换的现象就标记为乒乓切换数据,即第i条记录的基站经纬度与第i+2条记录的基站经纬度一致,与第i+1条不一致时,认为第i至i+2条记录均为乒乓切换数据。在识别出所有的乒乓切换数据后,对连续的乒乓记录的经纬度取均值,重新计算记录开始时间和结束时间,得到新纪录后,插入原来的乒乓切换记录处,并删除原有乒乓切换记录。
公交GPS数据预处理具体包括步骤S2-2-1至S2-2-4。
步骤S2-2-1:删除缺失数据:同步骤S2-1-1。
步骤S2-2-2:合并同位置点数据:同步骤S2-1-3。
步骤S2-2-3:剔除漂移数据:同步骤S2-1-4。
步骤S2-2-4:线路名、车牌号匹配:利用线路编号与线路名的对应关系以及车载机编号与车牌号的对应关系来还原出公交GPS数据真实的线路名和车牌号。
公交刷卡数据预处理具体包括步骤S2-3-1至S2-3-5。
步骤S2-3-1:删除缺失数据:同步骤S2-1-1。
步骤S2-3-2:线路、车牌匹配:利用线路编号与线路名对应关系,以及车牌号解析规则还原出公交刷卡数据真实的线路名和车牌号。
步骤S2-3-3:代刷数据处理:在45s内重复刷卡的数据,仅保留第一次的刷卡记录。
步骤S2-3-4:经纬度解析:根据解析规则,对公交刷卡字段中的经纬度编号进行解析,还原出真实的经纬度坐标。
步骤S2-3-5:上车站点匹配:根据上车刷卡时的经纬度以及公交线路站点信息表,首先基于线路名对刷卡记录和公交线路站点信息数据进行匹配,然后计算刷卡经纬度与线路上站点之间的距离,取距离最小值对应的站点作为乘客刷卡上车站点,对应的线路方向为乘客所乘坐方向。
通过步骤S2后,就得到了清洗后的信令用户出行时空轨迹、已识别上车站点的刷卡用户记录以及清洗后的公交GPS轨迹,将处理后的数据输入步骤S3。
步骤S3:基于输入的数据,构建信令用户与刷卡用户的对应关系集,具体包括步骤S3-1至步骤S3-4。
步骤S3-1:对输入的所有手机信令数据进行去重,得到所有信令轨迹点的唯一位置,构建对应的基站信息表Base_info_table,表中字段包括基站编号BaseID和经纬度BaseLng、BaseLat。
步骤S3-2:对输入的公交站点信息数据进行去重,提取出所有的站点信息,结合S3-1所构建的基站信息表Base_info_table,基于站点与基站之间的距离关系,构建站点与基站的映射关系表Station_base_table,表中字段包括站点编号StationID和基站标号BaseID。
步骤S3-3:基于时空约束初步筛选刷卡用户对应的候选信令用户。
步骤S3-3-1:输入刷卡数据,根据建立的Station_base_table,将其与刷卡数据匹配,得到上车站点对应的基站编号。
步骤S3-3-2:基于基站编号,将公交刷卡数据与手机信令数据按同一小时进行匹配,得到刷卡用户可能对应的信令用户。
步骤S3-3-3:将匹配了信令用户的刷卡数据基于刷卡用户编号和时间分组,进一步按刷卡时间前后T1=5分钟细粒度地筛选满足条件的信令用户,从而得到初始的刷卡用户与信令用户的对应表。
步骤S3-3-4:根据刷卡用户分组,取信令用户出现次数排名前N=5的用户作为刷卡用户的候选匹配用户集,从而得到初步的刷卡用户与信令用户对应关系集(1个刷卡用户对应5个候选信令用户)。
步骤S3-4:基于轨迹时空相似度确定刷卡用户与信令用户的唯一匹配。
步骤S3-4-1:筛选出刷卡用户乘坐车辆从用户上车时间后至终点站的GPS轨迹。
步骤S3-4-2:基于刷卡时间,筛选出一定时间范围T内的候选信令用户的信令轨迹;T的取值如下:
T=[boardingTime,ArriveFinalStationTime+t]
其中,boardingTime为刷卡上车时间,ArriveFinalStationTime为车辆到达终点站的时间,t取值10分钟。
步骤S3-4-3:基于基站覆盖范围的大小构建信令轨迹点的缓冲区。首先,基于维诺图生成所有信令基站的基站小区,然后找出基站小区的外接矩形,如图2所示,图2中红色框代表基站小区的外接矩形,假设矩形的长边距离为X,将外接矩形向外扩张X的大小,形成该基站的缓冲区范围,如图2中蓝色框所示。
步骤S3-4-4:计算信令轨迹与GPS轨迹的时空相似度。计算公式如下:
similarityCsD-GPS=sim/NCSD
其中,NCSD表示信令轨迹点的总数;sim表示GPS轨迹与信令轨迹的相似性。sim的计算方式为:判断①GPS轨迹点是否在信令轨迹点的时间范围内,②GPS轨迹点是否在信令轨迹点的覆盖范围内,同时满足上述①②两个条件,则说明该信令轨迹点与GPS轨迹点相似,相似性sim加1,逐个判断信令轨迹中所有轨迹点与GPS轨迹点的时空关系,得到总相似性sim。
基于步骤S3-4-4所述的相似度计算方法,结合步骤S3-3-4得到的刷卡用户对应的候选信令用户集,计算每个信令用户与刷卡用户的轨迹时空相似度。由于一个刷卡用户在一天内会有多次乘车记录,因此一个刷卡用户会计算得到一张二维的相似度矩阵表。在计算得到相似度矩阵表后,对同一信令用户(ISDN)在不同刷卡时间(CardTime)下的相似度取均值,得到最终的相似度值,取相似度最大值对应的信令用户作为刷卡用户(CardID)的唯一匹配。
通过步骤S3,可以得到刷卡用户与信令用户的唯一对应关系表。
步骤S4:对预处理后的手机信令数据和公交GPS数据进行分段(分组),以便后续计算映射点集。
信令轨迹分段:基于一天内用户的多次上车刷卡时间,利用相邻刷卡时间形成时段[boardingTimei,boardingTimei+1],将手机信令数据划分为若干段,得到若干个信令轨迹点集合。
GPS数据分组:将刷卡用户一天内所乘坐车辆的GPS轨迹按刷卡用户和上车刷卡时间进行分组,得到刷卡用户不同刷卡时段的车辆GPS轨迹。
步骤S5:计算对应刷卡时段内信令轨迹与GPS轨迹之间的直接映射点集。
图3为某刷卡时段对应的信令轨迹和GPS轨迹的情况,其中,共有5个信令轨迹点,9个GPS轨迹点。
将这5个信令轨迹点直接映射至GPS轨迹,映射结果如图4所示。
图4所示的例子的主要计算步骤如下:
①计算CSD1至GPS轨迹所形成的线LA-I之间的最短距离映射点,得到CSD1所对应的映射点A;
②去掉GPS轨迹中A点之前的轨迹点,计算CSD2至GPS轨迹所形成的线LB-I之间的最短距离映射点,得到CSD2所对应的映射点B;
③去掉GPS轨迹中B点之前的轨迹点,计算CSD3至GPS轨迹所形成的线LC-I之间的最短距离映射点,得到CSD3所对应的映射点E;
④去掉GPS轨迹中E点之前的轨迹点,计算CSD4至GPS轨迹所形成的线LF-I之间的最短距离映射点,得到CSD4所对应的映射点F;
⑤去掉GPS轨迹中F点之前的轨迹点,计算CSD5至GPS轨迹所形成的线LG-I之间的最短距离映射点,得到CSD5所对应的映射点G;
⑥最后得到直接映射点集DirectPointSet:{A,B,E,F,G}。
步骤S6:计算对应刷卡时段内信令轨迹与GPS轨迹之间的时空分段映射点集。
假设同样是上述某刷卡时段的信令轨迹和GPS轨迹,若除了考虑空间距离进行映射,也同时考虑信令轨迹点和GPS轨迹点的记录时间来计算信令轨迹点在GPS上的映射点,即为时空分段映射点,结果如图5所示。
图5示例子的主要计算步骤如下:
①根据CSD1和CSD2的记录时间,得到CSD1的记录时段TimePeroid1:[14:01,14:07],筛选TimePeroid1时段内的GPS轨迹,得到CSD1对应的GPS轨迹GPS1:[A,B,C,D];
②计算CSD1至GPS1:[A,B,C,D]所形成的的线LA-D之间的最短距离所对应的点,得到CSD1的时空分段映射点为A;
③同理,可以计算得到CSD2对应的GPS轨迹GPS2:[D,E],因此,其对应的时空分段映射点为D;
④同理,可以计算得到CSD3对应的GPS轨迹GPS3:[F,G],因此,其对应的时空分段映射点为F;
⑤同理,可以计算得到CSD4对应的GPS轨迹GPS4:[G,H,I],因此,其对应的时空分段映射点为G;
⑥CSD5对应的时空分段映射点为I;
⑦最后,得到时空分段映射点集SegmentPointSet:{A,D,F,G,I}。
通过步骤S5和S6,可以得到刷卡用户的信令轨迹与GPS轨迹之间的直接映射点集DirectPointSet:{A,B,E,F,G}与时空分段映射点集SegmentPointSet:{A,D,F,G,I}。
步骤S7:根据直接映射点集DirectPointSet:{A,B,E,F,G}与时空分段映射点集SegmentPointSet:{A,D,F,G,I}之间的位置偏移程度确定下车映射点,具体步骤包括S7-1至S7-4。
步骤S7-1:计算DirectPointSet:{A,B,E,F,G}与SegmentPointSet:{A,D,F,G,I}中的映射点之间的距离,得到距离矩阵DistanceArray:[dA-A,dB-D,dE-F,dF-G,dG-I];
步骤S7-2:判断DistanceArray:[dA-A,dB-D,dE-F,dF-G,dG-I]中每个距离值与距离阈值Dmax=100m之间的大小关系;
步骤S7-3:若距离值小于Dmax=100m,则说明乘客在车上,赋值为true;反之,则表明乘客已不在车上,赋值为false。得到关系矩阵RelationArray:[trueA-A,fasleB-D,trueE-F,trueF-G,fasleG-I];
步骤S7-4:由于手机信令数据的不稳定性,因此可能会在乘客公交出行途中产生较大偏移,因此应找出最后一次距离值小于Dmax的直接映射点,来作为乘客的下车映射点。在本实施例中,下车映射点为F[lngF,latF,timeF]。
步骤S8:在得到刷卡用户当前记录所对应的下车映射点F[lngF,latF,timeF]后,基于就近原则推断得到刷卡用户的下车站点,具体步骤包括S8-1至S8-3。
步骤S8-1:基于线路名和线路方向,将刷卡用户当前刷卡记录与公交线路站点信息数据进行匹配,筛选出用户上车后当前线路方向上直至终点站的所有站点,得到候选下车站点集合CandidateAlightingStops:
{station1[lng1,lat1],station2[lng2,lat2],…,stationn[lngn,latn]}
步骤S8-2:计算下车映射点F[lngF,latF,timeF]与候选下车站点集合CandidateAlightingStops中各站点之间的距离,得到距离矩阵值dF:[dF-1,dF-2,…dF-n]。
步骤S8-3:取距离dF中最小值dF-min所对应的站点作为刷卡用户的下车站点stationmin,下车时间为下车映射点所对应的时间timeF
为验证本发明所提出方法的可行性与准确率,本实施例以一次公交出行实验为例,共采集了10名志愿者在2021年05月25日的公交出行记录,包括出行过程中采集的手机信令数据、实验后某交通局提供的实验当天的公交刷卡数据以及公交GPS数据。实验中,共计79条公交刷卡记录,利用本发明所提出的方法可以识别出77条记录的下车站点,方法识别率可以达到97.47%。下车站点推断准确率结果如下表5。
表5下车站点推断结果
误差 | 准确率 |
无误差 | 57.14% |
误差1站 | 88.31% |
误差2站 | 90.91% |
误差3站 | 90.91% |
综上所述,相较于现有技术,本发明具有以下优点:
本发明提出了一种基于手机信令数据的公交乘客下车站点推断方法。该方法创新性地提出了信令用户与刷卡用户的匹配方法,为手机信令数据应用至公交研究中奠定了基础。之后在推断刷卡用户的下车站点时,综合考虑了信令数据的强伴随性特征和GPS轨迹的高精度特征,通过判断二者之间的映射关系来判断乘客是否已经下车,为“一票制”公交刷卡制度下推断乘客下车站点提供了新的解决思路,对公交线网优化具有重要意义。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.基于手机信令数据的公交乘客下车站点预测方法,其特征在于,包括:
获取目标数据集,所述目标数据集包括手机信令用户的时空信令轨迹和公交刷卡用户所乘车辆的GPS轨迹;
根据所述目标数据集,构建所述手机信令用户与所述公交刷卡用户之间的对应关系;
根据所述目标数据集,对所述公交刷卡用户的相邻上车时间进行时段划分,确定信令轨迹和GPS轨迹;
计算所述信令轨迹对应的直接映射点集和所述GPS轨迹对应的时空分段映射点集;
根据所述直接映射点集和所述时空分段映射点集之间的位置偏移程度,确定下车映射点;
根据所述下车映射点的时空信息,结合公交路线的站点信息,预测刷卡用户的下车站点。
2.根据权利要求1所述的基于手机信令数据的公交乘客下车站点预测方法,其特征在于,所述获取目标数据集,包括:
获取原始数据集,所述原始数据集包括手机信令数据、公交刷卡数据、公交GPS数据以及公交线路站点信息;
对所述原始数据集进行数据预处理,得到手机信令用户的时空信令轨迹和公交刷卡用户所乘车辆的GPS轨迹,构建得到所述目标数据集。
3.根据权利要求2所述的基于手机信令数据的公交乘客下车站点预测方法,其特征在于,所述根据所述目标数据集,构建所述手机信令用户与所述公交刷卡用户之间的对应关系,包括:
对所有手机信令数据进行去重处理,得到所有信令轨迹点的唯一位置,进而构建基站信息表;其中,所述基站信息表包括基站编号信息和经纬度信息;
对所有公交线路站点信息进行去重处理,得到所有站点信息;
根据所述基站信息表和所述站点信息,构建站点与基站之间的映射关系表;其中,所述映射关系表包括站点编号信息和基站标号信息;
根据时空约束从所述公交刷卡用户中筛选候选信令用户;
根据时空相似度,确定所述候选信令用户中公交刷卡用户与对应的手机信令用户之间的匹配对应关系。
4.根据权利要求3所述的基于手机信令数据的公交乘客下车站点预测方法,其特征在于,所述根据时空约束从所述公交刷卡用户中筛选候选信令用户,包括:
根据所述映射关系表和所述公交刷卡数据,匹配得到上车站点对应的基站编号;
根据所述基站编号,将所述公交刷卡数据与所述手机信令数据按预设的时间匹配规则进行匹配,得到刷卡用户可能对应的信令用户;
按照刷卡用户编号和刷卡时间,将匹配了信令用户的公交刷卡数据进行分组,确定公交刷卡用户与手机信令用户之间的第一对应表以及候选匹配用户集;
根据所述第一对应表和所述候选匹配用户集,确定公交刷卡用户与手机信令用户之间的第一对应关系集;其中,所述第一对应关系集包含每个公交刷卡用户对应的多个候选信令用户。
5.根据权利要求3所述的基于手机信令数据的公交乘客下车站点预测方法,其特征在于,所述根据时空相似度,确定所述候选信令用户中公交刷卡用户与对应的手机信令用户之间的匹配对应关系,包括:
构建所述公交刷卡用户从上车点到公交终点站之间的GPS轨迹;
根据刷卡时间,查找在预设的时间范围内,所述候选信令用户的信令轨迹;
根据基站的覆盖范围大小,构建信令轨迹点的缓冲区;
计算每个所述候选信令用户的所述信令轨迹与对应的公交刷卡用户的所述GPS轨迹之间的时空相似度;
根据计算得到的所有所述时空相似度,计算每个所述候选信令用户在不同刷卡时间下的相似度均值;
将相似度均值最大的候选信令用户确定为对应的公交刷卡用户的唯一匹配对象。
6.根据权利要求1所述的基于手机信令数据的公交乘客下车站点预测方法,其特征在于,所述计算所述信令轨迹对应的直接映射点集,包括:
获取一个公交刷卡时段内的信令轨迹和GPS轨迹,并按照时间顺序对所述信令轨迹和所述GPS轨迹进行排序,确定信令轨迹点和GPS轨迹点;
将所述信令轨迹和所述GPS轨迹中的经纬度坐标转换为直角坐标;
根据所述信令轨迹,计算每个所述信令轨迹点在所述信令轨迹中对应的直接映射点,构建得到直接映射点集。
7.根据权利要求1所述的基于手机信令数据的公交乘客下车站点预测方法,其特征在于,所述计算所述GPS轨迹对应的时空分段映射点集,包括:
获取一个公交刷卡时段内的信令轨迹和GPS轨迹,并按照时间顺序对所述信令轨迹和所述GPS轨迹进行排序,确定信令轨迹点和GPS轨迹点;
将所述信令轨迹和所述GPS轨迹中的经纬度坐标转换为直角坐标;
根据所述GPS轨迹,计算每个所述信令轨迹点在所述GPS轨迹中对应的时空映射点,构建得到时空分段映射点集。
8.根据权利要求1所述的基于手机信令数据的公交乘客下车站点预测方法,其特征在于,所述根据所述直接映射点集和所述时空分段映射点集之间的位置偏移程度,确定下车映射点,包括:
计算所述直接映射点集和所述时空分段映射点集中轨迹点之间的直接距离,构建距离矩阵;
判断所述距离矩阵中各个距离值与距离阈值之间的大小关系,当所述距离值小于所述距离阈值时,判定在对应的轨迹点时用户在车上;反之,则判定在所述对应的轨迹点时用户不在车上;
查找最后一个所述距离值小于所述距离阈值时对应的直接映射点,将所述直接映射点确定为用户下车时对应的映射点;
获取用户所有下车时的映射点,确定所述用户的下车映射点集合。
9.根据权利要求1所述的基于手机信令数据的公交乘客下车站点预测方法,其特征在于,所述根据所述下车映射点的时空信息,结合公交路线的站点信息,预测刷卡用户的下车站点,包括:
获取待预测用户的待预测刷卡数据,所述待预测刷卡数据包括线路名、线路方向和上车站点;
获取公交线路站点信息,所述公交线路站点信息包括线路名、线路方向、线路途经站点和站点经纬度;
根据所述待预测刷卡数据,筛选所述待预测用户的候选下车站点集合;
计算所述待预测用户在当前下车映射点与候选下车站点集合中各个站点之间的距离;
将距离最小时对应的站点作为所述待预测用户的下车站点,并将所述下车站点对应的下车映射点的时间作为所述待预测用户的下车时间。
10.基于手机信令数据的公交乘客下车站点预测装置,其特征在于,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如权利要求1至9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111678626.4A CN114363842B (zh) | 2021-12-31 | 2021-12-31 | 基于手机信令数据的公交乘客下车站点预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111678626.4A CN114363842B (zh) | 2021-12-31 | 2021-12-31 | 基于手机信令数据的公交乘客下车站点预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114363842A true CN114363842A (zh) | 2022-04-15 |
CN114363842B CN114363842B (zh) | 2023-04-28 |
Family
ID=81105463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111678626.4A Active CN114363842B (zh) | 2021-12-31 | 2021-12-31 | 基于手机信令数据的公交乘客下车站点预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114363842B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115877343A (zh) * | 2023-02-02 | 2023-03-31 | 中电信数字城市科技有限公司 | 基于雷达目标跟踪的人车匹配方法、装置和电子设备 |
CN116579667A (zh) * | 2023-07-11 | 2023-08-11 | 北京大也智慧数据科技服务有限公司 | 公交站点的辐射人群的分析方法、装置、存储介质及设备 |
CN117035232A (zh) * | 2023-08-08 | 2023-11-10 | 广东家祥智能科技有限公司 | 一种基于大数据平台的智慧城市数据处理方法及系统 |
CN117275274A (zh) * | 2023-11-20 | 2023-12-22 | 河北省交通规划设计研究院有限公司 | 一种常规公交出行信息识别方法、设备和介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104298236A (zh) * | 2014-04-15 | 2015-01-21 | 明日交通公司 | 智能公交系统的行程规划和管理方法 |
CN108389420A (zh) * | 2018-03-13 | 2018-08-10 | 重庆邮电大学 | 一种基于历史出行特征的公交乘客下车站点实时识别方法 |
CN109308546A (zh) * | 2018-08-31 | 2019-02-05 | 江苏智通交通科技有限公司 | 乘客公交出行下车站点预测方法及系统 |
CN110021169A (zh) * | 2019-05-06 | 2019-07-16 | 南京航空航天大学 | 一种基于手机信令数据和公交数据的公交乘客下车站点推测方法 |
CN111985710A (zh) * | 2020-08-18 | 2020-11-24 | 深圳诺地思维数字科技有限公司 | 一种公交乘客出行站点预测方法、存储介质及服务器 |
CN112530166A (zh) * | 2020-12-01 | 2021-03-19 | 江苏欣网视讯软件技术有限公司 | 基于信令数据与大数据分析识别公交出行上下车站点的方法与系统 |
WO2021070490A1 (ja) * | 2019-10-10 | 2021-04-15 | 株式会社日立製作所 | 乗降判定装置、乗降判定方法及び乗降判定プログラム |
-
2021
- 2021-12-31 CN CN202111678626.4A patent/CN114363842B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104298236A (zh) * | 2014-04-15 | 2015-01-21 | 明日交通公司 | 智能公交系统的行程规划和管理方法 |
CN108389420A (zh) * | 2018-03-13 | 2018-08-10 | 重庆邮电大学 | 一种基于历史出行特征的公交乘客下车站点实时识别方法 |
CN109308546A (zh) * | 2018-08-31 | 2019-02-05 | 江苏智通交通科技有限公司 | 乘客公交出行下车站点预测方法及系统 |
CN110021169A (zh) * | 2019-05-06 | 2019-07-16 | 南京航空航天大学 | 一种基于手机信令数据和公交数据的公交乘客下车站点推测方法 |
WO2021070490A1 (ja) * | 2019-10-10 | 2021-04-15 | 株式会社日立製作所 | 乗降判定装置、乗降判定方法及び乗降判定プログラム |
CN111985710A (zh) * | 2020-08-18 | 2020-11-24 | 深圳诺地思维数字科技有限公司 | 一种公交乘客出行站点预测方法、存储介质及服务器 |
CN112530166A (zh) * | 2020-12-01 | 2021-03-19 | 江苏欣网视讯软件技术有限公司 | 基于信令数据与大数据分析识别公交出行上下车站点的方法与系统 |
Non-Patent Citations (2)
Title |
---|
徐文远等: "基于公交IC卡数据的公交客流统计方法", 《中国公路学报》 * |
柳伍生等: "基于IC卡数据的公交下车站点区间不确定性客流推导方法", 《铁道科学与工程学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115877343A (zh) * | 2023-02-02 | 2023-03-31 | 中电信数字城市科技有限公司 | 基于雷达目标跟踪的人车匹配方法、装置和电子设备 |
CN116579667A (zh) * | 2023-07-11 | 2023-08-11 | 北京大也智慧数据科技服务有限公司 | 公交站点的辐射人群的分析方法、装置、存储介质及设备 |
CN117035232A (zh) * | 2023-08-08 | 2023-11-10 | 广东家祥智能科技有限公司 | 一种基于大数据平台的智慧城市数据处理方法及系统 |
CN117275274A (zh) * | 2023-11-20 | 2023-12-22 | 河北省交通规划设计研究院有限公司 | 一种常规公交出行信息识别方法、设备和介质 |
CN117275274B (zh) * | 2023-11-20 | 2024-02-02 | 河北省交通规划设计研究院有限公司 | 一种常规公交出行信息识别方法、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114363842B (zh) | 2023-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114363842A (zh) | 基于手机信令数据的公交乘客下车站点预测方法及装置 | |
CN110111575B (zh) | 一种基于复杂网络理论的城市交通流量网络分析方法 | |
CN112543427B (zh) | 基于信令轨迹及大数据分析识别城市交通走廊的方法与系统 | |
CN108415975B (zh) | 基于bdch-dbscan的出租车载客热点识别方法 | |
CN111681421B (zh) | 基于手机信令数据的对外客运枢纽集疏空间分布分析方法 | |
CN105608505B (zh) | 一种基于手机信令数据的居民轨道交通出行方式识别方法 | |
CN111091720B (zh) | 基于信令数据和浮动车数据的拥堵路段识别方法及装置 | |
CN102521965B (zh) | 基于车牌识别数据的交通需求管理措施效果评价方法 | |
CN111653099B (zh) | 基于手机信令数据的公交客流od获取方法 | |
CN109729518B (zh) | 基于手机信令的城市交通早高峰拥堵源头识别方法 | |
CN111932925A (zh) | 一种公共交通站点的出行客流的确定方法、装置及系统 | |
CN110880238B (zh) | 一种基于手机通信大数据的道路拥堵监测方法 | |
CN108806301A (zh) | 一种公交车辆信息的自动识别方法 | |
CN112036757A (zh) | 基于手机信令和浮动车数据的停车换乘停车场的选址方法 | |
CN114416710B (zh) | 一种快速路车辆od位置提取方法及系统 | |
CN110460962B (zh) | 轨道交通用户识别方法和装置 | |
CN110598999A (zh) | 基于个体数据的交通出行分析方法、系统及存储介质 | |
CN114390458A (zh) | 一种应用手机信令数据辨识个体地铁乘候车行为的方法 | |
CN115714957A (zh) | 基于手机信令的地铁出行识别方法、装置、设备及介质 | |
CN108242146B (zh) | 基于公交卡数据分析乘客乘车站点及时间的方法和系统 | |
CN112733112B (zh) | 一种用户出行方式的确定方法、装置、电子设备和存储介质 | |
CN116933958B (zh) | 一种基于刷卡数据的地铁换乘站换乘客流估计方法 | |
CN113079463A (zh) | 一种基于手机信令数据的旅游景点游客出行活动识别方法 | |
CN116137109B (zh) | 一种基于云计算的机械停车设备控制系统及方法 | |
CN115662124A (zh) | 一种基于网络编码的gps轨迹数据路段流量匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |