CN113766428A - 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 - Google Patents
城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 Download PDFInfo
- Publication number
- CN113766428A CN113766428A CN202010487422.1A CN202010487422A CN113766428A CN 113766428 A CN113766428 A CN 113766428A CN 202010487422 A CN202010487422 A CN 202010487422A CN 113766428 A CN113766428 A CN 113766428A
- Authority
- CN
- China
- Prior art keywords
- travel
- passenger
- individual
- time
- trip
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012545 processing Methods 0.000 claims abstract description 26
- 239000012634 fragment Substances 0.000 claims abstract description 22
- 238000012546 transfer Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 13
- 238000010586 diagram Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Train Traffic Observation, Control, And Security (AREA)
Abstract
本申请涉及一种城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质。包括:构建地铁网络图,根据所述地铁网络图获取每一位乘客的至少一条有效路径;获取乘客的位置数据,根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段;按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类,并根据所述聚类结果提取乘客的至少一个个体出行模式;基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理,并根据所述补全后的个体出行片段提取乘客的完整出行轨迹。本申请实施例能够获取到覆盖面更广、数量更大的样本,为乘客出行轨迹分析提供了较为完整的数据基础,对全网客流量的分析具有非常重要的意义。
Description
技术领域
本申请属于公共交通技术领域,特别涉及一种城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质。
背景技术
由于地铁具有准时性、速度快、稳定性高等特点,目前已经成为了城市市民出行的首选交通方式。获取地铁乘客的出行路径对全网客流量的分析具有非常重要的意义。传统的地铁乘客出行路径获取方法主要包括:
(1)通过调查问卷等人工的方式获得部分样本数据;例如在某些地铁站发放调查问卷,问卷内容包括乘客出行的起点和终点(简称OD)、步行花费时间、所选择的出行路径等。该方法的缺点在于:需要大量的人进行实地采样以及考察,人力成本较高,并且难以保证抽样的随机性、数据质量和覆盖范围。
(2)基于AFC(Automatic Fare Collection System,城市轨道交通自动售检票系统)采集到的进出站数据;假设乘客总的出行时间服从某提前指定的概率分布的前提下,基于AFC数据采集到的出行花费时间构建概率模型推算乘客所选择的出行路径。该方法的缺点在于:由于AFC系统只能采集到进出站数据,所以基于此数据对于进出站之间的多条路径所花费时间相差不大的情况,很难仅通过进出站信息对乘客所选择的路径做出精确判断,并且给定某路径,其所花费的时间在复杂情况下(拥挤,滞留)很难给出精确估算。
目前,随着某些城市的地铁站内AP(access point,无线接入点)设备的全面部署,可以通过用户携带的移动手机采集到乘客在出行过程经过的部分位置信息,这为乘客出行轨迹的估计提供了新的思路。相比AFC数据,AP设备采集的数据覆盖面更广,但是由于受用户设备状态(wifi功能是否开启)、AP设备覆盖范围、网络状态等因素的影响,导致采集到的位置数据存在稀疏不连续、乘客出行路径的关键点(例如出行中的进出站和换乘站)出现缺失等情况,从而无法完整的估计乘客出行轨迹。
发明内容
本申请提供了一种城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质,旨在解决现有技术中由于AP设备采集到的位置数据稀疏不连续以及乘客出行路径的关键点缺失,导致无法完整的估计乘客出行轨迹的技术问题。
为了解决上述问题,本申请提供了如下技术方案:
一种城市公共交通乘客出行轨迹估计方法,包括以下步骤:
步骤a:构建地铁网络图,根据所述地铁网络图获取每一位乘客的至少一条有效路径;所述有效路径包括所通过的线路、站点、路径长度或/和花费时间;
步骤b:获取乘客的位置数据,根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段;所述每一个个体出行片段分别包括一次出行所途径的所有轨迹点,并且满足时间花费预设条件和有效路径预设条件;
步骤c:按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类,并根据所述聚类结果提取乘客的至少一个个体出行模式;所述个体出行模式包括{so,sd,t1,t2,r}信息,表示在一天的某固定时间段[t1,t2],乘客超过设定阈值的出行是从出发站点so前往另一个目的站点sd,并选择有效路径r;
步骤d:基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理,并根据所述补全后的个体出行片段提取乘客的完整出行轨迹。
本申请实施例采取的技术方案还包括:所述步骤a中,所述构建地铁网络图包括:
用G=(V,E)标识地铁网络图,其中V是标识地铁站点的非空集合,E为地铁网络图的边集;所述地铁网络图中的每一个节点Vi分别包括地铁物理站点信息Vi.s、所属线路Vi.l和方向Vi.d,如果两个节点之间符合以下两个预设规则中的任意一个,则表示所述地铁网络图存在带权重的有向边ei,j:
第一预设规则:如果两个节点Vi和Vj是同一条物理线路的先后经过的两个相邻站点,其边的权重为列车通过这两个站点所花费的时间;
第二预设规则:如果两个节点所属站点是不同物理线路的同一个物理站点,且所述站点为换乘站点,其边的权重为换乘步行时间与平均等待时间之和。
本申请实施例采取的技术方案还包括:所述步骤a中,所述根据所述地铁网络图获取每一位乘客的至少一条有效路径包括:
给定起始站点si和目的站点sj,基于所述地铁网络图,使用前n条最短路径计算方法得到从属于{vi|vi.s=si}的节点到属于{vj|vj.s=sj}的节点的前k条最短路径作为有效路径;每条有效路径分别包括开始节点、途径换乘节点集合和终点节点。
本申请实施例采取的技术方案还包括:在所述步骤b中,所述根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段包括:
按照MacID字段对所述位置数据进行分组,得到每一位乘客的个体出行轨迹信息,并按位置数据采集时间的先后对所述个体出行轨迹信息进行排序,得到每一位乘客的轨迹点序列;
根据所述花费时间和所述有效路径将每一位乘客的轨迹点序列划分为多个个体出行片段。
本申请实施例采取的技术方案还包括:在所述步骤b中,
所述时间花费预设条件为:
在每一个个体出行片段中,任意两个相邻轨迹点之间的时间差不能大于两站之间的最大时间;
所述有效路径预设条件为:
所述每一个个体出行片段中的所有轨迹点都属于从起始站点到目的站点之间的有效路径途径站点。
本申请实施例采取的技术方案还包括:在所述步骤c中,所述按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类具体为:采用基于核密度估计的聚类算法对所述轨迹点进行聚类;所述基于核密度估计的聚类算法包括:
选定计算核密度的带宽h;
根据核密度公式f计算每个点的局部密度ρ:
代入高斯核函数后计算出每个点xi的局部密度ρi:
将局部密度ρ和相对距离δ的二维空间分布图作为决策图,选取具有较大ρ和δ的数据点作为类簇中心;
计算各个个体出行片段的中位时间,根据所述个体出行片段的中位时间与所述类簇中心的距离对所述个体出行片段进行归类。
本申请实施例采取的技术方案还包括:在所述步骤c中,所述根据所述聚类结果提取乘客的至少一个个体出行模式包括:
统计所述多个出行片段中第一轨迹点和最后一个轨迹点对应站点的被检测总次数和持续时间,并按照被检测总次数和持续时间分别选择前N/2个站点作为可能的起始站点和目的站点;
对于所述N个站点中的任意两个站点,提取其有效路径,如果存在覆盖所述个体出行片段的比例大于设定阈值λ的有效路径,则将该有效路径作为对应出行模式的有效路径r,并将所述两个站点作为起始站点so和目的站点sd,将覆盖到的所述个体出行片段中起始站点so出现的最早时间和目的站点sd被检测到的最晚时间作为固定时间段[t1,t2]。
本申请实施例采取的技术方案还包括:在所述步骤d中,所述基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理包括:
顺序读取所述多个个体出行片段中的连续两个出行片段,如果前一个出行片段的最后一个点与后一个出行片段的第一个点之间的间隔时间差小于设定时间阈值,且将所述前一个出行片段的最后一个点插入到所述后一个出行片段的第一个点之前后,所述后一个出行片段仍然满足所述时间花费预设条件和有效路径预设条件,则执行所述将前一个出行片段的最后一个点插入到所述后一个出行片段的第一个点之前的操作;以及如果将所述后一个出行片段的第一个点插入到所述前一个出行片段的最后一个点之后,所述前一个出行片段仍然满足所述时间花费预设条件和有效路径预设条件,则执行所述将所述后一个出行片段的第一个点插入到所述前一个出行片段的最后一个点的操作。
本申请实施例采取的技术方案还包括:在所述步骤d中,所述基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理还包括:
针对所述多个出行片段中的每一个出行片段,首先判断是否存在出行模式pi∈P,且乘车过程tr包含在该出行模式中,如果存在,用轨迹模型中对应的OD和路径对所述出行片段进行补全处理;其中所述乘车过程tr包括进站站点tr.so、出站站点tr.sd、进站时间tr.to、出站时间tr.td、路径tr.r。
本申请实施例采取的技术方案还包括:在所述步骤d中,所述根据所述补全后的个体出行片段提取乘客的完整出行轨迹包括:
提取所述补全后的每一个出行片断对应的乘车过程,将所述乘车过程的进站站点和进站时间设置为所述出行片段的第一个点的站点和时间,将所述乘车过程的出站站点和出站时间设置为所述出行片段的最后一个点的站点和时间,将所述乘车过程设置为所述出行片段途径的路径,以获取到乘客的完整出行轨迹。
本申请实施例采取的另一技术方案为:一种城市公共交通乘客出行轨迹估计系统,包括:
路径获取模块:用于构建地铁网络图,根据所述地铁网络图获取每一位乘客的至少一条有效路径;所述有效路径包括所通过的线路、站点、路径长度或/和花费时间;
出行片段划分模块:用于获取乘客的位置数据,根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段;所述每一个个体出行片段分别包括一次出行所途径的所有轨迹点,并且满足时间花费预设条件和有效路径预设条件;
出行模式提取模块:用于按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类,并根据所述聚类结果提取乘客的至少一个个体出行模式;所述个体出行模式包括{so,sd,t1,t2,r}信息,表示在一天的某固定时间段[t1,t2],乘客超过设定阈值的出行是从出发站点so前往另一个目的站点sd,并选择有效路径r;
出行轨迹提取模块:用于基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理,并根据所述补全后的个体出行片段提取乘客的完整出行轨迹。
本申请实施例采取的又一技术方案为:一种终端,所述终端包括处理器、与所述处理器耦接的存储器,其中,
所述存储器存储有用于实现所述城市公共交通乘客出行轨迹估计方法的程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以控制城市公共交通乘客出行轨迹估计。
本申请实施例采取的又一技术方案为:一种存储介质,存储有处理器可运行的程序指令,所述程序指令用于执行所述城市公共交通乘客出行轨迹估计方法。
相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质按照预定规则将AP设备采集的位置数据划分为多个个体出行片段,按照时间属性对每一位乘客的个体出行片段集合中的轨迹点进行聚类,提取每一位乘客的多个个体出行模式,基于乘客的出行模式集合对个体出行片段中的残缺信息进行补全处理,并根据补全后的个体出行片段提取乘客的完整出行轨迹。相比现有技术,本申请实施例能够获取到覆盖面更广、数量更大的样本,为乘客出行轨迹分析提供了较为完整的数据基础,对全网客流量的分析具有非常重要的意义。
附图说明
图1是本申请实施例的城市公共交通乘客出行轨迹估计方法的流程图;
图2为本申请实施例的城市公共交通乘客出行轨迹估计系统结构示意图;
图3为本申请实施例的终端结构示意图;
图4为本申请实施例的存储介质的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
请参阅图1,是本申请实施例的城市公共交通乘客出行轨迹估计方法的流程图。本申请实施例的城市公共交通乘客出行轨迹估计方法包括以下步骤:
步骤100:通过地铁站内的AP设备收集乘客的位置数据;
步骤100中,位置数据的收集方式具体为:通过AP设备定时(例如15秒钟)采集周边的移动设备,收集移动设备对应乘客的多条位置数据,每一条位置数据分别表示乘客的一个时空位置点p={id,s,time},其中id为乘客移动设备的唯一标识,s为地铁站点,time为位置数据的采集时间。
步骤200:对采集的位置数据进行预处理,将每一位乘客的位置数据划分为多个个体出行片段;
步骤200中,数据预处理具体包括以下步骤:
步骤201:根据地铁网络特征构建地铁网络图,并根据地铁网络图获取每一位乘客的前k条有效路径;
其中,地铁网络特征具体为:一个地铁系统由多个物理站点S={s1,s2,…,s|S|}和多条物理线路L={l1,l2,…,l|L|}组成,其中每条物理线路分别包括多个有序的物理站点,并包括上行和下行两个方向,即D={d1,d2},且上行和下行两个方向的物理站点的序列(正序和倒序)相反。物理站点包括普通站点和换乘站点,其中普通站点为只有一条物理线路通过的站点,换乘站点为有至少两条物理线路通过的站点,乘客可以在换乘站点换乘不同的物理线路。乘客从一个物理站点前往另一个物理站点所选择的一条或多条物理线路(包括换乘)即为该乘客的出行轨迹。
基于上述,地铁网络图的构建方式具体为:用G=(V,E)标识地铁网络图,其中V是标识地铁站点的非空集合,E为图的边集。地铁网络图中的每一个节点Vi分别包括地铁物理站点信息Vi.s、所属线路Vi.l和方向Vi.d,如果两个节点之间符合以下两个预设规则中的任意一个,则表示地铁网络图存在带权重的有向边ei,j:
第一预设规则:如果两个节点Vi和Vj是同一条物理线路的先后经过的两个相邻站点,其边的权重为列车通过这两个站点所花费的时间。
第二预设规则:如果两个节点所属站点是不同物理线路的同一个物理站点,且该站点为换乘站站点,其边的权重为换乘步行时间与平均等待时间之和,该权重可以通过实际测量得到。
本申请实施例中,有效路径是指:给定任意两个物理站点so和sd,所述两个站点之间的前k条有效路径表示为R={r1,r2,...,rk},每条有效路径分别包括所通过的线路、站点、路径长度或/和所花费时间。
基于上述,本申请实施例中的有效路径获取方式为:给定起始站点si和目的站点sj,基于地铁网络图,使用前n条最短路径计算方法得到从节点(属于集合{vi|vi.s=si})到节点(属于集合{vj|vj.s=sj})的前k条最短路径作为有效路径,其中每条有效路径分别包括开始节点、途径换乘节点集合和终点节点等关键节点信息。
步骤202:按照MacID字段对AP设备收集到的位置数据进行分组,得到每一位乘客的个体出行轨迹信息,并按数据采集时间的先后对个体出行轨迹信息进行排序,得到每位乘客在一段时间内的轨迹点序列P={p1,p2,…,p|P|};
步骤203:根据花费时间和有效路径将每一位乘客的轨迹点序列划分为多个出行片段,得到每一位乘客的个体出行片段集合SG={sg1,sg2,…,sgn};
本申请实施例中,乘客的一次出行tr是指一次逻辑的乘车过程,即一次从进站到出站的全过程,包括进站站点tr.so、出站站点tr.sd、进站时间tr.to、出站时间tr.td、路径tr.r。而每一个个体出行片段中分别包括一次出行所途径的所有轨迹点,并且满足以下时间花费预设条件和有效路径预设条件:
时间花费预设条件:在每一个个体出行片段G={pi,pi+1,…,pi+m}中,任意两个相邻轨迹点之间的时间差不能大于两站之间的最大时间,即其中是站点si和站点sj之间的最短时间,Δt是可容忍的时间,Δt值可根据实际时间场景进行设置。
有效路径预设条件:给定一个个体出行片段G={pi,pi+1,…,pi+m},其中的所有轨迹点都属于从起始站点si到目的站点sj之间的有效路径途径站点。
基于以上两个预设条件,顺序遍历每一位乘客的轨迹点序列中的每一个轨迹点,将其划分为多个个体出行片段,得到每一位乘客的个体出行片段集合SG={sg1,sg2,…,sgn};乘客可能由于进站、出站和换乘等原因会在某站点的逗留时间较长,导致出行片段中存在多个连续检测到的轨迹点属于同一站点的情况,为了节省空间和统计需求,本申请实施例将这些轨迹点进行合并,只记录进入该站点的开始时间和持续时间。
步骤300:按照一天内所属的时间属性对每一位乘客的个体出行片段集合中的轨迹点进行聚类,并从聚类得到的每类出行片段中提取每一位乘客的多个个体出行模式;
步骤300中,由于公共交通乘客的出行具有时空规律性,即个体乘客在一天的固定时段从一个站点前往另一个站点,且对具有相同起点和终点的出行,个体乘客习惯选择一条熟悉的线路。因此本申请实施例首先基于该时空规律性对个体出行片段中的轨迹点进行聚类,提取乘客出行模式,并基于乘客出行模式对其个体出行片段中残缺信息进行补全,得到乘客的完整出行轨迹。
其中,乘客的每一种个体出行模式p用于描述用户出行的时空规律性,一个个体出行模式p包含{so,sd,t1,t2,r}信息,表示在一天的某固定时间段[t1,t2],乘客超过设定阈值λ的出行是从某出发站点so前往另一个目的站点sd,并选择有效路径r。该阈值λ优选设定为≥50%,例如在100天中,张三有60%的出行是在8:30~9:30之间从大学城到深圳北站,并选择了耗时最短的有效路径。
进一步地,个体出行模式提取主要包括以下步骤:
步骤301:将每一位乘客的个体出行片段集合中的轨迹点按照一天内所属的时间属性进行聚类,并根据各个个体出行片段的中位时间与各聚类类别中心点的距离将其归类;
具体的,由于不同的乘客存在不同的出行规律,无法在聚类开始时确定聚类的类簇数量,因此本申请实施例采用一种能够自动确定类簇数量和类簇中心的新型快速聚类算法:基于核密度估计的聚类算法。该算法不仅适用于大规模数据的聚类分析,而且能够快速的进行离群噪声点的剔除工作。
基于核密度估计聚类算法的个体出行片段聚类具体包括:
1)选定计算核密度的带宽h;
2)根据核密度公式f计算每个点的局部密度ρ;
对于由轨迹中数据点的时间信息构成的数据集X={x1,x2,…xn},其中xi为该数据点时间信息的时分秒部分转化后的秒数,结合地铁的运营时间,例如深圳市地铁的运营时间为早上6:00到晚上12:00,仅保留位于R=[6*60*60,24*60*60]范围内的时间信息,目的是去除部分噪声点的影响。将X视为取值于R的独立分布随机变量,其服从的分布密度函数为f(x),定义函数:
公式(1)中,为密度函数f(x)的核密度估计;为核函数;h为带宽,用于决定核函数作用的局部范围的大小,考虑到不同乘客的出行轨迹的时长不同,需要为每位乘客分别设定合适的h,本申请实施例将各个乘客的个体出行片段集合的平均时长作为其带宽参数,同时,为了避免异常数据的影响,首先将个体出行片段集合中过大和过小的轨迹时长剔除,然后再进行平均时长的计算。
代入高斯核函数后上式变为:
通过公式(2)即可计算出每个点xi的局部密度ρi。
4)将ρ和δ的二维空间分布图作为决策图,选取具有较大ρ和δ的数据点作为类簇中心;
5)确定类簇中心之后,计算各个个体出行片段的中位时间,根据个体出行片段的中位时间与各类簇中心的距离(即时间差)将其归类。
步骤302:根据个体出行片段的聚类结果提取乘客的出行模式集合P={p1,p2,…,p|P|};
其中,通常情况下,乘客在起点、终点以及换乘站点所停留的时间要大于其它途径的站点,其被AP设备检测到的可能性也越大,基于此,本申请实施例通过以下步骤进行出行模式的提取:
(1)首先统计乘客的出行片段集合中第一轨迹点和最后一个轨迹点对应站点的被检测总次数和持续时间,并按照被检测总次数和持续时间分别选择前N/2个站点作为可能的起始站点和目的站点,其中N根据实际情况进行设定。
(2)对于N个站点中的任意两个站点,提取其有效路径,如果存在覆盖出行片段的比例大于设定阈值λ(例如50%)的有效路径,则将该有效路径作为对应出行模式的有效路径r,并将这两个站点作为so,sd,将覆盖到的出行片段中so出现的最早时间和sd被检测到的最晚时间作为[t1,t2]。相反,如果不存在覆盖出行片段的比例大于设定阈值λ的有效路径,则说明此乘客出行比较随意,没有对应的出行模式。
步骤400:基于乘客的出行模式集合对个体出行片段集合中的残缺信息进行补全处理,并根据补全后的个体出行片段集合SG'提取乘客的完整出行轨迹;
具体的,本申请实施例基于以下两种信息对个体出行片段集合SG中的残缺信息进行补全处理:
(1)基于乘客的个体出行模式对部分规律出行做补全;
(2)如果前一次出行与后一次出行的时间间隔小于设定阈值,则将前一次出行的终点作为后一次出行的起点。
进一步地,补全操作顺序包括:
第一步:顺序读取个体出行片段集合SG={sg1,sg2,…,sgn}中的连续两个出行片段sgi和sgi+1,如果前一个出行片段sgi的最后一个点与后一个出行片段sgi+1的第一个点之间的间隔时间差小于设定时间阈值ζ,且将前一个出行片段sgi的最后一个点插入到后一个出行片段sgi+1的第一个点之前后,后一个出行片段sgi+1仍然满足个体出行片段划分中的时间花费预设条件和有效路径预设条件,则执行上述的将sgi的最后一个点插入到sgi+1第一个点之前的操作;以及如果将后一个出行片段sgi+1的第一个点插入到前一个出行片段sgi的最后一个点之后,前一个出行片段sgi仍然满足个体出行片段划分中的时间花费预设条件和有效路径预设条件,则执行上述的将后一个出行片段sgi+1的第一个点插入到前一个出行片段sgi的最后一个点之后的操作。
第二步:针对出行片段集合SG={sg1,sg2,…,sgn}中的每一个出行片段sg,首先判断是否存在出行模式pi∈P,且乘车过程tr包含在该出行模式中,如果存在,用轨迹模型中对应的OD(交通起止点)和路径对该出行片段进行补全处理;否则不做补全处理。
第三步,重新执行第一步,得到补全后的出行片段集合SG'={sg'1,sg'2,…,sg'n}。
得到补全后的出行片段集合SG'={sg'1,sg'2,…,sg'n}后,提取每一个出行片断sg'i对应的乘车过程tri,将tri的进站站点和进站时间设置为该出行片段的第一个点的站点和时间,将tri的出站站点和出站时间设置为该出行片段的最后一个点的站点和时间,将tri设置为该出行片段途径的路径,从而获取到乘客的完整出行轨迹。
请参阅图2,是本申请实施例的城市公共交通乘客出行轨迹估计系统的结构示意图。本申请实施例的城市公共交通乘客出行轨迹估计系统40包括:
路径获取模块41:用于构建地铁网络图,根据所述地铁网络图获取每一位乘客的至少一条有效路径;所述有效路径包括所通过的线路、站点、路径长度或/和花费时间;
出行片段划分模块42:用于获取乘客的位置数据,根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段;所述每一个个体出行片段分别包括一次出行所途径的所有轨迹点,并且满足时间花费预设条件和有效路径预设条件;
出行模式提取模块43:用于按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类,并根据所述聚类结果提取乘客的至少一个个体出行模式;所述个体出行模式包括{so,sd,t1,t2,r}信息,表示在一天的某固定时间段[t1,t2],乘客超过设定阈值的出行是从出发站点so前往另一个目的站点sd,并选择有效路径r;
出行轨迹提取模块44:用于基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理,并根据所述补全后的个体出行片段提取乘客的完整出行轨迹。
为了验证本申请实施例的可行性和有效性,采用深圳市一个月内地铁站监测乘客通信设备的移动轨迹数据进行实验,实验结果表明本申请实施例在补全效果上优于现有技术。
请参阅图3,为本申请实施例的终端结构示意图。该终端50包括处理器51、与处理器51耦接的存储器52。
存储器52存储有用于实现上述城市公共交通乘客出行轨迹估计方法的程序指令。
处理器51用于执行存储器52存储的程序指令以控制城市公共交通乘客出行轨迹估计。
其中,处理器51还可以称为CPU(Central Processing Unit,中央处理单元)。处理器51可能是一种集成电路芯片,具有信号的处理能力。处理器51还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
请参阅图4,为本申请实施例的存储介质的结构示意图。本申请实施例的存储介质存储有能够实现上述所有方法的程序文件61,其中,该程序文件61可以以软件产品的形式存储在上述存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。
本申请实施例的城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质按照预定规则将AP设备采集的位置数据划分为多个个体出行片段,按照时间属性对每一位乘客的个体出行片段集合中的轨迹点进行聚类,提取每一位乘客的多个个体出行模式,基于乘客的出行模式集合对个体出行片段中的残缺信息进行补全处理,并根据补全后的个体出行片段提取乘客的完整出行轨迹。相比现有技术,本申请实施例能够获取到覆盖面更广、数量更大的样本,为乘客出行轨迹分析提供了较为完整的数据基础,对全网客流量的分析具有非常重要的意义。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本申请中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本申请所示的这些实施例,而是要符合与本申请所公开的原理和新颖特点相一致的最宽的范围。
Claims (13)
1.一种城市公共交通乘客出行轨迹估计方法,其特征在于,包括以下步骤:
步骤a:构建地铁网络图,根据所述地铁网络图获取每一位乘客的至少一条有效路径;所述有效路径包括所通过的线路、站点、路径长度或/和花费时间;
步骤b:获取乘客的位置数据,根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段;所述每一个个体出行片段分别包括一次出行所途径的所有轨迹点,并且满足时间花费预设条件和有效路径预设条件;
步骤c:按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类,并根据所述聚类结果提取乘客的至少一个个体出行模式;所述个体出行模式包括{so,sd,t1,t2,r}信息,表示在一天的某固定时间段[t1,t2],乘客超过设定阈值的出行是从出发站点so前往另一个目的站点sd,并选择有效路径r;
步骤d:基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理,并根据所述补全后的个体出行片段提取乘客的完整出行轨迹。
2.根据权利要求1所述的城市公共交通乘客出行轨迹估计方法,其特征在于,所述步骤a中,所述构建地铁网络图包括:
用G=(V,E)标识地铁网络图,其中V是标识地铁站点的非空集合,E为地铁网络图的边集;所述地铁网络图中的每一个节点Vi分别包括地铁物理站点信息Vi.s、所属线路Vi.l和方向Vi.d,如果两个节点之间符合以下两个预设规则中的任意一个,则表示所述地铁网络图存在带权重的有向边ei,j:
第一预设规则:如果两个节点Vi和Vj是同一条物理线路的先后经过的两个相邻站点,其边的权重为列车通过这两个站点所花费的时间;
第二预设规则:如果两个节点所属站点是不同物理线路的同一个物理站点,且所述站点为换乘站点,其边的权重为换乘步行时间与平均等待时间之和。
3.根据权利要求2所述的城市公共交通乘客出行轨迹估计方法,其特征在于,所述步骤a中,所述根据所述地铁网络图获取每一位乘客的至少一条有效路径包括:
给定起始站点si和目的站点sj,基于所述地铁网络图,使用前n条最短路径计算方法得到从属于{vi|vi.s=si}的节点到属于{vj|vj.s=sj}的节点的前k条最短路径作为有效路径;每条有效路径分别包括开始节点、途径换乘节点集合和终点节点。
4.根据权利要求1所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤b中,所述根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段包括:
按照MacID字段对所述位置数据进行分组,得到每一位乘客的个体出行轨迹信息,并按位置数据采集时间的先后对所述个体出行轨迹信息进行排序,得到每一位乘客的轨迹点序列;
根据所述花费时间和所述有效路径将每一位乘客的轨迹点序列划分为多个个体出行片段。
5.根据权利要求4所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤b中,
所述时间花费预设条件为:
在每一个个体出行片段中,任意两个相邻轨迹点之间的时间差不能大于两站之间的最大时间;
所述有效路径预设条件为:
所述每一个个体出行片段中的所有轨迹点都属于从起始站点到目的站点之间的有效路径途径站点。
6.根据权利要求5所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤c中,所述按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类具体为:采用基于核密度估计的聚类算法对所述轨迹点进行聚类;所述基于核密度估计的聚类算法包括:
选定计算核密度的带宽h;
根据核密度公式f计算每个点的局部密度ρ:
代入高斯核函数后计算出每个点xi的局部密度ρi:
将局部密度ρ和相对距离δ的二维空间分布图作为决策图,选取具有较大ρ和δ的数据点作为类簇中心;
计算各个个体出行片段的中位时间,根据所述个体出行片段的中位时间与所述类簇中心的距离对所述个体出行片段进行归类。
7.根据权利要求6所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤c中,所述根据所述聚类结果提取乘客的至少一个个体出行模式包括:
统计所述多个出行片段中第一轨迹点和最后一个轨迹点对应站点的被检测总次数和持续时间,并按照被检测总次数和持续时间分别选择前N/2个站点作为可能的起始站点和目的站点;
对于所述N个站点中的任意两个站点,提取其有效路径,如果存在覆盖所述个体出行片段的比例大于设定阈值λ的有效路径,则将该有效路径作为对应出行模式的有效路径r,并将所述两个站点作为起始站点so和目的站点sd,将覆盖到的所述个体出行片段中起始站点so出现的最早时间和目的站点sd被检测到的最晚时间作为固定时间段[t1,t2]。
8.根据权利要求1所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤d中,所述基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理包括:
顺序读取所述多个个体出行片段中的连续两个出行片段,如果前一个出行片段的最后一个点与后一个出行片段的第一个点之间的间隔时间差小于设定时间阈值,且将所述前一个出行片段的最后一个点插入到所述后一个出行片段的第一个点之前后,所述后一个出行片段仍然满足所述时间花费预设条件和有效路径预设条件,则执行所述将前一个出行片段的最后一个点插入到所述后一个出行片段的第一个点之前的操作;以及如果将所述后一个出行片段的第一个点插入到所述前一个出行片段的最后一个点之后,所述前一个出行片段仍然满足所述时间花费预设条件和有效路径预设条件,则执行所述将所述后一个出行片段的第一个点插入到所述前一个出行片段的最后一个点的操作。
9.根据权利要求8所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤d中,所述基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理还包括:
针对所述多个出行片段中的每一个出行片段,首先判断是否存在出行模式pi∈P,且乘车过程tr包含在该出行模式中,如果存在,用轨迹模型中对应的OD和路径对所述出行片段进行补全处理;其中所述乘车过程tr包括进站站点tr.so、出站站点tr.sd、进站时间tr.to、出站时间tr.td、路径tr.r。
10.根据权利要求9所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤d中,所述根据所述补全后的个体出行片段提取乘客的完整出行轨迹包括:
提取所述补全后的每一个出行片断对应的乘车过程,将所述乘车过程的进站站点和进站时间设置为所述出行片段的第一个点的站点和时间,将所述乘车过程的出站站点和出站时间设置为所述出行片段的最后一个点的站点和时间,将所述乘车过程设置为所述出行片段途径的路径,以获取到乘客的完整出行轨迹。
11.一种城市公共交通乘客出行轨迹估计系统,其特征在于,包括:
路径获取模块:用于构建地铁网络图,根据所述地铁网络图获取每一位乘客的至少一条有效路径;所述有效路径包括所通过的线路、站点、路径长度或/和花费时间;
出行片段划分模块:用于获取乘客的位置数据,根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段;所述每一个个体出行片段分别包括一次出行所途径的所有轨迹点,并且满足时间花费预设条件和有效路径预设条件;
出行模式提取模块:用于按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类,并根据所述聚类结果提取乘客的至少一个个体出行模式;所述个体出行模式包括{so,sd,t1,t2,r}信息,表示在一天的某固定时间段[t1,t2],乘客超过设定阈值的出行是从出发站点so前往另一个目的站点sd,并选择有效路径r;
出行轨迹提取模块:用于基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理,并根据所述补全后的个体出行片段提取乘客的完整出行轨迹。
12.一种终端,其特征在于,所述终端包括处理器、与所述处理器耦接的存储器,其中,
所述存储器存储有用于实现权利要求1-10任一项所述的城市公共交通乘客出行轨迹估计方法的程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以控制城市公共交通乘客出行轨迹估计。
13.一种存储介质,其特征在于,存储有处理器可运行的程序指令,所述程序指令用于执行权利要求1至10任一项所述城市公共交通乘客出行轨迹估计方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010487422.1A CN113766428B (zh) | 2020-06-01 | 2020-06-01 | 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010487422.1A CN113766428B (zh) | 2020-06-01 | 2020-06-01 | 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113766428A true CN113766428A (zh) | 2021-12-07 |
CN113766428B CN113766428B (zh) | 2024-08-20 |
Family
ID=78782245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010487422.1A Active CN113766428B (zh) | 2020-06-01 | 2020-06-01 | 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113766428B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115580830A (zh) * | 2022-12-07 | 2023-01-06 | 成都智元汇信息技术股份有限公司 | 一种基于ap探针多点定位的乘客违规路径检测方法及装置 |
CN116028827A (zh) * | 2022-12-31 | 2023-04-28 | 中国电子科技集团公司信息科学研究院 | 基于车辆gps轨迹数据聚类的轨迹补全方法 |
CN117035232A (zh) * | 2023-08-08 | 2023-11-10 | 广东家祥智能科技有限公司 | 一种基于大数据平台的智慧城市数据处理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130091472A1 (en) * | 2010-07-22 | 2013-04-11 | Sony Corporation | Information processing apparatus, information processing method, and recording medium |
CN107358319A (zh) * | 2017-06-29 | 2017-11-17 | 深圳北斗应用技术研究院有限公司 | 城市轨道交通客流预测方法、装置、存储介质和计算机设备 |
CN110942198A (zh) * | 2019-11-27 | 2020-03-31 | 重庆市交通规划研究院 | 一种用于轨道交通运营的乘客路径识别方法和系统 |
CN111191816A (zh) * | 2019-12-05 | 2020-05-22 | 东南大学 | 城市轨道交通乘客出行时间链辨识系统 |
-
2020
- 2020-06-01 CN CN202010487422.1A patent/CN113766428B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130091472A1 (en) * | 2010-07-22 | 2013-04-11 | Sony Corporation | Information processing apparatus, information processing method, and recording medium |
CN107358319A (zh) * | 2017-06-29 | 2017-11-17 | 深圳北斗应用技术研究院有限公司 | 城市轨道交通客流预测方法、装置、存储介质和计算机设备 |
CN110942198A (zh) * | 2019-11-27 | 2020-03-31 | 重庆市交通规划研究院 | 一种用于轨道交通运营的乘客路径识别方法和系统 |
CN111191816A (zh) * | 2019-12-05 | 2020-05-22 | 东南大学 | 城市轨道交通乘客出行时间链辨识系统 |
Non-Patent Citations (1)
Title |
---|
余宏强: "基于移动互联网的地铁出行辅助系统研究与设计", CNKI, 1 March 2017 (2017-03-01), pages 32 - 46 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115580830A (zh) * | 2022-12-07 | 2023-01-06 | 成都智元汇信息技术股份有限公司 | 一种基于ap探针多点定位的乘客违规路径检测方法及装置 |
CN115580830B (zh) * | 2022-12-07 | 2023-03-10 | 成都智元汇信息技术股份有限公司 | 一种基于ap探针多点定位的乘客违规路径检测方法及装置 |
CN116028827A (zh) * | 2022-12-31 | 2023-04-28 | 中国电子科技集团公司信息科学研究院 | 基于车辆gps轨迹数据聚类的轨迹补全方法 |
CN116028827B (zh) * | 2022-12-31 | 2024-05-31 | 中国电子科技集团公司信息科学研究院 | 基于车辆gps轨迹数据聚类的轨迹补全方法 |
CN117035232A (zh) * | 2023-08-08 | 2023-11-10 | 广东家祥智能科技有限公司 | 一种基于大数据平台的智慧城市数据处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113766428B (zh) | 2024-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021243516A1 (zh) | 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 | |
CN111681421B (zh) | 基于手机信令数据的对外客运枢纽集疏空间分布分析方法 | |
CN113766428B (zh) | 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 | |
CN108415975B (zh) | 基于bdch-dbscan的出租车载客热点识别方法 | |
WO2017133627A1 (zh) | 用户通勤轨迹管理方法、装置及系统 | |
CN104658252B (zh) | 基于多源数据融合的高速公路交通运行状态的评估方法 | |
CN109688532B (zh) | 一种划分城市功能区域的方法及装置 | |
WO2021082464A1 (zh) | 预测车辆的目的地的方法和装置 | |
CN110472999B (zh) | 基于地铁和共享单车数据的客流模式分析方法及装置 | |
CN107040894A (zh) | 一种基于手机信令数据的居民出行od获取方法 | |
CN106529711B (zh) | 用户行为预测方法及装置 | |
CN110874668B (zh) | 一种轨道交通od客流预测方法、系统及电子设备 | |
CN108053240B (zh) | 生成车载广告投放公交线路方案的方法及装置 | |
CN110969861B (zh) | 一种车辆识别方法、装置、设备及计算机存储介质 | |
CN110545558A (zh) | 基于Wi-Fi数据的高速服务区人群密度估计系统 | |
JP6307376B2 (ja) | 交通分析システム、交通分析プログラムおよび交通分析方法 | |
CN111858806A (zh) | 乘客出行轨迹检测方法、装置、设备及存储介质 | |
CN110377687A (zh) | 用户出行方式判别方法、装置和服务器 | |
CN111380530A (zh) | 导航方法及相关产品 | |
CN111797926A (zh) | 城际迁徙行为识别方法、装置、计算机设备及存储介质 | |
Dokuz | Weighted spatio-temporal taxi trajectory big data mining for regional traffic estimation | |
Rodrigues et al. | Impact of crowdsourced data quality on travel pattern estimation | |
CN112488388B (zh) | 基于概率分布的出站客流预测方法及装置 | |
CN116933958B (zh) | 一种基于刷卡数据的地铁换乘站换乘客流估计方法 | |
CN110046535B (zh) | 基于机器学习的智能出行时间预测系统、方法及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |