WO2021243516A1 - 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 - Google Patents

城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 Download PDF

Info

Publication number
WO2021243516A1
WO2021243516A1 PCT/CN2020/093744 CN2020093744W WO2021243516A1 WO 2021243516 A1 WO2021243516 A1 WO 2021243516A1 CN 2020093744 W CN2020093744 W CN 2020093744W WO 2021243516 A1 WO2021243516 A1 WO 2021243516A1
Authority
WO
WIPO (PCT)
Prior art keywords
travel
passenger
time
trajectory
individual
Prior art date
Application number
PCT/CN2020/093744
Other languages
English (en)
French (fr)
Inventor
赵娟娟
张刘涛
须成忠
代浩
王洋
Original Assignee
深圳先进技术研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳先进技术研究院 filed Critical 深圳先进技术研究院
Priority to PCT/CN2020/093744 priority Critical patent/WO2021243516A1/zh
Publication of WO2021243516A1 publication Critical patent/WO2021243516A1/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services

Definitions

  • This application belongs to the technical field of public transportation, and particularly relates to a method, system, terminal, and storage medium for estimating travel trajectory of urban public transportation passengers.
  • the traditional methods of obtaining travel routes for subway passengers mainly include:
  • Part of the sample data is obtained through manual methods such as questionnaires; for example, questionnaires are distributed at certain subway stations.
  • the content of the questionnaire includes the starting point and ending point of passengers' travel (abbreviated as OD), the time spent on walking, and the selected travel route.
  • OD the starting point and ending point of passengers' travel
  • the shortcomings of this method are that a large number of people are required to conduct field sampling and surveys, the labor cost is high, and it is difficult to guarantee the randomness of sampling, data quality and coverage.
  • AP access point, wireless access point
  • the data collected by AP devices has a wider coverage, but due to the influence of user device status (whether the wifi function is turned on), AP device coverage, network status and other factors, the collected location data is sparse and discontinuous.
  • the key points of the passenger travel path (such as the entry and exit station and transfer station during the travel) are missing, so that the passenger travel trajectory cannot be fully estimated.
  • This application provides a method, system, terminal and storage medium for estimating the travel trajectory of urban public transportation passengers, which aims to solve the problem of sparse and discontinuous location data collected by AP equipment and the lack of key points in the travel path of passengers in the prior art.
  • a method for estimating travel trajectory of urban public transportation passengers including the following steps:
  • Step a construct a subway network map, and obtain at least one effective path for each passenger according to the subway network map; the effective path includes the route passed, the station, the length of the path or/and the time spent;
  • Step b Obtain the location data of the passengers, and divide the location data into a plurality of individual travel segments according to the at least one effective route; each individual travel segment includes all the trajectory points of a trip and satisfies the time Cost preset conditions and effective path preset conditions;
  • Step c cluster the trajectory points in the multiple individual travel segments according to the time attribute of the day, and extract at least one individual travel mode of the passenger according to the clustering result;
  • the individual travel mode includes ⁇ s o ,s d ,t 1 ,t 2 ,r ⁇ information, indicating that in a certain fixed time period of the day [t 1 ,t 2 ], the trip of passengers exceeding the set threshold is from the departure station s o to another destination station s d , And select a valid path r;
  • Step d Complementing the incomplete information in the individual travel segment based on the travel mode, and extracting the complete travel trajectory of the passenger based on the completed individual travel segment.
  • the construction of the subway network diagram includes:
  • G (V, E) identifying the metro network diagram, where V is a non-empty set identifier subway stations, E is the set of edges of the metro network of FIG; metro physical sites each node of the metro network of FIG V I respectively comprising Information V i. s, belonging line V i. l and direction V i. d. If any one of the following two preset rules is met between the two nodes, it means that the subway network graph has a weighted direction Edge e i,j :
  • the first preset rule if two nodes V i and V j are the same physical site adjacent two lines has elapsed, the weight of its sides by the time the train takes two sites;
  • the second preset rule If the stations to which two nodes belong are the same physical station on different physical lines, and the station is a transfer station, the weight of its edge is the sum of the transfer walking time and the average waiting time.
  • the technical solution adopted in the embodiment of the present application further includes: in the step a, the obtaining at least one valid path for each passenger according to the subway network map includes:
  • each valid path includes a start node, a set of route transfer nodes, and a destination node.
  • the technical solution adopted in the embodiment of the present application further includes: in the step b, the dividing the location data into a plurality of individual travel segments according to the at least one effective route includes:
  • the location data is grouped according to the MacID field to obtain the individual travel trajectory information of each passenger, and the individual travel trajectory information is sorted according to the sequence of the location data collection time to obtain the trajectory point sequence of each passenger;
  • the trajectory point sequence of each passenger is divided into multiple individual travel segments according to the time spent and the effective path.
  • the technical solution adopted in the embodiment of the present application further includes: in the step b,
  • the preset conditions for the time spent are:
  • the preset condition of the valid path is:
  • All the track points in each individual travel segment belong to the effective path route station from the starting station to the destination station.
  • the technical solution adopted in the embodiment of the present application further includes: in the step c, the clustering of the trajectory points in the plurality of individual travel segments according to the time attribute of the day is specifically: adopting kernel density estimation based A clustering algorithm clusters the track points; the clustering algorithm based on kernel density estimation includes:
  • the median time of each individual travel segment is calculated, and the individual travel segments are classified according to the distance between the median time of the individual travel segment and the cluster center.
  • the extracting at least one individual travel mode of the passenger according to the clustering result includes:
  • any two of the N stations extract their effective paths. If there is an effective path that covers the individual travel fragments with a ratio greater than the set threshold ⁇ , then the effective path is taken as the effective path r of the corresponding travel mode. and the two sites as starting sites s o s d and the destination station, the cover of the individual fragments travel start site appears earliest time s o and s d destination station is detected at the latest Time is regarded as a fixed time period [t 1 , t 2 ].
  • the technical solution adopted in the embodiment of the present application further includes: in the step d, the completion of the incomplete information in the individual travel segment based on the travel mode includes:
  • the technical solution adopted in the embodiment of the present application further includes: in the step d, the completion of the incomplete information in the individual travel segment based on the travel mode further includes:
  • the riding process tr For each of the multiple travel segments, first determine whether there is a travel mode p i ⁇ P, and the riding process tr is included in the travel mode. If it exists, use the corresponding OD and path pair in the trajectory model The travel segment is complemented; wherein the riding process tr includes the inbound station tr.s o , the outbound station tr.s d , the inbound time tr.t o , the outbound time tr.t d , and the route tr.r.
  • step d extracting the complete travel trajectory of the passenger according to the completed individual travel segment includes:
  • Extract the travel process corresponding to each travel segment after the completion set the stop and stop time of the travel process as the stop and time of the first point of the travel segment, and set the The outbound station and the outbound time of the riding process are set as the station and time of the last point of the travel segment, and the riding process is set as the path of the travel segment route to obtain the complete travel trajectory of the passenger .
  • an urban public transportation passenger travel trajectory estimation system including:
  • Path acquisition module used to construct a subway network diagram, and obtain at least one effective path for each passenger according to the subway network diagram; the effective path includes the route passed, the station, the path length or/and the time spent;
  • Travel segment division module used to obtain passenger location data, and divide the location data into a plurality of individual travel segments according to the at least one effective route; each individual travel segment includes all track points through a trip , And meet the time cost preset conditions and the effective path preset conditions;
  • Travel mode extraction module used to cluster the trajectory points in the multiple individual travel segments according to the time attribute of the day, and extract at least one individual travel mode of the passenger according to the clustering result; the individual travel mode Including ⁇ s o ,s d ,t 1 ,t 2 ,r ⁇ information, which means that in a certain time period of the day [t 1 ,t 2 ], the trip that the passenger exceeds the set threshold is from the departure station s o to another Destination site s d , and select a valid path r;
  • Travel trajectory extraction module used to perform complement processing on the incomplete information in the individual travel segment based on the travel mode, and extract the complete travel trajectory of the passenger based on the completed individual travel segment.
  • a terminal includes a processor and a memory coupled to the processor, wherein:
  • the memory stores program instructions for implementing the method for estimating travel trajectory of urban public transportation passengers
  • the processor is configured to execute the program instructions stored in the memory to control urban public transportation passenger travel trajectory estimation.
  • a storage medium storing program instructions executable by a processor, and the program instructions are used to execute the urban public transportation passenger travel trajectory estimation method.
  • the beneficial effects produced by the embodiments of the present application are: the method, system, terminal, and storage medium for estimating the travel trajectory of urban public transportation passengers in the embodiments of the present application divide the location data collected by the AP device into a plurality of locations according to predetermined rules. Individual travel segments, clustering the trajectory points in each passenger's individual travel segment set according to time attributes, extracting multiple individual travel patterns for each passenger, and based on the passenger's travel pattern set to determine the incompleteness of the individual travel segment The information is completed and processed, and the complete travel trajectory of the passenger is extracted based on the completed individual travel segment.
  • the embodiments of the present application can obtain a wider coverage and a larger number of samples, provide a relatively complete data basis for passenger travel trajectory analysis, and have a very important significance for the analysis of passenger flow on the entire network.
  • FIG. 1 is a flowchart of a method for estimating travel trajectories of urban public transportation passengers according to an embodiment of the present application
  • FIG. 2 is a schematic diagram of the structure of an urban public transportation passenger travel trajectory estimation system according to an embodiment of the application;
  • FIG. 3 is a schematic diagram of a terminal structure according to an embodiment of the application.
  • FIG. 4 is a schematic structural diagram of a storage medium according to an embodiment of the application.
  • FIG. 1 is a flowchart of a method for estimating travel trajectory of urban public transportation passengers according to an embodiment of the present application.
  • the method for estimating travel trajectory of urban public transportation passengers in the embodiment of the present application includes the following steps:
  • Step 100 Collect location data of passengers through AP devices in subway stations;
  • the location data collection method is specifically: collecting peripheral mobile devices at a fixed time (for example, 15 seconds) through the AP device, and collecting multiple pieces of location data corresponding to the passenger from the mobile device, each piece of location data represents a space-time location of the passenger.
  • Point p ⁇ id, s, time ⁇ , where id is the unique identifier of the passenger's mobile device, s is the subway station, and time is the collection time of location data.
  • Step 200 Preprocess the collected location data, and divide the location data of each passenger into multiple individual travel segments;
  • step 200 data preprocessing specifically includes the following steps:
  • Step 201 Construct a subway network map according to the characteristics of the subway network, and obtain the first k valid paths for each passenger according to the subway network map;
  • ⁇ and multiple physical lines L ⁇ l 1 ,l 2 ,...,l
  • ⁇ , where each physical line includes multiple ordered physical sites, and includes both uplink and downlink directions, that is, D ⁇ d 1 ,d 2 ⁇ , and physical sites in both uplink and downlink directions
  • the sequence is reversed.
  • Physical stations include ordinary stations and transfer stations, where ordinary stations are stations with only one physical line passing, and transfer stations are stations with at least two physical lines passing through. Passengers can transfer to different physical lines at the transfer station.
  • One or more physical routes (including transfers) selected by a passenger from one physical station to another physical station are the travel trajectory of the passenger.
  • Each node V i in the subway network graph includes physical subway station information V i. s, its own line V i. l, and direction V i. d. If the two nodes meet any of the following two preset rules One, it means that there are weighted directed edges e i, j in the subway network graph:
  • the second preset rule If two nodes belong to the same physical station on different physical lines, and the station is a transfer station, the weight of its edge is the sum of the transfer walking time and the average waiting time, the weight can be Obtained by actual measurement.
  • the effective path acquisition method in the embodiment of the present application is: given the starting site s i and the destination site s j , based on the subway network graph, the first n shortest path calculation methods are used to obtain the slave nodes (belonging to the set ⁇ v i
  • v i .s s i ⁇ ) to the node (belonging to the set ⁇ v j
  • v j .s s j ⁇ ) as the first k shortest paths as effective paths, where each effective path includes the starting node and the path change.
  • Multiply key node information such as node set and end node.
  • Step 202 Group the location data collected by the AP device according to the MacID field to obtain the individual travel trajectory information of each passenger, and sort the individual travel trajectory information according to the time of data collection, and obtain each passenger in a period of time
  • the sequence of trajectory points within P ⁇ p 1 ,p 2 ,...,p
  • a passenger’s trip tr refers to a logical ride process, that is, the entire process from inbound to outbound, including the inbound station tr.s o , the outbound station tr.s d , and the inbound station. Station time tr.t o , outbound time tr.t d , path tr.r. And each individual travel segment includes all the trajectory points of a trip, and meets the following preset conditions for time-consuming and effective routes:
  • Passengers may stay at a station for a long time due to inbound, outbound, and transfer, resulting in multiple continuously detected track points belonging to the same station in the travel segment
  • this embodiment of the application combines these track points, and only records the start time and duration of entering the site.
  • Step 300 Cluster the trajectory points in the set of individual travel segments of each passenger according to the time attribute of the day, and extract multiple individual travel patterns of each passenger from each type of travel segment obtained by the clustering ;
  • step 300 since the travel of public transportation passengers has temporal and spatial regularity, that is, individual passengers travel from one stop to another at a fixed time of day, and for travel with the same starting point and ending point, the individual passenger is accustomed to choosing a familiar route. Therefore, the embodiment of this application first clusters the trajectory points in the individual travel segments based on the temporal and spatial regularity, extracts the passenger travel mode, and complements the incomplete information in the individual travel segments based on the passenger travel mode to obtain the complete travel of the passenger Trajectory.
  • each passenger’s individual travel pattern p is used to describe the temporal and spatial regularity of the user’s travel, and an individual travel pattern p contains ⁇ s o , s d , t 1 , t 2 , r ⁇ information, which represents a certain fixed day
  • the trip of passengers exceeding the set threshold ⁇ is from a certain departure station s o to another destination station s d , and an effective route r is selected.
  • the threshold ⁇ is preferably set to ⁇ 50%. For example, in 100 days, 60% of Zhang San’s trips were from University Town to Shenzhen North Railway Station between 8:30 and 9:30, and he chose the shortest time-consuming Effective path.
  • the extraction of individual travel patterns mainly includes the following steps:
  • Step 301 Cluster the trajectory points in the set of individual travel segments of each passenger according to the time attributes of the day, and classify them according to the distance between the median time of each individual travel segment and the center point of each cluster category kind;
  • this embodiment of the present application adopts a new type of rapid clustering that can automatically determine the number of clusters and the center of clusters.
  • Algorithm Clustering algorithm based on kernel density estimation. The algorithm is not only suitable for cluster analysis of large-scale data, but also can quickly eliminate outlier noise points.
  • the clustering of individual travel segments based on the kernel density estimation clustering algorithm specifically includes:
  • the local density ⁇ i of each point x i can be calculated by formula (2).
  • Step 400 Based on the passenger's travel mode set, complete the incomplete information in the individual travel segment set, and extract the complete travel trajectory of the passenger based on the completed individual travel segment set SG';
  • the embodiment of the present application performs completion processing on the incomplete information in the individual travel segment set SG based on the following two kinds of information:
  • sequence of completion operations includes:
  • FIG. 2 is a schematic structural diagram of an urban public transportation passenger travel trajectory estimation system according to an embodiment of the present application.
  • the urban public transportation passenger travel trajectory estimation system 40 of the embodiment of the present application includes:
  • Path acquisition module 41 used to construct a subway network diagram, and obtain at least one effective path for each passenger according to the subway network diagram; the effective path includes the route passed, the station, the length of the path or/and the time spent;
  • Travel segment dividing module 42 used to obtain passenger location data, and divide the location data into a plurality of individual travel segments according to the at least one effective route; each individual travel segment includes all the trajectories of a trip Point, and meet the time cost preset conditions and the effective path preset conditions;
  • the travel mode extraction module 43 used to cluster the trajectory points in the multiple individual travel segments according to the time attribute of the day, and extract at least one individual travel mode of the passenger according to the clustering result; the individual travel The mode includes ⁇ s o ,s d ,t 1 ,t 2 ,r ⁇ information, which means that in a certain fixed time period of the day [t 1 ,t 2 ], the trip of passengers exceeding the set threshold is from the departure station s o to another A destination site s d and an effective path r is selected;
  • the travel trajectory extraction module 44 is configured to perform completion processing on the incomplete information in the individual travel segment based on the travel mode, and extract the complete travel trajectory of the passenger based on the completed individual travel segment.
  • FIG. 3 is a schematic diagram of a terminal structure according to an embodiment of the application.
  • the terminal 50 includes a processor 51 and a memory 52 coupled to the processor 51.
  • the memory 52 stores program instructions for implementing the above-mentioned method for estimating the travel trajectory of urban public transportation passengers.
  • the processor 51 is used to execute the program instructions stored in the memory 52 to control urban public transportation passenger travel trajectory estimation.
  • the processor 51 may also be referred to as a CPU (Central Processing Unit, central processing unit).
  • the processor 51 may be an integrated circuit chip with signal processing capability.
  • the processor 51 may also be a general-purpose processor, a digital signal processor (DSP), an application specific integrated circuit (ASIC), an off-the-shelf programmable gate array (FPGA) or other programmable logic device, a discrete gate or transistor logic device, or a discrete hardware component.
  • DSP digital signal processor
  • ASIC application specific integrated circuit
  • FPGA off-the-shelf programmable gate array
  • the general-purpose processor may be a microprocessor or the processor may also be any conventional processor or the like.
  • FIG. 4 is a schematic structural diagram of a storage medium according to an embodiment of the application.
  • the storage medium of the embodiment of the present application stores a program file 61 that can implement all the above methods.
  • the program file 61 can be stored in the above storage medium in the form of a software product, and includes a number of instructions to enable a computer device (which can It is a personal computer, a server, or a network device, etc.) or a processor (processor) that executes all or part of the steps of the various embodiments of the present invention.
  • the aforementioned storage media include: U disk, mobile hard disk, read-only memory (ROM, Read-Only Memory), random access memory (RAM, Random Access Memory), magnetic disks or optical disks and other media that can store program codes. , Or terminal devices such as computers, servers, mobile phones, and tablets.
  • the method, system, terminal, and storage medium for estimating travel trajectory of urban public transportation passengers divide the location data collected by the AP device into multiple individual travel segments according to predetermined rules, and calculate the individual travel segments of each passenger according to the time attribute
  • the trajectory points in the set are clustered to extract multiple individual travel patterns for each passenger, and based on the travel pattern set of the passengers, the incomplete information in the individual travel fragments is complemented, and extracted according to the completed individual travel fragments
  • the complete travel trajectory of passengers Compared with the prior art, the embodiment of the present application can obtain a wider coverage and a larger number of samples, which provides a relatively complete data basis for passenger travel trajectory analysis, and is of great significance for the analysis of passenger flow on the entire network.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Navigation (AREA)

Abstract

一种城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质。包括:构建地铁网络图,根据所述地铁网络图获取每一位乘客的至少一条有效路径;获取乘客的位置数据,根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段;按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类,并根据所述聚类结果提取乘客的至少一个个体出行模式;基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理,并根据所述补全后的个体出行片段提取乘客的完整出行轨迹。本方法能够获取到覆盖面更广、数量更大的样本,为乘客出行轨迹分析提供了较为完整的数据基础,对全网客流量的分析具有非常重要的意义。

Description

城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 技术领域
本申请属于公共交通技术领域,特别涉及一种城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质。
背景技术
由于地铁具有准时性、速度快、稳定性高等特点,目前已经成为了城市市民出行的首选交通方式。获取地铁乘客的出行路径对全网客流量的分析具有非常重要的意义。传统的地铁乘客出行路径获取方法主要包括:
(1)通过调查问卷等人工的方式获得部分样本数据;例如在某些地铁站发放调查问卷,问卷内容包括乘客出行的起点和终点(简称OD)、步行花费时间、所选择的出行路径等。该方法的缺点在于:需要大量的人进行实地采样以及考察,人力成本较高,并且难以保证抽样的随机性、数据质量和覆盖范围。
(2)基于AFC(Automatic Fare Collection System,城市轨道交通自动售检票系统)采集到的进出站数据;假设乘客总的出行时间服从某提前指定的概率分布的前提下,基于AFC数据采集到的出行花费时间构建概率模型推算乘客所选择的出行路径。该方法的缺点在于:由于AFC系统只能采集到进出站数据,所以基于此数据对于进出站之间的多条路径所花费时间相差不大的情况,很难仅通过进出站信息对乘客所选择的路径做出精确判断,并且给定某路径,其所花费的时间在复杂情况下(拥挤,滞留)很难给出精确估算。
目前,随着某些城市的地铁站内AP(access point,无线接入点)设备的全面部署,可以通过用户携带的移动手机采集到乘客在出行过程经过的部分位置信息,这为乘客出行轨迹的估计提供了新的思路。相比AFC数据,AP设备采集的数据覆盖面更广,但是由于受用户设备状态(wifi功能是否开启)、AP设备 覆盖范围、网络状态等因素的影响,导致采集到的位置数据存在稀疏不连续、乘客出行路径的关键点(例如出行中的进出站和换乘站)出现缺失等情况,从而无法完整的估计乘客出行轨迹。
发明内容
本申请提供了一种城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质,旨在解决现有技术中由于AP设备采集到的位置数据稀疏不连续以及乘客出行路径的关键点缺失,导致无法完整的估计乘客出行轨迹的技术问题。
为了解决上述问题,本申请提供了如下技术方案:
一种城市公共交通乘客出行轨迹估计方法,包括以下步骤:
步骤a:构建地铁网络图,根据所述地铁网络图获取每一位乘客的至少一条有效路径;所述有效路径包括所通过的线路、站点、路径长度或/和花费时间;
步骤b:获取乘客的位置数据,根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段;所述每一个个体出行片段分别包括一次出行所途径的所有轨迹点,并且满足时间花费预设条件和有效路径预设条件;
步骤c:按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类,并根据所述聚类结果提取乘客的至少一个个体出行模式;所述个体出行模式包括{s o,s d,t 1,t 2,r}信息,表示在一天的某固定时间段[t 1,t 2],乘客超过设定阈值的出行是从出发站点s o前往另一个目的站点s d,并选择有效路径r;
步骤d:基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理,并根据所述补全后的个体出行片段提取乘客的完整出行轨迹。
本申请实施例采取的技术方案还包括:所述步骤a中,所述构建地铁网络 图包括:
用G=(V,E)标识地铁网络图,其中V是标识地铁站点的非空集合,E为地铁网络图的边集;所述地铁网络图中的每一个节点V i分别包括地铁物理站点信息V i.s、所属线路V i.l和方向V i.d,如果两个节点之间符合以下两个预设规则中的任意一个,则表示所述地铁网络图存在带权重的有向边e i,j
第一预设规则:如果两个节点V i和V j是同一条物理线路的先后经过的两个相邻站点,其边的权重为列车通过这两个站点所花费的时间;
第二预设规则:如果两个节点所属站点是不同物理线路的同一个物理站点,且所述站点为换乘站点,其边的权重为换乘步行时间与平均等待时间之和。
本申请实施例采取的技术方案还包括:所述步骤a中,所述根据所述地铁网络图获取每一位乘客的至少一条有效路径包括:
给定起始站点s i和目的站点s j,基于所述地铁网络图,使用前n条最短路径计算方法得到从属于{v i|v i.s=s i}的节点到属于{v j|v j.s=s j}的节点的前k条最短路径作为有效路径;每条有效路径分别包括开始节点、途径换乘节点集合和终点节点。
本申请实施例采取的技术方案还包括:在所述步骤b中,所述根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段包括:
按照MacID字段对所述位置数据进行分组,得到每一位乘客的个体出行轨迹信息,并按位置数据采集时间的先后对所述个体出行轨迹信息进行排序,得到每一位乘客的轨迹点序列;
根据所述花费时间和所述有效路径将每一位乘客的轨迹点序列划分为多个个体出行片段。
本申请实施例采取的技术方案还包括:在所述步骤b中,
所述时间花费预设条件为:
在每一个个体出行片段中,任意两个相邻轨迹点之间的时间差不能大于两站之间的最大时间;
所述有效路径预设条件为:
所述每一个个体出行片段中的所有轨迹点都属于从起始站点到目的站点之间的有效路径途径站点。
本申请实施例采取的技术方案还包括:在所述步骤c中,所述按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类具体为:采用基于核密度估计的聚类算法对所述轨迹点进行聚类;所述基于核密度估计的聚类算法包括:
选定计算核密度的带宽h;
根据核密度公式f计算每个点的局部密度ρ:
Figure PCTCN2020093744-appb-000001
上述公式中,
Figure PCTCN2020093744-appb-000002
为密度函数f(x)的核密度估计;
Figure PCTCN2020093744-appb-000003
为核函数;h为带宽;
代入高斯核函数后计算出每个点x i的局部密度ρ i
Figure PCTCN2020093744-appb-000004
根据所述局部密度计算每个点与最近邻的更高密度点的相对距离δ i=min ρj>ρi|x i-x j|,其中x j∈X且i≠j,|x i-x j|为时间差;
将局部密度ρ和相对距离δ的二维空间分布图作为决策图,选取具有较大ρ和δ的数据点作为类簇中心;
计算各个个体出行片段的中位时间,根据所述个体出行片段的中位时间与所述类簇中心的距离对所述个体出行片段进行归类。
本申请实施例采取的技术方案还包括:在所述步骤c中,所述根据所述聚类结果提取乘客的至少一个个体出行模式包括:
统计所述多个出行片段中第一轨迹点和最后一个轨迹点对应站点的被检测总次数和持续时间,并按照被检测总次数和持续时间分别选择前N/2个站点作为可能的起始站点和目的站点;
对于所述N个站点中的任意两个站点,提取其有效路径,如果存在覆盖所述个体出行片段的比例大于设定阈值λ的有效路径,则将该有效路径作为对应出行模式的有效路径r,并将所述两个站点作为起始站点s o和目的站点s d,将覆盖到的所述个体出行片段中起始站点s o出现的最早时间和目的站点s d被检测到的最晚时间作为固定时间段[t 1,t 2]。
本申请实施例采取的技术方案还包括:在所述步骤d中,所述基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理包括:
顺序读取所述多个个体出行片段中的连续两个出行片段,如果前一个出行片段的最后一个点与后一个出行片段的第一个点之间的间隔时间差小于设定时间阈值,且将所述前一个出行片段的最后一个点插入到所述后一个出行片段的第一个点之前后,所述后一个出行片段仍然满足所述时间花费预设条件和有效路径预设条件,则执行所述将前一个出行片段的最后一个点插入到所述后一个出行片段的第一个点之前的操作;以及如果将所述后一个出行片段的第一个点插入到所述前一个出行片段的最后一个点之后,所述前一个出行片段仍然满足所述时间花费预设条件和有效路径预设条件,则执行所述将所述后一个出行片段的第一个点插入到所述前一个出行片段的最后一个点的操作。
本申请实施例采取的技术方案还包括:在所述步骤d中,所述基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理还包括:
针对所述多个出行片段中的每一个出行片段,首先判断是否存在出行模式p i∈P,且乘车过程tr包含在该出行模式中,如果存在,用轨迹模型中对应的OD和路径对所述出行片段进行补全处理;其中所述乘车过程tr包括进站站点tr.s o、出站站点tr.s d、进站时间tr.t o、出站时间tr.t d、路径tr.r。
本申请实施例采取的技术方案还包括:在所述步骤d中,所述根据所述补全后的个体出行片段提取乘客的完整出行轨迹包括:
提取所述补全后的每一个出行片断对应的乘车过程,将所述乘车过程的进站站点和进站时间设置为所述出行片段的第一个点的站点和时间,将所述乘车过程的出站站点和出站时间设置为所述出行片段的最后一个点的站点和时间,将所述乘车过程设置为所述出行片段途径的路径,以获取到乘客的完整出行轨迹。
本申请实施例采取的另一技术方案为:一种城市公共交通乘客出行轨迹估计系统,包括:
路径获取模块:用于构建地铁网络图,根据所述地铁网络图获取每一位乘客的至少一条有效路径;所述有效路径包括所通过的线路、站点、路径长度或/和花费时间;
出行片段划分模块:用于获取乘客的位置数据,根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段;所述每一个个体出行片段分别包括一次出行所途径的所有轨迹点,并且满足时间花费预设条件和有效路径预设条件;
出行模式提取模块:用于按照一天内所属时间属性对所述多个个体出行片 段中的轨迹点进行聚类,并根据所述聚类结果提取乘客的至少一个个体出行模式;所述个体出行模式包括{s o,s d,t 1,t 2,r}信息,表示在一天的某固定时间段[t 1,t 2],乘客超过设定阈值的出行是从出发站点s o前往另一个目的站点s d,并选择有效路径r;
出行轨迹提取模块:用于基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理,并根据所述补全后的个体出行片段提取乘客的完整出行轨迹。
本申请实施例采取的又一技术方案为:一种终端,所述终端包括处理器、与所述处理器耦接的存储器,其中,
所述存储器存储有用于实现所述城市公共交通乘客出行轨迹估计方法的程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以控制城市公共交通乘客出行轨迹估计。
本申请实施例采取的又一技术方案为:一种存储介质,存储有处理器可运行的程序指令,所述程序指令用于执行所述城市公共交通乘客出行轨迹估计方法。
相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质按照预定规则将AP设备采集的位置数据划分为多个个体出行片段,按照时间属性对每一位乘客的个体出行片段集合中的轨迹点进行聚类,提取每一位乘客的多个个体出行模式,基于乘客的出行模式集合对个体出行片段中的残缺信息进行补全处理,并根据补全后的个体出行片段提取乘客的完整出行轨迹。相比现有技术,本申请实施例能够获取到覆盖面更广、数量更大的样本,为乘客出行轨迹分析提供 了较为完整的数据基础,对全网客流量的分析具有非常重要的意义。
附图说明
图1是本申请实施例的城市公共交通乘客出行轨迹估计方法的流程图;
图2为本申请实施例的城市公共交通乘客出行轨迹估计系统结构示意图;
图3为本申请实施例的终端结构示意图;
图4为本申请实施例的存储介质的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
请参阅图1,是本申请实施例的城市公共交通乘客出行轨迹估计方法的流程图。本申请实施例的城市公共交通乘客出行轨迹估计方法包括以下步骤:
步骤100:通过地铁站内的AP设备收集乘客的位置数据;
步骤100中,位置数据的收集方式具体为:通过AP设备定时(例如15秒钟)采集周边的移动设备,收集移动设备对应乘客的多条位置数据,每一条位置数据分别表示乘客的一个时空位置点p={id,s,time},其中id为乘客移动设备的唯一标识,s为地铁站点,time为位置数据的采集时间。
步骤200:对采集的位置数据进行预处理,将每一位乘客的位置数据划分为多个个体出行片段;
步骤200中,数据预处理具体包括以下步骤:
步骤201:根据地铁网络特征构建地铁网络图,并根据地铁网络图获取每一位乘客的前k条有效路径;
其中,地铁网络特征具体为:一个地铁系统由多个物理站点S={s 1,s 2,…,s |S|}和多条物理线路L={l 1,l 2,…,l |L|}组成,其中每条物理线路分别包括多个有序的物理站点,并包括上行和下行两个方向,即D={d 1,d 2},且上行和下行两个方向的物理站点的序列(正序和倒序)相反。物理站点包括普通站点和换乘站点,其中普通站点为只有一条物理线路通过的站点,换乘站点为有至少两条物理线路通过的站点,乘客可以在换乘站点换乘不同的物理线路。乘客从一个物理站点前往另一个物理站点所选择的一条或多条物理线路(包括换乘)即为该乘客的出行轨迹。
基于上述,地铁网络图的构建方式具体为:用G=(V,E)标识地铁网络图,其中V是标识地铁站点的非空集合,E为图的边集。地铁网络图中的每一个节点V i分别包括地铁物理站点信息V i.s、所属线路V i.l和方向V i.d,如果两个节点之间符合以下两个预设规则中的任意一个,则表示地铁网络图存在带权重的有向边e i,j:
第一预设规则:如果两个节点V i和V j是同一条物理线路的先后经过的两个相邻站点,其边的权重为列车通过这两个站点所花费的时间。
第二预设规则:如果两个节点所属站点是不同物理线路的同一个物理站点,且该站点为换乘站站点,其边的权重为换乘步行时间与平均等待时间之和,该权重可以通过实际测量得到。
本申请实施例中,有效路径是指:给定任意两个物理站点s o和s d,所述两个站点之间的前k条有效路径表示为R={r 1,r 2,...,r k},每条有效路径分别包括所通过的线路、站点、路径长度或/和所花费时间。
基于上述,本申请实施例中的有效路径获取方式为:给定起始站点s i和目的站点s j,基于地铁网络图,使用前n条最短路径计算方法得到从节点(属于 集合{v i|v i.s=s i})到节点(属于集合{v j|v j.s=s j})的前k条最短路径作为有效路径,其中每条有效路径分别包括开始节点、途径换乘节点集合和终点节点等关键节点信息。
步骤202:按照MacID字段对AP设备收集到的位置数据进行分组,得到每一位乘客的个体出行轨迹信息,并按数据采集时间的先后对个体出行轨迹信息进行排序,得到每位乘客在一段时间内的轨迹点序列P={p 1,p 2,…,p |P|};
步骤203:根据花费时间和有效路径将每一位乘客的轨迹点序列划分为多个出行片段,得到每一位乘客的个体出行片段集合SG={sg 1,sg 2,…,sg n};
本申请实施例中,乘客的一次出行tr是指一次逻辑的乘车过程,即一次从进站到出站的全过程,包括进站站点tr.s o、出站站点tr.s d、进站时间tr.t o、出站时间tr.t d、路径tr.r。而每一个个体出行片段中分别包括一次出行所途径的所有轨迹点,并且满足以下时间花费预设条件和有效路径预设条件:
时间花费预设条件:在每一个个体出行片段G={p i,p i+1,…,p i+m}中,任意两个相邻轨迹点之间的时间差不能大于两站之间的最大时间,即
Figure PCTCN2020093744-appb-000005
其中
Figure PCTCN2020093744-appb-000006
是站点s i和站点s j之间的最短时间,Δ t是可容忍的时间,Δ t值可根据实际时间场景进行设置。
有效路径预设条件:给定一个个体出行片段G={p i,p i+1,…,p i+m},其中的所有轨迹点都属于从起始站点s i到目的站点s j之间的有效路径途径站点。
基于以上两个预设条件,顺序遍历每一位乘客的轨迹点序列中的每一个轨迹点,将其划分为多个个体出行片段,得到每一位乘客的个体出行片段集合SG={sg 1,sg 2,…,sg n};乘客可能由于进站、出站和换乘等原因会在某站点的逗留时间较长,导致出行片段中存在多个连续检测到的轨迹点属于同一站点的情况,为了节省空间和统计需求,本申请实施例将这些轨迹点进行合并,只记录进入 该站点的开始时间和持续时间。
步骤300:按照一天内所属的时间属性对每一位乘客的个体出行片段集合中的轨迹点进行聚类,并从聚类得到的每类出行片段中提取每一位乘客的多个个体出行模式;
步骤300中,由于公共交通乘客的出行具有时空规律性,即个体乘客在一天的固定时段从一个站点前往另一个站点,且对具有相同起点和终点的出行,个体乘客习惯选择一条熟悉的线路。因此本申请实施例首先基于该时空规律性对个体出行片段中的轨迹点进行聚类,提取乘客出行模式,并基于乘客出行模式对其个体出行片段中残缺信息进行补全,得到乘客的完整出行轨迹。
其中,乘客的每一种个体出行模式p用于描述用户出行的时空规律性,一个个体出行模式p包含{s o,s d,t 1,t 2,r}信息,表示在一天的某固定时间段[t 1,t 2],乘客超过设定阈值λ的出行是从某出发站点s o前往另一个目的站点s d,并选择有效路径r。该阈值λ优选设定为≥50%,例如在100天中,张三有60%的出行是在8:30~9:30之间从大学城到深圳北站,并选择了耗时最短的有效路径。
进一步地,个体出行模式提取主要包括以下步骤:
步骤301:将每一位乘客的个体出行片段集合中的轨迹点按照一天内所属的时间属性进行聚类,并根据各个个体出行片段的中位时间与各聚类类别中心点的距离将其归类;
具体的,由于不同的乘客存在不同的出行规律,无法在聚类开始时确定聚类的类簇数量,因此本申请实施例采用一种能够自动确定类簇数量和类簇中心的新型快速聚类算法:基于核密度估计的聚类算法。该算法不仅适用于大规模数据的聚类分析,而且能够快速的进行离群噪声点的剔除工作。
基于核密度估计聚类算法的个体出行片段聚类具体包括:
1)选定计算核密度的带宽h;
2)根据核密度公式f计算每个点的局部密度ρ;
对于由轨迹中数据点的时间信息构成的数据集X={x 1,x 2,…x n},其中x i为该数据点时间信息的时分秒部分转化后的秒数,结合地铁的运营时间,例如深圳市地铁的运营时间为早上6:00到晚上12:00,仅保留位于R=[6*60*60,24*60*60]范围内的时间信息,目的是去除部分噪声点的影响。将X视为取值于R的独立分布随机变量,其服从的分布密度函数为f(x),定义函数:
Figure PCTCN2020093744-appb-000007
公式(1)中,
Figure PCTCN2020093744-appb-000008
为密度函数f(x)的核密度估计;
Figure PCTCN2020093744-appb-000009
为核函数;h为带宽,用于决定核函数作用的局部范围的大小,考虑到不同乘客的出行轨迹的时长不同,需要为每位乘客分别设定合适的h,本申请实施例将各个乘客的个体出行片段集合的平均时长作为其带宽参数,同时,为了避免异常数据的影响,首先将个体出行片段集合中过大和过小的轨迹时长剔除,然后再进行平均时长的计算。
代入高斯核函数后上式变为:
Figure PCTCN2020093744-appb-000010
通过公式(2)即可计算出每个点x i的局部密度ρ i
3)根据局部密度计算每个点与最近邻的更高密度点的相对距离
Figure PCTCN2020093744-appb-000011
其中x j∈X且i≠j,|x i-x j|为时间差;
4)将ρ和δ的二维空间分布图作为决策图,选取具有较大ρ和δ的数据点作为类簇中心;
5)确定类簇中心之后,计算各个个体出行片段的中位时间,根据个体出 行片段的中位时间与各类簇中心的距离(即时间差)将其归类。
步骤302:根据个体出行片段的聚类结果提取乘客的出行模式集合P={p 1,p 2,…,p |P|};
其中,通常情况下,乘客在起点、终点以及换乘站点所停留的时间要大于其它途径的站点,其被AP设备检测到的可能性也越大,基于此,本申请实施例通过以下步骤进行出行模式的提取:
(1)首先统计乘客的出行片段集合中第一轨迹点和最后一个轨迹点对应站点的被检测总次数和持续时间,并按照被检测总次数和持续时间分别选择前N/2个站点作为可能的起始站点和目的站点,其中N根据实际情况进行设定。
(2)对于N个站点中的任意两个站点,提取其有效路径,如果存在覆盖出行片段的比例大于设定阈值λ(例如50%)的有效路径,则将该有效路径作为对应出行模式的有效路径r,并将这两个站点作为s o,s d,将覆盖到的出行片段中s o出现的最早时间和s d被检测到的最晚时间作为[t 1,t 2]。相反,如果不存在覆盖出行片段的比例大于设定阈值λ的有效路径,则说明此乘客出行比较随意,没有对应的出行模式。
步骤400:基于乘客的出行模式集合对个体出行片段集合中的残缺信息进行补全处理,并根据补全后的个体出行片段集合SG'提取乘客的完整出行轨迹;
具体的,本申请实施例基于以下两种信息对个体出行片段集合SG中的残缺信息进行补全处理:
(1)基于乘客的个体出行模式对部分规律出行做补全;
(2)如果前一次出行与后一次出行的时间间隔小于设定阈值,则将前一次出行的终点作为后一次出行的起点。
进一步地,补全操作顺序包括:
第一步:顺序读取个体出行片段集合SG={sg 1,sg 2,…,sg n}中的连续两个出行片段sg i和sg i+1,如果前一个出行片段sg i的最后一个点与后一个出行片段sg i+1的第一个点之间的间隔时间差小于设定时间阈值ζ,且将前一个出行片段sg i的最后一个点插入到后一个出行片段sg i+1的第一个点之前后,后一个出行片段sg i+1仍然满足个体出行片段划分中的时间花费预设条件和有效路径预设条件,则执行上述的将sg i的最后一个点插入到sg i+1第一个点之前的操作;以及如果将后一个出行片段sg i+1的第一个点插入到前一个出行片段sg i的最后一个点之后,前一个出行片段sg i仍然满足个体出行片段划分中的时间花费预设条件和有效路径预设条件,则执行上述的将后一个出行片段sg i+1的第一个点插入到前一个出行片段sg i的最后一个点之后的操作。
第二步:针对出行片段集合SG={sg 1,sg 2,…,sg n}中的每一个出行片段sg,首先判断是否存在出行模式p i∈P,且乘车过程tr包含在该出行模式中,如果存在,用轨迹模型中对应的OD(交通起止点)和路径对该出行片段进行补全处理;否则不做补全处理。
第三步,重新执行第一步,得到补全后的出行片段集合SG'={sg' 1,sg' 2,…,sg' n}。
得到补全后的出行片段集合SG'={sg' 1,sg' 2,…,sg' n}后,提取每一个出行片断sg' i对应的乘车过程tr i,将tr i的进站站点和进站时间设置为该出行片段的第一个点的站点和时间,将tr i的出站站点和出站时间设置为该出行片段的最后一个点的站点和时间,将tr i设置为该出行片段途径的路径,从而获取到乘客的完整出行轨迹。
请参阅图2,是本申请实施例的城市公共交通乘客出行轨迹估计系统的结构示意图。本申请实施例的城市公共交通乘客出行轨迹估计系统40包括:
路径获取模块41:用于构建地铁网络图,根据所述地铁网络图获取每一位乘客的至少一条有效路径;所述有效路径包括所通过的线路、站点、路径长度或/和花费时间;
出行片段划分模块42:用于获取乘客的位置数据,根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段;所述每一个个体出行片段分别包括一次出行所途径的所有轨迹点,并且满足时间花费预设条件和有效路径预设条件;
出行模式提取模块43:用于按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类,并根据所述聚类结果提取乘客的至少一个个体出行模式;所述个体出行模式包括{s o,s d,t 1,t 2,r}信息,表示在一天的某固定时间段[t 1,t 2],乘客超过设定阈值的出行是从出发站点s o前往另一个目的站点s d,并选择有效路径r;
出行轨迹提取模块44:用于基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理,并根据所述补全后的个体出行片段提取乘客的完整出行轨迹。
为了验证本申请实施例的可行性和有效性,采用深圳市一个月内地铁站监测乘客通信设备的移动轨迹数据进行实验,实验结果表明本申请实施例在补全效果上优于现有技术。
请参阅图3,为本申请实施例的终端结构示意图。该终端50包括处理器51、与处理器51耦接的存储器52。
存储器52存储有用于实现上述城市公共交通乘客出行轨迹估计方法的程序指令。
处理器51用于执行存储器52存储的程序指令以控制城市公共交通乘客出 行轨迹估计。
其中,处理器51还可以称为CPU(Central Processing Unit,中央处理单元)。处理器51可能是一种集成电路芯片,具有信号的处理能力。处理器51还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
请参阅图4,为本申请实施例的存储介质的结构示意图。本申请实施例的存储介质存储有能够实现上述所有方法的程序文件61,其中,该程序文件61可以以软件产品的形式存储在上述存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。
本申请实施例的城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质按照预定规则将AP设备采集的位置数据划分为多个个体出行片段,按照时间属性对每一位乘客的个体出行片段集合中的轨迹点进行聚类,提取每一位乘客的多个个体出行模式,基于乘客的出行模式集合对个体出行片段中的残缺信息进行补全处理,并根据补全后的个体出行片段提取乘客的完整出行轨迹。相比现有技术,本申请实施例能够获取到覆盖面更广、数量更大的样本,为乘客出行轨迹分析提供了较为完整的数据基础,对全网客流量的分析具有非常重要的意义。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (13)

  1. 一种城市公共交通乘客出行轨迹估计方法,其特征在于,包括以下步骤:
    步骤a:构建地铁网络图,根据所述地铁网络图获取每一位乘客的至少一条有效路径;所述有效路径包括所通过的线路、站点、路径长度或/和花费时间;
    步骤b:获取乘客的位置数据,根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段;所述每一个个体出行片段分别包括一次出行所途径的所有轨迹点,并且满足时间花费预设条件和有效路径预设条件;
    步骤c:按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类,并根据所述聚类结果提取乘客的至少一个个体出行模式;所述个体出行模式包括{s o,s d,t 1,t 2,r}信息,表示在一天的某固定时间段[t 1,t 2],乘客超过设定阈值的出行是从出发站点s o前往另一个目的站点s d,并选择有效路径r;
    步骤d:基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理,并根据所述补全后的个体出行片段提取乘客的完整出行轨迹。
  2. 根据权利要求1所述的城市公共交通乘客出行轨迹估计方法,其特征在于,所述步骤a中,所述构建地铁网络图包括:
    用G=(V,E)标识地铁网络图,其中V是标识地铁站点的非空集合,E为地铁网络图的边集;所述地铁网络图中的每一个节点V i分别包括地铁物理站点信息V i.s、所属线路V i.l和方向V i.d,如果两个节点之间符合以下两个预设规则中的任意一个,则表示所述地铁网络图存在带权重的有向边e i,j
    第一预设规则:如果两个节点V i和V j是同一条物理线路的先后经过的两个相邻站点,其边的权重为列车通过这两个站点所花费的时间;
    第二预设规则:如果两个节点所属站点是不同物理线路的同一个物理站点, 且所述站点为换乘站点,其边的权重为换乘步行时间与平均等待时间之和。
  3. 根据权利要求2所述的城市公共交通乘客出行轨迹估计方法,其特征在于,所述步骤a中,所述根据所述地铁网络图获取每一位乘客的至少一条有效路径包括:
    给定起始站点s i和目的站点s j,基于所述地铁网络图,使用前n条最短路径计算方法得到从属于{v i|v i.s=s i}的节点到属于{v j|v j.s=s j}的节点的前k条最短路径作为有效路径;每条有效路径分别包括开始节点、途径换乘节点集合和终点节点。
  4. 根据权利要求1所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤b中,所述根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段包括:
    按照MacID字段对所述位置数据进行分组,得到每一位乘客的个体出行轨迹信息,并按位置数据采集时间的先后对所述个体出行轨迹信息进行排序,得到每一位乘客的轨迹点序列;
    根据所述花费时间和所述有效路径将每一位乘客的轨迹点序列划分为多个个体出行片段。
  5. 根据权利要求4所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤b中,
    所述时间花费预设条件为:
    在每一个个体出行片段中,任意两个相邻轨迹点之间的时间差不能大于两站之间的最大时间;
    所述有效路径预设条件为:
    所述每一个个体出行片段中的所有轨迹点都属于从起始站点到目的站点之间的有效路径途径站点。
  6. 根据权利要求5所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤c中,所述按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类具体为:采用基于核密度估计的聚类算法对所述轨迹点进行聚类;所述基于核密度估计的聚类算法包括:
    选定计算核密度的带宽h;
    根据核密度公式f计算每个点的局部密度ρ:
    Figure PCTCN2020093744-appb-100001
    上述公式中,
    Figure PCTCN2020093744-appb-100002
    为密度函数f(x)的核密度估计;
    Figure PCTCN2020093744-appb-100003
    为核函数;h为带宽;
    代入高斯核函数后计算出每个点x i的局部密度ρ i
    Figure PCTCN2020093744-appb-100004
    根据所述局部密度计算每个点与最近邻的更高密度点的相对距离
    Figure PCTCN2020093744-appb-100005
    其中x j∈X且i≠j,|x i-x j|为时间差;
    将局部密度ρ和相对距离δ的二维空间分布图作为决策图,选取具有较大ρ和δ的数据点作为类簇中心;
    计算各个个体出行片段的中位时间,根据所述个体出行片段的中位时间与所述类簇中心的距离对所述个体出行片段进行归类。
  7. 根据权利要求6所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤c中,所述根据所述聚类结果提取乘客的至少一个个体出行模式包括:
    统计所述多个出行片段中第一轨迹点和最后一个轨迹点对应站点的被检测总次数和持续时间,并按照被检测总次数和持续时间分别选择前N/2个站点作为可能的起始站点和目的站点;
    对于所述N个站点中的任意两个站点,提取其有效路径,如果存在覆盖所述个体出行片段的比例大于设定阈值λ的有效路径,则将该有效路径作为对应出行模式的有效路径r,并将所述两个站点作为起始站点s o和目的站点s d,将覆盖到的所述个体出行片段中起始站点s o出现的最早时间和目的站点s d被检测到的最晚时间作为固定时间段[t 1,t 2]。
  8. 根据权利要求1所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤d中,所述基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理包括:
    顺序读取所述多个个体出行片段中的连续两个出行片段,如果前一个出行片段的最后一个点与后一个出行片段的第一个点之间的间隔时间差小于设定时间阈值,且将所述前一个出行片段的最后一个点插入到所述后一个出行片段的第一个点之前后,所述后一个出行片段仍然满足所述时间花费预设条件和有效路径预设条件,则执行所述将前一个出行片段的最后一个点插入到所述后一个出行片段的第一个点之前的操作;以及如果将所述后一个出行片段的第一个点插入到所述前一个出行片段的最后一个点之后,所述前一个出行片段仍然满足所述时间花费预设条件和有效路径预设条件,则执行所述将所述后一个出行片段的第一个点插入到所述前一个出行片段的最后一个点的操作。
  9. 根据权利要求8所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤d中,所述基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理还包括:
    针对所述多个出行片段中的每一个出行片段,首先判断是否存在出行模式p i∈P,且乘车过程tr包含在该出行模式中,如果存在,用轨迹模型中对应的OD和路径对所述出行片段进行补全处理;其中所述乘车过程tr包括进站站点tr.s o、出站站点tr.s d、进站时间tr.t o、出站时间tr.t d、路径tr.r。
  10. 根据权利要求9所述的城市公共交通乘客出行轨迹估计方法,其特征在于,在所述步骤d中,所述根据所述补全后的个体出行片段提取乘客的完整出行轨迹包括:
    提取所述补全后的每一个出行片断对应的乘车过程,将所述乘车过程的进站站点和进站时间设置为所述出行片段的第一个点的站点和时间,将所述乘车过程的出站站点和出站时间设置为所述出行片段的最后一个点的站点和时间,将所述乘车过程设置为所述出行片段途径的路径,以获取到乘客的完整出行轨迹。
  11. 一种城市公共交通乘客出行轨迹估计系统,其特征在于,包括:
    路径获取模块:用于构建地铁网络图,根据所述地铁网络图获取每一位乘客的至少一条有效路径;所述有效路径包括所通过的线路、站点、路径长度或/和花费时间;
    出行片段划分模块:用于获取乘客的位置数据,根据所述至少一条有效路径将所述位置数据划分为多个个体出行片段;所述每一个个体出行片段分别包括一次出行所途径的所有轨迹点,并且满足时间花费预设条件和有效路径预设条件;
    出行模式提取模块:用于按照一天内所属时间属性对所述多个个体出行片段中的轨迹点进行聚类,并根据所述聚类结果提取乘客的至少一个个体出行模式;所述个体出行模式包括{s o,s d,t 1,t 2,r}信息,表示在一天的某固定时间段[t 1,t 2],乘客超过设定阈值的出行是从出发站点s o前往另一个目的站点s d,并选择有效路径r;
    出行轨迹提取模块:用于基于所述出行模式对所述个体出行片段中的残缺信息进行补全处理,并根据所述补全后的个体出行片段提取乘客的完整出行轨迹。
  12. 一种终端,其特征在于,所述终端包括处理器、与所述处理器耦接的存储器,其中,
    所述存储器存储有用于实现权利要求1-10任一项所述的城市公共交通乘客出行轨迹估计方法的程序指令;
    所述处理器用于执行所述存储器存储的所述程序指令以控制城市公共交通乘客出行轨迹估计。
  13. 一种存储介质,其特征在于,存储有处理器可运行的程序指令,所述程序指令用于执行权利要求1至10任一项所述城市公共交通乘客出行轨迹估计方法。
PCT/CN2020/093744 2020-06-01 2020-06-01 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质 WO2021243516A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2020/093744 WO2021243516A1 (zh) 2020-06-01 2020-06-01 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2020/093744 WO2021243516A1 (zh) 2020-06-01 2020-06-01 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质

Publications (1)

Publication Number Publication Date
WO2021243516A1 true WO2021243516A1 (zh) 2021-12-09

Family

ID=78830093

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2020/093744 WO2021243516A1 (zh) 2020-06-01 2020-06-01 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质

Country Status (1)

Country Link
WO (1) WO2021243516A1 (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114529043A (zh) * 2022-01-05 2022-05-24 深圳大学 一种城市空间组团划分方法
CN114723163A (zh) * 2022-04-26 2022-07-08 深圳市城市交通规划设计研究中心股份有限公司 分时段客流时空分配方法、系统、电子设备及存储介质
CN114822066A (zh) * 2022-04-14 2022-07-29 北京百度网讯科技有限公司 车辆定位方法、装置、电子设备和存储介质
CN114896507A (zh) * 2022-05-27 2022-08-12 桂林电子科技大学 一种基于时空结构的地铁路径推荐方法
CN114937241A (zh) * 2022-06-01 2022-08-23 北京凯利时科技有限公司 基于过渡区的客流统计方法和系统以及计算机程序产品
CN114971229A (zh) * 2022-05-10 2022-08-30 东南大学 基于刷卡与定位数据的轨道交通线路客流车次匹配方法
CN114999151A (zh) * 2022-05-24 2022-09-02 电子科技大学 Gps轨迹中基于密度的城市交通流分层次分析方法及装置
CN115098798A (zh) * 2022-06-09 2022-09-23 福州大学 融合地图数据的多元交通流城市空间组织模式识别方法
CN115580830A (zh) * 2022-12-07 2023-01-06 成都智元汇信息技术股份有限公司 一种基于ap探针多点定位的乘客违规路径检测方法及装置
CN115866529A (zh) * 2023-03-02 2023-03-28 深圳市深圳通有限公司 清分模型结果验证方法、装置、设备及存储介质
CN115934701A (zh) * 2023-01-06 2023-04-07 深圳市城市交通规划设计研究中心股份有限公司 基于知识图谱的个体出行补全方法、电子设备及存储介质
CN116028827A (zh) * 2022-12-31 2023-04-28 中国电子科技集团公司信息科学研究院 基于车辆gps轨迹数据聚类的轨迹补全方法
CN116233823A (zh) * 2023-05-10 2023-06-06 深圳市城市交通规划设计研究中心股份有限公司 一种跨城通勤圈的识别方法、电子设备及存储介质
CN116543310A (zh) * 2023-06-30 2023-08-04 眉山环天智慧科技有限公司 一种基于Voronoi图和核密度的道路线提取方法
CN116028827B (zh) * 2022-12-31 2024-05-31 中国电子科技集团公司信息科学研究院 基于车辆gps轨迹数据聚类的轨迹补全方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108882168A (zh) * 2017-05-10 2018-11-23 腾讯科技(深圳)有限公司 出行轨迹获取方法、装置及服务器
CN109348404A (zh) * 2018-10-09 2019-02-15 上海世脉信息科技有限公司 一种大数据环境下个体出行道路轨迹提取的方法
CN109508471A (zh) * 2018-09-21 2019-03-22 长安通信科技有限责任公司 运动轨迹补全方法及装置、可读存储介质
CN110337067A (zh) * 2019-07-25 2019-10-15 深圳市口袋网络科技有限公司 一种运动轨迹生成方法、装置及相关组件

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108882168A (zh) * 2017-05-10 2018-11-23 腾讯科技(深圳)有限公司 出行轨迹获取方法、装置及服务器
CN109508471A (zh) * 2018-09-21 2019-03-22 长安通信科技有限责任公司 运动轨迹补全方法及装置、可读存储介质
CN109348404A (zh) * 2018-10-09 2019-02-15 上海世脉信息科技有限公司 一种大数据环境下个体出行道路轨迹提取的方法
CN110337067A (zh) * 2019-07-25 2019-10-15 深圳市口袋网络科技有限公司 一种运动轨迹生成方法、装置及相关组件

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XU CHAO ,JI MINHE: "An Algorithm for Repairing Missing Trajectories of GPS Data in Personal Light-rail Travel", JOURNAL OF TRANSPORT INFORMATION AND SAFETY, vol. 30, no. 169, 20 August 2012 (2012-08-20), pages 6 - 10, XP055877158, ISSN: 1674-4861, DOI: 10.3969/j.issn.1674-4861.2012.04.002 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114529043A (zh) * 2022-01-05 2022-05-24 深圳大学 一种城市空间组团划分方法
CN114822066A (zh) * 2022-04-14 2022-07-29 北京百度网讯科技有限公司 车辆定位方法、装置、电子设备和存储介质
CN114723163A (zh) * 2022-04-26 2022-07-08 深圳市城市交通规划设计研究中心股份有限公司 分时段客流时空分配方法、系统、电子设备及存储介质
CN114971229A (zh) * 2022-05-10 2022-08-30 东南大学 基于刷卡与定位数据的轨道交通线路客流车次匹配方法
CN114999151A (zh) * 2022-05-24 2022-09-02 电子科技大学 Gps轨迹中基于密度的城市交通流分层次分析方法及装置
CN114999151B (zh) * 2022-05-24 2023-01-24 电子科技大学 Gps轨迹中基于密度的城市交通流分层次分析方法及装置
CN114896507B (zh) * 2022-05-27 2024-03-19 桂林电子科技大学 一种基于时空结构的地铁路径推荐方法
CN114896507A (zh) * 2022-05-27 2022-08-12 桂林电子科技大学 一种基于时空结构的地铁路径推荐方法
CN114937241A (zh) * 2022-06-01 2022-08-23 北京凯利时科技有限公司 基于过渡区的客流统计方法和系统以及计算机程序产品
CN114937241B (zh) * 2022-06-01 2024-03-26 北京凯利时科技有限公司 基于过渡区的客流统计方法和系统以及计算机程序产品
CN115098798A (zh) * 2022-06-09 2022-09-23 福州大学 融合地图数据的多元交通流城市空间组织模式识别方法
CN115580830B (zh) * 2022-12-07 2023-03-10 成都智元汇信息技术股份有限公司 一种基于ap探针多点定位的乘客违规路径检测方法及装置
CN115580830A (zh) * 2022-12-07 2023-01-06 成都智元汇信息技术股份有限公司 一种基于ap探针多点定位的乘客违规路径检测方法及装置
CN116028827A (zh) * 2022-12-31 2023-04-28 中国电子科技集团公司信息科学研究院 基于车辆gps轨迹数据聚类的轨迹补全方法
CN116028827B (zh) * 2022-12-31 2024-05-31 中国电子科技集团公司信息科学研究院 基于车辆gps轨迹数据聚类的轨迹补全方法
CN115934701A (zh) * 2023-01-06 2023-04-07 深圳市城市交通规划设计研究中心股份有限公司 基于知识图谱的个体出行补全方法、电子设备及存储介质
CN115866529A (zh) * 2023-03-02 2023-03-28 深圳市深圳通有限公司 清分模型结果验证方法、装置、设备及存储介质
CN116233823A (zh) * 2023-05-10 2023-06-06 深圳市城市交通规划设计研究中心股份有限公司 一种跨城通勤圈的识别方法、电子设备及存储介质
CN116233823B (zh) * 2023-05-10 2023-08-01 深圳市城市交通规划设计研究中心股份有限公司 一种跨城通勤圈的识别方法、电子设备及存储介质
CN116543310A (zh) * 2023-06-30 2023-08-04 眉山环天智慧科技有限公司 一种基于Voronoi图和核密度的道路线提取方法
CN116543310B (zh) * 2023-06-30 2023-10-31 眉山环天智慧科技有限公司 一种基于Voronoi图和核密度的道路线提取方法

Similar Documents

Publication Publication Date Title
WO2021243516A1 (zh) 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质
CN111681421B (zh) 基于手机信令数据的对外客运枢纽集疏空间分布分析方法
CN108320501B (zh) 基于用户手机信令的公交线路识别方法
Zhang et al. Revealing intra-urban travel patterns and service ranges from taxi trajectories
Wang et al. A comparative analysis of intra-city human mobility by taxi
CN107241512B (zh) 基于手机数据的城际交通出行方式判断方法和设备
Ma et al. Transit smart card data mining for passenger origin information extraction
CN106529711B (zh) 用户行为预测方法及装置
CN110874668B (zh) 一种轨道交通od客流预测方法、系统及电子设备
CN112288131B (zh) 公交站点优化方法、电子设备及计算机可读存储介质
Kazagli et al. Estimation of arterial travel time from automatic number plate recognition data
CN110472999B (zh) 基于地铁和共享单车数据的客流模式分析方法及装置
CN111932925A (zh) 一种公共交通站点的出行客流的确定方法、装置及系统
Wan et al. Classifying human activity patterns from smartphone collected GPS data: A fuzzy classification and aggregation approach
Mishalani et al. Use of mobile device wireless signals to determine transit route-level passenger origin–destination flows: Methodology and empirical evaluation
CN113766428A (zh) 城市公共交通乘客出行轨迹估计方法、系统、终端以及存储介质
JP6307376B2 (ja) 交通分析システム、交通分析プログラムおよび交通分析方法
CN112686417B (zh) 一种地铁大客流预测方法、系统及电子设备
Su et al. Data-driven method for passenger path choice inference in congested subway network
Ou et al. Big data processing and analysis on the impact of COVID-19 on public transport delay
Jang et al. Pedestrian mode identification, classification and characterization by tracking mobile data
CN112990518B (zh) 一种地铁个体乘客目的站点实时预测方法及装置
CN104121917B (zh) 一种自动发现新建桥梁的方法和装置
Wang et al. Spatio-temporal anomaly detection in traffic data
CN111931968B (zh) 一种应用手机gps数据来优化公共自行车站点布局的方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20939203

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20939203

Country of ref document: EP

Kind code of ref document: A1