CN112288131A - 公交站点优化方法、电子设备及计算机可读存储介质 - Google Patents
公交站点优化方法、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN112288131A CN112288131A CN202011013023.8A CN202011013023A CN112288131A CN 112288131 A CN112288131 A CN 112288131A CN 202011013023 A CN202011013023 A CN 202011013023A CN 112288131 A CN112288131 A CN 112288131A
- Authority
- CN
- China
- Prior art keywords
- bus
- user
- getting
- stop
- signaling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000005457 optimization Methods 0.000 title claims abstract description 40
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 230000011664 signaling Effects 0.000 claims abstract description 312
- 238000009826 distribution Methods 0.000 claims abstract description 57
- 230000033001 locomotion Effects 0.000 claims description 47
- 238000001914 filtration Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 101100182248 Caenorhabditis elegans lat-2 gene Proteins 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/047—Optimisation of routes or paths, e.g. travelling salesman problem
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0204—Market segmentation
- G06Q30/0205—Location or geographical consideration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Mobile Radio Communication Systems (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供了一种公交站点优化方法、电子设备及计算机可读存储介质,其中,该方法包括:获取公交车单程运行时段内的用户信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据;对用户和公交车的信令轨迹数据进行一致性比较,得到各站点相应时间段的乘车用户;根据乘车用户统计得到各公交站点的上车用户和下车用户;根据至少一天的用户信令轨迹数据集分析上车用户和下车用户的工作地和居住地;根据用户的工作地和居住地确定相应公交站点的稳定停留地点;根据稳定停留地点得到相应公交站点的相关上下车用户的稳定停留地点分布并计算其中心位置,并以此调整公交站点。通过上述方案能够提升公交站点优化效果。
Description
技术领域
本发明涉及数据分析技术领域,尤其涉及一种公交站点优化方法、电子设备及计算机可读存储介质。
背景技术
随着城市公共交通的迅猛发展与人们出行需求的日益提高,公交车路网的覆盖面积逐步扩大,而为缓解高峰期拥堵,各地方有关部门或多或少制定了公交出行相关政策,有效缓解了交通拥堵。但是由于城市建设的快速发展,公共交通出行用户的需求多种多样,而且现有公交线路设计存在站点设计不合理,所以会出现高峰时期车辆泊入排队等现象,这不但会影响公交自身入站出站效率,还会造成路面整体交通拥堵。所以,现有公交线路设计实际上并不能满足人们的出行需求。
现有公交车线路优化方法,通常采取基于公交车的轨迹数据、刷卡数据等实现对公交用户行为的追踪并为公交车线路优化提供决策建议。然而,公交车刷卡数据通常只能提供用户上下车时间点,如果单程刷卡就只有上车或者下车的数据,据此无法对用户的公交通勤进行延续追踪,也无法知道用户利用公交通勤的有效性,例如上车前或者下车后是否还需要其他交通方式,所以,利用公交车的自有数据进行公交线路优化缺乏用户数据的有效支撑,难以达到较好的优化效果。
发明内容
有鉴于此,本发明提供了一种公交站点优化方法、电子设备及计算机可读存储介质,以提升公交站点优化效果。
为了达到上述目的,本发明采用以下方案实现:
根据本发明实施例的一个方面,提供了一种公交站点优化方法,包括:
获取公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据;
对用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据进行一致性比较,得到所述公交车在单程运行时段内驶经每个公交站点时的乘车用户;
根据所述公交车在单程运行时段内驶经每个公交站点时的乘车用户,统计得到所述公交车驶经各公交站点时的上车用户和下车用户;
根据至少一天的用户移动信令轨迹数据集,分析得到所述公交车驶经各公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息;
根据所述公交车驶经每个公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息,确定相应公交站点的每个上车用户上车前的稳定停留地点和每个下车用户下车后的稳定停留地点;
根据所述公交车驶经每个公交站点时的所有上车用户上车前的稳定停留地点和所有下车用户下车后的稳定停留地点,得到相应公交站点的相关上下车用户的稳定停留地点分布,并计算相应公交站点的相关上下车用户的稳定停留地点分布的中心位置;
根据所述公交车驶经的各公交站点的相关上下车用户的稳定停留地点分布的中心位置调整所述公交车驶经的公交站点的位置。
在一些实施例中,获取公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,包括:
获取初始时间范围的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,并获取所述公交车的运行时刻表;其中,所述用户移动信令轨迹数据集中的每条移动信令轨迹数据包括用户唯一标识和与其对应的基站位置序列及信令时间序列;所述车载POS机中手机号的信令轨迹数据包括该手机号的用户唯一标识和与其对应的基站位置序列及信令时间序列;所述运行时刻表包括公交站点信息序列和相应的站点驶经时间序列;
根据所述公交车的运行时刻表的站点驶经时间序列中的首站点出发时间和末站点到达时间,对初始时间范围的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据进行过滤,得到位于所述公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据;
对用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据进行一致性比较,得到所述公交车在单程运行时段内驶经每个公交站点时的乘车用户,包括:
根据所述公交车的运行时刻表中的站点驶经时间序列确定包括所述公交车驶经的至少两个公交站点的设定时间段;
从所述公交车的单程运行时段内的用户移动信令轨迹数据集中查找信令时间序列与所述设定时间段存在交叠的用户移动信令轨迹数据,得到所述公交车在所述设定时间段内的疑似乘车用户与其基站位置子序列;
从所述公交车的单程运行时段内的车载POS机中手机号的信令轨迹数据中查找所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列;
通过比较所述公交车在所述设定时间段内的疑似乘车用户的基站位置子序列对应的用户所处地理网格分布和所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列对应的公交车所驶经地理网格分布的相似度,从所述公交车在所述设定时间段内的疑似乘车用户中提取出所述公交车在所述设定时间段内的乘车用户,得到所述公交车在单程运行时段中的所述设定时间段所驶经的每个公交站点的乘车用户;
根据所述公交车在单程运行时段内驶经每个公交站点时的乘车用户,统计得到所述公交车驶经各公交站点时的上车用户和下车用户,包括:
根据所述公交车在单程运行总时段内的各不同设定时间段所驶经的每个公交站点的乘车用户,统计得到所述公交车的各乘车用户的乘车轨迹;
根据所述公交车的各乘车用户的乘车轨迹,得到所述公交车驶经各公交站点时的上车用户和下车用户。
在一些实施例中,根据至少一天的用户移动信令轨迹数据集,分析得到所述公交车驶经各公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息,包括:
针对所述公交车驶经各公交站点时的上车用户和下车用户中每个用户,将至少一天的用户信令轨迹数据集中的信令轨迹数据中的基站位置序列转换为设定大小的地理网格的序列;
根据每个用户的地理网格的序列统计相应用户在其中各地理网格中的白天停留时长和夜晚停留时长;
将每个用户的同一天内最长的白天停留时长对应的地理网格作为相应用户在该天的工作地网格,以及将每个用户的同一天内最长的夜晚停留时长对应的地理网格作为相应用户在该天的居住地网格;
根据每个用户的在设定天数内出现次数最多的工作地网格得到相应用户的工作地信息,以及根据每个用户的在设定天数内出现次数最多的居住地网格得到相应用户的居住地信息。
在一些实施例中,根据所述公交车驶经每个公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息,确定相应公交站点的每个上车用户上车前的稳定停留地点和每个下车用户下车后的稳定停留地点,包括:
根据所述公交车驶经的每个公交站点的位置信息和相应公交站点的上车用户的工作地信息和居住地信息,确定相应公交站点的每个上车用户的工作地和居住地中距离相应公交站点较近者,作为相应上车用户在相应公交站点上车前的稳定停留地点;
根据所述公交车驶经的每个公交站点的位置信息和相应公交站点的下车用户的工作地信息和居住地信息,确定相应公交站点的每个下车用户的工作地和居住地中距离相应公交站点较近者,作为相应下车用户在相应公交站点下车后的稳定停留地点。
在一些实施例中,计算相应公交站点的相关上下车用户的稳定停留地点分布的中心位置,包括:
利用DBScan算法计算公交站点的相关上下车用户的稳定停留地点分布的至少一个簇和相应的簇中心位置。
在一些实施例中,根据所述公交车驶经的各公交站点的相关上下车用户的稳定停留地点分布的中心位置调整所述公交车驶经的公交站点的位置,包括:
在所述公交车驶经的公交站点的相关上下车用户的稳定停留地点分布的中心位置与最近的所述公交车驶经的公交站点的距离大于设定距离的情况下,调整相应中心位置附近的所述公交车驶经的公交站点的位置,或根据相应中心位置确定新增所述公交车驶经的公交站点的位置。
在一些实施例中,根据至少一天的用户移动信令轨迹数据集,分析得到所述公交车驶经各公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息之前,所述方法,还包括:
过滤掉所述公交车驶经每个公交站点时的上车用户中在上车前的设定距离行程中的移动速度超过设定速度阈值的用户,并过滤掉所述公交车驶经每个公交站点时的下车用户中在下车后的行程中的移动速度超过设定速度阈值的用户;
和/或,
根据所述公交车驶经每个公交站点时的所有上车用户上车前的稳定停留地点和所有下车用户下车后的稳定停留地点,得到相应公交站点的相关上下车用户的稳定停留地点分布,并计算相应公交站点的相关上下车用户的稳定停留地点分布的中心位置之前,所述方法,包括:
过滤掉所述公交车驶经的每个公交站点的上车用户中其上车前的稳定停留地点超过设定距离阈值的用户,并过滤掉所述公交车驶经的每个公交站点的下车用户中其下车后的稳定停留地点超过设定距离阈值的用户。
在一些实施例中,获取公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,还包括:
根据位于所述公交车的单程运行时段内的公交车车载POS机中手机号的信令轨迹数据,确定所述公交车到达每个公交站点时前后一段时间内所对应的geohash方格,并从位于所述公交车的单程运行时段内的用户移动信令轨迹数据集中,提取位于所述公交车到达相应公交站点时前后一段时间内所对应的geohash方格内的用户移动信令轨迹数据。
在一些实施例中,获取公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,还包括:
对所述公交车的单程运行时段内的用户移动信令轨迹数据集进行去噪,以滤除位于公交车车载POS机中手机号的信令轨迹数据对应的地理网格之外的用户移动信令轨迹数据;
和/或,
用户所处地理网格分布和公交车所驶经地理网格分布均用geohash方格表示;
通过比较所述公交车在所述设定时间段内的疑似乘车用户的基站位置子序列对应的用户所处地理网格分布和所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列对应的公交车所驶经地理网格分布的相似度,从所述公交车在所述设定时间段内的疑似乘车用户中提取出所述公交车在所述设定时间段内的乘车用户,得到所述公交车在单程运行时段中的所述设定时间段所驶经的每个公交站点的乘车用户,包括:
将所述公交车在所述设定时间段内的疑似乘车用户的基站位置子序列转化为相应用户所处的geohash方格,将所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列转化为相应公交车所处的geohash方格;
计算所述公交车在所述设定时间段内的每个疑似乘车用户所处的geohash方格和所述车载POS机中手机号的对应于所述设定时间段的公交车所处的geohash方格的相似度;
在相似度不小于设定相似度阈值的情况下,将相应疑似乘车用户确定为所述公交车驶经相应公交站点时的乘车用户;
获取初始时间范围的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,包括:
获取初始时间范围的移动信令数据集,其中,所述移动信令数据集中的每条移动信令数据包括用户唯一标识、信令时间戳、及基站唯一标识;
将所述移动信令数据集中的所有移动信令数据按其中的用户唯一标识分组,并将每组移动信令数据按信令时间戳的大小进行排序,得到初始时间范围的初始移动信令轨迹数据集,其中,所述初始移动信令轨迹数据集中的每条移动信令轨迹数据包括用户唯一标识与相应的信令时间戳序列及基站唯一标识序列;
将初始时间范围的初始移动信令轨迹数据集中的信令时间戳序列转换为相应的信令时间序列,并根据初始时间范围的初始信令轨迹数据集中的基站唯一标识获取到相应基站位置信息,从而得到包括用户唯一标识和与其对应的基站位置序列及信令时间序列的初始时间范围的移动信令轨迹数据集;
从初始时间范围的移动信令轨迹数据集提取得到初始时间范围的公交车车载POS机中手机号的信令轨迹数据,并根据其余信令轨迹数据构成的集合得到初始时间范围的用户移动信令轨迹数据集。
根据本发明实施例的另一个方面,还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述方法的步骤。
根据本发明实施例的另一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一实施例所述方法的步骤。
本发明实施例的公交站点优化方法、电子设备及计算机可读存储介质,利用移动信令轨迹数据对公交用户乘车情况进行分析,实现了对公交用户的延续追踪,所以能够更有效地分析用户的出行需求,从而实现提升公交站点优化效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明一实施例的公交站点优化方法的流程示意图;
图2是本发明一具体实施例的公交站点优化方法的流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
移动通信技术的快速进步,4G网络的广泛覆盖以及下一代移动通信技术的快速演进和发展,手机终端的渗透率已经达到很高的程度。当用户使用手机终端时,手机会持续地与基站交互,当手机附着到基站对应的扇区,可以认为当前手机的位置是处在该基站覆盖范围内,所以在定位精度要求不高时,可以认为基站的中心位置等同于手机的当前位置,从而可以利用蜂窝数据网络实现手机的基站定位,并产生对应的轨迹数据。
基于此,面对现有公交车线路优化方法缺乏用户数据的有效支撑,难以达到较好的优化效果的问题,发明人考虑到,从移动终端与基站通信的信令数据中提取用户的出行轨迹序列,利用基站位置实现对手机终端用户的轨迹定位,由于手机处于开机的状态会持续地与基站交互,产生信令轨迹数据,所以能够通过信令轨迹对用户进行追踪并结合工作居住地情况分析用户的通勤行为。因此,利用被动监测的移动信令轨迹数据,可以有效地分析用户的出行需求、工作地点、居住地点等,从而可以持续有效地延伸追踪公交用户的出行情况,进而能够有效地优化公共站点。
为此,本发明实施例提供了一种公交站点优化方法,以基于移动信令数据实现公交站点的优化,提升优化效果。
图1是本发明一实施例的公交站点优化方法的流程示意图。如图1所示,一些实施例的公交站点优化方法可包括以下步骤S110~S170。
下面将对步骤S110至步骤S170的具体实施方式进行详细说明。
步骤S110:获取公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据。
该步骤S110中,单程运行时段是指首站出发到末站到达所需时间,公交车在一天的运行时段内可以包含多个单程运行时段。单程运行时段主要是强调数据是成段的,以此可以便于后续分析得到上车用户和下车用户,所以,用来优化公交站点的数据可以包含一个单程运行时段的数据,或者,可以包括多个单程运行时段的数据,例如,可以利用每天相同时段的单程运行时段的信令轨迹数据一起进行分析,以此可以便于搜集到更多信令轨迹数据。
移动信令轨迹数据集是根据移动终端和基站交互产生信令数据得到,可以记录基站的变化,以此可以反映移动终端的位置变化。移动信令轨迹数据集包含大量信令轨迹数据,可以是根据历史信令数据得到,如前一个月采集的信令数据,或者可以是现场采集的信令数据;信令数据采集范围可以根据需要优化的公交站点所在区域确定,以便于得到当前公交站点附近的用户的数据。通过筛选出公交车运行时段的信令轨迹数据,能够使得信令轨迹数据和当前公交路网在时间上匹配起来。用户移动信令轨迹数据集包括很多用户的移动信令轨迹数据,公交车车载POS机中有SIM卡,可以利用该SIM卡中手机号的信令轨迹数据得到公交车的信息,从而可以利用用户的移动信令轨迹数据和公交车的信令轨迹数据分析这些用户与公交车的相关情况。
为了获取公交车的单程运行时段内的信令轨迹数据,可以先获得较大时间范围内的信令轨迹数据,再依据时间进行过滤,得到所需信令轨迹数据。
示例性地,上述步骤S110,即,获取公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,具体可包括步骤:
S111,获取初始时间范围的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,并获取所述公交车的运行时刻表;其中,所述用户移动信令轨迹数据集中的每条移动信令轨迹数据包括用户唯一标识和与其对应的基站位置序列及信令时间序列;所述车载POS机中手机号的信令轨迹数据包括该手机号的用户唯一标识和与其对应的基站位置序列及信令时间序列;所述运行时刻表包括公交站点信息序列和相应的站点驶经时间序列;
S112,根据所述公交车的运行时刻表的站点驶经时间序列中的首站点出发时间和末站点到达时间,对初始时间范围的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据进行过滤,得到位于所述公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据。
上述步骤S111中,初始时间范围例如可以是从一天到几个月不等的时间范围。用户唯一标识可以是手机号,一个用户唯一标识可以认为对应一个用户;移动信令轨迹数据中的基站位置序列是指按时间顺序排列的基站位置,基站位置可以根据信令数据中的基站唯一标识从基站配置表中查找得到,可以用经纬度信息表示;移动信令轨迹数据中的信令时间序列是指信令数据到来的时间构成的序列,可以根据信令数据中的时间戳转换得到时间点,时间点可以是一小段时长,具体时间范围可以视需要分析的那组数据的选取情况确定,以此可以便于减小时间所占存储空间。用户的移动信令轨迹数据和公交车的移动信令轨迹数据属于同一类型数据,其所包含的具体数据内容可以一致。运行时刻表中的公交站点信息序列包括按公交车线路顺序排列的公交站点信息,每个公交站点的公交站点信息可包括公交站点标识(如站点名称)和公交站点位置(可以用经纬度信息表示),以此可知数据分析所针对的站点;运行时刻表中的站点驶经时间序列包括公交车依次驶经每个站点的时间点,可以包括进站时间和出站时间,以此可知公交车在该站点的停留时长,例如,一个时间点可以是60s-300s范围内的时长。
上述步骤S112中,可以从较大时间范围的信令轨迹数据中提取出单程运行时段的数据。可以根据公交车运行时刻表从POS机SIM卡的轨迹数据中过滤得到公交车运行时间段的轨迹数据信息,并可按照公交车单程运行分段,即从首站出发到末站到达时刻内(即,单程运行时段)的轨迹数据为一段。
该实施例中,可以先得到较大范围的移动信令轨迹数据集,再从中提取符合所需时段的数据。其他实施例中,可以先得到符合时段要求的信令数据,再根据信令数据得到移动信令轨迹数据。另外,用户的移动信令轨迹数据和公交车的移动信令轨迹数据的获取方式、先后顺序,数据的具体内容、形式,可以采用多种不同方式实施。
为了进一步减少信令轨迹数据量,上述步骤S110的具体实施例中,在得到位于所述公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据之后,即,过滤得到单程运行时段内的轨迹数据之后,还可以进一步过滤得到公交车到达的公交站点附近的用户移动信令轨迹数据。
示例性地,上述步骤S110,即,获取公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,除了包括上述步骤S111和步骤S112,还可包括步骤:根据位于所述公交车的单程运行时段内的公交车车载POS机中手机号的信令轨迹数据,确定所述公交车到达每个公交站点时前后一段时间内所对应的geohash方格,并从位于所述公交车的单程运行时段内的用户移动信令轨迹数据集中,提取位于所述公交车到达相应公交站点时前后一段时间内所对应的geohash方格内的用户移动信令轨迹数据。其中,所述的前后一段时间可以根据需要进行确定。公交车到达每个公交站点的时刻可以结合运行时刻表和公交车车载POS机中手机号的信令轨迹数据中的信令时间序列确定。
为了得到所需的信令轨迹数据,可以先得到移动信令数据,再对移动信令进行统计处理,得到所需的信令轨迹数据。
示例性地,上述步骤S111中,获取初始时间范围的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,具体可包括步骤:
S1111,获取初始时间范围的移动信令数据集,其中,所述移动信令数据集中的每条移动信令数据包括用户唯一标识、信令时间戳、及基站唯一标识;
S1112,将所述移动信令数据集中的所有移动信令数据按其中的用户唯一标识分组,并将每组移动信令数据按信令时间戳的大小进行排序,得到初始时间范围的初始移动信令轨迹数据集,其中,所述初始移动信令轨迹数据集中的每条移动信令轨迹数据包括用户唯一标识与相应的信令时间戳序列及基站唯一标识序列;
S1113,将初始时间范围的初始移动信令轨迹数据集中的信令时间戳序列转换为相应的信令时间序列,并根据初始时间范围的初始信令轨迹数据集中的基站唯一标识获取到相应基站位置信息,从而得到包括用户唯一标识和与其对应的基站位置序列及信令时间序列的初始时间范围的移动信令轨迹数据集;
S1114,从初始时间范围的移动信令轨迹数据集提取得到初始时间范围的公交车车载POS机中手机号的信令轨迹数据,并根据其余信令轨迹数据构成的集合得到初始时间范围的用户移动信令轨迹数据集。
上述步骤S1111~S1114中,移动信令数据集可以从基于手机移动信令数据建立的全量或增量的手机信令轨迹日志基础库中读取得到。用户的唯一标识可表示为UserNum,可以使用SIM卡的手机号或IMSI作为唯一标识;用户可以对应该手机中的SIM卡,可以是实际手机用户的SIM卡,也可以是公交车中刷卡机中的物联网SIM卡;用户的唯一标识UserNum的数据类型可为字符串。基站的唯一标识可表示为BTSID,可以由基站的运营商ID、原始设备制造商ID、LAC(Location Area Code,位置区编码)、CI(小区识别)等构成字符串类型。时间戳Timestamp可以为Unix时间戳,即从1970年1月1日(UTC/GMT的午夜)开始所经过的秒数,在计算机中使用长整型Long的数据类型表示,例如可为64位整数(占据空间8字节),数据范围可为-9,223,372,036,854,775,808~9,223,372,036,854,775,807。基站的位置信息可以用GPS的经度Lng和纬度Lat表示。
当手机附着到基站或是手机和基站通信时就会产生一条信令日志,该条信令日志可包括用户唯一标识UserNum、时间戳Timestamp、基站唯一标识BTSID、基站位置Lng,Lat。将轨迹位置数据按照用户唯一标识UserNum分组,对每个手机号的位置数据按照出现的时间戳Timestamp顺序进行排序,构成同一个手机号(用户唯一标识/用户)的移动信令轨迹数据。收集公交车车载POS机中的SIM手机号,可以在手机信令轨迹日志基础库查询得到这个手机号(用户唯一标识)UserNum相关的日志信息。其他实施例中,可以以其他方式,如现场采集,得到公交车对应的移动信令轨迹数据。
为了得到更有效的用户移动信令轨迹数据,上述步骤S110中,可以对信令轨迹数据进行去噪。
示例性地,上述步骤S110,即,获取公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,可包括步骤:S113,对所述公交车的单程运行时段内的用户移动信令轨迹数据集进行去噪,以滤除位于公交车车载POS机中手机号的信令轨迹数据对应的地理网格之外的用户移动信令轨迹数据。该步骤S113可以在前述步骤S112之后执行。
该步骤S113中,可以将公交车SIM卡的基站位置GPS数据转换为公交车所驶经地理网格的数据,如geohash方格。然后,从可以所述公交车的单程运行时段内的用户移动信令轨迹数据集中去除位于公交车SIM卡经过的geohash方格之外的数据。例如,可以从全量手机信令轨迹日志基础库过滤满足一定时间段(该段公交车运行轨迹起止时刻)的用户移动信令轨迹数据,然后从这些用户移动信令轨迹数据中提取出位于现在公交车SIM卡经过的geohash方格的用户的手机轨迹数据,即,找到该手机在这个时间段内附着的基站GPS坐标位于公交车经过的geohash方格之内,并抽取这些手机在这个时间段内信令轨迹数据。
该实施例中,通过去除位于公交车经过的网格之外的用户的信令轨迹数据,能够更精确地得到公交车所经过的位置附着的手机用户。
步骤S120:对用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据进行一致性比较,得到所述公交车在单程运行时段内驶经每个公交站点时的乘车用户。
该步骤S120,用户移动信令轨迹数据中的位置和相应时间的公交车车载POS机中手机号的信令轨迹数据中的位置,若一致性较高,则该用户移动信令轨迹数据对应的用户可以认为是该公交车的乘车用户,以此可以通过一致性比较得到公交车的乘车用户。
在一些实施例中,可以通过计算网格间的相似度,对用户的移动信令轨迹数据和公交车的信令轨迹数据进行一致性比较。
示例性地,上述步骤S120,即,对用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据进行一致性比较,得到所述公交车在单程运行时段内驶经每个公交站点时的乘车用户,具体可包括步骤:
S121,根据所述公交车的运行时刻表中的站点驶经时间序列确定包括所述公交车驶经的至少两个公交站点的设定时间段;
S122,从所述公交车的单程运行时段内的用户移动信令轨迹数据集中查找信令时间序列与所述设定时间段存在交叠的用户移动信令轨迹数据,得到所述公交车在所述设定时间段内的疑似乘车用户与其基站位置子序列;
S123,从所述公交车的单程运行时段内的车载POS机中手机号的信令轨迹数据中查找所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列;
S124,通过比较所述公交车在所述设定时间段内的疑似乘车用户的基站位置子序列对应的用户所处地理网格分布和所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列对应的公交车所驶经地理网格分布的相似度,从所述公交车在所述设定时间段内的疑似乘车用户中提取出所述公交车在所述设定时间段内的乘车用户,得到所述公交车在单程运行时段中的所述设定时间段所驶经的每个公交站点的乘车用户。
上述步骤S121中,为了对一定时间段内的疑似乘车用户的轨迹数据和公交车的轨迹数据进行比较,可以先确定所选取的时间段。选取的设定时间段至少包括乘车用户的最短乘车时间,也就是,至少使得公交车驶经两个公交站点(可使用户从一个公交站上车并从另一个公交站下车)。另外,可以确定多个不同设定时间段,使得所有的设定时间段一起能够对应公交车整个运行里程中驶经的所有公交站点。
上述步骤S122和步骤S123中,可以从公交车的整个单程运行时段的用户移动信令轨迹数据集中过滤出设定时间段的用户移动信令轨迹数据。可以从公交车的整个单程运行时段的车载POS机中手机号的信令轨迹数据中过滤出设定时间段的车载POS机中手机号的移动信令轨迹数据。单程运行时段的用户移动信令轨迹数据集中信令轨迹数和车载POS机中手机号的信令轨迹数据中的信令时间序列是按时间顺序排序,且基站位置序列与信令时间序列对应,所以可以通过根据设定时间段从信令时间序列中取信令时间以及相应的基站位置,一般信令时间及基站位置可能不是一个数据点,可能是多个数据点,所以表述为基站位置子序列。
上述步骤S124中,可以预先将一定时间范围的各用户移动信令轨迹数据中基站位置数据和车载POS机中手机号的信令轨迹数据中的基站位置数据转换为地理网格的数据。可以在各个步骤执行节点将基站位置转换为地理网格的数据。
在一些实施例中,可以在得到上述设定时间段内的疑似乘车用户的数据和设定时间段内的车载POS机中手机号的数据后,将这些数据转换为地理网格表示的数据。例如,上述步骤S124之前可包括步骤:将所述公交车在所述设定时间段内的疑似乘车用户的基站位置子序列转换为对应的用户所处地理网格分布,并将所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列转换为对应的公交车所驶经地理网格分布,之后可以将得到的数据应用于步骤S124来计算相似度。
其他实施例中,可以在更早时候对更多数据转换为地理网格的数据,然后再执行过滤步骤得到比较相似度所需数据。例如,可以先在前述步骤S113中,先将公交车对应的信令轨迹数据转换为对应的用地理网格表示的时空数据,然后,将不再公交车对应的地理网格中的数据率除掉;然后,可以在该步骤S124中,先将用户的信令轨迹数据转换为地理网格对应的数据,然后与之前得到的公交车对应的用地理网格表示的数据计算相似度。
更具体地,上述步骤S124中的用户所处地理网格分布和公交车所驶经地理网格分布可以均用geohash方格表示,所以可以基于geohash方格计算相似度。
在此情况下,上述步骤S124,即,通过比较所述公交车在所述设定时间段内的疑似乘车用户的基站位置子序列对应的用户所处地理网格分布和所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列对应的公交车所驶经地理网格分布的相似度,从所述公交车在所述设定时间段内的疑似乘车用户中提取出所述公交车在所述设定时间段内的乘车用户,得到所述公交车在单程运行时段中的所述设定时间段所驶经的每个公交站点的乘车用户,具体可包括步骤:
S1241,将所述公交车在所述设定时间段内的疑似乘车用户的基站位置子序列转化为相应用户所处的geohash方格,将所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列转化为相应公交车所处的geohash方格;
S1242,计算所述公交车在所述设定时间段内的每个疑似乘车用户所处的geohash方格和所述车载POS机中手机号的对应于所述设定时间段的公交车所处的geohash方格的相似度;
S1243,在相似度不小于设定相似度阈值的情况下,将相应疑似乘车用户确定为所述公交车驶经相应公交站点时的乘车用户。
上述步骤S1241中,可以将公交车SIM卡的轨迹数据中的基站位置GPS数据转换为geohash方格,另外,该步骤可以在更早时候执行,如在上述步骤S113或之前执行。对乘坐公交车的手机号对应的轨迹数据中每个手机号的轨迹序列按照时间排序,若原位时间戳,还可将时间戳转化为时间点(如范围为60s-300s),若尚未根据时间进行过滤,还可取设定时间段内的轨迹数据,若尚未得到基站位置数据,可以根据信令日志中的手机基站编号从基站配置表获取基站的经纬度,并可转换为geohash方格,最后可以得到包括手机号码(用户唯一标识)、时间点(时间序列)、geohash方格(空间数据,地理网格序列/分布)的时空数据。
上述步骤S1242和步骤S1243中,可以将疑似乘车手机号的轨迹数据逐一与公交车运行时间段内轨迹数据做比对,满足轨迹相似性的即可认为是乘车可能性较高的手机用户。轨迹相似性判断方式例如可以是,在一定时间段(例如设定时间段的起止时间分别为ts、te,起止时间ts、te至少覆盖超过两个公交站点A、C的时刻点),疑似乘车手机号和公交车SIM卡的轨迹数据(包括时间点(时间数据)、geohash方格(空间数据)等)碰撞到或重叠的时空区块超过设定阈值,如90%,则可认为该疑似乘车手机号对应的手机用户在起止时间ts到te时段内极大可能为实际乘坐公交车经过公交站点从A到C的用户,所以可以认为这样的用户为乘车用户。
步骤S130:根据所述公交车在单程运行时段内驶经每个公交站点时的乘车用户,统计得到所述公交车驶经各公交站点时的上车用户和下车用户。
利用类似于上述步骤S1241~步骤S1243的方式,可以得到各个公交站点的乘车用户,基于这些数据进行统计,可以得到乘车用户的乘车轨迹,即用户从哪一站上车经过哪些公交站点,然后从哪一个公交站点下车。所以,在该步骤S130,基于前述步骤得到的数据,可以得到公交车每个公交站点的上车用户和下车用户。
具体实施时,上述步骤S130,即,根据所述公交车在单程运行时段内驶经每个公交站点时的乘车用户,统计得到所述公交车驶经各公交站点时的上车用户和下车用户,具体可包括步骤:
S131,根据所述公交车在单程运行总时段内的各不同设定时间段所驶经的每个公交站点的乘车用户,统计得到所述公交车的各乘车用户的乘车轨迹;
S132,根据所述公交车的各乘车用户的乘车轨迹,得到所述公交车驶经各公交站点时的上车用户和下车用户。
上述步骤S131中,可以获取到大概率乘坐公交车用户的轨迹(可包括公交车站点时刻、公交车站点位置等),当用户在站点时刻t1处于公交车站点1所在的位置区块,则认为用户乘坐公交经过了站点1,以此可得到用户乘坐公交车所经历的全部站点。另外,按照公交车站点统计在经过每个站点用户的数量,可以得到每个站点的乘客数。用户经历的站点从站点1开始,则可认为在站点1上车,统计公交车在每个站点的上车用户数,并保留用户编号。用户经历的最后一个站点为站点1,则可认为在站点1下车,统计公交车在每个站点的下车人数,并保留用户编号。如此一来可以得到各公交站点时的上车用户和下车用户。
为了使得公交站点的优化方案更好的满足仅乘坐公交车这一类机动车的人群的需求,可以剔除不仅乘公交车还乘其他交机动车的用户。
示例性地,在执行后续步骤(如步骤S140)之前,图1所示的方法,还可包括步骤:S180,过滤掉所述公交车驶经每个公交站点时的上车用户中在上车前的设定距离行程中的移动速度超过设定速度阈值的用户,并过滤掉所述公交车驶经每个公交站点时的下车用户中在下车后的行程中的移动速度超过设定速度阈值的用户。
该步骤S180中,可以对前述得到的手机号数据(上车用户和下车用户)作进一步过滤。具体地,例如,可计算用户在设定时间段的终止时间te时刻后一段时间内的累计移动距离,并计算移动速度,若移动速度太快,如10分钟内超过5km,则可认为这部分用户是通过机动车出行的方式与公交车伴随,并不是仅乘坐公交车,则可排除下车用户中的这部分用户。类似的,可以排除上车用户在上车前移动速度过快的用户。
经过上述步骤S180过滤后,可以认为剩下的用户为大概率乘车用户。进一步可以利用大概率乘车用户执行前述步骤S132,得到各公交站点时的上车用户和下车用户。
步骤S140:根据至少一天的用户移动信令轨迹数据集,分析得到所述公交车驶经各公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息。
该步骤S140中,可以基于移动信令日志库中各用户历史累计数据分析公交出行用户的居住工作地情况。所述工作地信息可以为工作地位置或相关信息,如行政区划;所述居住地信息可以为居住地位置或相关信息,如行政区划。考虑到工作时间是在白天,居住地主要体现在夜里,所以该步骤分析用户的工作地信息和居住地信息至少需要一天(如24小时)的用户移动信令轨迹数据。当然利用多天的数据可以得到更准确的分析结果。
具体可以,根据各公交站点的上车用户的用户唯一标识和下车用户的用户唯一标识,从信令轨迹数据集中各用户唯一标识对应的工作地信息中提取出各公交站点的上车用户的工作地信息和下车用户的工作地信息,从信令数据集中各用户唯一标识对应的居住地信息中提取出各公交站点的上车用户的居住地信息和下车用户的居住地信息。
具体实施时,上述步骤S140,即,根据至少一天的用户移动信令轨迹数据集,分析得到所述公交车驶经各公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息,具体可包括步骤:
S141,针对所述公交车驶经各公交站点时的上车用户和下车用户中每个用户,将至少一天的用户信令轨迹数据集中的信令轨迹数据中的基站位置序列转换为设定大小的地理网格的序列;
S142,根据每个用户的地理网格的序列统计相应用户在其中各地理网格中的白天停留时长和夜晚停留时长;
S143,将每个用户的同一天内最长的白天停留时长对应的地理网格作为相应用户在该天的工作地网格,以及将每个用户的同一天内最长的夜晚停留时长对应的地理网格作为相应用户在该天的居住地网格;
S144,根据每个用户的在设定天数内出现次数最多的工作地网格得到相应用户的工作地信息,以及根据每个用户的在设定天数内出现次数最多的居住地网格得到相应用户的居住地信息。
上述步骤S141中,可以根据GIS地图信息获取每个行政区域的GPS坐标范围,可以将信令轨迹数据中基站位置的GPS坐标转成设定大小的地理网格,可以用于计算用户在各地理网络的停留时间。
上述步骤S142和步骤S143中,可以根据白天时间段范围(如7:00-19:00)计算用户在地理网络中的白天停留时间,统计每天中用户对应的白天停留时间最长且超过白天设定时长阈值的地理网格作为当日工作地网格,并统计设定天数(如一个月)中日工作地网格出现次数最多的网格作为用户当月工作地网格。另外,可以根据夜晚时间段范围(如22:00-5:00)计算用户在地理网络中的白天停留时间,统计每天中用户对应的夜晚停留时间最长且超过夜晚设定时长阈值的地理网格作为当日居住地网格,并统计设定天数(如一个月)中日居住地网格出现次数最多的网格作为用户当月居住地网格。
步骤S150:根据所述公交车驶经每个公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息,确定相应公交站点的每个上车用户上车前的稳定停留地点和每个下车用户下车后的稳定停留地点。
前述步骤中得到各公交站点的工作地信息和居住地信息后,并不知道一个公交站点的上车用户是来自工作地还是居住地,或者下车用户是要去工作地还是居住地。所以,通过该步骤S150可以确定上车用户的来源地和下车用户的目的地。
具体实施时,上述步骤S150,即,根据所述公交车驶经每个公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息,确定相应公交站点的每个上车用户上车前的稳定停留地点和每个下车用户下车后的稳定停留地点,具体可包括步骤:
S151,根据所述公交车驶经的每个公交站点的位置信息和相应公交站点的上车用户的工作地信息和居住地信息,确定相应公交站点的每个上车用户的工作地和居住地中距离相应公交站点较近者,作为相应上车用户在相应公交站点上车前的稳定停留地点;
S152,根据所述公交车驶经的每个公交站点的位置信息和相应公交站点的下车用户的工作地信息和居住地信息,确定相应公交站点的每个下车用户的工作地和居住地中距离相应公交站点较近者,作为相应下车用户在相应公交站点下车后的稳定停留地点。
上述步骤S151~步骤S152中,获取公交上车用户工作地和居住地网格位置信息后,可以计算用户上车点离工作地、居住地距离,取距离较短的位置为上车来源地,去除距离大于一定范围的数据,可以计算每个站点上车用户到工作居住通勤上车站点平均距离;可以计算用户下车点离工作地、居住地就,并可取距离较短的为下车点目的地,去除距离大于一定范围的数据,据此可以进一步计算每个站点下车用户到工作居住通勤下车站点平均距离。
已知每条公交线路中每个乘客在上车时间点和上车位置、下车时间点和下车位置,可基于信令数据持续追踪乘客在上车前和下车后的起始和目标位置。当已知乘客上车地点和上车时刻,获取乘客在上车时刻之前的轨迹,乘客在上车时刻t1之前在从来源地出发时刻t2之间时间段内位置稳定不动,可以认为乘客在上车之前的稳定停留位置,即乘客在到达站点前的出发位置,去除超过一定距离范围的数据。当已知乘客下车地点和下车时刻后,可获取乘客在下车时刻之后的轨迹,乘客在下车时刻t3之后在到达目的地t5之间的时间段内位置稳定不动,可以认为乘客在下车之后的稳定停留位置,即乘客在到达站点后的目的位置,以此可以去除超过一定距离范围的数据。
为了更好地为需求意义更大的用户群体优化公交站点,可以去除为其优化公交站点意义不大的用户。
示例性地,后续步骤(如步骤S160)之前,图1所示方法还可包括步骤:S190,过滤掉所述公交车驶经的每个公交站点的上车用户中其上车前的稳定停留地点超过设定距离阈值的用户,并过滤掉所述公交车驶经的每个公交站点的下车用户中其下车后的稳定停留地点超过设定距离阈值的用户。
步骤S160:根据所述公交车驶经每个公交站点时的所有上车用户上车前的稳定停留地点和所有下车用户下车后的稳定停留地点,得到相应公交站点的相关上下车用户的稳定停留地点分布,并计算相应公交站点的相关上下车用户的稳定停留地点分布的中心位置。
该步骤S160中,可以合并前面所得上车前用户来源地和下车后用户目的地,并按照站点分组,可以得到每个站点相关的用户分布地。每个站点相关的用户可包括站点名、站点GPS位置(经纬度数据)等,其中,站点用户的经纬度数据可表示为[lng1,lat1;lng2,lat2;…]。对站点用户经纬度分布数据可以计算中心位置。
在一些实施例中,可以利用现有算法计算分布簇的中心位置。示例性地,上述步骤S160中,计算相应公交站点的相关上下车用户的稳定停留地点分布的中心位置,具体可包括步骤:S161,利用DBScan算法计算公交站点的相关上下车用户的稳定停留地点分布的至少一个簇和相应的簇中心位置。该步骤S161中,可以对站点用户经纬度分布数据利用DBScan算法距离,得到N个站点用户分布簇和簇中心点位置,并可以得到各簇所对应的用户数。其他实施例中,可以利用其他聚合算法计算中心位置。
步骤S170:根据所述公交车驶经的各公交站点的相关上下车用户的稳定停留地点分布的中心位置调整所述公交车驶经的公交站点的位置。
具体实施时,上述步骤S170,具体可包括步骤:S171,在所述公交车驶经的公交站点的相关上下车用户的稳定停留地点分布的中心位置与最近的所述公交车驶经的公交站点的距离大于设定距离的情况下,调整相应中心位置附近的所述公交车驶经的公交站点的位置,或根据相应中心位置确定新增所述公交车驶经的公交站点的位置。
该步骤S170中,可以根据DBScan算法得到的站点用户分布簇进行站点规划,当附近站点与中心点位置小于设定距离则不作站点调整,当附近站点与中心点位置大于设定距离则调整站点位置或是新设站点,并重新规划线路。
另外,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一实施例所述方法的步骤。
为使本领域技术人员更好地了解本发明,下面将以具体实施例说明本发明的实施方式。
图2是本发明一具体实施例的公交站点优化方法的流程示意图。如图2所示,为了解决公交线路优化的问题,,以更精确地对公交线路运行情况和用户通勤情况进行分析,该实施例的公交线路运行情况分析方法具体可包括如下步骤S1~S9。
S1.汇集移动信令数据,并对信令数据进行解析,以提取出信令数据中的有效信息;其中,每条信令数据可包括:移动终端用户标识、基站标识、时间戳等。
一条信令数据可以包含一个移动终端用户标识、一个基站标识、及一个时间戳。移动终端用户标识可以是手机号、IMSI(国际移动用户识别码)等;基站标识可以是由运营商ID、基站原始设备制造商ID、LAC(Location Area Code,位置区编码)、CI(小区识别)构成的字符串,时间戳可以是能够反映信令数据产生先后顺序等的信息的各种时间形式。
信令数据集可以是事先得到的数据,例如,当前时间前一个月的数据;或者,信令数据集可以是实时获取的数据,例如,不断获得的增量数据。
具体实施时,可以通过消息队列接收实时的信令数据,累积存储形成信令数据集。示例性地,获取信令数据集的步骤,具体可包括步骤:通过Kafka消息队列接收并存储实时的信令数据,得到信令数据集。该获取信令数据集的具体步骤中,通过Kafka消息队列可以方便地接入分布式集群传来的大量的信令数据。
可以从基站工参信息配置表中获取基站工参信息,基站工参信息可以包括基站位置和基站所属行政区划,还可以包括基站标识(如基站名称)、基站方位角、基站覆盖半径等。其中,基站所属行政区划具体可包括基站所属城市、区县、街道等各级行政区划信息。所获取的基站工参信息中的基站所属行政区划的级别可以是一个或多个,可以根据需要设定。
可以根据用户基站信令轨迹数据建立用户轨迹数据数据库,将轨迹位置数据按照UserNum分组,对每个手机号的位置数据按照出现的时间Timestamp排序,构成同一个手机号移动信令轨迹数据。
S2.收集公交车SIM卡数据,并从轨迹数据库中提取出公交车的轨迹序列数据,进一步,可以对轨迹数据进行降噪、geo删格化等处理,具体可包括以下步骤:
收集公交车车载POS机中的SIM手机号,在手机信令轨迹日志基础库查询得到这个手机号UserNum相关的日志信息;
获取公交车运行时刻表,可包括公交站点信息(可包括站点名称、站点GPS坐标位置等)、站点到达/出发时间等,并可将公交车实际运行情况与车载SIM卡数据比对,作为参考路径信息;
根据公交车运行时刻表,分别从POS机SIM的轨迹数据过滤公交车运行时间段的轨迹数据信息,并按照公交车单程运行分段,即从首站出发到末站到达时刻内的轨迹数据为一段;
对公交车SIM卡的轨迹数据进行去噪,然后将基站位置GPS数据转换为geohash方格。
S3.根据公交车的每段运行轨迹数据提取可能的乘坐公交车乘坐用户,主要可包括以下步骤:
1)初步抽取可能乘坐公交车的手机用户,具体可以,从全量手机信令轨迹日志基础库过滤满足一定时间段(该段公交车运行轨迹起止时刻)得到出现在公交车SIM卡经过的geohash方格的手机用户,即,该手机用户在该时间段内附着的基站GPS坐标位于公交车运行轨迹的geohash方格之内,并可以抽取这些手机用户在这个时间段内信令轨迹数据;
2)可对乘坐公交车的手机号对应的轨迹数据进行去噪处理;可以获取每个手机号的轨迹序列,按照时间排序,将时间戳转化为时间点(如范围为60s-300s),并取上述步骤1)中公交车起止时间范围内的轨迹数据,根据日志中的手机基站编号,从基站配置表获取基站的经纬度,并转换为geohash方格,最后可得出包括手机号码、时间点(时间数据)、geohash方格(空间数据)等的时空数据;
3)将疑似乘车手机号的轨迹数据逐一与公交车运行时间段内轨迹数据做比对,满足轨迹相似性的即为乘车可能性较高的手机用户;轨迹相似性判断方式可以是,在一定时间段(例如,时间段起止时间为ts、te,ts和te至少覆盖超过两个公交站点A、C的时刻点),疑似乘车手机号和公交车SIM卡的轨迹数据(时间点(时间数据)、geohash方格(空间数据))碰撞到的时空区块超过如90%时,可认为这个用户在ts到te时刻内极大可能乘坐公交班次从A到C;
4)对手机号数据作进一步过滤,计算用户在te时刻后一段时间内的累计移动距离(如10分钟内超过5km),则可认为这部分用户是通过机动车出行的方式与公交车伴随,并未乘坐公交车,则可从上述步骤3)中得到的手机号排除这部分用户。
S4.根据获取到大概率乘坐公交车用户的轨迹(可包括公交车站点时刻、公交车站点位置),当用户在站点时刻t1处于公交车站点1所在的位置区块,则可认为用户乘坐公交经过了站点1,得到用户乘坐公交车所经历的全部站点。
S5.按照公交车站点统计在经过每个站点用户的数量,即可得到每个站点的乘客数。
具体地,若用户经历的站点从站点1开始,则可认为在站点1上车,统计公交车在每个站点的上车用户数,并保留用户编号;若用户经历的最后一个站点为站点1,则可认为在站点1下车,统计公交车在每个站点的下车人数,并保留用户编号。
S6.为了提供公交车线路优化的分析数据,需要知道公交车用户的上车点和下车点是否合理,所以可以借助分析用户的居住工作地分析利用公交车通勤用户在上车前和下车后与出发地或者目的地间距。通常用户利用公交车通勤是往返于用户的工作地和居住地,而工作居住地通勤又是较为高频的通勤方式,需要借助信令轨迹数据分析出用户的工作地点和居住地点,分析方法可包括以下流程:
根据GIS地图信息获取每个行政区域的GPS坐标范围,将移动信令轨迹数据库中的GPS坐标转成设定大小的地理网格,并重新划分计算用户在各地理网络的停留时间;
根据白天时间段范围(如7:00-19:00)计算用户在地理网络中的白天停留时间,统计每天中用户对应的白天停留时间最长且超过白天设定时长阈值的地理网格作为当日工作地网格,统计一个月中日工作地网格出现次数最多的网格作为用户当月工作地网格;
根据夜晚时间段范围(如22:00-5:00)计算用户在地理网络中的白天停留时间,统计每天中用户对应的夜晚停留时间最长且超过夜晚设定时长阈值的地理网格作为当日居住地网格,统计一个月中日居住地网格出现次数最多的网格作为用户当月居住地网格。
S7.抽取公交上车用户工作地和居住地网格位置信息,计算用户上车点离工作地、居住地距离,取距离较短的位置为上车来源地,去除距离大于一定范围的数据,计算每个站点上车用户到上车站点平均距离;计算用户下车点离工作地、居住地就,取距离较短的为下车点目的地,去除距离大于一定范围的数据,计算每个站点下车用户到下车站点平均距离。
S8.利用公交车各站点上下车人数,用户上车前和下车后通勤距离对公交线路进行优化,包括新增班次、调整新增线路站点等,公交线路优化后,重复上述过程评估公交线路优化前后的上下车人流、用户非公交通勤平均距离等。
S9.基于步骤S5得到的数据可以得知每条公交线路中,每个乘客在上车时间点和上车位置、下车时间点和下车位置,所以,可基于信令数据持续追踪乘客在上车前和下车后的起始和目标位置。具体可包括以下过程:
(1)当已知乘客上车地点和上车时刻,获取乘客在上车时刻之前的轨迹,乘客在t1之前在t2时间段内位置稳定不动可以认为乘客在上车之前的稳定停留位置,即乘客在到达站点前的出发位置,去除超过一定距离范围的数据;
(2)当已知乘客下车地点和下车时刻,获取乘客在下车时刻之后的轨迹,乘客在t3之后在t5时间段内位置稳定不动可以认为乘客在下车之后的稳定停留位置,即乘客在到达站点后的目的位置,去除超过一定距离范围的数据;
(3)合并上述步骤(1)和(2)中上车前用户来源地或者下车后用户目的地并按照站点分组,可以得到每个站点相关的用户分布地;
(4)每个站点相关的用户可包括站点名、站点GPS位置(经纬度)等,站点用户的经纬度数据可表示为[lng1,lat1;lng2,lat2;…],对站点用户经纬度分布数据可利用DBScan算法(基于密度的聚类算法)距离,得到站点用户分布簇的N个中心点位置,以及各簇所对应的用户数;
(5)根据DBScan算法得到的站点用户分布簇进行站点规划,当附近站点与中心点位置小于设定距离则不作站点调整,当附近站点与中心点位置大于设定距离则调整站点位置或是新设站点,并重新规划线路。
本实施例中,通过对公交运行轨迹与路网进行匹配,基于公交运行的信令轨迹数据识别公交的伴随手机号码,以及基于手机信令数据分析用户居住工作,实现了利用被动监测的移动信令轨迹数据,有效地分析用户的出行需求、工作地点、居住地点等,从而能够持续有效地延伸追踪公交用户的出行情况,有效地优化公共站点。基于移动信令数据实现了对公交车线路运行情况,以及道路交通横断面流量进行分析,能够为公共交通规划与公交站点选址优化提供数据支撑。
综上所述,本发明实施例的公交站点优化方法、电子设备及计算机可读存储介质,利用移动信令轨迹数据对公交用户乘车情况进行分析,实现了对公交用户的延续追踪,所以能够更有效地分析用户的出行需求,从而实现提升公交站点优化效果。
在本说明书的描述中,参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本发明的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种公交站点优化方法,其特征在于,包括:
获取公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据;
对用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据进行一致性比较,得到所述公交车在单程运行时段内驶经每个公交站点时的乘车用户;
根据所述公交车在单程运行时段内驶经每个公交站点时的乘车用户,统计得到所述公交车驶经各公交站点时的上车用户和下车用户;
根据至少一天的用户移动信令轨迹数据集,分析得到所述公交车驶经各公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息;
根据所述公交车驶经每个公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息,确定相应公交站点的每个上车用户上车前的稳定停留地点和每个下车用户下车后的稳定停留地点;
根据所述公交车驶经每个公交站点时的所有上车用户上车前的稳定停留地点和所有下车用户下车后的稳定停留地点,得到相应公交站点的相关上下车用户的稳定停留地点分布,并计算相应公交站点的相关上下车用户的稳定停留地点分布的中心位置;
根据所述公交车驶经的各公交站点的相关上下车用户的稳定停留地点分布的中心位置调整所述公交车驶经的公交站点的位置。
2.如权利要求1所述的公交站点优化方法,其特征在于,
获取公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,包括:
获取初始时间范围的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,并获取所述公交车的运行时刻表;其中,所述用户移动信令轨迹数据集中的每条移动信令轨迹数据包括用户唯一标识和与其对应的基站位置序列及信令时间序列;所述车载POS机中手机号的信令轨迹数据包括该手机号的用户唯一标识和与其对应的基站位置序列及信令时间序列;所述运行时刻表包括公交站点信息序列和相应的站点驶经时间序列;
根据所述公交车的运行时刻表的站点驶经时间序列中的首站点出发时间和末站点到达时间,对初始时间范围的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据进行过滤,得到位于所述公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据;
对用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据进行一致性比较,得到所述公交车在单程运行时段内驶经每个公交站点时的乘车用户,包括:
根据所述公交车的运行时刻表中的站点驶经时间序列确定包括所述公交车驶经的至少两个公交站点的设定时间段;
从所述公交车的单程运行时段内的用户移动信令轨迹数据集中查找信令时间序列与所述设定时间段存在交叠的用户移动信令轨迹数据,得到所述公交车在所述设定时间段内的疑似乘车用户与其基站位置子序列;
从所述公交车的单程运行时段内的车载POS机中手机号的信令轨迹数据中查找所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列;
通过比较所述公交车在所述设定时间段内的疑似乘车用户的基站位置子序列对应的用户所处地理网格分布和所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列对应的公交车所驶经地理网格分布的相似度,从所述公交车在所述设定时间段内的疑似乘车用户中提取出所述公交车在所述设定时间段内的乘车用户,得到所述公交车在单程运行时段中的所述设定时间段所驶经的每个公交站点的乘车用户;
根据所述公交车在单程运行时段内驶经每个公交站点时的乘车用户,统计得到所述公交车驶经各公交站点时的上车用户和下车用户,包括:
根据所述公交车在单程运行总时段内的各不同设定时间段所驶经的每个公交站点的乘车用户,统计得到所述公交车的各乘车用户的乘车轨迹;
根据所述公交车的各乘车用户的乘车轨迹,得到所述公交车驶经各公交站点时的上车用户和下车用户。
3.如权利要求1所述的公交站点优化方法,其特征在于,根据至少一天的用户移动信令轨迹数据集,分析得到所述公交车驶经各公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息,包括:
针对所述公交车驶经各公交站点时的上车用户和下车用户中每个用户,将至少一天的用户信令轨迹数据集中的信令轨迹数据中的基站位置序列转换为设定大小的地理网格的序列;
根据每个用户的地理网格的序列统计相应用户在其中各地理网格中的白天停留时长和夜晚停留时长;
将每个用户的同一天内最长的白天停留时长对应的地理网格作为相应用户在该天的工作地网格,以及将每个用户的同一天内最长的夜晚停留时长对应的地理网格作为相应用户在该天的居住地网格;
根据每个用户的在设定天数内出现次数最多的工作地网格得到相应用户的工作地信息,以及根据每个用户的在设定天数内出现次数最多的居住地网格得到相应用户的居住地信息。
4.如权利要求1所述的公交站点优化方法,其特征在于,根据所述公交车驶经每个公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息,确定相应公交站点的每个上车用户上车前的稳定停留地点和每个下车用户下车后的稳定停留地点,包括:
根据所述公交车驶经的每个公交站点的位置信息和相应公交站点的上车用户的工作地信息和居住地信息,确定相应公交站点的每个上车用户的工作地和居住地中距离相应公交站点较近者,作为相应上车用户在相应公交站点上车前的稳定停留地点;
根据所述公交车驶经的每个公交站点的位置信息和相应公交站点的下车用户的工作地信息和居住地信息,确定相应公交站点的每个下车用户的工作地和居住地中距离相应公交站点较近者,作为相应下车用户在相应公交站点下车后的稳定停留地点。
5.如权利要求1所述的公交站点优化方法,其特征在于,计算相应公交站点的相关上下车用户的稳定停留地点分布的中心位置,包括:
利用DBScan算法计算公交站点的相关上下车用户的稳定停留地点分布的至少一个簇和相应的簇中心位置。
6.如权利要求1所述的公交站点优化方法,其特征在于,根据所述公交车驶经的各公交站点的相关上下车用户的稳定停留地点分布的中心位置调整所述公交车驶经的公交站点的位置,包括:
在所述公交车驶经的公交站点的相关上下车用户的稳定停留地点分布的中心位置与最近的所述公交车驶经的公交站点的距离大于设定距离的情况下,调整相应中心位置附近的所述公交车驶经的公交站点的位置,或根据相应中心位置确定新增所述公交车驶经的公交站点的位置。
7.如权利要求1所述的公交站点优化方法,其特征在于,
根据至少一天的用户移动信令轨迹数据集,分析得到所述公交车驶经各公交站点时的上车用户和下车用户中每个用户的工作地信息和居住地信息之前,所述方法,还包括:
过滤掉所述公交车驶经每个公交站点时的上车用户中在上车前的设定距离行程中的移动速度超过设定速度阈值的用户,并过滤掉所述公交车驶经每个公交站点时的下车用户中在下车后的行程中的移动速度超过设定速度阈值的用户;
和/或,
根据所述公交车驶经每个公交站点时的所有上车用户上车前的稳定停留地点和所有下车用户下车后的稳定停留地点,得到相应公交站点的相关上下车用户的稳定停留地点分布,并计算相应公交站点的相关上下车用户的稳定停留地点分布的中心位置之前,所述方法,包括:
过滤掉所述公交车驶经的每个公交站点的上车用户中其上车前的稳定停留地点超过设定距离阈值的用户,并过滤掉所述公交车驶经的每个公交站点的下车用户中其下车后的稳定停留地点超过设定距离阈值的用户。
8.如权利要求2所述的公交站点优化方法,其特征在于,获取公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,还包括:
根据位于所述公交车的单程运行时段内的公交车车载POS机中手机号的信令轨迹数据,确定所述公交车到达每个公交站点时前后一段时间内所对应的geohash方格,并从位于所述公交车的单程运行时段内的用户移动信令轨迹数据集中,提取位于所述公交车到达相应公交站点时前后一段时间内所对应的geohash方格内的用户移动信令轨迹数据。
9.如权利要求2所述的公交站点优化方法,其特征在于,
获取公交车的单程运行时段内的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,还包括:
对所述公交车的单程运行时段内的用户移动信令轨迹数据集进行去噪,以滤除位于公交车车载POS机中手机号的信令轨迹数据对应的地理网格之外的用户移动信令轨迹数据;
和/或,
用户所处地理网格分布和公交车所驶经地理网格分布均用geohash方格表示;
通过比较所述公交车在所述设定时间段内的疑似乘车用户的基站位置子序列对应的用户所处地理网格分布和所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列对应的公交车所驶经地理网格分布的相似度,从所述公交车在所述设定时间段内的疑似乘车用户中提取出所述公交车在所述设定时间段内的乘车用户,得到所述公交车在单程运行时段中的所述设定时间段所驶经的每个公交站点的乘车用户,包括:
将所述公交车在所述设定时间段内的疑似乘车用户的基站位置子序列转化为相应用户所处的geohash方格,将所述车载POS机中手机号的对应于所述设定时间段的基站位置子序列转化为相应公交车所处的geohash方格;
计算所述公交车在所述设定时间段内的每个疑似乘车用户所处的geohash方格和所述车载POS机中手机号的对应于所述设定时间段的公交车所处的geohash方格的相似度;
在相似度不小于设定相似度阈值的情况下,将相应疑似乘车用户确定为所述公交车驶经相应公交站点时的乘车用户;
获取初始时间范围的用户移动信令轨迹数据集和公交车车载POS机中手机号的信令轨迹数据,包括:
获取初始时间范围的移动信令数据集,其中,所述移动信令数据集中的每条移动信令数据包括用户唯一标识、信令时间戳、及基站唯一标识;
将所述移动信令数据集中的所有移动信令数据按其中的用户唯一标识分组,并将每组移动信令数据按信令时间戳的大小进行排序,得到初始时间范围的初始移动信令轨迹数据集,其中,所述初始移动信令轨迹数据集中的每条移动信令轨迹数据包括用户唯一标识与相应的信令时间戳序列及基站唯一标识序列;
将初始时间范围的初始移动信令轨迹数据集中的信令时间戳序列转换为相应的信令时间序列,并根据初始时间范围的初始信令轨迹数据集中的基站唯一标识获取到相应基站位置信息,从而得到包括用户唯一标识和与其对应的基站位置序列及信令时间序列的初始时间范围的移动信令轨迹数据集;
从初始时间范围的移动信令轨迹数据集提取得到初始时间范围的公交车车载POS机中手机号的信令轨迹数据,并根据其余信令轨迹数据构成的集合得到初始时间范围的用户移动信令轨迹数据集。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至9任一项所述方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至9任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011013023.8A CN112288131B (zh) | 2020-09-24 | 2020-09-24 | 公交站点优化方法、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011013023.8A CN112288131B (zh) | 2020-09-24 | 2020-09-24 | 公交站点优化方法、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112288131A true CN112288131A (zh) | 2021-01-29 |
CN112288131B CN112288131B (zh) | 2021-06-11 |
Family
ID=74421188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011013023.8A Active CN112288131B (zh) | 2020-09-24 | 2020-09-24 | 公交站点优化方法、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112288131B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819229A (zh) * | 2021-02-04 | 2021-05-18 | 汉纳森(厦门)数据股份有限公司 | 一种基于分布式机器学习的行车站点优化更新方法和系统 |
CN113190637A (zh) * | 2021-04-27 | 2021-07-30 | 北京交通发展研究院 | 公交线路新增方法、装置、计算机设备及存储介质 |
CN114822066A (zh) * | 2022-04-14 | 2022-07-29 | 北京百度网讯科技有限公司 | 车辆定位方法、装置、电子设备和存储介质 |
CN114936959A (zh) * | 2022-06-17 | 2022-08-23 | 上海市城乡建设和交通发展研究院 | 基于ic刷卡和公交轨迹数据实现车辆匹配和乘客上车点的识别方法 |
CN115061995A (zh) * | 2022-06-10 | 2022-09-16 | 吉林云帆智能工程有限公司 | 一种轨道车辆在途监测数据规则库模型 |
CN115086879A (zh) * | 2022-08-22 | 2022-09-20 | 广州市城市规划勘测设计研究院 | 轨道交通站客流特征及接驳方式的识别方法、装置及设备 |
CN116264009A (zh) * | 2022-06-21 | 2023-06-16 | 中兴通讯股份有限公司 | 光伏系统的数据处理方法、数据处理终端及存储介质 |
CN116579667A (zh) * | 2023-07-11 | 2023-08-11 | 北京大也智慧数据科技服务有限公司 | 公交站点的辐射人群的分析方法、装置、存储介质及设备 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102097002A (zh) * | 2010-11-22 | 2011-06-15 | 东南大学 | 一种基于ic卡数据获取公交站点od的方法及系统 |
EP2387279A1 (en) * | 2010-05-11 | 2011-11-16 | Panasonic Corporation | Cell (re)selection in a heterogeneous mobile communication system |
CN102595323A (zh) * | 2012-03-20 | 2012-07-18 | 北京交通发展研究中心 | 基于手机定位数据的居民出行特征参数的获取方法 |
CN104732756A (zh) * | 2013-12-24 | 2015-06-24 | 中兴通讯股份有限公司 | 一种利用移动通信数据挖掘进行公交规划的方法 |
CN104751536A (zh) * | 2013-12-25 | 2015-07-01 | 中兴通讯股份有限公司 | 一种公交站点优化评估方法和系统 |
CN105468595A (zh) * | 2014-08-12 | 2016-04-06 | 中国科学院深圳先进技术研究院 | 公交线路规划方法及系统 |
CN106503843A (zh) * | 2016-10-20 | 2017-03-15 | 上海萃图数字科技有限公司 | 一种基于手机信令数据的常规公交线网优化与调整方法 |
CN106951549A (zh) * | 2017-03-27 | 2017-07-14 | 重庆邮电大学 | 一种基于轨道ic卡和手机信令数据的乘客出行路线识别方法 |
US20170228715A1 (en) * | 2016-02-05 | 2017-08-10 | Mastercard International Incorporated | Method and system for point of sale payments |
CN108255944A (zh) * | 2017-12-12 | 2018-07-06 | 北京荣之联科技股份有限公司 | 确定用户的居住地和工作地的方法和装置 |
CN108564226A (zh) * | 2018-04-25 | 2018-09-21 | 哈尔滨工业大学 | 一种基于出租车gps及手机信令数据的公交线路优化方法 |
CN109035770A (zh) * | 2018-07-31 | 2018-12-18 | 上海世脉信息科技有限公司 | 一种大数据环境下公交载客量实时分析预测方法 |
CN109657843A (zh) * | 2018-11-28 | 2019-04-19 | 深圳市综合交通设计研究院有限公司 | 一种城市接驳公交系统的一体化规划决策支持系统 |
CN110021169A (zh) * | 2019-05-06 | 2019-07-16 | 南京航空航天大学 | 一种基于手机信令数据和公交数据的公交乘客下车站点推测方法 |
CN110310477A (zh) * | 2019-05-14 | 2019-10-08 | 浙江工业大学之江学院 | 基于公交gps与手机信令数据的公交客流检测方法 |
CN111615054A (zh) * | 2020-05-25 | 2020-09-01 | 和智信(山东)大数据科技有限公司 | 人口分析方法及装置 |
CN111653099A (zh) * | 2020-06-10 | 2020-09-11 | 南京瑞栖智能交通技术产业研究院有限公司 | 基于手机信令数据的公交客流od获取方法 |
-
2020
- 2020-09-24 CN CN202011013023.8A patent/CN112288131B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2387279A1 (en) * | 2010-05-11 | 2011-11-16 | Panasonic Corporation | Cell (re)selection in a heterogeneous mobile communication system |
CN102097002A (zh) * | 2010-11-22 | 2011-06-15 | 东南大学 | 一种基于ic卡数据获取公交站点od的方法及系统 |
CN102595323A (zh) * | 2012-03-20 | 2012-07-18 | 北京交通发展研究中心 | 基于手机定位数据的居民出行特征参数的获取方法 |
CN104732756A (zh) * | 2013-12-24 | 2015-06-24 | 中兴通讯股份有限公司 | 一种利用移动通信数据挖掘进行公交规划的方法 |
CN104751536A (zh) * | 2013-12-25 | 2015-07-01 | 中兴通讯股份有限公司 | 一种公交站点优化评估方法和系统 |
CN105468595A (zh) * | 2014-08-12 | 2016-04-06 | 中国科学院深圳先进技术研究院 | 公交线路规划方法及系统 |
US20170228715A1 (en) * | 2016-02-05 | 2017-08-10 | Mastercard International Incorporated | Method and system for point of sale payments |
CN106503843A (zh) * | 2016-10-20 | 2017-03-15 | 上海萃图数字科技有限公司 | 一种基于手机信令数据的常规公交线网优化与调整方法 |
CN106951549A (zh) * | 2017-03-27 | 2017-07-14 | 重庆邮电大学 | 一种基于轨道ic卡和手机信令数据的乘客出行路线识别方法 |
CN108255944A (zh) * | 2017-12-12 | 2018-07-06 | 北京荣之联科技股份有限公司 | 确定用户的居住地和工作地的方法和装置 |
CN108564226A (zh) * | 2018-04-25 | 2018-09-21 | 哈尔滨工业大学 | 一种基于出租车gps及手机信令数据的公交线路优化方法 |
CN109035770A (zh) * | 2018-07-31 | 2018-12-18 | 上海世脉信息科技有限公司 | 一种大数据环境下公交载客量实时分析预测方法 |
CN109657843A (zh) * | 2018-11-28 | 2019-04-19 | 深圳市综合交通设计研究院有限公司 | 一种城市接驳公交系统的一体化规划决策支持系统 |
CN110021169A (zh) * | 2019-05-06 | 2019-07-16 | 南京航空航天大学 | 一种基于手机信令数据和公交数据的公交乘客下车站点推测方法 |
CN110310477A (zh) * | 2019-05-14 | 2019-10-08 | 浙江工业大学之江学院 | 基于公交gps与手机信令数据的公交客流检测方法 |
CN111615054A (zh) * | 2020-05-25 | 2020-09-01 | 和智信(山东)大数据科技有限公司 | 人口分析方法及装置 |
CN111653099A (zh) * | 2020-06-10 | 2020-09-11 | 南京瑞栖智能交通技术产业研究院有限公司 | 基于手机信令数据的公交客流od获取方法 |
Non-Patent Citations (4)
Title |
---|
L.J.J. WISMANS,ETAL: "Improving A Priori Demand Estimates Transport Models using Mobile Phone Data: A Rotterdam-Region Case", 《JOURNAL OF URBAN TECHNOLOGY》 * |
孙卓 等: "基于手机信令大数据的城市居民出行OD预测", 《数学的实践与认识》 * |
杜亚朋: "基于手机信令数据的居民轨道交通通勤出行研究", 《中国优秀硕士学位论文全文数据库工程科技II辑》 * |
贾曼月: "基于手机信令定位数据的中小城市公交线网优化研究", 《中国优秀硕士学位论文全文数据库工程科技II辑》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819229A (zh) * | 2021-02-04 | 2021-05-18 | 汉纳森(厦门)数据股份有限公司 | 一种基于分布式机器学习的行车站点优化更新方法和系统 |
CN112819229B (zh) * | 2021-02-04 | 2022-10-28 | 汉纳森(厦门)数据股份有限公司 | 一种基于分布式机器学习的行车站点优化更新方法和系统 |
CN113190637A (zh) * | 2021-04-27 | 2021-07-30 | 北京交通发展研究院 | 公交线路新增方法、装置、计算机设备及存储介质 |
CN113190637B (zh) * | 2021-04-27 | 2022-01-25 | 北京交通发展研究院 | 公交线路新增方法、装置、计算机设备及存储介质 |
CN114822066A (zh) * | 2022-04-14 | 2022-07-29 | 北京百度网讯科技有限公司 | 车辆定位方法、装置、电子设备和存储介质 |
CN115061995A (zh) * | 2022-06-10 | 2022-09-16 | 吉林云帆智能工程有限公司 | 一种轨道车辆在途监测数据规则库模型 |
CN114936959A (zh) * | 2022-06-17 | 2022-08-23 | 上海市城乡建设和交通发展研究院 | 基于ic刷卡和公交轨迹数据实现车辆匹配和乘客上车点的识别方法 |
CN116264009A (zh) * | 2022-06-21 | 2023-06-16 | 中兴通讯股份有限公司 | 光伏系统的数据处理方法、数据处理终端及存储介质 |
CN116264009B (zh) * | 2022-06-21 | 2023-10-27 | 中兴通讯股份有限公司 | 光伏系统的数据处理方法、数据处理终端及存储介质 |
CN115086879A (zh) * | 2022-08-22 | 2022-09-20 | 广州市城市规划勘测设计研究院 | 轨道交通站客流特征及接驳方式的识别方法、装置及设备 |
CN115086879B (zh) * | 2022-08-22 | 2022-12-16 | 广州市城市规划勘测设计研究院 | 轨道交通站客流特征及接驳方式的识别方法、装置及设备 |
CN116579667A (zh) * | 2023-07-11 | 2023-08-11 | 北京大也智慧数据科技服务有限公司 | 公交站点的辐射人群的分析方法、装置、存储介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112288131B (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112288131B (zh) | 公交站点优化方法、电子设备及计算机可读存储介质 | |
CN109035770B (zh) | 一种大数据环境下公交载客量实时分析预测方法 | |
CN103177575B (zh) | 城区出租车动态在线调度优化系统及其方法 | |
CN111681421B (zh) | 基于手机信令数据的对外客运枢纽集疏空间分布分析方法 | |
CN108320501B (zh) | 基于用户手机信令的公交线路识别方法 | |
CN111091720B (zh) | 基于信令数据和浮动车数据的拥堵路段识别方法及装置 | |
CN108322891B (zh) | 基于用户手机信令的交通区域拥堵识别方法 | |
EP3335209B1 (en) | Method and system for computing an o-d matrix obtained through radio mobile network data | |
Hoque et al. | Analysis of mobility patterns for urban taxi cabs | |
Wang et al. | Estimating dynamic origin-destination data and travel demand using cell phone network data | |
CN105809962A (zh) | 一种基于手机数据的交通出行方式划分的方法 | |
CN105142106A (zh) | 基于手机信令数据的出行者职住地识别与出行链刻画方法 | |
CN109688532B (zh) | 一种划分城市功能区域的方法及装置 | |
CA2460136A1 (en) | System and method for providing traffic information using operational data of a wireless network | |
EP2608181B1 (en) | Method for detecting traffic | |
CN107403550B (zh) | 公交路网数据采集方法、装置和终端设备 | |
CN111882867A (zh) | 一种基于物联网的城市智慧交通预警系统 | |
Kumar et al. | A model based approach to predict stream travel time using public transit as probes | |
CN105070057A (zh) | 一种道路实时路况的监测方法 | |
CN108171973A (zh) | 一种基于手机网格数据的交通出行模式识别方法 | |
CN112036757A (zh) | 基于手机信令和浮动车数据的停车换乘停车场的选址方法 | |
CN107545318A (zh) | 公交线路优先级确定、公交换乘线路排序方法及装置 | |
CN115795332A (zh) | 一种用户出行模式识别的方法 | |
CN113901109B (zh) | 城际公路客货车出行方式总人数及时间分布的计算方法 | |
CN108711286B (zh) | 一种基于多源车联网和手机信令的交通量分配方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |