CN110782098A - 一种基于出租车载客数据的定制公交规划方法 - Google Patents

一种基于出租车载客数据的定制公交规划方法 Download PDF

Info

Publication number
CN110782098A
CN110782098A CN201911063205.3A CN201911063205A CN110782098A CN 110782098 A CN110782098 A CN 110782098A CN 201911063205 A CN201911063205 A CN 201911063205A CN 110782098 A CN110782098 A CN 110782098A
Authority
CN
China
Prior art keywords
passenger carrying
taxi
time
bus
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911063205.3A
Other languages
English (en)
Inventor
赵蕴龙
孙天旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201911063205.3A priority Critical patent/CN110782098A/zh
Publication of CN110782098A publication Critical patent/CN110782098A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于出租车载客数据的定制公交规划方法。目的是通过结合出租车载客数据,分析并挖掘城市居民的出行需求,并为定制公交的规划提供指导,提出了一种新颖且合理有效的定制公交规划方法。本发明主要包括五个步骤。首先根据出租车轨迹信息与运营信息采集出租车载客数据样本集;然后根据出租车载客数据样本集对出租车载客行为时空特征的提取;进而依据一种改进的基于密度的时空聚类算法对出租车载客模式的提取;接着对得到的载客模式区域进行定制公交的站点选址;最后进行定制公交的时间规划。

Description

一种基于出租车载客数据的定制公交规划方法
技术领域
本发明涉及交通数据处理技术领域和交通规划领域,尤其涉及一种基于出租车载客数据的定制公交规划方法。
背景技术
当今城市中,居民经济水平不断增长,一方面城市中私家车的数量不断上升,另一方面城市居民的出行需求也在不断增长,这导致城市中交通压力越来越大,过大的交通压力导致城市交通系统中的事故与拥堵现象更加严重。在这种情况下,传统的交通方式已经不能很好的解决城市中居民的出行需求。
公共交通作为城市的重要公共资源,是城市中居民的重要出行方式。传统的公共交通方式运行模式较为固定。而定制公交作为一种新兴的概念,有着路线安排灵活,贴近居民需求的特点。但定制公交的需求收集主要依赖于问卷调查等手段,这使得定制公交的路线规划会遇到需求片面且时效性差等特点。而出租车作为城市中最重要的交通方式的一种,本身有着路线灵活的特征,并且出租车的运客行为可以有效的反应城市中居民的出行需求,所以通过分析挖掘出租车载客数据,可以为定制公交的路线规划提供可靠的指导。
因此通过对出租车载客数据进行分析挖掘,找出城市中居民的出行模式,并根据此来进行定制公交规划,可以使得到的定制公交线路更加合理,且更贴近城市居民的需求。
发明内容
本发明的目的在于解决现有技术中存在的不足,提供一种基于出租车载客数据的定制公交规划方法,通过对出租车载客数据的分析,来找出城市中人流的移动方式,并根据此人流移动特点来规划定制公交线路,从而使得到的公交线路更加合理、有效。
实现本发明目的的技术方案是:一种基于出租车载客数据的定制公交规划方法,包括如下步骤:
第一步:根据出租车轨迹信息与运营信息采集出租车载客数据样本集;
第二步:根据出租车载客数据样本集对出租车载客行为时空特征的提取,时空特征提取包括从时间和空间两个维度进行提取;
第三步:出租车载客模式的提取:依据改进的基于密度的一种时空聚类算法,寻找出租车载客数据样本集中相似的载客行为,确定进行起、止点选址的两个区域;
第四步:定制公交站点的选址:设置站点最大覆盖范围,基于第三步得到的进行起、止点选址的两个区域,确定定制公交站点的数量;
第五步:定制公交的时间规划:基于第四步得到的公交站点位置,为每一个站点规划定制公交的到站时间。
进一步的,所述第一步的具体过程如下:
从出租车的轨迹数据集中获取出租车的位置序列与载客状态,在出租车载客状态发生改变时进行记录;载客状态从空载变为已载客时记录为上车行为,并记录上车时间与位置;载客状态从已载客变为空载时记录为下车行为,并记录下车时间与位置;将上/下车的一组时间和位置数据作为一条样本,加入出租车载客数据样本集。
进一步的,所述第二步的具体过程如下:
在空间维度上,分析第一步得到的出租车载客数据样本集在城市区域中的分布情况,得到分布特征;在时间维度上,先以一天为单位根据日期划分,根据实际日期将每日划分为工作日与非工作日,再以一小时为单位根据时间进行划分,提取载客数据样本在时间上的分布特征。
进一步的,所述第三步的具体过程如下:
依据于改进的基于密度的一种时空聚类算法进行出租车载客模式提取,具体包括:
S1:分别提取单条出租车载客样本数据的乘客上/下车的时间、经度、维度,构成一对数据对,将每个数据在时间和空间维度上进行归一化,设归一化系数a,空间上以50m为单位,时间上以分钟为单位,使50m=1min*a,根据载客样本从上车点指向下车点构成向量μ;
S2:给定邻域半径c与核心阈值m,在出租车载客样本数据集中寻找满足核心对象条件的向量集C,计算向量的距离方法具体为:空间欧式距离加上时间差与归一化系数的乘积;
S3:从核心对象向量集C中取出任意核心对象c,将它与所有它的密度可达对象设置为同一簇;
S4:重复S3,直到核心对象集C中没有核心对象;
S5:将没有被分簇的出租车载客样本设置为离群点。
进一步的,所述第四步的具体过程如下:
S1:设置站点的最大覆盖范围L,并在起、止点区域内以L为网格长度将区域网格化;
S2:设置站点能接纳的最大乘客人数M,选取密度最大的网格作为一个定制公交站点,并在网格内随机剔除M个载客样本;
S3:重复S2直到区域内的载客样本完全被剔除。
进一步的,所述第五步的具体过程如下:
任意选取一个步骤四中得到的定制公交站点,获取该站点所在网格内的所有载客样本,由于载客样本经过步骤三聚类,所有样本的时间差必定小于乘客可等待的时间阈值,故选取时间最晚的载客样本,指定该时间作为定制公交的到达时间。
本发明的有益效果为:
本发明考虑到定制公交规划问题中出行需求难以收集的问题,通过结合出租车这种路线灵活的交通方式,来挖掘城市中居民的出行模式,从而为定制公交规划提供基础,使得所得到的线路更加合理且贴近居民的需求。
附图说明
为了使本发明的内容更容易被清楚地理解,下面根据具体实施例并结合附图,对本发明作进一步详细的说明:
附图1为本发明的流程图;
附图2为本发明提供的某城市出租车载客数据的每日高峰分布图;
附图3为本发明提供的某城市出租车载客数据的地理热点分布图;
附图4为本发明提供的某城市出租车载客数据的聚类结果图;
具体实施方式
为更加了解本发明的技术内容,特举具体实施方式配合图例进行说明如下。
结合图一,本发明提出一种基于手机信令数据和公交数据的公交乘客下车站点推测方法,具体实施步骤如下:
第一步:根据出租车轨迹信息与运营信息采集出租车载客数据样本集;
第二步:根据出租车载客数据样本集对出租车载客行为时空特征的提取,时空特征提取包括从时间和空间两个维度进行提取;
第三步:出租车载客模式的提取:依据改进的基于密度的一种时空聚类算法,寻找出租车载客数据样本集中相似的载客行为,确定进行起、止点选址的两个区域;
第四步:定制公交站点的选址:设置站点最大覆盖范围,基于第三步得到的进行起、止点选址的两个区域,确定定制公交站点的数量;
第五步:定制公交的时间规划:基于第四步得到的公交站点位置,为每一个站点规划定制公交的到站时间。
结合图例,所述步骤一的具体实施如下:
从出租车的轨迹数据集中获取出租车的位置序列与载客状态,在出租车载客状态发生改变时进行记录;载客状态从空载变为已载客时记录为上车行为,并记录上车时间与位置;载客状态从已载客变为空载时记录为下车行为,并记录下车时间与位置;将上/下车的一组时间和位置数据作为一条样本,加入出租车载客数据样本集。
结合图例,所述步骤二的具体实施如下:
在空间维度上,分析第一步得到的出租车载客数据样本集在城市区域中的分布情况,得到分布特征;在时间维度上,先以一天为单位根据日期划分,根据实际日期将每日划分为工作日与非工作日,再以一小时为单位根据时间进行划分,提取载客数据样本在时间上的分布特征。
此处,对上述步骤进行举例说明如下:
时间上取2018年到10月1日至10月26日之间的某城市100辆出租车的载客数据,这段时间内的日期覆盖了工作日与休息日,所以首先比较在不同日期中,出租车载客行为在一天内的分布情况,分布量如图2所示,工作日和休息日的出租车载客分布有显著的不同;空间上取2018年到10月1日至10月26日之间的某城市100辆出租车的载客数据,载客数据分布于城市中的全部区域,可以得到出租车载客行为发生的地点分布如图3所示,城市中的不同区域的载客行为数量有显著的不同。
结合图例,所述步骤三的具体实施如下:
依据于改进的基于密度的一种时空聚类算法进行出租车载客模式提取,具体包括:
S1:分别提取单条出租车载客样本数据的乘客上/下车的时间、经度、维度,构成一对数据对,将每个数据在时间和空间维度上进行归一化,设归一化系数α,空间上以50m为单位,时间上以分钟为单位,使50m=1min*α,根据载客样本从上车点指向下车点构成向量μ;
S2:给定邻域半径c与核心阈值m,在出租车载客样本数据集中寻找满足核心对象条件的向量集C,计算向量的距离方法具体为:空间欧式距离加上时间差与归一化系数的乘积;
S3:从核心对象向量集C中取出任意核心对象c,将它与所有它的密度可达对象设置为同一簇;
S4:重复S3,直到核心对象集C中没有核心对象;
S5:将没有被分簇的出租车载客样本设置为离群点。
此处,对上述步骤进行举例说明如下:
取2018年到10月1日至10月26日之间的某城市100辆出租车的载客数据,在步骤三中给定α为0.05,邻域半径为0.03,核心阈值为15,可以将载客数据集聚类为如图4所示的聚类结果。
结合图例,所述步骤四的具体实施如下:
S1:设置站点的最大覆盖范围L,并在起、止点区域内以L为网格长度将区域网格化;
S2:设置站点能接纳的最大乘客人数M,选取密度最大的网格作为一个定制公交站点,并在网格内随机剔除M个载客样本;
S3:重复S2直到区域内的载客样本完全被剔除。
此处,对上述步骤进行举例说明如下:
假定得到的一个起点区域内含有7个样本,坐标点分别记为A,B,…,G,假定站点最大乘客人数为3,站点覆盖为200米,假定地图网格化后ABCD四个点位于同一网格1,EFG三个点位于同一网格2,在网格1内随机选择三点例如ACD作为一个公交站点,并将此三个点剔除;重复选择密度最大的网格2,选择EFG三点作为一个公交站点并将3个点剔除;最后选取剩余的B点作为一个公交站点。
结合图例,所述步骤五的具体实施如下:
任意选取一个步骤四中得到的定制公交站点,获取该站点所在网格内的所有载客样本,由于载客样本经过步骤三聚类,所有样本的时间差必定小于乘客可等待的时间阈值,故选取时间最晚的载客样本,指定该时间作为定制公交的到达时间。
此处,对上述步骤进行举例说明如下:
假定步骤四中的一个起点区域内的7个样本的载客时间分别为(A,9:00:01),(B,9:07:56),(C,9:15:00),(D,9:20:49),(E,9:28:05),(F,9:34:15),(G,9:40:11),由ACD点得到的公交站点的发车时间规划为时间最晚的D点的时间9:20:49,由EFG点得到的公交站点的发车时间规划为时间最晚的G点的时间9:40:11,由B点得到的公交站点的发车时间规划为B点的时间9:07:56。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于出租车载客数据的定制公交规划方法,其特征在于,包括:
第一步:根据出租车轨迹信息与运营信息采集出租车载客数据样本集;
第二步:根据出租车载客数据样本集对出租车载客行为时空特征的提取,时空特征提取包括从时间和空间两个维度进行提取;
第三步:出租车载客模式的提取:依据改进的基于密度的一种时空聚类算法,寻找出租车载客数据样本集中相似的载客行为,确定进行起、止点选址的两个区域;
第四步:定制公交站点的选址:设置站点最大覆盖范围,基于第三步得到的进行起、止点选址的两个区域,确定定制公交站点的数量;
第五步:定制公交的时间规划:基于第四步得到的公交站点位置,为每一个站点规划定制公交的到站时间。
2.根据权利要求1所述一种基于出租车载客数据的定制公交规划方法,其特征在于:所诉步骤一中根据出租车轨迹信息与运营信息采集出租车载客数据样本集;具体过程为:从出租车的轨迹数据集中获取出租车的位置序列与载客状态,在出租车载客状态发生改变时进行记录;载客状态从空载变为已载客时记录为上车行为,并记录上车时间与位置;载客状态从已载客变为空载时记录为下车行为,并记录下车时间与位置;将上/下车的一组时间和位置数据作为一条样本,加入出租车载客数据样本集。
3.根据权利要求1所述一种基于出租车载客数据的定制公交规划方法,其特征在于:所诉步骤二中根据出租车载客数据样本集对出租车载客行为时空特征的提取;具体过程为:在空间维度上,分析第一步得到的出租车载客数据样本集在城市区域中的分布情况,得到分布特征;在时间维度上,先以一天为单位根据日期划分,根据实际日期将每日划分为工作日与非工作日,再以一小时为单位根据时间进行划分,提取载客数据样本在时间上的分布特征。
4.根据权利要求1所述一种基于出租车载客数据的定制公交规划方法,其特征在于:所诉步骤三中出租车载客模式的提取;具体过程为:出租车载客模式提取依据于改进的基于密度的一种时空聚类算法,具体包括:
S1:分别提取单条出租车载客样本数据的乘客上/下车的时间、经度、维度,构成一对数据对,将每个数据在时间和空间维度上进行归一化,设归一化系数α,空间上以50m为单位,时间上以分钟为单位,使50m=1min*α,根据载客样本从上车点指向下车点构成向量μ;
S2:给定邻域半径c与核心阈值m,在出租车载客样本数据集中寻找满足核心对象条件的向量集C,计算向量的距离方法具体为:空间欧式距离加上时间差与归一化系数的乘积;
S3:从核心对象向量集C中取出任意核心对象c,将它与所有它的密度可达对象设置为同一簇;
S4:重复S3,直到核心对象集C中没有核心对象;
S5:将没有被分簇的出租车载客样本设置为离群点。
5.根据权利要求1所述一种基于出租车载客数据的定制公交规划方法,其特征在于:所诉步骤四中定制公交站点的选址;具体过程为:
S1:设置站点的最大覆盖范围L,并在起、止点区域内以L为网格长度将区域网格化;
S2:设置站点能接纳的最大乘客人数M,选取密度最大的网格作为一个定制公交站点,并在网格内随机剔除M个载客样本;
S3:重复S2直到区域内的载客样本完全被剔除。
6.根据权利要求1所述一种基于出租车载客数据的定制公交规划方法,其特征在于:所诉步骤四中定制公交的时间规划;具体过程为:任意选取一个步骤四中得到的定制公交站点,获取该站点所在网格内的所有载客样本,由于载客样本经过步骤三聚类,所有样本的时间差必定小于乘客可等待的时间阈值,故选取时间最晚的载客样本,指定该时间作为定制公交的到达时间。
CN201911063205.3A 2019-11-01 2019-11-01 一种基于出租车载客数据的定制公交规划方法 Pending CN110782098A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911063205.3A CN110782098A (zh) 2019-11-01 2019-11-01 一种基于出租车载客数据的定制公交规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911063205.3A CN110782098A (zh) 2019-11-01 2019-11-01 一种基于出租车载客数据的定制公交规划方法

Publications (1)

Publication Number Publication Date
CN110782098A true CN110782098A (zh) 2020-02-11

Family

ID=69388629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911063205.3A Pending CN110782098A (zh) 2019-11-01 2019-11-01 一种基于出租车载客数据的定制公交规划方法

Country Status (1)

Country Link
CN (1) CN110782098A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326989A (zh) * 2021-06-15 2021-08-31 北京沃东天骏信息技术有限公司 一种车辆路线优化的方法和系统
CN114495484A (zh) * 2021-12-17 2022-05-13 北京航空航天大学杭州创新研究院 基于多源数据层次图聚类算法的公交站点位置推荐方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326989A (zh) * 2021-06-15 2021-08-31 北京沃东天骏信息技术有限公司 一种车辆路线优化的方法和系统
CN114495484A (zh) * 2021-12-17 2022-05-13 北京航空航天大学杭州创新研究院 基于多源数据层次图聚类算法的公交站点位置推荐方法
CN114495484B (zh) * 2021-12-17 2023-10-27 北京航空航天大学杭州创新研究院 基于多源数据层次图聚类算法的公交站点位置推荐方法

Similar Documents

Publication Publication Date Title
CN109035770B (zh) 一种大数据环境下公交载客量实时分析预测方法
CN107506864B (zh) 一种客运巴士路线规划方法和装置
CN108564226B (zh) 一种基于出租车gps及手机信令数据的公交线路优化方法
CN111653099B (zh) 基于手机信令数据的公交客流od获取方法
CN107818412B (zh) 一种基于MapReduce的大规模公交乘客OD并行计算方法
CN112133090A (zh) 一种基于手机信令数据的多方式交通分布模型构建方法
CN105788260A (zh) 一种基于智能公交系统数据的公交乘客od推算方法
WO2015096400A1 (zh) 一种利用移动通信数据挖掘进行公交规划的方法
CN103985247A (zh) 基于城市叫车需求分布密度的出租车运力调度系统
CN110796337B (zh) 一种评价城市公交站点服务可达性的系统
CN105809962A (zh) 一种基于手机数据的交通出行方式划分的方法
CN104167092A (zh) 一种确定出租车上下客热点区域中心的方法以及装置
CN103177575A (zh) 城区出租车动态在线调度优化系统及其方法
CN109509351B (zh) 一种公交站点周边地区公交分担率的计算方法
CN112036757B (zh) 基于手机信令和浮动车数据的停车换乘停车场的选址方法
CN110853156B (zh) 融合公交gps轨迹与ic卡数据的乘客od识别方法
CN112418556B (zh) 一种基于互联网共享平台下的网格化服务系统
CN115168529B (zh) 一种基于手机定位数据的枢纽客流溯源方法
CN110782098A (zh) 一种基于出租车载客数据的定制公交规划方法
CN102881155A (zh) 基于出租车智能终端的乘降热点区域分析的方法
CN111651529A (zh) 基于手机信令数据的机场航空旅客分类识别方法
CN115714957A (zh) 基于手机信令的地铁出行识别方法、装置、设备及介质
CN104599499A (zh) 一种分布式统计交通位置的方法及装置
CN105336155A (zh) 公交班次加派方法及系统
CN103748432B (zh) 图像处理装置、图像处理管理装置、终端、处理装置以及图像处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200211

WD01 Invention patent application deemed withdrawn after publication