CN114722312A - 一种基于轨迹聚类技术的定制公交线路生成方法 - Google Patents
一种基于轨迹聚类技术的定制公交线路生成方法 Download PDFInfo
- Publication number
- CN114722312A CN114722312A CN202210464393.6A CN202210464393A CN114722312A CN 114722312 A CN114722312 A CN 114722312A CN 202210464393 A CN202210464393 A CN 202210464393A CN 114722312 A CN114722312 A CN 114722312A
- Authority
- CN
- China
- Prior art keywords
- track
- similarity
- clustering
- tracks
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/60—Planning or developing urban green infrastructure
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明属于智能交通领域,涉及一种基于轨迹聚类技术的定制公交线路生成方法。本发明包括获取出租车GPS轨迹数据;从方向、地理区间、轨迹子片段三个维度计算轨迹相似度,并考虑领域知识与计算复杂度对特征进行融合,获得能反映三个特征的轨迹相似度;基于计算得到的轨迹相似度,使用DBSCAN模型对轨迹集进行聚类,并基于多目标优化方法VIKOR优化DBSCAN中的Eps、MinPts参数;基于聚类结果,对每类聚类结果进行潜在线路提取。本发明能够有效地应用在出租车GPS轨迹数据上,并通过对聚类结果的中心轨迹进行提取,实现了最终潜在开设线路的提取。
Description
技术领域
本发明属于智能交通领域,涉及一种基于轨迹聚类技术的定制公交线路生成方法。
背景技术
近年来,一种名为定制公交的新型地面公交服务模式正在很多国家兴起。定制公交是一种基于汽车共享理念的需求响应式公交。线路规划是定制公交研究的关键之一,目前许多地区面向出行需求开设的定制公交线路大多采取问卷调研与预约结合的方式进行开设,另一部分则在政策或与公交公司合作指导下开设。然而,网络问卷调研的方式存在如下问题:(1)可靠性低:难以覆盖城市居民的整体通勤需求(2)时效性差:难以根据变化的出行需求进行实时调整。(3)繁琐且昂贵:人工地设计线路这样的不但消耗大量的人力与时间成本。
部分研究采取从大规模数据集中提取出行OD并结合路径规划的方法生成潜在线路。一些研究人员提出了包含出行需求处理、OD小区划分、OD区域配对和线路发布的定制公交线网规划方法,构建了线网规划模型并设计了求解算法。然而,该研究采取调查数据而导致可靠性低、时效性差繁琐不经济等诸多缺点。因此,一些研究人员基于出租车轨迹数据,对具有相似起点、终点、出发时刻的轨迹进行聚类提取。此外,一些研究人员基于公交车刷卡数据,对相似OD对进行聚类分析。相比于出租车数据,公交刷卡数据集中提取定制公交线路更适宜于长途出行用户(8km以上)。上述研究利用出租车数据或公交车数据提取出行OD数据,对需求起始点和终到点进行聚类,找出可选站点,进而进行定制公交线路规划。这样的做法容易忽略起点和终点间的对应关系造成与实际的出行需求产生偏差,且居民出行过程中的线路选择因受到环境条件和其自身的经验知识影响,如道路的拥堵程度、上下车的便捷性等。因此路径规划产生的中间线路与居民的实际行驶线路有时并不一致。一部分研究将定制公交应用于转移地铁客流,限制地铁站为起点的定制公交路线规划,或以连接居民区与地铁站的接驳公交线路优化。该类型线路需要设置在地铁站附近,不符合定制公交门到门的出行特征与优势,也难以作为一种通用方法使用。
轨迹聚类采取数据挖掘方法挖掘海量出行数据中的出行模式,成为移动对象轨迹数据挖掘的热点之一。基于出租车轨迹数据,从轨迹聚类获得的出行模式提取的潜在线路蕴含着出行者的历史出行经验知识与实时路网状态信息,能够较大程度覆盖居民的出行需求,且不需要进行繁琐的线路规划,适合作为定制公交线路开设的依据。
虽然目前已有部分学者对车辆轨迹聚类进行了研究,并取得了相当不错的成果,但仍存在一些挑战:
1、考虑多种轨迹特征的综合轨迹相似度计算方法。轨迹相似度的计算研究热点之一在于如何综合考虑轨迹不同属性,例如轨迹的方向和重叠子片段,如何将轨迹的各个特征合理进行融合仍然是一个难点。
2、聚类结果难以应用,通用方法的聚类结果具有较为离散的起终点,研究人员难以从聚类结果中提取符合具有集中出行OD线路作为定制公交潜在开设线路的参考。
发明内容
针对现有技术的不足,本发明提出一种基于轨迹聚类技术的定制公交线路生成方法。
本发明包括以下步骤:
步骤A,利用路网中的出租车GPS数据信息,构建以出行为单位的轨迹集合,并计算轨迹集合T中各轨迹之间的相似度矩阵M。
步骤B,基于第一步获得的相似度矩阵M,使用DBSCAN聚类方法对轨迹集合T中的轨迹进行聚类,调节聚类参数Eps与MinPts,得到期望的聚类结果C。
步骤C,基于第二步获得的聚类结果C,根据计算每类轨迹簇的中心轨迹作为定制公交线路的生成结果。
本发明的有益效果:区别于传统的人工问卷调查方式,本发明基于数据驱动方式挖掘定制公交的潜在开设线路,节约人工成本并提高了所开设线路的可靠性,赋能公交公司主动服务能力。本发明通过分析定制公交的开设背景,综合考虑轨迹的多维特征包括轨迹方向、地理区间与子片段,并实现对三种轨迹相似度的有效融合。实验证明,本发明能够有效地应用在出租车GPS轨迹数据上,并通过对聚类结果的中心轨迹进行提取,实现了最终潜在开设线路的提取。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明提供的轨迹地理区间相似度示意图;
图2是本发明提供的轨迹累计公共子片段相似度示意图;
图3是本发明提供的出租车出行量实验数据示意图;
图4是本发明提供的实验数据下轨迹聚类结果示意图;
图5是本发明提供的中心轨迹提取结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明提出一种基于轨迹聚类技术的定制公交线路生成方法,具体包括以下步骤:
第1步,利用路网中的出租车GPS数据信息,构建以出行为单位的轨迹集合,并计算轨迹集合T中各轨迹之间的相似度矩阵M。具体如下:
计算轨迹间的相似度矩阵M,其中轨迹相似度中,采用S(Ti,Tj)表示轨迹Ti,、Tj间的相似度,该相似度考虑了地理区域、轨迹方向与公共子片段三个轨迹特征,并由地理区间相似度、方向相似度和累计公共子片段相似度进行表征,实现了对轨迹的多个特征进行了有效融合,其相似度S(Ti,Tj)计算公式如下:
其中GRS表示地理区间相似度,DS表示方向相似度,CCSS表示累计公共子片段相似度。在具体计算流程中,在得到地理区间相似度与方向相似度后,若两者中任何一个结果为0,则不必计算累计公共子片段相似度,而直接将轨迹相似度记为0。
第1.1步,计算地理区间相似度GRS(Geographic Range Similarity)。
如图1所示,对于轨迹Ti,其经纬度范围分别表示为Rx(Ti)=[minr{xr},maxr{xr}],Ry(Ti)=[minr{yr},maxr{yr}](r∈[1,2,…,Υi]),其中Rx表示经度区间,Ry表示纬度区间。
通过引入Jaccard相似度计算两个区间的重合程度,任意两条轨迹Ti,、Tj,地理区相似度被定义为经纬度区间上的Jaccard相似度的平均值,计算公式如下:
其中J(Rx(Ti),Rx(Tj))与J(Ry(Ti),Ry(Tj))分别表示根据轨迹Ti,Tj经度区间与纬度区间计算得到的Jaccard相似度。
第1.2步,计算方向相似度DS。
将轨迹起终点分别表示为O与D,其中O、D均包含经度坐标与纬度坐标。对于任意两条轨迹Ti,、Tj,其起终点表示为{Oi,Di}与{Oj,Dj},通过连接O、D,可以构建OD向量Oi Di,OjDj。计算两个向量Oi Di,Oj Dj构成夹角的余弦值,计算公式如下:
将上一步计算得到的cos(Ti,Tj)归一化0到1,可以得到方向相似度DS,计算公式如下:
第1.3步,计算累计公共子片段相似度CCSS。
在传统的轨迹最大公共子序列LCSS算法中,如果一个轨迹完全包含在另一个轨迹中,两个轨迹之间的最大公共子序列长度等于较短轨迹的长度,它们的相似性度量为1。这使得从聚类结果中提取较为清晰的起终站点坐标十分困难。本发明对LCSS算法进行了改进,使用累计公共子片段代替最大公共子序列,提高聚类结果出行轨迹OD的集中程度。
在LCSS中,轨迹中所有匹配点构成的最长连续子序列被定义被该轨迹的最长公共子序列。然而,轨迹间的匹配片段情况可能存在多段的情况,从整体比较轨迹的角度出发,应当将多匹配片段的情况进行考虑。如图2所示,轨迹Ti,Tj存在多条匹配片段Li1,Li2,Lj1,Lj2。
与轨迹间的LCSS计算相同,CCSS的计算需要确定轨迹点之间的匹配准则,这一准则由一个距离参数δ表征(如果两点的空间距离小于δ将会被匹配)。实际上,对于任意轨迹Ti上的一个点pi,轨迹Tj可能存在多个点与之匹配(如图2所示,轨迹Ti上的点Pi2可以与轨迹Tj上的点Pj2,Pj3匹配)。这里规定,对于Ti上的点pi,只要与之进行比较的轨迹上存在与之匹配的点,pi是一个匹配点。
对于轨迹Ti,Tj,根据上一步可以得到其所有匹配片段的长度,累计公共子片段相似度的计算公式如下:
第2步,基于第一步获得的相似度矩阵M,使用DBSCAN聚类方法对轨迹集合T中的轨迹进行聚类,调节聚类参数Eps与MinPts,得到期望的聚类结果C。
第3步,基于第二步获得的聚类结果C,根据计算每类轨迹簇的中心轨迹作为定制公交线路的生成结果。若通过DBSCAN聚类后,获得了K个轨迹簇,记为C1,C2,…,Ck,…,CK,则第K个簇的中心轨迹的计算公式如下:
实施分析
通过分析对数据集中出行量的小时变化,如图3所示,可以看到出行量在8点达到最高值,取8点前后1小时的时间区间为早高峰通勤时段,并最终确定早高峰通勤时段为7:00-9:00。数据说明如表1所示。在4092辆出租车出行轨迹中,随机选择了10000条轨迹。
表1数据字段说明
在CCSS计算时需要确定距离阈值δ,距离小于δ的两个点将会被匹配。考虑到路网结构,将δ设置为20m。
计算GRS、DS与CCSS,并根据融合方法计算综合三种特征的轨迹相似度;
基于轨迹相似度构建用于聚类的距离矩阵,其中距离矩阵中的值为1减去对应的轨迹相似度;
DBSCAN轨迹聚类,通过综合分析聚类结果,设定EPS为0.26,MinPts为3;
计算获得每类轨迹簇的中心轨迹作为定制公交的潜在线路提取结果。聚类结果如图4所示,结果显示本发明能够有效从海量出租车GPS轨迹数据中提取出了具有共性的出行趋势的轨迹集。其中,图4上右侧为聚类结果中两个聚类簇的单独显示结果,可以看到同一簇中轨迹有着集中的出行起终点。
四个聚类结果的中心轨迹提取如图5所示,中心轨迹通过点状线表示,可以看出中心轨迹能够有效代表所在轨迹簇的出行趋势,因此将中心轨迹作为最终的定制公交线路的生成结果。
Claims (6)
1.一种基于轨迹聚类技术的定制公交线路生成方法,其特征在于包括以下步骤:
第一步,利用路网中的出租车GPS数据信息,构建以出行为单位的轨迹集合,并计算轨迹集合T中各轨迹之间的相似度矩阵M;
第二步,基于第一步获得的相似度矩阵M,使用DBSCAN聚类方法对轨迹集合T中的轨迹进行聚类,调节聚类参数Eps与MinPts,得到期望的聚类结果C;
第三步,基于第二步获得的聚类结果C,根据计算每类轨迹簇的中心轨迹作为定制公交线路的生成结果。
3.根据权利要求2所述的一种基于轨迹聚类技术的定制公交线路生成方法,其特征在于:地理区间相似度的计算具体包括以下步骤:
对于轨迹Ti,其经纬度范围分别表示为Rx(Ti)=[minr{xr},maxr{xr}],Ry(Ti)=[minr{yr},maxr{yr}],其中Rx表示经度区间,Ry表示纬度区间,r∈[1,2,…,Υi];
b)引入Jaccard相似度计算两个区间的重合程度,任意两条轨迹Ti,、Tj,地理区相似度被定义为经纬度区间上的Jaccard相似度的平均值,计算公式如下:
其中J(Rx(Ti),Rx(Tj))与J(Ry(Ti),Ry(Tj))分别表示根据轨迹Ti,Tj经度区间与纬度区间计算得到的Jaccard相似度。
4.根据权利要求2所述的一种基于轨迹聚类技术的定制公交线路生成方法,其特征在于:方向相似度的计算具体包括以下步骤:
a)将轨迹起终点分别表示为O与D,其中O、D均包含经度坐标与纬度坐标;
b)对于任意两条轨迹Ti,、Tj,其起终点表示为{Oi,Di}与{Oj,Dj},通过连接O、D,构建OD向量Oi Di,OjDj;
c)计算两个向量OiDi,OjDj构成夹角的余弦值cos(Ti,Tj);
d)将上一步计算得到的cos(Ti,Tj)归一化0到1,得到方向相似度DS。
5.根据权利要求2所述的一种基于轨迹聚类技术的定制公交线路生成方法,其特征在于:累计公共子片段相似度的计算具体包括以下步骤:
a)设定距离阈值δ,两条轨迹上距离小于δ的轨迹点标记为匹配点;
b)遍历两条轨迹,找出两条轨迹上的所有匹配点,这些连续不间断的匹配点构成了轨迹上的匹配片段;
d)对于轨迹Ti,Tj,根据上一步得到其所有匹配片段的长度,累计公共子片段相似度的计算公式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210464393.6A CN114722312A (zh) | 2022-04-25 | 2022-04-25 | 一种基于轨迹聚类技术的定制公交线路生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210464393.6A CN114722312A (zh) | 2022-04-25 | 2022-04-25 | 一种基于轨迹聚类技术的定制公交线路生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114722312A true CN114722312A (zh) | 2022-07-08 |
Family
ID=82246374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210464393.6A Pending CN114722312A (zh) | 2022-04-25 | 2022-04-25 | 一种基于轨迹聚类技术的定制公交线路生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114722312A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115392407A (zh) * | 2022-10-28 | 2022-11-25 | 中建五局第三建设有限公司 | 基于无监督学习的危险源预警方法、装置、设备及介质 |
-
2022
- 2022-04-25 CN CN202210464393.6A patent/CN114722312A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115392407A (zh) * | 2022-10-28 | 2022-11-25 | 中建五局第三建设有限公司 | 基于无监督学习的危险源预警方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107766808B (zh) | 道路网络空间中车辆对象移动轨迹聚类的方法及系统 | |
CN108761509A (zh) | 一种基于历史数据的汽车行驶轨迹及里程预测方法 | |
CN105844362B (zh) | 一种城市交通综合出行决策装置 | |
CN105261212B (zh) | 一种基于出租车gps数据地图匹配的出行时空分析方法 | |
CN103177561B (zh) | 公交实时路况的生成方法 | |
Carpenter et al. | Generating route-specific origin–destination tables using Bluetooth technology | |
CN110909788B (zh) | 一种基于统计聚类的轨迹数据中道路交叉口位置识别方法 | |
CN110491158B (zh) | 一种基于多元数据融合的公交车到站时间预测方法及系统 | |
Edwards et al. | Comparing fixed-route and demand-responsive feeder transit systems in real-world settings | |
CN108961758A (zh) | 一种基于梯度提升决策树的路口展宽车道探测方法 | |
CN110222786A (zh) | 基于出行信息的动态拼车方法及系统 | |
CN110598917B (zh) | 一种基于路径轨迹的目的地预测方法、系统及存储介质 | |
Liu et al. | A distributed Markovian parking assist system | |
CN111653092A (zh) | 一种车路协同智慧公交管理监控系统 | |
CN114722312A (zh) | 一种基于轨迹聚类技术的定制公交线路生成方法 | |
Xia et al. | Urban customized bus design for private car commuters | |
Qiu et al. | RPSBPT: A route planning scheme with best profit for taxi | |
CN111860699B (zh) | 一种基于波动率的通勤出行模式识别方法 | |
Zhao et al. | Study on urban road network traffic district division based on clustering analysis | |
González-Rodríguez et al. | Urban traffic flow mapping of an andean capital: Quito, ecuador | |
CN103236180A (zh) | 一种车载信息互动接口方法 | |
CN109558978B (zh) | 基于出行距离的区域交通方式划分方法 | |
Yao et al. | A path planning model based on spatio-temporal state vector from vehicles trajectories | |
Abu-Aisha et al. | A New Methodology To Infer Travel Behavior Using Floating Car Data | |
Lou et al. | Planning of a comprehensive transportation system in Ma’anshan based on mobile phone signaling data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20221021 Address after: 310058 Yuhang Tang Road, Xihu District, Hangzhou, Zhejiang 866 Applicant after: ZHEJIANG University Applicant after: ZHEJIANG SCIENTIFIC Research Institute OF TRANSPORT Address before: 310058 Yuhang Tang Road, Xihu District, Hangzhou, Zhejiang 866 Applicant before: ZHEJIANG University |
|
TA01 | Transfer of patent application right |