CN108415975A - 基于bdch-dbscan的出租车载客热点识别方法 - Google Patents

基于bdch-dbscan的出租车载客热点识别方法 Download PDF

Info

Publication number
CN108415975A
CN108415975A CN201810130946.8A CN201810130946A CN108415975A CN 108415975 A CN108415975 A CN 108415975A CN 201810130946 A CN201810130946 A CN 201810130946A CN 108415975 A CN108415975 A CN 108415975A
Authority
CN
China
Prior art keywords
point
cluster
data
hot spot
dbscan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810130946.8A
Other languages
English (en)
Other versions
CN108415975B (zh
Inventor
高尚兵
黄子赫
李木子
陈超
李胜东
周君
严云洋
陈晓兵
潘登峰
龚野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaiyin Institute of Technology
Original Assignee
Huaiyin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaiyin Institute of Technology filed Critical Huaiyin Institute of Technology
Priority to CN201810130946.8A priority Critical patent/CN108415975B/zh
Publication of CN108415975A publication Critical patent/CN108415975A/zh
Application granted granted Critical
Publication of CN108415975B publication Critical patent/CN108415975B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Traffic Control Systems (AREA)
  • Navigation (AREA)

Abstract

本发明公开了一种基于BDCH‑DBSCAN的出租车载客热点识别方法,首先提供大量出租车GPS数据轨迹,从中剔除干扰数据;提取GPS数据轨迹中的上车数据点和下车数据点;对提取的数据点进行多线程分块聚类,并采用DBSCAN算法分离出核心点,并获取核心点的邻居节点集,对核心点进行扩展簇操作,扩展簇指对核心点的邻居点进行类簇划分,并将大于最小簇点数的邻居核心点及其领域添加进簇中;根据两点之间的曲面距离找出扫描半径内的邻居节点,找出每个簇中的最大密度点,作为簇心,并对簇心集合再次循环聚类直至集合数量、精度满足要求。本发明可以适应大规模数据、便于识别类簇中心、多线程聚类速度快、精确度高。

Description

基于BDCH-DBSCAN的出租车载客热点识别方法
技术领域
本发明涉及交通大数据领域,尤其涉及一种基于BDCH-DBSCAN的出租车载客热点识别方法。
背景技术
现今GPS轨迹数据作为交通大数据的一种,已被广泛应用。大量出租车上下客点形成的上下客热点对分析居民出行的时空分布、城市交通规划有着重要意义。
现有技术中,基于出租车载客热点的提取主要包括两种方式:(1)通过划分网格单元格的方式:如基于路网约束的DBSCAN改进算法,基于网格的K-Means交通热区识别算法,利用数据场势值阈值法探测轨迹点的聚集模式,提取热点区域。(2)基于无监督的聚类方式:如结合当前环境轨迹特征的DBSCAN算法,基于MapReduce的从出租车轨迹提取热点区域的分布并行算法,GBADBSCAN上下客热点生成聚类算法。这些算法在聚类热点区域中,均取得了较好的检测效果,但是在大数据处理精确度上仍存在不足。
DBSCAN是最常用的一种基于密度的聚类方法。传统的DBSCAN算法在聚类海量出租车行车轨迹数据点具有无法适应大规模数据、无法识别类簇中心、过程式单线程聚类速度慢等局限性。DBSCAN算法的基本原理是通过设定扫描半径Eps和最小包含点数MinPts来找出数据点集合中密度相连的最大集合。在半径Eps内含有超过MinPts数目的点叫做核心点;在半径Eps内含有小于MinPts数目,并且是在核心点的邻域内的点叫做边界点;既不是核心点也不是边界点的点叫做噪音点。但是,该方法只是简单的考虑了数据点之间的距离和每个核心点所需要的最小包含点数,在数据量大的情况下,经常会出现簇中轨迹点过多、覆盖面积较广、可视化效果差、热点无法被精确找到等问题。
发明内容
发明目的:为了解决现有技术存在的问题,既适用于大规模数据又能高效准确的找出类簇簇心,本发明提供一种基于BDCH-DBSCAN的出租车载客热点识别方法。
技术方案:一种基于BDCH-DBSCAN的出租车载客热点识别方法,包括以下步骤:
(1)提供大量出租车GPS数据轨迹,从中剔除干扰数据,每个GPS数据轨迹包括多个GPS数据点,每个GPS数据点包括载客状态、经度、纬度;
(2)提取GPS数据轨迹中的上车数据点和下车数据点,若在该点之前的GPS数据点的载客状态为空载状态,在该点之后的GPS数据点的载客状态为载客状态,则判断该点为上车数据点;若在该点之前的GPS数据点的载客状态为载客状态,在该点之后的GPS数据点的载客状态为空载状态,则判断该点为下车数据点;
(3)对提取的上车数据点和下车数据点聚类进行分块循环聚类,将数据以5000个为一组放入线程池中进行聚类,聚类设定扫描半径Eps和最小簇点数MinPts,采用DBSCAN算法分离出核心点,并获取核心点的邻居节点集,所述邻居节点集是以核心点为中心在半径Eps范围内的所有点的集合,邻居节点集中的点为邻居节点,对核心点进行扩展簇操作,扩展簇指对核心点的邻居节点进行类簇划分,类簇划分指将每个点分配到对应点集内,由此形成一个个簇,并将大于MinPts的邻居节点及其领域添加进簇中;
(4)找出簇心:根据上车数据点和下车数据点的经度、纬度,确定两个数据点之间的曲面距离用来发现扫描半径Eps内的邻居节点;对每一个簇内点P进行密度计算,点P的邻居节点个数占簇内总点数的比例记为P点密度;最后找出该簇中密度最大即所含邻居节点数最多的点作为该簇的簇心;
(5)将簇心集合重新写入轨迹点队列中再次聚类,并设定载客热点数量范围,直到最终簇心集合数量即载客热点数量达到设定的范围。
优选的,步骤(1)中剔除干扰数据的方法为:设定出租车最大行驶速度为Vmax;在GPS数据轨迹中提取一段时间内的GPS数据点,记为GPS轨迹序列T{p1,p2,...,pk},选择保留满足下式的GPS轨迹序列:
式中:distance(pi+1,pi)表示pi+1到pi的欧式距离;pi,t表示采集pi轨迹点的时间,(pi+1,t-pi,t)表示pi+1点到pi点之间的时间差;
若pi不满足上式,则pi为跳变点,剔除该GPS数据轨迹。
优选的,步骤(4)找出簇心的方法为:在获取类簇操作时,记录每一簇内节点的邻居点集中点的个数;对每一簇内的点进行密度计算,所述密度为该点的邻居点个数占簇内总点数的比例;找出簇中密度最大即所含邻居节点数最多的点,作为该簇的簇心。
优选的,步骤(4)中确定两个数据点之间的曲面距离的方法为:
设两个数据点之间的曲面距离为L,则:
a=lat1-lat2
b=lon1-lon2
式中,lat1表示第一个数据点的纬度,lat2表示第二个数据点的纬度,lat1表示第一个轨迹点的经度,lat2表示第二个轨迹点的经度,R表示地球半径。
优选的,步骤(1)中的GPS数据点还包括簇序号、簇热点中心标识参数;所述簇序号为类簇编号,是每一类簇唯一的标识,用于区分各个类簇;所述簇热点中心标识参数为标记计算出的类簇中心点。
有益效果:本发明提供一种基于BDCH-DBSCAN的出租车载客热点识别方法,相比较现有技术,根据出租车GPS数据的分布特征,将簇心引入传统的DBSCAN算法中,可以适应大规模数据、便于识别类簇中心、多线程聚类速度快;将簇心与多线程并行分块聚类加入至DBSCAN算法中,克服了现有技术的方法在出租车载客热点区域提取精确度的不足的问题。本方法有效的为用户找出每个簇中的最大密度点,并以该点作为簇心。用簇心代替簇类的显示方法既可以使输出结果更为简洁,也可以使热点显示更为精确。
附图说明
图1为上车数据点、下车数据点的载客状态变化图;
图2为簇心识别流程图;
图3为分块聚类流程图;
图4为是使用DBSCAN算法、C-DBSCAN和BDCH-DBSCAN算法聚类后的时间复杂度对比图;
图5(a)采用单线程聚类的资源利用率示意图;
图5(b)采用多线程聚类的资源利用率示意图;
图6(a)为使用DBSCAN算法聚类后的郊区热点示意图;
图6(b)为使用C-DBSCAN算法聚类后的郊区热点示意图;
图6(c)为使用BDCH-DBSCAN算法聚类后的郊区热点示意图;
图7为实验中使用BDCH-DBSCAN算法的出租车载客热点聚类效果示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
基于BDCH-DBSCAN的出租车载客热点识别方法,包括以下步骤:
(1)首先提供大量出租车GPS数据轨迹,本实施例采用的GPS数据轨迹为淮安市2016~2017年出租车GPS轨迹数据,数据大小约为200G,采样时间间隔在30~60秒。每个GPS数据轨迹包括多个GPS数据点,每个GPS数据点包括出租车的车牌号、当前采样点的采样时间、载客状态、经度、纬度、簇序号(0:未分类,-1:噪声点,正数:序号)、簇热点中心标识参数(0:非簇中心,1:簇中心);所述簇序号为类簇编号,是每一类簇唯一的标识,用于区分各个类簇;所述簇热点中心标识参数为标记计算出的类簇中心点;
从这些大量的初始数据中剔除干扰数据,具体方法为:设定出租车最大行驶速度为Vmax;在GPS数据轨迹中提取一段时间内的GPS数据点,记为GPS轨迹序列T{p1,p2,..,pk},选择保留满足下式的GPS轨迹序列:
式中:distance(pi+1,pi)表示pi+1到pi的欧式距离;
若pi不满足上式,则pi为跳变点,剔除该GPS数据轨迹。
由于轨迹数据量巨大,而且受到GPS设备的精准度以及环境等因素的影响,初始的GPS数据点中夹杂了一些异常点,而这些异常点会直接影响后续轨迹处理的准确度,故首先对数据进行一定的预处理,然后再将其进行聚类,可以避免干扰信息的影响。
(2)提取GPS数据轨迹中的上车数据点和下车数据点,如图1所示,若在该点之前的GPS数据点的载客状态为空载状态,在该点之后的GPS数据点的载客状态为载客状态,则判断该点为上车数据点;若在该点之前的GPS数据点的载客状态为载客状态,在该点之后的GPS数据点的载客状态为空载状态,则判断该点为下车数据点;
(3)对提取的上车数据点和下车数据点聚类进行分块循环聚类,采用BDCH-DBSCAN算法将所有的上车数据点和下车数据点以5000个为一组放入线程池中进行聚类,聚类设定扫描半径Eps和最小簇点数MinPts,采用DBSCAN算法分离出核心点,并获取核心点的邻居节点集,所述邻居节点集是以核心点为中心在半径Eps范围内的所有点的集合,邻居节点集中的点为邻居节点,对核心点进行扩展簇操作,扩展簇指对核心点的邻居节点进行类簇划分(将每个点分配到对应点集内,由此形成一个个簇),类簇划分指将每个点分配到对应点集内,由此形成一个个簇,并将大于MinPts的邻居节点及其领域添加进簇中;
(4)找出簇心:根据上车数据点和下车数据点的经度、纬度,确定两个数据点之间的曲面距离用来发现扫描半径Eps内的邻居节点;对每一个簇内点P进行密度计算,点P的邻居节点个数占簇内总点数的比例记为P点密度;最后找出该簇中密度最大即所含邻居节点数最多的点作为该簇的簇心;
之所以根据GPS数据点的经度、纬度,确定两个数据点之间的距离,是因为地球面是一个曲面,所以在计算两个地理位置的距离时,不能用简单的欧式距离来计算,而需要考虑实际的曲面距离,才能使结果更加准确,设两个数据点之间的曲面距离为L,两个数据点之间的曲面距离的计算方法为:
a=lat1-lat2
b=lon1-lon2
式中,lat1表示第一个数据点的纬度,lat2表示第二个数据点的纬度,lat1表示第一个轨迹点的经度,lat2表示第二个轨迹点的经度,R表示地球半径。
如图2所示,找出簇心的方法具体为:在获取类簇操作时,记录每一簇内节点的邻居点集中点的个数;对每一簇内的点进行密度计算,所述密度为该点的邻居点个数占簇内总点数的比例;找出簇中密度最大即所含邻居节点数最多的点,作为该簇的簇心。
(5)找出簇心后,将簇心集合重新写入轨迹点队列中再次聚类,并设定载客热点数量范围,直到最终簇心集合数量即载客热点数量达到设定的范围。
分块聚类的方法流程如图3所示,本方法将数据以5000个为一组放入最大线程数为50的阻塞队列线程池中进行聚类。在聚类过程中对线程池每秒进行监控。当线程池为空时,将聚类结果重新写入轨迹点队列GPSList中以便再次聚类。该聚类以每组5000个数据集、Eps(扫描半径)=30、MinPts(最小簇点数)=3为参数的BDCH-DBSCAN聚类方法进行聚类。多次实验表明当MinPts设置为2时,会导致结果簇中点数较多。而当MinPts设置为4或更高时,会导致结果簇中点数过少,故本文设定的MinPts值为3。
将输出的结果点数压缩到1000以内,增强可视化效果,合并每组的聚类结果,并获取聚类后的数据点数GPSList.Count。压缩的过程是再次聚类的过程,该算法针对在MinPts的选取上出现无法同时照顾到稀疏的偏远地区和市区密集的载客点的问题,设定了不同的最小包含点数MinPts值。GPSList.Count<=1000时,则满足输出要求,可以直接将聚类结果写入数据库;GPSList.Count>1000且GPSList.Count<=3000时,则以MinPts=2,Eps=30进行聚类;GPSList.Count>3000时,则以MinPts=3,Eps=30进行聚类。
最后将聚类结果写入数据库,再次运行程序时就无需再次聚类所有的点,直接显示每个簇中为簇心的点,为用户节省了因重复操作而等待的时间。
为了验证本方法的技术效果,进行以下实验对比分析:
实验环境为Intel(R)Core(TM)i7-4700MQ CPU,8GB DDR3 1600内存的PC机。实验数据来自淮安市2016-2017年出租车GPS数据轨迹资源。实验过程中需要提供网络服务。本实验与现有技术中的DBCSCAN算法、基于海量GPS数据的公共交通站点及路线优化研究中的C-DBSCAN算法进行比较。实验结果主要是从以下四个方面进行分析:
1、时间复杂度:
DBSCAN聚类算法采用单线程操作,而单线程在程序执行时,运行的程序路径是连续顺序的,必须前面的处理好,后面的才会执行到。因此,所消耗时间也较长。DBSCAN算法的基本时间复杂度是O(n2)。C-DBSCAN算法的时间复杂度是O(nlog(n))。BDCH-DBSCAN算法采用先分块聚类,后对结果再次聚类的方案。时间复杂度为O(n)。
实验证明,通过多线程分块循环聚类的方案,算法的时间复杂度从O(n2)的指数关系降至O(n)的线性关系,极大的缩短了大规模数据的聚类时间,对一个月150多万条数据从估计时间(5*90000=450000秒)缩短为780秒。图4为三个方法的时间复杂度对比。
2、资源利用率
为了充分发挥电脑的性能,提高运算效率,本方法引入了线程池技术,将大数据以5000为一组放入最大线程数为50的线程池中进行聚类。在采用了线程池聚类情况下,明显改善了系统资源利用率低的情况,充分利用了CPU最大性能。实验表明,在采用了多线程聚类后,CPU性能越强,聚类时间越短。而在此之前,由于未充分开发系统资源,硬件性能的影响并不明显。
图5(a)为单线程,资源利用率为22%,未能充分利用系统资源;图5(b)为多线程,资源利用率几乎100%,效率大大提升。
3、聚类精确度
DBSCAN聚类算法的结果是以簇的形式呈现的。因此,热点在地图上往往显示的是一块区域,而不是某一个精确的位置。甚至在某些热点区域,聚类结果会覆盖整条街道。而且DBCSAN算法的聚类结果收到参数MinPts的影响,往往会忽略稀疏偏远地区的热点。
而C-DBSCAN算法则是简单的以取簇中的经纬度平均值作为簇心,会导致簇心不准确的情况出现。
由BDCH-DBSCAN算法处理过的数据集是选取每个簇中密度最高的点作为簇心呈现出来的,簇心具有较高的精确度和代表性。在程序进行再次聚类时,会根据初次聚类后数据集点数设定不同的MinPts值。在聚类结果中,一些郊区热点也可以被发现。
图6分别是使用DBSCAN算法、C-DBSCAN和BDCH-DBSCAN算法聚类后的热点图。可以看出,DBSCAN和C-DBSCAN算法无法覆盖学校门口的热点,而BDCH-DBSCAN算法可以覆盖到。而且在定位淮安汽车南站附近热点时可以更加精确的显示热点位置。
实验表明聚类后的精度明显提高,且覆盖了很多小规模数据无法得到的热点。
4、可视化效果
对于C-DBSCAN算法,在聚类的过程中由于数据多,运算量大,常常出现程序短时间卡死的现象,此时对地图的一些基本操作(例如:地图的拖动,缩放等操作)也无法同步完成。为此引入分块多线程并发操作,各线程之间独立运行,互不干扰。并且为了保证地图的效果,本方法将地图显示的线程独立,避免了因为大量数据的聚类操作而导致地图出现短时间的卡死状态。增强了程序的可用性和稳固性。淮安市出租车载客热点聚类效果如图7所示。
实验证明BDCH-DBSCAN算法在时间复杂度、资源利用率、聚类精确度和可视化效果上都具有一定的优势,对出租车载客热点区域的精确提取方面具有更好的效果,能更好地反映道路的载客热度。

Claims (5)

1.一种基于BDCH-DBSCAN的出租车载客热点识别方法,其特征在于,包括以下步骤:
(1)提供大量出租车GPS数据轨迹,从中剔除干扰数据,每个GPS数据轨迹包括多个GPS数据点,每个GPS数据点包括载客状态、经度、纬度;
(2)提取GPS数据轨迹中的上车数据点和下车数据点,若在该点之前的GPS数据点的载客状态为空载状态,在该点之后的GPS数据点的载客状态为载客状态,则判断该点为上车数据点;若在该点之前的GPS数据点的载客状态为载客状态,在该点之后的GPS数据点的载客状态为空载状态,则判断该点为下车数据点;
(3)对提取的上车数据点和下车数据点聚类进行分块循环聚类,将数据以5000个为一组放入线程池中进行聚类,聚类设定扫描半径Eps和最小簇点数MinPts,采用DBSCAN算法分离出核心点,并获取核心点的邻居节点集,所述邻居节点集是以核心点为中心在半径Eps范围内的所有点的集合,邻居节点集中的点为邻居节点,对核心点进行扩展簇操作,扩展簇指对核心点的邻居节点进行类簇划分,类簇划分指将每个点分配到对应点集内,由此形成一个个簇,并将大于MinPts的邻居节点及其领域添加进簇中;
(4)找出簇心:根据上车数据点和下车数据点的经度、纬度,确定两个数据点之间的曲面距离用来发现扫描半径Eps内的邻居节点;对每一个簇内点P进行密度计算,点P的邻居节点个数占簇内总点数的比例记为P点密度;最后找出该簇中密度最大即所含邻居节点数最多的点作为该簇的簇心;
(5)将簇心集合重新写入轨迹点队列中再次聚类,并设定载客热点数量范围,直到最终簇心集合数量即载客热点数量达到设定的范围。
2.根据权利要求1所述的基于BDCH-DBSCAN的出租车载客热点识别方法,其特征在于,步骤(1)中剔除干扰数据的方法为:设定出租车最大行驶速度为Vmax;在GPS数据轨迹中提取一段时间内的GPS数据点,记为GPS轨迹序列T{p1,p2,...,pk},选择保留满足下式的GPS轨迹序列:
式中:distance(pi+1,pi)表示pi+1到pi的欧式距离;pi,t表示采集pi轨迹点的时间,(pi+1t-pi,t)表示pi+1点到pi点之间的时间差;
若pi不满足上式,则pi为跳变点,剔除该GPS数据轨迹。
3.根据权利要求1或2所述的基于BDCH-DBSCAN的出租车载客热点识别方法,其特征在于,步骤(4)找出簇心的方法为:在获取类簇操作时,记录每一簇内节点的邻居点集中点的个数;对每一簇内的点进行密度计算,所述密度为该点的邻居点个数占簇内总点数的比例;找出簇中密度最大即所含邻居节点数最多的点,作为该簇的簇心。
4.根据权利要求1或2所述的基于BDCH-DBSCAN的出租车载客热点识别方法,其特征在于,步骤(4)中确定两个数据点之间的曲面距离的方法为:
设两个数据点之间的曲面距离为L,则:
a=lat1-lat2
b=lon1-lon2
式中,lat1表示第一个数据点的纬度,lat2表示第二个数据点的纬度,lat1表示第一个轨迹点的经度,lat2表示第二个轨迹点的经度,R表示地球半径。
5.根据权利要求1或2所述的基于BDCH-DBSCAN的出租车载客热点识别方法,其特征在于,步骤(1)中的GPS数据点还包括簇序号、簇热点中心标识参数;所述簇序号为类簇编号,是每一类簇唯一的标识,用于区分各个类簇;所述簇热点中心标识参数为标记计算出的类簇中心点。
CN201810130946.8A 2018-02-08 2018-02-08 基于bdch-dbscan的出租车载客热点识别方法 Active CN108415975B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810130946.8A CN108415975B (zh) 2018-02-08 2018-02-08 基于bdch-dbscan的出租车载客热点识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810130946.8A CN108415975B (zh) 2018-02-08 2018-02-08 基于bdch-dbscan的出租车载客热点识别方法

Publications (2)

Publication Number Publication Date
CN108415975A true CN108415975A (zh) 2018-08-17
CN108415975B CN108415975B (zh) 2021-07-27

Family

ID=63128187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810130946.8A Active CN108415975B (zh) 2018-02-08 2018-02-08 基于bdch-dbscan的出租车载客热点识别方法

Country Status (1)

Country Link
CN (1) CN108415975B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109359682A (zh) * 2018-10-11 2019-02-19 北京市交通信息中心 一种基于f-dbscan迭代聚类的机场巴士候选站点筛选方法
CN109686085A (zh) * 2018-12-17 2019-04-26 北京交通大学 基于gps数据危险货物运输车辆停留节点活动类型识别方法
CN110728305A (zh) * 2019-09-16 2020-01-24 南京信息工程大学 基于网格信息熵聚类算法的出租车载客热点区域挖掘方法
CN110851741A (zh) * 2019-11-09 2020-02-28 郑州天迈科技股份有限公司 出租车载客热点识别推荐算法
CN110990661A (zh) * 2019-10-23 2020-04-10 南通大学 一种基于路网约束和密度聚类的兴趣区域出入口提取方法
CN111694862A (zh) * 2019-03-11 2020-09-22 北京京东尚科信息技术有限公司 数据流的处理方法及系统、电子设备、存储介质
CN111950632A (zh) * 2020-08-12 2020-11-17 贝壳技术有限公司 用于实现聚类的方法、装置、介质以及电子设备
CN112069229A (zh) * 2020-08-27 2020-12-11 贵州民族大学 一种面向移动轨迹大数据的最佳候车点推荐方法及系统
CN112380302A (zh) * 2020-10-23 2021-02-19 北京建筑大学 基于轨迹数据的热力图生成方法、装置、电子设备以及存储介质
CN112784000A (zh) * 2021-01-27 2021-05-11 长沙理工大学 基于出租车轨迹数据的寻客方法
CN113225260A (zh) * 2021-04-25 2021-08-06 湖南大学 一种基于机器学习的混合聚类机会路由实现方法
CN113469242A (zh) * 2021-06-29 2021-10-01 深圳市瑞立视多媒体科技有限公司 基于多线程的聚类数据处理方法和数据处理设备
CN114022195A (zh) * 2021-10-21 2022-02-08 淮阴工学院 基于密度并结合小区数据的快递行业配送网点规划方法
CN115587657A (zh) * 2022-10-19 2023-01-10 华中科技大学 一种夜间定制公交的站点确定及线路优化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104167092A (zh) * 2014-07-30 2014-11-26 北京市交通信息中心 一种确定出租车上下客热点区域中心的方法以及装置
CN107481511A (zh) * 2017-08-16 2017-12-15 深圳先进技术研究院 一种计算候选公交站点的方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104167092A (zh) * 2014-07-30 2014-11-26 北京市交通信息中心 一种确定出租车上下客热点区域中心的方法以及装置
CN107481511A (zh) * 2017-08-16 2017-12-15 深圳先进技术研究院 一种计算候选公交站点的方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HUI XIONG等: "A Web-based Platform for Visualizing Spatiotemporal Dynamics of Big Taxi Data", 《THE INTERNATIONAL ARCHIVES OF THE PHOTOGRAMMETRY, REMOTE SENSING AND SPATIAL INFORMATION SCIENCES》 *
WU WANG等: "A C-DBSCAN Algorithm for Determining Bus-Stop Locations Based on Taxi GPS Data", 《ADVANCED DATA MINING AND APPLICATIONS》 *
江慧娟等: "出租车载客热点精细提取的改进DBSCAN算法", 《地理空间信息》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109359682A (zh) * 2018-10-11 2019-02-19 北京市交通信息中心 一种基于f-dbscan迭代聚类的机场巴士候选站点筛选方法
CN109686085A (zh) * 2018-12-17 2019-04-26 北京交通大学 基于gps数据危险货物运输车辆停留节点活动类型识别方法
CN111694862A (zh) * 2019-03-11 2020-09-22 北京京东尚科信息技术有限公司 数据流的处理方法及系统、电子设备、存储介质
CN110728305A (zh) * 2019-09-16 2020-01-24 南京信息工程大学 基于网格信息熵聚类算法的出租车载客热点区域挖掘方法
CN110728305B (zh) * 2019-09-16 2024-01-05 南京信息工程大学 基于网格信息熵聚类算法的出租车载客热点区域挖掘方法
CN110990661A (zh) * 2019-10-23 2020-04-10 南通大学 一种基于路网约束和密度聚类的兴趣区域出入口提取方法
CN110990661B (zh) * 2019-10-23 2023-06-30 南通大学 一种基于路网约束和密度聚类的兴趣区域出入口提取方法
CN110851741A (zh) * 2019-11-09 2020-02-28 郑州天迈科技股份有限公司 出租车载客热点识别推荐算法
CN111950632A (zh) * 2020-08-12 2020-11-17 贝壳技术有限公司 用于实现聚类的方法、装置、介质以及电子设备
CN111950632B (zh) * 2020-08-12 2021-11-09 贝壳找房(北京)科技有限公司 用于实现小区信息聚类的方法、装置、介质以及电子设备
CN112069229B (zh) * 2020-08-27 2024-02-27 贵州民族大学 一种面向移动轨迹大数据的最佳候车点推荐方法及系统
CN112069229A (zh) * 2020-08-27 2020-12-11 贵州民族大学 一种面向移动轨迹大数据的最佳候车点推荐方法及系统
CN112380302A (zh) * 2020-10-23 2021-02-19 北京建筑大学 基于轨迹数据的热力图生成方法、装置、电子设备以及存储介质
CN112380302B (zh) * 2020-10-23 2023-07-21 北京建筑大学 基于轨迹数据的热力图生成方法、装置、电子设备以及存储介质
CN112784000A (zh) * 2021-01-27 2021-05-11 长沙理工大学 基于出租车轨迹数据的寻客方法
CN113225260A (zh) * 2021-04-25 2021-08-06 湖南大学 一种基于机器学习的混合聚类机会路由实现方法
CN113225260B (zh) * 2021-04-25 2022-11-18 湖南大学 一种基于机器学习的混合聚类机会路由实现方法
CN113469242A (zh) * 2021-06-29 2021-10-01 深圳市瑞立视多媒体科技有限公司 基于多线程的聚类数据处理方法和数据处理设备
CN114022195A (zh) * 2021-10-21 2022-02-08 淮阴工学院 基于密度并结合小区数据的快递行业配送网点规划方法
CN115587657A (zh) * 2022-10-19 2023-01-10 华中科技大学 一种夜间定制公交的站点确定及线路优化方法

Also Published As

Publication number Publication date
CN108415975B (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
CN108415975A (zh) 基于bdch-dbscan的出租车载客热点识别方法
CN108959466A (zh) 基于bcs-dbscan的出租车载客热点可视化方法及系统
CN105788273B (zh) 基于低精度时空轨迹数据的城市交叉口自动识别的方法
Zhan et al. Citywide traffic volume estimation using trajectory data
CN110909788B (zh) 一种基于统计聚类的轨迹数据中道路交叉口位置识别方法
CN103218435B (zh) 一种中文文本数据聚类方法及系统
CN110738856B (zh) 一种基于移动聚类的城市交通拥堵精细识别方法
CN108427965A (zh) 一种基于路网聚类的热点区域挖掘方法
CN106600960A (zh) 基于时空聚类分析算法的交通出行起讫点识别方法
CN111582380B (zh) 一种基于时空特征的船舶轨迹密度聚类方法及装置
CN108961758A (zh) 一种基于梯度提升决策树的路口展宽车道探测方法
CN110120218A (zh) 基于gmm-hmm的高速公路大型车辆识别方法
CN110188803A (zh) 基于出租车轨迹数据的出行时空模式识别方法与系统
CN108806248B (zh) 一种针对rfid电子车牌数据的车辆出行轨迹划分方法
CN103268489A (zh) 基于滑窗搜索的机动车号牌识别方法
CN105682024A (zh) 一种基于移动信令数据的城市热点识别方法
WO2018045529A1 (zh) 一种网络站址规划方法及装置
CN104732092A (zh) 一种基于聚类的水文降雨一致区分析方法
CN107146414B (zh) 基于车辆识别的路网通行能力提取方法
CN106227859A (zh) 从gps数据中识别交通工具的方法
CN109489679A (zh) 一种导航路径中的到达时间计算方法
CN108053646B (zh) 基于时间敏感特征的交通特征获取方法、预测方法及系统
CN105590330B (zh) 基于群智感知的室内平面图生成方法、服务器及系统
CN114091581A (zh) 一种基于稀疏轨迹的车辆运营行为类型识别方法
CN116704750B (zh) 一种基于聚类算法的交通状态识别方法、电子设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20180817

Assignee: HUAIAN TIANZE STAR NETWORK INFORMATION INDUSTRY LTD.

Assignor: HUAIYIN INSTITUTE OF TECHNOLOGY

Contract record no.: X2021980012224

Denomination of invention: Identification method of taxi passenger hot spots based on bdch-dbscan

Granted publication date: 20210727

License type: Common License

Record date: 20211111