CN104167092B - 一种确定出租车上下客热点区域中心的方法以及装置 - Google Patents
一种确定出租车上下客热点区域中心的方法以及装置 Download PDFInfo
- Publication number
- CN104167092B CN104167092B CN201410370602.6A CN201410370602A CN104167092B CN 104167092 B CN104167092 B CN 104167092B CN 201410370602 A CN201410370602 A CN 201410370602A CN 104167092 B CN104167092 B CN 104167092B
- Authority
- CN
- China
- Prior art keywords
- board
- data
- taxi
- hot spot
- spot region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Traffic Control Systems (AREA)
- Navigation (AREA)
Abstract
本发明公开了一种确定出租车上下客热点区域中心的方法以及装置,该方法包括:获得出租车状态信息数据,并按出租车编号提取出地理位置数据,并按时间戳排序所述地理位置数据,获得出租车轨迹数据;从所述出租车轨迹数据中提取上下客位置数据,其中,每辆出租车的每一处上客点数据或下客点数据为一个样本数据;对所述上下客位置数据进行首次DBSCAN聚类,提取出核心对象数据,所述核心对象的预设扫描半径内的样本数据个数大于等于第一预设阈值;归并选定时间段内的所述核心对象数据,并对归并后的核心对象数据进行二次DBSCAN聚类,提取簇内核心对象数据;基于所述簇内核心对象数据,确定所述出租车上下客热点区域中心。
Description
技术领域
本发明涉及智能交通技术领域,尤其涉及一种确定出租车上下客热点区域中心的方法以及装置。
背景技术
随着城市化、现代化、机动化进程的加快以及市民个人意识的提高,越来越多的市民选择公共交通出行。然而当前城市人群活动具有区域密集和出行时间集中于早晚高峰时期的特点,现有的地面公共交通依然不能满足市民需求,地面公共交通形势日益严峻,公共交通合理性规划有待于完善。
当前,市民出行选择的公共交通工具主要包括出租车、公交车以及轨道交通等三种。出租车是用户出行优先选择的快速的公共交通方式,这种交通工具的优点是快捷、且能够实现点对点的交通服务。由于出租车长期以来没有经过合理的运营方式规划,出租车的运行问题主要包括一下两种:一是潜在乘客等待时间长,打车成功具有随机性。在交通平峰时期,潜在乘客居住、工作以及生活分布的不规律,对出租车的需求无明显区域聚集现象,乘客与出租车司机无交互,出租车司机无法快速发现乘客的需求,打车主要依靠路边招手停车等方式,等待时间不固定,成功打到车具有随机性;二是路边招手停车影响城市路面交通。在交通高峰时期,乘客对出租车需求相对集中,潜在乘客在主辅路路边打车,“招手即停”现象严重影响地面交通状况。
为方便乘客打车,合理规范出租车上下客停车,国内外很多城市设立有出租车扬招站。以北京市为例,北京市交通委员会牵头在六个主城区设立604个扬招站,主要分布在分布交通枢纽、地铁、学校、医院、旅游景点、商业区、办公区等周边。然而现有扬招站的设立依据主要是征集市民意见,而扬招站的设立没有经过合理性研究及规划,导致当前的扬招站设立存在以下问题:一是部分扬招站设在胡同、小区等非出租车上下客密集区域内,站点使用率趋于零;二是部分扬招站设立距离间隔短,存在多对站点距离小于100m的情况,扬招站站点设立冗余。
扬招站设立的问题可以抽象为出租车热点打车区域发现的问题,现有技术中有很多关于确定出租车上下客热点区域的方法的研究,主要包括以下两种:
第一种方法的核心思想是通过K-Means算法聚类出租车地理位置数据,如全球定位系统(英文:Global Positioning System;简称:GPS)数据等等,确定上下客热点区域。由于出租车上下客热点区域具有区域集中特性,因此地理位置数据将呈现聚类集中的规律。该方法通过K-means算法对地理位置数据中的上下客事件数据进行聚类分析,从原始数据中提取满足聚类条件的簇,将这些簇的地理位置数据投影至地图上即可发现出租车上下客热点区域。由于K-Means算法聚类算法用来解决发现出租车上下客热点区域的缺陷表现在以下两个问题:一是市区上下客区域的聚类中心不明显,无确定的簇数量,聚类算法不能有效发现热点区域数量;二是由于K-Mean算法得到的聚类簇将以某些地理位置数据点为中心,其余簇内的地理位置数据点分布在以该数据点为中心的圆形区域内。而出租车上下客位置点实际是沿着道路、交叉口或者十字路口呈现带状分布,因此这种算法不能够有效发现出租车上下客热点区域。
第二种确定热点区域的方法主要依赖于对于不同时段的出租车历史地理位置数据进行数据渲染得到热力图,该热力图面向司机及出租车调度公司服务。该方法通过对出租车某段时间内某个区域内的即时速度进行加权平均处理,得到某些区域内的出租车历史分布信息。该方法可以有效发现某些区域的需求,但是不能具体发现和识别具体的打车站点,不能满足规划扬招站位置的要求,继而不能有效地解决打车难的问题。
因此,现有技术中存在出租车上下客热点区域的确定方法无法识别具体的打车站点,不能满足规划扬招站位置需求的技术问题。
发明内容
本发明实施例通过提供一种确定出租车上下客热点区域中心的方法以及装置,用以解决现有技术中存在的出租车上下客热点区域的确定方法无法识别具体的打车站点,不能满足规划扬招站位置需求的技术问题。
本发明实施例一方面提供一种确定出租车上下客热点区域中心的方法,包括:
获得出租车状态信息数据,并按出租车编号提取出地理位置数据,并按时间戳排序所述地理位置数据,获得出租车轨迹数据;
从所述出租车轨迹数据中提取上下客位置数据,其中,每辆出租车的每一处上客点数据或下客点数据为一个样本数据;
对所述上下客位置数据进行首次基于密度的聚类算法DBSCAN聚类,提取出核心对象数据,所述核心对象的预设扫描半径内的样本数据个数大于等于第一预设阈值;
归并选定时间段内的所述核心对象数据,并对归并后的核心对象数据进行二次DBSCAN聚类,提取簇内核心对象数据;
基于所述簇内核心对象数据,确定所述出租车上下客热点区域中心。
可选地,所述基于所述簇内核心对象数据,确定所述出租车上下客热点区域中心,具体包括:
按第二预设阈值对所述簇内核心对象数据进行筛选,获得热点区域对象数据;
对所述热点区域对象数据对应的热点区域内的上下客位置数据进行加权平均处理,确定所述出租车上下客热点区域中心。
可选地,所述对所述热点区域对象数据对应的热点区域内的上下客位置数据进行加权平均处理,确定所述出租车上下客热点区域中心,具体包括:
(1)设定第一簇内包含k个数据点P1,P2,…,Pi,…,Pk(1≤i≤k),每个点地理位置数据表示为Pi(xi,yi),则所述第一簇的热点区域中心为P(x,y),其中
(2)重复步骤(1),直到确定出所述出租车上下客热点区域中心。
可选地,所述从所述出租车轨迹数据中提取上下客位置数据,具体包括:
对所述出租车轨迹数据进行关键字段数据筛选,提取出所述上下客位置数据,所述关键字段数据至少包括车辆经纬度、方向、速度、时间戳以及状态位,所述状态位的数值为空载(0)、满载(1)、驻车(2)或停车(3);
其中,对于每辆车的地理位置数据,若在3个连续的时刻t、t+1、t+2的状态位数据分别为0、1、1,并且在t时刻的速度小于第一值,则t时刻对应的地理位置数据为上客点数据;
若在3个连续时刻t-2、t-1、t的状态位数据分别为1、1、0且在t时刻的速度小于第二值,则t时刻对应的地理位置数据为下客点数据。
可选地,所述对所述上下客位置数据进行首次DBSCAN聚类,提取出核心对象数据,具体包括:
(1)设置扫描半径和最小包含点数,逐个读取所述上下客位置数据,检测每个尚未检查过的出租车的上下客位置数据对象p,如果p为被处理(归为某个簇或者标记为噪声),则检查其邻域,若包含的对象数不小于最小包含点数,建立新簇C,将其中的所有点加入候选集N;
(2)对候选集N中所有尚未被处理的对象q,检查其邻域,若至少包含最小包含点数个对象,则将这些对象加入N;如果q未归入任何一个簇,则将q加入C;
(3)重复步骤(2),继续检查N中未处理的对象,当前候选集N为空;
(4)重复步骤(1)~(3),直到所有对象都归入了某个簇或标记为噪声。
本发明实施例另一方面还提供一种确定出租车上下客热点区域中心的装置,包括:
第一提取单元,用于获得出租车状态信息数据,并按出租车编号提取出地理位置数据,并按时间戳排序所述地理位置数据,获得出租车轨迹数据;
第二提取单元,用于从所述出租车轨迹数据中提取上下客位置数据,其中,每辆出租车的每一处上客点数据或下客点数据为一个样本数据;
第三提取单元,用于对所述上下客位置数据进行首次DBSCAN聚类,提取出核心对象数据,所述核心对象的预设扫描半径内的样本数据个数大于等于第一预设阈值
第四提取单元,用于归并选定时间段内的所述核心对象数据,并对归并后的核心对象数据进行二次DBSCAN聚类,提取簇内核心对象数据;
确定单元,用于基于所述簇内核心对象数据,确定所述出租车上下客热点区域中心。
可选地,所述确定单元具体用于按第二预设阈值对所述簇内核心对象数据进行筛选,获得热点区域对象数据,并对所述热点区域对象数据对应的热点区域内的上下客位置数据进行加权平均处理,确定所述出租车上下客热点区域中心。
可选地,所述确定单元具体用于设定第一簇内包含k个数据点P1,P2,…,Pi,…,Pk(1≤i≤k),每个点地理位置数据表示为Pi(xi,yi),则所述第一簇的热点区域中心为P(x,y),其中并重复前述步骤,直到确定出所述出租车上下客热点区域中心。
可选地,所述第二提取单元具体用于对所述出租车轨迹数据进行关键字段数据筛选,提取出所述上下客位置数据,所述关键字段数据至少包括车辆经纬度、方向、速度、时间戳以及状态位,所述状态位的数值为空载(0)、满载(1)、驻车(2)或停车(3);
其中,对于每辆车的地理位置数据,若在3个连续的时刻t、t+1、t+2的状态位数据分别为0、1、1,并且在t时刻的速度小于第一值,则t时刻对应的地理位置数据为上客点数据;若在3个连续时刻t-2、t-1、t的状态位数据分别为1、1、0且在t时刻的速度小于第二值,则t时刻对应的地理位置数据为下客点数据。
可选地,所述第三提取单元具体用于:(1)设置扫描半径和最小包含点数,逐个读取所述上下客位置数据,检测每个尚未检查过的出租车的上下客位置数据对象p,如果p为被处理(归为某个簇或者标记为噪声),则检查其邻域,若包含的对象数不小于最小包含点数,建立新簇C,将其中的所有点加入候选集N;(2)对候选集N中所有尚未被处理的对象q,检查其邻域,若至少包含最小包含点数个对象,则将这些对象加入N;如果q未归入任何一个簇,则将q加入C;(3)重复步骤(2),继续检查N中未处理的对象,当前候选集N为空;(4)重复步骤(1)~(3),直到所有对象都归入了某个簇或标记为噪声。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
1、由于采用了根据出租车的状态信息数据获得出租车轨迹数据,并从出租车轨迹数据中提取上下客位置数据,并对所述上下客位置数据进行首次DBSCAN聚类,提取出核心对象数据,并归并选定时间段内的所述核心对象数据,并对归并后的核心对象数据进行二次DBSCAN聚类,提取簇内核心对象数据,并基于所述簇内核心对象数据,确定所述出租车上下客热点区域中心的技术方案,能够通过具体识别出租车的上下客位置信息来确定出租车上下客热点区域中心,所以解决了现有技术中存在的出租车上下客热点区域的确定方法无法识别具体的打车站点,不能满足规划扬招站位置需求的技术问题,从而提高了出租车扬招站位置的合理性,节省了扬招站的建设成本,同时,能够协助出租车公司进行合理的车辆调度,降低出租车的空驶率,并方便人们出行。
2、能够对城市内已经设置的出租车扬招站的位置进行合理性评价,对位置合理性不高的扬招站进行调整,进而方便人们出行。
附图说明
图1为本发明实施例提供的确定出租车上下客热点区域中心的方法流程图;
图2为本发明实施例提供的A城市某天出租车的定位设备传回的地理位置数据的示意图;
图3为本发明实施例提供的A城市A区域某天18:00—20:00之间出租车上下客位置数据示意图;
图4为本发明实施例提供的根据簇内核心对象数据所获得的热点区域的示意图;
图5为本发明实施例提供的出租车上下客热点区域中心的示意图。
具体实施方式
本发明实施例通过提供一种确定出租车上下客热点区域中心的方法以及装置,用以解决现有技术中存在的出租车上下客热点区域的确定方法无法识别具体的打车站点,不能满足规划扬招站位置需求的技术问题。
需要预先说明的是,“上下客”指“上客或者下客”,在本实施例接下来的部分中包括“上下客”在内的词语如“上下客位置数据”、“出租车上下客热点区域中心”等等均为此种含义。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
请参考图1,图1是本发明实施例提供的确定出租车上下客热点区域中心的方法流程图,如图1所示,该方法包括:
S1:获得出租车状态信息数据,并按出租车编号提取出地理位置数据,并按时间戳排序地理位置数据,获得出租车轨迹数据;
S2:从出租车轨迹数据中提取上下客位置数据,其中,每辆出租车的每一处上客点数据或下客点数据为一个样本数据;
S3:对上下客位置数据进行首次DBSCAN聚类,提取出核心对象数据,核心对象的预设扫描半径内的样本数据个数大于等于预设阈值;
S4:归并选定时间段内的核心对象数据,并对归并后的核心对象数据进行二次DBSCAN聚类,提取簇内核心对象数据;
S5:基于簇内核心对象数据,确定出租车上下客热点区域中心。
在S1中,具体来讲,可以通过出租车的定位设备,来获取出租车的地理位置数据,该地理位置数据例如可以是全球定位系统提供的地理位置数据,当然也可以是中国北斗卫星导航系统或者俄罗斯全球卫星导航系统等提供的地理位置数据,该地理位置数据包括出租车的经纬度、方向、速度、时间戳和状态位等数据,请参考图2,图2是本发明实施例提供的A城市某天出租车的定位设备传回的地理位置数据的示意图。
每辆出租车的定位设备都有着唯一的回传号码,该回传号码是与出租车编号是一一对应的,所以可以根据出租车编号提取出每辆出租车的地理位置数据,并按照时间戳排序地理位置数据,从而形成每辆出租车的轨迹数据。
如此重复,就能够获得所有出租车的轨迹数据。
在通过S1获得出租车轨迹数据之后,即进入S2:从出租车轨迹数据中提取上下客位置数据,其中,每辆出租车的每一处上客点数据或下客点数据为一个样本数据。
具体来讲,对于每辆出租车的轨迹数据记录,若在3个连续的时刻t、t+1、t+2的状态位数据分别为0、1、1,并且在t时刻的速度小于第一值,例如30km/h,则t时刻对应的地理位置数据记录为上客点数据;若在3个连续的时刻t-2、t-1、t的状态位数据分别为1、1、0且在t时刻的速度小于第二值,例如30km/h,则t时刻对应的地理位置数据记录为下客点数据,当然了,第一值与第二值可以是相同的,也可以是不相同的,在此就不再赘述了。
通过上述步骤,即能够从出租车轨迹数据中提取每辆车的上下客位置数据。当然,在实际应用中,通过本实施例的介绍,本领域所属的技术人员能够根据实际情况,设置连续时刻为合适的数值,如5S、10S等等,以满足实际情况的需要,在此就不再赘述了。
在实际应用中,由于在工作日(周一到周五)的早、晚上班高峰更需要合理的出租车扬招站配置,所以在本实施例中,将以A城市A区域某天18:00—20:00之间的数据为例来进行介绍本发明实施例中的技术方案,当然,在具体实施过程中,本领域所属的技术人员还可以考虑其他时间段,比如早高峰(如07:30—09:30等时间段)等等,在此就不再赘述了。
请参考图3,图3是本发明实施例提供的A城市A区域某天18:00—20:00之间出租车上下客位置数据示意图。
具体可以通过以下步骤从全城市的上下客位置数据中提取出A区域的上下客位置数据:
(1)设定A区域为由P1,P2,…,Pn-1,Pn,…,Pm点构成的多边形,对于每个点的经纬度分别表示为Pm(xm,ym),判断点Point(x,y)是否在多边形内(上),将交点个数count初始化0,以point为起点,以无穷远为终点作平行于X轴的直线line(x,y;-∞,y);
(2)对于多边形P的一条边edge(xi,yi;xi+1,yi+1),判断是否平行于X轴,如果平行则转到2,否则继续;
(3)判断point(x,y)是否在edge上,如果是,则返回1(点在多边形上),否则继续;
(4)判断边edge与line是否有交点,如果相交则count加1,否则跳转3。
(5)判断交点的总数,如果count为奇数则点在多边形内,若为偶数则点在多边形上。
在通过S2提取出上下客位置数据后,即进入S3:对上下客位置数据进行首次基于密度的聚类算法(英文:Density-Based Spatial Clustering of Applicationswith Noise;简称:DBSCAN)聚类,提取出核心对象数据,核心对象的预设扫描半径内的样本数据个数大于等于第一预设阈值,第一预设阈值也即该核心对象的扫描半径内的最小包含点数(指样本数据的个数)。
具体来讲,对上下客位置数据进行首次DBSCAN聚类的具体过程包括以下步骤:
(1)设置扫描半径(例如20m)和最小包含点数(例如4个),逐个读取上下客位置数据,检测每个尚未检查过的出租车的上下客位置数据对象p,如果p为被处理(归为某个簇或者标记为噪声),则检查其邻域,若包含的对象数不小于最小包含点数,建立新簇C,将其中的所有点加入候选集N;
(2)对候选集N中所有尚未被处理的对象q,检查其邻域,若至少包含最小包含点数个对象,则将这些对象加入N;如果q未归入任何一个簇,则将q加入C;
(3)重复步骤(2),继续检查N中未处理的对象,当前候选集N为空;
(4)重复步骤(1)~(3),直到所有对象都归入了某个簇或标记为噪声。
上述过程对A城市A区域某天18:00—20:00之间的出租车上下客位置数据进行首次DBSCAN聚类的具体过程,一天的数据肯定存在偶然性,所以为了提高计算的准确性,可以多次重复上述首次DBSCAN聚类的具体过程,例如以某个月内30天的18:00—20:00之间的出租车上下客位置数据进行重复聚类,来扩大样本数据的范围性。
即进入S4:归并选定时间段内的核心对象数据,并对归并后的核心对象数据进行二次DBSCAN聚类,提取簇内核心对象数据。
具体来讲,也即选定时间段为1个月内所有工作日(周一至周五)为例,将该1个月内所有工作日的核心对象数据归并至一个记录中,并将归并后的核心对象数据进行二次DBSCAN聚类,从而可以提取簇内核心对象数据。
将归并后的核心对象数据进行二次DBSCAN聚类的具体过程与首次DBSCAN聚类的过程一致,同样是设定扫描半径(例如20m)和最小包含点数(例如4个),在此就不再赘述了。
当然,通过本实施例的介绍,本领域所属的技术人员也能够根据实际情况,设定上述选定时间段的具体时间长度,以满足实际情况的需要,在此就不再赘述了。
在通过S4提取出簇内核心对象数据之后,即进入S5:基于簇内核心对象数据,确定出租车上下客热点区域中心。
具体来讲,包括:按第二预设阈值对簇内核心对象数据进行筛选,获得热点区域对象数据;对热点区域对象数据对应的热点区域内的上下客位置数据进行加权平均处理,确定出租车上下客热点区域中心。
首先,通过S3获得的簇,每个簇内包含有n个上下客位置数据对应的地理位置,可以设定第二阈值为300,当然,也可以为其他合适的数值,则将该簇内所有的地理位置构成的最小多边形确定为热点区域,热点区域对象数据即包括该热点区域的大小、位置等数据;如此,即可以确定出A城市A区内所有的热点区域。请参考图4,图4是本发明实施例提供的根据簇内核心对象数据所获得的热点区域的示意图。
然后,对热点区域对象数据对应的热点区域内的上下客位置数据进行加权平均处理,即假设某簇内包含k个数据点,即P1,P2,…,Pi,…,Pk(1≤i≤k),每个点地理位置数据表示为Pi(xi,yi),那么该簇的聚类中心为P(x,y),其中从而确定出出租车上下客热点区域中心。请参考图5,图5为本发明实施例提供的出租车上下客热点区域中心的示意图。
通过上述部分可以看出,由于采用了根据出租车的状态信息数据获得出租车轨迹数据,并从出租车轨迹数据中提取上下客位置数据,并对上下客位置数据进行首次DBSCAN聚类,提取出核心对象数据,并归并选定时间段内的核心对象数据,并对归并后的核心对象数据进行二次DBSCAN聚类,提取簇内核心对象数据,并基于簇内核心对象数据,确定出租车上下客热点区域中心的技术方案,能够通过具体识别出租车的上下客位置信息来确定出租车上下客热点区域中心,所以解决了现有技术中存在的出租车上下客热点区域的确定方法无法识别具体的打车站点,不能满足规划扬招站位置需求的技术问题,从而提高了出租车扬招站位置的合理性,节省了扬招站的建设成本,同时,能够协助出租车公司进行合理的车辆调度,降低出租车的空驶率,并方便人们出行。
进一步地,能够对城市内已经设置的出租车扬招站的位置进行合理性评价,对位置合理性不高的扬招站进行调整,进而方便人们出行。
基于同一发明构思,本发明实施例还提供一种确定出租车上下客热点区域中心的装置,该装置具体包括:
第一提取单元,用于获得出租车状态信息数据,并按出租车编号提取出地理位置数据,并按时间戳排序地理位置数据,获得出租车轨迹数据;
第二提取单元,用于从出租车轨迹数据中提取上下客位置数据,其中,每辆出租车的每一处上客点数据或下客点数据为一个样本数据;
第三提取单元,用于对上下客位置数据进行首次基于密度的聚类算法DBSCAN聚类,提取出核心对象数据,核心对象的预设扫描半径内的样本数据个数大于等于第一预设阈值
第四提取单元,用于归并选定时间段内的核心对象数据,并对归并后的核心对象数据进行二次DBSCAN聚类,提取簇内核心对象数据;
确定单元,用于基于簇内核心对象数据,确定出租车上下客热点区域中心。
在具体实施过程中,确定单元具体用于按第二预设阈值对簇内核心对象数据进行筛选,获得热点区域对象数据,并对热点区域对象数据对应的热点区域内的上下客位置数据进行加权平均处理,确定出租车上下客热点区域中心。
在具体实施过程中,确定单元具体用于设定第一簇内包含k个数据点P1,P2,…,Pi,…,Pk(1≤i≤k),每个点地理位置数据表示为Pi(xi,yi),则第一簇的热点区域中心为P(x,y),其中并重复前述步骤,直到确定出出租车上下客热点区域中心。
在具体实施过程中,第二提取单元具体用于对出租车轨迹数据进行关键字段数据筛选,提取出上下客位置数据,关键字段数据至少包括车辆经纬度、方向、速度、时间戳以及状态位,状态位的数值为空载(0)、满载(1)、驻车(2)或停车(3);
其中,对于每辆车的地理位置数据,若在3个连续的时刻t、t+1、t+2的状态位数据分别为0、1、1,并且在t时刻的速度小于第一值,则t时刻对应的地理位置数据为上客点数据;若在3个连续时刻t-2、t-1、t的状态位数据分别为1、1、0且在t时刻的速度小于第二值,则t时刻对应的地理位置数据为下客点数据。
在具体实施过程中,第三提取单元具体用于:(1)设置扫描半径和最小包含点数,逐个读取上下客位置数据,检测每个尚未检查过的出租车的上下客位置数据对象p,如果p为被处理(归为某个簇或者标记为噪声),则检查其邻域,若包含的对象数不小于最小包含点数,建立新簇C,将其中的所有点加入候选集N;(2)对候选集N中所有尚未被处理的对象q,检查其邻域,若至少包含最小包含点数个对象,则将这些对象加入N;如果q未归入任何一个簇,则将q加入C;(3)重复步骤(2),继续检查N中未处理的对象,当前候选集N为空;(4)重复步骤(1)~(3),直到所有对象都归入了某个簇或标记为噪声。
本发明实施例提供的确定出租车上下客热点区域中心的装置,与前述部分中所介绍的确定出租车上下客热点区域中心的方法是基于同一发明构思下的两个方面,在前述部分中已经详细地介绍了确定出租车上下客热点区域中心的方法的具体实施过程,本领域所属的技术人员能够根据实际情况,清楚地了解本发明实施例提供的确定出租车上下客热点区域中心的装置的具体结构以及具体实施过程,在此为了说明书的简洁,就不再赘述了。
上述本发明实施例中的技术方案,至少具有如下的技术效果或优点:
1、由于采用了根据出租车的状态信息数据获得出租车轨迹数据,并从出租车轨迹数据中提取上下客位置数据,并对上下客位置数据进行首次DBSCAN聚类,提取出核心对象数据,并归并选定时间段内的核心对象数据,并对归并后的核心对象数据进行二次DBSCAN聚类,提取簇内核心对象数据,并基于簇内核心对象数据,确定出租车上下客热点区域中心的技术方案,能够通过具体识别出租车的上下客位置信息来确定出租车上下客热点区域中心,所以解决了现有技术中存在的出租车上下客热点区域的确定方法无法识别具体的打车站点,不能满足规划扬招站位置需求的技术问题,从而提高了出租车扬招站位置的合理性,节省了扬招站的建设成本,同时,能够协助出租车公司进行合理的车辆调度,降低出租车的空驶率,并方便人们出行。
2、能够对城市内已经设置的出租车扬招站的位置进行合理性评价,对位置合理性不高的扬招站进行调整,进而方便人们出行。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种确定出租车上下客热点区域中心的方法,其特征在于,包括:
获得出租车状态信息数据,并按出租车编号提取出地理位置数据,并按时间戳排序所述地理位置数据,获得出租车轨迹数据;
从所述出租车轨迹数据中提取上下客位置数据,包括:对所述出租车轨迹数据进行关键字段数据筛选,提取出所述上下客位置数据,所述关键字段数据至少包括车辆经纬度、方向、速度、时间戳以及状态位,所述状态位的数值为空载0、满载1、驻车2或停车3;其中,对于每辆车的地理位置数据,若在3个连续的时刻t、t+1、t+2的状态位数据分别为0、1、1,并且在t时刻的速度小于第一值,则t时刻对应的地理位置数据为上客点数据;若在3个连续时刻t-2、t-1、t的状态位数据分别为1、1、0且在t时刻的速度小于第二值,则t时刻对应的地理位置数据为下客点数据;其中,每辆出租车的每一处上客点数据或下客点数据为一个样本数据;
对所述上下客位置数据进行首次基于密度的聚类算法DBSCAN聚类,提取出核心对象数据,所述核心对象的预设扫描半径内的样本数据个数大于等于第一预设阈值;
归并选定时间段内的所述核心对象数据,并对归并后的核心对象数据进行二次DBSCAN聚类,提取簇内核心对象数据;
基于所述簇内核心对象数据,确定所述出租车上下客热点区域中心。
2.如权利要求1所述的方法,其特征在于,所述基于所述簇内核心对象数据,确定所述出租车上下客热点区域中心,具体包括:
按第二预设阈值对所述簇内核心对象数据进行筛选,获得热点区域对象数据;
对所述热点区域对象数据对应的热点区域内的上下客位置数据进行加权平均处理,确定所述出租车上下客热点区域中心。
3.如权利要求2所述的方法,其特征在于,所述对所述热点区域对象数 据对应的热点区域内的上下客位置数据进行加权平均处理,确定所述出租车上下客热点区域中心,具体包括:
(1)设定第一簇内包含k个数据点P1,P2,…,Pi,…,Pk,1≤i≤k;每个点的地理位置数据表示为Pi(xi,yi),则所述第一簇的热点区域中心为P(x,y),其中
(2)重复步骤(1),直到确定出所述出租车上下客热点区域中心。
4.如权利要求1所述的方法,其特征在于,所述对所述上下客位置数据进行首次DBSCAN聚类,提取出核心对象数据,具体包括:
(1)设置扫描半径和最小包含点数,逐个读取所述上下客位置数据,检测每个尚未检查过的出租车的上下客位置数据对象p,如果p为被归为某个簇或者标记为噪声,则检查其邻域,若包含的对象数不小于最小包含点数,建立新簇C,将其中的所有点加入候选集N;
(2)对候选集N中所有尚未被处理的对象q,检查其邻域,若至少包含最小包含点数个对象,则将这些对象加入N;如果q未归入任何一个簇,则将q加入C;
(3)重复步骤(2),继续检查N中未处理的对象,当前候选集N为空;
(4)重复步骤(1)~(3),直到所有对象都归入了某个簇或标记为噪声。
5.一种确定出租车上下客热点区域中心的装置,其特征在于,包括:
第一提取单元,用于获得出租车状态信息数据,并按出租车编号提取出地理位置数据,并按时间戳排序所述地理位置数据,获得出租车轨迹数据;
第二提取单元,用于从所述出租车轨迹数据中提取上下客位置数据,包括:对所述出租车轨迹数据进行关键字段数据筛选,提取出所述上下客位置数据,所述关键字段数据至少包括车辆经纬度、方向、速度、时间戳以及状态位,所述状态位的数值为空载0、满载1、驻车2或停车3;其中,对于每辆车的地理位置数据,若在3个连续的时刻t、t+1、t+2的状态位数据分别为0、1、1,并 且在t时刻的速度小于第一值,则t时刻对应的地理位置数据为上客点数据;若在3个连续时刻t-2、t-1、t的状态位数据分别为1、1、0且在t时刻的速度小于第二值,则t时刻对应的地理位置数据为下客点数据;其中,每辆出租车的每一处上客点数据或下客点数据为一个样本数据;
第三提取单元,用于对所述上下客位置数据进行首次基于密度的聚类算法DBSCAN聚类,提取出核心对象数据,所述核心对象的预设扫描半径内的样本数据个数大于等于第一预设阈值
第四提取单元,用于归并选定时间段内的所述核心对象数据,并对归并后的核心对象数据进行二次DBSCAN聚类,提取簇内核心对象数据;
确定单元,用于基于所述簇内核心对象数据,确定所述出租车上下客热点区域中心。
6.如权利要求5所述的装置,其特征在于,所述确定单元具体用于按第二预设阈值对所述簇内核心对象数据进行筛选,获得热点区域对象数据,并对所述热点区域对象数据对应的热点区域内的上下客位置数据进行加权平均处理,确定所述出租车上下客热点区域中心。
7.如权利要求6所述的装置,其特征在于,所述确定单元具体用于设定第一簇内包含k个数据点P1,P2,…,Pi,…,Pk,1≤i≤k;每个点的地理位置数据表示为Pi(xi,yi),则所述第一簇的热点区域中心为P(x,y),其中并重复前述步骤,直到确定出所述出租车上下客热点区域中心。
8.如权利要求5所述的装置,其特征在于,所述第三提取单元具体用于:(1)设置扫描半径和最小包含点数,逐个读取所述上下客位置数据,检测每个尚未检查过的出租车的上下客位置数据对象p,如果p为被归为某个簇或者标记为噪声,则检查其邻域,若包含的对象数不小于最小包含点数,建立新簇C,将其中的所有点加入候选集N;(2)对候选集N中所有尚未被处理的对象q,检查其邻域,若至少包含最小包含点数个对象,则将这些对象加入N;如 果q未归入任何一个簇,则将q加入C;(3)重复步骤(2),继续检查N中未处理的对象,当前候选集N为空;(4)重复步骤(1)~(3),直到所有对象都归入了某个簇或标记为噪声。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410370602.6A CN104167092B (zh) | 2014-07-30 | 2014-07-30 | 一种确定出租车上下客热点区域中心的方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410370602.6A CN104167092B (zh) | 2014-07-30 | 2014-07-30 | 一种确定出租车上下客热点区域中心的方法以及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104167092A CN104167092A (zh) | 2014-11-26 |
CN104167092B true CN104167092B (zh) | 2016-09-21 |
Family
ID=51910878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410370602.6A Expired - Fee Related CN104167092B (zh) | 2014-07-30 | 2014-07-30 | 一种确定出租车上下客热点区域中心的方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104167092B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108765948A (zh) * | 2018-06-05 | 2018-11-06 | 厦门大学 | 一种弹性的公车调度方法和系统 |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104731894B (zh) * | 2015-03-18 | 2018-10-16 | 百度在线网络技术(北京)有限公司 | 热力图的展现方法及装置 |
CN105049286A (zh) * | 2015-07-21 | 2015-11-11 | 国家计算机网络与信息安全管理中心 | 基于层次聚类的云平台测速数据判定方法 |
CN105489000A (zh) * | 2015-09-08 | 2016-04-13 | 同济大学 | 一种夜班公交车站点及路径选择方法 |
CN105243128B (zh) * | 2015-09-29 | 2018-06-08 | 西华大学 | 一种基于签到数据的用户行为轨迹聚类方法 |
CN105206057B (zh) * | 2015-09-30 | 2018-09-07 | 哈尔滨工业大学深圳研究生院 | 基于浮动车居民出行热点区域的检测方法及系统 |
CN105206046B (zh) * | 2015-10-10 | 2017-07-18 | 东南大学 | 基于大数据的出租车服务站选址及可行性评价方法 |
CN105389975B (zh) * | 2015-12-11 | 2017-11-14 | 北京航空航天大学 | 专车调度方法和装置 |
CN105677804B (zh) * | 2015-12-31 | 2020-08-07 | 百度在线网络技术(北京)有限公司 | 权威站点的确定以及权威站点数据库的建立方法和装置 |
CN105488752A (zh) * | 2016-01-18 | 2016-04-13 | 中国科学技术大学 | 基于大规模实时轨迹分析的出租车拒载行为检测方法 |
CN105809967A (zh) * | 2016-05-25 | 2016-07-27 | 浙江宇视科技有限公司 | 一种车流量展示方法及装置 |
CN106372784A (zh) * | 2016-08-29 | 2017-02-01 | 陈牧锋 | 区域急救色谱云图成像方法及系统 |
CN106169240A (zh) * | 2016-08-31 | 2016-11-30 | 广州地理研究所 | 一种车辆调度系统及调度方法和装置 |
CN106373387A (zh) * | 2016-10-25 | 2017-02-01 | 先锋智道(北京)科技有限公司 | 一种车辆调度方法、装置及系统 |
CN106846795A (zh) * | 2017-01-04 | 2017-06-13 | 百度在线网络技术(北京)有限公司 | 人群密集区域的获取方法及装置 |
CN106843219B (zh) * | 2017-02-20 | 2020-07-10 | 北京百度网讯科技有限公司 | 无人驾驶车辆选择接泊点的方法、装置、设备及存储介质 |
CN107191076A (zh) * | 2017-06-23 | 2017-09-22 | 深圳市盛路物联通讯技术有限公司 | 一种智能确定乘客安全下车的方法及装置 |
CN107392389A (zh) * | 2017-08-03 | 2017-11-24 | 重庆大学 | 基于arima模型的出租车调度处理方法 |
CN107481511A (zh) * | 2017-08-16 | 2017-12-15 | 深圳先进技术研究院 | 一种计算候选公交站点的方法及系统 |
CN108010306B (zh) * | 2017-08-16 | 2019-06-04 | 北京嘀嘀无限科技发展有限公司 | 运力调度方法、运力调度系统及服务器 |
CN108182446A (zh) * | 2017-12-13 | 2018-06-19 | 北京中交兴路信息科技有限公司 | 一种基于聚类算法的司机常驻地预测方法及装置 |
CN108415975B (zh) * | 2018-02-08 | 2021-07-27 | 淮阴工学院 | 基于bdch-dbscan的出租车载客热点识别方法 |
CN108427965B (zh) * | 2018-03-05 | 2022-08-23 | 重庆邮电大学 | 一种基于路网聚类的热点区域挖掘方法 |
CN110309241B (zh) * | 2018-03-15 | 2021-11-23 | 北京嘀嘀无限科技发展有限公司 | 挖掘方法、装置、服务器、计算机设备和可读存储介质 |
CN108417023A (zh) * | 2018-05-02 | 2018-08-17 | 长安大学 | 基于出租车上下客点空间聚类的交通小区中心点选取方法 |
CN110633337B (zh) * | 2018-06-05 | 2021-07-09 | 北京三快在线科技有限公司 | 一种特征区域确定方法及装置,电子设备 |
CN110689362B (zh) * | 2018-07-04 | 2022-04-12 | 北京嘀嘀无限科技发展有限公司 | 一种地区聚类的方法及系统 |
CN109541654A (zh) * | 2018-11-19 | 2019-03-29 | 北京金州世纪信息技术有限公司 | 一种车辆停靠点的计算方法及装置 |
CN109598305A (zh) * | 2018-12-05 | 2019-04-09 | 杭州东方通信软件技术有限公司 | 基于ai实现区域内小区流量热力图的方法和装置 |
CN109711451A (zh) * | 2018-12-20 | 2019-05-03 | 成都四方伟业软件股份有限公司 | 一种数据处理方法、装置、电子设备及存储介质 |
CN110852354A (zh) * | 2019-10-22 | 2020-02-28 | 上海中旖能源科技有限公司 | 车辆轨迹点识别方法及设备 |
CN110990661B (zh) * | 2019-10-23 | 2023-06-30 | 南通大学 | 一种基于路网约束和密度聚类的兴趣区域出入口提取方法 |
CN110849379B (zh) * | 2019-10-23 | 2023-04-25 | 南通大学 | 一种用于导航地图的出入口通行状态符号表达方法 |
CN110866559A (zh) * | 2019-11-14 | 2020-03-06 | 上海中信信息发展股份有限公司 | 一种家禽的行为分析方法及装置 |
CN112991804B (zh) * | 2019-12-18 | 2022-06-07 | 浙江大华技术股份有限公司 | 停留区域确定方法以及相关装置 |
CN111008675B (zh) * | 2019-12-26 | 2020-11-24 | 口碑(上海)信息技术有限公司 | 召回区域的抽样处理方法及装置 |
CN111710157B (zh) * | 2020-05-25 | 2021-06-08 | 安徽师范大学 | 一种出租车热点区域的提取方法 |
CN111881243B (zh) * | 2020-07-30 | 2024-04-02 | 河北工程大学 | 一种出租车轨迹热点区域分析方法及系统 |
CN112131382B (zh) * | 2020-08-20 | 2024-05-10 | 彭涛 | 民生问题高发地的识别方法、装置及电子设备 |
CN112232148B (zh) * | 2020-09-28 | 2024-07-16 | 浙江大华技术股份有限公司 | 图像聚类、目标轨迹追踪方法、电子设备及存储介质 |
CN113283660B (zh) * | 2021-06-04 | 2022-07-05 | 北京市智慧交通发展中心(北京市机动车调控管理事务中心) | 互联网租赁自行车区域运行关联特征识别方法及系统 |
CN117787669B (zh) * | 2024-02-26 | 2024-06-18 | 北京阿帕科蓝科技有限公司 | 车辆管理方法、装置、计算机设备和存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011128921A1 (en) * | 2010-04-15 | 2011-10-20 | Neptuny S.R.L. | Automated service time estimation method for it system resources |
US8498991B2 (en) * | 2010-10-06 | 2013-07-30 | GM Global Technology Operations LLC | Neighborhood guide for semantic search system and method to support local POI discovery |
CN103578265B (zh) * | 2012-07-18 | 2015-07-08 | 北京掌城科技有限公司 | 基于出租车gps数据的打车热点获取方法 |
CN103632532B (zh) * | 2012-08-22 | 2015-09-30 | 北京掌城科技有限公司 | 一种出租车的打车诱导方法 |
CN102867411B (zh) * | 2012-09-21 | 2014-07-09 | 博康智能网络科技股份有限公司 | 一种基于视频监控系统的出租车调度方法及调度系统 |
CN103295394B (zh) * | 2013-06-24 | 2015-01-14 | 东南大学 | 基于广义gps数据的出租车候客站点备选地址确定方法 |
-
2014
- 2014-07-30 CN CN201410370602.6A patent/CN104167092B/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108765948A (zh) * | 2018-06-05 | 2018-11-06 | 厦门大学 | 一种弹性的公车调度方法和系统 |
CN108765948B (zh) * | 2018-06-05 | 2020-07-28 | 厦门大学 | 一种弹性的公车调度方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104167092A (zh) | 2014-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104167092B (zh) | 一种确定出租车上下客热点区域中心的方法以及装置 | |
CN106683404B (zh) | 一种通过手机定位技术获取公交客流od的方法 | |
CN107506864B (zh) | 一种客运巴士路线规划方法和装置 | |
CN103985247B (zh) | 基于城市叫车需求分布密度的出租车运力调度系统 | |
CN105809292B (zh) | 公交ic卡乘客下车站点推算方法 | |
Veloso et al. | Sensing urban mobility with taxi flow | |
CN108537391B (zh) | 一种基于出租车轨迹数据的出租车停靠站设置优化方法 | |
CN108053240B (zh) | 生成车载广告投放公交线路方案的方法及装置 | |
CN107403550B (zh) | 公交路网数据采集方法、装置和终端设备 | |
CN110288205B (zh) | 交通影响评价方法及装置 | |
CN104916133B (zh) | 一种基于交通轨迹数据的道路海拔信息提取方法及系统 | |
US10489431B2 (en) | Digital location-based data methods and product | |
CN105139638A (zh) | 一种出租车载客点选取的方法及系统 | |
CN108573604A (zh) | 基于移动终端定位的公交od数据获取方法及存储介质 | |
CN109886508A (zh) | 基于gps大数据的出租车高效益寻客多目标规划算法 | |
CN110223514B (zh) | 城市交通运行状态分析方法、装置及电子设备 | |
CN108538054A (zh) | 一种基于手机信令数据获取交通路况信息的方法及系统 | |
Ge et al. | Urban taxi ridership analysis in the emerging metropolis: Case study in Shanghai | |
CN111356074B (zh) | 公交站点定位方法及装置、服务器、介质 | |
CN108108997B (zh) | 车载广告投放公交线路选取方法及装置 | |
CN117114210B (zh) | 无障碍公共设施布局优化方法、装置、设备及存储介质 | |
CN107622467B (zh) | 一种通勤出行模式提取方法及装置 | |
Tian et al. | Identifying residential and workplace locations from transit smart card data | |
CN115129769A (zh) | 一种居民出行调查扩样方法、装置及存储介质 | |
CN112566025B (zh) | 公交客流来源去向识别方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160921 |
|
CF01 | Termination of patent right due to non-payment of annual fee |