CN103020284A - 一种基于时空聚类的出租车载客点推荐方法 - Google Patents
一种基于时空聚类的出租车载客点推荐方法 Download PDFInfo
- Publication number
- CN103020284A CN103020284A CN2012105807164A CN201210580716A CN103020284A CN 103020284 A CN103020284 A CN 103020284A CN 2012105807164 A CN2012105807164 A CN 2012105807164A CN 201210580716 A CN201210580716 A CN 201210580716A CN 103020284 A CN103020284 A CN 103020284A
- Authority
- CN
- China
- Prior art keywords
- point
- carrying
- taxi
- time
- pbuffer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Position Fixing By Use Of Radio Waves (AREA)
- Navigation (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于时空聚类的出租车载客点推荐方法,1.本发明引入了时空聚类分析的方法,获取了不同时段里有较大可能发生载客事件的地点;2.本发明为出租车司机提供了在短时间能到达的载客地点,计算复杂度较低,并具有很好的实时性。
Description
所属技术领域
本发明涉及GPS(全球定位系统)、GIS(地理信息系统)和计算机软件新技术,具体为一种全新的基于时空聚类的出租车载客点推荐方法。
背景技术
目前大多数出租车司机在未载到客人时,行驶目的都是不明确的。在这种情况下,司机通常是在街上巡游或在某个特定的地点等。然而,在车辆巡游找乘客的过程中,有效里程(有车费的里程)与巡游里程(没有车费的里程)的比例不高,并且司机损失了燃料费用,很明显巡游里程越长司机的利润越低;不仅如此,没载乘客的出租车还会为城市的交通增加负担、增大资源浪费和加重城市污染。如果在某个特定地点等乘客,这要使得司机清楚在哪些地方能较容易的等到乘客。现实生活中,不同的时间段里,乘客相对集中的地点并不相同,比如在早上,住宅区和商业区对出租车的需求量很大,而晚上的时候,娱乐休闲场所周围就有很多需要打车的乘客。如果司机要清楚的知道在哪个时间段里哪里的会有较多的乘客,无疑需要较长的时间来熟悉这些区域人群的流动情况,而且还要能够从中分析出什么时间该去哪里接乘客。这要求出租车司机不仅有经验还要有头脑。基于如此,针对出租车司机的推荐系统先后出现很多,但缺乏分区域、分时段的推荐方式,而且推荐地点精度不够高。
GPS是英文Global Positioning System(全球定位系统)的简称。用户设备部分即GPS接收机可以进行定位计算,计算出用户所在地理位置的经纬度、高度、速度、时间等信息。目前GPS接收机种类越来越多,用途也越来越广。出租车车载GPS设备的使用可记录车辆的轨迹,以每3或5秒的频率保存轨迹点的经纬度、高度、载客状况和时间数据并可导出指定格式的文件保存,这些完备的时空数据可用来做出租车行驶轨迹的分析和挖掘更深层次信息。出租车车载GPS设备的普及程度为从车辆轨迹中提取相应的知识提供了重要的基础条件。
GIS是英文Geographic Information System(地理信息系统)的简称,具有空间数据的获取、存储、显示、编辑、处理、分析、输出和应用等功能,是一个基于数据库管理系统(DBMS)的分析和管理空间对象的信息系统。该技术是读取GPS数据并对其做分析处理显示的关键技术,易于高效直观地生成车辆轨迹地图用以区域聚类分析。
时空聚类分析,是地理数据挖掘和知识发现中的前沿的研究热点问题之一,其主要目的就是根据时空数据的本质特征和智能算法,发现隐藏在时空数据集中的游泳的聚类模式,对于分析地理实体的演变规律具有重要意义。通过聚类能够识别对象空间中稠密和稀疏的区域,将数据中的相似性与异常特征提取出来,从而发现全局分布模式和数据属性之间有意义的相关。
该系统涉及两项硬件设备:车载GPS轨迹记录仪和计算机硬件。计算机硬件的配置包括,处理器:Pentium III-600兆赫兹(MHz)兼容或更快的处理器,内存:512兆(MB)内存或更多,硬盘容量:大约需要1GB可用硬盘空间,显示器:支持1,024x768分辨率或者更高性能的视频显示卡和监视器。
软件环境包括两部分:(1)开发环境有Microsoft Visual Studio 2008、ESRIArcGIS Engine9.3.1Runtime and Developer Kit for Windows和ESRI ArcGISDesktop SDK for the Microsoft.NET Framework。(2)运行环境,操作系统:Windows 2000/Windows XP简体中文操作系统及以上;支持软件:Microsoft.NET Framework 3.5。
发明内容
本发明的目的是抚今提供一种向出租车司机推荐载客地点的方法,这种方法是利用历史载客点进行时空聚类分析,其聚类过程分为三步:1.先进行空间层次聚类,再将聚类的结果划分到不同时段中;2.先把出租车的历史载客点划分到各个时段中,再对每个时段的数据进行空间层次聚类;3.将前两步的结果进行“求交集”。这种方法可以有效的提高推荐载客点的精度。
基于时空聚类的出租车载客点推荐方法实现主要分为如下4个步骤:
1)从出租车车载GPS中读取选定时间段的出租车车载GPS数据,其格式是“.plt”,文件包含的坐标点的经度、纬度、出租车载客状态、高程和时间的数据信息;
2)对数据进行预处理,删除所针对选定区域以外的GPS点,依据出租车载客状态的变化,查找载客或卸客的地点;
识别轨迹文件中发生载客事件的地点代码为:
3)用时空聚类的方法获取出租车在各个时段中选定区域经常发生载客事件的地点,作为候选载客点;
基于K均值的层次聚类代码为:
合并聚类结果的代码为:
4)利用ArcGIS提供的ITopologicalOperator接口查找车辆周围选定区域范围内的候选载客点,并对它们根据一定规则进行排序,取序列的top-5作为推荐载客点向司机推荐。
在车辆周围建立缓冲区:
pBuffer.in_features=infile;
pBuffer.out_feature_class=outfilename;
pBuffer.buffer_distance_or_field=radius+″″+″Meters″;
pBuffer.dissolve_option=″All″;
IGPProcess GProcess=pBuffer;
gp.Execute(GProcess,null);
axMapControl1.AddShapeFile(bufferoutpath,buffername);//加载缓冲区文件
确定缓冲区内的候选载客点:
pClip.in_features=inputfeature;
pClip.clip_features=clipfeature;
pClip.out_feature_class=clipoutpath+outpath_file;
gpsr.Execute(pClip,null);
axMapControl1.AddShapeFile(clipoutpath,outpath_file);
对候选载客点进行排序:
本发明有如下优点和积极效果:
1.本发明引入了时空聚类分析的方法,获取了不同时段里有较大可能发生载客事件的地点;
2.本发明为出租车司机提供了在短时间能到达的载客地点,计算复杂度较低,并具有很好的实时性。
附图说明
图1是本发明基于时空聚类的出租车载客点推荐新方法实现步骤流程图。
图2是本发明实时推荐的过程图。
具体实施方式
车载GPS记录仪所记录的坐标和时间信息,为利用时空聚类的方法进一步挖掘相关知识提供了数据基础。为提高处理速度,前期的处理是有C ++写的,后期的推荐点是用C#基于ArcGIS Engine 10.0的二次开发得到。
基于时空聚类的出租车载客点推荐方法实现主要分为如下4个步骤:
1)读取一段时期如早晨7-9时,晚上6-8时等出租车车载GPS数据,其格式是“.plt”,文件包含的坐标点的经度、纬度、出租车载客状态、高程和时间的数据信息;
2)对数据进行预处理,删除所针对城区以外的GPS点,依据出租车载客状态的变化,查找载客或卸客的地点;
3)用时空聚类的方法获取出租车在各个时段中城区以内经常发生载客事件的地点,作为候选载客点;
基于K均值的层次聚类代码为:
合并聚类结果的代码为:
4)利用ArcGIS提供的ITopologicalOperator接口查找车辆周围区域范围内的候选载客点,并对它们根据规则进行排序,取序列的top-5作为推荐载客点向司机推荐。
在车辆周围建立缓冲区:
pBuffer.in_features=infile;
pBuffer.out_feature_class=outfilename;
pBuffer.buffer_distance_or_field=radius+″″+″Meters″;
pBuffer.dissolve_option=″All″;
IGPProcess GProcess=pBuffer;
gp.Execute(GProcess,null);
axMapControl1.AddShapeFile(bufferoutpath,buffername);//加载缓冲区文件
确定缓冲区内的候选载客点:
pClip.in_features=inputfeature;
pClip.clip_features=clipfeature;
pClip.out_feature_class=clipoutpath+outpath_file;
gpsr.Execute(pClip,null);
axMapControl1.AddShapeFile(clipoutpath,outpath_file);
对候选载客点进行排序:
方法的执行情况,用算法的消耗时间进行评定。对于推荐点的正确性,是根据信息检索中的查全率和查准率两项指标对推荐点进行测评,指标说明和测评结果如下:
1.算法设计
因为不同时段里不同区域的载客点集中程度不同,为得到不同时段里的推荐点,时空聚类的过程分为三步:先对载客点进行空间层次聚类再划分到不同时段中,先将载客点划分到不同时段再对每个时段的载客点进行空间层次聚类和合并前两步的结果作为推荐点。
空间层次聚类,先利用K均值聚类的方法对所有的载客点进行聚类,以得到代表较大区域的聚类簇;再根据每个簇内部元素的个数,利用K均值聚类的思想对每个簇包含的载客点进行聚类,以得到代表较小区域的聚类簇。时间切片,是为了得到不同时段里具有区域代表行的聚类簇。
2.时间消耗
该方法的第三步是主要处理步骤,其中的前两小步(先对载客点进行空间层次聚类再划分到不同时段中和先将载客点划分到不同时段再对每个时段的载客点进行空间层次聚类)的平均时间消耗为12.73秒,第三小步(合并前两小步相同时段里的结果)的时间消耗为1.17秒。由于现有GPS数据并不是均匀的分布在城区,在测试实时推荐过程处理的
3.查准率
查准率(Precision),即精度。它是衡量某一检索系统的信号噪声比的一种指标,即检出来的相关文献与检出的全部文献的百分比。在本方法的评定中,查准率被定义为标记点一定范围内推荐点的个数与总推荐点个数的比,即查准率=(标记点周围内推荐点的个数/总推荐点个数)×100%,标记点是历史载客点与兴趣点的总和,兴趣点是已知的,它是有大量商场、地铁口和公园入口等坐标点组成。
4.查全率
查全率(Recall),即召回率。它是衡量某一检索系统从文献集合中检出相关文献成功度的一项标准,即检出的相关文献与全部相关文献的百分比。在本方法的评定中,查全率被定义为在推荐点范围内的标记点的个数与总标记点个数的比,即查全率=(推荐点周围的标记点个数/总标记点个数)×100%,标记点的概念同上。
5.结果
根据自定义查准率和查全率的概念,范围定位20米为半径的圆。利用ArcMap软件来计算查准率和查全率,结果分别为85.0%和82.1%。
Claims (3)
1.一种基于时空聚类的出租车载客点推荐方法,其特征在于:
1)从出租车车载GPS中读取选定时间段的出租车车载GPS数据,其格式是“.plt”,文件包含的坐标点的经度、纬度、出租车载客状态、高程和时间的数据信息;
2)对数据进行预处理,删除所选定区域以外的GPS点,依据出租车载客状态的变化,查找载客或卸客的地点;
3)用时空聚类的方法获取出租车在各个时段中选定区域经常发生载客事件的地点,作为候选载客点;
4)利用ArcGIS提供的ITopologicalOperator接口查找车辆周围区域范围内的候选载客点,并对它们根据规则进行排序,取序列的top-5作为推荐载客点向司机推荐。
3.根据权利要求1所述的一种基于时空聚类的出租车载客点推荐方法,其特征在于:获取车辆周围推荐载客点算法的代码为:
在车辆周围建立缓冲区:
pBuffer.in_features=infile;
pBuffer.out_feature_class=outfilename;
pBuffer.buffer_distance_or_field=radius+″″+″Meters″;
pBuffer.dissolve_option=″All″;
IGPProcess GProcess=pBuffer;
gp.Execute(GProcess,null);
axMapControl 1.AddShapeFile(bufferoutpath,buffername);//加载缓冲区文件确定缓冲区内的候选载客点:
pClip.in_features=inputfeature;
pClip.clip_features=clipfeature;
pClip.out_feature_class=clipoutpath+outpath_file;gpsr.Execute(pClip,null);
axMapControl 1.AddShapeFile(clipoutpath,outpath_file);
对候选载客点进行排序:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012105807164A CN103020284A (zh) | 2012-12-28 | 2012-12-28 | 一种基于时空聚类的出租车载客点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012105807164A CN103020284A (zh) | 2012-12-28 | 2012-12-28 | 一种基于时空聚类的出租车载客点推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103020284A true CN103020284A (zh) | 2013-04-03 |
Family
ID=47968887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012105807164A Pending CN103020284A (zh) | 2012-12-28 | 2012-12-28 | 一种基于时空聚类的出租车载客点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103020284A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103699601A (zh) * | 2013-12-12 | 2014-04-02 | 深圳先进技术研究院 | 基于时空数据挖掘的地铁乘客分类方法 |
CN103699801A (zh) * | 2013-12-31 | 2014-04-02 | 深圳先进技术研究院 | 一种时空规律的地铁乘客聚类和边缘检测方法 |
CN103955505A (zh) * | 2014-04-24 | 2014-07-30 | 中国科学院信息工程研究所 | 一种基于微博的事件实时监测方法及系统 |
CN104794553A (zh) * | 2014-08-12 | 2015-07-22 | 北京东方车云信息技术有限公司 | 网络租车中基于出租车运营区域熟悉程度的派单系统和方法 |
CN104952248A (zh) * | 2015-06-08 | 2015-09-30 | 浙江大学 | 一种基于欧氏空间的车辆汇聚预测方法 |
CN105045858A (zh) * | 2015-07-10 | 2015-11-11 | 湖南科技大学 | 基于投票的出租车载客点推荐方法 |
CN106227884A (zh) * | 2016-08-08 | 2016-12-14 | 深圳市未来媒体技术研究院 | 一种基于协同过滤的在线打车推荐方法 |
CN106600960A (zh) * | 2016-12-22 | 2017-04-26 | 西南交通大学 | 基于时空聚类分析算法的交通出行起讫点识别方法 |
CN107844851A (zh) * | 2017-09-30 | 2018-03-27 | 平安科技(深圳)有限公司 | 查勘网格优化方法、电子设备及计算机可读存储介质 |
CN107862030A (zh) * | 2017-11-01 | 2018-03-30 | 平安科技(深圳)有限公司 | 出险待命位置确定方法、装置、计算机设备和存储介质 |
CN109410362A (zh) * | 2017-08-18 | 2019-03-01 | 信享设备租赁(上海)有限公司 | 混合动力汽车租赁管理系统 |
CN109413126A (zh) * | 2017-08-18 | 2019-03-01 | 信享设备租赁(上海)有限公司 | 新能源汽车租赁管理系统 |
WO2019154393A1 (en) * | 2018-02-11 | 2019-08-15 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for organizing participants of service platform |
CN110309241A (zh) * | 2018-03-15 | 2019-10-08 | 北京嘀嘀无限科技发展有限公司 | 挖掘方法、装置、服务器、计算机设备和可读存储介质 |
CN110852354A (zh) * | 2019-10-22 | 2020-02-28 | 上海中旖能源科技有限公司 | 车辆轨迹点识别方法及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101620781A (zh) * | 2008-06-30 | 2010-01-06 | 株式会社查纳位资讯情报 | 预测乘客信息的系统和搜索乘客信息的系统及其方法 |
US20120232943A1 (en) * | 2011-03-09 | 2012-09-13 | Makor Issues And Rights Ltd. | Automatic optimal taxicab mobile location based dispatching system |
-
2012
- 2012-12-28 CN CN2012105807164A patent/CN103020284A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101620781A (zh) * | 2008-06-30 | 2010-01-06 | 株式会社查纳位资讯情报 | 预测乘客信息的系统和搜索乘客信息的系统及其方法 |
US20120232943A1 (en) * | 2011-03-09 | 2012-09-13 | Makor Issues And Rights Ltd. | Automatic optimal taxicab mobile location based dispatching system |
Non-Patent Citations (1)
Title |
---|
MINGYUE ZHANG等: "Recommending Pick-up Points for Taxi-drivers based on Spatio-temporal Clustering", 《CLOUD AND GREEN COMPUTING(CGC),2012 SECOND INTERNATIONAL CONFERENCE ON.IEEE》, 3 November 2012 (2012-11-03), pages 67 - 72, XP032329060, DOI: 10.1109/CGC.2012.34 * |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103699601A (zh) * | 2013-12-12 | 2014-04-02 | 深圳先进技术研究院 | 基于时空数据挖掘的地铁乘客分类方法 |
CN103699601B (zh) * | 2013-12-12 | 2017-02-08 | 深圳先进技术研究院 | 基于时空数据挖掘的地铁乘客分类方法 |
CN103699801A (zh) * | 2013-12-31 | 2014-04-02 | 深圳先进技术研究院 | 一种时空规律的地铁乘客聚类和边缘检测方法 |
CN103699801B (zh) * | 2013-12-31 | 2017-01-11 | 深圳先进技术研究院 | 一种时空规律的地铁乘客聚类和边缘检测方法 |
CN103955505A (zh) * | 2014-04-24 | 2014-07-30 | 中国科学院信息工程研究所 | 一种基于微博的事件实时监测方法及系统 |
CN104794553A (zh) * | 2014-08-12 | 2015-07-22 | 北京东方车云信息技术有限公司 | 网络租车中基于出租车运营区域熟悉程度的派单系统和方法 |
CN104794553B (zh) * | 2014-08-12 | 2018-07-10 | 北京东方车云信息技术有限公司 | 网络租车中基于出租车运营区域熟悉程度的派单系统和方法 |
CN104952248B (zh) * | 2015-06-08 | 2017-09-12 | 浙江大学 | 一种基于欧氏空间的车辆汇聚预测方法 |
CN104952248A (zh) * | 2015-06-08 | 2015-09-30 | 浙江大学 | 一种基于欧氏空间的车辆汇聚预测方法 |
CN105045858B (zh) * | 2015-07-10 | 2018-04-13 | 湖南科技大学 | 基于投票的出租车载客点推荐方法 |
CN105045858A (zh) * | 2015-07-10 | 2015-11-11 | 湖南科技大学 | 基于投票的出租车载客点推荐方法 |
CN106227884B (zh) * | 2016-08-08 | 2019-12-03 | 深圳市未来媒体技术研究院 | 一种基于协同过滤的在线打车推荐方法 |
CN106227884A (zh) * | 2016-08-08 | 2016-12-14 | 深圳市未来媒体技术研究院 | 一种基于协同过滤的在线打车推荐方法 |
CN106600960B (zh) * | 2016-12-22 | 2020-01-24 | 西南交通大学 | 基于时空聚类分析算法的交通出行起讫点识别方法 |
CN106600960A (zh) * | 2016-12-22 | 2017-04-26 | 西南交通大学 | 基于时空聚类分析算法的交通出行起讫点识别方法 |
CN109410362A (zh) * | 2017-08-18 | 2019-03-01 | 信享设备租赁(上海)有限公司 | 混合动力汽车租赁管理系统 |
CN109413126A (zh) * | 2017-08-18 | 2019-03-01 | 信享设备租赁(上海)有限公司 | 新能源汽车租赁管理系统 |
CN107844851A (zh) * | 2017-09-30 | 2018-03-27 | 平安科技(深圳)有限公司 | 查勘网格优化方法、电子设备及计算机可读存储介质 |
CN107844851B (zh) * | 2017-09-30 | 2021-09-03 | 平安科技(深圳)有限公司 | 查勘网格优化方法、电子设备及计算机可读存储介质 |
CN107862030A (zh) * | 2017-11-01 | 2018-03-30 | 平安科技(深圳)有限公司 | 出险待命位置确定方法、装置、计算机设备和存储介质 |
WO2019154393A1 (en) * | 2018-02-11 | 2019-08-15 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for organizing participants of service platform |
CN110309241A (zh) * | 2018-03-15 | 2019-10-08 | 北京嘀嘀无限科技发展有限公司 | 挖掘方法、装置、服务器、计算机设备和可读存储介质 |
CN110309241B (zh) * | 2018-03-15 | 2021-11-23 | 北京嘀嘀无限科技发展有限公司 | 挖掘方法、装置、服务器、计算机设备和可读存储介质 |
CN110852354A (zh) * | 2019-10-22 | 2020-02-28 | 上海中旖能源科技有限公司 | 车辆轨迹点识别方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103020284A (zh) | 一种基于时空聚类的出租车载客点推荐方法 | |
Long et al. | Combining smart card data and household travel survey to analyze jobs–housing relationships in Beijing | |
Liu et al. | Understanding intra-urban trip patterns from taxi trajectory data | |
Zheng et al. | Mining interesting locations and travel sequences from GPS trajectories | |
CN106462627B (zh) | 根据多个位置数据报告分析语义地点和相关数据 | |
Hong et al. | Hierarchical community detection and functional area identification with OSM roads and complex graph theory | |
US9355063B2 (en) | Parking lot detection using probe data | |
Wang et al. | Extracting trips from multi-sourced data for mobility pattern analysis: An app-based data example | |
US9082014B2 (en) | Methods and apparatus to estimate demography based on aerial images | |
Cai et al. | Design and application of an attractiveness index for urban hotspots based on GPS trajectory data | |
Liu et al. | Identifying and understanding road-constrained areas of interest (AOIs) through spatiotemporal taxi GPS data: A case study in New York City | |
Cesario et al. | An approach for the discovery and validation of urban mobility patterns | |
Jia et al. | Trips and their CO2 emissions to and from a shopping center | |
Li et al. | A two-phase clustering approach for urban hotspot detection with spatiotemporal and network constraints | |
Dong et al. | Analysis of urban environmental problems based on big data from the urban municipal supervision and management information system | |
Jiao et al. | Evaluating spatial accessibility to healthcare services from the lens of emergency hospital visits based on floating car data | |
Liang et al. | Assessing the validity of SafeGraph data for visitor monitoring in Yellowstone National Park | |
Chen et al. | Uvlens: urban village boundary identification and population estimation leveraging open government data | |
Yamagata et al. | Evaluating walkability using mobile GPS data | |
Zhao et al. | Inferring nonwork travel semantics and revealing the nonlinear relationships with the community built environment | |
Yao et al. | Trip end identification based on spatial-temporal clustering algorithm using smartphone positioning data | |
Soe et al. | Haversine formula and RPA algorithm for navigation system | |
Cui et al. | Research on the driving forces of urban hot spots based on exploratory analysis and binary logistic regression model | |
Tian et al. | Spatial analysis of commuting carbon emissions in main urban area of Beijing: A GPS trajectory-based approach | |
Shi | Spatial Data Mining and Big Data Analysis of Tourist Travel Behavior. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130403 |