CN104615858A - 一种计算车辆起始地和目的地的方法 - Google Patents

一种计算车辆起始地和目的地的方法 Download PDF

Info

Publication number
CN104615858A
CN104615858A CN201510013434.XA CN201510013434A CN104615858A CN 104615858 A CN104615858 A CN 104615858A CN 201510013434 A CN201510013434 A CN 201510013434A CN 104615858 A CN104615858 A CN 104615858A
Authority
CN
China
Prior art keywords
anchor point
time
data
destination
vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510013434.XA
Other languages
English (en)
Other versions
CN104615858B (zh
Inventor
李鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING SINOIOV VEHICLE NETWORK TECHNOLOGY Co Ltd
Original Assignee
BEIJING SINOIOV VEHICLE NETWORK TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING SINOIOV VEHICLE NETWORK TECHNOLOGY Co Ltd filed Critical BEIJING SINOIOV VEHICLE NETWORK TECHNOLOGY Co Ltd
Priority to CN201510013434.XA priority Critical patent/CN104615858B/zh
Publication of CN104615858A publication Critical patent/CN104615858A/zh
Application granted granted Critical
Publication of CN104615858B publication Critical patent/CN104615858B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开一种计算车辆起始地和目的地的方法,其计算量小,有利于数据查询,计算结果较为准确。包括步骤:(1)将车辆行驶轨迹数据网格化;(2)计算每个车辆经过一个网格一次在该网格内的停留时间;过滤总停留时间小于指定时间的停靠点;对于每个车辆,按照在每个停靠点的总停靠时间从大到小排序,找出排序前50的停靠点;(3)获取每个车辆的排序前50的停靠点的原始数据;(4)对货车轨迹的停靠点聚类,对聚类之后的簇是否特殊进行特征标注,根据前50个停靠点是否在特殊簇进行特征标注;(5)进行停靠点特征提取;(6)通过货车停靠的数据与实际地图比较,标注出货车的起始地和目的地,形成标注集;(7)找出每个特征中的最大值。

Description

一种计算车辆起始地和目的地的方法
技术领域
本发明涉及大规模数据处理的技术领域,具体地涉及一种计算车辆起始地和目的地的方法。
背景技术
车辆在行驶的过程中,会通过车载终端间隔地向后台服务器传输行驶记录数据。如何更准确地从这些行驶记录数据中分析出哪些是车辆的起始地,哪些是车辆行驶的目的地,将能开发出更多基于此数据的新应用。
通常计算车辆起始地和目的地的方法是将所有车辆经过的每个城市分别划分为起始地和目的地进行计算。这样就将很多车辆途经的城市也划分为起始地或者目的地了。这种方法计算量大,不利于数据查询,计算结果模糊,且没有将普通停靠点从起始地和目的地中区分开来。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提供一种计算车辆起始地和目的地的方法,其计算量小,有利于数据查询,计算结果较为准确。
本发明的技术解决方案是:这种计算车辆起始地和目的地的方法,该方法包括以下步骤:
(1)将车辆行驶轨迹数据网格化;
(2)计算每个车辆经过一个网格一次在该网格内的停留时间;通过过滤操作过滤掉总停留时间小于指定时间的停靠点;对于每个车辆,按照在每个停靠点的总停靠时间从大到小排序,并找出停靠时间排序前50的停靠点;
(3)获取每个车辆的停靠时间排序前50的停靠点的原始数据;
(4)对货车轨迹的停靠点进行聚类,对聚类之后的簇是否特殊进行特征标注,根据前50个停靠点是否在特殊簇进行特征标注;
(5)进行停靠点特征提取;
(6)根据步骤(5)的特征,通过货车停靠的数据与实际地图进行比较,标注出货车的起始地和目的地,形成标注集;
(7)找出每个特征中的最大值。
本发明提取车辆每次停靠的多种特征,标注数据,利用机器学习的方法分析每一次停靠地是不是起始地或者目的地,使得计算量小,有利于数据查询,计算结果较为准确。
附图说明
图1为根据本发明的数据网格化的示意图。
图2为根据本发明的计算车辆起始地和目的地的方法的流程图。
具体实施方式
如图2所示,这种计算车辆起始地和目的地的方法,该方法包括以下步骤:
(1)将车辆行驶轨迹数据网格化;
(2)计算每个车辆经过一个网格一次在该网格内的停留时间;通过过滤操作过滤掉总停留时间小于指定时间的停靠点;对于每个车辆,按照在每个停靠点的总停靠时间从大到小排序,并找出排序前50的停靠点;
(3)获取每个车辆的排序前50的停靠点的原始数据;
(4)对货车轨迹的停靠点进行聚类,对聚类之后的簇是否特殊进行特征标注,根据前50个停靠点是否在特殊簇进行特征标注;
(5)进行停靠点特征提取;
(6)根据步骤(5)的特征,通过货车停靠的数据与实际地图进行比较,标注出货车的起始地和目的地,形成标注集;
(7)找出每个特征中的最大值。
本发明提取车辆每次停靠的多种特征,标注数据,利用机器学习的方法分析每一次停靠地是不是起始地或者目的地,使得计算量小,有利于数据查询,计算结果较为准确。
另外,所述步骤(7)中对每个特征做归一化处理,并且该方法还包括以下步骤:
(8)根据提取特征的停靠点数据,对其进行逻辑回归建模;
(9)对计算结果,运用交叉验证,计算模型的精度、召回率。
另外,所述步骤(1)包括以下分步骤:
(1.1)数据过滤,将时间大于2020年或者小于2010年的数据过滤掉;将经度为0或者纬度为0的数据过滤掉;将行驶里程为0的数据过滤掉;
(1.2)对于数据的经纬度做网格化处理,将数据的经纬度的最后两位数字改写为50,这样当两个数据的经纬度坐标除了最后两位之外都相同时,这两个数据的经纬度处于同一个网格中;
(1.3)对于每个车辆,按照车辆行驶轨迹数据的记录时间排序之后,计算当前时间跟上一条时间的间隔,并添加在该行驶轨迹数据末尾。
另外,所述步骤(2)中停留时间为当前网格的最后记录点时间减去前一网格的最先记录点时间,指定时间为10分钟。
另外,所述步骤(3)通过连接join操作获取每个车辆的排序前50的停靠点的原始数据。
另外,所述步骤(4)对前50的停靠点的原始数据和聚类后的停靠点做join操作,以便连接上前50的停靠点的原始数据中的时间和在每个停靠点的间隔,按照停靠时间对聚类后的停靠点做排序。
另外,所述步骤(5)中对于每个停靠点,计算上一个停靠点到该停靠点的行驶时间、该停靠点到下一个停靠点的行驶时间、上一个停靠点到该停靠点的行驶里程、该停靠点到下一个停靠点的行驶里程、在该停靠点的白天停靠时间、晚上停靠时间、该停靠点的平均停靠时间、平均白天停靠时间、平均晚上停靠时间;并按照时间的先后顺序对停靠点数据做排序。
下面给出具体的例子说明,其中车辆为货车。
其计算过程为:
1、原始数据为货车一个月的行驶轨迹数据。数据过滤,将时间大于2020年,或者小于2010年的记录过滤掉;将经度为0或者纬度为0的记录过滤掉;将行驶里程为0的记录过滤掉。对于经纬度做网格化处理,如图1所示,其处理过程为将经纬度的最后两位数字改写为“50”,这样只要两个经纬度坐标除了最后两位的前几位相同,那么认为这两个经纬度相同,也可以认为这些经纬度处于同一个网格中,在图1中,可以认为B、C、D处于网格2中,E、F、G处于网格3中。之后对于每辆货车,按照货车的记录时间排序之后,计算当前时间跟上一条时间记录的间隔(duration),并添加在该记录末尾输出。
2、计算每辆货车经过一个网格一次在该网格内的停留时间(duration),在图1中,网格2的停留时间为从记录A到记录D的时间,即D的时间戳减去A的时间戳。通过reduce操作计算每辆车在每个停靠点一个月内的总停留时间。通过filter操作过滤掉总停留时间小于10分钟的停留点。对于每辆车,按照在每个停靠点的总停靠时间排序(按照从大到小的顺序),并找出top 50(排序前50)的停靠点。
3、在计算top 50的时候过滤掉一部分数据,只留下top 50的停靠点数据,所以需要通过join操作找出每辆车的top 50停靠点的原始数据。
4、按照步骤(2)中的停靠网格对货车的轨迹进行聚类,对聚类完的簇进行特殊簇分析,即,遍历簇中所有停靠网格的停靠时间,如果停靠时间大于一天,则认为该簇为特殊簇。再对前50个停靠网格进行分析,如果前50网格中那一个落在特殊簇中即将该簇标注为特殊停靠网格。即,标注其为特殊停靠网格。
5、该步骤为停靠点特征提取。对于每个停靠点,计算上一个停靠点到该停靠点的行驶时间、该停靠点到下一个停靠点的行驶时间、上一个停靠点到该停靠点的行驶里程、该停靠点到下一个停靠点的行驶里程、在该停靠点的白天停靠时间、晚上停靠时间、该停靠点的平均停靠时间、平均白天停靠时间、平均晚上停靠时间。并按照时间的先后顺序对停靠点数据做排序。
6、根据数据特征,对已有数据标注。该步骤为人工找到确切停靠与非停靠的点,对小部分(通常为1%)数据进行标注。形成标注集。
7、找出每个特征中的最大值,并利用每个特征除以最大值做每个特征的归一化处理。
8、根据提取特征的停靠点数据,对其进行逻辑回归建模。或者决策树建模。
9、对计算结果,运用交叉验证,计算模型的精度、召回率。通过验证,利用专利中提取的特征并利用逻辑回归模型或者决策树模型,计算的精度均高于80%。
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。

Claims (7)

1.一种计算车辆起始地和目的地的方法,其特征在于:该方法包括以下步骤:
(1)将车辆行驶轨迹数据网格化;
(2)计算每个车辆经过一个网格一次在该网格内的停留时间;通过过滤操作过滤掉总停留时间小于指定时间的停靠点;对于每个车辆,按照在每个停靠点的总停靠时间从大到小排序,并找出停靠时间排序前50的停靠点;
(3)获取每个车辆的停靠时间排序前50的停靠点的原始数据;
(4)对货车轨迹的停靠点进行聚类,对聚类之后的簇是否特殊进行特征标注,根据前50个停靠点是否在特殊簇进行特征标注;
(5)进行停靠点特征提取;
(6)根据步骤(5)的特征,通过货车停靠的数据与实际地图进行比较,标注出货车的起始地和目的地,形成标注集;
(7)找出每个特征中的最大值。
2.根据权利要求1所述的计算车辆起始地和目的地的方法,其特征在于:所述步骤(7)中对每个特征做归一化处理,并且该方法还包括以下步骤:
(8)根据提取特征的停靠点数据,对其进行逻辑回归建模;
(9)对计算结果,运用交叉验证,计算模型的精度、召回率。
3.根据权利要求2所述的计算车辆起始地和目的地的方法,其特征在于:所述步骤(1)包括以下分步骤:
(1.1)数据过滤,将时间大于2020年或者小于2010年的数据过滤掉;将经度为0或者纬度为0的数据过滤掉;将行驶里程为0的数据过滤掉;
(1.2)对于数据的经纬度做网格化处理,将数据的经纬度的最后两位数字改写为50,这样当两个数据的经纬度坐标除了最后两位之外都相同时,这两个数据的经纬度处于同一个网格中;
(1.3)对于每个车辆,按照车辆行驶轨迹数据的记录时间排序之后,计算当前时间跟上一条时间的间隔,并添加在该行驶轨迹数据末尾。
4.根据权利要求3所述的计算车辆起始地和目的地的方法,其特征在于:所述步骤(2)中停留时间为当前网格的最后记录点时间减去前一网格的最先记录点时间,指定时间为10分钟。
5.根据权利要求4所述的计算车辆起始地和目的地的方法,其特征在于:所述步骤(3)通过连接join操作获取每个车辆的排序前50的停靠点的原始数据。
6.根据权利要求5所述的计算车辆起始地和目的地的方法,其特征在于:所述步骤(4)对货车轨迹的停靠点进行聚类,对聚类之后的簇是否特殊进行特征标注,根据前50个停靠点是否在特殊簇进行特征标注。
7.根据权利要求6所述的计算车辆起始地和目的地的方法,其特征在于:所述步骤(5)中对于每个停靠点,计算上一个停靠点到该停靠点的行驶时间、该停靠点到下一个停靠点的行驶时间、上一个停靠点到该停靠点的行驶里程、该停靠点到下一个停靠点的行驶里程、在该停靠点的白天停靠时间、晚上停靠时间、该停靠点的平均停靠时间、平均白天停靠时间、平均晚上停靠时间;并按照时间的先后顺序对停靠点数据做排序。
CN201510013434.XA 2015-01-12 2015-01-12 一种计算车辆起始地和目的地的方法 Active CN104615858B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510013434.XA CN104615858B (zh) 2015-01-12 2015-01-12 一种计算车辆起始地和目的地的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510013434.XA CN104615858B (zh) 2015-01-12 2015-01-12 一种计算车辆起始地和目的地的方法

Publications (2)

Publication Number Publication Date
CN104615858A true CN104615858A (zh) 2015-05-13
CN104615858B CN104615858B (zh) 2018-01-09

Family

ID=53150299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510013434.XA Active CN104615858B (zh) 2015-01-12 2015-01-12 一种计算车辆起始地和目的地的方法

Country Status (1)

Country Link
CN (1) CN104615858B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273520A (zh) * 2017-06-22 2017-10-20 北京理工大学 一种基于货车监控数据的装卸货地点识别方法
CN108074415A (zh) * 2017-12-19 2018-05-25 广州小鹏汽车科技有限公司 一种基于用户行为的车辆目的地预测方法及系统
CN108133345A (zh) * 2017-12-27 2018-06-08 北京中交兴路车联网科技有限公司 一种基于货车海量轨迹数据判断回程车的方法及系统
CN108182558A (zh) * 2017-12-04 2018-06-19 北京中交兴路信息科技有限公司 一种基于统计特征的运距计算方法及装置
CN108444487A (zh) * 2018-01-30 2018-08-24 北京小度信息科技有限公司 导航数据处理方法、导航方法及相关装置
CN109541654A (zh) * 2018-11-19 2019-03-29 北京金州世纪信息技术有限公司 一种车辆停靠点的计算方法及装置
WO2019174630A1 (en) * 2018-03-15 2019-09-19 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for determining destination of navigation
CN111353732A (zh) * 2018-12-21 2020-06-30 北京中交兴路信息科技有限公司 车辆运输模式识别方法、装置、设备和存储介质
CN113176599A (zh) * 2021-05-20 2021-07-27 中国第一汽车股份有限公司 地理位置确定方法、装置、设备及存储介质
CN113823081A (zh) * 2021-03-08 2021-12-21 上海评驾科技有限公司 一种基于商用车行程起终点的空间定位方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320386A (zh) * 2008-07-10 2008-12-10 北京大学 一种车辆自组织网络中多目标查询的方法
CN102147261A (zh) * 2010-12-22 2011-08-10 南昌睿行科技有限公司 一种交通车辆gps数据地图匹配的方法与系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320386A (zh) * 2008-07-10 2008-12-10 北京大学 一种车辆自组织网络中多目标查询的方法
CN102147261A (zh) * 2010-12-22 2011-08-10 南昌睿行科技有限公司 一种交通车辆gps数据地图匹配的方法与系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘奎恩等: "轨迹数据库中热门区域的发现", 《软件学报》 *
毛峰等: "一种基于交通网格划分的出租车轨迹数据空间聚类方法", 《中国科技论文在线》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273520A (zh) * 2017-06-22 2017-10-20 北京理工大学 一种基于货车监控数据的装卸货地点识别方法
CN107273520B (zh) * 2017-06-22 2020-05-29 北京理工大学 一种基于货车监控数据的装卸货地点识别方法
CN108182558A (zh) * 2017-12-04 2018-06-19 北京中交兴路信息科技有限公司 一种基于统计特征的运距计算方法及装置
CN108074415B (zh) * 2017-12-19 2020-09-11 广州小鹏汽车科技有限公司 一种基于用户行为的车辆目的地预测方法及系统
CN108074415A (zh) * 2017-12-19 2018-05-25 广州小鹏汽车科技有限公司 一种基于用户行为的车辆目的地预测方法及系统
CN108133345A (zh) * 2017-12-27 2018-06-08 北京中交兴路车联网科技有限公司 一种基于货车海量轨迹数据判断回程车的方法及系统
CN108133345B (zh) * 2017-12-27 2021-06-29 北京中交兴路车联网科技有限公司 一种基于货车海量轨迹数据判断回程车的方法及系统
CN108444487A (zh) * 2018-01-30 2018-08-24 北京小度信息科技有限公司 导航数据处理方法、导航方法及相关装置
WO2019174630A1 (en) * 2018-03-15 2019-09-19 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for determining destination of navigation
CN109541654A (zh) * 2018-11-19 2019-03-29 北京金州世纪信息技术有限公司 一种车辆停靠点的计算方法及装置
CN111353732A (zh) * 2018-12-21 2020-06-30 北京中交兴路信息科技有限公司 车辆运输模式识别方法、装置、设备和存储介质
CN113823081A (zh) * 2021-03-08 2021-12-21 上海评驾科技有限公司 一种基于商用车行程起终点的空间定位方法
CN113176599A (zh) * 2021-05-20 2021-07-27 中国第一汽车股份有限公司 地理位置确定方法、装置、设备及存储介质
CN113176599B (zh) * 2021-05-20 2024-03-15 中国第一汽车股份有限公司 地理位置确定方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN104615858B (zh) 2018-01-09

Similar Documents

Publication Publication Date Title
CN104615858B (zh) 一种计算车辆起始地和目的地的方法
CN106323301B (zh) 一种道路情报的获取方法及装置
CN103413437B (zh) 一种基于车辆数据采集的道路交叉口转向识别方法及系统
CN110189317A (zh) 一种基于深度学习的道路影像智能采集和识别方法
CN106610981A (zh) 电子地图中道路信息的验证更新方法及系统
CN107195180B (zh) 一种基于电警数据的交通出行轨迹提取方法和装置
CN109191872B (zh) 一种基于号牌数据的路口交通流特征参数提取方法
CN109191605B (zh) 一种考虑收费路径的高速公路计费费率准确性评测方法
CN106446208A (zh) 一种考虑路网契合度的智能手机出行方式识别方法
CN106205120B (zh) 一种提取道路路口交通限制的方法及装置
CN104732765A (zh) 基于卡口数据的城市道路饱和度实时监测方法
WO2019205020A1 (zh) 一种路况识别方法、装置及设备
CN104598992A (zh) 一种车辆常跑路线分析方法
CN106898142B (zh) 一种考虑路段相关性的路径行程时间可靠度计算方法
CN107240264B (zh) 一种车辆非有效行驶轨迹识别方法和城市道路设施规划方法
CN106097717A (zh) 基于两类浮动车数据融合的信号交叉口平均通行时间估计方法
CN112163166B (zh) 检测道路属性的方法、装置、计算机可读介质及电子设备
CN103280100A (zh) 融合智能调度数据的公交ic卡乘客换乘站点判断方法
CN105336164A (zh) 基于大数据分析的错误卡口位置信息自动识别方法
CN104422451A (zh) 一种道路识别方法及装置
CN102968900A (zh) 一种对rfid交通数据进行处理的方法
CN110362557A (zh) 一种基于机器学习和车牌识别数据的缺失路径修复方法
CN112734219A (zh) 一种车辆运输行驶行为分析方法及系统
CN109377757A (zh) 基于含多源粗差的车牌识别数据的车辆出行轨迹提取方法
CN114664087B (zh) 基于轨迹识别车辆上下高速的方法、装置、设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant