CN104598992A - 一种车辆常跑路线分析方法 - Google Patents

一种车辆常跑路线分析方法 Download PDF

Info

Publication number
CN104598992A
CN104598992A CN201510013430.1A CN201510013430A CN104598992A CN 104598992 A CN104598992 A CN 104598992A CN 201510013430 A CN201510013430 A CN 201510013430A CN 104598992 A CN104598992 A CN 104598992A
Authority
CN
China
Prior art keywords
vehicle
sequence
grid
provision
runs away
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510013430.1A
Other languages
English (en)
Inventor
李鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING SINOIOV VEHICLE NETWORK TECHNOLOGY Co Ltd
Original Assignee
BEIJING SINOIOV VEHICLE NETWORK TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING SINOIOV VEHICLE NETWORK TECHNOLOGY Co Ltd filed Critical BEIJING SINOIOV VEHICLE NETWORK TECHNOLOGY Co Ltd
Priority to CN201510013430.1A priority Critical patent/CN104598992A/zh
Publication of CN104598992A publication Critical patent/CN104598992A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management

Abstract

本发明公开一种车辆常跑路线分析方法,其统计计算量较少、耗时少、便于分析、计算结果准确。该方法包括步骤:(1)将车辆行驶路线序列化;(2)根据频繁序列挖掘模型的剪枝理论去除与非频繁序列相关的序列,剩下的序列为频繁序列;(3)将步骤(2)的频繁序列进行处理得到车辆常跑路线。

Description

一种车辆常跑路线分析方法
技术领域
本发明涉及大规模数据处理的技术领域,具体地涉及一种车辆常跑路线分析方法。
背景技术
车辆常跑路线为车辆经常行驶的路线。
车辆常跑路线的分析对车联网业务有重要意义。具体体现有:
1、分析货车经常行驶路线,可以在货车空载时向货车推荐货运业务,提高货车车主的运营收入。从另一方面讨论,也可以为零散货源提供有效的运输途径。
2、分析货车的常跑路线有助于优化货车的运输路线,为货车司机提供更经济的运输线路。
3、根据车辆的常跑线路,可以在常跑线路的周边构建货车的一些相关服务。例如维修、加油等。
4、根据车辆常跑线路可以对运送危险品的车辆实行更细致的运输监控。减少重大事故的发生。
通常分析车辆常跑路线的方法为:统计所有车辆所有经过的路线的次数来判断车辆的常跑路线。即:使用了一种蛮力的办法来对所有线路进行频率统计,然后将行驶路线频率小的路线过滤掉,并给出经常跑的线路。因此,这种方法统计计算量大,耗时耗力巨大,而且不便于分析利用。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提供一种车辆常跑路线分析方法,其统计计算量较少、耗时少、便于分析、计算结果准确。
本发明的技术解决方案是:这种车辆常跑路线分析方法,该方法包括以下步骤:
(1)将车辆行驶路线序列化;
(2)根据频繁序列挖掘模型的剪枝理论去除与非频繁序列相关的序列,
剩下的序列为频繁序列;
(3)将步骤(2)的频繁序列进行处理得到车辆常跑路线。
本发明将车辆行驶路线序列化,再根据频繁序列挖掘模型的剪枝理论获取频繁序列,从而得到车辆常跑路线,使得统计计算量大大减少,耗时减少,而且便于分析、计算结果准确。
附图说明
图1为根据本发明的数据网格化的示意图。
图2为根据本发明的车辆行驶停靠点聚类图。
图3为根据本发明的车辆停靠事件序列示意图。
图4为根据本发明的车辆常跑路线分析方法的流程图。
具体实施方式
如图4所示,这种车辆常跑路线分析方法,该方法包括以下步骤:
(1)将车辆行驶路线序列化;
(2)根据频繁序列挖掘模型的剪枝理论去除与非频繁序列相关的序列,剩下的序列为频繁序列;
(3)将步骤(2)的频繁序列进行处理得到车辆常跑路线。
本发明将车辆行驶路线序列化,再根据频繁序列挖掘模型的剪枝理论获取频繁序列,从而得到车辆常跑路线,使得统计计算量大大减少,耗时减少,而且便于分析、计算结果准确。
如图2所示,为一辆货车的行驶轨迹,其中A、B、C…分别为车辆的停靠网格,方格1(C1)、2(C2)、3(C3)、4(C4)、5(C5)、6(C6)分别为车辆经过的城市。如果按照普通方法计算,需要统计种路线的行驶频率,分别为:
1-2、1-3、1-4、1-5、1-6、2-3、2-4、2-5、
2-6、3-4、3-5、3-6、4-5、4-6、5-6
但是使用频繁项挖掘模式统计的数量可能就比这个数字要小很多。因为根据频繁序列挖掘模型的剪枝理论,如果上述路线中路线“1-2”为非频繁序列,那么路线1-3、路线1-4、路线1-5、路线1-6将不再统计。因为路线1-3、路线1-4等都经过路线1-2,如果路线1-2不是常跑路线,路线1-3、路线1-4等肯定不是常跑路线。
另外,所述步骤(1)包括以下分步骤:
(1.1)对原始车辆数据进行噪声数据过滤;
(1.2)对步骤(1.1)得到的每条数据的经纬度做网格化处理;
(1.3)计算每个车辆经过一个网格一次在该网格内的停留时间,如果一个车辆在一个网格之内的停留时间大于指定时间,认为是一次停靠;通过过滤操作过滤掉停留时间小于指定时间的网格;
(1.4)分析每个停靠网格的信息点POI数据,将POI数据是加油站、维修站的停靠网格过滤掉,然后对剩下的停靠网格进行单路径增量聚类,形成停靠网格;
(1.5)进行序列模式模型的建模。
另外,所述步骤(1.1)中将时间大于2020年或者小于2010年的数据记录过滤掉;将经度为0或者纬度为0的记录过滤掉;将行驶里程为0的记录过滤掉。
另外,所述步骤(1.2)中当两个数据的经纬度坐标除了最后两位之外都相同时,这两个数据的经纬度处于同一个网格中。
另外,所述步骤(1.3)中指定时间为10分钟。
另外,所述步骤(1.4)中增量聚类的簇半径为0.5km。
另外,所述步骤(1.5)的序列模式模型中在车辆行驶的过程中形成一个城市序列,每个城市为该城市序列的一个元素;而每个停靠网格簇为每个元素的一个事件;该模型用于分析具体每个车辆的运营规律。
或者,所述步骤(1.5)的序列模式模型中将车辆经过的城市形成事件序列,用于分析车辆运营经过的城市。
或者,所述步骤(1.5)的序列模式模型中将车辆经过的停靠网格簇形成序列,分析从一个区域到另一个区域的路线,优化路线为车辆提供经济的运输线路。
另外,所述步骤(3)中设定最小支持度阈值,如果有序列的最小支持度大于或等于该阈值,则该序列为一个频繁序列,对应为车辆的一个常跑路线。
下面给出具体的例子说明,其中车辆为货车。
原始数据为货车一个月的行驶轨迹数据。原始数据中,每一条记录为车载终端相隔30秒向服务器报告一次货车的运行信息。其中包括:位置GPS、车辆速度、车辆id等。
其计算过程为:
1、噪声数据过滤。将时间大于2020年,或者小于2010年的数据记录过滤掉;将经度为0或者纬度为0的记录过滤掉;将行驶里程为0的记录过滤掉。
2、网格化处理。对每条数据记录(R,record)的经纬度做网格(G,gridding)化处理。如图1所示,其处理过程为将经纬度的最后两位数字改写为“50”,做该处理后,只要两个经纬度坐标除了最后两位的前几位相同,就认为这两个经纬度相同,也可以认为这些经纬度处于同一个网格中。在图1中,可以认为R2、R3、R4处于网格2(G2)中,R5、R6、R7处于网格3(G3)中。对于每辆货车,按照货车的记录时间排序之后,计算当前时间跟上一条时间记录的间隔(duration),并添加在该记录末尾输出。
3、计算每辆货车经过一个网格一次在该网格内的停留时间(duration),在图1中,网格G2的停留时间为从记录R1到记录R4的时间,即R4的时间戳减去R1的时间戳。如果一辆货车在一个网格之内的停留时间大于10分钟,认为是一次停靠。通过过滤(filter)操作过滤掉停留时间小于10分钟的网格,剩下的为程序计算的停靠网格。
4、分析每个停靠网格的POI(point of interest)信息。如图2所示。点A、B、C…分别为步骤3中的停靠网格,C1、C2…分别为城市(C,city)标记。将POI信息是加油站、维修站的停靠网格过滤掉,然后对剩下的停靠网格进行单路径增量聚类,形成停靠网格簇(SC,stopping cluster)。如图2中的SC1、SC2等,增量聚类的簇半径设定为0.5km,因为通过分析数据,95%以上的车辆在每个停靠点的停靠变化不会超过1km。聚类的原因是货车每次在同一个POI停靠时,停靠位置可能会有小范围的变化,上传的经纬度数据也有所差别。
5、序列模式建模过程。在该业务场景中,有两种序列,一个是城市序列,一个是停靠网格簇序列。建模方法有三种方法,分别对应不同的应用。
A、在货车行驶的过程中形成了一个城市序列。如图3所示,解释了图2中车辆在行驶过程中形成的有序城市序列,记S1={C1C2C3C4C5C6},每个城市为该序列的一个元素。而每个停靠网格簇(SC)为每个元素的一个事件。该模型用于分析具体每个货车的货物运营规律。例如货车将货物从A市的某个地区,运输到B市的某个区域。
B、将货车经过的城市形成事件序列,不包含停靠网格簇,用于分析货车运营经过的城市。
C、将货车经过的停靠网格簇形成序列,分析从一个区域到另一个区域的路线,优化路线为货车提供经济的运输线路。
6、计算频繁模式。设定最小支持度MinSupport阈值,如果有序列的最小支持度大于或等于该阈值,则该序列为一个频繁序列。对应为货车的一个长跑路线。
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。

Claims (10)

1.一种车辆常跑路线分析方法,其特征在于:该方法包括以下步骤:
(1)将车辆行驶路线序列化;
(2)根据频繁序列挖掘模型的剪枝理论去除与非频繁序列相关的序列,剩下的序列为频繁序列;
(3)将步骤(2)的频繁序列进行处理得到车辆常跑路线。
2.根据权利要求1所述的车辆常跑路线分析方法,其特征在于:所述步骤(1)包括以下分步骤:
(1.1)对原始车辆数据进行噪声数据过滤;
(1.2)对步骤(1.1)得到的每条数据的经纬度做网格化处理;
(1.3)计算每个车辆经过一个网格一次在该网格内的停留时间,如果一个车辆在一个网格之内的停留时间大于指定时间,认为是一次停靠;通过过滤操作过滤掉停留时间小于指定时间的网格;
(1.4)分析每个停靠网格的信息点POI数据,将POI数据是加油站、维修站的停靠网格过滤掉,然后对剩下的停靠网格进行单路径增量聚类,形成停靠网格;
(1.5)进行序列模式模型的建模。
3.根据权利要求2所述的车辆常跑路线分析方法,其特征在于:所述步骤(1.1)中将时间大于2020年或者小于2010年的数据记录过滤掉;将经度为0或者纬度为0的记录过滤掉;将行驶里程为0的记录过滤掉。
4.根据权利要求3所述的车辆常跑路线分析方法,其特征在于:所述步骤(1.2)中当两个数据的经纬度坐标除了最后两位之外都相同时,这两个数据的经纬度处于同一个网格中。
5.根据权利要求4所述的车辆常跑路线分析方法,其特征在于:所述步骤(1.3)中指定时间为10分钟。
6.根据权利要求5所述的车辆常跑路线分析方法,其特征在于:所述步骤(1.4)中增量聚类的簇半径为0.5km。
7.根据权利要求6所述的车辆常跑路线分析方法,其特征在于:所述步骤(1.5)的序列模式模型中在车辆行驶的过程中形成一个城市序列,每个城市为该城市序列的一个元素;而每个停靠网格簇为每个元素的一个事件;该模型用于分析具体每个车辆的运营规律。
8.根据权利要求6所述的车辆常跑路线分析方法,其特征在于:所述步骤(1.5)的序列模式模型中将车辆经过的城市形成事件序列,用于分析车辆运营经过的城市。
9.根据权利要求6所述的车辆常跑路线分析方法,其特征在于:所述步骤(1.5)的序列模式模型中将车辆经过的停靠网格簇形成序列,分析从一个区域到另一个区域的路线,优化路线为车辆提供经济的运输线路。
10.根据权利要求1-9任一项所述的车辆常跑路线分析方法,其特征在于:所述步骤(3)中设定最小支持度阈值,如果有序列的最小支持度大于或等于该阈值,则该序列为一个频繁序列,对应为车辆的一个常跑路线。
CN201510013430.1A 2015-01-12 2015-01-12 一种车辆常跑路线分析方法 Pending CN104598992A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510013430.1A CN104598992A (zh) 2015-01-12 2015-01-12 一种车辆常跑路线分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510013430.1A CN104598992A (zh) 2015-01-12 2015-01-12 一种车辆常跑路线分析方法

Publications (1)

Publication Number Publication Date
CN104598992A true CN104598992A (zh) 2015-05-06

Family

ID=53124760

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510013430.1A Pending CN104598992A (zh) 2015-01-12 2015-01-12 一种车辆常跑路线分析方法

Country Status (1)

Country Link
CN (1) CN104598992A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107993441A (zh) * 2017-12-18 2018-05-04 北京中交兴路信息科技有限公司 一种货车常跑路线的预测方法及装置
CN108133345A (zh) * 2017-12-27 2018-06-08 北京中交兴路车联网科技有限公司 一种基于货车海量轨迹数据判断回程车的方法及系统
CN108133611A (zh) * 2016-12-01 2018-06-08 中兴通讯股份有限公司 车辆行驶轨迹监测方法及系统
CN108182558A (zh) * 2017-12-04 2018-06-19 北京中交兴路信息科技有限公司 一种基于统计特征的运距计算方法及装置
CN108182800A (zh) * 2017-12-08 2018-06-19 北京中交兴路信息科技有限公司 一种货运交通信息处理方法及设备
CN108444487A (zh) * 2018-01-30 2018-08-24 北京小度信息科技有限公司 导航数据处理方法、导航方法及相关装置
CN109948990A (zh) * 2019-03-29 2019-06-28 合肥工业大学智能制造技术研究院 云物流环境下的路径优化方法、系统及存储介质
CN111353732A (zh) * 2018-12-21 2020-06-30 北京中交兴路信息科技有限公司 车辆运输模式识别方法、装置、设备和存储介质
CN112633592A (zh) * 2020-12-30 2021-04-09 鱼快创领智能科技(南京)有限公司 基于机器学习聚类算法的车辆常跑路线计算方法及系统
CN112700201A (zh) * 2021-01-12 2021-04-23 上海斑马来拉物流科技有限公司 货源推荐方法、电子设备和存储介质
CN113222492A (zh) * 2021-03-29 2021-08-06 北京中交兴路信息科技有限公司 一种车辆行驶线路类型的判别方法、装置、存储介质及终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102306183A (zh) * 2011-08-30 2012-01-04 王洁 一种对事务数据流进行闭合加权频繁模式挖掘的方法
CN102509170A (zh) * 2011-10-10 2012-06-20 浙江鸿程计算机系统有限公司 一种基于历史轨迹数据挖掘的位置预测系统及方法
CN103258049A (zh) * 2013-05-27 2013-08-21 重庆邮电大学 一种基于海量数据的关联规则挖掘方法
CN103761229A (zh) * 2013-10-15 2014-04-30 北京航空航天大学 数据处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102306183A (zh) * 2011-08-30 2012-01-04 王洁 一种对事务数据流进行闭合加权频繁模式挖掘的方法
CN102509170A (zh) * 2011-10-10 2012-06-20 浙江鸿程计算机系统有限公司 一种基于历史轨迹数据挖掘的位置预测系统及方法
CN103258049A (zh) * 2013-05-27 2013-08-21 重庆邮电大学 一种基于海量数据的关联规则挖掘方法
CN103761229A (zh) * 2013-10-15 2014-04-30 北京航空航天大学 数据处理方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
吕明琪: "基于轨迹数据挖掘的语义化位置感知计算研究", 《中国博士学位论文全文数据库》 *
王晓明: "基于移动数据的轨迹模式挖掘算法的研究与应用", 《中国优秀硕士学位论文全文数据库》 *
贾俊杰: "空间数据挖掘中若干关键技术研究", 《中国博士学位论文全文数据库》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108133611A (zh) * 2016-12-01 2018-06-08 中兴通讯股份有限公司 车辆行驶轨迹监测方法及系统
CN108182558A (zh) * 2017-12-04 2018-06-19 北京中交兴路信息科技有限公司 一种基于统计特征的运距计算方法及装置
CN108182800A (zh) * 2017-12-08 2018-06-19 北京中交兴路信息科技有限公司 一种货运交通信息处理方法及设备
CN107993441A (zh) * 2017-12-18 2018-05-04 北京中交兴路信息科技有限公司 一种货车常跑路线的预测方法及装置
CN107993441B (zh) * 2017-12-18 2020-03-27 北京中交兴路信息科技有限公司 一种货车常跑路线的预测方法及装置
CN108133345B (zh) * 2017-12-27 2021-06-29 北京中交兴路车联网科技有限公司 一种基于货车海量轨迹数据判断回程车的方法及系统
CN108133345A (zh) * 2017-12-27 2018-06-08 北京中交兴路车联网科技有限公司 一种基于货车海量轨迹数据判断回程车的方法及系统
CN108444487A (zh) * 2018-01-30 2018-08-24 北京小度信息科技有限公司 导航数据处理方法、导航方法及相关装置
CN111353732A (zh) * 2018-12-21 2020-06-30 北京中交兴路信息科技有限公司 车辆运输模式识别方法、装置、设备和存储介质
CN109948990A (zh) * 2019-03-29 2019-06-28 合肥工业大学智能制造技术研究院 云物流环境下的路径优化方法、系统及存储介质
CN112633592A (zh) * 2020-12-30 2021-04-09 鱼快创领智能科技(南京)有限公司 基于机器学习聚类算法的车辆常跑路线计算方法及系统
CN112633592B (zh) * 2020-12-30 2023-07-18 鱼快创领智能科技(南京)有限公司 基于机器学习聚类算法的车辆常跑路线计算方法及系统
CN112700201A (zh) * 2021-01-12 2021-04-23 上海斑马来拉物流科技有限公司 货源推荐方法、电子设备和存储介质
CN112700201B (zh) * 2021-01-12 2023-08-15 上海斑马来拉物流科技有限公司 货源推荐方法、电子设备和存储介质
CN113222492A (zh) * 2021-03-29 2021-08-06 北京中交兴路信息科技有限公司 一种车辆行驶线路类型的判别方法、装置、存储介质及终端

Similar Documents

Publication Publication Date Title
CN104598992A (zh) 一种车辆常跑路线分析方法
CN104615858B (zh) 一种计算车辆起始地和目的地的方法
CN107036572A (zh) 一种农机作业面积获取方法及装置
CN103440768B (zh) 一种基于动态修正的公交车到达时间实时预测方法
CN101763729B (zh) 路况数据特征值提取的方法和装置
CN112270460A (zh) 一种基于多源数据的超重货车货源站点识别方法
CN109410368B (zh) 一种基于铁路车号信息计算货车运行里程的方法
Liu et al. Intersection delay estimation from floating car data via principal curves: a case study on Beijing’s road network
CN104112361A (zh) 路网交通中常发瓶颈和偶发瓶颈的识别方法
CN104408920B (zh) 基于卡口通行信息判断长途客运车辆交通违法行为的方法
CN103035123A (zh) 一种交通轨迹数据中异常数据获取方法及系统
CN103632541B (zh) 交通事件路链检测与数据填补方法
CN104200659A (zh) 一种不按规定线路行驶的重点车辆交通违法行为判定方法
Berkow et al. Beyond generating transit performance measures: visualizations and statistical analysis with historical data
CN105575120B (zh) 面向道路实时速度计算的浮动车数据停车行为模式清洗方法
CN103700262A (zh) 一种套牌车车辆的区域自动捕获方法
CN105608895A (zh) 一种基于局部异常因子的城市交通拥堵路段检测方法
CN106373399A (zh) 一种公交线路站点间运行瓶颈识别系统
CN101976305B (zh) 一种基于概率统计的旅行时间筛选方法
CN104978859A (zh) 一种计算城市任意区域公交线网密度的方法
CN105261218B (zh) 基于大数据分析的浮动车伴随行为模式挖掘方法
CN105551241B (zh) 一种基于fcd及ep多源数据的实时拥堵分析方法
CN105427600B (zh) 一种基于fcd的道路拥堵实时识别方法与装置
CN102809384A (zh) 一种路链提取方法及装置
CN104732062A (zh) 一种基于特征事件、运动行为、行驶轨迹、地理位置的路上用户社会化属性自动判断方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150506