CN106649709B - 一种基于数据挖掘的车辆停留行为模式预测与评估方法 - Google Patents

一种基于数据挖掘的车辆停留行为模式预测与评估方法 Download PDF

Info

Publication number
CN106649709B
CN106649709B CN201611187064.2A CN201611187064A CN106649709B CN 106649709 B CN106649709 B CN 106649709B CN 201611187064 A CN201611187064 A CN 201611187064A CN 106649709 B CN106649709 B CN 106649709B
Authority
CN
China
Prior art keywords
data
time
points
vehicle
longitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611187064.2A
Other languages
English (en)
Other versions
CN106649709A (zh
Inventor
田大新
单雄宇
王云鹏
唐文忠
胡俊杰
杨越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yixian Intelligent Technology Co ltd
Original Assignee
Beijing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Aeronautics and Astronautics filed Critical Beijing University of Aeronautics and Astronautics
Priority to CN201611187064.2A priority Critical patent/CN106649709B/zh
Publication of CN106649709A publication Critical patent/CN106649709A/zh
Application granted granted Critical
Publication of CN106649709B publication Critical patent/CN106649709B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于数据挖掘的车辆停留行为模式预测与评估方法,可以发现,现如今,道路交通运输的发展越来越迅速,道路交通运输的主体——货运车辆的停留行为模式将会在一定程度上影响道路交通运输过程中随之产生的时间成本,本发明通过数据挖掘的方式对于大量的货运车辆GPS轨迹数据进行处理与分析,实现对于车辆停留行为模式的预测与评估,为道路交通运输过程中的时间成本的优化提供一定的标准。

Description

一种基于数据挖掘的车辆停留行为模式预测与评估方法
技术领域
本发明涉及数据挖掘的方法、车辆的停留行为模式以及相关的预测与评估方法,特别是涉及一种基于数据挖掘的车辆停留行为模式预测与评估方法。
背景技术
数据挖掘的方法是一个从大量数据中提取出人们所感兴趣的知识的复杂的方式,人们所感兴趣的知识是有实际意义的并且以可以被理解的模式蕴含在数据之中。20年左右的发展,数据挖掘的相关研究已经越来越成熟,并且应用到其他领域。移动对象的数据挖掘主要是通过数据的处理与分析,数学,以及统计学等一系列数据挖掘的方法从移动对象的历史活动数据——轨迹数据中挖掘,并进一步发现有意义的和有价值的信息。轨迹数据是移动对象的历史活动数据,在一定水平上可以体现移动对象的性质、状态、行为等等内部特征和外部特征,此外,还可以体现内部环境和外部环境的变化对于移动对象的活动的影响。
行为模式是从大量的行为活动中提取出来的,是行为的基本的理论、模型和规律。具体到车辆的停留行为模式,指的是车辆,特别是货运车辆,在一次行驶过程中,因为某一种因素的影响,所导致停留行为的时刻、间隔、频率、距离等一系列的指标所体现出来的特征。相关的预测与评估方法,主要有常规的预测与评估,灰色系统理论以及模型等,一般情况下,是通过对于现有的数据的整理及进一步处理,统计及进一步分析,
建立一个回归函数进行预测,并且建立一个指标体系进行评估,在这一过程中,这个回归函数的类型还要求根据所使用的数据进一步确定,这个指标体系可以是单值函数或者集值函数。另外,对于规律性不大的系统也可以用灰色系统方法。
发明内容
本发明的目的是为了解决上述问题,提出一种基于数据挖掘的车辆停留行为模式预测与评估方法。
本发明是一种基于数据挖掘的车辆停留行为模式预测与评估方法,如图1所示,包括以下几个步骤:
步骤一,导入初始的GPS轨迹数据,进行数据预处理;
步骤二,从SQL数据库之中提取数据预处理之后的基本的GPS轨迹数据,并且进一步的进行停留点的提取;
步骤三,对于每一种类型的停留点,分别对于以下四个统计指标;
步骤四,对于每一种类型的停留点的四个统计指标的统计分布进一步的拟合,拟合过程主要是根据最小二乘法按照线性回归的方式提取统计分布的回归函数,可以利用一系列的常规函数拟合统计分布,并且比较拟合效果以确定回归函数,这里所采用的的函数是相关研究中通常会采用的函数。
步骤五,根据每一种类型的停留点的停留时间和停留频率的统计分布平均值来确定总体上的停留时间的平均水平。
本发明的优点在于:
(1)本发明基于数据挖掘的车辆停留行为模式预测与评估方法,基本的主要流程是基于大量的GPS轨迹数据,采取数据挖掘技术相关的方法,对于以上轨迹数据进行选择、清洗、整理、存储等一系列的处理步骤,以保证接下来所使用的数据的真实性、实时性、准确性,进一步的利用相关的统计学理论来进行货运车辆的停留点的提取和停留点的分类,以保证接下来的统计分析过程的具体性和合理性,在此基础之上,对于行为模式理论相关的一系列统计指标进行统计分析,以提取分布规律和分布函数,与此同时,分析总体和个体的统计指标的分布之间的关系,为预测和评估提供数据和理论上的支持;
(2)本发明基于数据挖掘的车辆停留行为模式预测与评估方法,其中预测与评估的主要方法选择了回归函数与指标体系二者相结合的方式,以保证总体的完整性,回归函数的确定主要是通过对于实际数据的统计指标的统计分析,体现其合理性,指标体系的确定主要是通过对于大量的统计分析的结果的处理,以总体反映个体,如此,可以保证预测与评估方法体系的正确性,以实现所要达到的效果。
附图说明
图1为本发明基于数据挖掘的车辆停留行为模式预测与评估方法流程图;
具体实施方式
下面将结合附图和实施例对本发明作进一步的详细说明。
本发明是一种基于数据挖掘的车辆停留行为模式预测与评估方法,如图1所示,包括以下几个步骤:
步骤一,导入初始的GPS轨迹数据,进行数据预处理;
一般情况下,车辆的GPS轨迹数据包括以下字段,如时间、车辆ID、经度、纬度、速度、方向,根据数据所反映的车辆的类型、行驶路线、行驶时间、行驶区域的相关的信息,选择所需要的GPS轨迹数据,并且主要关注时间、车辆ID、经度、纬度以及速度,这里所需要导入的数据是若干车辆行驶一段时间的GPS轨迹数据,主要包括时间、车辆ID、经度、纬度、速度几个字段;
初始的数据往往存在一定的问题,如字段的记录是否正确、规范、或者存在缺失,因此还需要对数据进行清洗和整理,根据相应的字段的性质,选择其中的记录正常的数据,并且保证数据的完整性,具体的方法是将GPS轨迹数据记录中,时间、车辆ID、经度、纬度、速度几个字段的记录存在不正确、不规范、或者存在缺失问题的条目筛选出来并且去除掉,将处理之后的数据根据车辆ID分类,并且对于每一个车辆ID分类下的数据按照时间的顺序重新排列,如果其中有时间不连续的情况,还需要进一步对时间字段进行补全,并且对于相应的条目中的经度、纬度、速度字段,结合车辆行驶的实际情况的合理性,进行理论的估计和补全,以保证时间、经度、纬度、速度的前后连贯性,并且将数据存储入SQL数据库中。
步骤二,从SQL数据库之中提取数据预处理之后的基本的GPS轨迹数据,并且进一步的进行停留点的提取;
为了进行停留点的提取,必须判断数据记录中的速度是否为零,因为轨迹数据可能存在一定的误差,所以依据记录判断不合理,因此,可以进行以下处理,将总体的轨迹数据中的 速度字段提取出来为一条数据,定义为x1,x2,x3,……xM,其中,xn为某一车辆在某一时刻的速度数值,并且,xn≥0,M为所有具有速度数值的有效记录的个数,在此基础之上,根据3-sigma原则,判断总体的速度数据是否符合正态分布,若符合正态分布,则可以根据一个区间来判断速度是否为零,
Figure BDA0001186002120000042
Figure BDA0001186002120000043
分别为区间的下限和上限,表示均值,δ表示方差,在这一区间范围内的速度为零,不在这一区间范围内的速度不为零,
其中,
Figure BDA0001186002120000045
定义为
Figure BDA0001186002120000046
其中,δ定义为
若不符合正态分布,则需要对数据进行正态化处理,公式如下所示,
Figure BDA0001186002120000048
其中,x表示不符合正态分布的数据,y表示经过正态化处理后符合正态分布的数据,γ为幂指数,
对于x1,x2,x3,……xM一系列数值,可以将使以下公式达到其最大值的式中的参数γ的理论值作为参数γ的实际值,
Figure BDA0001186002120000049
其中,l(γ)表示目标函数值,yi表示y中数据的单个值,
Figure BDA00011860021200000410
表示y中数据的平均值,
Figure BDA00011860021200000411
以上处理方法可以参考非正态数据的正态变换处理方法;
上述处理过程之后,选择出来的速度为零的数据记录,可能存在的情况是,一系列连续的速度为零的数据记录实际上属于一个停留点,对于某一辆ID为XXX的车辆,获得其一部分连续的行驶轨迹数据记录,时间记录为t1、t2……、tn,经度和纬度记录分别为lon1、lon2……、lonn和lat1、lat2……、latn,并且数值变化比较小(两点之间实际距离误差范围为s米以内,s=1),速度记录均为0,具体形式如下所示,
时间 车辆ID 经度 纬度 速度
t 1 XXX lon 1 lat 1 0
…… …… …… …… ……
t n XXX lon n lat n 0
对于这样一系列连续的速度为零的数据记录,可以将其整理为一条数据记录,将这一条数据记录的时间取为上述数据中第一条数据条目的时间,记为t,经度和纬度分别取为上述数据中所有经度和纬度的平均值,记为lon ave和lat ave,速度取为0,持续时间取为上述数据中第一条数据条目和最后一条数据条目的时间之差,记为t last,车辆的ID还是为XXX,具体形式如下所示,
时间 车辆ID 经度 纬度 速度 持续时间
t XXX lon ave 1at ave 0 t last
时间记为t=t 1,
经度记为lon ave=(lon 1+lon 2+lon 3+……+lon n)/n,
纬度记为lat ave=(lat 1+lat 2+lat 3+……+lat n)/n,
速度记为0,
持续时间记为t last=(t n–t 1),
到此为止,完成了停留点的提取,提取出来的停留点的形式为一条一条的数据条目,每一条数据条目包括时间、车辆ID、经度、纬度、速度、持续时间几个字段的内容,因为表示的是停留点,所以这里的速度字段的值均为0,则这一条条目的含义就是某一个ID的车辆,在某一时间(时间表示的),于某一位置(经度和纬度表示的),停留了多少时间(持续时间表示的),接下来,进一步的来进行停留点的分类,将提取出来的总体的停留点的数据,按照 持续时间的长短,体现其统计分布结果,以持续时间的长短为横坐标,单位为分钟,区间为(0,480),间隔为10,并且以停留点的个数为纵坐标,单位为个数,表示出总体的停留点的数据的统计分布,按照统计分布中所反映的停留点的持续时间的分布情况,结合可能的行驶过程中导致停留行为的因素的种类,将停留点划分为n种类型,持续时间的区间分别设为(0,t1),(t1,t2),(t2,t3),……(tn-1,∞)。此处,统计分布主要是为了直观的表示,划分为n种类型主要还是根据实际的经验。
步骤三,对于每一种类型的停留点,分别对于以下四个统计指标,表示出其统计分布规律,
(1)停留时间,指的是某一次停留中停留行为的持续时间,
(2)停留频率,指的是某一段时间内停留行为的重复次数,
(3)两个停留点之间的距离,指的是某一车辆的两次停留位置之间的距离,可以依据停留点的经度和纬度的信息来计算,
两个停留点的经纬度坐标分别为(lon end,lat end),(lon start,lat start),两者之间其实还有一系列的点的坐标,例如(lon 1,lat 1),(lon 2,lat 2),……可以逐个计算两点之间的距离,再一一加起来,也就是两个停留点之间的距离,
计算公式如下所示,
C=(sin(MlatA)*sin(MlatB)*cos(MlonA-MlonB)+cos(MlatA)*cos(MlatB)) (6)
Distance=R*arccos(C)*π/180 (7)
其中,(lonA,latA)和(lonB,latB)为两点的经纬度坐标,东经取经度的正值(longitude),西经取经度负值(-longitude),北纬取90-纬度值(90-latitude),南纬取90+纬度值(90+latitude),进行以上处理的两点的经纬度坐标分别为(MlonA,MlatA),(MlonB,MlatB),R为地球的平均半径,
(4)停留时刻,指的是某一车辆的某一次停留行为发生的时间,
对于根据某一车辆的停留点的数据和根据所有车辆的停留点的数据所获得的上述某一类型停留点(指的是之前划分的n种停留点的类型)的某一个统计指标(指的是之前提到的四个统计指标,也就是停留时间、停留频率、两个停留点之间的距离、停留时刻)的统计分布,还要确定是否为类似分布,这个可以根据t-test检验进行判断,检验主要用于检测两个分布是否为类似分布,其功能可以通过MATLAB或者其他的数学软件实现。
步骤四,对于每一种类型的停留点的四个统计指标的统计分布进一步的拟合,拟合过程主要是根据最小二乘法按照线性回归的方式提取统计分布的回归函数,可以利用一系列的常规函数拟合统计分布,并且比较拟合效果以确定回归函数,这里所采用的的函数是相关研究中通常会采用的函数。
可以考虑采用的常规函数有,
(1)指数分布函数
f(x)=a·eb·x (8)
(2)高斯分布函数
Figure BDA0001186002120000071
(3)幂律分布函数
f(x)=a·xb (10)
(4)对数正态分布函数
Figure BDA0001186002120000072
其中,f(x)为目标函数,也就是上述的四个统计指标所对应的横坐标的量,x为变化的量,也就是数据的个数所对应的纵坐标的量,a,b,c分别为其参数,
可以考虑采用R-Square公式来比较拟合效果,
Figure BDA0001186002120000073
Figure BDA0001186002120000074
Figure BDA0001186002120000081
其中,R-Square为一个(0,1)的数值,通常用来描述数据对模型的拟合程度的好坏,yi
Figure BDA0001186002120000082
wi四个参数分别表示第i个数据点的实际值,拟合值,平均值,数据点的数据量占数据总量的权重,R-Square的值越趋于0表示效果越差,R-Square的值越趋于1表示效果越好。
步骤五,根据每一种类型的停留点的停留时间和停留频率的统计分布平均值来确定总体上的停留时间的平均水平,
对于类型M的停留点,对其所包含的停留点的数据统计如下,
表1类型M的停留点所包含的停留点的数据
序号 1 2 3 …… m
个数 num(1) num(2) num(3) …… num(m)
停留时间 t1 t2 t3 …… tm
平均停留时间为
Figure BDA0001186002120000083
其中tMmean表示平均停留时间,num(i)表示停留时间为ti的停留点个数,ti表示停留时间,nfrequentMmean表示类型M的停留点的停留频率的平均值,
tMmean为类型M的停留点的停留时间的平均水平,并且可以根据数据t1,t2,t3,…tm中的最大值和最小值,来分别确定停留时间的最高水平和最低水平,分别设为tMmax,tMmin
此外,还可以将(tMmin,tMmean,tMmax)之间进一步的划分对应的等级并且赋予对应的评分,如下,
表2类型M的停留点对应的等级和评分的划分
t<sub>Mmin</sub>~t<sub>M1</sub> t<sub>M1</sub>~t<sub>M2</sub> t<sub>M2</sub>~t<sub>M3</sub> t<sub>M3</sub>~t<sub>Mmean</sub> t<sub>Mmean</sub>~t<sub>M4</sub> t<sub>M4</sub>~t<sub>M5</sub> t<sub>M5</sub>~t<sub>M6</sub> t<sub>M6</sub>~t<sub>Mmax</sub>
P1 P2 P3 P4 P5 P6 P7 P8
其中tM1、tM2、tM3、tM4、tM5、tM6表示时间常数,用于划分tMmin,tMmean,tMmax之间的等级,P1、P2、P3、P4、P5、P6、P7、P8表示对应等级的评分,具体来说,等级指的是根据类型M的停留点的停留时间所进行的分类,如tMmin~tM1、tM1~tM2、tM2~tM3、tM3~tMmean、tMmean~tM4、tM4~tM5、tM5~tM6、tM6~tMmax分别对应8个等级,评分指的是人为规定的对应于各个等级的分数,以用于进一步的评价,如P1、P2、P3、P4、P5、P6、P7、P8指的就是对应于8个等级的评分;
所划分的等级和赋予的评分可以是均匀的,并且规则是时间增加,评分减少,
考虑到之前划分了n种类型的停留点,对于每一种类型的停留点均进行上述的处理,如下所示,
表3任意类型的停留点对应的等级和评分的划分
Figure BDA0001186002120000091
其中,t11、t12、t13、t14、t15、t16和t21、t22、t23、t24、t25、t26和tn1、tn2、tn3、tn4、tn5、tn6表示时间常数,A1、A2、A3、A4、A5、A6、A7、A8和B1、B2、B3、B4、B5、B6、B7、B8和C1、C2、C3、C4、C5、C6、C7、C8表示对应等级的评分,这里与P1、P2、P3、P4、P5、P6、P7、P8没有直接的关系,也可以人为的设为1、2、3、4、5、6、7、8,并不影响进一步的评分,具体的如上所述,等级指的是根据相应类型的停留点的停留时间所进行的分类,评分指的是人为规定的对应于各个等级的分数,以用于进一步的评价。
对于某一车辆在某一个时间区间之内正常行驶过程中的停留时间t,可以应用上述体系进行预测和评估,
对其进行预测的方法具体是,根据目标车辆预期的行驶路线过程中可能出现的停留点的类型和频率,对照上述表3显示的结果,可以计算出对应于不同等级情况下的车辆可能的用于停留的时间,作为停留行为模式的预测,
对其进行评估的方法具体是,根据目标车辆实际的行驶路线过程中确实出现的停留点的类型、时间、频率,计算出车辆在不同类型的停留点停留的时间,对照上述表3显示的结果,可以给出相应的等级和评分,作为停留行为模式的评估,
并且可以以此为依据,进一步调整其行驶的方案,
另外,两个停留点之间的距离以及停留的时刻这两个统计指标主要可以用来确定是否有异常驾驶的行为,
也就是根据大量的历史数据发现这两个统计指标的正常情况下的数值,并且与某一车辆在某一个时间区间之内行驶过程中的对应的统计指标的数值相比较,若一致,则没有异常驾驶的行为,若不一致,则有异常驾驶的行为。

Claims (2)

1.一种基于数据挖掘的车辆停留行为模式预测与评估方法,包括以下几个步骤:
步骤一,导入初始的GPS轨迹数据,进行数据预处理;
初始的GPS轨迹数据为车辆行驶一段时间的GPS轨迹数据,包括时间、车辆ID、经度、纬度、速度字段;对初始的GPS轨迹数据进行数据预处理,将数据存储入SQL数据库中;
步骤二,从SQL数据库之中提取数据预处理之后的GPS轨迹数据,进行停留点的提取;
提取GPS轨迹数据中的速度字段,设为x1,x2,x3,……xM,其中,xn为某一车辆在某一时刻的速度数值,并且,xn≥0,M为所有具有速度数值的有效记录的个数;
根据3-sigma原则,判断总体的速度数据是否符合正态分布,若符合正态分布,则根据区间
Figure FDA0002191617540000011
判断速度是否为零,
Figure FDA0002191617540000012
Figure FDA0002191617540000013
分别为区间的下限和上限,
Figure FDA0002191617540000014
表示均值,δ表示方差,在这一区间范围内的速度为零,不在这一区间范围内的速度不为零,
其中,定义为
Figure FDA0002191617540000016
其中,δ定义为
Figure FDA0002191617540000017
若不符合正态分布,则对数据进行正态化处理:
Figure FDA0002191617540000018
其中,x表示不符合正态分布的速度数据,y表示经过正态化处理后符合正态分布的速度数据,γ为幂指数;
针对x1,x2,x3,……xM,使以下公式达到其最大值的式中的参数γ的理论值作为参数γ的实际值:
其中,l(γ)表示目标函数值,yi表示y中数据的单个值,
Figure FDA0002191617540000022
表示y中数据的平均值,
Figure FDA0002191617540000023
最终,得到速度为零的数据记录;
如果某一辆ID为XXX的车辆,获得其一部分连续的行驶轨迹数据记录,时间记录为t1、t2……、tn,经度和纬度记录分别为lon1、lon2……、lonn和lat1、lat2……、latn,并且两点之间实际距离误差范围为s米以内,速度记录均为0,则将数据整理为一条数据记录,车辆的ID为XXX,数据记录的时间取为第一条数据条目的时间,记为t,经度和纬度分别取为数据中所有经度和纬度的平均值,记为lon ave和lat ave,速度取为0,持续时间取为上述数据中第一条数据条目和最后一条数据条目的时间之差,记为t last,车辆的ID还是为XXX;
通过从SQL数据库之中提取数据预处理之后的GPS轨迹数据,提取得到停留点,停留点的形式为一条数据条目,每一条数据条目包括时间、车辆ID、经度、纬度、速度、持续时间字段;
进行停留点分类:将提取出来的总体的停留点的数据,以持续时间的长短为横坐标,单位为分钟,以停留点的个数为纵坐标,单位为个数,将停留点划分为n种类型;
步骤三,对于每一种类型的停留点,分别对于以下四个统计指标,表示出其统计分布规律,
(1)停留时间,指的是某一次停留中停留行为的持续时间;
(2)停留频率,指的是某一段时间内停留行为的重复次数;
(3)两个停留点之间的距离,指的是某一车辆的两次停留位置之间的距离;
依据停留点的经度和纬度的信息来计算,两个停留点的经纬度坐标分别为(lon end,lat end),(lon start,lat start),两者还有一系列的点的坐标,设为(lon 1,lat 1),(lon 2,lat 2),……,逐个计算两点之间的距离,进行累加,得到两个停留点之间的距离;
计算公式如下所示,
C=(sin(MlatA)*sin(MlatB)*cos(MlonA-MlonB)+cos(MlatA)*cos(MlatB)) (6)
Distance=R*arccos(C)*π/180 (7)
其中,(lonA,latA)和(lonB,latB)为两点的经纬度坐标,东经取经度的正值(longitude),西经取经度负值(-longitude),北纬取90-纬度值(90-latitude),南纬取90+纬度值(90+latitude),进行以上处理的两点的经纬度坐标分别为(MlonA,MlatA),(MlonB,MlatB),R为地球的平均半径,
(4)停留时刻,指的是某一车辆的某一次停留行为发生的时间;
对于根据某一车辆的停留点的数据和根据所有车辆的停留点的数据所获得的上述某一类型停留点的某一个统计指标的统计分布,确定是否为类似分布;
步骤四,对于每一种类型的停留点的四个统计指标的统计分布进一步的拟合,拟合过程根据最小二乘法按照线性回归的方式提取统计分布的回归函数;
步骤五,根据每一种类型的停留点的停留时间和停留频率的统计分布平均值,确定总体上的停留时间的平均水平,
对于类型M的停留点,对其所包含的停留点的数据统计如下;
表1类型M的停留点所包含的停留点的数据
序号 1 2 3 …… m 个数 num(1) num(2) num(3) …… num(m) 停留时间 t1 t2 t3 …… tm
平均停留时间为
Figure FDA0002191617540000041
其中tMmean表示平均停留时间,num(i)表示停留时间为ti的停留点个数,ti表示停留时间,nfrequentMmean表示类型M的停留点的停留频率的平均值,
tMmean为类型M的停留点的停留时间的平均水平,根据数据t1,t2,t3,…tm中的最大值和最小值,来分别确定停留时间的最高水平和最低水平,分别设为tMmax,tMmin
将(tMmin,tMmean,tMmax)之间进一步的划分对应的等级并且赋予对应的评分,如下,
表2类型M的停留点对应的等级和评分的划分
t<sub>Mmin</sub>~t<sub>M1</sub> t<sub>M1</sub>~t<sub>M2</sub> t<sub>M2</sub>~t<sub>M3</sub> t<sub>M3</sub>~t<sub>Mmean</sub> t<sub>Mmean</sub>~t<sub>M4</sub> t<sub>M4</sub>~t<sub>M5</sub> t<sub>M5</sub>~t<sub>M6</sub> t<sub>M6</sub>~t<sub>Mmax</sub> P1 P2 P3 P4 P5 P6 P7 P8
其中:tM1、tM2、tM3、tM4、tM5、tM6表示时间常数,用于划分tMmin,tMmean,tMmax之间的等级,P1、P2、P3、P4、P5、P6、P7、P8表示对应等级的评分,具体来说,等级指的是根据类型M的停留点的停留时间所进行的分类,tMmin~tM1、tM1~tM2、tM2~tM3、tM3~tMmean、tMmean~tM4、tM4~tM5、tM5~tM6、tM6~tMmax分别对应8个等级,评分指的是人为规定的对应于各个等级的分数,以用于进一步的评价,如P1、P2、P3、P4、P5、P6、P7、P8指的就是对应于8个等级的评分;
对于每一种类型的停留点统计停留时间和停留频率的统计分布平均值,如下所示,
表3任意类型的停留点对应的等级和评分的划分
Figure FDA0002191617540000042
其中,t11、t12、t13、t14、t15、t16和t21、t22、t23、t24、t25、t26和tn1、tn2、tn3、tn4、tn5、tn6表示时间常数,A1、A2、A3、A4、A5、A6、A7、A8和B1、B2、B3、B4、B5、B6、B7、B8和C1、C2、C3、C4、C5、C6、C7、C8表示对应等级的评分;
对于某一车辆在某一个时间区间之内正常行驶过程中的停留时间t,进行预测和评估的方法具体是,根据目标车辆预期的行驶路线过程中出现的停留点的类型和频率,对照表3显示的结果,计算出对应于不同等级情况下的车辆用于停留的时间,作为停留行为模式的预测;
进行评估的方法具体是,根据目标车辆实际的行驶路线过程中确实出现的停留点的类型、时间、频率,计算出车辆在不同类型的停留点停留的时间,对照表3显示的结果,给出相应的等级和评分,作为停留行为模式的评估,进一步调整其行驶的方案;
通过两个停留点之间的距离以及停留的时刻,确定是否有异常驾驶的行为。
2.根据权利要求1所述的一种基于数据挖掘的车辆停留行为模式预测与评估方法,所述的步骤一中,数据预处理具体为:
根据相应的字段的性质,去除不正确、不规范、或者存在缺失问题的数据,然后数据根据车辆ID分类,并且对于每一个车辆ID分类下的数据按照时间的顺序重新排列,如果其中时间不连续,则对时间字段进行补全,并且对于相应的条目中的经度、纬度、速度字段,根据车辆行驶的实际情况,进行理论的估计和补全,保证时间、经度、纬度、速度的前后连贯性。
CN201611187064.2A 2016-12-20 2016-12-20 一种基于数据挖掘的车辆停留行为模式预测与评估方法 Active CN106649709B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611187064.2A CN106649709B (zh) 2016-12-20 2016-12-20 一种基于数据挖掘的车辆停留行为模式预测与评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611187064.2A CN106649709B (zh) 2016-12-20 2016-12-20 一种基于数据挖掘的车辆停留行为模式预测与评估方法

Publications (2)

Publication Number Publication Date
CN106649709A CN106649709A (zh) 2017-05-10
CN106649709B true CN106649709B (zh) 2020-02-07

Family

ID=58835221

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611187064.2A Active CN106649709B (zh) 2016-12-20 2016-12-20 一种基于数据挖掘的车辆停留行为模式预测与评估方法

Country Status (1)

Country Link
CN (1) CN106649709B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108120991A (zh) * 2017-12-06 2018-06-05 上海评驾科技有限公司 一种行车轨迹优化方法
CN108009012B (zh) * 2017-12-14 2021-12-14 中南大学 一种基于任务模型的多智能体动态任务分配方法
CN108364457A (zh) * 2018-01-31 2018-08-03 长安大学 一种基于gps的商用车疲劳驾驶检测方法
CN110399437A (zh) * 2018-04-23 2019-11-01 北京京东尚科信息技术有限公司 行为分析方法及装置、电子设备、存储介质
CN111178806B (zh) * 2019-12-30 2023-08-15 北京四维智联科技有限公司 一种车辆停留点的查找方法、装置及设备
CN111340415B (zh) * 2020-02-14 2024-01-09 北京航空航天大学 一种基于货运轨迹数据的车辆自发编队模式挖掘方法
CN115964545B (zh) * 2023-03-16 2023-05-30 四川国蓝中天环境科技集团有限公司 一种基于运渣车轨迹点推断污染点位的方法
CN117238141B (zh) * 2023-11-14 2024-02-02 交通运输部规划研究院 目标车辆的跨区域出行行为识别方法、装置和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103052964A (zh) * 2010-08-04 2013-04-17 日本电气株式会社 行为特征提取设备、行为特征提取系统、行为特征提取方法以及行为特征提取程序
CN104504245A (zh) * 2014-12-04 2015-04-08 吉林大学 一种应用gps出行调查数据识别出行和活动的方法
CN106227889A (zh) * 2016-08-15 2016-12-14 华云科技有限公司 一种轨迹停留点分析提取方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4175312B2 (ja) * 2004-09-17 2008-11-05 株式会社日立製作所 交通情報予測装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103052964A (zh) * 2010-08-04 2013-04-17 日本电气株式会社 行为特征提取设备、行为特征提取系统、行为特征提取方法以及行为特征提取程序
CN104504245A (zh) * 2014-12-04 2015-04-08 吉林大学 一种应用gps出行调查数据识别出行和活动的方法
CN106227889A (zh) * 2016-08-15 2016-12-14 华云科技有限公司 一种轨迹停留点分析提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于GPS轨迹和照片轨迹的时空数据挖掘;王冠男;《中国博士学位论文全文数据库信息科技辑》;20140315(第03期);全文 *

Also Published As

Publication number Publication date
CN106649709A (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
CN106649709B (zh) 一种基于数据挖掘的车辆停留行为模式预测与评估方法
CN110197588B (zh) 一种基于gps轨迹数据的大货车驾驶行为评估方法及装置
CN108091133B (zh) 一种基于海量交通数据分析的车辆安全驾驶行为分析方法
US9519875B2 (en) Method for determining an expected consumption value of a motor vehicle
US9082072B1 (en) Method for applying usage based data
CN109670970B (zh) 一种驾驶行为评分方法、装置及计算机可读存储介质
CN108556682B (zh) 一种续驶里程预测方法、装置及设备
CN106650157B (zh) 车辆零部件故障发生概率估算方法、装置及系统
CN104850676B (zh) 一种公路桥梁随机车流仿真模拟方法
CN106485919B (zh) 一种判定快速道路定点测速仪对交通事故数量影响的方法
CN109886724B (zh) 一种鲁棒性的居民出行轨迹识别方法
CN110222421B (zh) 一种行驶路线集中度评估方法及系统
CN115691120A (zh) 一种基于高速公路流水数据的拥堵识别方法及系统
CN115422747A (zh) 一种机动车尾气污染物排放量的计算方法和计算装置
CN110264725B (zh) 路段流量的确定方法及装置
CN111680888A (zh) 基于rfid数据确定路网容量的方法
Yu et al. Statistical inference-based research on sampling time of vehicle driving cycle experiments
CN115204755B (zh) 服务区入区率测算方法、装置、电子设备及可读存储介质
CN111121803A (zh) 获取道路常用停靠点的方法及装置
CN116665436A (zh) 一种基于雷达轨迹数据的高速公路交通拥堵度量方法
CN113450592B (zh) 一种基于循环神经网络的停车场占有率预测方法
CN110956808B (zh) 一种基于非全样定位数据的重型货车交通流量预测方法
CN114881676A (zh) 一种新产品销量的预测方法
CN111832599A (zh) 一种基于机器学习随机森林的加油站预测方法
Shen et al. Real-time traffic prediction using GPS data with low sampling rates: a hybrid approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230104

Address after: 100000 046, 2f, No. 17, Zhichun Road, Haidian District, Beijing

Patentee after: Yixian Intelligent Technology Co.,Ltd.

Address before: 100191 No. 37, Haidian District, Beijing, Xueyuan Road

Patentee before: BEIHANG University

TR01 Transfer of patent right