CN112733890A - 一种考虑时空特征的网联车辆轨迹聚类方法 - Google Patents

一种考虑时空特征的网联车辆轨迹聚类方法 Download PDF

Info

Publication number
CN112733890A
CN112733890A CN202011585050.2A CN202011585050A CN112733890A CN 112733890 A CN112733890 A CN 112733890A CN 202011585050 A CN202011585050 A CN 202011585050A CN 112733890 A CN112733890 A CN 112733890A
Authority
CN
China
Prior art keywords
distance
track
calculating
tracks
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011585050.2A
Other languages
English (en)
Inventor
于海洋
方婧
任毅龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202011585050.2A priority Critical patent/CN112733890A/zh
Publication of CN112733890A publication Critical patent/CN112733890A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)

Abstract

本专利公开了一种考虑时空特征的网联车辆轨迹聚类方法,包括步骤一、对轨迹区域内的交叉路口进行编号,根据轨迹通过的路段,将轨迹转化为其经过的交叉口的编号序列;步骤二、计算轨迹间的空间距离、时间距离以及编辑距离;其中所述编辑距离为组成估计的字符串之间的编辑距离;步骤三、根据步骤二计算出的空间距离、时间距离以及编辑距离数据,采用信息量权数法对三个距离的权重系数进行计算,进而求出考虑了时空差异性的综合距离;步骤四、基于聚类对象局部密度和距离对轨迹进行聚类。在考虑轨迹差异性时引入编辑距离的概念,多维度的评估轨迹之间的差异性;且采用一种新型的聚类方法,使得聚类结果更合理。

Description

一种考虑时空特征的网联车辆轨迹聚类方法
技术领域
本发明涉及轨迹聚类技术,具体涉及一种考虑时空特征的网联车辆轨迹聚类方法。
背景技术
近年来,随着通信技术的发展以及网联车辆的增多,越来越多网联车辆的GPS轨迹数据被采集或记录在云端。轨迹数据一般是由多条带有时间戳的位置信息构成的带有时序性的序列,描述的是车辆的移动行为,通过对车辆轨迹数据进行分析,可以挖掘大量的出行信息。
聚类是通过分析数据对象之间的相似性,并把相似性高的数据划分成同一类,通过对车辆的轨迹进行聚类可以获取很多信息,如:通过聚类结果可以分析居民日常出行的热点路径,支撑路网重点通道和路段的判断识别,辅助公交路线的修改和设立等多种有关城市交通规划管理的方面。
传统的聚类算法如Kmeans是以距离作为对象的相似性度量标准,这也是大多数聚类算法所采纳的,而且一般使用欧氏距离做为距离的计算方法,但是仅仅以欧氏距离衡量轨迹之间的差异性并没有考虑轨迹之间的时间特征,因此并不能取得很好的聚类效果。
发明内容
本发明的目的在于提供一种考虑时空特征的网联车辆轨迹聚类方法,以充分考虑影响聚类的各种因素,提高聚类结果的准确性。
为了解决上述问题,本发明提供的技术方案包括:
1.一种考虑时空特征的网联车辆轨迹聚类方法,其特征在于,所述方法包括如下步骤:
步骤一、对轨迹区域内的交叉路口进行编号,根据轨迹通过的路段,将轨迹转化为其经过的交叉口的编号序列;
步骤二、计算轨迹间的空间距离、时间距离以及编辑距离;其中所述编辑距离为组成估计的字符串之间的编辑距离;
步骤三、根据步骤二计算出的空间距离、时间距离以及编辑距离数据,采用信息量权数法对三个距离的权重系数进行计算,进而求出考虑了时空差异性的综合距离;
步骤四、基于聚类对象局部密度和距离对轨迹进行聚类。首先对轨迹数据及其部分特征进行描述与定义。其包括:计算轨迹对象的局部密度ρqi;计算轨迹对象之间的距离δqi;计算轨迹对象的分类标签nqi;根据轨迹对象的局部密度和距离判断聚类中心;将其余轨迹对象根据其分类标签分类到聚类中心的簇当中。
优选地,将每条轨迹作为一个对象,
计算轨迹对象的局部密度
Figure BDA0002864582230000021
其中函数
Figure BDA0002864582230000022
Figure BDA0002864582230000023
参数Dij为轨迹ti和轨迹tj之间的综合距离;参数Dc为截断距离,Dc>0;m个轨迹对象之间的综合距离一共有
Figure BDA0002864582230000024
个,对其进行升序排列,设得到的序列为D1≤D2≤...≤Dnum,取Dc=Df(num*t),其中f(num*t)表示对num*t进行四舍五入后得到的整数,t取0.02;
轨迹对象之间的距离
Figure BDA0002864582230000025
其中,限定
Figure BDA0002864582230000026
表示
Figure BDA0002864582230000027
的一个降序排列下标序,满足
Figure BDA0002864582230000028
Figure BDA0002864582230000029
为轨迹
Figure BDA00028645822300000210
和轨迹
Figure BDA00028645822300000211
间的综合距离;
优选地,定义如下若干记号:nc表示T包含nc个类簇,
Figure BDA00028645822300000212
表示各个聚类中心对应轨迹对象的编号,即
Figure BDA00028645822300000213
为第j个类簇的中心;
Figure BDA00028645822300000214
表示轨迹对象归类属性标记,即ai表示T中第i号轨迹对象归属于第ai个类簇;
Figure BDA00028645822300000215
表示T中距离最远的两个轨迹对象之间的距离;设
Figure BDA0002864582230000031
表示T中所有局部密度比
Figure BDA0002864582230000032
大的轨迹对象中与
Figure BDA0002864582230000033
距离最近的轨迹对象的编号,具体定义为
Figure BDA0002864582230000034
优选地,步骤一中轨迹数据转化为交叉口的编号序列包括如下子步骤:
S11:将轨迹集所在地区的交叉口标定编号集C={1,2,…,n},并记录对应的经纬度坐标为Li,其中i∈C;
S12:设定交叉口范围半径为r,通过遍历轨迹点与交叉口范围进行比较得到轨迹经过的交叉口编号序列。
优选地,所述步骤二中计算轨迹之间空间距离、时间距离以及编辑距离包括如下子步骤:
优选地,计算轨迹间的空间距离,取两条轨迹的起点和终点经纬度坐标,将地球近似看作球形,利用地球半径R与起始点经纬度坐标计算起始点距离之和作为轨迹间的空间距离;
优选地,计算轨迹间的时间距离,计算两条轨迹的开始时间之差作为轨迹间的时间距离;
优选地,计算轨迹间的编辑距离,根据步骤S12所得轨迹的交叉口编号序列计算轨迹间的编辑距离。
优选地,,综合距离的计算包括如下子步骤:
S31:将步骤二中求得的三个距离数据进行归一化处理;
S32:根据三个距离的数据分别计算其平均值
Figure BDA0002864582230000035
为空间距离、
Figure BDA0002864582230000036
为到间距离、
Figure BDA0002864582230000037
为编辑距离;以及每个距离数据之间的标准差Ss,St,Se,计算变异系数
Figure BDA0002864582230000038
Figure BDA0002864582230000039
S33:对变异系数归一化处理,归一化处理的结果作为各距离的权重系数Wi,求得综合距离D=WsDs+WtDt+WeDe
实现本发明目的的技术解决方案为:一种考虑时空特征的网联车辆轨迹聚类方法,包括如下步骤:
S1:对轨迹区域内的交叉路口进行编号,根据轨迹通过的路段,将轨迹转化为其经过的交叉口的编号序列;
S2:计算轨迹间的时间距离、编辑距离以及空间距离;
S3:根据步骤2计算出的三种距离数据,采用信息量权数法对三个距离的权重系数进行计算,进而求出考虑了时空差异性的综合距离;
S4:采用一种考虑聚类对象局部密度和距离的聚类方法对轨迹进行聚类;
进一步,步骤S1中轨迹数据转化为交叉口的编号序列包括如下子步骤:
S11:将轨迹集所在地区的交叉口标定编号集C={c1,c2,…,cn},并记录对应的经纬度坐标为
Figure BDA0002864582230000041
S12:设定交叉口范围半径为r,通过遍历轨迹点与交叉口范围进行比较得到轨迹经过的交叉口编号序列。
进一步,步骤S2中计算轨迹之间空间距离、时间距离以及编辑距离包括如下子步骤:
S21:计算轨迹间的时间距离,计算两条轨迹的开始时间之差作为轨迹间的时间距离;
S22:计算轨迹间的编辑距离,根据步骤S12所得轨迹的交叉口编号序列计算轨迹间的编辑距离。
S23:计算轨迹间的空间距离,取两条轨迹的起点和终点经纬度坐标,将地球近似看作球形,利用地球半径R与起始点经纬度坐标计算起始点距离之和作为轨迹间的空间距离;
进一步,步骤S3中权重系数以及综合距离的计算包括如下子步骤:
S31:将步骤S2中求得的三个距离数据进行归一化处理;
S32:根据三个距离的数据分别计算其熵值Es(空间距离熵值),Et(时间距离熵值),Ee(编辑距离熵值),进而计算差异性系数fs,ft,fe
S33:对差异性系数归一化处理,结果作为距离的权重系数Ws,Wt,We,进一步求得综合距离D=WsDs+WtDt+WeDe
本发明与现有技术相比,其显著优点在于:1)在考虑轨迹差异性时引入编辑距离的概念,多维度的评估轨迹之间的差异性;2)采用一种新型的聚类方法,解决了如Kmeans等传统聚类算法需要设定聚类簇数以及多个阈值的问题。
附图说明
图1为本发明的方法流程示意图
图2为轨迹点转化为交叉口序列示意图
图3为空间距离计算示意图
图4为聚类中心选取示意图
具体实施方式
下面结合附图对本发明进行进一步说明:
本发明的方法流程示意图如图1所示,具体内容如下:
在本实例中的数据有轨迹数据和交叉口数据。轨迹数据由时间间隔几秒的多条数据组成,每条数据包括经纬度坐标,时间等信息,交叉口数据为交叉口的经纬度坐标,这些都是常见的数据。
步骤1:设轨迹数据集为
Figure BDA0002864582230000051
其中集合T共包含m个元素,m即为轨迹数据集包含的轨迹个数,i为变量。根据轨迹数据所在的区域,对该区域的交叉口进行编号标定,设交叉口的编号集为
Figure BDA0002864582230000052
其中集合C共包含n个元素,n即为该区域的交叉口数量,j为变量。记交叉口的经纬度坐标为
Figure BDA0002864582230000053
(cj∈C),交叉口的范围半径为r(r一般取30m),以图2为例,遍历轨迹点,若某轨迹点与编号为Ci的交叉口的距离小于半径r(具体的距离计算方法将在步骤2中给出),则将该交叉口的编号加入该条轨迹的交叉口序列当中,最终每条轨迹将有其对应的交叉口编号序列,如:c1-c4-c5-c6-...-cj(cj∈C)。
步骤2:首先计算轨迹间的时间距离,设两条轨迹的起始时间为time1和time2,则时间距离Dt=|time1-time2|。
编辑距离表示两个字符串之间的差异,具体而言,其为把一个字符串转换为另一个字符串时,所需要的最小编辑操作的次数。由于本专利的交叉口序列也是一组字符串,因此其用于本方法的交叉口序列同样适用。
所述编辑距离中的编辑操作包含替换、插入和删除三种,本方法采用动态规划的方法计算编辑距离,假设两条轨迹的交叉口序列分别为c1-c3-c5-...-ci和c2-c4-c6-...-cj(ci,cj∈C),从第一个字符向后计算(若序列长度不同,则在较短序列后加入空白符并与较长序列长度相同),以de矩阵表示两个序列之间的编辑距离,当编辑操作为替换时,若ci=cj,不需要操作变化,所以de[i,j]=de[i-1,j-1],若ci≠cj,则de[i,j]=de[i-1,j-1]+1;当编辑操作为插入时,易知de[i,j]=de[i-1,j-1]+1;当编辑操作为删除时,同理de[i,j]=de[i-1,j-1]+1。综上所述,编辑距离的计算方法为:
Figure BDA0002864582230000061
最终两条轨迹序列之间的编辑距离用De表示。
编辑距离可以反应两条轨迹序列之间的形状相似性;但是对于两条形状相似的轨迹,编辑距离并不能体现轨迹之间的具体的空间差距大小,因此,本发明引入空间距离来更全面的衡量轨迹之间的空间特征。
最后计算轨迹间的空间距离,设两条轨迹的起始点经纬度坐标分别为O1(lon1,lat1),D1(lon2,lat2),O2(lon3,lat3),D2(lon4,lat4),其中lon表示经度坐标,lat表示维度坐标。精确计算两点A(lona,lata),B(lonb,latb)间的距离方法如下:
设地球半径为R,如图2所示,从A和B两点分别向赤道平面作垂线,垂足分别为C和D;从A点向BD作垂线交BD于E。分别求出AC、BD、CD,再由BE和AE求出AB,算出AB所对圆心角,进而求出弧AB。具体计算公式为:
Figure BDA0002864582230000062
AB2=OA2+OB2-2OA·OBcos∠AOB=2R2(1-cos∠AOB);
Figure BDA0002864582230000071
Figure BDA0002864582230000072
由上述公式求得轨迹间起点距离为do,终点距离为dD,空间距离Ds=dO+dD
需要补充的是,若想更多地考虑轨迹中间部分的空间距离,可以考虑加入轨迹中间的点去计算空间距离,加入几个代表点的距离之和代表空间距离Ds。因为即使轨迹起始点固定,轨迹的形状也有多种情况,加入中间点的距离可以更全面的衡量轨迹之间的空间距离。
步骤3:根据步骤2计算可得各个轨迹之间的空间距离,时间距离和编辑距离数据,进一步地计算三个距离的权重系数。
首先对三个距离数据做归一化处理,归一化的空间距离Ds′、时间距离Dt′和编辑距离De′分别为:
Figure BDA0002864582230000073
定义Dsij′,Dtij′,Deij′分别为轨迹ti和tj之间归一化后的空间距离,时间距离和编辑距离,进一步地计算每个轨迹对象ti的空间距离,时间距离和编辑距离数据占自身的比重系数,定义公式为
Figure BDA0002864582230000074
Figure BDA0002864582230000075
其中psi为轨迹ti空间距离的比重系数,pei为轨迹ti编辑距离的比重系数,pti为轨迹ti时间距离的比重系数。并根据p值计算各个距离的熵值Es=-0.5∑(psi×lnpsi),Et=-0.5∑(pti×lnpti),Ee=-0.5∑(pei×lnpei),其中Es为空间距离的熵值,Ee为编辑距离的熵值,We为时间距离的熵值。
进一步地根据熵值计算差异性系数:fs=1-Es,ft=1-Et,fe=1-Ee,其中,fs为空间距离的差异性系数,fe为编辑距离的差异性系数,ft为时间距离的差异性系数。对差异性系数做归一化处理后的系数作为三个距离的权重系数,即
Figure BDA0002864582230000076
其中Ws为空间距离的权重,We为编辑距离的权重,Wt为时间距离的权重。
进一步地,计算综合距离数据D=WsDs+WtDt+WeDe。进而可以计算轨迹数据集中各个轨迹之间的综合距离。
步骤4:下面对于使用的聚类算法进行具体解释:
首先对轨迹数据及其部分特征进行描述与定义。
对于每条轨迹,若将其作为一个对象,定义其密度:
Figure BDA0002864582230000081
其中函数
Figure BDA0002864582230000082
参数Dij为轨迹ti和轨迹tj之间的综合距离D,可由步骤3求出。参数Dc>0为截断距离,根据上一步计算出的轨迹间的距离,m个轨迹对象之间的综合距离一共有
Figure BDA0002864582230000083
个,对其进行升序排列,设得到的序列为D1≤D2≤...≤Dnum,取Dc=Df(num*t),其中f(num*t)表示对num*t进行四舍五入后得到的整数,t一般取0.02。
进一步地,定义每个轨迹对象的距离δi
Figure BDA0002864582230000084
表示
Figure BDA0002864582230000085
的一个降序排列下标序,即满足
Figure BDA0002864582230000086
则定义
Figure BDA0002864582230000087
其中
Figure BDA0002864582230000088
即为步骤3中计算的轨迹
Figure BDA0002864582230000089
和轨迹
Figure BDA00028645822300000810
间的综合距离。
进一步地,定义如下若干记号:nc表示T包含nc个类簇,
Figure BDA00028645822300000811
表示各个聚类中心对应轨迹对象的编号,即
Figure BDA00028645822300000812
为第j个类簇的中心;
Figure BDA00028645822300000813
表示轨迹对象归类属性标记,即ai表示T中第i号轨迹对象归属于第ai个类簇;
Figure BDA00028645822300000814
表示T中距离最远的两个轨迹对象之间的距离;设
Figure BDA00028645822300000815
表示T中所有局部密度比
Figure BDA00028645822300000816
大的轨迹对象中与
Figure BDA00028645822300000817
距离最近的轨迹对象的编号,具体定义为
Figure BDA0002864582230000091
进一步地,给出聚类算法的完整具体步骤:
Step1:计算综合距离Dij,并令Dji=Dij,i<j,i,j∈IT
Step2:计算截断距离Dc
Step3:计算
Figure BDA0002864582230000092
并生成其降序排列下标序
Figure BDA0002864582230000093
Step4:计算
Figure BDA0002864582230000094
Figure BDA0002864582230000095
Step5:令ni=0(i=1,2,...,m),i=2。
Step6:令
Figure BDA0002864582230000096
j=1。
Step7:如果
Figure BDA0002864582230000097
Step8:令j=j+1,如果j≤i-1,返回Step7,否则执行Step9。
Step9:令i=i+1,如果i≤N,返回Step6,否则执行Step10。
Step10:
Figure BDA0002864582230000098
Step11:以ρ和δ为坐标轴建立坐标系,选取同时具有较大ρ值和δ值的对象作为聚类中心,以图4为例,轨迹t4、t6、t10、t11即可作为聚类中心点。
Step12:初始化轨迹对象归类属性标记
Figure BDA0002864582230000099
若ti归属于第k个类簇,则ai=k,非聚类中心的ai=-1。
Step13:令i=1。
Step14:如果
Figure BDA00028645822300000910
Figure BDA00028645822300000911
Step15:令i=i+1,如果i≤N,返回Step14,否则结束。
至此,聚类算法介绍完成,
Figure BDA00028645822300000912
记录聚类中心,
Figure BDA00028645822300000913
记录每个轨迹对象的类簇归属。

Claims (5)

1.一种考虑时空特征的网联车辆轨迹聚类方法,其特征在于,所述方法包括如下步骤:
步骤一、对轨迹区域内的交叉路口进行编号,根据轨迹通过的路段,将轨迹转化为其经过的交叉口的编号序列;
步骤二、计算轨迹间的空间距离、时间距离以及编辑距离;其中所述编辑距离为组成估计的字符串之间的编辑距离;
步骤三、根据步骤二计算出的空间距离、时间距离以及编辑距离数据,采用信息量权数法对三个距离的权重系数进行计算,进而求出考虑了时空差异性的综合距离;
步骤四、基于聚类对象局部密度和距离对轨迹进行聚类。首先对轨迹数据及其部分特征进行描述与定义。其包括:计算轨迹对象的局部密度ρqi;计算轨迹对象之间的距离δqi;计算轨迹对象的分类标签nqi;根据轨迹对象的局部密度和距离判断聚类中心;将其余轨迹对象根据其分类标签分类到聚类中心的簇当中。
2.根据权利要求1所述的一种考虑时空特征的网联车辆轨迹聚类方法,其特征在于,将每条轨迹作为一个对象,
计算轨迹对象的局部密度
Figure FDA0002864582220000011
其中函数
Figure FDA0002864582220000012
Figure FDA0002864582220000013
参数Dij为轨迹ti和轨迹tj之间的综合距离;参数Dc为截断距离,Dc>0;m个轨迹对象之间的综合距离一共有
Figure FDA0002864582220000014
个,对其进行升序排列,设得到的序列为D1≤D2≤...≤Dnum,取Dc=Df(num*t),其中f(num*t)表示对num*t进行四舍五入后得到的整数,t取0.02;
轨迹对象之间的距离
Figure FDA0002864582220000015
其中,限定
Figure FDA0002864582220000016
表示
Figure FDA0002864582220000017
的一个降序排列下标序,满足
Figure FDA0002864582220000018
Figure FDA0002864582220000019
为轨迹
Figure FDA00028645822200000110
和轨迹
Figure FDA00028645822200000111
间的综合距离;
进一步地,定义如下若干记号:nc表示T包含nc个类簇,
Figure FDA00028645822200000112
表示各个聚类中心对应轨迹对象的编号,即
Figure FDA00028645822200000113
为第j个类簇的中心;
Figure FDA00028645822200000114
表示轨迹对象归类属性标记,即ai表示T中第i号轨迹对象归属于第ai个类簇;
Figure FDA0002864582220000021
表示T中距离最远的两个轨迹对象之间的距离;设
Figure FDA0002864582220000022
表示T中所有局部密度比
Figure FDA0002864582220000023
大的轨迹对象中与
Figure FDA0002864582220000024
距离最近的轨迹对象的编号,具体定义为
Figure FDA0002864582220000025
3.根据权利要求1或2所述的一种考虑时空特征的网联车辆轨迹聚类方法,其特征在于,
步骤一中轨迹数据转化为交叉口的编号序列包括如下子步骤:
S11:将轨迹集所在地区的交叉口标定编号集C={1,2,…,n},并记录对应的经纬度坐标为Li,其中i∈C;
S12:设定交叉口范围半径为r,通过遍历轨迹点与交叉口范围进行比较得到轨迹经过的交叉口编号序列。
4.根据权利要求3所述的一种考虑时空特征的网联车辆轨迹聚类方法,其特征在于,所述步骤二中计算轨迹之间空间距离、时间距离以及编辑距离包括如下子步骤:
S21:计算轨迹间的空间距离,取两条轨迹的起点和终点经纬度坐标,将地球近似看作球形,利用地球半径R与起始点经纬度坐标计算起始点距离之和作为轨迹间的空间距离;
S22:计算轨迹间的时间距离,计算两条轨迹的开始时间之差作为轨迹间的时间距离;
S23:计算轨迹间的编辑距离,根据步骤S12所得轨迹的交叉口编号序列计算轨迹间的编辑距离。
5.根据权利要求4所述的一种考虑时空特征的网联车辆轨迹聚类方法,其特征在于,综合距离的计算包括如下子步骤:
S31:将步骤二中求得的三个距离数据进行归一化处理;
S32:根据三个距离的数据分别计算其平均值
Figure FDA0002864582220000031
为空间距离、
Figure FDA0002864582220000032
为到间距离、
Figure FDA0002864582220000033
为编辑距离;以及每个距离数据之间的标准差Ss,St,Se,计算变异系数
Figure FDA0002864582220000034
Figure FDA0002864582220000035
S33:对变异系数归一化处理,归一化处理的结果作为各距离的权重系数Wi,求得综合距离D=WsDs+WtDt+WeDe
CN202011585050.2A 2020-12-28 2020-12-28 一种考虑时空特征的网联车辆轨迹聚类方法 Pending CN112733890A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011585050.2A CN112733890A (zh) 2020-12-28 2020-12-28 一种考虑时空特征的网联车辆轨迹聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011585050.2A CN112733890A (zh) 2020-12-28 2020-12-28 一种考虑时空特征的网联车辆轨迹聚类方法

Publications (1)

Publication Number Publication Date
CN112733890A true CN112733890A (zh) 2021-04-30

Family

ID=75606794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011585050.2A Pending CN112733890A (zh) 2020-12-28 2020-12-28 一种考虑时空特征的网联车辆轨迹聚类方法

Country Status (1)

Country Link
CN (1) CN112733890A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114757355A (zh) * 2022-04-08 2022-07-15 中国科学技术大学 轨迹数据集差异性度量方法、系统、设备及存储介质
WO2023201938A1 (zh) * 2022-04-22 2023-10-26 南京邮电大学 缺失轨迹填补方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339716A (zh) * 2016-08-16 2017-01-18 浙江工业大学 一种基于加权欧氏距离的移动轨迹相似度匹配方法
CN109242024A (zh) * 2018-09-13 2019-01-18 中南大学 一种基于卡口数据的车辆行为相似度计算方法
CN111125189A (zh) * 2019-12-12 2020-05-08 四川大学 基于加权实数代价编辑距离的轨迹相似性度量方法
CN111930791A (zh) * 2020-05-28 2020-11-13 中南大学 一种车辆轨迹的相似度计算方法、系统及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339716A (zh) * 2016-08-16 2017-01-18 浙江工业大学 一种基于加权欧氏距离的移动轨迹相似度匹配方法
CN109242024A (zh) * 2018-09-13 2019-01-18 中南大学 一种基于卡口数据的车辆行为相似度计算方法
CN111125189A (zh) * 2019-12-12 2020-05-08 四川大学 基于加权实数代价编辑距离的轨迹相似性度量方法
CN111930791A (zh) * 2020-05-28 2020-11-13 中南大学 一种车辆轨迹的相似度计算方法、系统及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ALEX RODRIGUEZ 等: "Clustering by fast search and find of density peaks", 《SCIENCE》 *
FAGUI LIU 等: "Adaptive density trajectory cluster based on time and space distance", 《WWW.ELSEVIER.COM/LOACTE/PHYSA》 *
朱进: "基于运动特征的轨迹相似性度量研究", 《中国知网》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114757355A (zh) * 2022-04-08 2022-07-15 中国科学技术大学 轨迹数据集差异性度量方法、系统、设备及存储介质
CN114757355B (zh) * 2022-04-08 2024-04-02 中国科学技术大学 轨迹数据集差异性度量方法、系统、设备及存储介质
WO2023201938A1 (zh) * 2022-04-22 2023-10-26 南京邮电大学 缺失轨迹填补方法及系统

Similar Documents

Publication Publication Date Title
CN109670277B (zh) 一种基于多模态数据融合与多模型集成的旅行时间预测方法
CN108596202B (zh) 基于移动终端gps定位数据计算个人通勤时间的方法
CN109544914B (zh) 一种基于历史gps轨迹的共享单车逆行行为识别方法
CN108427965A (zh) 一种基于路网聚类的热点区域挖掘方法
CN111652520B (zh) 一种基于大数据的路面养护智能决策系统及方法
CN112733890A (zh) 一种考虑时空特征的网联车辆轨迹聚类方法
CN110929939B (zh) 一种基于聚类-信息量耦合模型下的滑坡灾害易发性空间预测方法
CN113159364A (zh) 一种大型交通场站的客流预测方法及系统
CN110162997B (zh) 基于插值点的匿名隐私保护方法
CN108961758A (zh) 一种基于梯度提升决策树的路口展宽车道探测方法
CN104794496A (zh) 一种改进mRMR算法的遥感特征优选算法
CN113436433B (zh) 一种高效的城市交通离群值检测方法
CN114299742B (zh) 一种高速公路的限速信息动态识别与更新推荐方法
Chen et al. Discrimination and prediction of traffic congestion states of urban road network based on spatio-temporal correlation
CN116628455A (zh) 一种城市交通碳排放监测与决策支持方法及系统
CN108171365B (zh) 一种基于改进svm算法的交通状态预测方法
CN116010838A (zh) 一种融合密度值和K-means算法的车辆轨迹聚类方法
CN116739376A (zh) 一种基于数据挖掘的公路路面预防性养护决策方法
CN115168900A (zh) 一种用于智慧交通系统的轨迹数据隐私保护方法及系统
CN115269758A (zh) 面向乘客诱导的路网客流状态推演方法及系统
CN109147322B (zh) 一种城市交通大数据处理中多源数据自适应融合方法
CN110909792A (zh) 一种基于改进K-means算法和新聚类有效性指标的聚类分析方法
CN111123333B (zh) 一种融合卡口和gps数据的车辆轨迹定位方法
CN102880881A (zh) 一种基于二类支持向量机和遗传算法的轿车车型识别方法
CN115565376B (zh) 融合graph2vec、双层LSTM的车辆行程时间预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210430

RJ01 Rejection of invention patent application after publication