CN112749743B - 一种轨迹时空聚类方法、系统以及存储装置 - Google Patents

一种轨迹时空聚类方法、系统以及存储装置 Download PDF

Info

Publication number
CN112749743B
CN112749743B CN202110004197.6A CN202110004197A CN112749743B CN 112749743 B CN112749743 B CN 112749743B CN 202110004197 A CN202110004197 A CN 202110004197A CN 112749743 B CN112749743 B CN 112749743B
Authority
CN
China
Prior art keywords
similarity
track
sequence
neighborhood
tracks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110004197.6A
Other languages
English (en)
Other versions
CN112749743A (zh
Inventor
李萌
张珂
郭娅明
林犀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110004197.6A priority Critical patent/CN112749743B/zh
Publication of CN112749743A publication Critical patent/CN112749743A/zh
Application granted granted Critical
Publication of CN112749743B publication Critical patent/CN112749743B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种融合路段与方向角信息的轨迹时空聚类方法,该方法包括:获取交通数据,所述数据包括多条轨迹的轨迹坐标序列、旅行时间序列、方向角序列、路段ID序列;利用一条轨迹的邻域内轨迹的数量、轨迹坐标序列间的距离计算不同轨迹的坐标序列之间的相似度;根据轨迹上的方向角序列之间的距离、角度差计算方向角的相似度;利用Jaccard相似性系数计算路段ID的相似度;将满足第一预定数量的且与一轨迹的相似度低于第一预定阈值的轨迹进行聚类,并将满足第二预定数量的且与所述聚类的轨迹的相似度低于第二预定阈值的轨迹进行聚类;输出轨迹聚类结果。通过本发明,能够更准确的对轨迹进行聚类。

Description

一种轨迹时空聚类方法、系统以及存储装置
技术领域
本发明涉及智能交通技术、数据处理技术领域,尤其涉及一种融合路段与方向角信息的轨迹时空聚类方法、系统以及存储装置。
背景技术
车辆轨迹聚类是智能交通系统(ITS)不可或缺的组成部分,它主要是研究轨迹的相似性并将车辆轨迹分为具有相同特征的几个集群。聚类已被广泛应用于交通状况监控,交通流分析和路线推荐等。例如从轨迹聚类中发现主要的乘客运动模式可以帮助导航软件向驾驶员推荐更合适的路线。在过去的几十年中,研究者们已经提出了许多聚类算法,最有代表性的算法是K-Means,它可以迭代地计算质心,并将观测结果划分为k个不同的聚类。但是该算法容易得到局部最优值,并且对噪声和离群值比较敏感。基于密度的两种典型的算法是DBSCAN和OPTICS算法。DBSCAN通过计算围绕该点的指定半径区域中的点数来获得与该点关联的密度。OPTICS与DBSCAN相似,不过OPTICS能够更好的处理不同密度的群集。
先前的研究主要是对点进行聚类,而忽略了时间信息。时空聚类近年来引起了广泛关注,其目的是从数据集中提取重要的信息,并根据对象的时空相似性对其进行分组。例如DBSCAN的扩展算法:时空DBSCAN,该算法首先计算对象之间的空间,时间和属性距离,将簇定义为密度相连的点的最大集合,然后根据时空密度定义了密度因子来划分为簇,并且该算法可以在噪声的空间数据库中发现任意形状的聚类。但是该算法的聚类结果对参数的取值非常敏感,不同的取值将产生不同的聚类结果。ST-OPTICS能够克服这个局限性,该算法并不直接产生结果类簇,而是生成一个增广的簇排序,该排序代表了各样本点基于密度的聚类结构。所以该算法通过保留时域邻居及其对应的时空值来连接数据。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的技术方案。因此,本发明的一个方面,提供了一种融合路段与方向角信息的轨迹时空聚类方法,该方法包括:
获取交通数据,所述数据包括多条轨迹的轨迹坐标序列、旅行时间序列、方向角序列、路段ID序列;
利用一条轨迹的邻域内的轨迹的数量、轨迹坐标序列间的距离计算不同轨迹的坐标序列之间的相似度;
根据轨迹上的方向角序列之间的距离、角度差计算方向角的相似度;
利用Jaccard相似性系数计算路段ID的相似度;
将满足第一预定数量的且与一轨迹的相似度低于第一预定阈值的轨迹进行聚类,并将满足第二预定数量的且与所述聚类的轨迹的相似度低于第二预定阈值的轨迹进行聚类;
输出轨迹聚类结果。
可选的,设与/>为两条不同的轨迹数据,其中N1和N2分别是轨迹Mp和Mq的长度,/>即为/>x为横坐标序列,y为纵坐标序列,t为旅行时间序列,θ为方向角序列,r为路段ID序列。
可选的,利用DTW函数计算轨迹坐标的相似度,包括:
通过匹配Mp和Mq构造路径矩阵矩阵元素的计算公式如下:
其中表示两条轨迹的特征之间的相似度,计算公式如下:
可选的,利用DTW函数计算方向角的相似度,包括:
其中表示两组方向角之间的相似度,计算公式如下:
可选的,利用公式来计算路段ID的相似度。
可选的,根据相似度利用改进的ST-OPTICS算法进行轨迹聚类,包括:从第一个对象Mp开始,在Eps距离内检索其他对象,如果这些对象的总数大于预定值,则创建一个新的群集,所述群集包括对象Mp、Eps距离内的其他对象。
可选的,根据相似度利用改进的ST-OPTICS算法进行轨迹聚类,包括:基于轨迹坐标、方向角的相似度以及路段ID的相似度以及基于旅行时间确定每个对象Mp的邻域;
根据Mp的邻域以及邻域内最少对象数量的限制得到核心对象集;
取出核心对象集中未处理的对象Mp,根据其邻域获取对象Mp的邻域集G1,然后将Mp输出到有序列表W中;
将所述邻域集G1的数量与最少对象数量的限制值进行比较,如果大于最少对象数量的限制值,则将种子集合初始化为空的队列,计算邻域集G1中每个未处理的对象Mq与Mp的可达距离,并根据可达距离按顺序将Mq插入到种子集合中;
对于种子集合中每个未处理的对象Mq,根据其邻域获取对象Mq的邻域集G2,计算邻域集G2中每个未处理的对象Mq与Mp的可达距离,并根据可达距离按顺序将Mp插入到有序列表W中。
可选的,根据相似度利用改进的ST-OPTICS算法进行轨迹聚类,包括:
按顺序从有序列表W中取出元素,直到所有元素被取出;
根据有序列表W计算每个对象所属的类别。
本发明还提供一种存储有计算机程序的存储装置,所述计算机程序执行下述步骤:
获取交通数据,所述数据包括多条轨迹的轨迹坐标序列、旅行时间序列、方向角序列、路段ID序列;
利用一条轨迹的邻域内的轨迹的数量、轨迹坐标序列间的距离计算不同轨迹的坐标序列之间的相似度;
根据轨迹上的方向角序列之间的距离、角度差计算方向角的相似度;
利用Jaccard相似性系数计算路段ID的相似度;
将满足第一预定数量的且与一轨迹的相似度低于第一预定阈值的轨迹进行聚类,并将满足第二预定数量的且与所述聚类的轨迹的相似度低于第二预定阈值的轨迹进行聚类;
输出轨迹聚类结果。
本发明还提供一种融合路段与方向角信息的轨迹时空聚类系统,该系统包括:
数据获取模块,用于获取交通数据,所述数据包括多条轨迹的轨迹坐标序列、旅行时间序列、方向角序列、路段ID序列;
第一相似度计算模块,用于利用一条轨迹的邻域内的轨迹的数量、轨迹坐标序列间的距离计算不同轨迹的坐标序列之间的相似度;
第二相似度计算模块,用于根据轨迹上的方向角序列之间的距离、角度差计算方向角的相似度;
第三相似度计算模块,用于利用Jaccard相似性系数计算路段ID的相似度;轨迹聚类模块,用于将满足第一预定数量的且与一轨迹的相似度低于第一预定阈值的轨迹进行聚类,并将满足第二预定数量的且与所述聚类的轨迹的相似度低于第二预定阈值的轨迹进行聚类;
轨迹聚类输出模块,用于输出轨迹聚类结果。
本申请实施例中提供的技术方案,基于轨迹位置,方向角,行驶时间和路段ID提出了一种新的车辆行驶轨迹的聚类模型,能够耦合利用时空数据,该方法。可以更准确的对轨迹进行聚类
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述技术方案和其目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明提出的融合路段与方向角信息的轨迹时空聚类方法的流程图;
图2示出了进行轨迹聚类的具体过程。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明的一个方面,提供了一种融合路段与方向角信息的轨迹时空聚类方法,如图1所示,该方法包括:
S1.获取交通数据,所述数据包括多条轨迹的轨迹坐标序列、旅行时间序列、方向角序列、路段ID序列;
S2.利用一条轨迹的邻域内轨迹的数量、轨迹坐标序列间的距离计算不同轨迹的坐标序列之间的相似度;
S3.根据轨迹上的方向角序列之间的距离、角度差计算方向角的相似度;
S4.利用Jaccard相似性系数计算路段ID的相似度;
S5.将满足第一预定数量的且与一轨迹的相似度低于第一预定阈值的轨迹进行聚类,并将满足第二预定数量的且与所述聚类的轨迹的相似度低于第二预定阈值的轨迹进行聚类;
S6.输出轨迹聚类结果。
上面给各步骤编号,数字不代表之间前后顺序关系,仅仅是为了下面方便说明。
在步骤S1中,输入的交通数据的形式为包括轨迹横坐标序列x,纵坐标序列y,旅行时间序列t,方向角序列θ,路段ID序列r;利用/>表示第p条轨迹,其中N是轨迹的长度,P是轨迹数量,/>即为/>将轨迹数据的时空信息以矩阵的形式表达。
步骤S2-S4进行相似度运算,步骤S5进行轨迹聚类,这些步骤为本发明的关键步骤。
在S2-S4中,本发明进行了轨迹坐标序列,方向角序列,路段ID序列的相似度建模。根据不同的轨迹信息,对于轨迹表示和距离度量存在多种相似度计算方法。
虽然轨迹起点和终点都在预定边界附近,但轨迹无法保持相同的长度和旅行时间,又由于传统方法通常需要相同的长度,因此难以计算轨迹之间的相似度。利用动态时间调整函数(DTW)进行相似度建模。通过压缩,拉伸和匹配轨迹,该方法可以有效地解决两条变长轨迹之间的相似度计算问题。
下面具体说明对轨迹坐标序列的相似度的建模和运算。
S2-1:设与/>两条不同的轨迹,其中N1和N2分别是轨迹Mp和Mq的长度;
S2-2:下边通过匹配Mp和Mq构造路径矩阵矩阵元素的计算公式如下:
其中表示两组轨迹特征之间的相似度,计算公式如下:
在步骤S3中,计算方向角的相似度。同S2-1,这里利用DTW刻画方向角的相似度。计算公式如下:
其中表示两组方向角之间的相似度,计算公式如下:
在步骤S4中,计算路段ID的相似度。这里采用Jaccard相似度函数,计算公式如下:
在步骤S5中,从第一个对象Mp开始,在Eps距离内检索其他对象,如果这些对象的总数大于预定值,则创建一个新的群集,所述群集包括对象Mp、Eps距离内的其他对象。步骤S5具体可包括下述过程:
基于轨迹坐标、方向角的相似度以及路段ID的相似度以及基于旅行时间确定每个对象Mp的邻域;
根据Mp的邻域以及邻域内最少对象数量的限制得到核心对象集;
取出核心对象集中未处理的对象Mp,根据其邻域获取对象Mp的邻域集G1,然后将Mp输出到有序列表W中;
将所述邻域集G1的数量与最少对象数量的限制值进行比较,如果大于最少对象数量的限制值,则将种子集合初始化为空的队列,计算邻域集G1中每个未处理的对象Mq与Mp的可达距离,并根据可达距离按顺序将Mq插入到种子集合中,如果已经处理,更新该对象的可达距离。
对于种子集合中每个未处理的对象Mq,根据其邻域获取对象Mq的邻域集G2,计算邻域集G2中每个未处理的对象Mq与Mp的可达距离,并根据可达距离按顺序将Mq插入到有序列表W中,根据有序列表W确定每个对象所属的类别,如果已经处理,就更新该对象的可达距离。
按顺序从有序列表W中取出元素,直到所有元素被取出。
轨迹聚类方法关键是如何量化由多个点组成的车辆轨迹之间的相似度。轨迹聚类以零散点(例如经度和纬度)为聚类样本来研究车辆的轨迹特性。现有技术很少有利用方向角和路段ID的时空聚类方法。本发明提出了改进的ST-OPTICS算法,该算法利用方向角和路段信息等多维轨迹信息来提高聚类效果。该算法是一种基于密度的聚类算法,可以将密度足够大的区域划分为聚类。
作为一种优选实施方式,利用改进的ST-OPTICS算法进行轨迹聚类,目的是聚类中相邻对象的属性值相似。它具有五个基本参数来描述样本分布的紧密程度:轨迹空间阈值ε1,时间阈值ε2,方向角相似性阈值ε3,路段相似性阈值ε4和数量MinPts,该数量表示阈值邻域中的轨迹数。
如图2所示,过程大致包括:
S51.定义ST-OPTICS算法中的基本概念;
S52.获取核心对象集中的每个对象Mp的邻域G1,对邻域G1中的每个未处理的对象Mq进行处理;
S531.如果可达距离rd(Mp,Mq)没有定义则进行计算,并根据可达距离插入到种子集合中;
S532.否则,更新该点的可达距离;
S54.获取种子集合中的每个对象Mq的邻域G2,对邻域中的每个未处理的对象Mz进行处理;
S551.如果可达距离没有定义则进行计算,并根据可达距离插入到有序列表W中;
S552.否则更新该点的可达距离;
S56.根据有序列表W计算每个对象所属的类别。
最后进行步骤S6.输出轨迹聚类结果。
下面是具体过程:
S5-1:改进的ST-OPTICS算法中使用的一些基本概念定义如下。
S5-1-1:Eps邻域。基于轨迹坐标相似度的Eps邻域被定义为
属于Eps邻域的轨迹的数量表示为/>与基于方向角/>的Eps邻域相同,旅行时间/>路段/>最后,将总Eps邻域/>定义为这四个邻域的交集;
S5-1-2:核心对象。如果Mp的Eps邻域至少包含MinPts条轨迹,则Mp是核心对象;
S5-1-3:密度直接可达。如果Mq是核心对象并且Mp在Eps邻域内,则对象Mp可称为是从对象Mq密度直接可达;
S5-1-4:密度可达。称对象Mp相对于Mq是密度可达的,如果Mq是核心对象并且Mq包含在Eps邻域中;
S5-1-5:密度连接。称对象Mp相对于Mq是密度连接的,如果存在对象Mk使得对象Mp,Mq相对于Mk是密度可达的;
S5-1-6:基于密度的群集。群集C满足两个要求:(1)Mp,Mq:若Mq属于集合C并且Mp是从Mq密度可达的,那么Mp属于C.(2)/>Mp,Mq∈C:Mp是从Mq密度连接的;
S5-1-7:核心距离cd(Mp)。记MinPts_distance(Mp)为从Mp到其最近的MinPts邻居的距离。对象Mp相对于Eps和MinPts的核心距离定义如下:
S5-1-8:可达距离rd(Mp,Mq)。在对象Mq是核心对象的前提下,对象Mp到Mq的可达距离是使得Mp从Mq直接密度可达的最小距离,计算公式如下所示:
S5-2:该算法从第一个对象Mp开始,并在Eps距离内检索对象Mp的所有邻居。如果这些邻居的总数大于MinPts并且Mp是核心对象,则会创建一个新的群集。对象Mp及其邻居被分配到此新群集中。然后,迭代处理距核心对象Eps距离内的邻居。处理完所有对象后,则过程结束。具体计算过程如下所示:
S5-2-1:输入在S2部分计算得到的相似度矩阵Dxy(Mp,Mq),Dθ(Mp,Mq)和Dr(Mp,Mq);
S5-2-2:根据Eps邻域以及每个邻域最少元素数量的限制得到核心对象集;
S5-2-3:如果核心对象中所有对象都已被处理,则到S3-2-9。否则取出核心对象集中未处理的对象Mp并标记为处理,然后根据邻域得到对象Mp的邻域集G1,然后将Mp输出到有序列表W中。
S5-2-4:如果G1集合个数大于MinPts,则进行S3-2-5到S3-2-8的运算,否则回到S3-2-3;
S5-2-5:将种子集合初始化为空的排队序列。对于邻居集合G1每个未处理的对象Mq,如果可达距离rd(Mp,Mq)没有定义,则计算可达距离rd(Mp,Mq),并根据可达距离的大小按从小到大将Mq插入种子集合中。如果该对象已经在有序队列中且新的可达距离较小,则更新该点的可达距离;
S5-2-6:如果种子对象中所有对象都已被处理,则到S3-2-3。对于种子集合中每个未处理的对象Mq,根据邻域获取对象Mq的邻居集合G2,然后将Mq标记为已处理,并根据可达距离的大小按从小到大将Mq插入有序列表W中;
S5-2-7:如果G2集合个数大于MinPts,则进行S3-2-8的运算,否则回到S3-2-6;
S5-2-8:对于邻居集合G2每个未处理的对象Mz,如果可达距离rd(Mp,Mz)没有定义,则计算可达距离rd(Mp,Mz),并根据可达距离的大小按从小到大将Mq插入种子集合中。如果该对象已经在有序队列中且新的可达距离较小,则更新该对象的可达距离。计算完毕后回到步骤S3-2-7;
S5-2-9:根据有序列表W计算每个对象所属的类别;
S5-2-10:按照类别输出所述对象,如果有序列表W所有元素都被取出,则到步骤S-2-11;否则从有序列表W中按顺序取出对象,如果该对象的可达距离不大于给定半径Eps,则该点属于当前类别;
S5-2-11:如果该对象的核心距离大于给定半径Eps,则该点为噪声,可以忽略,否则该对象属于新的聚类,回到步骤S3-2-9;
S5-2-12:有序队列W遍历结束,则算法结束。
在上述方法的基础上,本发明还提供一种存储有计算机程序的存储装置,所述计算机程序执行下述步骤:
获取交通数据,所述数据包括多条轨迹的轨迹坐标序列、旅行时间序列、方向角序列、路段ID序列;
利用一条轨迹的邻域内的轨迹的数量、轨迹坐标序列间的距离计算不同轨迹的坐标序列之间的相似度;
根据轨迹上的方向角序列之间的距离、角度差计算方向角的相似度;
利用Jaccard相似性系数计算路段ID的相似度;
将满足第一预定数量的且与一轨迹的相似度低于第一预定阈值的轨迹进行聚类,并将满足第二预定数量的且与所述聚类的轨迹的相似度低于第二预定阈值的轨迹进行聚类;
输出轨迹聚类结果。
本发明提供一种融合路段与方向角信息的轨迹时空聚类系统,该系统包括:
数据获取模块,用于获取交通数据,所述数据包括多条轨迹的轨迹坐标序列、旅行时间序列、方向角序列、路段ID序列;
第一相似度计算模块,用于利用一条轨迹的邻域内的轨迹的数量、轨迹坐标序列间的距离计算不同轨迹的坐标序列之间的相似度;
第二相似度计算模块,用于根据轨迹上的方向角序列之间的距离、角度差计算方向角的相似度;
第三相似度计算模块,用于利用Jaccard相似性系数计算路段ID的相似度;
轨迹聚类模块,用于将满足第一预定数量的且与一轨迹的相似度低于第一预定阈值的轨迹进行聚类,并将满足第二预定数量的且与所述聚类的轨迹的相似度低于第二预定阈值的轨迹进行聚类;
轨迹聚类输出模块,用于输出轨迹聚类结果。
本申请实施例中提供的技术方案,基于轨迹位置,方向角,行驶时间和路段ID提出了一种新的车辆行驶轨迹的聚类模型,能够耦合利用时空数据,该方法可以更准确的对轨迹进行聚类。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。

Claims (7)

1.一种轨迹时空聚类方法,其特征在于,该方法包括:
获取交通数据,所述交通数据包括多条轨迹的轨迹坐标序列、旅行时间序列、方向角序列、路段ID序列,设与/>为两条不同的轨迹数据,其中N1和N2分别是轨迹Mp和Mq的长度,/>即为/>x为横坐标序列,y为纵坐标序列,t为旅行时间序列,θ为方向角序列,r为路段ID序列;
利用一条轨迹的邻域内轨迹的数量、轨迹坐标序列间的距离计算不同轨迹的坐标序列之间的相似度;
根据轨迹上的方向角序列之间的距离、角度差计算方向角的相似度;
利用Jaccard相似性系数计算路段ID的相似度;
根据相似度利用改进的ST-OPTICS算法进行轨迹聚类,具体包括:
基于轨迹坐标、方向角的相似度以及路段ID的相似度以及基于旅行时间确定每个对象Mp的邻域;根据Mp的邻域以及邻域内最少对象数量的限制值得到核心对象集;取出核心对象集中未处理的对象Mq,根据其邻域获取对象Mp的邻域集G1,然后将Mp输出到有序列表W中;将所述邻域集G1的数量与最少对象数量的限制值进行比较,如果大于最少对象数量的限制值,则将种子集合初始化为空的队列,计算邻域集G1中每个未处理的对象Mq与Mp的可达距离,并根据可达距离按顺序将Mq插入到种子集合中;对于种子集合中每个未处理的对象Mq,根据其邻域获取对象Mq的邻域集G2,计算邻域集G2中每个未处理的对象Mq与Mp的可达距离,并根据可达距离按顺序将Mq插入到有序列表W中;按顺序从有序列表W中取出元素,直到所有元素被取出;根据有序列表W计算每个对象所属的类别;
输出轨迹聚类结果。
2.根据权利要求1所述的轨迹时空聚类方法,其特征还在于,利用DTW函数计算轨迹坐标的相似度,包括:
通过匹配Mp和Mq构造路径矩阵矩阵元素的计算公式如下:
其中表示两条轨迹的特征之间的相似度,计算公式如下:
3.根据权利要求1所述的轨迹时空聚类方法,其特征还在于,
利用DTW函数计算方向角的相似度,包括:
其中表示两组方向角之间的相似度,计算公式如下:
4.根据权利要求1所述的轨迹时空聚类方法,其特征还在于,利用公式来计算路段ID的相似度。
5.根据权利要求1所述的轨迹时空聚类方法,其特征还在于,根据相似度利用改进的ST-OPTICS算法进行轨迹聚类,包括:
从第一个对象Mp开始,在Eps距离内检索其他对象,如果这些对象的总数大于预定值,则创建一个新的群集,所述群集包括对象Mp、Eps距离内的其他对象。
6.一种存储有计算机程序的存储装置,所述计算机程序执行下述步骤:获取交通数据,所述数据包括多条轨迹的轨迹坐标序列、旅行时间序列、方向角序列、路段ID序列,
与/>为两条不同的轨迹数据,其中N1和N2分别是轨迹Mp和Mq的长度,/>即为/>x为横坐标序列,y为纵坐标序列,t为旅行时间序列,θ为方向角序列,r为路段ID序列;利用一条轨迹的邻域内的轨迹的数量、轨迹坐标序列间的距离计算不同轨迹的坐标序列之间的相似度;
根据轨迹上的方向角序列之间的距离、角度差计算方向角的相似度;
利用Jaccard相似性系数计算路段ID的相似度;
根据相似度利用改进的ST-OPTICS算法进行轨迹聚类,具体包括:
基于轨迹坐标、方向角的相似度以及路段ID的相似度以及基于旅行时间确定每个对象Mp的邻域;根据Mp的邻域以及邻域内最少对象数量的限制值得到核心对象集;取出核心对象集中未处理的对象Mq,根据其邻域获取对象Mp的邻域集G1,然后将Mp输出到有序列表W中;将所述邻域集G1的数量与最少对象数量的限制值进行比较,如果大于最少对象数量的限制值,则将种子集合初始化为空的队列,计算邻域集G1中每个未处理的对象Mq与Mp的可达距离,并根据可达距离按顺序将Mq插入到种子集合中;对于种子集合中每个未处理的对象Mq,根据其邻域获取对象Mq的邻域集Ga,计算邻域集G2中每个未处理的对象Mq与Mp的可达距离,并根据可达距离按顺序将Mq插入到有序列表W中;按顺序从有序列表W中取出元素,直到所有元素被取出;根据有序列表W计算每个对象所属的类别;
输出轨迹聚类结果。
7.一种轨迹时空聚类系统,其特征在于,该系统包括:数据获取模块,用于获取交通数据,所述数据包括多条轨迹的轨迹坐标序列、旅行时间序列、方向角序列、路段ID序列,设
与/>为两条不同的轨迹数据,其中N1和N2分别是轨迹Mp和Mq的长度,/>即为/>x为横坐标序列,y为纵坐标序列,t为旅行时间序列,θ为方向角序列,r为路段ID序列;
第一相似度计算模块,用于利用一条轨迹的邻域内的轨迹的数量、轨迹坐标序列间的距离计算不同轨迹的坐标序列之间的相似度;
第二相似度计算模块,用于根据轨迹上的方向角序列之间的距离、角度差计算方向角的相似度;
第三相似度计算模块,用于利用Jaccard相似性系数计算路段ID的相似度;轨迹聚类模块,根据相似度利用改进的ST-OPTICS算法进行轨迹聚类,具体包括:基于轨迹坐标、方向角的相似度以及路段ID的相似度以及基于旅行时间确定每个对象Mp的邻域;根据Mp的邻域以及邻域内最少对象数量的限制值得到核心对象集;取出核心对象集中未处理的对象Mq,根据其邻域获取对象Mp的邻域集G1,然后将Mp输出到有序列表W中;将所述邻域集G1的数量与最少对象数量的限制值进行比较,如果大于最少对象数量的限制值,则将种子集合初始化为空的队列,计算邻域集G1中每个未处理的对象Mq与Mp的可达距离,并根据可达距离按顺序将Mq插入到种子集合中;对于种子集合中每个未处理的对象Mq,根据其邻域获取对象Mq的邻域集G2,计算邻域集G2中每个未处理的对象Mq与Mp的可达距离,并根据可达距离按顺序将Mq插入到有序列表W中;
轨迹聚类输出模块,用于输出轨迹聚类结果。
CN202110004197.6A 2021-01-04 2021-01-04 一种轨迹时空聚类方法、系统以及存储装置 Active CN112749743B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110004197.6A CN112749743B (zh) 2021-01-04 2021-01-04 一种轨迹时空聚类方法、系统以及存储装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110004197.6A CN112749743B (zh) 2021-01-04 2021-01-04 一种轨迹时空聚类方法、系统以及存储装置

Publications (2)

Publication Number Publication Date
CN112749743A CN112749743A (zh) 2021-05-04
CN112749743B true CN112749743B (zh) 2023-07-21

Family

ID=75649875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110004197.6A Active CN112749743B (zh) 2021-01-04 2021-01-04 一种轨迹时空聚类方法、系统以及存储装置

Country Status (1)

Country Link
CN (1) CN112749743B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113298195A (zh) * 2021-07-27 2021-08-24 中国电子科技集团公司第十五研究所 海上目标经典轨迹的生成方法、装置及存储介质
CN113807223B (zh) * 2021-09-07 2024-04-09 南京中兴力维软件有限公司 人脸聚类子类合并方法、装置及设备
CN114882066B (zh) * 2022-07-11 2022-11-22 浙江大华技术股份有限公司 目标跟踪方法及相关装置、电子设备和存储介质
CN117115757B (zh) * 2023-10-24 2024-02-02 中安创科(深圳)技术有限公司 一种枪支实时监控系统及监控方法
CN117290741B (zh) * 2023-11-14 2024-03-19 北京阿帕科蓝科技有限公司 车辆聚类方法、装置、计算机设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020191876A1 (zh) * 2019-03-26 2020-10-01 中国电子科技集团公司第二十八研究所 一种基于密度聚类的热点路径分析方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657424A (zh) * 2015-01-21 2015-05-27 段炼 一种多时空特征融合下的兴趣点轨迹聚类方法
CN107392245A (zh) * 2017-07-19 2017-11-24 南京信息工程大学 一种出租车载客轨迹聚类算法Tr‑OPTICS
US11562168B2 (en) * 2018-07-16 2023-01-24 Here Global B.V. Clustering for K-anonymity in location trajectory data
CN110309383B (zh) * 2019-06-17 2021-07-13 武汉科技大学 基于改进的dbscan算法的船舶轨迹聚类分析方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020191876A1 (zh) * 2019-03-26 2020-10-01 中国电子科技集团公司第二十八研究所 一种基于密度聚类的热点路径分析方法

Also Published As

Publication number Publication date
CN112749743A (zh) 2021-05-04

Similar Documents

Publication Publication Date Title
CN112749743B (zh) 一种轨迹时空聚类方法、系统以及存储装置
Wei et al. Superpixel hierarchy
Krishnapuram et al. Content-based image retrieval based on a fuzzy approach
CN106897374B (zh) 一种基于轨迹大数据最近邻查询的个性化推荐方法
CN105809672B (zh) 一种基于超像素和结构化约束的图像多目标协同分割方法
CN106991132A (zh) 一种基于图集重构与图核降维的图分类方法
CN106557579A (zh) 一种基于卷积神经网络的车辆型号检索系统及方法
CN110188763B (zh) 一种基于改进图模型的图像显著性检测方法
WO2022062419A1 (zh) 基于非督导金字塔相似性学习的目标重识别方法及系统
CN112288022B (zh) 一种基于ssd算法的特征融合的粮虫识别方法和识别系统
CN115827908A (zh) 用于交互式图像场景图模式搜索和分析的系统和方法
Singh et al. Semantically guided geo-location and modeling in urban environments
Chen et al. GPU-accelerated incremental Euclidean distance transform for online motion planning of mobile robots
CN115718906A (zh) 一种多能源系统多源异构数据融合方法及系统
CN112101132B (zh) 一种基于图嵌入模型和度量学习的交通状况预测方法
Maltar et al. Visual place recognition using directed acyclic graph association measures and mutual information-based feature selection
CN113553975A (zh) 基于样本对关系蒸馏的行人重识别方法、系统、设备及介质
CN113470738B (zh) 基于模糊聚类和基因本体语义相似性的可重叠蛋白质复合物识别方法和系统
CN114596632B (zh) 基于架构搜索图卷积网络的中大型四足动物行为识别方法
Arslan et al. Comparison of feature-based and image registration-based retrieval of image data using multidimensional data access methods
CN113850304B (zh) 一种高准确率的点云数据分类分割改进方法
CN110941994B (zh) 一种基于元类基学习器的行人重识别集成方法
Lu et al. Measuring the similarity between shapes of buildings using graph edit distance
CN112101086A (zh) 一种基于链接预测的人脸聚类方法
Chen et al. Meta-learning based Classification for moving object trajectories in Mobile IoT

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant