CN103593430B - 一种基于移动对象时空信息轨迹分段聚类的方法 - Google Patents

一种基于移动对象时空信息轨迹分段聚类的方法 Download PDF

Info

Publication number
CN103593430B
CN103593430B CN201310553219.XA CN201310553219A CN103593430B CN 103593430 B CN103593430 B CN 103593430B CN 201310553219 A CN201310553219 A CN 201310553219A CN 103593430 B CN103593430 B CN 103593430B
Authority
CN
China
Prior art keywords
cluster
orbit segment
track
segment
trajectory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310553219.XA
Other languages
English (en)
Other versions
CN103593430A (zh
Inventor
胡宝清
段炼
覃开贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201310553219.XA priority Critical patent/CN103593430B/zh
Publication of CN103593430A publication Critical patent/CN103593430A/zh
Application granted granted Critical
Publication of CN103593430B publication Critical patent/CN103593430B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于移动对象时空信息轨迹分段聚类的方法,该基于移动对象时空信息轨迹分段聚类的方法包括:引入时间、速度和方向三个属性,并给出他们的相似度计算公式来分析移动对象轨迹内外部结构;首先根据轨迹的空间密度将轨迹划分成若干轨迹段,然后通过计算各轨迹段在空间、时间、速度和方向上的差异来判断轨迹段的相似度,最后,基于第一次聚类结果,将非显著簇中的轨迹段删除或并入邻近的显著簇,使聚类空间形态体现出全局性的移动规律。本发明提高了聚类效果,具有更强的应用价值,采用空间四叉树对轨迹段进行索引,在大规模轨迹数集环境下极大提升聚类效率,可对轨迹进行有效聚类。

Description

一种基于移动对象时空信息轨迹分段聚类的方法
技术领域
本发明属于轨迹地理坐标值进行聚类技术领域,尤其涉及一种基于移动对象时空信息轨迹分段聚类的方法。
背景技术
时空轨迹是移动对象的位置和时间的记录序列,包括了时间、位置、速度等基础信息。随着移动互联网、定位系统等技术的快速发展,在交通、物流等应用领域,通过智能移动终端能够及时收集大量的时空轨迹(Trajectory)数据。作为一种重要的时空对象数据类型和信息源,时空轨迹数据蕴含着丰富的知识,其应用范围涵盖了人类行为、交通物流、应急疏散管理、动物习性和市场营销等诸多方面。聚类分析是对数据对象进行分组,使得同一组中对象之间具有较高的相似度,而不同组中的对象具有较低的相似度。轨迹聚类的目标是寻找那些具有相同运动模式的轨迹,通过对轨迹内部运动模式和特征信息的分析,确定轨迹间的相似程度,然后将相似程度较高的轨迹归为一类。通过对各种时空轨迹数据进行聚类分析,提取时空轨迹数据中的相似性与异常特征,有助于发现其中有意义的模式。
近年来,世界各国的研究人员提出了多种轨迹聚类方法,,如K-MEANS、BIRCH,DBSCAN、OPTICS、STING等[5]。KREVELD等[6]首次将轨迹的时间依赖关系引入到形状依赖的轨迹分析中,KNORR等将轨迹的起始位置、方向等要素引入轨迹间的相似度计算。张延玲等通过轨迹聚类得到运动模式,Ping等提出了路网空间下基于密度的轨迹聚类方法,该方法首先根据移动对象经过的道路计算出繁忙路径,然后根据用户设置的密度参数对子轨迹进行聚类。Sang等提出首先计算重叠路段长度的相似度,然后进行聚类。Ying等提出了在路网约束下综合考虑时间和空间约束的轨迹相似性度量方法,并应用于轨迹聚类。这些方法大多是基于整条轨迹采样点空间信息进行聚类,没有全面考虑轨迹的局部特征和移动属性,难以匹配路径较长或较复杂的轨迹。
目前直接以轨迹地理坐标值进行聚类,导致聚类效果降低。
发明内容
本发明实施例的目的在于提供一种基于移动对象时空信息轨迹分段聚类的方法,旨在解决目前直接以轨迹地理坐标值进行聚类,导致聚类效果降低的问题。
本发明实施例是这样实现的,一种基于移动对象时空信息轨迹分段聚类的方法,该基于移动对象时空信息轨迹分段聚类的方法包括以下步骤:
第一步,轨迹和轨迹段:
定义1轨迹:三维空间中的有序点集称为轨迹,轨迹TRi定义:TRi={p1,p2,…,pk},其中pk={xk,yk,tk},分别代表该点的二维空间坐标和采用时间,不同轨迹长度可能不一样;
定义2轨迹段:为TRi内连续的部分三维点集,如:SubTrajectorys={p1,…,pk}(1≤s≤k),k为该轨迹段所属轨迹的采样点总数;
第二步,Hausdorff距离:给定两个轨迹段P和Q,使用Hausdorff距离进行相似性测量:
其中,d(p,q)为点p和q之间某个属性上的距离公式,Hausdorff距离用以量度轨迹段之间的空间和时间差异度;
第三步,轨迹段速度:
通过如下公式得到每个采样点速度:
其中,p-为p点之前的相邻采样点,p+为p点之后的相邻采样点,分别代表p-和p+的采样时间;
第四步,轨迹段方向
轨迹段的总体移动方向之间主要方向差别,运动方向角:其中,(xs,ys)为轨迹段起点,(xe,ye)为轨迹段终点;
第五步,轨迹段邻域:
定义3轨迹段Li的ξ邻域Nζ(Li):Nζ(Li)={Li∈D|d(Li,Lj)≤λ};
其中,D为所有轨迹段数据集合,轨迹段领域用以在DBSCAN轨迹密度聚类中,判断每个轨迹段的当前空间密度,进而将空间密度较大的轨迹段聚为同一组;
第六步,轨迹分割;通过采样点在某个时间段内的速度变化来分割轨迹;
定义4断点:假设存在一轨迹段,位于轨迹段上的任何两点之间的距离不超过阈值ε,并且这段子轨迹的采样点数s大于阈值Ε,则将这段子轨迹中的第[s/2]个点设置为断点,同时将位于段子轨迹上其余的点删除;如果一条轨迹上有t个断点,则轨迹被分割为t+1个轨迹段;
第七步,轨迹段相似性比较:轨迹段之间的相似性通过轨迹段之间的差异度获取,包括:空间差异度、时间差异度、方向差异度和速度差异度;
第八步,VOC-TC算法:对轨迹进行分割后,再利用DBSCAN密度算法,采用距离公式,对轨迹段进行聚类,设聚类簇C中包含的轨迹数目为簇基数ncb,簇基数nb与聚类中轨迹段数目nc之比为簇显著度ncs,给定阈值τ和γ,进行如下定义:
定义5显著簇:Csig={C|C∈O∩ncb>τ∩ncs>γ},其中,O为第一次聚类的结果集,即簇基数nb高于τ且簇显著度ns高于γ聚类称为显著簇;
定义6非显著簇:其中,Osig为显著簇集合,即显著簇之外的聚类都为非显著簇;
进行第二次聚类,将第一次聚类中非显著簇删除,同时将该其中包含的轨迹段归并到离其最距离小于阈值μ且包含同一条轨迹的聚类中,最终获取那些能反映主题变化的显著簇,非显著簇的轨迹段归并到其他簇不会改变这些簇中的轨迹数量。
进一步,在第三步中,利用移动对象在三个连续采用点的平均速度作为当前点的速度,轨迹段的速度通过该轨迹段中的最小速度、最大速度和平均速度来衡量:
其中,ωma≤1,vmin为轨迹段中速度最低值,vmax为轨迹段中速度最高值,i和j分别为该轨迹段采样点的下标。
进一步,在第七步中,空间差异度与时间差异度采用Hausdorff距离计算得到,方向差异度和速度差异度直接采用属性差值绝对值表示即可;结合得到一个统一的表达轨迹段相似性公式:
subDis=ωs×spatialDis+ωt×tempoDis+ωo×OrientDis+ωv×velocityDis,
且ws+wt+wo+wv=1
其中,ws、wt、wo、wv为轨迹段相似性权重,spatialDis、tempoDis、OrientDi和seolocityDis分别为轨迹段之间的空间差异度、时间差异度、方向差异度和速度差异度,轨迹段相似性公式为:
subSIM=1-tanh(subD is)
其中,tanh(subD is)为三角函数归一化公式。
进一步,在第八步中,从不同的聚类开始进行顺序显著簇的判断和轨迹段归并,最终会得到相同的聚类形态,计算每个轨迹段邻域的时间复杂度为O(n2),采用四叉树空间索引,将时间复杂度O(n2)降为O(nlogn)。
本发明提供的基于移动对象时空信息轨迹分段聚类的方法,通过引入时间、速度和方向三个属性,并给出他们的相似度计算公式来分析移动对象轨迹内外部结构。首先根据轨迹的空间密度将轨迹划分成若干轨迹段,然后通过计算各轨迹段在空间、时间、速度和方向上的差异来判断轨迹段的相似度,最后,基于第一次聚类结果,将非显著簇中的轨迹段删除或并入邻近的显著簇,使聚类空间形态体现出全局性的移动规律。本发明首次对不重要聚类中的轨迹段进行适当处理,或者将其并入其他邻接的重要聚类,或者作为噪音删除,从而提高了聚类效果,具有更强的应用价值,在进行聚类时需获取每条轨迹的邻近轨迹段,计算量比较大,采用空间四叉树对轨迹段进行索引,在大规模轨迹数集环境下极大提升聚类效率。实验结果表明,本发明可对轨迹进行有效聚类。
附图说明
图1是本发明实施例提供的基于移动对象时空信息轨迹分段聚类的方法流程图;
图2是本发明实施例提供的轨迹聚类效果示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合附图及具体实施例对本发明的应用原理作进一步描述。
如图1所示,本发明实施例的基于移动对象时空信息轨迹分段聚类的方法包括以下步骤:
S101:通过引入时间、速度和方向三个属性,并给出他们的相似度计算公式来分析移动对象轨迹内外部结构;
S102:根据轨迹的空间密度将轨迹划分成若干轨迹段;
S103:然后通过计算各轨迹段在空间、时间、速度和方向上的差异来判断轨迹段的相似度;
S104:最后,基于第一次聚类结果,将非显著簇中的轨迹段删除或并入邻近的显著簇,使聚类空间形态体现出全局性的移动规律。
本发明的具体步骤为:
第一步,轨迹和轨迹段:
定义1轨迹:三维空间中的有序点集称为轨迹,轨迹TRi定义:TRi={p1,p2,…,pk},其中pk={xk,yk,tk},分别代表该点的二维空间坐标和采用时间,不同轨迹长度可能不一样;
定义2轨迹段:为TRi内连续的部分三维点集,如:SubTrajectorys={p1,…,pk}(1≤s≤k),k为该轨迹段所属轨迹的采样点总数;
第二步,Hausdorff距离:
Hausdorff距离是描述两组点集之间相似程度的一种度量,也是集合之间距离的一种定义形式,给定两个轨迹段P和Q,可直接使用Hausdorff距离对其进行相似性测量:
其中,d(p,q)为点p和q之间某个属性上的距离公式,Hausdorff距离在本发明用以量度轨迹段之间的空间和时间差异度;
第三步,轨迹段速度:
轨迹段速度表达了某段时间内该该轨迹所在路径的通达程度,具有十分重要的意义,由于实验数据集缺失采样点的速度,因此,通过如下公式得到每个采样点速度:
其中,p-为p点之前的相邻采样点,p+为p点之后的相邻采样点,分别代表p-和p+的采样时间,该计算公式利用移动对象在三个连续采用点的平均速度作为当前点的速度,轨迹段的速度通过该轨迹段中的最小速度、最大速度和平均速度来衡量:
其中,ωma≤1,vmin为轨迹段中速度最低值,vmax为轨迹段中速度最高值,i和j分别为该轨迹段采样点的下标,对于一条轨迹段多个采样点,其速度都是不相同的,因此,这里要综合考虑速度的各种因素,以将具有相似速度结构的轨迹段聚集在一块;
第四步,轨迹段方向
轨迹段方向仅仅考虑始末参考点之间形成的角度,因为尽管道路上两条轨迹段在每个采样位置的最小移动方向差异较大,但在道路网的约束往往这些采样点的总体移动方向是相同的,所以,轨迹段的总体移动方向才能表达他们之间主要方向差别,运动方向角:其中,(xs,ys)轨迹段起点,(xe,ye)为轨迹段终点;
第五步,轨迹段邻域:
一个聚类主要由时空、速度、方向上相似的轨迹段组成,这些相似轨迹段称之为轨迹段邻域;
定义3轨迹段Li的ξ邻域Nζ(Li):Nζ(Li)={Li∈D|d(Li,Li)≤λ};
其中,D为所有轨迹段数据集合,轨迹段领域用以在DBSCAN轨迹密度聚类中,判断每个轨迹段的当前空间密度,进而将空间密度较大的轨迹段聚为同一组;
第六步,轨迹分割;城市中,浮动车辆的行动受道路网约束,其轨迹空间形态不会类似动物路径或风暴路径那样在角度和速度上经常出现随机的剧烈变化,因此依据角度和速度变化进行轨迹分割的方法不适合城市空间中的轨迹段划分,而受到交叉路口红灯、交通拥塞、工作、休闲和生活场所的影响,城市中的移动对象常常在这些位置有较明显的角度或速度差异,因此,通过采样点在某个时间段内的速度变化来分割轨迹;
定义4断点:假设存在一轨迹段,位于该轨迹段上的任何两点之间的距离不超过阈值ε,并且这段子轨迹的采样点数s大于阈值Ε,则将这段子轨迹中的第[s/2]个点设置为断点,同时将位于该段子轨迹上其余的点删除,这实际上表示如果某轨迹段在空间上的密度和采用点数量达到一定程度,即可认为该轨迹段包含了断点;
显然,如果一条轨迹上有t个断点,则该轨迹被分割为t+1个轨迹段;
第七步,轨迹段相似性比较:轨迹段之间的相似性通过轨迹段之间的差异度获取,该计算包括4方面:空间差异度、时间差异度、方向差异度和速度差异度,其中,空间差异度与时间差异度采用Hausdorff距离计算得到,方向差异度和速度差异度直接采用属性差值绝对值表示即可;结合得到一个统一的表达轨迹段相似性公式:
subDis=ωs×spatialDis+ωt×tempoDis+ωo×OrientDis+ωv×velocityDis,
且ws+wt+wo+wv=1 (4)
其中,ws、wt、wo、wv为轨迹段相似性权重,spatialDis、tempoDis、OrientDi和seolocityDis分别为轨迹段之间的空间差异度、时间差异度、方向差异度和速度差异度,轨迹段相似性公式为:
subSIM=1-tanh(subDis) (5)
其中,tanh(subD is)为三角函数归一化公式;
第八步,VOC-TC算法:
对轨迹进行分割后,再利用DBSCAN密度算法,采用式(4)的距离公式,对轨迹段进行聚类,与DBSCAN不同,这里还需考虑轨迹段与原始轨迹的关系,设聚类簇C中包含的轨迹数目为簇基数ncb,簇基数nb与该聚类中轨迹段数目nc之比为簇显著度ncs,给定阈值τ和γ,进行如下定义:
定义5显著簇:Csig={C|C∈O∩ncb>τ∩ncs>γ},其中,O为第一次聚类的结果集,即簇基数nb高于τ且簇显著度ns高于γ聚类称为显著簇;
定义6非显著簇:其中,Osig为显著簇集合,即显著簇之外的聚类都为非显著簇;
一旦某聚类中簇基数少于τ,则说明该聚类中亦或包含了较多属于同一条轨迹的轨迹段,亦或仅仅包含了较少的移动对象,同样,如果某聚类中的显著度小于γ,则说明该聚类中的轨迹数量相对于轨迹段来说过少,这两者均无法反映全局上的该聚类所覆盖路径的重要性,因此,进行第二次聚类,将第一次聚类中非显著簇删除,同时将该其中包含的轨迹段归并到离其最距离小于阈值μ且包含同一条轨迹的聚类中,最终获取那些能反映主题变化的显著簇,非显著簇的轨迹段归并到其他簇不会改变这些簇中的轨迹数量,因此,从不同的聚类开始进行顺序显著簇的判断和轨迹段归并,最终会得到相同的聚类形态,一般情况下,计算每个轨迹段邻域的时间复杂度为O(n2),本发明采用采用四叉树空间索引,将其时间复杂度降为O(nlogn),
双重聚类算法伪代码如表1所示:
表1轨迹时空聚类伪算法
本发明能较好过滤到大部分不重要的聚类,同时扩充了那些具有全局重要意义的轨迹聚类所涉及的空间范围,在全局空间分异上凸显出重要聚类的影响范围,而其他类似的轨迹密度聚类方法无法做到这一点。
通过以下实验分析和比较对本发明的使用效果做进一步的说明:
1、实验与分析:
1.1实验数据与运行环境
为了验证本发明提出的聚类算法,开发了轨迹聚类分析系统。轨迹数据存储在MySQL数据表中,实验的软硬件环境包括:64位的Windows 7,Visual Studio 2010,CPU(CORE 2DUO 2.8GH),内存8GB。采用武汉市武昌区2010年2月至4月的出租车数据集作为实验数据,共10835条轨迹,每条轨迹的采样点包括了经纬度坐标、采样时间。通过计算断点,最终得到52934个轨迹段。
1.2实验分析
1.2.1不同参数下的聚类效果比较
本发明提出的算法涉及13个需要用户预先设定的参数:轨迹段邻域阈值λ和领域轨迹段数量阈值ξ,轨迹段速度权重值ωa、ωm,轨迹段相似性权重ωv、ωt、ωo、ωs,断点设置阈值ε、Ε,聚类簇基数阈值τ和簇显著度阈值γ,归并阈值μ。本发明着重观察速度、方向对聚类效果的影响,此外,τ、γ和μ作为与以往轨迹聚类方法不同的参数,对聚类个数和最终聚类形态的影响较大,因此,经过多次调整后将其他参数固定下来后,观察这5个参数对最终聚类形态的影响。列出了5组ωv、ωo、τ、γ和μ的参数,并在表2—表6显示这5组参数下的聚类的计算时间和聚类数目。下面对不同参数的影响进行分析(表标题中的“?”表示对该参数进行调整)。
表2第1组参数(ωv=?,ωo=0.25,τ=160,γ=0.25,μ=0.1)的聚类效果
随着速度权重的提高,越来越多的具有相同路径的轨迹被拆分,形成新的聚类,如果没有后期对簇基数的控制,则聚类数量将更加多。
表3第2组参数(ωv=0.2,ωo=?,τ=160,γ=0.25,μ=0.1)的聚类效果
与速度权重的效果类似,随着方向权重的提高,越来越多的具有相同路径的轨迹被拆分,形成新的聚类,但其聚类数量较速度权重的少,可见,道路上车辆间的速度变化差异较方向变化差异更加大。
表4第3组参数(ωv=0.2,ωo=0.25,τ=?,γ=0.25,μ=0.1)的聚类效果
随着聚类簇基数阈值τ的提高,越来越多的包含少数轨迹聚类被删除,其中的轨迹段一部分作为噪音被过滤掉,一部分融入了周边的显著簇。但其聚类时间变化不大少,说明在进行过滤和轨迹段合并的过程消耗的时间不多。
表5第4组参数(ωv=0.2,ωo=0.25,τ=160,γ=?,μ=0.1)的聚类效果
随着簇显著度阈值γ的提高,大量空间形态过长的聚类被过滤掉,被过滤的聚类包含的轨迹段一部分作为噪音被删除,一部分融入了周边的“大”聚类。然而,随着聚类数量的减少,聚类时间逐渐小幅增加,说明在进行轨迹段合并的过程需有较多合适的邻近类供选择,系统在选取最近邻类时增加了相应的时间开销。
表6第5组参数(ωv=0.2,ωo=0.25,τ=160,γ=0.25,μ=?)的聚类效果
由于聚类簇基数阈值τ决定了最终聚类的个数,因此这里的聚类数目不会随着归并阈值μ的变化而变化。然而,在μ不断增加时,低于聚类簇基数阈值τ的“小”聚类中,越来越多的轨迹段被作为噪音过滤掉,当μ达到0.3时,被删除的轨迹几乎占了轨迹段总数的1/3,可见,加入速度和方向约束后的轨迹段之间的差异比较大,造成很多同一轨迹上的轨迹段无法聚在同一类中。
1.2.2不同聚类算法效果对比
本发明提出的算法VOC-TC与DBSCAN、OPTICS等都是密度相关的聚类算法。VOC-TC、DBSCA和OPTICS的参数调优以最大程度体现城市主干要道为准。从表7中可以看出,相对于其他2种方法,本算法具有较好的运行速度,且发现的聚类更能体现城市交通特征(图2),主要有以下原因:①VOC-TC采用了空间四叉树存储轨迹段并为其近邻增加空间索引,提高了邻接轨迹段的搜索效率;②VOC-TC以方向和速度特征为依据,容易区分开那些路径相同但移动属性不同隐蔽轨迹群;③VOC-TC通过两次聚类,删除了大量非显著聚类,表现了总体上轨迹运动模式和趋势。
表7不同聚类算法之间的效果比较
经过计算后轨迹数据被分为41个类,将结果转换为shp格式,如图2所示,图中每条线代表200条不区分速度、方向和时间的轨迹,小于200条的也用一条线段表示。其中,带有颜色的线条为显著轨迹段聚类,灰色轨迹为噪音。在考虑速度和方向后,原来在同一道路上经过的轨迹段之间由速度和方向的差异较大,会被聚合到邻近的聚类。由于轨迹段的归并,某些聚类特别长,而某些聚类类包含了主干道之外旁系轨迹。此外,由于位于枝干道路上移动对象的速度和方向的相似度较低,大部分的处于主干道之外的轨迹被作为噪音处理,很多处主干道的非显著聚类,被归并到同一主干道上的显著性聚类中。可见,本轨迹聚集的空间分布反映了车流在城市中的最为主要的流动状况,从侧面也反映出了城市主干要道的分布。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于移动对象时空信息轨迹分段聚类的方法,其特征在于,该基于移动对象时空信息轨迹分段聚类的方法包括以下步骤:
第一步,轨迹和轨迹段:
定义1轨迹:三维空间中的有序点集称为轨迹,轨迹TRi定义:TRi={p1,p2,…,pk},其中pk={xk,yk,tk},分别代表该点的二维空间坐标和采用时间;
定义2轨迹段:为TRi内连续的部分三维点集,如:SubTrajectorys={p1,…,pk}(1≤s≤k),k为该轨迹段所属轨迹的采样点总数;
第二步,Hausdorff距离:给定两个轨迹段P和Q,使用Hausdorff距离进行相似性测量:
H ( P , Q ) = m a x [ h ( P , Q ) , h ( Q , P ) ] h ( P , Q ) = max p ∈ P min q ∈ Q d ( p , q ) h ( Q , P ) = max q ∈ Q min p ∈ P d ( q , p )
其中,d(p,q)为点p和q之间某个属性上的距离公式,Hausdorff距离用以量度轨迹段之间的空间和时间差异度;
第三步,轨迹段速度:
通过如下公式得到每个采样点速度:
v p = d i s tan c e ( p - , p ) + d i s tan c e ( p , p + ) t p + - t p -
其中,p-为p点之前的相邻采样点,p+为p点之后的相邻采样点,tp-和tp+分别代表p-和p+的采样时间;
第四步,轨迹段方向
轨迹段的总体移动方向之间方向差别,运动方向角:其中,(xs,ys)为轨迹段起点,(xe,ye)为轨迹段终点;
第五步,轨迹段邻域:
定义3轨迹段Li的ξ邻域:Nξ(Li):Nξ(Li)={Li∈D|d(Li,Lj)≤λ};
其中,D为所有轨迹段数据集合,轨迹段领域用以在DBSCAN轨迹密度聚类中,判断每个轨迹段的当前空间密度,进而将空间密度较大的轨迹段聚为同一组;
第六步,轨迹分割;通过采样点在某个时间段内的速度变化来分割轨迹;
定义4断点:假设存在一轨迹段,位于轨迹段上的任何两点之间的距离不超过阈值ε,并且这段子轨迹的采样点数s大于阈值Ε,则将这段子轨迹中的第[s/2]个点设置为断点,同时将位于这段子轨迹上其余的点删除;如果一条轨迹上有t个断点,则轨迹被分割为t+1个轨迹段;
第七步,轨迹段相似性比较:轨迹段之间的相似性通过轨迹段之间的差异度获取,包括:空间差异度、时间差异度、方向差异度和速度差异度;
第八步,VOC-TC算法:对轨迹进行分割后,再利用DBSCAN密度算法,采用距离公式,对轨迹段进行聚类,设聚类簇C中包含的轨迹数目为簇基数ncb,簇基数nb与聚类中轨迹段数目nc之比为簇显著度ncs,给定阈值τ和γ,进行如下定义:
定义5显著簇:Csig={C|C∈O∩ncb>τ∩ncs>γ},其中,O为第一次聚类的结果集,即簇基数nb高于τ且簇显著度ns高于γ聚类称为显著簇;
定义6非显著簇:其中,Osig为显著簇集合,即显著簇之外的聚类都为非显著簇;
进行第二次聚类,将第一次聚类中非显著簇删除,同时将该其中包含的轨迹段归并到离其最小距离小于阈值μ且包含同一条轨迹的聚类中,最终获取那些能反映主题变化的显著簇,非显著簇的轨迹段归并到其他簇不会改变这些簇中的轨迹数量。
2.如权利要求1所述的基于移动对象时空信息轨迹分段聚类的方法,其特征在于,在第三步中,利用移动对象在三个连续采用点的平均速度作为当前点的速度,轨迹段的速度通过该轨迹段中的最小速度、最大速度和平均速度来衡量:
V ‾ S u b T r a j e c t o r y = ( 1 - w m - w a ) v min + w m v max + w a v i + v i + 1 + ... + v j j - i + 1
其中,ωma≤1,vmin为轨迹段中速度最低值,vmax为轨迹段中速度最高值,i和j分别为该轨迹段采样点的下标。
3.如权利要求1所述的基于移动对象时空信息轨迹分段聚类的方法,其特征在于,在第七步中,空间差异度与时间差异度采用Hausdorff距离计算得到,方向差异度和速度差异度直接采用属性差值绝对值表示即可;结合得到一个统一的表达轨迹段相似性公式:
subDis=ws×spatialDis+wt×tempoDis+wo×OrientDis+wv×velocityDis,,
且ws+wt+wo+wv=1
其中,ws、wt、wo、wv为轨迹段相似性权重,spatialDis、tempoDis、OrientDi和seolocityDis分别为轨迹段之间的空间差异度、时间差异度、方向差异度和速度差异度,轨迹段相似性公式为:
subSIM=1-tanh(subD is)
其中,tanh(subD is)为三角函数归一化公式。
4.如权利要求1所述的基于移动对象时空信息轨迹分段聚类的方法,其特征在于,在第八步中,从不同的聚类开始进行顺序显著簇的判断和轨迹段归并,最终会得到相同的聚类形态,计算每个轨迹段邻域的时间复杂度为O(n2),采用四叉树空间索引,将时间复杂度O(n2)降为O(nlogn)。
CN201310553219.XA 2013-11-11 2013-11-11 一种基于移动对象时空信息轨迹分段聚类的方法 Expired - Fee Related CN103593430B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310553219.XA CN103593430B (zh) 2013-11-11 2013-11-11 一种基于移动对象时空信息轨迹分段聚类的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310553219.XA CN103593430B (zh) 2013-11-11 2013-11-11 一种基于移动对象时空信息轨迹分段聚类的方法

Publications (2)

Publication Number Publication Date
CN103593430A CN103593430A (zh) 2014-02-19
CN103593430B true CN103593430B (zh) 2017-03-22

Family

ID=50083571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310553219.XA Expired - Fee Related CN103593430B (zh) 2013-11-11 2013-11-11 一种基于移动对象时空信息轨迹分段聚类的方法

Country Status (1)

Country Link
CN (1) CN103593430B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912683A (zh) * 2016-04-15 2016-08-31 深圳大学 一种基于时间顺序的轨迹匹配方法
CN106385660A (zh) * 2015-08-07 2017-02-08 杜比实验室特许公司 处理基于对象的音频信号
CN108537254A (zh) * 2018-03-23 2018-09-14 浙江工业大学 一种基于绘画时间的笔划线条全局聚类方法
CN110097074A (zh) * 2019-03-19 2019-08-06 中国科学院信息工程研究所 一种基于序列相似度的车辆轨迹压缩方法

Families Citing this family (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103957509A (zh) * 2014-05-07 2014-07-30 北京邮电大学 一种车载网络区分用户移动行为相似性的方法
US9541404B2 (en) * 2014-08-29 2017-01-10 Samsung Electronics Co., Ltd. System for determining the location of entrances and areas of interest
CN104467866B (zh) * 2014-10-14 2018-03-06 福建师范大学 一种基于角度的轨迹数据压缩方法及装置
CN104657424A (zh) * 2015-01-21 2015-05-27 段炼 一种多时空特征融合下的兴趣点轨迹聚类方法
CN104596507B (zh) * 2015-02-09 2017-10-03 成都小步创想畅联科技有限公司 一种移动终端出行轨迹的确定方法
CN104794494B (zh) * 2015-04-30 2018-02-23 中国地质大学(武汉) 一种可扩展快速的轨迹聚类方法
CN105117424B (zh) * 2015-07-31 2019-08-02 中国科学院软件研究所 一种基于停留时间的移动对象语义行为模式挖掘方法
CN105206041B (zh) * 2015-08-12 2017-05-24 东南大学 一种考虑时序dbscan的智能手机轨迹链簇识别方法
CN105404648A (zh) * 2015-10-29 2016-03-16 东北大学 一种基于密度与紧密度聚类的用户移动行为确定方法
CN105512212B (zh) * 2015-11-27 2019-11-22 武汉光庭信息技术股份有限公司 一种导航数字地图道路数据元素的唯一编码生成方法
CN105741188B (zh) * 2016-01-26 2019-09-27 重庆大学 双馈风力发电机群电磁暂态同调分群方法
CN106095104A (zh) * 2016-06-20 2016-11-09 电子科技大学 基于目标模型信息的连续手势轨迹分割方法及系统
CN106203357A (zh) * 2016-07-11 2016-12-07 浙江宇视科技有限公司 一种人员聚集的检测方法和装置
CN106407519B (zh) * 2016-08-31 2019-04-16 浙江大学 一种人群移动规律的建模方法
CN106291503B (zh) * 2016-08-31 2018-12-28 西南交通大学 一种雷达探测系统密度聚类预警方法
CN106383868A (zh) * 2016-09-05 2017-02-08 电子科技大学 一种基于道路网络的时空轨迹聚类方法
CN106650771A (zh) * 2016-09-29 2017-05-10 百度在线网络技术(北京)有限公司 基于聚类分析的轨迹去噪方法以及装置
CN106951903B (zh) * 2016-10-31 2019-12-17 浙江大学 一种人群移动规律的可视化方法
CN107045519B (zh) * 2016-10-31 2019-10-18 浙江大学 一种分析人群移动规律的可视化系统
CN106776482B (zh) * 2016-12-01 2019-07-12 河海大学 一种轨迹相似度计算方法
CN107134778A (zh) * 2017-07-03 2017-09-05 湖南工业大学 基于互联网直流侧电压自适应调节apf 电流预测控制方法
CN107480231A (zh) * 2017-08-04 2017-12-15 深圳大学 基于带序兴趣区域的轨迹查询的启发式扩张搜索扩展算法
CN107622085A (zh) * 2017-08-11 2018-01-23 河海大学 一种基于网格和密度的自适应轨迹聚类方法
CN107766808B (zh) * 2017-09-30 2021-06-29 北京泓达九通科技发展有限公司 道路网络空间中车辆对象移动轨迹聚类的方法及系统
CN107944628A (zh) * 2017-11-27 2018-04-20 中国矿业大学 一种路网环境下的聚集模式发现方法及系统
CN109948040A (zh) * 2017-12-04 2019-06-28 北京京东尚科信息技术有限公司 对象信息的存储、推荐方法及系统、设备和存储介质
CN108151745B (zh) * 2017-12-25 2021-07-30 千寻位置网络有限公司 Nmea轨迹差异的自动分析与标识方法
CN108182230B (zh) * 2017-12-27 2020-11-03 南京师范大学 基于位向量四叉树的移动对象汇聚模式挖掘方法
CN109951791A (zh) * 2018-04-29 2019-06-28 中山市澳多电子科技有限公司 一种应用于tbox的拐点补传算法
CN108680174B (zh) * 2018-05-10 2019-05-10 长安大学 一种基于机器学习算法改进地图匹配异常点的方法
CN108737979B (zh) * 2018-05-11 2020-05-22 华南理工大学 一种室内定位方法
CN110737006B (zh) * 2018-07-20 2023-05-02 菜鸟智能物流控股有限公司 轨迹去噪的处理方法、装置以及电子设备
CN109033395A (zh) * 2018-08-01 2018-12-18 安徽华米信息科技有限公司 确定路段的方法及装置
CN109255315B (zh) * 2018-08-30 2021-04-06 跨越速运集团有限公司 一种出车途中人车分离判断方法及装置
CN109005515B (zh) * 2018-09-05 2020-07-24 武汉大学 一种基于移动轨迹信息的用户行为模式画像的方法
CN111046895B (zh) * 2018-10-15 2023-11-07 北京京东振世信息技术有限公司 一种确定目标区域的方法和装置
CN109767615B (zh) * 2018-10-19 2021-05-18 江苏智通交通科技有限公司 路网交通流关键流向和关键路径分析方法
CN109445587A (zh) * 2018-10-22 2019-03-08 北京顺源开华科技有限公司 运动参数确定方法及装置
CN112889017A (zh) * 2018-11-21 2021-06-01 深圳市柔宇科技股份有限公司 手写笔迹处理方法、手写输入设备及计算机可读存储介质
CN109635059A (zh) * 2018-11-23 2019-04-16 武汉烽火众智数字技术有限责任公司 基于轨迹相似度匹配的人车关联分析方法及系统
CN109784254B (zh) * 2019-01-07 2021-06-25 中兴飞流信息科技有限公司 一种车辆违规事件检测的方法、装置和电子设备
CN109726874A (zh) * 2019-01-18 2019-05-07 创新奇智(北京)科技有限公司 出行线路规划方法、装置、计算设备及存储介质
CN111696343B (zh) * 2019-03-12 2022-04-05 北京嘀嘀无限科技发展有限公司 一种轨迹数据处理方法及装置
CN110060004A (zh) * 2019-03-19 2019-07-26 深圳市金鹰鹏物流有限公司 物流配送异常检测方法及系统
CN110033051B (zh) * 2019-04-18 2021-08-20 杭州电子科技大学 一种基于多步聚类的拖网渔船行为判别方法
CN110139221B (zh) * 2019-05-09 2020-02-14 特斯联(北京)科技有限公司 一种基于手机信号微卡口的人口集群动态监测方法与系统
CN110222131A (zh) * 2019-05-21 2019-09-10 北京交通大学 起讫信息提取方法及装置
CN110363094A (zh) * 2019-06-20 2019-10-22 珠海云航智能技术有限公司 一种船只异常行为识别方法、装置及终端设备
CN110543539B (zh) * 2019-08-29 2022-09-16 河海大学 一种分布式的路网环境下移动对象轨迹相似性查询方法
CN110766895A (zh) * 2019-09-17 2020-02-07 重庆特斯联智慧科技股份有限公司 基于目标轨迹分析的智慧社区异常报警系统及方法
CN110689082A (zh) * 2019-09-30 2020-01-14 中国电子科技集团公司第五十四研究所 一种使用optics与离线批处理优化的轨迹聚类算法
CN111059514A (zh) * 2019-09-30 2020-04-24 陕西想象力智能科技有限公司 一种500w光源、控制系统及控制方法
CN110909592B (zh) * 2019-10-11 2020-12-18 重庆特斯联智慧科技股份有限公司 一种基于多尺度特征量的目标跟踪方法和系统
CN110631594B (zh) * 2019-10-24 2021-03-26 成都大成均图科技有限公司 基于复杂轨迹网络划分模型的离线地图匹配方法和系统
CN110738856B (zh) * 2019-11-12 2020-09-22 中南大学 一种基于移动聚类的城市交通拥堵精细识别方法
CN111723304B (zh) * 2020-01-03 2023-07-14 腾讯科技(深圳)有限公司 一种轨迹点识别方法和相关装置
CN113139027B (zh) * 2020-01-20 2023-03-24 阿里巴巴集团控股有限公司 作业任务切分方法、装置、设备及存储介质
CN111521191A (zh) * 2020-04-20 2020-08-11 中国农业科学院农业信息研究所 一种基于信令数据的移动电话用户移动路径地图匹配方法
CN111552754B (zh) * 2020-04-24 2020-12-29 中国科学院空天信息创新研究院 一种舰船轨迹相似度度量方法及系统
CN111582602B (zh) * 2020-05-19 2021-03-16 深圳市快金数据技术服务有限公司 一种基于物流供应链的协同优化方法
CN111897805B (zh) * 2020-06-24 2022-11-11 东南大学 基于最长公共子轨迹密度聚类的热点路径挖掘方法
CN112037245B (zh) * 2020-07-22 2023-09-01 杭州海康威视数字技术股份有限公司 一种确定追踪目标相似度的方法和系统
CN111949750A (zh) * 2020-07-30 2020-11-17 智慧航海(青岛)科技有限公司 一种船舶轨迹模型建立及异常轨迹检测方法
CN111950407B (zh) * 2020-07-30 2023-12-05 浙江大学 基于沉浸式的羽毛球轨迹分析方法和系统
CN114120018B (zh) * 2020-08-25 2023-07-11 四川大学 一种基于人群聚类轨迹熵的空间活力量化方法
CN112269844B (zh) * 2020-09-24 2021-08-06 桂林电子科技大学 基于大规模轨迹数据的通用伴随模式分布式挖掘方法
CN112257249B (zh) * 2020-10-19 2021-06-25 上海现代建筑设计集团工程建设咨询有限公司 基坑工程中基于归并的布置路径方法、装置和电子设备
CN112686327A (zh) * 2021-01-05 2021-04-20 重庆邮电大学 一种基于轨迹三重特征聚类的方法
CN112905576B (zh) * 2021-03-02 2023-09-08 中国农业大学 一种基于农机作业轨迹确定农田和道路的方法及系统
CN112685428B (zh) * 2021-03-10 2021-07-06 南京烽火星空通信发展有限公司 一种基于海量位置轨迹数据时空分析方法
CN113312360B (zh) * 2021-07-28 2022-01-04 阿里云计算有限公司 索引建立方法、装置、设备、存储介质及计算机程序产品
CN113887590B (zh) * 2021-09-22 2023-06-09 中国电子科技集团公司第二十九研究所 一种目标典型航迹及区域分析方法
CN114265409A (zh) * 2021-12-24 2022-04-01 广州极飞科技股份有限公司 轨迹信息处理方法、装置及地面设备
CN114814777B (zh) * 2022-06-27 2022-09-27 中国人民解放军32035部队 一种多雷达密集目标的图形匹配关联方法及系统
CN116541727B (zh) * 2023-07-07 2023-09-12 中国兵工物资集团有限公司 一种轨迹相似度计算方法和系统
CN117648502B (zh) * 2024-01-29 2024-04-02 深圳市名通科技股份有限公司 基于时空大数据的出行路径选取方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722541A (zh) * 2012-05-23 2012-10-10 中国科学院计算技术研究所 一种时空轨迹相似度计算方法及系统
JP2012526311A (ja) * 2010-03-15 2012-10-25 パナソニック株式会社 移動軌跡算出方法およびその装置、ならびに領域分割方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012526311A (ja) * 2010-03-15 2012-10-25 パナソニック株式会社 移動軌跡算出方法およびその装置、ならびに領域分割方法
CN102722541A (zh) * 2012-05-23 2012-10-10 中国科学院计算技术研究所 一种时空轨迹相似度计算方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于结构相似度的轨迹聚类算法;袁冠等;《第三届中国计算机网络与信息安全会议(CCNIS2010)》;20101126;第38-45页 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106385660A (zh) * 2015-08-07 2017-02-08 杜比实验室特许公司 处理基于对象的音频信号
CN106385660B (zh) * 2015-08-07 2020-10-16 杜比实验室特许公司 处理基于对象的音频信号
CN105912683A (zh) * 2016-04-15 2016-08-31 深圳大学 一种基于时间顺序的轨迹匹配方法
CN105912683B (zh) * 2016-04-15 2019-05-07 深圳大学 一种基于时间顺序的轨迹匹配方法
CN108537254A (zh) * 2018-03-23 2018-09-14 浙江工业大学 一种基于绘画时间的笔划线条全局聚类方法
CN110097074A (zh) * 2019-03-19 2019-08-06 中国科学院信息工程研究所 一种基于序列相似度的车辆轨迹压缩方法

Also Published As

Publication number Publication date
CN103593430A (zh) 2014-02-19

Similar Documents

Publication Publication Date Title
CN103593430B (zh) 一种基于移动对象时空信息轨迹分段聚类的方法
CN110298500B (zh) 一种基于出租车数据和城市路网的城市交通轨迹数据集生成方法
Chu et al. Visualizing hidden themes of taxi movement with semantic transformation
Castro et al. From taxi GPS traces to social and community dynamics: A survey
CN108427965A (zh) 一种基于路网聚类的热点区域挖掘方法
CN103533501B (zh) 一种地理围栏生成方法
Davies et al. Scalable, distributed, real-time map generation
CN108153867B (zh) 基于时间规律性的用户轨迹预测方法和装置
CN104657424A (zh) 一种多时空特征融合下的兴趣点轨迹聚类方法
CN107301254A (zh) 一种路网热点区域挖掘方法
Fang et al. FTPG: A fine-grained traffic prediction method with graph attention network using big trace data
Xu et al. Taxi-RS: Taxi-hunting recommendation system based on taxi GPS data
CN109726594B (zh) 一种基于差分隐私的新型轨迹数据发布方法
Tork Spatio-temporal clustering methods classification
CN105206041A (zh) 一种考虑时序dbscan的智能手机轨迹链簇识别方法
CN108170793A (zh) 基于车辆语义轨迹数据的停留点分析方法及其系统
Tang et al. Significant linear hotspot discovery
CN106730841A (zh) 一种寻路方法和装置
CN110716935A (zh) 基于网约车出行的轨迹数据分析与可视化方法及系统
CN110516702B (zh) 一种基于流数据的离散路径规划方法
CN110472999A (zh) 基于地铁和共享单车数据的客流模式分析方法及装置
CN107944628A (zh) 一种路网环境下的聚集模式发现方法及系统
CN109145489A (zh) 一种基于概率图的障碍物分布仿真方法、装置以及终端
Liu et al. A semantics-based trajectory segmentation simplification method
Schoier et al. Individual movements and geographical data mining. Clustering algorithms for highlighting hotspots in personal navigation routes

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170322

Termination date: 20171111

CF01 Termination of patent right due to non-payment of annual fee