CN109241126A - 一种基于r*树索引的时空轨迹聚集模式挖掘算法 - Google Patents
一种基于r*树索引的时空轨迹聚集模式挖掘算法 Download PDFInfo
- Publication number
- CN109241126A CN109241126A CN201810698222.3A CN201810698222A CN109241126A CN 109241126 A CN109241126 A CN 109241126A CN 201810698222 A CN201810698222 A CN 201810698222A CN 109241126 A CN109241126 A CN 109241126A
- Authority
- CN
- China
- Prior art keywords
- track
- group
- algorithm
- time
- tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009825 accumulation Methods 0.000 title claims abstract description 28
- 238000005065 mining Methods 0.000 title claims abstract description 27
- 230000002776 aggregation Effects 0.000 claims abstract description 26
- 238000004220 aggregation Methods 0.000 claims abstract description 26
- 230000033001 locomotion Effects 0.000 claims abstract description 20
- 230000006835 compression Effects 0.000 claims abstract description 8
- 238000007906 compression Methods 0.000 claims abstract description 8
- 238000012946 outsourcing Methods 0.000 claims description 12
- 238000000034 method Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 7
- 238000002474 experimental method Methods 0.000 abstract description 7
- 238000007418 data mining Methods 0.000 abstract description 3
- 238000001514 detection method Methods 0.000 abstract description 3
- 230000015572 biosynthetic process Effects 0.000 abstract 1
- 238000003786 synthesis reaction Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 14
- 230000000052 comparative effect Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000013138 pruning Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于R*树索引的时空轨迹聚集模式挖掘算法,包括轨迹压缩,轨迹聚类和聚集检测三个步骤。该算法综合利用轨迹数据的运动方向、运动速度和偏移信息来压缩轨迹,提高算法压缩的效果;使用基于R*树索引的线段DBSCAN对轨迹段聚类,提高算法聚类的效率。相关实验表明该算法相比同类算法挖掘效果有所提高。接下来的工作就是将此算法运用于实际的轨迹数据聚集模式挖掘任务中,提高数据挖掘的效果。
Description
技术领域
本发明涉及数据挖掘领域,主要对时空轨迹聚集模式挖掘算法Crowd-TAD(Crowd-Testand Divide)进行改进,以提高聚集模式挖掘算法的准确性和效率,具体涉 及一种基于R*树索引的时空轨迹聚集模式挖掘算法。
背景技术
时空轨迹模式挖掘是指从移动对象的运动轨迹中发现有用的行为规律来获取有价 值的信息。其中时空轨迹聚集模式挖掘主要挖掘出在一定空间范围内持续一段时间的密 集的移动对象群体,广泛应用于流量预测和交通线路规划等方面。
时空轨迹聚集模式的特点可以根据以下因素进行区分:移动群组的形状或者密度、 群组中的对象数以及移动持续的时间。随着研究的深入,时空轨迹聚集模式的定义也越 来越符合实际场景。在这些聚集模式中,Gathering模式是目前最新定义的聚集模式,该模式定义中的限定比较宽泛,适用于城市计算、流量预测等多种应用场景。
Gathering模式的挖掘方法分为三种,分别是基于网格的挖掘算法、基于R树的挖掘算法和基于时空图的挖掘算法。基于网格索引的聚集判断算法原理是在每个时间点建立网格索引遍历聚簇集合,得出需要进行距离计算的聚簇集合,减少计算量,缺点是索 引效率受划分粒度影响。基于R树索引的聚集判断算法原理是在计算聚簇间的距离时, 在每个时间点建立R树索引存储聚簇最小外包矩形,利用R树的窗口查询进行剪枝, 减少聚簇间的距离计算,缺点是R树实现复杂,边界矩形不一定近似聚簇形状。基于时 空图的聚集判断算法原理是根据轨迹聚类信息建立时空图,根据时空图进行聚集判断, 缺点是时间复杂度高,当数据量增长过快时,时空图规模大,挖掘算法效率降低。
针对时空轨迹聚集模式挖掘的研究还存在以下问题:一是现有的挖掘算法中没有考 虑移动对象的运动方向属性,不能准确地反映移动对象的动态特征;二是针对轨迹聚类过程时间复杂度高,运行时间长,目前没有一个最优的聚类方案。针对以上问题,本发 明在深入研究时空轨迹聚集模式挖掘算法的基础上,提出一种基于R*树索引的聚集模 式挖掘算法,在轨迹预处理阶段,提取轨迹的运动方向、运动速度和偏移信息综合表示 轨迹,进行轨迹压缩;在聚类阶段,对轨迹按照时间区间分成轨迹段,使用基于R*树 索引的线段DBSCAN进行轨迹聚类。相关实验表明本方法相比已有算法,在保证挖掘 算法准确性的基础上具有更高的挖掘效率。
发明内容
本发明主要采用以下技术手段实现:
一种基于R*树索引的时空轨迹聚集模式挖掘算法,其特征在于,包括:
步骤1、对轨迹进行预处理,包括提取轨迹特征并对提取的轨迹特征进行关键点判断,得到压缩后轨迹;
步骤2、对步骤1得到的压缩后轨迹进行轨迹聚类,首先进行时间片划分,然后对于每个时间片创建一颗R*树,最后对每个时间片内的所有轨迹段进行聚类;
步骤3、对步骤2已经聚类后的轨迹进行聚集判断,首先经过群体判断确定群体数量,并经过聚集判断确定群体中的参与者,完成最终的聚集集合。
在上述的一种基于R*树索引的时空轨迹聚集模式挖掘算法,所述步骤1具体包括:
步骤1.1、轨迹特征提取,具体是采用轨迹的移动方向、移动速度和偏移信息三类特征来描述轨迹;
对于轨迹点序列t={(x1,y1),(x2,y2),...,(xn,yn)},(xi,yi)为轨迹点的坐标,t中元 素个数为轨迹数据所包含的轨迹点个数;
第i次采样时移动对象的运动方向计算如下:
第i次采样时移动对象运动方向的变化值的计算如下:
Δ(θi-θi-1)=min{|θi-θi-1|,2π-|θi-θi-1|}
第i次采样时移动对象的运动速度为相邻两轨迹点的连线长度与时间间隔的比值, 其速度变化值的计算为相邻点的速度之差;
Pi-1(xi-1,yi-1),Pi(xi,yi),Pi+1(xi+1,yi+1)为原始轨迹上3个连续的轨迹点,若压 缩后的轨迹为Pi-1Pi+1的连线,轨迹点Pi(xi,yi)在该线段上按时间比例的投影位置为 P′i(x′i,y′i),则第i次采样时移动对象的偏移距离即Pi(xi,yi)到P′i(x′i,y′i)的SED距离计算 如下:
其中
步骤1.2、关键点判断,得到压缩后轨迹,定义轨迹集合Tr={P1,P2,…,Pt},方向改变阈值θα,速度改变阈值θν,偏移距离阈值θd,
针对轨迹集合Tr中的每一个轨迹点,依次计算Δdir、Δsp、Δd,并进行判断:
若Δdir、Δsp、Δd满足任意条件:Δdir>θα或者Δsp>θν或者Δd>θd,
将Pi加入压缩后轨迹STr,判断Tr中的下一个轨迹点;否则,直接判断Tr中的下 一个轨迹点。
在上述的一种基于R*树索引的时空轨迹聚集模式挖掘算法,所述步骤2具体包括:
步骤2.1、进行时间片划分,具体是将时间域表示为T=<t1,t2,…,tn>,然后设置时间间隔长度λ值,将整个时间域划分成相同时间间隔的时间区间S=<τ1,τ2,...,τt>;
步骤2.2、创建R*树,具体是对于每个时间片创建一颗R*树,叶子节点存储轨迹段的最小外包矩形信息,非叶子节点含有指向下一级节点的指针,包含到下一级节点的最 小外包矩形的条目信息;
步骤2.3、聚类轨迹段,对每个时间片内的所有轨迹段进行聚类操作,具体是遍历所有轨迹段,判断当前轨迹段oi是否为核心轨迹段;通过R*树的窗口查询,找出当前 轨迹段的所有近邻轨迹段;R*树的窗口指的是轨迹段oi的扩大到聚簇半径距离阈值∈的 最小外包矩形;如果叶子节点中的轨迹段与窗口相交,则与窗口相交的轨迹段是轨迹段 oi的近邻,判断这些轨迹段的密度,若其密度超过邻域密度阈值,说明轨迹段oi是核心 轨迹段,将该轨迹段加入候选聚簇;对轨迹段oi的邻域内的轨迹段依次判断是否为核心 对象,直到所有轨迹段均已被访问,最终获得带有类别标签的聚簇集合。
在上述的一种基于R*树索引的时空轨迹聚集模式挖掘算法,所述步骤3具体包括:
步骤3.1、群体判断:在每个时间点从当前聚簇集合中检测最后一个聚簇,判断能否通过继续增加聚簇来扩展成更大的群体,具体是将前一时刻的群体中最后一个簇与当前时刻所有聚簇进行距离判断,并根据判断结果执行:
执行一、若当前时刻聚簇中有一个距离小于阈值δ的聚簇,将其加入群体;
执行二、若有多个距离小于阈值δ的聚簇,复制前一时刻群体为多个,将这些符 合条件的聚簇分别加入每个群体;
执行三、若说明没有距离小于阈值δ的聚簇,说明前一时刻的群体已经闭合,不 能再扩展;
步骤3.2、聚集判断:计算群体中每个对象出现次数,
1A)、判断每个对象是否为一个参与者,若是,则标记,否则不标记;
2A)、统计群体中每个聚簇包含的参与者个数,
3A)、判断是否满足设定参与者数目阈值,若符合阈值条件则执行步骤4A),否则到5A)
4A)、判断群体生存周期是否满足设定阈值;
5A)、对于没有足够参与者的聚簇,删除这些聚簇,并以这些聚簇为界将群体分成多个子序列,对于每个仍然为群体的子序列,重复对这些群体进行聚集判断,直到所有 群体都被遍历完成。
因此,本发明具有如下优点:本发明综合利用轨迹数据的运动方向、运动速度和偏移信息来压缩轨迹,提高算法压缩的效果;使用基于R*树索引的线段DBSCAN对轨迹 段聚类,提高算法聚类的效率。相关实验表明该算法相比同类算法挖掘效果有所提高。 接下来的工作就是将此算法运用于实际的轨迹数据聚集模式挖掘任务中,提高数据挖掘 的效果。
附图说明
图1是本发明的聚集模式挖掘算法流程示意图。
图2a是本发明的DCCR与Crowd-TAD算法进行比较后两种算法的准确性对比结果示意图(一天内不同时间段聚集数)。
图2b是本发明的DCCR与Crowd-TAD算法进行比较后两种算法的准确性对比结果示意图(典型区域的聚集结果数量)。
图2c是本发明的DCCR与Crowd-TAD算法进行比较后两种算法的准确性对比结果示意图(DCCR挖掘出的典型区域的聚集结果数量)。
图2d是本发明的DCCR与Crowd-TAD算法进行比较后两种算法的准确性对比结果示意图(DCCR与Crowd-TAD挖掘出的聚集结果的相似度对比)。
图3a是本发明的DCCR与Brute-Force、Crowd-TAD算法的效率对比结果示意图(三种算法在群体阈值个数上的效率对比)。
图3b本发明的DCCR与Brute-Force、Crowd-TAD算法的效率对比结果示意图(三 种算法在相邻时刻簇间距阈值上的效率对比)。
图3c是本发明的三种算法的效率对比结果示意图(相邻时刻簇间距阈值上的)。
图4是不同数据量的各个算法各阶段运行时间示意图。
具体实施方式
一、首先介绍下本发明的方法原理。
基于R*树索引的时空轨迹聚集模式挖掘算法,包括:
步骤1:轨迹特征提取。本发明考虑采用轨迹的移动方向、移动速度和偏移信息这三类特征来描述轨迹。
对于轨迹点序列t={(x1,y1),(x2,y2),...,(xn,yn)},(xi,yi)为轨迹点的坐标,t中元 素个数为轨迹数据所包含的轨迹点个数。
第i次采样时移动对象的运动方向计算如下:
第i次采样时移动对象运动方向的变化值的计算如下:
Δ(θi-θi-1)=min{|θi-θi-1|,2π-|θi-θi-1|}
第i次采样时移动对象的运动速度为相邻两轨迹点的连线长度与时间间隔的比值, 其速度变化值的计算为相邻点的速度之差。
Pi-1(xi-1,yi-1),Pi(xi,yi),Pi+1(xi+1,yi+1)为原始轨迹上3个连续的轨迹点,若压 缩后的轨迹为Pi-1Pi+1的连线,轨迹点Pi(xi,yi)在该线段上按时间比例的投影位置为 P′i(x′i,y′i),则第i次采样时移动对象的偏移距离即Pi(xi,yi)到P′i(x′i,y′i)的SED距离计算 如下:
其中
步骤2:关键点判断,得到压缩后轨迹。
步骤3:时间片划分。将时间域表示为T=<t1,t2,...,tn>,然后设置时间间隔长度λ值,将整个时间域划分成相同时间间隔的时间区间S=<τ1,τ2,…,τt>。
步骤4:R*树创建。对于每个时间片创建一颗R*树,其叶子节点存储轨迹段的最 小外包矩形信息,非叶子节点含有指向下一级节点的指针,包含到下一级节点的最小外 包矩形的条目信息。图3-4反映了轨迹段在R*树中的存储结构。
步骤5:轨迹段聚类。对每个时间片内的所有轨迹段进行聚类操作。遍历所有轨迹段,判断当前轨迹段oi是否为核心轨迹段。通过R*树的窗口查询,找出当前轨迹段的 所有近邻轨迹段。R*树的窗口指的是轨迹段oi的扩大到聚簇半径距离阈值∈的最小外包 矩形。如果叶子节点中的轨迹段与窗口相交,说明这些轨迹段是轨迹段oi的近邻,判断 这些轨迹段的密度,若其密度超过邻域密度阈值,说明轨迹段oi是核心轨迹段,将该轨 迹段加入候选聚簇。对轨迹段oi的邻域内的轨迹段依次判断是否为核心对象,直到所有 轨迹段均已被访问,最终获得带有类别标签的聚簇集合。
步骤6:。
在每个时间点从当前聚簇集合中检测最后一个聚簇,判断能否通过继续增加聚簇来 扩展成更大的群体;
然后计算群体中每个对象出现次数,判断该对象是否为一个参与者,统计群体中每 个聚簇包含的参与者个数,判断是否满足参与者数目阈值,若符合阈值条件则继续判断群体生存周期是否满足阈值条件,若符合阈值条件则该群体是一个聚集,否则找出没有 足够参与者的聚簇,删除这些聚簇,并以这些聚簇为界将群体分成多个子序列,对于每 个仍然为群体的子序列,重复以上步骤,直到所有群体都被发现。
二、以下是采用上述方法的具体案例。
实验所使用的轨迹数据集是从北京10357辆出租车采集到的一周的时空轨迹数据, 数据集共有752MB大小。实验环境配置为:CPU为Intel(R)Core(TM)CPU(2.50GHz), 内存8G,操作系统采用Windows,实验采用Java语言编写完成。
与本发明的研究工作最接近的是聚集模式挖掘算法Crowd-TAD,因此主要将本发明 算法DCCR与基于R树的Crowd-TAD算法进行实验对比。准确性通过挖掘出的聚集模 式数量和聚集结果相似性两方面进行比较,效率通过算法的运行时间进行比较,算法的 运行时间越短,表明算法越高效。
通过计算某个时间段的移动对象聚集数量将本发明的DCCR与Crowd-TAD算法进行比较,验证DCCR的准确性。图2显示了两种算法的准确性对比结果。
为验证本发明算法的效率,选择三种算法进行实验对比,分别是Brute-force、Crowd-TAD和本发明算法DCCR。Brute-force算法是从轨迹数据库中取出所有符合时空 约束的轨迹数据,依次遍历每一时刻的轨迹集合,对其进行扩展,最后发现聚集。 Crowd-TAD算法是取出所有轨迹,对每一时间点的轨迹聚类,用Crowd-TAD算法挖掘 出所有聚集。DCCR算法是取出给定时间和空间范围的轨迹,对给定时间范围的轨迹进 行聚类,按时间增量挖掘出所有聚集。
分两组实验,第一组实验,通过改变群体对象阈值mc、相邻时刻簇间距阈值δ和移动对象个数|ODB|这三个参数进行三种算法的效率对比。其中,默认参数为:时间数据库 TDB划分为7*24*15个时间片,每个时间片λ=4(分钟),移动对象数据库|ODB|=3000, 群体生存时间阈值kc=20(分钟),参与者生存时间阈值kp=15(分钟),参与者数目阈值mp=10,群体对象阈值mc=15,相邻时刻聚簇间的距离阈值δ=300(米)。
图3显示了三种算法的效率对比结果。
可以得出以下结论:
1)当mc增加时,所有算法运行时间都有所减少,这是因为当群体中所要求的对象阈值 增加时,对于每一个时间片满足阈值条件的聚簇就会减少,因此符合条件的候选群体就 会相应减少。另一方面,由于本文的算法DCCR使用R*树索引加快了聚类中的查询过 程,减少了计算量,使得DCCR算法效率比Crowd-TAD和Brute-Force算法均有所提高。
2)当δ增加时,所有算法运行时间都有所增加,这是因为在查询下一时间片的候选聚类时,遍历区域增大了,显然这一过程需要花更多时间。同时因为本文的DCCR算 法采用索引剪枝策略和聚簇中心间距离判断,相比Crowd-TAD采用豪斯多夫距离计算 聚簇中心距离和Brute-force算法循环遍历移动群组的方式,减少了计算量,因此比这两 种算法更加高效。
3)当增加移动对象个数|ODB|时,所有算法都需运行更长时间,因为在每一时间片有更多的聚簇在形成。值得注意的是,当数据量增加到一定程度时,本文算法DCCR反 而会比Crowd-TAD算法更耗时,这是因为随着数据量增加,算法使用的R*树索引的创 建和维护成本很高,这反而会使得改进算法失去使用R*树索引加快查询速度的优势。而 随着数据量的增加,Brute-force算法运行时间显著增长,大量轨迹段距离计算和聚簇间 距离计算使得算法效率显著降低。总体来说,本文算法的效率优于Crowd-TAD和 Brute-force算法。
第二组实验,为进一步分析三种算法效率不同的原因,记录三种算法在不同数据量 下的轨迹聚类和聚集判断阶段的运行时间,结果如图4所示。
从运行时间对比结果来看,三种算法都是在聚类阶段耗时巨大,因为聚类是从大量 轨迹数据中发现密集聚簇,而聚集检测是从少量聚簇中检测Gathering聚集,该部分运行时间相对较短。但也可以看出Brute-force算法在两个阶段运行时间均最长,因为包含大量轨迹段距离计算和聚簇间距离计算。在轨迹聚类阶段,DCCR算法使用基于R*树 索引的聚类算法,利用R*树的窗口查询,减小计算量,而Crowd-TAD算法使用最小 外包矩形进行轨迹段剪枝,仍然需要计算大量轨迹段的最小外包矩形间的距离,因此 Crowd-TAD算法聚类效率不如DCCR算法。在聚集检测阶段,Crowd-TAD算法由于使 用豪斯多夫距离计算聚簇间距离,计算复杂,计算量大,虽使用R树索引检索聚簇,聚 集检测阶段算法效率依然高于本文的DCCR算法,因为DCCR算法采用基于聚簇中心 的聚簇间距离计算,大大减少了由豪斯多夫距离带来的计算量。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域 的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (4)
1.一种基于R*树索引的时空轨迹聚集模式挖掘算法,其特征在于,包括:
步骤1、对轨迹进行预处理,包括提取轨迹特征并对提取的轨迹特征进行关键点判断,得到压缩后轨迹;
步骤2、对步骤1得到的压缩后轨迹进行轨迹聚类,首先进行时间片划分,然后对于每个时间片创建一颗R*树,最后对每个时间片内的所有轨迹段进行聚类;
步骤3、对步骤2已经聚类后的轨迹进行聚集判断,首先经过群体判断确定群体数量,并经过聚集判断确定群体中的参与者,完成最终的聚集集合。
2.根据权利要求1所述的一种基于R*树索引的时空轨迹聚集模式挖掘算法,其特征在于,所述步骤1具体包括:
步骤1.1、轨迹特征提取,具体是采用轨迹的移动方向、移动速度和偏移信息三类特征来描述轨迹;
对于轨迹点序列t={(x1,y1),(x2,y2),...,(xn,yn)},(xi,yi)为轨迹点的坐标,t中元素个数为轨迹数据所包含的轨迹点个数;
第i次采样时移动对象的运动方向计算如下:
第i次采样时移动对象运动方向的变化值的计算如下:
Δ(θi-θi-1)=min{|θi-θi-1|,2π-|θi-θi-1|}
第i次采样时移动对象的运动速度为相邻两轨迹点的连线长度与时间间隔的比值,其速度变化值的计算为相邻点的速度之差;
Pi-1(xi-1,yi-1),Pi(xi,yi),Pi+1(xi+1,yi+1)为原始轨迹上3个连续的轨迹点,若压缩后的轨迹为Pi-1Pi+1的连线,轨迹点Pi(xi,yi)在该线段上按时间比例的投影位置为P′i(x′i,y′i),则第i次采样时移动对象的偏移距离即Pi(xi,yi)到P′i(x′i,y′i)的SED距离计算如下:
其中
步骤1.2、关键点判断,得到压缩后轨迹,定义轨迹集合Tr={P1,P2,…,Pt},方向改变阈值θα,速度改变阈值θν,偏移距离阈值θd,
针对轨迹集合Tr中的每一个轨迹点,依次计算Δdir、Δsp、Δd,并进行判断:
若Δdir、Δsp、Δd满足任意条件:Δdir>θα或者Δsp>θν或者Δd>θd,
将Pi加入压缩后轨迹STr,判断Tr中的下一个轨迹点;否则,直接判断Tr中的下一个轨迹点。
3.根据权利要求1所述的一种基于R*树索引的时空轨迹聚集模式挖掘算法,其特征在于,所述步骤2具体包括:
步骤2.1、进行时间片划分,具体是将时间域表示为T=<t1,t2,…,tn>,然后设置时间间隔长度λ值,将整个时间域划分成相同时间间隔的时间区间S=<T1,T2,…,τt>;
步骤2.2、创建R*树,具体是对于每个时间片创建一颗R*树,叶子节点存储轨迹段的最小外包矩形信息,非叶子节点含有指向下一级节点的指针,包含到下一级节点的最小外包矩形的条目信息;
步骤2.3、聚类轨迹段,对每个时间片内的所有轨迹段进行聚类操作,具体是遍历所有轨迹段,判断当前轨迹段oi是否为核心轨迹段;通过R*树的窗口查询,找出当前轨迹段的所有近邻轨迹段;R*树的窗口指的是轨迹段oi的扩大到聚簇半径距离阈值∈的最小外包矩形;如果叶子节点中的轨迹段与窗口相交,则与窗口相交的轨迹段是轨迹段oi的近邻,判断这些轨迹段的密度,若其密度超过邻域密度阈值,说明轨迹段oi是核心轨迹段,将该轨迹段加入候选聚簇;对轨迹段oi的邻域内的轨迹段依次判断是否为核心对象,直到所有轨迹段均已被访问,最终获得带有类别标签的聚簇集合。
4.根据权利要求1所述的一种基于R*树索引的时空轨迹聚集模式挖掘算法,其特征在于,所述步骤3具体包括:
步骤3.1、群体判断:在每个时间点从当前聚簇集合中检测最后一个聚簇,判断能否通过继续增加聚簇来扩展成更大的群体,具体是将前一时刻的群体中最后一个簇与当前时刻所有聚簇进行距离判断,并根据判断结果执行:
执行一、若当前时刻聚簇中有一个距离小于阈值δ的聚簇,将其加入群体;
执行二、若有多个距离小于阈值δ的聚簇,复制前一时刻群体为多个,将这些符合条件的聚簇分别加入每个群体;
执行三、若说明没有距离小于阈值δ的聚簇,说明前一时刻的群体已经闭合,不能再扩展;
步骤3.2、聚集判断:计算群体中每个对象出现次数,
1A)、判断每个对象是否为一个参与者,若是,则标记,否则不标记;
2A)、统计群体中每个聚簇包含的参与者个数,
3A)、判断是否满足设定参与者数目阈值,若符合阈值条件则执行步骤4A),否则到5A)
4A)、判断群体生存周期是否满足设定阈值;
5A)、对于没有足够参与者的聚簇,删除这些聚簇,并以这些聚簇为界将群体分成多个子序列,对于每个仍然为群体的子序列,重复对这些群体进行聚集判断,直到所有群体都被遍历完成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810698222.3A CN109241126B (zh) | 2018-06-29 | 2018-06-29 | 一种基于r*树索引的时空轨迹聚集模式挖掘算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810698222.3A CN109241126B (zh) | 2018-06-29 | 2018-06-29 | 一种基于r*树索引的时空轨迹聚集模式挖掘算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109241126A true CN109241126A (zh) | 2019-01-18 |
CN109241126B CN109241126B (zh) | 2021-09-14 |
Family
ID=65072312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810698222.3A Expired - Fee Related CN109241126B (zh) | 2018-06-29 | 2018-06-29 | 一种基于r*树索引的时空轨迹聚集模式挖掘算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109241126B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109902139A (zh) * | 2019-03-12 | 2019-06-18 | 湖南科技大学 | 一种基于r树的轨迹数据压缩方法 |
CN109948701A (zh) * | 2019-03-19 | 2019-06-28 | 太原科技大学 | 一种基于轨迹间时空关联性的数据聚类方法 |
CN110232067A (zh) * | 2019-06-10 | 2019-09-13 | 长安大学 | 一种基于BHR-Tree索引的共乘群体发现方法 |
CN110457315A (zh) * | 2019-07-19 | 2019-11-15 | 国家计算机网络与信息安全管理中心 | 一种基于用户轨迹数据的群体聚集模式分析方法和系统 |
CN111078634A (zh) * | 2019-12-30 | 2020-04-28 | 中科海拓(无锡)科技有限公司 | 一种基于r树的分布式时空数据索引方法 |
CN112269844A (zh) * | 2020-09-24 | 2021-01-26 | 桂林电子科技大学 | 基于大规模轨迹数据的通用伴随模式分布式挖掘方法 |
CN112632151A (zh) * | 2020-12-25 | 2021-04-09 | 南京邮电大学 | 一种基于二分过滤的移动对象传染行为挖掘方法 |
CN112988849A (zh) * | 2021-04-27 | 2021-06-18 | 北京航空航天大学 | 一种交通轨迹模式分布式挖掘方法 |
CN113051360A (zh) * | 2021-04-16 | 2021-06-29 | 深圳前海中电慧安科技有限公司 | 一种相似轨迹的确定方法、装置、计算机设备及存储介质 |
CN113312360A (zh) * | 2021-07-28 | 2021-08-27 | 阿里云计算有限公司 | 索引建立方法、装置、设备、存储介质及计算机程序产品 |
CN113326257A (zh) * | 2020-04-30 | 2021-08-31 | 阿里巴巴集团控股有限公司 | 索引构建方法、推荐方法、装置、电子设备和计算机存储介质 |
CN115936561A (zh) * | 2022-11-18 | 2023-04-07 | 广州云达供应链管理有限公司 | 一种物流车轨迹运行异常监测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2676176A1 (fr) * | 2011-02-15 | 2013-12-25 | Snecma | Surveillance d'un moteur d'aéronef pour anticiper les opérations de maintenance |
EP3070622A1 (en) * | 2015-03-16 | 2016-09-21 | Palantir Technologies, Inc. | Interactive user interfaces for location-based data analysis |
CN106095952A (zh) * | 2016-06-15 | 2016-11-09 | 公安部第三研究所 | 基于键值云存储的时空范围内海量过车记录快速查询方法 |
CN106899306A (zh) * | 2017-02-20 | 2017-06-27 | 武汉大学 | 一种保持移动特征的车辆轨迹线数据压缩方法 |
-
2018
- 2018-06-29 CN CN201810698222.3A patent/CN109241126B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2676176A1 (fr) * | 2011-02-15 | 2013-12-25 | Snecma | Surveillance d'un moteur d'aéronef pour anticiper les opérations de maintenance |
EP3070622A1 (en) * | 2015-03-16 | 2016-09-21 | Palantir Technologies, Inc. | Interactive user interfaces for location-based data analysis |
CN106095952A (zh) * | 2016-06-15 | 2016-11-09 | 公安部第三研究所 | 基于键值云存储的时空范围内海量过车记录快速查询方法 |
CN106899306A (zh) * | 2017-02-20 | 2017-06-27 | 武汉大学 | 一种保持移动特征的车辆轨迹线数据压缩方法 |
Non-Patent Citations (1)
Title |
---|
TIANTIAN X,ET AL: "Spatio-Temporal Trajectory Gatherings Pattern Mining Method Based on R * Tree Index", 《2018 3RD INTERNATIONAL CONFERENCE FOR CONVERGENCE IN TECHNOLOGY (I2CT)》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109902139B (zh) * | 2019-03-12 | 2022-10-28 | 湖南科技大学 | 一种基于r树的轨迹数据压缩方法 |
CN109902139A (zh) * | 2019-03-12 | 2019-06-18 | 湖南科技大学 | 一种基于r树的轨迹数据压缩方法 |
CN109948701A (zh) * | 2019-03-19 | 2019-06-28 | 太原科技大学 | 一种基于轨迹间时空关联性的数据聚类方法 |
CN110232067A (zh) * | 2019-06-10 | 2019-09-13 | 长安大学 | 一种基于BHR-Tree索引的共乘群体发现方法 |
CN110457315A (zh) * | 2019-07-19 | 2019-11-15 | 国家计算机网络与信息安全管理中心 | 一种基于用户轨迹数据的群体聚集模式分析方法和系统 |
CN111078634A (zh) * | 2019-12-30 | 2020-04-28 | 中科海拓(无锡)科技有限公司 | 一种基于r树的分布式时空数据索引方法 |
CN111078634B (zh) * | 2019-12-30 | 2023-07-25 | 中科海拓(无锡)科技有限公司 | 一种基于r树的分布式时空数据索引方法 |
CN113326257A (zh) * | 2020-04-30 | 2021-08-31 | 阿里巴巴集团控股有限公司 | 索引构建方法、推荐方法、装置、电子设备和计算机存储介质 |
CN113326257B (zh) * | 2020-04-30 | 2023-12-15 | 阿里巴巴集团控股有限公司 | 索引构建方法、推荐方法、装置、电子设备和计算机存储介质 |
CN112269844B (zh) * | 2020-09-24 | 2021-08-06 | 桂林电子科技大学 | 基于大规模轨迹数据的通用伴随模式分布式挖掘方法 |
CN112269844A (zh) * | 2020-09-24 | 2021-01-26 | 桂林电子科技大学 | 基于大规模轨迹数据的通用伴随模式分布式挖掘方法 |
CN112632151A (zh) * | 2020-12-25 | 2021-04-09 | 南京邮电大学 | 一种基于二分过滤的移动对象传染行为挖掘方法 |
CN112632151B (zh) * | 2020-12-25 | 2023-02-10 | 南京邮电大学 | 一种基于二分过滤的移动对象传染行为挖掘方法 |
CN113051360A (zh) * | 2021-04-16 | 2021-06-29 | 深圳前海中电慧安科技有限公司 | 一种相似轨迹的确定方法、装置、计算机设备及存储介质 |
CN113051360B (zh) * | 2021-04-16 | 2024-04-09 | 深圳前海中电慧安科技有限公司 | 一种相似轨迹的确定方法、装置、计算机设备及存储介质 |
CN112988849A (zh) * | 2021-04-27 | 2021-06-18 | 北京航空航天大学 | 一种交通轨迹模式分布式挖掘方法 |
CN113312360B (zh) * | 2021-07-28 | 2022-01-04 | 阿里云计算有限公司 | 索引建立方法、装置、设备、存储介质及计算机程序产品 |
CN113312360A (zh) * | 2021-07-28 | 2021-08-27 | 阿里云计算有限公司 | 索引建立方法、装置、设备、存储介质及计算机程序产品 |
CN115936561A (zh) * | 2022-11-18 | 2023-04-07 | 广州云达供应链管理有限公司 | 一种物流车轨迹运行异常监测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109241126B (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241126A (zh) | 一种基于r*树索引的时空轨迹聚集模式挖掘算法 | |
CN111475596B (zh) | 一种基于多层级轨迹编码树的子段相似性匹配方法 | |
CN107016126A (zh) | 一种基于序列模式挖掘的多用户模型移动轨迹预测方法 | |
Jana et al. | YOLO based Detection and Classification of Objects in video records | |
Potamias et al. | Sampling trajectory streams with spatiotemporal criteria | |
CN107103754B (zh) | 一种道路交通状况预测方法及系统 | |
Fang et al. | FTPG: A fine-grained traffic prediction method with graph attention network using big trace data | |
CN105117424B (zh) | 一种基于停留时间的移动对象语义行为模式挖掘方法 | |
CN108153867B (zh) | 基于时间规律性的用户轨迹预测方法和装置 | |
CN103246706A (zh) | 一种道路网络空间中车辆对象移动轨迹聚类的方法 | |
CN104657424A (zh) | 一种多时空特征融合下的兴趣点轨迹聚类方法 | |
CN109671102A (zh) | 一种基于深度特征融合卷积神经网络的综合式目标跟踪方法 | |
CN107944628A (zh) | 一种路网环境下的聚集模式发现方法及系统 | |
CN111523577A (zh) | 一种基于改进的lcss算法的海量轨迹相似度计算方法 | |
CN109829936A (zh) | 一种目标追踪的方法及设备 | |
Salehi et al. | Local outlier detection for data streams in sensor networks: Revisiting the utility problem invited paper | |
CN110263840A (zh) | 一种线路分析方法、装置及程序产品、存储介质 | |
CN113779105B (zh) | 分布式轨迹流伴随模式挖掘方法 | |
CN108182230B (zh) | 基于位向量四叉树的移动对象汇聚模式挖掘方法 | |
CN112559587B (zh) | 基于城市语义图谱的轨迹时空语义模式提取方法 | |
Xie et al. | Road network inference from GPS traces using DTW algorithm | |
CN110909037B (zh) | 一种频繁轨迹模式的挖掘方法及装置 | |
CN112765226A (zh) | 基于轨迹数据挖掘的城市语义图谱构建方法 | |
CN110309332A (zh) | 一种融合工程语义的cad模型局部结构检索方法 | |
CN109800231A (zh) | 一种基于Flink的实时轨迹co-movement运动模式检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210914 |