CN106339580A - 一种基于迁移轨迹的集群模式发现方法 - Google Patents

一种基于迁移轨迹的集群模式发现方法 Download PDF

Info

Publication number
CN106339580A
CN106339580A CN201610689375.2A CN201610689375A CN106339580A CN 106339580 A CN106339580 A CN 106339580A CN 201610689375 A CN201610689375 A CN 201610689375A CN 106339580 A CN106339580 A CN 106339580A
Authority
CN
China
Prior art keywords
cluster
candidate
pattern
current
loose
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201610689375.2A
Other languages
English (en)
Inventor
卢晓珍
徐小龙
王新珩
孙雁飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201610689375.2A priority Critical patent/CN106339580A/zh
Publication of CN106339580A publication Critical patent/CN106339580A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于迁移轨迹的集群模式发现方法。本方案所要解决的技术问题在于克服现有组群模式的局限性——同一模式下的组移动或遵循类似的路径移动,提供一种基于迁移轨迹的集群模式发现方法,将利用组群发现算法,在运动过程中,利用每个时隙的簇集来确定属于当前模式下的组群数目。为了降低对时隙连续性的要求,本发明还进一步改进迁移轨迹的集群模式发现方法。相比现有的技术,本发明方法可以找出更准确的群组成员。

Description

一种基于迁移轨迹的集群模式发现方法
技术领域
本发明涉及基于人类轨迹的运动模式研究,具体涉及一种基于迁移轨迹的集群模式发现方法,属于组群关系、移动计算等信息技术类应用领域。
背景技术
位置获取设备的技术和跟踪技术的进步,使得各种各样的移动物体的运动轨迹数据的获得成为可能。这些轨迹数据使得我们能够从一些新的技术视角,发现关于运动行为更为有价值的东西,比如运动模式的发掘。
一个有趣的发现群体的方向是哪些人是一起移动或者以类似的方式移动,这表明人的群关系和他们的行为是高度相关的。例如,零售商可以通过了解某个群体中一个人的行为方式,他就可以了解到这整个群体的购买兴趣,从而开发出特定的定价模式,并且可以提供个性化的服务。
一些研究已经提出移动物体的运动模式,例如羊群、护航队和蜂群等。这些模式的共同点是:在其生命周期内,每个群体里面的个体是不变的。在另一个研究领域,存在着群体模式的另一种定义,在其生命周期内,每个群体里面的个体可以产生更替,但它们需要在连续时隙中任意两个群体有着共同的对象(大)足够多,比如已经提出的宽松的旅行伴侣、移动集群和松散集团运动模式。
发明内容
本发明所要解决的技术问题在于克服现有组群模式的局限性——同一模式下的组对象需一起移动或遵循类似的路径移动,提供一种基于迁移轨迹的集群模式发现方法,将利用组群发现算法,在运动过程中,利用每个时隙的簇集来确定属于当前模式下的组群数目。为了降低对时隙连续性的要求,本发明进一步改进迁移轨迹的集群模式发现方法。
本发明采用以下技术方案解决上述技术问题。
一种基于迁移轨迹的集群模式发现方法,假设每个轨迹有着不同的长度和采样率,为了与这些特征相适应,采用最长公共子序列作为距离度量,它允许随着时间的推移扩展序列。如果时间间隔接近,对象在空间中可以在不同时间间隔完成瞬时匹配,除了强大的噪声外,它通常出现在时空轨迹的情况下。应用标准的空间聚类算法,即分层聚类确定在时隙t的集群,将聚类作为一个预处理过程,因为在不同的场景下,聚类的方法也会有所不同,其实现按照以下方案A和B完成:
方案A:
步骤A-1、在聚类阶段,在所有轨迹中运用分层聚类,将所有的数据集进行分类;
步骤A-2、在给定的是在时隙t内,使用之前已发现的集群,用特定的方法扩展当前的候选者;
步骤A-3、考虑当前的候选者P,对于每一个集群c,如果它的子序列是P的成员,则将c加入一个临时的列表;
步骤A-4、检查完所有的集群和建立临时的列表后,如果发现P和所建列表中有相同的成员,那么可以从P中得出下一个候选者,满足条件的候选者被视为松散的旅伴模式,即有效的候选者;
步骤A-5、一旦P不进行扩展,则需检查它是否为封闭松散旅伴模式,如果P不存在一个有效的SUP-模式,则认为P是封闭模式;
步骤A-6、从当前子集创建新的候选者。簇集S将从当前的集群中获得,候选子集Vnext中,只有闭合子集且满足大小要求,才能被添加到新的候选列表中。
为了降低对时隙连续性的要求,改进基于迁移轨迹的集群模式发现方法,该方法同样包含三个阶段:聚类、扩展当前候选者和创建新的候选者,使得该方法具有更一般地应用,进一步采用以下技术方案:
方案B:
步骤B-1、在聚类阶段,在所有轨迹中运用分层聚类,将所有的数据集进行分类;
步骤B-2、在给定的是在时隙t内,使用之前已发现的集群,用特定的方法扩展当前的候选者;
步骤B-3、考虑当前的候选者P,对于每一个集群c,如果它的子序列是P的成员,则将c加入一个临时的列表;
步骤B-4、检查完所有的集群和建立临时的列表后,如果发现P和所建列表中有相同的成员,那么可以从P中得出下一个候选者,满足条件的候选者被视为松散旅伴模式,即有效的候选者;
步骤B-5、对于任何一个未被簇集扩展的候选者P(P.assigned=False),需要检查最后簇集和当前时间的间隙。如果该间隙没有超过间隙阈值lC,则将P加入下一轮的候选集中,否则,则需检查它是否为一个合格的弱连续松散旅伴模式;
步骤B-6、从当前子集创建新的候选者。簇集S将从当前的集群中获得,候选子集Vnext中,只有闭合子集且满足大小要求,才能被添加到新的候选列表中。
由于弱连续松散旅伴模式允许各个簇集存在时间间隙,因此,相比于松散旅伴模式,弱连续松散旅伴模式能够找到更加完整和更长的群组。
考虑一个实际的轨迹数据库模型,并且假设每个轨迹有着不同的长度和采样率,为了与这些特征相适应,采用最长公共子序列作为距离度量,它允许随着时间的推移扩展序列。如果时间间隔接近,对象在空间中可以在不同时间间隔完成瞬时匹配,除了强大的噪声外,它通常出现在时空轨迹的情况下。应用标准的空间聚类算法,即分层聚类确定在时隙ith的集群,将聚类作为一个预处理过程,因为在不同的场景下,聚类的方法也会有所不同。
为了减少计算时间,机场场景下应用最大阈值,即考虑最大组数为20。
有益效果
(1)所提出的松散旅伴模式,可以让同属于一个主群的成员在移动过程中服务于其他不同的子群;
(2)所提出的发现算法可以很准确地找出所有封闭模式;
(3)所提出的弱连续松散的旅伴模式,能够明显地降低对时隙连续性的要求,更加符合实际问题中的情况;
(4)当某个主群中拥有的成员数目很多,并且寿命较长时,本发明所提出的方法具有更明显的优势;
(5)所提出组群模式符合于现实生活中人类的轨迹,通过某对象属于哪个主群,可以了解他们的行为和他们的需要。
附图说明
图1是机场乘客分布示意图;
图2是运动模式举例示意图。
具体实施方式
下面结合附图对本发明的技术方案进行详细说明:
本发明的思路是在研究人类轨迹的应用时,利用迁移轨迹的模式特点,考虑组群的演变过程以及群体的形成,提出了松散旅伴模式,为了降低对连续性的要求,将该方法扩展弱连续松散旅伴模式,并提出了两种相应的发现算法来验证两种模式。
在对本发明技术方案进行详细描述前,先对所提出的组群模式进行简要介绍:
定义1:一个对象O的轨迹Tr可以表示为Tr=<p1,p2,...,pn>,其中pi为包含位置和时间戳属性的点,假设t∈{1,...,T}作为时间间隔,其中T为一个周期,ODB(t)表示在时间间隔t内的对象集。
在此,考虑一个实际的轨迹数据库模型,并且假设每个轨迹有着不同的长度和采样率,为了与这些特征相适应,我们采用最长公共子序列作为距离度量,它允许随着时间的推移扩展序列。如果时间间隔接近,对象在空间中可以在不同时间间隔完成瞬时匹配,除了强大的噪声外,它通常出现在时空轨迹的情况下。应用标准的空间聚类算法,即分层聚类确定在时隙ith的集群,将聚类作为一个预处理过程,因为在不同的场景下,聚类的方法也会有所不同。
最终输出的集群数据库CDB=<C1,C2,...,Cn>,Ci是在时隙i获得的一系列集群,Ci=〈ci,1,ci,2,...,ci,j〉,j是在该时隙内的集群数,而观察每个集群的频率用c.f表示。
定义Si=〈csi,1,csi,2,...,csi,k>在时隙i作为C的子集,cs是Ci的子集,k代表了所有的子集数目(除了空集),将每个S叫做一个簇集。例如图2中,当t=2时,C2=<c2,c3,c4>,S2=<<c2>,<c3>,<c4>,<c2,c3>,<c2,c4>,〈c3,c4〉,〈c2,c3,c4>>,且cs2,4=〈c2,c3〉。将簇集的时间戳定义为cs.t,在不同的时隙组合簇集,定义松散旅伴模式如下:
定义2:给定一组轨迹,大小阈值为mG、时间阈值为dG和频率阈值为fC,确定一个对象集OG和一个簇集序列TS=〈cs1,a1,cs2,a2,...,csn,an〉(n=t2-t1+1)在间隔[t1,t2]作为一个松散旅伴模式,如果它满足以下条件:
1)cs1.t=t1,csn.t=t2,t2-t1≥dG
2)|OG|≥mG
3)∪cj=OG
4)cj=OG,cj.f≥fc
则OG在区间[t1,t2]上是一个松散旅伴,TS是簇集的一个序列,一对OG和TS:P=<OG,TS>在区间[t1,t2]就叫做松散旅伴模式。
基于集群中的集簇间的联合运作,推导出一个符合定义2中条件3的集群序列。通过观察,发现一个松散旅伴模式不需要所有成员在每个时隙保持密切联系,定义2中的条件4就约束了所有成员需要保持并拢的次数。图2中显示了一个松散旅伴模式在区间[1,5]包含了{O1,O2,O3,O4,O5,O6,O7}成员(fC=2,mG=7)。
如前面所提及的,在一些时段,可能有一些成员会离开所在集群,而加入另外一个集群。为了避免丢失这些成员,本发明定义了一个新的成员模式:弱连续松散旅伴模式,是松散旅伴模式在非严格连续场景的延伸。弱连续松散旅伴模式和松散旅伴模式之间的区别在于:各个簇集间时间间隔的概率,考虑一个在区间[t1,t2]的簇集序列TS=<cs1,a1,cs2,a2,...,csn,an>(n=t2-t1+1)和时间间隔阈值lC,则应该满足以下条件:
考虑两个松散旅伴模式/弱连续松散旅伴模式,P=<OG,TS>和P′=<O′G,TS′>。如果且TS是TS′的子序列,那么P是P′的子模式,P′是P的SUP-模式。如果没有SUP-模式,则一个松散旅伴模式/弱连续松散旅伴模式就称为封闭模式。
本发明还提出了两种在轨迹数据库中发现所有封闭模式的算法。
松散旅伴模式发现算法主要分为三个部分:聚类、扩展当前的候选者和从当前子集创建新的候选者。
任务执行过程如下:
(1)初始化,设定当前的松散旅伴模式候选者;
(2)对于每个时隙t,设定新的松散旅伴模式候选者;
(3)在所有轨迹中运用分层聚类,将数据集分类;
(4)验证某个属于V的候选者是否为一个松散旅伴模式;
(5)考虑当前的候选者P,对于每一个集群c,如果它的子序列是P的成员,则将c加入一个临时的列表templist;
(6)检查完所有的集群和建立templist后,如果发现P和templist中有相同的成员,那么可以从P中得出Pnext
(7)满足定义2中条件的候选者被视为松散旅伴模式,即有效的候选者;
(8)一旦P不进行扩展,则需检查它是否为封闭松散旅伴模式,如果P不存在一个有效的SUP-模式,则认为P是封闭模式;
(9)对于一个子集csi,如果不存在一个Pj使得csi.OG=Pj.OG,则说明csi是一个封闭子集;簇集S将从当前的集群中获得,候选子集Vnext中,只有闭合子集且满足大小要求,才能被添加到新的候选列表中。
为了减少该步骤的计算时间,将最大阈值应用于机场场景下,即考虑最大组数为20。
弱连续松散旅伴模式发现算法同样包含三个阶段。聚类和发现新候选者两个阶段与松散旅伴模式发现算法类似,由于对时间间隔的连续性要求降低,扩展当前候选者与前面的算法不同。扩展阶段分为两个部分:第一部分与松散旅伴模式发现算法相同;第二部分,对于任何一个未被簇集扩展的候选者P(P.assigned=False),需要检查最后簇集和当前时间的间隙。如果该间隙没有超过间隙阈值lC,则将P加入下一轮的候选集中,否则,则需检查它是否为一个合格的弱连续松散旅伴模式。
任务执行过程如下:
(1)初始化,设定当前的松散旅伴模式候选者;
(2)对于每个时隙t,设定新的松散旅伴模式候选者;
(3)在所有轨迹中运用分层聚类,将数据集分类;
(4)验证某个属于V的候选者是否为一个松散旅伴模式;
(5)考虑当前的候选者P,对于每一个集群c,如果它的子序列是P的成员,则将c加入一个临时的列表templist;
(6)检查完所有的集群和建立templist后,如果发现P和templist中有相同的成员,那么可以从P中得出Pnext
(7)满足定义2中条件的候选者被视为松散旅伴模式,即有效的候选者;
(8)对于任何一个未被簇集扩展的候选者P(P.assigned=False),需要检查最后簇集和当前时间的间隙。如果该间隙没有超过间隙阈值lC,则将P加入下一轮的候选集中,否则,则需检查它是否为一个合格的弱连续松散旅伴模式;
(9)对于一个子集csi,如果不存在一个Pj使得csi.OG=Pj.OG,则说明csi是一个封闭子集;簇集S将从当前的集群中获得,候选子集Vnext中,只有闭合子集且满足大小要求,才能被添加到新的候选列表中。
实施例:
表1表示了在图2中识别松散旅伴模式的过程。很明显,小组成员在其生命期内是不变的(OG={O1-O7}),然而各成员服务于不同的子集群。所有的成员在两个时隙(t=1和t=4)在一起保持密切联系,当fC=2时,定义2中的条件4也能够满足。值得指出的是,阈值参数可以根据不同的场景改变,例如,在图1中的机场场景下,mG=2。
由于弱连续松散旅伴模式允许各个簇集存在时间间隙,因此,相比于松散旅伴模式,弱连续松散旅伴模式能够找到更加完整和更长的群组。在图2中,如果设置lC=2,弱连续松散旅伴模式在时隙[1-8]可以找到如下群组:<{O1-O7},<<C1>,<C2,C3>,<C5,C6>,<C7>,<C8,C9>>>。
表1在图2中识别松散旅伴模式的过程
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内,本发明要求保护范围由所附的权利要求书其等效物界定。

Claims (1)

1.一种基于迁移轨迹的集群模式发现方法,其特征在于,假设每个轨迹有着不同的长度和采样率,为了与这些特征相适应,采用最长公共子序列作为距离度量,允许随着时间的推移扩展序列;如果时间间隔接近,对象在空间中在不同时间间隔完成瞬时匹配。应用标准的空间聚类算法,即分层聚类确定在时隙t的集群,将聚类作为一个预处理过程,其实现按照以下方案A和B完成:
方案A:
步骤A-1、在聚类阶段,在所有轨迹中运用分层聚类,将所有的数据集进行分类;
步骤A-2、在给定的是在时隙t内,使用之前已发现的集群,用特定的方法扩展当前的候选者;
步骤A-3、考虑当前的候选者P,对于每一个集群c,如果它的子序列是P的成员,则将c加入一个临时的列表;
步骤A-4、检查完所有的集群和建立临时的列表后,如果发现P和所建列表中有相同的成员,那么可以从P中得出下一个候选者,满足条件的候选者被视为松散的旅伴模式,即有效的候选者;
步骤A-5、一旦P不进行扩展,则需检查它是否为封闭松散旅伴模式,如果P不存在一个有效的SUP-模式,则认为P是封闭模式;
步骤A-6、从当前子集创建新的候选者,簇集S将从当前的集群中获得,候选子集Vnext中,只有闭合子集且满足大小要求,才能被添加到新的候选列表中;
为了降低对时隙连续性的要求,改进基于迁移轨迹的集群模式发现方法,该方法同样包含三个阶段:聚类、扩展当前候选者和创建新的候选者,使得该方法具有更一般地应用,进一步采用以下技术方案:
方案B:
步骤B-1、在聚类阶段,在所有轨迹中运用分层聚类,将所有的数据集进行分类;
步骤B-2、在给定的是在时隙t内,使用之前已发现的集群,用特定的方法扩展当前的候选者;
步骤B-3、考虑当前的候选者P,对于每一个集群c,如果它的子序列是P的成员,则将c加入一个临时的列表;
步骤B-4、检查完所有的集群和建立临时的列表后,如果发现P和所建列表中有相同的成员,那么可以从P中得出下一个候选者,满足条件的候选者被视为松散旅伴模式,即有效的候选者;
步骤B-5、对于任何一个未被簇集扩展的候选者P(P.assigned=False),需要检查最后簇集和当前时间的间隙,如果该间隙没有超过间隙阈值lC,则将P加入下一轮的候选集中,否则,则需检查它是否为一个合格的弱连续松散旅伴模式;
步骤B-6、从当前子集创建新的候选者。簇集S将从当前的集群中获得,候选子集Vnext中,只有闭合子集且满足大小要求,才能被添加到新的候选列表中。
CN201610689375.2A 2016-08-18 2016-08-18 一种基于迁移轨迹的集群模式发现方法 Withdrawn CN106339580A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610689375.2A CN106339580A (zh) 2016-08-18 2016-08-18 一种基于迁移轨迹的集群模式发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610689375.2A CN106339580A (zh) 2016-08-18 2016-08-18 一种基于迁移轨迹的集群模式发现方法

Publications (1)

Publication Number Publication Date
CN106339580A true CN106339580A (zh) 2017-01-18

Family

ID=57824808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610689375.2A Withdrawn CN106339580A (zh) 2016-08-18 2016-08-18 一种基于迁移轨迹的集群模式发现方法

Country Status (1)

Country Link
CN (1) CN106339580A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110139221A (zh) * 2019-05-09 2019-08-16 特斯联(北京)科技有限公司 一种基于手机信号微卡口的人口集群动态监测方法与系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110139221A (zh) * 2019-05-09 2019-08-16 特斯联(北京)科技有限公司 一种基于手机信号微卡口的人口集群动态监测方法与系统
CN110139221B (zh) * 2019-05-09 2020-02-14 特斯联(北京)科技有限公司 一种基于手机信号微卡口的人口集群动态监测方法与系统

Similar Documents

Publication Publication Date Title
Zhu et al. RGBT tracking by trident fusion network
CN104933710B (zh) 基于监控视频下的商店人流轨迹智能分析方法
CN109766868B (zh) 一种基于身体关键点检测的真实场景遮挡行人检测网络及其检测方法
CN103714181B (zh) 一种层级化的特定人物检索方法
CN108875816A (zh) 融合置信度准则和多样性准则的主动学习样本选择策略
CN105227907B (zh) 基于视频的无监督异常事件实时检测方法
CN103226835B (zh) 基于在线初始化梯度增强回归树的目标跟踪方法及系统
CN106529477A (zh) 基于显著轨迹和时空演化信息的视频人体行为识别方法
CN106228109A (zh) 一种基于骨骼运动轨迹的动作识别方法
CN109871875A (zh) 一种基于深度学习的建筑物变化检测方法
CN106295532A (zh) 一种视频图像中的人体动作识别方法
CN104484890A (zh) 基于复合稀疏模型的视频目标跟踪方法
CN104123714B (zh) 一种人流量统计中最优目标检测尺度的生成方法
CN105320963B (zh) 面向高分遥感图像的大尺度半监督特征选择方法
CN107944628A (zh) 一种路网环境下的聚集模式发现方法及系统
CN105046720B (zh) 基于人体运动捕捉数据字符串表示的行为分割方法
CN103955671A (zh) 基于快速判别公共向量算法的人体行为识别方法
Li et al. A top–bottom clustering algorithm based on crowd trajectories for small group classification
CN102902976A (zh) 一种基于目标及其空间关系特性的图像场景分类方法
Xu et al. Occlusion problem-oriented adversarial faster-RCNN scheme
Weinmann et al. A hybrid semantic point cloud classification-segmentation framework based on geometric features and semantic rules
CN106056627A (zh) 一种基于局部鉴别性稀疏表示的鲁棒目标跟踪方法
CN103577804A (zh) 基于sift流和隐条件随机场的人群异常行为识别方法
CN105184654A (zh) 一种基于社区划分的舆情热点实时获取方法与获取装置
CN112559587B (zh) 基于城市语义图谱的轨迹时空语义模式提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20170118