CN112100243B - 一种基于海量时空数据分析的异常聚集检测方法 - Google Patents
一种基于海量时空数据分析的异常聚集检测方法 Download PDFInfo
- Publication number
- CN112100243B CN112100243B CN202010969343.4A CN202010969343A CN112100243B CN 112100243 B CN112100243 B CN 112100243B CN 202010969343 A CN202010969343 A CN 202010969343A CN 112100243 B CN112100243 B CN 112100243B
- Authority
- CN
- China
- Prior art keywords
- aggregation
- abnormal
- periodic
- historical
- track
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002776 aggregation Effects 0.000 title claims abstract description 184
- 238000004220 aggregation Methods 0.000 title claims abstract description 184
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 55
- 238000001514 detection method Methods 0.000 title claims abstract description 43
- 238000007405 data analysis Methods 0.000 title claims abstract description 23
- 230000000737 periodic effect Effects 0.000 claims abstract description 61
- 238000000034 method Methods 0.000 claims abstract description 18
- 230000007613 environmental effect Effects 0.000 claims abstract description 14
- 230000004931 aggregating effect Effects 0.000 claims abstract description 5
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 abstract description 5
- 238000005065 mining Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于海量时空数据分析的异常聚集检测方法,属于异常聚集检测技术领域。其特征在于:包括如下步骤:步骤1,轨迹预处理;步骤2,聚集发现;步骤3,聚集分类;步骤4,异常聚集检测。在本基于海量时空数据分析的异常聚集检测方法中,首先从轨迹数据中捕获各种聚集。其次从历史轨迹中提取时空特征,将聚集分为非预期聚集和候选的周期性聚集。再次,进一步研究了周期性聚集的强度,结合环境因素动态识别其异常,并结合之前获得的孤立聚集和非周期性聚集形成异常聚集,实现了大规模轨迹流异常聚集的在线检测。改进了群体模式,捕获了由具有共同目的或行为的相关对象组成的集合。并采用不同的插值策略,使其适用于稀疏时空数据的模式挖掘。
Description
技术领域
一种基于海量时空数据分析的异常聚集检测方法,属于异常聚集检测技术领域。
背景技术
轨迹挖掘近年来受到了广泛的关注。许多应用,如社区推荐、交通预测、出租车轨迹异常检测等,都得益于轨迹挖掘。异常聚集检测着眼于发现一种称为聚集的群体模式,并提出一种基于历史时空特征的异常检测方法,一般来说,聚集是由一定数量的个体在一段时间内出现在一个区域内形成的。聚集和热点有明显的区别,后者只包含大量的个体,但是这些个体可能只是巧合地通过该区域而且行动方式完全不同,聚集检测可以帮助监测各种不寻常的群体事件。
现有的技术中已经提出了一些群体模式,如flock、convoy、swarm、gathering等。这些群体模式往往要求群体中始终存在同一组个体,或者并不保证成员随着时间的推移而逐渐变化,这些都与congregation的定义不一致。另外,现有的技术大多考虑到聚集已经是一个不寻常的事件,所以没有对聚集的结果进行进一步的分析。
现有的研究大多由于考虑到聚集已经是一个不寻常的事件,所以没有对聚集的结果进行进一步的分析,但进一步的分析有助于提高异常聚集检测结果的质量,现实中,采用异常聚集检测方法往往对不可预测活动的实时监测具有更重要的价值。同时,现有的技术程序并行度不够,无法在线地对大规模轨迹流中的异常聚集进行检测。
发明内容
本发明要解决的技术问题是:克服现有技术的不足,提出一种首先从轨迹数据中捕获各种聚集,其次从历史轨迹中提取时空特征,将聚集分为非预期聚集和候选的周期性聚集。再次,进一步研究了周期性聚集的强度,结合环境因素动态识别其异常,并结合之前获得的孤立聚集和非周期性聚集形成异常聚集,实现了大规模轨迹流异常聚集在线检测的基于海量时空数据分析的异常聚集检测方法。
本发明解决其技术问题所采用的技术方案是:该基于海量时空数据分析的异常聚集检测方法,其特征在于:包括如下步骤:
步骤1,轨迹预处理;结合历史轨迹与当前轨迹得到点的平均位置,同时通过历史轨迹与当前轨迹的对比得到该点的缺失位置,对于无法报告位置的点进行插补处理,确定该点的插补值,通过插补值与平均位置确定该点处理后的轨迹;
步骤2,聚集发现;生成快照聚类,认定聚集在任何时候都包含一定数量的普通成员和核心成员,当一个人群在一段时间内所有的时间片簇中都包含了数量超过了阈值的核心成员和阈值的普通成员,如果人群在任何时候都包含足够的核心成员,则定义为聚集;
步骤3,聚集分类;将聚集分为三类:孤立聚集、候选周期性聚集中的非周期性聚集和周期性聚集;
步骤4,异常聚集检测;根据每个聚集的历史数据和当前数据,为其设置参与人数阈值,同时根据历史数据计算其持续时间的平均值,当新聚集的参与者人数大于等于其参与人数阈值,同时时间长于聚集的平均值判定该聚集为异常聚集。
首先从轨迹数据中捕获各种聚集。其次从历史轨迹中提取时空特征,将聚集分为非预期聚集和候选的周期性聚集。再次,进一步研究了周期性聚集的强度,结合环境因素动态识别其异常,并结合之前获得的孤立聚集和非周期性聚集形成异常聚集,实现了大规模轨迹流异常聚集的在线检测。
优选的,在所述步骤1中,通过历史轨迹与当前轨迹的对比时,分别计算两个点之间的球面距离以及某个点的历史位置与当前位置的最大距离。
优选的,所述的两个点之间球面距离的计算公式为:
历史位置与当前位置的最大距离的计算公式为:
其中,p表示点的当前位置,q表示点的某个历史位置,p1表示点当前位置的纬度角,p2表示当前位置的经度角,q1表示点某历史位置的纬度角,q2表示某历史位置的经度角,Q表示点的历史位置的集合,r表示地球半径。
优选的,在所述步骤2中生成快照聚类时,采用基于密度的并行化聚类算法MRDBSCAN。
优选的,在所述步骤3中,所述的孤立聚集为对附近的聚集进行聚类,得到最初的候选周期聚集集合,而由于附近没有历史聚集异常值的聚集。
优选的,在所述步骤3中,所述的周期性聚集是候选周期性聚集的子集,即周期性聚集中所包含的聚集,两两之间的距离小于阈值的聚集。
优选的,在所述步骤3中,所述周期性聚集历史和当前聚集状况之间差异的计算公式为:
其中,m表示聚集的数量,第n个时间戳下的环境参数δenvn表示环境参数,k表示第k个聚集,j表示选取最近的j个时间戳,i表示第i个聚集,n表示当前在第n个时间戳下,表示第n个时间戳下第k个聚集的状态,/>表示第i个时间戳下第k个聚集的状态。
与现有技术相比,本发明所具有的有益效果是:
1、在本基于海量时空数据分析的异常聚集检测方法中,首先从轨迹数据中捕获各种聚集。其次从历史轨迹中提取时空特征,将聚集分为非预期聚集和候选的周期性聚集。再次,进一步研究了周期性聚集的强度,结合环境因素动态识别其异常,并结合之前获得的孤立聚集和非周期性聚集形成异常聚集,实现了大规模轨迹流异常聚集的在线检测。
2、改进了群体模式,捕获了由具有共同目的或行为的相关对象组成的集合。并根据不同的数据源采用不同的插值策略,使其适用于稀疏时空数据的模式挖掘。
3、通过对长期聚集结果的进一步研究,提出了一种新的异常聚集检测方法。其基本思想是将候选的周期性聚集的位置附近的聚集从孤立的聚集中分离来,然后从候选者中提取周期性聚集。最终,所有孤立的聚集、从候选的周期性聚集中分离出来的非周期性聚集和具有异常强度的周期性聚集组成了新的异常聚集。
4、程序主要耗时的部分被并行化,加上增量更新优化,从而形成在线检测大规模轨迹流中的异常聚集的解决方案,这意味着它可以立即对更新的轨迹做出响应。
附图说明
图1为基于海量时空数据分析的异常聚集检测方法图。
图2为基于海量时空数据分析的异常聚集检测方法增量更新示意图。
图3为基于海量时空数据分析的异常聚集检测方法快照群集,人群和聚集示例示意图。
图4为基于海量时空数据分析的异常聚集检测方法非预期性聚集,周期性聚集和异常聚集示例示意图。
图5为基于海量时空数据分析的异常聚集检测方法严格的周期性示意图。
图6为基于海量时空数据分析的异常聚集检测方法改进的周期性示意图。
图7为基于海量时空数据分析的异常聚集检测方法除偶然性聚集缺失的影响示意图。
具体实施方式
图1~7是本发明的最佳实施例,下面结合附图1~7对本发明做进一步说明。
如图1所示,一种基于海量时空数据分析的异常聚集检测方法(以下简称异常聚集检测方法),包括如下步骤:
步骤1,轨迹预处理;
首先确定点停止或移动的状态,结合历史轨迹与当前轨迹得到该点的平均位置。同时通过历史轨迹与当前轨迹的对比得到该点的缺失位置,并通过以下公式(1)和公式(2)分别计算两个点之间的球面距离以及某个点历史位置与当前位置的最大距离:
其中,p表示点的当前位置,q表示点的某个历史位置,p1表示点当前位置的纬度角,p2表示当前位置的经度角,q1表示点某历史位置的纬度角,q2表示某历史位置的经度角,Q表示点的历史位置的集合,r表示地球半径。
对于无法报告位置的点,需要进行插补处理,确定该点的插补值,通过插补值与平均位置确定该点处理后的轨迹,完成轨迹预处理步骤。
在进行差值处理时,基于数据源生成的缺失位置的虚拟位置,对慢速运动的物体进行线性插值。而对于高速的,可能被车辆所载的物体,则采用地图匹配预测算法进行插值。为了加速插值操作,在本异常聚集检测方法中,通过原有对象集合Sk和停止状态对象集Oidle,以确定所有对象的插值必要性,而不是检查每个对象的最后kv时间戳轨迹。
如图2所示,与Sk(t-1)相比,集合Sk(t)包含了在t处出现,而[t-kv-1,t-1]中没有出现的对象,并排除了出现在t-kv-2处但没有出现在[t-kv-1,t-1]中的对象。本质上,插值仍然是为处于空闲状态的对象实现的,但对于至少消失了kv个时间戳的处于移动状态的对象不适用。
步骤2,聚集发现;
在本异常聚集检测方法中,采用基于密度的并行化聚类算法MRDBSCAN,以获取聚类。如图3所示,首先采用基于密度的聚类算法,生成一个快照聚类,该区域由具有任意形状和程度的密度可到达对象组成,然后在时间方面获得人群来连接快照聚类。
认定聚集在任何时候都包含一定数量的普通成员和核心成员的会众。定义核心成员的概念是为了解决之前的模式中过度参与的问题。核心成员给定参与者的生存时间阈值kp,滑动窗口大小W,核心成员的出现时长阈值wp。当一个物体出现在人群的至少kp个快照集群中,并且至少在wp个时间戳中出现在滑动窗口W中。当一个人群在一段时间内所有的时间片簇中都包含了数量超过了阈值wp的核心成员和阈值mp的普通成员,这个人群就进化为了聚集。
然后,将它们与历史人群组合在一起以并行更新人群。历史人群要么演变为至少一个候选人群,要么由于没有快照群集可用于附加到人群而永久中断。最后,如果人群在任何时候都包含足够的核心成员,就会形成聚集。
使用一个示例来说明聚集的发现。表1~2列出了一个聚集场景和增量更新的过程。令kc=mc=kp=3,mp=wp=2,W=3。在t3时,簇c3由足够的候选核心成员{o1,o2,o4}和参与者{o1,o2}组成。
表1
表2
通过表1~2可以观察到有两个核心成员(Can CM∩Par),满足了人群成为聚集<c1,c2,c3>的要求。在t6,聚集暂停,因为只有一个核心成员o3出现在集群中。而o6在t7时成为候选核心成员,并在[t1;t9]期间出现在kp个历史簇中,适合作为核心员。因此在t9时,将集群c6设置为有效,更新集合<c1,c2,c3,c4,c5,c6,c7,c9>。这个过程说明了一个无效的集群可能在稍后支持人群成为聚集,即使它已经被移出滑动窗口。相反,由于包含不充分的候选核心成员的滑出窗口的集群将永久无效,因此人群将立即中断。假设t11到达时c9中的候选核心成员数量不足,在c9之前截断最长符合条件的簇序列,即<c1,c2,c3,c4,c5,c6,c7>把它变成一个封闭的聚集。同时,c9之后的集群,即<c1,c2,…>将重新进行评估来更新人群的位向量。
步骤3,聚集分类;
在本异常聚集检测方法中,将聚集分为三类:孤立聚集、候选周期性聚集中的非周期性聚集和周期性聚集,检测过程如图4所示。对附近的聚集进行聚类,得到最初的候选周期聚集集合,而由于附近没有历史聚集的异常值将被视为孤立聚集。然后采用剪影系数为度量值的k-means将原始的大跨度候选对象划分为多个子候选对象。周期性聚集是候选周期性聚集的一个子集,即周期性聚集中所包含的聚集,两两之间的距离小于阈值δt,那么认为这个集合中的聚集是周期性聚集。
非预期聚集是指给定一个聚集的集合,不存在聚集之间的距离小于阈值δcg,所有意外聚集都属于异常聚集,因为不存在其他具有时空相似性的聚集。同样,具有异常强度(成员数或持续时间明显超过阈值)的周期性聚集将被视为异常聚集。
周期性聚集是候选周期性聚集的一个子集,候选聚集中,每两个连续的聚集间距离相似。直观上,迭代检查多个时间槽来获得某一周期长度的聚集是既费时又不必要。相反,采用区间检验方法来实现这一点。图5展示了同一地点五天的聚集场景。通常,PCG=<Cg1,Cg2,Cg3,Cg4,Cg5>是严格的周期性聚集,因为所有聚集之间都存在时间重叠。但是,这可能会带来问题,因为它需要新的聚集与所有旧的周期性聚集重叠。
如图6所示,第2天的较早的聚集导致周期性的候选聚集集合被分为三个子集,即PCG1=<Cg1,Cg2,Cg3,Cg4>;PCG2=<Cg1,Cg2,Cg3,Cg5>;PCG3=<Cg3,Cg4,Cg5>。实际上,它们明确地属于同一周期性聚集。因此,通过允许后来的聚集与大多数先前的聚集有重叠来改进模型,这在实际情况中更为常见。同时,参数δppcg被设计为处理有限的聚集不足。如图7所示,由于在T0+3t缺少聚集聚,周期性聚集的间隔已扩展2t。通过应用δppcg,系统将填充虚拟聚集以维持原始间隔,从而使新到达的对象正确地分类为周期性聚集。
此外,设计了一种增量更新算法来处理流数据,从而优化了这个过程。如图7所示,由位置附近所形成的优先候选人将被保存。当一个新的聚集形成时,计算它和候选周期性聚集之间的距离,以确定其一个是先前群集的扩展还是一个离群值,而不是重新群集所有的历史和当前的聚集。
如果一个聚集属于一个已有的候选周期聚集集合,进一步研究了新的聚集与周期聚集之间的距离。结果,更新的聚集将是1)一个/多个现有的周期性聚集的拓展并将其插入周期性聚集集合,2)来自周期性聚集候选集的非周期性聚集,其之后可能会演变为周期性聚集;3)与先前孤立聚集形成新周期性聚集候选集;或4)由于周围没有聚集而形成的孤立聚集。
步骤4,异常聚集监测;
在确定为周期性聚集的扩展之后,需要进一步验证聚集是否异常。直观地,像在聚集发现过程中一样设置强度阈值。人口并不是在整个市区内均匀分布。通常,交通枢纽的聚集比中央商务区或居民区的聚集情况更为严重。如果使用相同的阈值来确定异常,则系统将无法获得合理的结果。较大的阈值将导致无法检测异常聚集,而较小的阈值可能导致检测出过多的异常聚集。为了解决这个问题,尝试根据其自身的历史强度为每个周期性聚集设置各种阈值。如公式3所示,根据最近j个时间戳的聚集,自适应调整阈值,在阈值决定过程中,较晚的聚集权重更高。
其中,δpcgn表示在第n个时间戳下聚集强度阈值,δenvn表示第n个时间戳下的环境参数,n表示当前在第n个时间戳下,i表示时间戳序号,j表示选取最近的j个时间戳,pcgi表示第i个时间戳下的聚集状态,weight表示该时间戳下聚集状态的权重,x为函数变量,δenv表示环境参数。
此外,某些外部因素可能会导致人数聚集,例如雨天交通缓慢或假日期间的人类活动增加。认为,如果很多聚集发生变化,应适当考虑到影响,为此,添加环境参数δenvn以自动调整阈值,该阈值由历史和当前聚集状况之间的差异决定。如果聚集的数量和单个聚集的平均人数都大大高于正常情况,则将适当增加阈值以减少误报。利用如下公式(4),计算周期性聚集历史和当前聚集状况之间的差异。
其中,m表示聚集的数量,第n个时间戳下的环境参数δenvn表示环境参数,k表示第k个聚集,j表示选取最近的j个时间戳,i表示第i个聚集,n表示当前在第n个时间戳下,表示第n个时间戳下第k个聚集的状态,/>表示第i个时间戳下第k个聚集的状态。
如果δenvn的平均增长大于δenv,则异常聚集确定的阈值会增加。否则,认为环境因素的影响可以忽略。与聚集的异常增加相比,持续时间主要受聚集的特征影响,而不是受外部因素的影响,因此处理起来相对较简单。因此,只需要计算每个周期性聚集的平均持续时间。仅当新聚集的参与者人数不少于其历史参与者时,同时其时间明显长于之前聚集的平均值才会判定该聚集存在异常。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。
Claims (7)
1.一种基于海量时空数据分析的异常聚集检测方法,其特征在于:包括如下步骤:
步骤1,轨迹预处理;结合历史轨迹与当前轨迹得到点的平均位置,同时通过历史轨迹与当前轨迹的对比得到该点的缺失位置,对于无法报告位置的点进行插补处理,确定该点的插补值,通过插补值与平均位置确定该点处理后的轨迹;
步骤2,聚集发现;生成快照聚类,认定聚集在任何时候都包含一定数量的普通成员和核心成员,当一个人群在一段时间内所有的时间片簇中都包含了数量超过了阈值的核心成员和阈值的普通成员,如果人群在任何时候都包含足够的核心成员,则定义为聚集;
步骤3,聚集分类;将聚集分为三类:孤立聚集、候选周期性聚集中的非周期性聚集和周期性聚集;
步骤4,异常聚集检测;根据每个聚集的历史数据和当前数据,为其设置参与人数阈值,同时根据历史数据计算其持续时间的平均值,当新聚集的参与者人数大于等于其参与人数阈值,同时时间长于聚集的平均值判定该聚集为异常聚集。
2.根据权利要求1所述的基于海量时空数据分析的异常聚集检测方法,其特征在于:在所述步骤1中,通过历史轨迹与当前轨迹的对比时,分别计算两个点之间的球面距离以及某个点的历史位置与当前位置的最大距离。
3.根据权利要求2所述的基于海量时空数据分析的异常聚集检测方法,其特征在于:所述的两个点之间球面距离的计算公式为:
历史位置与当前位置的最大距离的计算公式为:
其中,p表示点的当前位置,q表示点的某个历史位置,p1表示点当前位置的纬度角,p2表示当前位置的经度角,q1表示点某历史位置的纬度角,q2表示某历史位置的经度角,Q表示点的历史位置的集合,r表示地球半径。
4.根据权利要求1所述的基于海量时空数据分析的异常聚集检测方法,其特征在于:在所述步骤2中生成快照聚类时,采用基于密度的并行化聚类算法MRDBSCAN。
5.根据权利要求1所述的基于海量时空数据分析的异常聚集检测方法,其特征在于:在所述步骤3中,所述的孤立聚集为对附近的聚集进行聚类,得到最初的候选周期聚集集合,而由于附近没有历史聚集异常值的聚集。
6.根据权利要求1所述的基于海量时空数据分析的异常聚集检测方法,其特征在于:在所述步骤3中,所述的周期性聚集是候选周期性聚集的子集,即周期性聚集中所包含的聚集,两两之间的距离小于阈值的聚集。
7.根据权利要求1所述的基于海量时空数据分析的异常聚集检测方法,其特征在于:在所述步骤3中,所述周期性聚集历史和当前聚集状况之间差异的计算公式为:
其中,m表示聚集的数量,第n个时间戳下的环境参数δenvn表示环境参数,k表示第k个聚集,j表示选取最近的j个时间戳,i表示第i个聚集,n表示当前在第n个时间戳下,表示第n个时间戳下第k个聚集的状态,/>表示第i个时间戳下第k个聚集的状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010969343.4A CN112100243B (zh) | 2020-09-15 | 2020-09-15 | 一种基于海量时空数据分析的异常聚集检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010969343.4A CN112100243B (zh) | 2020-09-15 | 2020-09-15 | 一种基于海量时空数据分析的异常聚集检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112100243A CN112100243A (zh) | 2020-12-18 |
CN112100243B true CN112100243B (zh) | 2024-02-20 |
Family
ID=73760277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010969343.4A Active CN112100243B (zh) | 2020-09-15 | 2020-09-15 | 一种基于海量时空数据分析的异常聚集检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112100243B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114485677B (zh) * | 2022-04-14 | 2022-06-24 | 中国民用航空总局第二研究所 | 结合飞行轨迹变高度的民航导航设备视距覆盖分析方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038248A (zh) * | 2017-04-27 | 2017-08-11 | 杭州杨帆科技有限公司 | 一种基于弹性分布数据集的海量空间数据密度聚类方法 |
WO2018122585A1 (zh) * | 2016-12-30 | 2018-07-05 | 同济大学 | 一种基于浮动车数据的城市道路交通异常检测方法 |
CN108256058A (zh) * | 2018-01-16 | 2018-07-06 | 山东理工大学 | 一种基于微型计算平台的实时响应大媒体近邻检索方法 |
CN109685675A (zh) * | 2019-01-11 | 2019-04-26 | 西南大学 | 基于标签传播自然启发式的动态网络社团结构识别方法 |
CN110457315A (zh) * | 2019-07-19 | 2019-11-15 | 国家计算机网络与信息安全管理中心 | 一种基于用户轨迹数据的群体聚集模式分析方法和系统 |
CN110580251A (zh) * | 2019-07-19 | 2019-12-17 | 中国科学院信息工程研究所 | 一种大数据环境下的群体轨迹伴随模式在线分析方法和系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008107867A (ja) * | 2006-10-23 | 2008-05-08 | Hitachi Ltd | コミュニティ抽出方法、コミュニティ抽出処理装置 |
WO2018165664A1 (en) * | 2017-03-10 | 2018-09-13 | Athlon Communications, Inc. | Systems, methods and computer program products for aggregation, analysis, and visualization of legislative events |
-
2020
- 2020-09-15 CN CN202010969343.4A patent/CN112100243B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018122585A1 (zh) * | 2016-12-30 | 2018-07-05 | 同济大学 | 一种基于浮动车数据的城市道路交通异常检测方法 |
CN107038248A (zh) * | 2017-04-27 | 2017-08-11 | 杭州杨帆科技有限公司 | 一种基于弹性分布数据集的海量空间数据密度聚类方法 |
CN108256058A (zh) * | 2018-01-16 | 2018-07-06 | 山东理工大学 | 一种基于微型计算平台的实时响应大媒体近邻检索方法 |
CN109685675A (zh) * | 2019-01-11 | 2019-04-26 | 西南大学 | 基于标签传播自然启发式的动态网络社团结构识别方法 |
CN110457315A (zh) * | 2019-07-19 | 2019-11-15 | 国家计算机网络与信息安全管理中心 | 一种基于用户轨迹数据的群体聚集模式分析方法和系统 |
CN110580251A (zh) * | 2019-07-19 | 2019-12-17 | 中国科学院信息工程研究所 | 一种大数据环境下的群体轨迹伴随模式在线分析方法和系统 |
Non-Patent Citations (4)
Title |
---|
云计算环境下轨迹聚集模式挖掘算法研究;杨宇;CNKI;全文 * |
基于时空图的移动对象聚集模式挖掘方法;张峻铭;李静林;王尚广;刘志晗;袁泉;杨放春;软件学报;第27卷(第2期);全文 * |
基于社会网络分析的知识型社区群体智慧涌现的影响因素研究;吴煜山;CNKI;全文 * |
复杂网络中社区结构发现算法研究及建模;杜楠;CNKI;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112100243A (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107682319B (zh) | 一种基于增强型角度异常因子的数据流异常检测及多重验证的方法 | |
KR101910926B1 (ko) | It 시스템의 장애 이벤트를 처리하기 위한 기법 | |
CN108197566B (zh) | 一种基于多路神经网络的监控视频行为检测方法 | |
CN103699771B (zh) | 一种冷负荷预测的情景-聚类方法 | |
CN112381181B (zh) | 一种建筑能耗异常的动态检测方法 | |
CN107257351B (zh) | 一种基于灰色lof流量异常检测系统及其检测方法 | |
CN113542060B (zh) | 一种基于设备通信数据特征的异常设备检测方法 | |
CN111046968B (zh) | 一种基于改进dpc算法的道路网络轨迹聚类分析方法 | |
CN112100243B (zh) | 一种基于海量时空数据分析的异常聚集检测方法 | |
CN106845389B (zh) | 一种基于方向-集群性模型的人群逃散事件检测方法及系统 | |
Wang et al. | Practical and white-box anomaly detection through unsupervised and active learning | |
CN109726553A (zh) | 一种基于snn-lof算法的慢速拒绝服务攻击检测方法 | |
CN107944628A (zh) | 一种路网环境下的聚集模式发现方法及系统 | |
CN112363896A (zh) | 日志异常检测系统 | |
Karaki et al. | An adaptive sampling technique for massive data collection in distributed sensor networks | |
CN112887326A (zh) | 一种基于边云协同的入侵检测方法 | |
CN114417971A (zh) | 一种基于k近邻密度峰值聚类的电力数据异常值检测算法 | |
CN110826623B (zh) | 基于气象数据的分类方法、装置、计算机设备及存储介质 | |
CN116185758A (zh) | 一种基于滑动窗口和关联规则分析的告警数据收敛方法 | |
CN103793438A (zh) | 一种基于MapReduce的并行聚类方法 | |
Xie et al. | An anomaly detection method based on fuzzy c-means clustering algorithm | |
Pang et al. | Federated Learning for Crowd Counting in Smart Surveillance Systems | |
CN104077571A (zh) | 一种采用单类序列化模型的人群异常行为检测方法 | |
CN108966169A (zh) | 针对农田土壤的重金属污染分析预警系统 | |
CN109344729B (zh) | 一种识别道路中人员运动的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |