CN107249000B - 一种移动用户异常行为检测方法 - Google Patents

一种移动用户异常行为检测方法 Download PDF

Info

Publication number
CN107249000B
CN107249000B CN201710545014.5A CN201710545014A CN107249000B CN 107249000 B CN107249000 B CN 107249000B CN 201710545014 A CN201710545014 A CN 201710545014A CN 107249000 B CN107249000 B CN 107249000B
Authority
CN
China
Prior art keywords
cluster
data
clustering
data set
normal behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710545014.5A
Other languages
English (en)
Other versions
CN107249000A (zh
Inventor
朱军龙
吴庆涛
郑瑞娟
张明川
谢萍
魏汪洋
张茉莉
杜鹃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HENAN QUNZHI INFORMATION TECHNOLOGY Co.,Ltd.
Original Assignee
Henan University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Science and Technology filed Critical Henan University of Science and Technology
Priority to CN201710545014.5A priority Critical patent/CN107249000B/zh
Publication of CN107249000A publication Critical patent/CN107249000A/zh
Application granted granted Critical
Publication of CN107249000B publication Critical patent/CN107249000B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/259Fusion by voting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Security & Cryptography (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

为了克服现有技术中来选择聚类成员容易造成检测结果误报率高的问题,本发明提供了一种移动用户异常行为检测方法,其采用滑动窗口动态的获取数据,以提高用户行为获取的准确性,在传统FC算法的初始聚类和增量阶段之后引入Duun_index概念,对增量后产生的聚类成员进行选择,再将选择后的优质成员用投票算法进行融合得到最终结果,再与用户的正常行为进行相似度对比时引入关联矩阵,利用平均差异度的变化来判断用户行为是否正常,从而达到异常检测高效、准确的目的。

Description

一种移动用户异常行为检测方法
技术领域
本发明涉及信息安全可信技术领域,具体涉及一种基于选择性聚类融合的移动用户异常行为检测方法。
背景技术
随着Internet的广泛应用,整个人类社会的生活与工作正在逐渐被计算机技术、网络技术及通信技术所影响和改变着。随着智能终端的快速普及和移动互联网的迅猛发展,许多用户将互联网入口从PC端转移到了智能手机等移动智能终端,云计算技术在移动通信行业的应用必然会开创移动互联网的新时代。目前移动云服务所涉及的安全性等可信要求大多相对较低,移动云服务所涉及的各个要素和环节的可信性已成为阻碍移动云服务发展和广泛应用的重要障碍。本文旨在从用户可信方面研究用户协作层的异常行为分析技术,立足移动终端的固有缺陷,向用户提供低耗、高效、可靠的满意服务。只有当用户行为是正常合法的,用户的请求才会被智慧映射层接收,进行进一步的处理。
聚类融合技术是将多个对一组对象进行聚类划分的不同结果进行合并的技术,合并后的结果比原先单一聚类的结果更加优越,稳定性和精确性都得到了明显提升。选择性聚类融合是利用设计的选择策略对聚类成员进行筛选,选出优质的聚类成员再进行融合,提高了聚类结果的质量。
现有的选择性聚类融合算法一般采用差异度计算公式来对聚类成员的差异度进行衡量,从而选择优质的成员。而仅仅依据差异度来选择聚类成员容易造成检测结果误报率高,所以必须联合多方面因素考量,才能取得较好的结果。
发明内容
为了克服现有技术中来选择聚类成员容易造成检测结果误报率高的问题,本发明提供了一种移动用户异常行为检测方法,其采用滑动窗口动态的获取数据,以提高用户行为获取的准确性,在传统FC算法的初始聚类和增量阶段之后引入Duun_index概念,对增量后产生的聚类成员进行选择,再将选择后的优质成员用投票算法进行融合得到最终结果,再与用户的正常行为进行相似度对比时引入关联矩阵,利用平均差异度的变化来判断用户行为是否正常,从而达到异常检测高效、准确的目的。
本发明为解决上述问题所采用的技术方案是:一种移动用户异常行为检测方法,其技术方案是:包含以下步骤:
S1.对数据集进行训练,建立正常行为数据库;
S2.利用滑动窗口模型获取移动用户窗口范围内的数据集X,采用基于分形的聚类融合算法得到数据集X的聚类融合结果Γ;
S3.异常检测过程:
S301.对S2步骤得到的聚类融合结果Γ与S1步骤中的正常行为数据库中的N个正常行为数据P={P1,P2,...,PN}进行关联矩阵转换,得到相应的关联矩阵M={M1,M2,...,MN};
S302.对S1步骤中的正常行为数据库中的N个正常行为数据P={P1,P2,...,PN}进行平均差异度计算;
S303.把S2步骤得到的聚类融合结果Γ加入到正常行为数据集P中,再次进行平均差异度计算;
S304.对S302步骤和S303步骤得到的差异度进行比较,如果S303步骤得到的差异度小于S302步骤得到的差异度,则S2步骤中的数据集X为正常行为,将S1步骤中的正常行为数据库更新为N+1个聚类结果的聚类成员集合;如果S303步骤得到的差异度大于S302步骤得到的差异度,则S2步骤中的数据集X确定为异常行为。
进一步的,所述的S2步骤中的基于分形的聚类融合算法的过程是:
S201.初始聚类过程:
S2011.利用滑动窗口模型获取移动用户窗口范围内的数据集X,滑动窗口模型以外的数据b备用;
S2012.将S2011步骤获得的数据集X随机划分为H组数据子集{Xi}(i=1,2,...,H),并对Xi进行k-means聚类,每组数据子集产生K个簇并记录每一个簇的聚类中心,共得到H组聚类中心;
S2013.利用S2012步骤得到的H组聚类中心对数据集X重新k-means聚类,得到数据集X的初始聚类集合λ={λ12,...,λH},其中
Figure GDA0002328523040000031
λH表示数据集X的初始聚类集合中的某一个初始聚类;λi表示H组数据子集中的第i个聚类,
Figure GDA0002328523040000032
表示λi中的第k个簇;
S202.增量过程:
S2021.对在S201步骤中尚未分配的点b,与S2013步骤中得到的聚类集合Ci求并集得到用户全部数据C′i=Ci∪b(i=1,2,...,H);分别计算Ci与Ci'的分形维数Fi、Fi'及其分形影响度FIDi=|Fi-Fi'|,相互比较后得到FIDi的值最小的一个
Figure GDA0002328523040000033
其中,
Figure GDA0002328523040000034
S2022.遴选S2013步骤中的数据集X的初始聚类集合,保存满足公式min|Fi-Fi'|<FIDε的聚类类别;
S203:筛选融合过程:
S2031.设定阈值DIε,利用Duun_index算法对满足S2022步骤的聚类成员进行处理,得到类间离间距离高于设定阈值DIε的聚类成员λ′={λ′1,λ′2,...,λ′h},其中,h≤H,低于设定阈值的不再考虑;
S2032.利用投票法对S2031步骤得到的高于设定阈值DIε的聚类成员进行融合得到最终的聚类结果Γ。
进一步的,所述的步骤S2031中类间离间距离的得到过程如下:
Figure GDA0002328523040000035
其中,其中dist(Ci,Cj)函数表示聚类的类间离间距离
diam(Ci)函数用来测量一个类的点的直径其中,m=1……k;k代表聚类中心个数。
优选的,所述的S2031步骤中的阈值DIε=3.5。
进一步的,所述的S2032步骤中的投票法是指:设定一个矩阵Matrix[N][Z],N为数据集中S2步骤中的数据X中的数据个数,Z为类的个数,用来存放每个数据Xi针对某个类Zi的出现的次数;最后扫描矩阵Matrix[N][Z],记录每个数据Xi属于某个类Zi的最大次数;把该数据Xi归入次数最大的列所标识的类,得到最终的聚类结果Γ。
进一步的,所述的S301步骤中的关联矩阵转换过程是:将S1骤中的N个正常行为的聚类成员集合P={P1,P2,...,PN},与其中任意一个正常行为聚类成员Pi,其关联矩阵为:
Figure GDA0002328523040000041
得到关联矩阵M={M1,M2,...,MN};其中,k代表聚类中心个数。
进一步的,所述的S303步骤中的平均差异度定义过程如下:
Figure GDA0002328523040000042
其中Mi和Mj是正常行为数据集P={P1,P2,...,PN}相应的关联矩阵M={M1,M2,...,MN}中的任意两个成员,||Mi,Mj||是指两个矩阵的相似性计算;1≤i≤N,1≤j≤N。
本发明的有益效果是:本发明采用滑动窗口动态的获取数据,以提高用户行为获取的准确性,在传统FC算法的初始聚类和增量阶段之后引入Duun_index概念,对增量后产生的聚类成员进行选择,再将选择后的优质成员用投票算法进行融合得到最终结果,再与用户的正常行为进行相似度对比时引入关联矩阵,利用平均差异度的变化来判断用户行为是否正常,从而达到异常检测高效、准确的目的。
附图说明
图1为本发明流程图。
图2为本发明、FC算法和K-means聚类算法检测率对比图。
图3为本发明、FC算法和K-means聚类算法准确率对比图。
图4为本发明、FC算法和K-means聚类算法误报率对比图。
具体实施方式
下面结合附图对本发明进行进一步的说明。
如图1,一种移动用户异常行为检测方法,其技术方案是:包含以下步骤:
S1.对数据集进行训练,建立正常行为数据库;
S2.利用滑动窗口模型获取移动用户窗口范围内的数据集X,采用基于分形的聚类融合算法得到数据集X的聚类融合结果Γ;
S3.异常检测过程:
S301.对S2步骤得到的聚类融合结果Γ与S1步骤中的正常行为数据库中的N个正常行为数据P={P1,P2,...,PN}进行关联矩阵转换,得到相应的关联矩阵M={M1,M2,...,MN};
S302.对S1步骤中的正常行为数据库中的N个正常行为数据P={P1,P2,...,PN}进行平均差异度计算;
S303.把S2步骤得到的聚类融合结果Γ加入到正常行为数据集P中,再次进行平均差异度计算;
S304.对S302步骤和S303步骤得到的差异度进行比较,如果S303步骤得到的差异度小于S302步骤得到的差异度,则S2步骤中的数据集X为正常行为,将S1步骤中的正常行为数据库更新为N+1个聚类结果的聚类成员集合;如果S303步骤得到的差异度大于S302步骤得到的差异度,则S2步骤中的数据集X确定为异常行为。
需要明确的是:现有技术中的异常行为检测方法k-means聚类算法和FC聚类算法相比,本发明增加了S3步骤,可以明确的检测出移动用户异常行为,提高了检测的准确率。
进一步的,所述的S2步骤中的基于分形的聚类融合算法的过程是:
S201.初始聚类过程:
S2011.利用滑动窗口模型获取移动用户窗口范围内的数据集X,滑动窗口模型以外的数据b备用;
S2012.将S2011步骤获得的数据集X随机划分为H组数据子集{Xi}(i=1,2,...,H),并对Xi进行k-means聚类,每组数据子集产生K个簇并记录每一个簇的聚类中心,共得到H组聚类中心;
S2013.利用S2012步骤得到的H组聚类中心对数据集X重新k-means聚类,得到数据集X的初始聚类集合λ={λ12,...,λH},其中
Figure GDA0002328523040000061
λH表示数据集X的初始聚类集合中的某一个初始聚类;λi表示H组数据子集中的第i个聚类,
Figure GDA0002328523040000062
表示λi中的第k个簇;
S202.增量过程:
S2021.对在S2011步骤中尚未分配的点b,与S2013步骤中得到的聚类集合Ci求并集得到用户全部数据C′i=Ci∪b(i=1,2,...,H);分别计算Ci与Ci'的分形维数Fi、Fi'及其分形影响度FIDi=|Fi-Fi'|,相互比较后得到FIDi的值最小的一个
Figure GDA0002328523040000063
其中,
S2022.遴选S2013步骤中的数据集X的初始聚类集合,保存满足公式min|Fi-Fi'|<FIDε的聚类类别;
S203:筛选融合过程:
S2031.设定阈值DIε,利用Duun_index算法对满足S2022步骤的聚类成员进行处理,得到类间离间距离高于设定阈值DIε的聚类成员λ′={λ′1,λ′2,...,λ′h},其中,h≤H,低于设定阈值的不再考虑;
S2032.利用投票法对S2031步骤得到的高于设定阈值DIε的聚类成员进行融合得到最终的聚类结果Γ。
需要明确的是:聚类融合算法是现有技术中常用的计算方法。而在现有的聚类融合算法之中,增加了S2031步骤,增加了阈值DIε,解决了聚类融合的质量的问题(增量阶段之后产生多个聚类成员,成员的聚类质量参差不齐,如果把所有成员都进行融合,势必会影响聚类的效果,可能还不如原先单一聚类的质量高)。
需要明确的是:Duun_index算法是一种公开的算法,由Anastasios Drosou andDimitrios Tzovaras公布于IEEE ICC 2015《Amulti-objective clustering approachfor the detection ofabnormal behaviors in mobile networks》。
进一步的,所述的步骤S2031中类间离间距离的得到过程如下:
Figure GDA0002328523040000071
其中,其中dist(Ci,Cj)函数表示聚类的类间离间距离
Figure GDA0002328523040000072
diam(Ci)函数用来测量一个类的点的直径
Figure GDA0002328523040000073
其中,m=1……k;k代表聚类中心个数。
需要明确的是:显然,DI越大,类间离间的可视化就越清晰,聚类效果也就越好。在此,我们要设定一个阈值DIε,高于阈值DIε的视为优质聚类结果,低于阈值DIε的则不进入最后的融合阶段。
优选的,所述的S2031步骤中的阈值DIε=3.5。
进一步的,所述的S2032步骤中的投票法是指:设定一个矩阵Matrix[N][Z],N为数据集中S2步骤中的数据X中的数据个数,Z为类的个数,用来存放每个数据Xi针对某个类Zi的出现的次数;最后扫描矩阵Matrix[N][Z],记录每个数据Xi属于某个类Zi的最大次数;把该数据Xi归入次数最大的列所标识的类,得到最终的聚类结果Γ。
进一步的,所述的S301步骤中的关联矩阵转换过程是:将S1骤中的N个正常行为的聚类成员集合P={P1,P2,...,PN},与其中任意一个正常行为聚类成员Pi,其关联矩阵为:
Figure GDA0002328523040000081
得到关联矩阵M={M1,M2,...,MN};其中,k代表聚类中心个数。
进一步的,所述的S303步骤中的平均差异度定义过程如下:
Figure GDA0002328523040000082
其中Mi和Mj是正常行为数据集P={P1,P2,...,PN}相应的关联矩阵M={M1,M2,...,MN}中的任意两个成员,||Mi,Mj||是指两个矩阵的相似性计算;1≤i≤N,1≤j≤N。
实验过程:本发明实验硬件环境为IntelCorei5-2400CPU,主频3.10GHz,内存4GB,操作系统为win7,64位,编程工具使用Matlab(R2010a)。本发明在上述实验环境下对本发明进行测试。
本发明S1步骤采用的正常行为数据库为KDDCUP99数据集,此数据集是1998年美国国防部高级规划署(DARPA)在MIT林肯实验室进行了一项入侵检测评估项目而建立的测试数据集。
为了达到本发明检测用户异常行为的目的,考虑检测率(detectionrate,DR)、准确率(accuracyrate,AR)和误报率(errorrate,ER)这三个指标。
DR=检测到的攻击样本数/攻击样本总数×100%
AR=所有被检测到的异常样本数/异常样本数×100%
ER=所有正常样本被误报为异常的样本数/正常样本数×100%
本文采用的KDD99数据集共有数据点4898431个,如果直接对数据集进行建模,会消耗大量资源。因此,从数据集中随机选取20000条数据作为实验数据,其中取出1000条数据进行初始化,然后模拟数据流环境,将剩下的数据用滑动窗口不停的获取。滑动窗口得到的数据集X划分成H=20个基本数据子集,把判定是否为离群点的阈值FIDε设置为0.01,DIε设置为3.50。
检测率:一个检测率较高的方法能够更加准确的分析异常行为,中断攻击行为的顺利进行,有效保护用户个人行为数据。检测率为检测到的攻击样本数与攻击样本总数之比。由图2可知,在测试样本数量极少的时候本发明的检测率都能达到100%,当样本数量在2000-4000的时候发生了异常攻击,但是K-means聚类的用户异常行为不能很好的检测出该攻击行为,误将该行为认为是正常行为,所以造成检测率急速降低。此时,FC聚类算法和本文算法的用户异常行为分析方法可以很好的识别出该攻击行为,所以检测率保持稳定。随着测试样本数量的增加,本发明所述的用户异常行为分析方法表现出了明显的优势,相比于传统的FC聚类算法,本文算法增加了选择步骤,减少了劣质聚类成员对融合结果的干扰,提高了聚类质量,使得检测率相对比较高,并且比较稳定。
准确率:为所有异常样本被检测到的样本数与异常样本数之比,由图3可以看出,3种用户异常分析算法在检测样本数量极少的情况下,准确率可以达到100%,由于样本数量在2000-4000的时候发生了异常攻击,造成了K-means聚类的用户异常行为准确率的急速降低,而另外两种检测方法可以检测出异常攻击使得准确率相对来说比较稳定。随着样本数量的增加,本发明的检测率较高且趋于平稳。
误报率:是指正常样本被误认为是异常样本的个数与总异常样本量个数之比,由图4可以看出,对于三种检测方法,误报率随着样本数的增多逐渐增大,但是相比于其他两种算法,本发明所用到的用户异常行为分析方法的误报率相对较低,表明该算法对用户的异常行为有较好的识别能力。
本发明基于分形模型,提出了一种选择性分形聚类融合算法用于用户的异常行为检测方法,在传统的FC挖掘算法只能满足一般高维数据的实时动态挖掘却没有很高准确性的基础上,本发明既实现了对任意形状数据的挖掘,也提高了分形聚类结果的准确性和有效性,在用户异常行为检测中也能够准确有效地完成聚类任务,且适用于高维、海量的数据,可应用于空间数据聚类、商业数据聚类等领域。实验表明,本发明的检测率和准确率都有明显提升,具有良好的鲁棒性,可以较好的在用户和云环境之间建立一个相互的信任关系,成为云服务环境可信的有效前提。

Claims (6)

1.一种移动用户异常行为检测方法,其特征是:包含以下步骤:
S1.对数据集进行训练,建立正常行为数据库;
S2.利用滑动窗口模型获取移动用户窗口范围内的数据集X,采用基于分形的聚类融合算法得到数据集X的聚类融合结果Γ;
S201.初始聚类过程:
S2011.利用滑动窗口模型获取移动用户窗口范围内的数据集X,滑动窗口模型以外的数据b备用;
S2012.将S2011步骤获得的数据集X随机划分为H组数据子集{Xi}(i=1,2,...,H),并对Xi进行k-means聚类,每组数据子集产生K个簇并记录每一个簇的聚类中心,共得到H组聚类中心;
S2013.利用S2012步骤得到的H组聚类中心对数据集X重新k-means聚类,得到数据集X的初始聚类集合λ={λ12,...,λH},其中
Figure FDA0002328523030000011
λH表示数据集X的初始聚类集合中的某一个初始聚类;λi表示H组数据子集中的第i个聚类,
Figure FDA0002328523030000012
表示λi中的第k个簇;
S202.增量过程:
S2021.对在S201步骤中尚未分配的点b,与S2013步骤中得到的聚类集合Ci求并集得到用户全部数据Ci′=Ci∪b(i=1,2,...,H);分别计算Ci与Ci'的分形维数Fi、Fi'及其分形影响度FIDi=|Fi-Fi'|,相互比较后得到FIDi的值最小的一个
Figure FDA0002328523030000013
其中,
Figure FDA0002328523030000014
Figure FDA0002328523030000015
S2022.遴选S2013步骤中的数据集X的初始聚类集合,保存满足公式min|Fi-Fi'|<FIDε的聚类类别;
S203:筛选融合过程:
S2031.设定阈值DIε,利用Duun_index算法对满足S2022步骤的聚类成员进行处理,得到类间离间距离高于设定阈值DIε的聚类成员λ′={λ′1,λ′2,...,λ′h},其中,h≤H,低于设定阈值的不再考虑;
S2032.利用投票法对S2031步骤得到的高于设定阈值DIε的聚类成员进行融合得到最终的聚类结果
S3.异常检测过程:
S301.对S2步骤得到的聚类融合结果Γ与S1步骤中的正常行为数据库中的N个正常行为数据P={P1,P2,...,PN}进行关联矩阵转换,得到相应的关联矩阵M={M1,M2,...,MN};
S302.对S1步骤中的正常行为数据库中的N个正常行为数据P={P1,P2,...,PN}进行平均差异度计算;
S303.把S2步骤得到的聚类融合结果Γ加入到正常行为数据集P中,再次进行平均差异度计算;
S304.对S302步骤和S303步骤得到的差异度进行比较,如果S303步骤得到的差异度小于S302步骤得到的差异度,则S2步骤中的数据集X为正常行为,将S1步骤中的正常行为数据库更新为N+1个聚类结果的聚类成员集合;如果S303步骤得到的差异度大于S302步骤得到的差异度,则S2步骤中的数据集X确定为异常行为。
2.根据权利要求1所述的一种移动用户异常行为检测方法,其特征是:所述的步骤S2031中类间离间距离的得到过程如下:
Figure FDA0002328523030000031
其中,其中dist(Ci,Cj)函数表示聚类的类间离间距离
Figure FDA0002328523030000032
diam(Ci)函数用来测量一个类的点的直径
Figure FDA0002328523030000033
其中,m=1……k;k代表聚类中心个数。
3.根据权利要求1所述的一种移动用户异常行为检测方法,其特征是:所述的S2031步骤中的阈值DIε=3.5。
4.根据权利要求1所述的一种移动用户异常行为检测方法,其特征是:所述的S2032步骤中的投票法是指:设定一个矩阵Matrix[N][Z],N为数据集中S2步骤中的数据X中的数据个数,Z为类的个数,用来存放每个数据Xi针对某个类Zi的出现的次数;最后扫描矩阵Matrix[N][Z],记录每个数据Xi属于某个类Zi的最大次数;把该数据Xi归入次数最大的列所标识的类,得到最终的聚类结果Γ。
5.根据权利要求1所述的一种移动用户异常行为检测方法,其特征是:所述的S301步骤中的关联矩阵转换过程是:将S1骤中的N个正常行为的聚类成员集合P={P1,P2,...,PN},与其中任意一个正常行为聚类成员Pi,其关联矩阵为:
Figure FDA0002328523030000034
得到关联矩阵M={M1,M2,...,MN};其中,k代表聚类中心个数。
6.根据权利要求1所述的一种移动用户异常行为检测方法,其特征是:所述的S303步骤中的平均差异度定义过程如下:
Figure FDA0002328523030000041
其中Mi和Mj是正常行为数据集P={P1,P2,...,PN}相应的关联矩阵M={M1,M2,...,MN}中的任意两个成员,||Mi,Mj||是指两个矩阵的相似性计算;1≤i≤N,1≤j≤N。
CN201710545014.5A 2017-07-06 2017-07-06 一种移动用户异常行为检测方法 Active CN107249000B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710545014.5A CN107249000B (zh) 2017-07-06 2017-07-06 一种移动用户异常行为检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710545014.5A CN107249000B (zh) 2017-07-06 2017-07-06 一种移动用户异常行为检测方法

Publications (2)

Publication Number Publication Date
CN107249000A CN107249000A (zh) 2017-10-13
CN107249000B true CN107249000B (zh) 2020-02-25

Family

ID=60013946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710545014.5A Active CN107249000B (zh) 2017-07-06 2017-07-06 一种移动用户异常行为检测方法

Country Status (1)

Country Link
CN (1) CN107249000B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108924100B (zh) * 2018-06-20 2020-12-01 广东电网有限责任公司 一种异常用户识别方法
CN109587350B (zh) * 2018-11-16 2021-06-22 国家计算机网络与信息安全管理中心 一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法
CN109739736B (zh) * 2018-12-13 2022-07-08 每日互动股份有限公司 一种基于移动终端数据的用户异常行为检测方法
CN110062410B (zh) * 2019-03-28 2021-09-28 东南大学 一种基于自适应谐振理论的小区中断检测定位方法
CN110321934B (zh) * 2019-06-12 2023-05-12 深圳供电局有限公司 一种检测用户用电异常数据的方法及系统
CN111917801A (zh) * 2020-08-18 2020-11-10 南京工业大学浦江学院 私有云环境下基于Petri网的用户行为认证方法
CN112131605A (zh) * 2020-09-24 2020-12-25 合肥城市云数据中心股份有限公司 一种基于互信息相关技术的差分隐私动态数据发布方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336842A (zh) * 2013-07-17 2013-10-02 山东师范大学 一种基于聚类和投票机制的主动学习初始样本选择方法
CN106714220A (zh) * 2017-01-06 2017-05-24 江南大学 一种基于mea‑bp神经网络wsn异常检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9177226B2 (en) * 2013-03-15 2015-11-03 Google Inc. Object detection in images based on affinity determinations

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336842A (zh) * 2013-07-17 2013-10-02 山东师范大学 一种基于聚类和投票机制的主动学习初始样本选择方法
CN106714220A (zh) * 2017-01-06 2017-05-24 江南大学 一种基于mea‑bp神经网络wsn异常检测方法

Also Published As

Publication number Publication date
CN107249000A (zh) 2017-10-13

Similar Documents

Publication Publication Date Title
CN107249000B (zh) 一种移动用户异常行为检测方法
Li et al. Electricity theft detection in power grids with deep learning and random forests
Sun et al. Learning sparse representation with variational auto-encoder for anomaly detection
Ibrahimi et al. Management of intrusion detection systems based-KDD99: Analysis with LDA and PCA
CN107493277B (zh) 基于最大信息系数的大数据平台在线异常检测方法
Xue et al. Spatial analysis with preference specification of latent decision makers for criminal event prediction
Rodriguez et al. Patent clustering and outlier ranking methodologies for attributed patent citation networks for technology opportunity discovery
Du et al. GAN-based anomaly detection for multivariate time series using polluted training set
WO2019200739A1 (zh) 数据欺诈识别方法、装置、计算机设备和存储介质
CN111556016A (zh) 一种基于自动编码器的网络流量异常行为识别方法
CN115438102B (zh) 时空数据异常识别方法、装置和电子设备
Yu et al. WEB DDoS attack detection method based on semisupervised learning
CN111464529A (zh) 一种基于聚类集成的网络入侵检测方法及系统
Sönmez et al. Anomaly detection using data mining methods in it systems: a decision support application
Zubi et al. Using data mining techniques to analyze crime patterns in the libyan national crime data
CN111612531B (zh) 一种点击欺诈的检测方法及系统
US20230164162A1 (en) Valuable alert screening method efficiently detecting malicious threat
Ye et al. A Novel Self-Supervised Learning-Based Anomalous Node Detection Method Based on an Autoencoder for Wireless Sensor Networks
Wang et al. Multiple accounts detection on facebook using semi-supervised learning on graphs
CN113438239B (zh) 一种基于深度k近邻的网络攻击检测方法及装置
Yasarathna et al. Anomaly detection in cloud network data
CN114554491A (zh) 基于改进ssae和dnn模型的无线局域网入侵检测方法
He et al. An improved kernel clustering algorithm used in computer network intrusion detection
CN111698269A (zh) 一种基于Plackett-Luce模型的网络入侵检测方法
Ince A novel approach for intrusion detection systems: V-IDS

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20201224

Address after: Room 202, building 3-1, science and Technology Park, Luoyang National University, Longyu Road, Jianxi District, Luoyang area, China (Henan) pilot Free Trade Zone, Luoyang, Henan 471000

Patentee after: HENAN QUNZHI INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 471000 No. 48, Xiyuan Road, Jianxi District, Henan, Luoyang

Patentee before: HENAN University OF SCIENCE AND TECHNOLOGY

TR01 Transfer of patent right