CN110191110B - 基于网络表示学习的社交网络异常账户检测方法及系统 - Google Patents

基于网络表示学习的社交网络异常账户检测方法及系统 Download PDF

Info

Publication number
CN110191110B
CN110191110B CN201910419270.9A CN201910419270A CN110191110B CN 110191110 B CN110191110 B CN 110191110B CN 201910419270 A CN201910419270 A CN 201910419270A CN 110191110 B CN110191110 B CN 110191110B
Authority
CN
China
Prior art keywords
network
account
matrix
account node
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910419270.9A
Other languages
English (en)
Other versions
CN110191110A (zh
Inventor
杜航原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxi University
Original Assignee
Shanxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanxi University filed Critical Shanxi University
Priority to CN201910419270.9A priority Critical patent/CN110191110B/zh
Publication of CN110191110A publication Critical patent/CN110191110A/zh
Application granted granted Critical
Publication of CN110191110B publication Critical patent/CN110191110B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于社交网络数据挖掘领域,具体涉及一种基于网络表示学习的社交网络异常账户检测方法及系统,基于网络表示学习的社交网络异常账户检测方法包括利用社交网络数据构建网络G(V,E,C);构建网络G(V,E,C)的M×M维邻接矩阵;构建网络关于拓扑结构和账户节点属性的表征学习联合优化模型等步骤,本发明将异常账户检测任务与网络表征学习相结合,通过求解网络账户节点的拓扑结构和账户节点属性对应的低维向量表征形式来分别确定每个账户节点在拓扑结构和账户节点属性上的异常因子,进一步的,通过求取二者在低维空间中的一致性表征形式,计算每个账户节点的一致性异常因子,最终,通过联合异常因子评估社交网络中每个账户节点的异常程度,进而完成异常账户的检测和识别。

Description

基于网络表示学习的社交网络异常账户检测方法及系统
技术领域
本发明属于社交网络数据挖掘领域,具体涉及一种基于网络表示学习的社交网络异常账户检测方法及系统。
背景技术
随着第三代Web技术的快速发展和广泛应用,社交网络因其高效便捷、内容丰富和实时性强等特点,逐渐成为人们网络生活中重要的组成部分。社交网络一方面是承载海量媒体资讯和社交信息的载体,另一方面本身也蕴含着大量用户的隐私信息和广阔的商业价值,容易成为不法分子攻击的目标。网络攻击者通过创建虚假账户或盗取正常账户,在社交网络中进行恶意信息发布、金融交易诈骗、发动网络攻击等各类行为,严重威胁到人们的生命财产安全和社交网络的规则体系及信任关系。社交网络中异常账户具有广泛存在性与严重危害性,为此学术界和工业界提出了大量检测方案。在线社交网络中的异常账户检测问题,对于社交网站安全、用户隐私保护等具有重要的意义和价值,另外对网络群体事件监测、网络舆论导向分析等也具有重要价值。
综上所述,随着在线社交网络的快速发展,异常账户带来的各种危害和隐患严重威胁到广大用户的信息安全以及社交网站的健康发展。为此,设计和发展高效可靠的社交网络异常账户监测方法成为学术界和产业界共同关注的一个热点问题。这一工作需要分析用户行为模式以及网络结构,涉及异常检测、图论、非监督学习和半监督学习等多个领域,具有重要的理论价值和现实意义。但是网络数据由于拓扑结构中“边”的存在,导致数据的表达呈现出高维稀疏、网络账户节点高度耦合,以及账户节点相关关系重重迭代的特点,为网络数据的分析挖掘带来的巨大困难。
发明内容
本发明针对上述问题提供了一种基于网络表示学习的社交网络异常账户检测方法及系统。
为达到上述目的本发明采用以下技术方案:
基于网络表示学习的社交网络异常账户检测方法,包括以下步骤:
S1、利用社交网络数据构建网络G(V,E,C);
S2、构建网络G(V,E,C)的M×M维邻接矩阵;
S3、构建网络关于拓扑结构和账户节点属性的表征学习联合优化模型;
S4、令网络关于拓扑结构和账户节点属性的表征学习联合损失函数的偏导数取0,分别获得网络G(V,E,C)的网络结构和账户节点属性的低维表征的迭代计算方法;
S5、求取网络G(V,E,C)在低维空间中拓扑结构和账户节点属性间的映射矩阵的计算方法;
S6、求取各账户节点的拓扑结构异常因子、属性异常因子、一致性异常因子,在此基础上计算账户节点的联合异常因子;
S7、初始化模型相关参数,通过迭代执行S4~S6的方法计算每个账户节点的联合异常因子;
S8、利用3σ法则筛选联合异常因子较大的账户节点,并将这些账户节点对应的网络账户作为异常账户检测结果输出反馈给网络分析人员,用于识别社交网络中存在的异常账户。
进一步,所述步骤S1中构建网络G(V,E,C)的方法为:利用社交网络数据构建网络,将社交网络账户表示为网络中的账户节点,将账户之间的关联关系表示为账户节点间的边;将网络记为G(V,E,C),其中V=(v1,v2,…,vM)表示网络中M个账户构成的集合,其中第m个账户(1≤m≤M)记为账户节点vm;E=(e1,e2,…,ef)表示账户节点之间存在的F条连边,其中第f条边(1≤f≤F)记为ef;C为M×D维的账户节点属性矩阵,其第m行Cm=[Cm,1,Cm,2,…,Cm,D]表示网络中账户节点vm的D个属性,其中元素Cm,d表示账户节点vm的第d个属性(1≤d≤D);对于网络中的任一账户节点vm,记其在低维隐空间中的表征形式为K维向量xm,K满足K<min(M,D)。
再进一步,所述步骤S2中构建网络G(V,E,C)邻接矩阵的方法为:将M×M维邻接矩阵记为A,令A中每个元素的值表示网络G(V,E,C)中两个相应账户节点间的邻接关系,即A中第m行第n列(1≤m≤M,1≤n≤M)的元素Am,n表示网络G(V,E,C)中第m个账户节点vm和第n个账户节点vn间的邻接关系,若vm和vn之间存在边,则Am,n=1,否则Am,n=0。
更进一步,所述步骤S3的具体步骤如下:
S31、构建网络拓扑结构表征学习的子优化模型:令网络G(V,E,C)的拓扑结构在低维隐空间中的表征形式记为Z,则Z是一个M×K维矩阵,其每一行表示每个账户节点拓扑结构的K维表征向量,为了使Z最大限度的保持网络拓扑中各账户节点之间的相似度关系,引入一个K×M维矩阵H构建网络拓扑的重构损失函数如式(1)所示,其中Zm.为矩阵Z的第m行,表示账户节点vm的拓扑结构在隐空间中的K维表征向量;H.n为矩阵H的第n列,表示账户节点vn在拓扑空间和隐空间之间的映射关系;O1,m为账户节点vm的拓扑结构异常因子,用于描述该账户节点在拓扑结构方面的异常程度,构建网络拓扑结构表征学习的子优化目标函数L1,即使得式(1)所示的损失函数取值最小;
Figure BDA0002065464670000031
S32、构建账户节点属性表征学习的子优化模型:将网络G(V,E,C)的账户节点属性在低维隐空间中的表征形式记为U,则U是一个M×K维矩阵,其每一行表示每个账户节点的属性在隐空间中的K维表征向量,为了使账户节点间属性相似性关系在U中完整的保持,引入一个K×D维矩阵Q构建账户节点属性的重构损失函数如式(2)所示,其中U为矩阵U的第m行,表示账户节点vm的相关属性在隐空间中的K维表征向量;Q·d为矩阵Q的第d列,表示账户节点属性的第d个特征在网络空间和隐空间之间的映射关系;O2,m为账户节点vm的属性异常因子,用于描述该账户节点在属性特征方面的异常程度;构建账户节点属性表征学习的子优化目标函数L2,即令式(2)所示的损失函数取值最小;
Figure BDA0002065464670000032
S33、构建拓扑结构和账户节点属性低维表征间的映射子优化模型:网络结构和账户节点属性是网络数据不同侧面的表现形式,二者之间存在一定映射关系,令隐空间中网络G(V,E,C)的拓扑结构和账户节点属性的低维表征之间的映射关系为K×K维的矩阵W,则网络数据在两个不同侧面数据表征的损失函数如式(3)所示,其中(WT)·k表示矩阵W的转置的第k列(1<k<K),O3,m为账户节点vm的一致性异常因子,用于描述该账户节点在网络拓扑和特征属性映射间的异常程度,构建拓扑结构和账户节点属性低维表征间的映射子优化目标函数L3,即令式(3)所示的损失函数取值最小;
Figure BDA0002065464670000041
其中Zm,k表示矩阵Z的第m行第k列的元素;
S34、构建网络关于拓扑结构和账户节点属性的表征学习联合优化模型:网络在低维空间中的有效表征应同时满足S31~S33中的三个子优化目标,构建网络关于拓扑结构和账户节点属性的表征学习联合损失函数
Figure BDA0002065464670000046
如式(4)所示:
Figure BDA0002065464670000047
其中α,β>0为控制网络结构和账户节点属性在最终表征结果中比重的参数,且满足:
0<O1,m<1,0<O2,m<1,0<O3,m<1 (5)
以及,
Figure BDA0002065464670000042
网络关于拓扑结构和账户节点属性的表征学习联合优化目标即令式(4)所示的损失函数取值最小。
更进一步,所述步骤S4的具体步骤如下:
S41、求解
Figure BDA0002065464670000043
得到网络拓扑结构的低维表征的迭代计算方法如式(7)所示:
Figure BDA0002065464670000044
其中,W表示矩阵W的第k行,H表示矩阵H的第k行;
Z′m,k由式(8)计算:
Figure BDA0002065464670000045
其中,Z′m,k表示矩阵Z的第m行第k’列的元素,Hk',n表示矩阵H的第k’行第n列的元素,Hk,n表示矩阵H的第k行第n列的元素;
S42、求解
Figure BDA0002065464670000051
得到网络拓扑结构在原始空间和低维隐空间之间映射关系的迭代计算方法如式(9)所示:
Figure BDA0002065464670000052
S43、求解
Figure BDA0002065464670000053
得到账户节点属性低维表征的迭代计算方法如式(10)所示:
Figure BDA0002065464670000054
其中,Um,k表示矩阵U的第m行第k列的元素,Q为矩阵Q的第k行,W·k为矩阵W的第k列,U′m,k和U″m,k由式(11)和式(12)计算:
Figure BDA0002065464670000055
Um,k'表示矩阵U的第m行第k列的元素,Qk',d表示矩阵Q的第k’行第d列的元素,Qk,d表示矩阵Q的第k行第d列的元素;
Figure BDA0002065464670000056
S44、求解
Figure BDA0002065464670000057
得到账户节点属性在原始空间和低维隐空间之间映射关系的迭代计算方法如式(13)所示:
Figure BDA0002065464670000058
更进一步,所述步骤S5中网络G(V,E,C)在低维空间中拓扑结构和账户节点属性间的映射矩阵的计算方法如式(14)所示:
Figure BDA0002065464670000059
其中,矩阵
Figure BDA0002065464670000061
中元素的计算方法如式(15)所示:
Figure BDA0002065464670000062
矩阵
Figure BDA0002065464670000063
中元素的计算方法如式(16)所示:
Figure BDA0002065464670000064
更进一步,所述步骤S6的具体步骤如下:
S61、计算账户节点的拓扑结构异常因子,如式(17)所示:
Figure BDA0002065464670000065
其中O1,m为账户节点vm的拓扑结构异常因子;
S62、计算账户节点的属性异常因子,如式(18)所示:
Figure BDA0002065464670000066
其中O2,m为账户节点vm的属性异常因子;
S63、计算账户节点的一致性异常因子,如式(19)所示:
Figure BDA0002065464670000067
其中O3,m为账户节点vm的一致性异常因子,W为矩阵W的第m行,U·k为矩阵U的第k列;
S64、计算账户节点的联合异常因子,如式(20)所示:
Om=O1,m+O2,m+O3,m (20)
其中Om为账户节点vm的联合异常因子。
更进一步,所述步骤S7的具体步骤如下:
S71、对邻接矩阵A进行SVD矩阵分解,作为矩阵Z和H的初始化值,同理对账户节点属性矩阵进行SVD矩阵分解,作为矩阵U和Q的初始化值;
S72、对账户节点的拓扑结构异常因子、属性异常因子和一致性异常因子进行初始化,令每个账户节点的这三个异常因子初始化值都为1/3,即利用式(21)对第m个账户节点的异常因子进行初始化值:
O1,m=O2,m=O3,m=1/3 (21)
迭代执行步骤S73~S75,直到达到指定的迭代次数,或账户节点的异常因子不再发生变化:
S73、利用式(14)~(16)对W进行更新;
S74、利用式(7)~(13)对Z,H,U,Q进行更新;
S75、利用式(17)~(19)对O1、O2和O3进行更新。
更进一步,所述步骤S8的具体步骤如下:
S81、对于网络中的所有账户节点,依照式(22)的方法计算每个账户节点联合异常因子的Z分数:
Figure BDA0002065464670000071
其中,
Figure BDA0002065464670000072
表示账户节点vm的联合异常因子对应的Z分数,μO和σO分别表示网络中所有账户节点联合异常因子总体分布的期望和标准差,并由式(23)和式(24)计算
Figure BDA0002065464670000073
Figure BDA0002065464670000074
S82、从网络中选择联合异常因子的Z分数大于3的账户节点,进行输出,如式(25)所示:
Figure BDA0002065464670000075
Voutput表示本发明检测出的异常账户构成的集合;
S83、网络分析人员根据输出的结果识别社交网络中存在的异常账户。
基于网络表示学习的社交网络异常账户检测系统,包括网络数据存取单元、计算机处理器和内存、网络构建单元、网络数据表征学习单元、异常因子计算单元和异常账户筛选和结果输出单元,所述网络数据存取单元从社交网络中收集网络数据;计算机处理器和内存从网络数据存取单元读取收集到的网络数据;网络构建单元根据计算机处理器和内存读取到的网络数据构建网络以及网络的邻接矩阵;网络数据表征学习单元根据网络构建单元构建的网络以及网络的邻接矩阵,获取网络数据在低维隐空间中的表征形式;异常因子计算单元根据网络数据在低维隐空间中的表征形式计算网络中每个账户节点的异常因子;异常账户筛选和结果输出单元依据每个账户节点的异常因子将异常账户由网络中检测出来,并将检测结果进行输出;所有单元中具体的数据处理和计算工作由计算机处理器完成,且所有单元都与计算机内存的数据交互。
与现有技术相比本发明具有以下优点:
1、本发明将网络拓扑空间嵌入到低维向量空间,利用向量空间中账户节点间的“距离”取代拓扑空间中的“边”,将异常账户检测任务与网络表征学习相结合,通过求解网络账户节点的拓扑结构和账户节点属性对应的低维向量表征形式来分别确定每个账户节点在拓扑结构和账户节点属性上的异常因子,进一步的,通过求取二者在低维空间中的一致性表征形式,计算每个账户节点的一致性异常因子,最终,通过联合异常因子评估社交网络中每个账户节点的异常程度,进而完成异常账户的检测和识别;
2、本发明在有效实现社交网络异常账户检测的同时,能够获得网络数据的低维向量表征形式,从而提高下游网络分析任务的性能和效率,对于现实网络数据分析具有较高实用价值。
附图说明
图1为本发明的系统结构图;
图2为本发明的流程图;
图3为本发明实施例2中的数据集图。
具体实施方式
为了进一步阐述本发明的技术方案,下面结合附图及实施例对本发明进行进一步说明。
实施例1
如图2所示,基于网络表示学习的社交网络异常账户检测方法,包括以下步骤:
S1、利用社交网络数据构建网络G(V,E,C);
S2、构建网络G(V,E,C)的M×M维邻接矩阵;
S3、构建网络关于拓扑结构和账户节点属性的表征学习联合优化模型;
S4、令网络关于拓扑结构和账户节点属性的表征学习联合损失函数的偏导数取0,分别获得网络G(V,E,C)的网络结构和账户节点属性的低维表征的迭代计算方法;
S5、求取网络G(V,E,C)在低维空间中拓扑结构和账户节点属性间的映射矩阵的计算方法;
S6、求取各账户节点的拓扑结构异常因子、属性异常因子、一致性异常因子,在此基础上计算账户节点的联合异常因子;
S7、初始化模型相关参数,通过迭代执行S4~S6的方法计算每个账户节点的联合异常因子;
S8、利用3σ法则筛选联合异常因子较大的账户节点,并将这些账户节点对应的网络账户作为异常账户检测结果输出反馈给网络分析人员,用于识别社交网络中存在的异常账户。
所述步骤S1中构建网络G(V,E,C)的方法为:利用社交网络数据构建网络,将社交网络账户表示为网络中的账户节点,将账户之间的关联关系表示为账户节点间的边;将网络记为G(V,E,C),其中V=(v1,v2,…,vM)表示网络中M个账户构成的集合,其中第m个账户(1≤m≤M)记为账户节点vm;E=(e1,e2,…,ef)表示账户节点之间存在的F条连边,其中第f条边(1≤f≤F)记为ef;C为M×D维的账户节点属性矩阵,其第m行Cm=[Cm,1,Cm,2,…,Cm,D]表示网络中账户节点vm的D个属性,其中元素Cm,d表示账户节点vm的第d个属性(1≤d≤D);对于网络中的任一账户节点vm,记其在低维隐空间中的表征形式为K维向量xm,K满足K<min(M,D)。
所述步骤S2中构建网络G(V,E,C)邻接矩阵的方法为:将M×M维邻接矩阵记为A,令A中每个元素的值表示网络G(V,E,C)中两个相应账户节点间的邻接关系,即A中第m行第n列(1≤m≤M,1≤n≤M)的元素Am,n表示网络G(V,E,C)中第m个账户节点vm和第n个账户节点vn间的邻接关系,若vm和vn之间存在边,则Am,n=1,否则Am,n=0。
所述步骤S3的具体步骤如下:
S31、构建网络拓扑结构表征学习的子优化模型:令网络G(V,E,C)的拓扑结构在低维隐空间中的表征形式记为Z,则Z是一个M×K维矩阵,其每一行表示每个账户节点拓扑结构的K维表征向量,为了使Z最大限度的保持网络拓扑中各账户节点之间的相似度关系,引入一个K×M维矩阵H构建网络拓扑的重构损失函数如式(1)所示,其中Z为矩阵Z的第m行,表示账户节点vm的拓扑结构在隐空间中的K维表征向量;H·n为矩阵H的第n列,表示账户节点vn在拓扑空间和隐空间之间的映射关系;O1,m为账户节点vm的拓扑结构异常因子,用于描述该账户节点在拓扑结构方面的异常程度,构建网络拓扑结构表征学习的子优化目标函数L1,即使得式(1)所示的损失函数取值最小;
Figure BDA0002065464670000101
S32、构建账户节点属性表征学习的子优化模型:将网络G(V,E,C)的账户节点属性在低维隐空间中的表征形式记为U,则U是一个M×K维矩阵,其每一行表示每个账户节点的属性在隐空间中的K维表征向量,为了使账户节点间属性相似性关系在U中完整的保持,引入一个K×D维矩阵Q构建账户节点属性的重构损失函数如式(2)所示,其中U为矩阵U的第m行,表示账户节点vm的相关属性在隐空间中的K维表征向量;Q·d为矩阵Q的第d列,表示账户节点属性的第d个特征在网络空间和隐空间之间的映射关系;O2,m为账户节点vm的属性异常因子,用于描述该账户节点在属性特征方面的异常程度;构建账户节点属性表征学习的子优化目标函数L2,即令式(2)所示的损失函数取值最小;
Figure BDA0002065464670000102
S33、构建拓扑结构和账户节点属性低维表征间的映射子优化模型:网络结构和账户节点属性是网络数据不同侧面的表现形式,二者之间存在一定映射关系,令隐空间中网络G(V,E,C)的拓扑结构和账户节点属性的低维表征之间的映射关系为K×K维的矩阵W,则网络数据在两个不同侧面数据表征的损失函数如式(3)所示,其中(WT)·k表示矩阵W的转置的第k列,O3,m为账户节点vm的一致性异常因子,用于描述该账户节点在网络拓扑和特征属性映射间的异常程度,构建拓扑结构和账户节点属性低维表征间的映射子优化目标函数L3,即令式(3)所示的损失函数取值最小;
Figure BDA0002065464670000111
其中
Figure BDA0002065464670000112
中的k为常数,Zm,k表示矩阵Z的第m行第k列的元素;
S34、构建网络关于拓扑结构和账户节点属性的表征学习联合优化模型:网络在低维空间中的有效表征应同时满足S31~S33中的三个子优化目标,构建网络关于拓扑结构和账户节点属性的表征学习联合损失函数
Figure BDA0002065464670000113
如式(4)所示:
Figure BDA0002065464670000114
其中α,β>0为控制网络结构和账户节点属性在最终表征结果中比重的参数,且满足:
0<O1,m<1,0<O2,m<1,0<O3,m<1 (5)
以及,
Figure BDA0002065464670000115
网络关于拓扑结构和账户节点属性的表征学习联合优化目标即令式(4)所示的损失函数取值最小。
所述步骤S4的具体步骤如下:
S41、求解
Figure BDA0002065464670000116
得到网络拓扑结构的低维表征的迭代计算方法如式(7)所示:
Figure BDA0002065464670000117
其中,W表示矩阵W的第k行,H表示矩阵H的第k行;
Z′m,k由式(8)计算:
Figure BDA0002065464670000118
其中,Z′m,k表示矩阵Z的第m行第k’列的元素,Hk',n表示矩阵H的第k’行第n列的元素,Hk,n表示矩阵H的第k行第n列的元素;
S42、求解
Figure BDA0002065464670000121
得到网络拓扑结构在原始空间和低维隐空间之间映射关系的迭代计算方法如式(9)所示:
Figure BDA0002065464670000122
S43、求解
Figure BDA0002065464670000123
得到账户节点属性低维表征的迭代计算方法如式(10)所示:
Figure BDA0002065464670000124
其中,Um,k表示矩阵U的第m行第k列的元素,Q为矩阵Q的第k行,W·k为矩阵W的第k列,U′m,k和U″m,k由式(11)和式(12)计算:
Figure BDA0002065464670000125
Um,k'表示矩阵U的第m行第k’列的元素,Qk',d表示矩阵Q的第k’行第d列的元素,Qk,d表示矩阵Q的第k行第d列的元素;
Figure BDA0002065464670000126
S44、求解
Figure BDA0002065464670000127
得到账户节点属性在原始空间和低维隐空间之间映射关系的迭代计算方法如式(13)所示:
Figure BDA0002065464670000128
所述步骤S5中网络G(V,E,C)在低维空间中拓扑结构和账户节点属性间的映射矩阵的计算方法如式(14)所示:
Figure BDA0002065464670000129
其中,矩阵
Figure BDA0002065464670000131
中元素以及矩阵
Figure BDA0002065464670000132
中元素的计算方法分别由式(15)和式(16)给出:
Figure BDA0002065464670000133
Figure BDA0002065464670000134
式(15)中
Figure BDA0002065464670000135
表示矩阵
Figure BDA0002065464670000136
的第m行第k列上的元素,式(16)中
Figure BDA0002065464670000137
表示表示矩阵
Figure BDA0002065464670000138
的第m行第k列上的元素。
更进一步,所述步骤S6的具体步骤如下:
S61、计算账户节点的拓扑结构异常因子,如式(17)所示:
Figure BDA0002065464670000139
其中O1,m为账户节点vm的拓扑结构异常因子;
S62、计算账户节点的属性异常因子,如式(18)所示:
Figure BDA00020654646700001310
其中O2,m为账户节点vm的属性异常因子;
S63、计算账户节点的一致性异常因子,如式(19)所示:
Figure BDA00020654646700001311
其中O3,m为账户节点vm的一致性异常因子,W为矩阵W的第m行,U·k为矩阵U的第k列;
S64、计算账户节点的联合异常因子,如式(20)所示:
Om=O1,m+O2,m+O3,m (20)
其中Om为账户节点vm的联合异常因子。
所述步骤S7的具体步骤如下:
S71、对邻接矩阵A进行SVD矩阵分解,作为矩阵Z和H的初始化值,同理对账户节点属性矩阵进行SVD矩阵分解,作为矩阵U和Q的初始化值;
S72、对账户节点的拓扑结构异常因子、属性异常因子和一致性异常因子进行初始化,令每个账户节点的这三个异常因子初始化值都为1/3,即利用式(21)对第m个账户节点的异常因子进行初始化值:
O1,m=O2,m=O3,m=1/3 (21)
迭代执行步骤S73~S75,直到达到指定的迭代次数,或账户节点的异常因子不再发生变化:
S73、利用式(14)~(16)对W进行更新;
S74、利用式(7)~(13)对Z,H,U,Q进行更新;
S75、利用式(17)~(19)对O1、O2和O3进行更新。
所述步骤S8的具体步骤如下:
S81、对于网络中的所有账户节点,依照式(22)的方法计算每个账户节点联合异常因子的Z分数:
Figure BDA0002065464670000141
其中,
Figure BDA0002065464670000142
表示账户节点vm的联合异常因子对应的Z分数,μO和σO分别表示网络中所有账户节点联合异常因子总体分布的期望和标准差,并由式(23)和式(24)计算
Figure BDA0002065464670000143
Figure BDA0002065464670000144
S82、从网络中选择联合异常因子的Z分数大于3的账户节点,进行输出,如式(25)所示:
Figure BDA0002065464670000145
Voutput表示本发明检测出的异常账户构成的集合;
S83、网络分析人员根据输出的结果识别社交网络中存在的异常账户。
如图1所示,基于网络表示学习的社交网络异常账户检测系统,包括网络数据存取单元、计算机处理器和内存、网络构建单元、网络数据表征学习单元、异常因子计算单元和异常账户筛选和结果输出单元,所述网络数据存取单元从社交网络中收集网络数据;计算机处理器和内存从网络数据存取单元读取收集到的网络数据;网络构建单元根据计算机处理器和内存读取到的网络数据构建网络以及网络的邻接矩阵;网络数据表征学习单元根据网络构建单元构建的网络以及网络的邻接矩阵,获取网络数据在低维隐空间中的表征形式;异常因子计算单元根据网络数据在低维隐空间中的表征形式计算网络中每个账户节点的异常因子;异常账户筛选和结果输出单元依据每个账户节点的异常因子将异常账户由网络中检测出来,并将检测结果进行输出;所有单元中具体的数据处理和计算工作由计算机处理器完成,且所有单元都与计算机内存的数据交互。
实施例2
本发明所述的基于网络表征学习的社交网络异常账户检测方法通过计算机程序实施,下面将按照图2所示流程详述本发明提出的技术方案的具体实施方式,使用本发明的技术方案对来自Facebook社交网络的数据集进行异常账户检测。该数据集如图3所示,由134个社交网络账户构成,每个账户具有104个属性,这些账户之间由382条关联关系连接在一起,网络中包含若干异常账户。本实施例将阐述如何通过本发明提出的技术方案获取该社交网络数据集在低维隐空间(维度为10)中的表示形式,并从网络中检测出异常账户,其实施方式主要包含以下关键内容:
S1、利用Facebook社交网络数据集构建网络G(V,E,C),将社交网络账户表示为网络中的账户节点,全部账户节点构成的集合记为V=(v1,v2,…,v134),其中第m个账户(1≤m≤134)表示为账户节点vm;将账户之间的关联关系表示为账户节点间的边,全部关联关系构成的集合记为E=(e1,e2,…,e382),其中第f条关联关系(1≤f≤382)表示为边ef;使用134×104维的属性矩阵C表示网络G(V,E,C)中账户节点的属性,其中账户节点vm的属性为属性矩阵C的第m行Cm=[Cm,1,Cm,2,…,Cm,104]表示网络中账户节点vm的104个属性,其中元素Cm,d表示账户节点vm的第d个属性(1≤d≤104);对于网络中的任一账户节点vm,记其在低维隐空间中的表征形式为维度为10的向量xm
S2、构建网络G(V,E,C)的134×134维邻接矩阵A:A中每个元素的值表示网络G(V,E,C)中两个相应账户节点间的邻接关系,即A中第m行第n列(1≤m≤134,1≤n≤134)的元素Am,n表示网络G(V,E,C)中第m个账户节点vm和第n个账户节点vn间的邻接关系,若vm和vn之间存在边,则Am,n=1,否则Am,n=0。
S3、构建网络关于拓扑结构和账户节点属性的表征学习联合优化模型,具体步骤如下:
S31、构建网络拓扑结构表征学习的子优化模型:令网络G(V,E,C)的拓扑结构在低维隐空间中的表征形式记为Z,则Z是一个134×10维矩阵,其每一行表示每个账户节点拓扑结构的低维表征向量,为了使Z最大限度的保持网络拓扑中各账户节点之间的相似度关系,引入一个10×134维矩阵H构建网络拓扑的重构损失函数如式(1)所示,其中Z为矩阵Z的第m行,表示账户节点vm的拓扑结构在隐空间中的低维表征向量;H·n为矩阵H的第n列,表示账户节点vn在拓扑空间和隐空间之间的映射关系;O1,m为账户节点vm的拓扑结构异常因子,用于描述该账户节点在拓扑结构方面的异常程度,构建网络拓扑结构表征学习的子优化目标函数L1,即使得式(1)所示的损失函数取值最小;
Figure BDA0002065464670000161
S32、构建账户节点属性表征学习的子优化模型:将网络G(V,E,C)的账户节点属性在低维隐空间中的表征形式记为U,则U是一个134×10维矩阵,其每一行表示每个账户节点的属性在隐空间中的低维表征向量,为了使账户节点间属性相似性关系在U中完整的保持,引入一个10×104维矩阵Q构建账户节点属性的重构损失函数如式(2)所示,其中U为矩阵U的第m行,表示账户节点vm的相关属性在隐空间中的低维表征向量;Q·d为矩阵Q的第d列,表示账户节点属性的第d个特征在网络空间和隐空间之间的映射关系;O2,m为账户节点vm的属性异常因子,用于描述该账户节点在属性特征方面的异常程度;构建账户节点属性表征学习的子优化目标函数L2,即令式(2)所示的损失函数取值最小;
Figure BDA0002065464670000162
S33、构建拓扑结构和账户节点属性低维表征间的映射子优化模型:网络结构和账户节点属性是网络数据不同侧面的表现形式,二者之间存在一定映射关系,令隐空间中网络G(V,E,C)的拓扑结构和账户节点属性的低维表征之间的映射关系为10×10维的矩阵W,则网络数据在两个不同侧面数据表征的损失函数如式(3)所示,其中(WT)·k表示矩阵W的转置的第k列(1<k<10),O3,m为账户节点vm的一致性异常因子,用于描述该账户节点在网络拓扑和特征属性映射间的异常程度,构建拓扑结构和账户节点属性低维表征间的映射子优化目标函数L3,即令式(3)所示的损失函数取值最小;
Figure BDA0002065464670000171
其中Zm,k表示矩阵Z的第m行第k列的元素;
S34、构建网络关于拓扑结构和账户节点属性的表征学习联合优化模型:网络在低维空间中的有效表征应同时满足步骤S31-S33中的三个子优化目标,构建网络关于拓扑结构和账户节点属性的表征学习联合损失函数
Figure BDA0002065464670000172
如式(4)所示:
Figure BDA0002065464670000173
其中α,β>0为控制网络结构和账户节点属性在最终表征结果中比重的参数,且满足:
0<O1,m<1,0<O2,m<1,0<O3,m<1 (5)
以及,
Figure BDA0002065464670000174
网络关于拓扑结构和账户节点属性的表征学习联合优化目标即令式(4)所示的损失函数取值最小。
S4、令网络关于拓扑结构和账户节点属性的表征学习联合损失函数的偏导数取0,分别获得网络G(V,E,C)的网络结构和账户节点属性的低维表征的迭代计算方法,具体步骤如下:
S41、求解
Figure BDA0002065464670000175
得到网络拓扑结构的低维表征的迭代计算方法如式(7)所示:
Figure BDA0002065464670000176
其中,W表示矩阵W的第k行,H表示矩阵H的第k行;
Z′m,k由式(8)计算:
Figure BDA0002065464670000181
其中,Z′m,k表示矩阵Z的第m行第k’列的元素,Hk',n表示矩阵H的第k’行第n列的元素,Hk,n表示矩阵H的第k行第n列的元素;
S42、求解
Figure BDA0002065464670000182
得到网络拓扑结构在原始空间和低维隐空间之间映射关系的迭代计算方法如式(9)所示:
Figure BDA0002065464670000183
S43、求解
Figure BDA0002065464670000184
得到账户节点属性低维表征的迭代计算方法如式(10)所示:
Figure BDA0002065464670000185
其中,Um,k表示矩阵U的第m行第k列的元素,Q为矩阵Q的第k行,W·k为矩阵W的第k列,U′m,k和U″m,k由式(11)和式(12)计算:
Figure BDA0002065464670000186
Um,k'表示矩阵U的第m行第k’列的元素,Qk',d表示矩阵Q的第k’行第d列的元素,Qk,d表示矩阵Q的第k行第d列的元素;
Figure BDA0002065464670000187
S44、求解
Figure BDA0002065464670000188
得到账户节点属性在原始空间和低维隐空间之间映射关系的迭代计算方法如式(13)所示:
Figure BDA0002065464670000191
S5、求取网络G(V,E,C)在低维空间中拓扑结构和账户节点属性间的映射矩阵的计算方法,如式(14)所示:
Figure BDA0002065464670000192
其中,矩阵
Figure BDA0002065464670000193
中元素以及矩阵
Figure BDA0002065464670000194
中元素的计算方法分别由式(15)和式(16)给出:
Figure BDA0002065464670000195
Figure BDA0002065464670000196
式(15)中
Figure BDA0002065464670000197
表示矩阵
Figure BDA00020654646700001912
的第m行第k列上的元素,式(16)中
Figure BDA0002065464670000198
表示表示矩阵
Figure BDA0002065464670000199
的第m行第k列上的元素。
S6、求取各账户节点的拓扑结构异常因子、属性异常因子、一致性异常因子,在此基础上计算账户节点的联合异常因子,具体步骤如下:
S61、计算账户节点的拓扑结构异常因子,如式(17)所示:
Figure BDA00020654646700001910
其中O1,m为账户节点vm的拓扑结构异常因子;
S62、计算账户节点的属性异常因子,如式(18)所示:
Figure BDA00020654646700001911
其中O2,m为账户节点vm的属性异常因子;
S63、计算账户节点的一致性异常因子,如式(19)所示:
Figure BDA0002065464670000201
其中O3,m为账户节点vm的一致性异常因子,W为矩阵W的第m行,U·k为矩阵U的第k列;
S64、计算账户节点的联合异常因子,如式(20)所示:
Om=O1,m+O2,m+O3,m (20)
S7、初始化模型相关参数,通过迭代执行步骤S4-S6的方法计算每个账户节点的联合异常因子,具体步骤如下:
S71、对邻接矩阵A进行SVD矩阵分解,作为矩阵Z和H的初始化值,同理对账户节点属性矩阵进行SVD矩阵分解,作为矩阵U和Q的初始化值;
S72、对账户节点的拓扑结构异常因子、属性异常因子和一致性异常因子进行初始化,令每个账户节点的这三个异常因子初始化值都为1/3,即利用式(21)对第m个账户节点的异常因子进行初始化值:
O1,m=O2,m=O3,m=1/3 (21)
迭代执行步骤S73-S75,直到达到指定的迭代次数,或账户节点的异常因子不再发生变化:
S73、利用式(14)~(16)对W进行更新;
S74、利用式(7)~(13)对Z,H,U,Q进行更新;
S75、利用式(17)~(19)对O1、O2和O3进行更新。
S8、利用3σ法则筛选联合异常因子较大的账户节点,并将这些账户节点对应的网络账户作为异常账户检测结果输出反馈给网络分析人员,用于识别社交网络中存在的异常账户,具体步骤如下:
S81、对于网络中的所有账户节点,依照式(22)的方法计算每个账户节点联合异常因子的Z分数:
Figure BDA0002065464670000202
其中,
Figure BDA0002065464670000203
表示账户节点vm的联合异常因子对应的Z分数,μO和σO分别表示网络中所有账户节点联合异常因子总体分布的期望和标准差,并由式(23)和式(24)计算
Figure BDA0002065464670000211
Figure BDA0002065464670000212
S82、从网络中选择联合异常因子的Z分数大于3的账户节点,进行输出,如式(25)所示:
Figure BDA0002065464670000213
Voutput表示本发明检测出的异常账户构成的集合;
S83、网络分析人员根据输出的结果识别社交网络中存在的异常账户。
技术效果评价:
为验证本发明提出技术方案的有效性和先进性,选取几种已有的网络异常节点检测方法进行对比:DeepWalk、Node2Vector、AANE、TADW、GrahpSAGE、SEANO。其中本发明技术方案和SEANO算法能直接输出社交网络账号的异常度,DeepWalk、Node2Vector、AANE、TADW和GrahpSAGE算法获得的是社交网络数据的低维表征,在此基础上利用孤立森林(isolation forest)算法获得异常账号检测结果。通过精度(Precision)和召回率(Recall)对上述方法在Facebook社交网络数据集上的异常账户检测结果进行评价,结果如表1所示:
Figure BDA0002065464670000214
由表中结果可以看出,本发明技术方案在进行社交网络的异常账户检测时,能获得精度和可靠性优于已有方法的检测结果。
如图1所示,基于网络表示学习的社交网络异常账户检测系统,其特征在于:包括网络数据存取单元、计算机处理器和内存、网络构建单元、网络数据表征学习单元、异常因子计算单元和异常账户筛选和结果输出单元,所述网络数据存取单元从社交网络中收集网络数据;计算机处理器和内存从网络数据存取单元读取收集到的网络数据;网络构建单元根据计算机处理器和内存读取到的网络数据构建网络以及网络的邻接矩阵;网络数据表征学习单元根据网络构建单元构建的网络以及网络的邻接矩阵,获取网络数据在低维隐空间中的表征形式;异常因子计算单元根据网络数据在低维隐空间中的表征形式计算网络中每个账户节点的异常因子;异常账户筛选和结果输出单元依据每个账户节点的异常因子将异常账户由网络中检测出来,并将检测结果进行输出;所有单元中具体的数据处理和计算工作由计算机处理器完成,且所有单元都与计算机内存的数据交互。
以上显示和描述了本发明的主要特征和优点,对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (3)

1.一种基于网络表示学习的社交网络异常账户检测方法,其特征在于:包括以下步骤:
S1、利用社交网络数据构建网络G(V,E,C),具体方法为:利用社交网络数据构建网络,将社交网络账户表示为网络中的账户节点,将账户之间的关联关系表示为账户节点间的边;将网络记为G(V,E,C),其中V=(v1,v2,…,vM)表示网络中M个账户构成的集合,其中第m个账户(1≤m≤M)记为账户节点vm;E=(e1,e2,…,ef)表示账户节点之间存在的F条连边,其中第f条边(1≤f≤F)记为ef;C为M×D维的账户节点属性矩阵,其第m行Cm=[Cm,1,Cm,2,…,Cm,D]表示网络中账户节点vm的D个属性,其中元素Cm,d表示账户节点vm的第d个属性(1≤d≤D);对于网络中的任一账户节点vm,记其在低维隐空间中的表征形式为K维向量xm,K满足K<min(M,D);
S2、构建网络G(V,E,C)的M×M维邻接矩阵,具体方法为:将M×M维邻接矩阵记为A,令A中每个元素的值表示网络G(V,E,C)中两个相应账户节点间的邻接关系,即A中第m行第n列(1≤m≤M,1≤n≤M)的元素Am,n表示网络G(V,E,C)中第m个账户节点vm和第n个账户节点vn间的邻接关系,若vm和vn之间存在边,则Am,n=1,否则Am,n=0;
S3、构建网络关于拓扑结构和账户节点属性的表征学习联合优化模型,具体步骤如下:
S31、构建网络拓扑结构表征学习的子优化模型:令网络G(V,E,C)的拓扑结构在低维隐空间中的表征形式记为Z,则Z是一个M×K维矩阵,其每一行表示每个账户节点拓扑结构的K维表征向量,为了使Z最大限度的保持网络拓扑中各账户节点之间的相似度关系,引入一个K×M维矩阵H构建网络拓扑的重构损失函数如式(1)所示,其中Z为矩阵Z的第m行,表示账户节点vm的拓扑结构在隐空间中的K维表征向量;H·n为矩阵H的第n列,表示账户节点vn在拓扑空间和隐空间之间的映射关系;O1,m为账户节点vm的拓扑结构异常因子,用于描述该账户节点在拓扑结构方面的异常程度,构建网络拓扑结构表征学习的子优化目标函数L1,即使得式(1)所示的损失函数取值最小;
Figure FDA0002426010410000011
S32、构建账户节点属性表征学习的子优化模型:将网络G(V,E,C)的账户节点属性在低维隐空间中的表征形式记为U,则U是一个M×K维矩阵,其每一行表示每个账户节点的属性在隐空间中的K维表征向量,为了使账户节点间属性相似性关系在U中完整的保持,引入一个K×D维矩阵Q构建账户节点属性的重构损失函数如式(2)所示,其中U为矩阵U的第m行,表示账户节点vm的相关属性在隐空间中的K维表征向量;Q·d为矩阵Q的第d列,表示账户节点属性的第d个特征在网络空间和隐空间之间的映射关系;O2,m为账户节点vm的属性异常因子,用于描述该账户节点在属性特征方面的异常程度;构建账户节点属性表征学习的子优化目标函数L2,即令式(2)所示的损失函数取值最小;
Figure FDA0002426010410000021
S33、构建拓扑结构和账户节点属性低维表征间的映射子优化模型:网络结构和账户节点属性是网络数据不同侧面的表现形式,二者之间存在一定映射关系,令隐空间中网络G(V,E,C)的拓扑结构和账户节点属性的低维表征之间的映射关系为K×K维的矩阵W,则网络数据在两个不同侧面数据表征的损失函数如式(3)所示,其中(WT)·k表示矩阵W的转置的第k列(1<k<K),O3,m为账户节点vm的一致性异常因子,用于描述该账户节点在网络拓扑和特征属性映射间的异常程度,构建拓扑结构和账户节点属性低维表征间的映射子优化目标函数L3,即令式(3)所示的损失函数取值最小;
Figure FDA0002426010410000022
其中Zm,k表示矩阵Z的第m行第k列的元素;
S34、构建网络关于拓扑结构和账户节点属性的表征学习联合优化模型:网络在低维空间中的有效表征应同时满足S31~S33中的三个子优化目标,构建网络关于拓扑结构和账户节点属性的表征学习联合损失函数
Figure FDA0002426010410000024
如式(4)所示:
Figure FDA0002426010410000023
其中α,β>0为控制网络结构和账户节点属性在最终表征结果中比重的参数,且满足:
0<O1,m<1,0<O2,m<1,0<O3,m<1 (5)
以及,
Figure FDA0002426010410000031
网络关于拓扑结构和账户节点属性的表征学习联合优化目标即令式(4)所示的损失函数取值最小;
S4、令网络关于拓扑结构和账户节点属性的表征学习联合损失函数的偏导数取0,分别获得网络G(V,E,C)的网络结构和账户节点属性的低维表征的迭代计算方法,具体步骤如下:
S41、求解
Figure FDA0002426010410000032
得到网络拓扑结构的低维表征的迭代计算方法如式(7)所示:
Figure FDA0002426010410000033
其中,W表示矩阵W的第k行,H表示矩阵H的第k行;
Z′m,k由式(8)计算:
Figure FDA0002426010410000034
其中,Z′m,k表示矩阵Z的第m行第k’列的元素,Hk',n表示矩阵H的第k’行第n列的元素,Hk,n表示矩阵H的第k行第n列的元素;
S42、求解
Figure FDA0002426010410000035
得到网络拓扑结构在原始空间和低维隐空间之间映射关系的迭代计算方法如式(9)所示:
Figure FDA0002426010410000036
S43、求解
Figure FDA0002426010410000037
得到账户节点属性低维表征的迭代计算方法如式(10)所示:
Figure FDA0002426010410000041
其中,Um,k表示矩阵U的第m行第k列的元素,Q为矩阵Q的第k行,W·k为矩阵W的第k列,U′m,k和U″m,k由式(11)和式(12)计算:
Figure FDA0002426010410000042
Um,k'表示矩阵U的第m行第k’列的元素,Qk',d表示矩阵Q的第k’行第d列的元素,Qk,d表示矩阵Q的第k行第d列的元素;
Figure FDA0002426010410000043
S44、求解
Figure FDA0002426010410000044
得到账户节点属性在原始空间和低维隐空间之间映射关系的迭代计算方法如式(13)所示:
Figure FDA0002426010410000045
S5、求取网络G(V,E,C)在低维空间中拓扑结构和账户节点属性间的映射矩阵的计算方法,具体步骤如下:
网络G(V,E,C)在低维空间中拓扑结构和账户节点属性间的映射矩阵的计算方法如式(14)所示:
Figure FDA0002426010410000046
其中,矩阵
Figure FDA0002426010410000047
中元素以及矩阵
Figure FDA0002426010410000048
中元素的计算方法分别由式(15)和式(16)给出:
Figure FDA0002426010410000049
Figure FDA00024260104100000410
式(15)中
Figure FDA0002426010410000051
表示矩阵
Figure FDA0002426010410000052
的第m行第k列上的元素,式(16)中
Figure FDA0002426010410000053
表示表示矩阵
Figure FDA0002426010410000054
的第m行第k列上的元素;
S6、求取各账户节点的拓扑结构异常因子、属性异常因子、一致性异常因子,在此基础上计算账户节点的联合异常因子,具体步骤如下:
S61、计算账户节点的拓扑结构异常因子,如式(17)所示:
Figure FDA0002426010410000055
其中O1,m为账户节点vm的拓扑结构异常因子;
S62、计算账户节点的属性异常因子,如式(18)所示:
Figure FDA0002426010410000056
其中O2,m为账户节点vm的属性异常因子;
S63、计算账户节点的一致性异常因子,如式(19)所示:
Figure FDA0002426010410000057
其中O3,m为账户节点vm的一致性异常因子,W为矩阵W的第m行,U·k为矩阵U的第k列;
S64、计算账户节点的联合异常因子,如式(20)所示:
Om=O1,m+O2,m+O3,m (20)
其中Om为账户节点vm的联合异常因子;
S7、初始化模型相关参数,通过迭代执行S4~S6的方法计算每个账户节点的联合异常因子,具体步骤如下:S71、对邻接矩阵A进行SVD矩阵分解,作为矩阵Z和H的初始化值,同理对账户节点属性矩阵进行SVD矩阵分解,作为矩阵U和Q的初始化值;
S72、对账户节点的拓扑结构异常因子、属性异常因子和一致性异常因子进行初始化,令每个账户节点的这三个异常因子初始化值都为1/3,即利用式(21)对第m个账户节点的异常因子进行初始化值:
O1,m=O2,m=O3,m=1/3 (21)
迭代执行步骤S73~S75,直到达到指定的迭代次数,或账户节点的异常因子不再发生变化:
S73、利用式(14)~(16)对W进行更新;
S74、利用式(7)~(13)对Z,H,U,Q进行更新;
S75、利用式(17)~(19)对O1、O2和O3进行更新;
S8、利用3σ法则筛选联合异常因子较大的账户节点,并将这些账户节点对应的网络账户作为异常账户检测结果输出反馈给网络分析人员,用于识别社交网络中存在的异常账户。
2.根据权利要求1所述的一种基于网络表示学习的社交网络异常账户检测方法,其特征在于:所述步骤S8的具体步骤如下:
S81、对于网络中的所有账户节点,依照式(22)的方法计算每个账户节点联合异常因子的Z分数:
Figure FDA0002426010410000061
其中,
Figure FDA0002426010410000062
表示账户节点vm的联合异常因子对应的Z分数,μO和σO分别表示网络中所有账户节点联合异常因子总体分布的期望和标准差,并由式(23)和式(24)计算
Figure FDA0002426010410000063
Figure FDA0002426010410000064
S82、从网络中选择联合异常因子的Z分数大于3的账户节点,进行输出,如式(25)所示:
Figure FDA0002426010410000065
Voutput表示本发明检测出的异常账户构成的集合;
S83、网络分析人员根据输出的结果识别社交网络中存在的异常账户。
3.一种基于网络表示学习的社交网络异常账户检测系统,该系统应用了权利要求1所述的基于网络表示学习的社交网络异常账户检测方法,其特征在于:包括网络数据存取单元、计算机处理器和内存、网络构建单元、网络数据表征学习单元、异常因子计算单元和异常账户筛选和结果输出单元,所述网络数据存取单元从社交网络中收集网络数据;计算机处理器和内存从网络数据存取单元读取收集到的网络数据;网络构建单元根据计算机处理器和内存读取到的网络数据执行步骤S1和步骤S2,从而构建网络以及网络的邻接矩阵;网络数据表征学习单元根据网络构建单元构建的网络以及网络的邻接矩阵,执行步骤S3和步骤S4获取网络数据在低维隐空间中的表征形式;异常因子计算单元根据网络数据在低维隐空间中的表征形式,执行步骤S5和步骤S6计算网络中每个账户节点的异常因子;异常账户筛选和结果输出单元依据每个账户节点的异常因子,执行步骤S8将异常账户由网络中检测出来,并将检测结果进行输出;所有单元中具体的数据处理和计算工作由计算机处理器完成,且所有单元都与计算机内存的数据交互。
CN201910419270.9A 2019-05-20 2019-05-20 基于网络表示学习的社交网络异常账户检测方法及系统 Active CN110191110B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910419270.9A CN110191110B (zh) 2019-05-20 2019-05-20 基于网络表示学习的社交网络异常账户检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910419270.9A CN110191110B (zh) 2019-05-20 2019-05-20 基于网络表示学习的社交网络异常账户检测方法及系统

Publications (2)

Publication Number Publication Date
CN110191110A CN110191110A (zh) 2019-08-30
CN110191110B true CN110191110B (zh) 2020-05-19

Family

ID=67716941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910419270.9A Active CN110191110B (zh) 2019-05-20 2019-05-20 基于网络表示学习的社交网络异常账户检测方法及系统

Country Status (1)

Country Link
CN (1) CN110191110B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111028073B (zh) * 2019-11-12 2023-05-12 同济大学 互联网金融平台网络借贷欺诈检测系统
CN110991552B (zh) * 2019-12-12 2021-03-12 支付宝(杭州)信息技术有限公司 基于联邦学习的孤立森林模型构建和预测方法和装置
CN111277433B (zh) * 2020-01-15 2021-02-12 同济大学 基于属性网络表征学习的网络服务异常检测方法及装置
CN111917601B (zh) * 2020-06-29 2021-09-28 电子科技大学 虚假流量识别方法及用户品牌价值的量化计算方法
CN111767472A (zh) * 2020-07-08 2020-10-13 吉林大学 一种社交网络异常账号检测方法及系统
CN111950594B (zh) * 2020-07-14 2023-05-05 北京大学 基于子图采样的大规模属性图上的无监督图表示学习方法和装置
CN112445957A (zh) * 2020-11-05 2021-03-05 西安电子科技大学 社交网络异常用户检测方法、系统、介质、设备、终端
CN113537272B (zh) * 2021-03-29 2024-03-19 之江实验室 基于深度学习的半监督社交网络异常账号检测方法
CN113407784B (zh) * 2021-05-28 2022-08-12 桂林电子科技大学 一种基于社交网络的社团划分方法、系统及存储介质
CN113409105B (zh) * 2021-06-04 2023-09-26 山西大学 一种电商网络异常用户检测方法及系统
CN116680633B (zh) * 2023-05-06 2024-01-26 国网四川省电力公司广安供电公司 基于多任务学习的异常用户检测方法、系统及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109412839A (zh) * 2018-09-30 2019-03-01 北京奇虎科技有限公司 一种异常账户的识别方法、装置、设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103853841A (zh) * 2014-03-19 2014-06-11 北京邮电大学 一种社交网用户异常行为的分析方法
KR101644405B1 (ko) * 2014-11-21 2016-08-10 택추얼센스 주식회사 Sns 앱 기반의 모바일 메신저 서비스에서 햅틱 효과를 갖는 이모티콘을 온라인 네트워크를 통해 제공하는 방법 및 시스템
CN109710754A (zh) * 2018-11-12 2019-05-03 中国科学院信息工程研究所 一种基于深度结构学习的群体异常行为检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109412839A (zh) * 2018-09-30 2019-03-01 北京奇虎科技有限公司 一种异常账户的识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110191110A (zh) 2019-08-30

Similar Documents

Publication Publication Date Title
CN110191110B (zh) 基于网络表示学习的社交网络异常账户检测方法及系统
Chen et al. GA-based Q-attack on community detection
CN112529168B (zh) 一种基于gcn的属性多层网络表示学习方法
Chen et al. Multiscale evolutionary perturbation attack on community detection
Ahmad et al. Optimized intrusion detection mechanism using soft computing techniques
CN106060008B (zh) 一种网络入侵异常检测方法
CN109710754A (zh) 一种基于深度结构学习的群体异常行为检测方法
CN113283909B (zh) 一种基于深度学习的以太坊钓鱼账户检测方法
Venema et al. Forest structure optimization using evolutionary programming and landscape ecology metrics
Murakonda et al. Quantifying the privacy risks of learning high-dimensional graphical models
Liu et al. Adaptive multi-channel bayesian graph attention network for iot transaction security
Xue et al. An anomaly detection framework for time-evolving attributed networks
Yu et al. Unsupervised euclidean distance attack on network embedding
Liu et al. Link prediction by multiple motifs in directed networks
Mazepa et al. An ontological approach to detecting fake news in online media
Wang et al. Uncovering fuzzy communities in networks with structural similarity
Peng et al. Adaptive graph regularization method based on least square regression for clustering
Liu et al. Community hiding using a graph autoencoder
CN113343123A (zh) 一种生成对抗多关系图网络的训练方法和检测方法
Yu et al. G $^ 2$ uardFL: Safeguarding Federated Learning Against Backdoor Attacks through Attributed Client Graph Clustering
CN115834251A (zh) 基于超图Transformer威胁狩猎模型建立方法
Zhao et al. Intrusion Detection Based on Improved SOM with Optimized GA.
Tian et al. Intrusion detection combining multiple decision trees by fuzzy logic
Bidgolya et al. A robust opinion spam detection method against malicious attackers in social media
CN115310589A (zh) 一种基于深度图自监督学习的群体识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant