CN107835113B - 一种基于网络映射的社交网络中异常用户检测方法 - Google Patents

一种基于网络映射的社交网络中异常用户检测方法 Download PDF

Info

Publication number
CN107835113B
CN107835113B CN201710541257.1A CN201710541257A CN107835113B CN 107835113 B CN107835113 B CN 107835113B CN 201710541257 A CN201710541257 A CN 201710541257A CN 107835113 B CN107835113 B CN 107835113B
Authority
CN
China
Prior art keywords
user
users
network
social
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710541257.1A
Other languages
English (en)
Other versions
CN107835113A (zh
Inventor
郑子彬
叶方华
周育人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Sun Yat Sen University
Original Assignee
National Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Sun Yat Sen University filed Critical National Sun Yat Sen University
Priority to CN201710541257.1A priority Critical patent/CN107835113B/zh
Publication of CN107835113A publication Critical patent/CN107835113A/zh
Application granted granted Critical
Publication of CN107835113B publication Critical patent/CN107835113B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/23Reliability checks, e.g. acknowledgments or fault reporting

Abstract

本发明涉及一种基于网络映射的社交网络中异常用户检测方法,包括以下步骤:S1、利用网络爬虫技术爬取社交网络平台的用户数据;S2、对爬取到的用户数据进行预处理,构建用户社交关系网络图G;S3、基于用户社交关系网络图G,利用node2vec将用户的社交关系转化为低维的向量表征;S4、融合用户多维度的向量表征得到最终的向量表征;S5、基于用户的特征向量进行聚类,预测用户是正常用户,还是异常用户,如果是异常用户,并给出异常类型。本发明具有时间和人力成本开销低、能够识别各种各样的异常用户类型并且能够识别新的异常用户类型、能够综合考虑用户多维度的属性特征、准确率高等优点。

Description

一种基于网络映射的社交网络中异常用户检测方法
技术领域
本发明涉及网络数据检测的技术领域,尤其涉及到一种基于网络映射的社交网络中异常用户检测方法。
背景技术
社交网络的便利性、娱乐性、实时性等一系列优良特性吸引了海量的用户,在网络空间中构筑起一个虚拟的社会。同时,社交网络庞大的用户基数吸引了大量的攻击者。攻击者通过创建大量的虚假账号和盗用正常的账户,在社交网络中或散发谣言,或发布广告、钓鱼、色情信息等,或通过这些账号来恶意增加其他账号的信誉,如批量关注、恶意点赞等。这些攻击者统称为异常用户。因此,社交网络中的异常用户检测对个人、企业和国家均具有十分重要的意义。
目前,学术界和工业界提出了大量的检测社交网络中异常用户的方法。这些方法可以被归为四类:基于行为特征的检测方法,基于内容的检测方法,基于图的检测方法,以及基于无监督学习的检测方法。基于行为特征的检测方法将异常用户检测视为一个二分类问题,利用用户的行为特征来区分正常用户和异常用户。基于内容的检测方法与基于行为特征的检测方法类似,其主要利用的是用户发布的内容信息,这些信息反映了用户的兴趣爱好。基于图的检测方法是利用正常用户和异常用户在所形成的社交网络中具有不同的结构性质,将异常用户检测问题转化为网络中的异常节点检测问题,然后利用图挖掘的相关算法来识别出异常用户。基于无监督学习的方法是利用正常用户有相同或者相似的特征,通过特征的聚类来区分正常用户和异常用户。尽管这些检测方法已经被广泛运用到实践当中,但是这些方法只有在特定的应用场景下才能取得良好的效果,泛化能力不强,不具有普适性,因而不能很好的满足实际需要。具体来讲,基于行为特征和基于内容的检测方法虽然准确率较高,但由于是有监督学习方法,需要提前对样本数据进行标记,这需要花费大量的时间和人力成本,而且只能检测已知的异常类型,当异常用户改变其表现形态后就无法准确检测。基于图的检测方法虽然有较强的鲁棒性,但是准确率较低,而且只能检测与其他用户有联系的异常用户,目前尚处于理论研究阶段。基于无监督学习的方法不需要提前对样本数据进行标记,节省了时间和人力成本开销,因而能够较快形成检测系统并且可以检测未知的攻击行为,但是其不容易区分不同类型的异常用户。
鉴于社交网络中海量的用户基数、异常用户的多种表现形态和动态特征,以及已有的办法的缺陷,亟待提出一种时间和人力成本开销低、能够识别各种各样的异常用户类型并且能够识别新的异常用户类型、能够综合考虑用户多维度的属性特征、准确率高的检测方法。
发明内容
本发明的目的在于克服现有技术的不足,提供一种时间和人力成本开销低、能够识别各种各样的异常用户类型并且能够识别新的异常用户类型、能够综合考虑用户多维度的属性特征、准确率高的基于网络映射的社交网络中异常用户检测方法。
为实现上述目的,本发明所提供的技术方案为:其包括以下步骤:
S1、利用网络爬虫技术爬取如腾讯QQ、微信、新浪微博、Facebook等社交网络平台的用户数据。
S2、对爬取到的用户数据进行预处理,构建用户社交关系网络图G;预处理步骤如下:
S21、将爬取到的用户数据分为四个维度,分别为用户基本信息、用户行为特征、用户兴趣爱好以及用户好友关系;
S22、将步骤S21中所述用户基本信息、用户行为特征、用户兴趣爱好该三个维度的用户数据分别对应处理成三个含有多维的特征向量;
对于基本信息,用户ID作为用户身份的唯一标识,其他的信息用一个向量V1来表示,V1的维数为l1,对于不是数值型的基本信息,将其一一映射到实数空间;如对于性别,用0表示女,用1表示男;对于所在地,先将所有的用户所在地按字符串序排序,然后用某个地址的顺序数来表示该地址;
对于行为特征,采取与基本信息一样的处理方式;行为特征用向量V2来表示,V2的维数为l2。对于发布消息的时间间隔,记录最大的时间间隔、最小的时间间隔和平均时间间隔。
对于用户兴趣爱好,用户兴趣爱好的处理主要依据LDA主题模型,即从与用户相关的消息内容中抽取出用户的兴趣爱好,具体步骤如下:
1)分词:
对与用户相关的每一条消息文本d进行分词处理,去掉停用词、标点符号和特殊符号等与主题无关的词,得到该消息的单词序列<w1,w2,w3,…,wn>,其中wi表示第i个单词,设d一共有n个单词;所有的消息内容的集合记为D,即D={d1,d2,d3,…,dm},设总共有m条消息内容;
2)生成每条消息的主题:
LDA假设一篇文档的主题分布服从某个概率分布p(t|d),同时也假设在给定某个主题t的前提下,单词也服从某个概率分布p(w|t),一篇文章d包含单词w的概率为:
p(w|d)=∑tp(w|t)*p(t|d),
考虑所有的文档,采用矩阵形式来描述上述关系,即:
Figure RE-GDA0001571037420000041
其中,D的元素表示词频,T的行向量表示文档的主题分布,W的列向量表示主题的单词分布;
通过统计分析得到p(w|d)的经验分布
Figure RE-GDA0001571037420000042
并求解T和W,使得T和 W的乘积尽可能的与
Figure RE-GDA0001571037420000043
吻合;T和W的求解目标函数为:
Figure RE-GDA0001571037420000044
其中,第一项表示T和W的乘积应尽可能的与
Figure RE-GDA0001571037420000045
吻合,后两项为正则项;起到防止过拟合的作用,该优化目标函数通过随机梯度下降SGD求解;
3)生成用户兴趣爱好的特征向量:
在求得每条消息的主题之后,针对每一个用户u,其兴趣爱好特征向量按下式求解:
Figure RE-GDA0001571037420000046
其中,h表示与u相关的消息数,Tu表示与u相关的消息的主题分布,V3的维度记为l3
S23、将步骤S22得到的三个特征向量拼接在一起得到V0,V0的维度为 l0=l1+l2+l3
S24、处理用户好友关系的数据,并与步骤S23拼接在一起的特征向量V0配合构建用户社交关系网络图G;具体过程为:基于好友、粉丝和关注情况构造一个有向无权图G0;但这样得到的G0往往十分稀疏,为了解决该问题,本方案在存在联系的用户和其二度好友之间构建一条赋予权值0.5的边,相应地,一度好友之间连边的权值设为1.0,从而得到有权图G0';显然,这样定义的权值比较粗糙,进一步地,对G0'中的任意一条边e=(u,v),按如下方式计算其权值:
wt(e)=wt0*wt1*wt2
其中,wt0等于0.5或者1,取决于u,v是一度好友还是二度好友;wt1定义为u和v的一度好友的Jaccard相似性,即
Figure RE-GDA0001571037420000051
nb(u), nb(v)分别表示u和v的一度好友;wt2的计算过程分为两步,第一步计算u和v 的前三个维度的特征相似度,采用欧式距离dist来刻画,第二步将求得的距离映射到(0,1)区间,选用Sigmoid函数
Figure RE-GDA0001571037420000052
得到 wt2=f(dist(V0(u),V0(v)));通过这种方式定义的边权包含了丰富的信息,wt0反映了u和v是一度好友还是二度好友,wt1反应了u和v的共同好友是多还是少,wt2反映了u和v的兴趣爱好和行为特征等是否相似。通过这种方式计算出每一条边的权值,得到最终的有向边权的用户社交关系网络图G。用户社交关系网络图G有效地解决了原始社交关系网络的稀疏性问题,同时也通过边权将不同用户之间的亲密程度或相似程度进行了有效量化。
S3、基于用户社交关系网络图G,利用node2vec将用户的社交关系转化为低维的向量表征;
用户社交关系网络图G经典描述方式为邻接矩阵,邻接矩阵的行向量可作为用户的特征向量,这种方式简单直接,但是不具有可行性。例如,微信用户数超过8亿,那么就需要用一个超过8亿维的向量来表征一个用户,这显然不切实际。因此需要基于用户社交关系网络图G求出一个低维向量来尽可能准确地表征用户在社交关系当中表现出的特征。这即为网络映射 (Network Embedding)。网络映射形式化定义为:
给定图G=(V,E),其中V是节点集合,E是边的集合,寻找一个映射函数
Figure RE-GDA0001571037420000061
将网络中的节点映射到低维向量空间Rr,转换后的低维向量尽可能保留原网络的特性。
本方案采用node2vec来进行网络映射。node2vec本质上与DeepWalk一样。DeepWalk借鉴的是word2vec的思想,其将网络中的节点视为一个单词,然后将从某个节点出发得到的长度为s的短距离随机游走节点序列视为一个句子,然后再利用word2vec来求得每个节点的向量表征。node2vec与 DeepWalk的差别在于其选择的是一种可以调节的2nd度随机游走方式。 node2vec的提出基于同质性假设和结构等价假设,同质性假设表明处于同一社区的节点理应由相似的向量表征,结构等价假设表明网络中充当相同或类似角色的节点的向量表征应尽可能相似。这两个假设均符合本方法的需要。因而选择node2vec来做网络映射是合适的选择。node2vec通过两个参数来控制随机游走是倾向于BFS还是DFS,因而具有更大的灵活性,因而本方法也具有很好的灵活性。当node2vec中随机游走倾向于宽度优先BFS时,得到的节点向量表征能够更精确的刻画节点的局部特征;当node2vec中随机游走倾向于深度优先DFS时,得到的节点向量表征能够更精确的刻画节点的全局特征。考虑到社交网络的小世界效应(即经典的六度分隔理论),本方法更倾向于得到节点的局部特征的精确刻画,即BFS所占的比重比DFS大。node2vec 采用2nd度随机游走方式相比于DeepWalk的一个很大的优势在于得到的节点向量表征的是节点的半局部信息,因而比局部信息更精准,同时又比全局信息更高效。网络映射最终可转化为最优化问题,node2vec的优化目标函数为:
Figure RE-GDA0001571037420000071
其中,Ns(u)表示节点u的通过负采样策略选出的邻居。利用随机梯度下降SGD可以求解该优化问题。通过node2vec得到的用户社交关系表征记为V4,其维度为l4
S4、融合用户多维度的向量表征得到最终的向量表征;
用户多维度的向量表征的融合方式有两种,一种简易的融合方式为直接将V1,V2,V3,V4拼接在一起得到一个维度为l1+l2+l3+l4的用户最终向量表征Vfinal,此种方式的缺陷在于没有考虑V1,V2,V3,V4之间的相关性。另一种融合方式通过借助张量得到
Figure RE-GDA0001571037420000072
其维度为l1*l2*l3*l4,此种方式充分考虑到了V1,V2,V3,V4之间的关联性,但是得到的向量表征可能维度偏高。融合时结合实际情况选择其中的一种融合方式。
S5、基于用户特征向量Vfinal,采取k-means或者DBSCAN算法对用户进行聚类,然后对得到的类中用户进行抽样验证来判断类中用户是否为正常用户,如果是异常用户,则同时可以确定该类所属的异常类型。k-means为一种基于距离的聚类算法,其将用户分为k个类别,处于同一个类别中的用户相似性大于处于不同类别中用户的相似性。DBSCAN聚类算法为一种基于高密度连通区域的基于密度的聚类算法,能够将具有足够高密度的用户划分到一起,并且在具有噪声的数据中发现任意大小的用户组。DBSCAN对于检测异常用户类型能够比k-means取得更好的结果,但是k-means求解比DBSCAN简单很多,在应用中可结合实际情况做出选择。
与现有技术相比,本方案原理和优点如下:
1.本方案主要分为特征工程和聚类预测两个阶段,采用的是无监督学习策略,相比于有监督学习策略,具有用时少以及人力成本开销低等优势。
2.基于图的检测方法与基于无监督学习的检测方法都是无监督的方法,传统算法将二者分开处理,没有充分利用用户数据包含的信息,因而预测效果不尽如人意;本方案同时考虑用户的社交关系和用户的其他特征,将基于图的检测方法与基于无监督学习的检测方法的优势合二为一,最终得到的用户特征向量能够更准确的刻画用户的真实特征。
附图说明
图1为本发明一种基于网络映射的社交网络中异常用户检测方法的总体框架图;
图2为本发明一种基于网络映射的社交网络中异常用户检测方法中特征工程的流程图;
图3为本发明一种基于网络映射的社交网络中异常用户检测方法的工作流程图。
具体实施方式
下面结合具体实施例对本发明作进一步说明:
参见附图1-3所示,本实施例所述的一种基于网络映射的社交网络中异常用户检测方法,包括以下步骤:
S1、利用网络爬虫技术爬取微信社交网络平台的用户数据,需要爬取的详细数据参见表1。
Figure RE-GDA0001571037420000081
Figure RE-GDA0001571037420000091
表1特征类型与对应的用户数据
S2、对爬取到的用户数据进行预处理,构建用户社交关系网络图G;预处理步骤如下:
S21、将爬取到的用户数据分为四个维度,分别为用户基本信息、用户行为特征、用户兴趣爱好以及用户好友关系;
S22、将步骤S21中所述用户基本信息、用户行为特征、用户兴趣爱好该三个维度的用户数据分别对应处理成三个含有多维的特征向量;
对于基本信息,用户ID作为用户身份的唯一标识,其他的信息用一个向量V1来表示,V1的维数为l1,对于不是数值型的基本信息,将其一一映射到实数空间;
对于行为特征,采取与基本信息一样的处理方式;行为特征用向量V2来表示,V2的维数为l2
对于用户兴趣爱好,用户兴趣爱好的处理主要依据LDA主题模型,即从与用户相关的消息内容中抽取出用户的兴趣爱好,具体步骤如下:
1)分词:
对与用户相关的每一条消息文本d进行分词处理,去掉停用词、标点符号和特殊符号等与主题无关的词,得到该消息的单词序列<w1,w2,w3,…,wn>,其中wi表示第i个单词,设d一共有n个单词;所有的消息内容的集合记为D,即D={d1,d2,d3,…,dm},设总共有m条消息内容;
2)生成每条消息的主题:
LDA假设一篇文档的主题分布服从某个概率分布p(t|d),同时也假设在给定某个主题t的前提下,单词也服从某个概率分布p(w|t),一篇文章d包含单词w的概率为:
p(w|d)=∑tp(w|t)*p(t|d),
考虑所有的文档,采用矩阵形式来描述上述关系,即:
Figure RE-GDA0001571037420000101
其中,D的元素表示词频,T的行向量表示文档的主题分布,W的列向量表示主题的单词分布;
通过统计分析得到p(w|d)的经验分布
Figure RE-GDA0001571037420000102
并求解T和W,使得T和 W的乘积尽可能的与
Figure RE-GDA0001571037420000103
吻合;T和W的求解目标函数为:
Figure RE-GDA0001571037420000104
其中,第一项表示T和W的乘积应尽可能的与
Figure RE-GDA0001571037420000105
吻合,后两项为正则项, 起到防止过拟合的作用,该优化目标函数通过随机梯度下降SGD求解;
3)生成用户兴趣爱好的特征向量:
在求得每条消息的主题之后,针对每一个用户u,其兴趣爱好特征向量按下式求解:
Figure RE-GDA0001571037420000106
其中,h表示与u相关的消息数,Tu表示与u相关的消息的主题分布,V3的维度记为l3
S23、将步骤S22得到的三个特征向量拼接在一起得到V0,V0的维度为 l0=l1+l2+l3
S24、处理用户好友关系的数据,并与步骤S23拼接在一起的特征向量V0配合构建用户社交关系网络图G,具体步骤如下:
1))基于好友、粉丝和关注情况构造一个有向无权图G0
2))基于有向无权图G0,在用户和其二度好友之间构建一条赋予权值0.5 的边,和一度好友之间连边的权值设为1.0,得到有权图G0';
3))计算有权图G0'中任意一条边e=(u,v)的权值,得出有向边权的用户社交关系网络图G;
权值的计算公式如下:
wt(e)=wt0*wt1*wt2
其中,wt0反映了u和v是一度好友还是二度好友,wt1反应了u和v的共同好友是多还是少,wt2反映了u和v的兴趣爱好和行为特征等是否相似。
S3、基于用户社交关系网络图G,利用node2vec将用户的社交关系转化为低维的向量表征;
利用node2vec将用户的社交关系转化为低维的向量表征的优化目标函数为:
Figure RE-GDA0001571037420000111
其中,fG(u)为网络映射函数,
Figure RE-GDA0001571037420000112
s.t.r<<|V|,V为用户社交关系网络图G的节点集合,Ns(u)表示节点u的通过负采样策略选出的邻居,利用随机梯度下降SGD求解该优化问题,通过node2vec得到的用户社交关系表征记为V4
S4、通过直接相加拼接的融合方式融合用户多维度的向量表征得到最终的向量表征;
S5、基于用户的特征向量采用k-means算法对用户进行聚类,预测用户是正常用户,还是异常用户,如果是异常用户,并给出异常类型。
本实施例主要分为特征工程和聚类预测两个阶段,采用的是无监督学习策略,相比于有监督学习策略,具有用时少以及人力成本开销低等优势;另外,本实施例同时考虑用户的社交关系和用户的其他特征,将基于图的检测方法与基于无监督学习的检测方法的优势合二为一,最终得到的用户特征向量能够更准确的刻画用户的真实特征。
以上所述之实施例子只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

Claims (6)

1.一种基于网络映射的社交网络中异常用户检测方法,其特征在于:包括以下步骤:
S1、利用网络爬虫技术爬取社交网络平台的用户数据;
S2、对爬取到的用户数据进行预处理,构建用户社交关系网络图G;
S3、基于用户社交关系网络图G,利用node2vec将用户的社交关系转化为低维的向量表征;
S4、融合用户多维度的向量表征得到最终的向量表征;
S5、基于用户的特征向量进行聚类,预测用户是正常用户,还是异常用户,如果是异常用户,并给出异常类型;
所述步骤S2中预处理步骤如下:
S21、将爬取到的用户数据分为四个维度,分别为用户基本信息、用户行为特征、用户兴趣爱好以及用户好友关系;
S22、将步骤S21中所述用户基本信息、用户行为特征、用户兴趣爱好三个维度的用户数据分别对应处理成三个含有多维的特征向量;
S23、将步骤S22得到的三个特征向量拼接在一起;
S24、处理用户好友关系的数据,并与步骤S23拼接在一起的特征向量V0配合构建用户社交关系网络图G;
所述步骤S22中用户兴趣爱好的处理主要依据LDA主题模型,具体步骤如下:
1)分词:
对与用户相关的每一条消息文本d进行分词处理,去掉停用词、标点符号和特殊符号等与主题无关的词,得到该消息的单词序列<w1,w2,w3,…,wn>,其中wi表示第i个单词,设d一共有n个单词;所有的消息内容的集合记为D,即D={d1,d2,d3,…,dm},设总共有m条消息内容;
2)生成每条消息的主题:
LDA假设一篇文档的主题分布服从某个概率分布p(t|d),同时也假设在给定某个主题t的前提下,单词也服从某个概率分布p(w|t),一篇文章d包含单词w的概率为:
p(w|d)=∑tp(w|t)*p(t|d),
考虑所有的文档,采用矩阵形式来描述上述关系,即:
Figure FDA0002524516270000021
其中,D的元素表示词频,T的行向量表示文档的主题分布,W的列向量表示主题的单词分布;
通过统计分析得到p(w|d)的经验分布
Figure FDA0002524516270000022
并求解T和W,使得T和W的乘积尽可能的与
Figure FDA0002524516270000023
吻合;T和W的求解目标函数为:
Figure FDA0002524516270000024
其中,第一项表示T和W的乘积应尽可能的与
Figure FDA0002524516270000025
吻合,后两项为正则项;
3)生成用户兴趣爱好的特征向量:
在求得每条消息的主题之后,针对每一个用户u,其兴趣爱好特征向量按下式求解:
Figure FDA0002524516270000026
其中,h表示与u相关的消息数,Tu表示与u相关的消息的主题分布。
2.根据权利要求1所述的一种基于网络映射的社交网络中异常用户检测方法,其特征在于:所述步骤S24处理用户好友关系的数据,并与步骤S23拼接在一起的特征向量V0配合构建用户社交关系网络图G的具体步骤如下:
1))基于好友、粉丝和关注情况构造一个有向无权图G0
2))基于有向无权图G0,在用户和其二度好友之间构建一条赋予权值0.5的边,和一度好友之间连边的权值设为1.0,得到有权图G0';
3))计算有权图G0'中任意一条边e=(u,v)的权值,得出有向边权的用户社交关系网络图G。
3.根据权利要求2所述的一种基于网络映射的社交网络中异常用户检测方法,其特征在于:所述步骤3))中任意一条边e=(u,v)的权值的计算公式如下:
wt(e)=wt0*wt1*wt2
其中,wt0反映u和v是一度好友还是二度好友,wt1反应u和v的共同好友是多还是少,wt2反映u和v的兴趣爱好和行为特征等是否相似。
4.根据权利要求1所述的一种基于网络映射的社交网络中异常用户检测方法,其特征在于:所述步骤S3利用node2vec将用户的社交关系转化为低维的向量表征的优化目标函数为:
Figure FDA0002524516270000031
其中,fG(u)为网络映射函数,
Figure FDA0002524516270000032
s.t.r<<|V|,V为用户社交关系网络图G的节点集合,Ns(u)表示节点u的通过负采样策略选出的邻居,利用随机梯度下降SGD求解该优化问题,通过node2vec得到的用户社交关系表征记为V4
5.根据权利要求1所述的一种基于网络映射的社交网络中异常用户检测方法,其特征在于:所述步骤S4用户多维度的向量表征的融合方式包括:多个维度的向量表征直接相加拼接融合以及多个维度的向量表征通过张量乘积融合。
6.根据权利要求1所述的一种基于网络映射的社交网络中异常用户检测方法,其特征在于:所述步骤S5基于用户的特征向量采用k-means或者DBSCAN算法对用户进行聚类。
CN201710541257.1A 2017-07-05 2017-07-05 一种基于网络映射的社交网络中异常用户检测方法 Active CN107835113B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710541257.1A CN107835113B (zh) 2017-07-05 2017-07-05 一种基于网络映射的社交网络中异常用户检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710541257.1A CN107835113B (zh) 2017-07-05 2017-07-05 一种基于网络映射的社交网络中异常用户检测方法

Publications (2)

Publication Number Publication Date
CN107835113A CN107835113A (zh) 2018-03-23
CN107835113B true CN107835113B (zh) 2020-09-08

Family

ID=61643152

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710541257.1A Active CN107835113B (zh) 2017-07-05 2017-07-05 一种基于网络映射的社交网络中异常用户检测方法

Country Status (1)

Country Link
CN (1) CN107835113B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108520166B (zh) * 2018-03-26 2022-04-08 中山大学 一种基于多重相似性网络游走的药物靶标预测方法
CN108596774B (zh) * 2018-04-24 2021-10-01 山东师范大学 基于深层次网络嵌入特征的社会化信息推荐算法及系统
CN108717602B (zh) * 2018-05-15 2021-09-28 创新先进技术有限公司 一种交易行为异常的识别方法、装置及设备
CN109063886B (zh) * 2018-06-12 2022-05-31 创新先进技术有限公司 一种异常检测方法、装置以及设备
CN110619564B (zh) * 2018-06-20 2021-01-05 天云融创数据科技(北京)有限公司 一种反欺诈特征生成方法和装置
CN108959524A (zh) * 2018-06-28 2018-12-07 中译语通科技股份有限公司 一种识别数据爬虫的方法、系统及信息数据处理终端
CN109034661A (zh) * 2018-08-28 2018-12-18 腾讯科技(深圳)有限公司 用户识别方法、装置、服务器以及存储介质
CN109145050B (zh) * 2018-09-29 2022-04-01 智器云南京信息科技有限公司 一种计算设备
CN115426653A (zh) * 2018-11-02 2022-12-02 华为技术有限公司 类别信息的确定方法及装置
CN109905399B (zh) * 2019-03-14 2021-06-01 哈尔滨工程大学 一种基于自我网络结构演化的社交媒体个体异常用户检测方法
CN110138751B (zh) * 2019-04-25 2021-07-20 东华大学 抵御位置数据中毒攻击的车联网位置数据处理方法和装置
CN110489691A (zh) * 2019-07-03 2019-11-22 平安证券股份有限公司 页面组件显示方法及终端设备
CN110472050A (zh) * 2019-07-24 2019-11-19 阿里巴巴集团控股有限公司 一种团伙聚类方法和装置
CN110555149A (zh) * 2019-09-05 2019-12-10 深圳前海微众银行股份有限公司 言论数据处理方法、装置、设备及可读存储介质
CN111143701A (zh) * 2019-12-13 2020-05-12 中国电子科技网络信息安全有限公司 一种基于多维度的社交网络用户推荐方法及系统
CN111209317A (zh) * 2020-01-15 2020-05-29 同济大学 一种知识图谱异常社区检测方法及装置
CN111582872A (zh) * 2020-05-06 2020-08-25 支付宝(杭州)信息技术有限公司 异常账号检测模型训练、异常账号检测方法、装置及设备
CN112487176B (zh) * 2020-11-26 2021-11-02 北京智谱华章科技有限公司 社交机器人检测方法、系统、存储介质和电子设备
CN113506113B (zh) * 2021-06-02 2022-02-11 北京顶象技术有限公司 一种基于关联网络的信用卡套现团伙挖掘方法及系统
CN115617694B (zh) * 2022-11-30 2023-03-10 中南大学 基于信息融合的软件缺陷预测方法、系统、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571484A (zh) * 2011-12-14 2012-07-11 上海交通大学 一种检测网络水军以及找到网络水军的方法
CN103150374A (zh) * 2013-03-11 2013-06-12 中国科学院信息工程研究所 一种识别微博异常用户的方法和系统
CN103390051A (zh) * 2013-07-25 2013-11-13 南京邮电大学 一种基于微博数据的话题发现与追踪方法
CN103458042A (zh) * 2013-09-10 2013-12-18 上海交通大学 一种微博广告用户检测方法
CN103793501A (zh) * 2014-01-20 2014-05-14 惠州学院 基于社交网络的主题社团发现方法
CN105005594A (zh) * 2015-06-29 2015-10-28 嘉兴慧康智能科技有限公司 异常微博用户识别方法
US9183387B1 (en) * 2013-06-05 2015-11-10 Google Inc. Systems and methods for detecting online attacks
CN106296422A (zh) * 2016-07-29 2017-01-04 重庆邮电大学 一种融合多算法的社交网络垃圾用户检测方法
CN106445513A (zh) * 2016-09-12 2017-02-22 中山大学 一种基于移动应用界面元素的相似性计算方法
CN106599181A (zh) * 2016-12-13 2017-04-26 浙江网新恒天软件有限公司 一种基于主题模型的新闻热点检测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571484A (zh) * 2011-12-14 2012-07-11 上海交通大学 一种检测网络水军以及找到网络水军的方法
CN103150374A (zh) * 2013-03-11 2013-06-12 中国科学院信息工程研究所 一种识别微博异常用户的方法和系统
US9183387B1 (en) * 2013-06-05 2015-11-10 Google Inc. Systems and methods for detecting online attacks
CN103390051A (zh) * 2013-07-25 2013-11-13 南京邮电大学 一种基于微博数据的话题发现与追踪方法
CN103458042A (zh) * 2013-09-10 2013-12-18 上海交通大学 一种微博广告用户检测方法
CN103793501A (zh) * 2014-01-20 2014-05-14 惠州学院 基于社交网络的主题社团发现方法
CN105005594A (zh) * 2015-06-29 2015-10-28 嘉兴慧康智能科技有限公司 异常微博用户识别方法
CN106296422A (zh) * 2016-07-29 2017-01-04 重庆邮电大学 一种融合多算法的社交网络垃圾用户检测方法
CN106445513A (zh) * 2016-09-12 2017-02-22 中山大学 一种基于移动应用界面元素的相似性计算方法
CN106599181A (zh) * 2016-12-13 2017-04-26 浙江网新恒天软件有限公司 一种基于主题模型的新闻热点检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DC-RSF: A Dynamic and Customized Reputation System Framework for Joint Cloud Computing;Fanghua Ye et al;《2017 IEEE 37th International Conference on Distributed Computing Systems Workshops (ICDCSW)》;20170608;全文 *
在线社交网络中异常帐号检测方法研究;张玉清等;《计算机学报》;20150602;全文 *
基于条件随机场的虚假评论识别研究;陈颖等;《北京电子科技学院学报》;20170615;全文 *

Also Published As

Publication number Publication date
CN107835113A (zh) 2018-03-23

Similar Documents

Publication Publication Date Title
CN107835113B (zh) 一种基于网络映射的社交网络中异常用户检测方法
CN107330461B (zh) 基于情感与信任的协同过滤推荐方法
Yuan et al. Sentribute: image sentiment analysis from a mid-level perspective
Hu et al. Social spammer detection with sentiment information
WO2019233258A1 (zh) 信息发送方法、装置、系统和计算机可读存储介质
Chen et al. Travel recommendation by mining people attributes and travel group types from community-contributed photos
CN105022761B (zh) 群组查找方法和装置
US20210026883A1 (en) Image-to-image search method, computer-readable storage medium and server
Zhang Language in our time: An empirical analysis of hashtags
Patel et al. A state of art survey on shilling attack in collaborative filtering based recommendation system
Sun et al. Opinion spam detection based on heterogeneous information network
Yuan et al. Sentiment analysis using social multimedia
US10706371B2 (en) Data processing techniques
KR20120087214A (ko) 소셜 네트워킹 서비스 사용자를 위한 친구 추천 방법, 이를 위한 기록 매체 및 이를 이용하는 소셜 네트워킹 서비스 및 서버
Sarsam et al. Geo-spatial-based emotions: A mechanism for event detection in microblogs
Gao et al. Detection of abnormal item based on time intervals for recommender systems
Yuan et al. Research of deceptive review detection based on target product identification and metapath feature weight calculation
KR101910424B1 (ko) 태그의 감성 분석을 이용한 영화 평점 예측 방법, 이를 수행하기 위한 기록 매체 및 장치
Wu et al. Detecting malicious social robots with generative adversarial networks
Ivanov et al. Comparative study of trust modeling for automatic landmark tagging
Liyanage et al. Clustered Approach for Clone Detection in social media
CN107070702B (zh) 基于合作博弈支持向量机的用户账号关联方法及其装置
CN115204436A (zh) 检测业务指标异常原因的方法、装置、设备及介质
Qi et al. Object retrieval with image graph traversal-based re-ranking
CN112015937A (zh) 一种图片地理定位方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant