CN103077240A - 一种基于概率图模型的微博水军识别方法 - Google Patents

一种基于概率图模型的微博水军识别方法 Download PDF

Info

Publication number
CN103077240A
CN103077240A CN2013100086440A CN201310008644A CN103077240A CN 103077240 A CN103077240 A CN 103077240A CN 2013100086440 A CN2013100086440 A CN 2013100086440A CN 201310008644 A CN201310008644 A CN 201310008644A CN 103077240 A CN103077240 A CN 103077240A
Authority
CN
China
Prior art keywords
user
probability
value
waterborne troops
microblog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100086440A
Other languages
English (en)
Other versions
CN103077240B (zh
Inventor
韩忠明
万月亮
许峰敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING WISEWEB BIG DATA TECHNOLOGY Co.,Ltd.
Original Assignee
Beijing Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Technology and Business University filed Critical Beijing Technology and Business University
Priority to CN201310008644.0A priority Critical patent/CN103077240B/zh
Publication of CN103077240A publication Critical patent/CN103077240A/zh
Application granted granted Critical
Publication of CN103077240B publication Critical patent/CN103077240B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于概率图模型的微博水军识别方法,它有三大步骤。本发明是将用户的属性和以往使用微博的行为量化成特征指标,分别为用户的属性特征和行为特征,通过构建属性特征与行为特征之间的概率图结构,将用户为水军的概率视为此图结构中的隐变量,利用样本学习图模型的参数,利用学习后的概率图模型预测其它用户为水军的概率。本发明以如何在微博平台中自动识别水军用户为研究对象,提供了一种自动、有效、快速的识别微博水军用户的方法,它使得在微博平台大数据量的情况下能够进行有效的进行识别。它在数据挖掘技术领域里具有较好的实用价值和广阔地应用前景。

Description

一种基于概率图模型的微博水军识别方法
技术领域
本发明涉及一种基于概率图模型的微博水军识别方法,它应用于WEB数据挖掘、舆情监控、谣言检测、水军识别等方面,属于数据挖掘技术领域。
背景技术
微博凭借传播速度快、用户多、便捷等特点风靡整个世界,已经成为最具有影响力的社会媒体。目前中国网民使用微博的比例已经过半,并且成为微博用户世界第一大国。随着微博平台用户量剧增,传播效应的不断扩大,微博也正在成为“网络水军”的主战场,这里称为微博水军(以下简称水军)。
水军利用微博传播媒介,制造公共话题,扭曲网络舆论,并进行各种微博事件或产品的策划、推动、引导,使得某些特定事件、个人、单位的影响力飙升,达到引导舆论导向、获取自我营利等目的。
目前对于判别水军的研究多从传播学的角度出发,单纯的分析微博转发和评论的时序特征、内容特征或者用户的属性特征,然后定性地判别水军,而并没有定量的模型和方法。比如通过分析目标微博的转发时序,通过时序特征寻找某些时刻点,分析这些时刻点附近转发用户的属性特征从而判定这些用户是否为水军。
定性分析的方法在实际应用中有以下几点不足:
(1)定性分析的方法大都需要手工的判别,需要人力的介入。
(2)定性分析的方法在大数据量的微博平台中无论是在准确性还是实现性方面都很难取得很好的效果。
(3)定性分析的方法需要分析很多相关因素,无法达到快速有效的效果。
发明内容
1、目的:以如何在微博平台中自动识别水军用户为研究对象,提出了一种基于概率图模型的微博水军识别方法。
本发明的目的是提供一种自动、有效、快速的识别微博水军用户的方法,它使得在微博平台大数据量的情况下能够进行有效的进行识别。
本发明的原理是:将用户的属性和以往使用微博的行为量化成特征指标,分别为用户的属性特征和行为特征,通过构建属性特征与行为特征之间的概率图结构,将用户为水军的概率视为此图结构中的隐变量,利用样本学习图模型的参数,利用学习后的概率图模型预测其它用户为水军的概率。
2、技术方案:本发明提供的技术方案如下:
本发明是一种基于概率图模型的微博水军识别方法,该方法具体步骤如下:
步骤一:假设用户u通过量化后的属性特征向量为:c=(x1,x2,…,xn),行为特征为:{y1,y2,…,ym}。概率图模型结构如图3,c表示用户的属性特征向量,z表示用户是水军的概率,y表示用户行为特征。设定义4种用户属性特征c=(x1,x2,x3,x4)和4种用户行为特征{y1,y2,y3,y4},其中x1为用户类别,x2为用户活跃度,x3为用户粉丝值,x4为用户好友值;y1为微博原创比,y2为非空转发比,y3为原创微博交互性,y4为非营销活动参与性。
例如:用户u经过量化后的用户类别值为0.4,用户活跃度为1.4,用户粉丝值为3.0,用户好友值为5.6,则用户的属性特征向量为cu=(0.4,1.4,3.0,5.6);对此用户进行行为特征量化所得其微博原创比为0.1,非空转发比为0.3,原创微博交互性为0.5,非营销活动参与性为0.4,则其各行为特征分别取值为0.1,0.3,0.5,0.4。
步骤二:用户的属性特征初步决定着用户为水军的可能性,属性特征越高的用户,其为水军的概率越低。用常用的高斯分布来刻画当给定用户属性特征值后该用户为水军的条件概率:
P ( z ( i ) | x 1 ( i ) , x 2 ( i ) . . . x n ( i ) ) = N ( w T c ( x 1 ( i ) , x 2 ( i ) . . . x n ( i ) ) , v ) , v = 0.5
式中符号说明如下:c为量化后的用户属性特征向量,w为每个特征参数的权重,v为高斯分布的参数值,此处设定为0.5。
同时,用户是水军的概率决定了其各行为特征值的高低,用户为水军的概率越高其行为特征值越低。用Logistic函数来刻画当给定用户为水军的概率后其各行为特征值为1的概率:
P ( y t ( i ) = 1 | z ( i ) ) = 1 1 + e - ( θ t z ( i ) + b ) , b = - 1
式中符号说明如下:z为用户是水军的概率,θt为水军概率决定每一个行为特征的权重参数,b为Logistic函数的偏置参数,此处设定为-1。
由于可能产生过度拟合的问题,用高斯先验概率作为w的先验概率:
P ( w ) ∝ e - λ w 2 w T w
假设学习样本的数量为D,利用刚才所述用户属性特征,行为特征与用户为水军的概率之间的关系结构,构建概率图模型如下:
P ( D | w ) P ( w ) = ( Π i ∈ D P ( z ( i ) , y ( i ) | x 1 ( i ) , x 2 ( i ) . . . x n ( i ) , w ) ) P ( w )
= Π i ∈ D P ( z ( i ) | x 1 ( i ) , x 2 ( i ) . . . x n ( i ) , w ) Π t = 1 P ( y ( i ) = 1 | z ( i ) )
∝ Π i ∈ D ( e - 1 2 v ( w T c ( i ) - z ( i ) ) 2 Π t = 1 m e - ( θ t z ( i ) + b ) ( 1 - y t ( i ) ) 1 + e - ( θ t z ( i ) + b ) ) * e - λ w 2 w T w
利用最大似然估计方法、EM算法、矩估计等方法在一定数量的样本数据上进行学习,可以估计w,θ的取值和z的取值,其中w,θ为模型的参数值,z为样本数据中各用户为水军的概率取值。
步骤三:利用得到参数取值后的模型,对于新的用户u,通过模型参数w和其属性特征cu={x1,x2,x3,x4},即能得出此用户为水军的概率z=w·cu
在得到每个用户其为水军概率z的取值后,由于在实际情况中,属性特征值越大的用户其为水军的概率越小,用户为水军的概率越小其各行为特征值越大,所以需要对通过模型得到的用户为水军的概率值z取负,以满足实际情况。同时为了对用户进行是否为水军的分类,可以使用样本学习结果刻画的ROC曲线所得的最好阈值或者通过指定阈值等方法,寻找阈值z′使得满足zi>z′的用户i即为水军用户。
3、优点及功效:本发明的有益效果:本发明所提供的微博水军识别模型能够在各大微博平台中自动、有效而且快速的寻找出其中的水军用户,并且通过一定数量的样本学习之后,可以将该模型部署到在线微博平台中,对于识别微博水军用户或者虚假用户有很好的效果。
附图说明
图1是模型的预测结果ROC曲线示意图
图2是模型的预测结果P-R对比曲线示意图
图3是模型的概率图结构示意图
图4是本方法发明的流程框图
图中符号说明如下:
c表示用户的属性特征向量,z表示用户是水军的概率,y表示用户行为特征;
i表示用户。
具体实施方式
,见图4,本发明一种基于概率图模型的微博水军识别方法,该方法具体步骤如下:
步骤一:新浪微博平台中,假设有4个用户其属性特征向量分别为:
cu1=(0.4,1.4,3.0,5.6),cu2=(0.6,2.0,5.4,3.1),cu3=(0.8,5.2,15.4,16.3),cu4=(1,4.3,17.3,12.3)
其对应的行为特征为:
yu1={0.1,0.3,0.5,0.4},yu2={0.3,0.6,0.4,0.4},yu3={0.7,0.4,0.9,0.6},yu4={0.8,0.9,0.8,0.8}
则形成的学习样本为:
用户 属性1 属性2 属性3 属性4 行为1 行为2 行为3 行为4
A 0.4 1.4 3.0 5.6 0.1 0.3 0.5 0.4
B 0.6 2.0 5.4 3.1 0.3 0.6 0.4 0.4
C 0.8 5.2 15.4 16.3 0.7 0.4 0.9 0.6
D 1 4.3 17.3 12.3 0.8 0.9 0.8 0.8
步骤二:由模型得其对数似然函数为:
L ( z ( i ∈ D ) , w ) = Σ i ∈ D - 1 2 v ( w T c ( i ) - z ( i ) ) 2 + Σ i ∈ D Σ t = 1 m - ( 1 - y t ( i ) ) ( θ t z ( i ) + b ) - log ( 1 + e - ( θ t z ( i ) + b ) ) - λ w 2 w T w + C
以下介绍如何通过样本数据,估计模型的参数值:
由于对数似然函数是凹函数,可以通过坐标上升的优化算法迭代更新参数取值,使得似
然函数取得最大值。对对数似然函数各参数求其偏导如下:
∂ L ∂ z ( i ) = 1 v ( w T c ( i ) - z ( i ) ) + Σ t = 1 m ( y t ( i ) - 1 1 + e - ( θ t z ( i ) + b ) ) θ t - - - ( 1 )
∂ L ∂ θ = Σ i ∈ D ( y t ( i ) - 1 1 + e - ( θ t z ( i ) + b ) ) z ( i ) - - - ( 2 )
∂ L ∂ w = 1 v Σ i ∈ D ( z ( i ) - w T c ( i ) ) c ( i ) - λ w w - - - ( 3 )
由于偏导公式中含有向量且含有多个参数,考虑使用牛顿方法迭代更新每个参数的取值,在每一次迭代更新的过程中,可以加入内部迭代,以始得收敛速度加快。对公式(1)(2)运用牛顿方法如下:
z ( i ) new = z ( i ) old - L ∂ ∂ z ( i ) / ∂ 2 L ∂ ( z ( i ) ) 2 - - - ( 4 )
θ t ( i ) new = θ t ( i ) old - ∂ L ∂ θ t / ∂ 2 L ∂ ( θ t ) 2 - - - ( 5 )
其中,二阶导数为:
∂ 2 L ∂ ( z ( i ) ) 2 = - 1 v - Σ t = 1 m θ t e - ( θ t z ( i ) + b ) ( 1 + e - ( θ t z ( i ) + b ) ) 2 - - - ( 6 )
∂ 2 L ∂ ( θ t ) 2 = Σ i ∈ D e - ( θ t z ( i ) + b ) z ( i ) 2 ( 1 + e - ( θ t z ( i ) + b ) ) 2 - - - ( 7 )
由于参数w为向量,利用岭回归求解公式(3)得:
wnew=(λwI+CTC)-1CTz(8)
其中 C = C ( 1 ) C ( 2 ) . . . C ( D ) , Z = Z ( 1 ) Z ( 2 ) . . . Z ( D )
迭代过程如下所示:
初始化w=(0,0,0,0);θ1234=1;zA=zB=zC=zD=1
Figure BDA000027212151000410
Figure BDA00002721215100051
对于估计所得的用户为水军概率值z,由前述所得应该取其对应的负值。
所以:zA=-2.49,zB=-2.68,zC=-9.52,zD=-9.04
假定阈值z′=-2.5,由于zA>z′=-2.5,zB<z′,zC<z′,zD<z′,所以样本数据集中用户A为水军用户,B,C,D为普通用户。
步骤三:在得到不含未知参数的模型后,能够直接使用此模型对新用户进行是否为水军的预测。在进行预测时,若能取得预测用户的行为特征值,则可以运用公式(4)迭代计算每个用户为水军的概率值z,但在实际的使用情况中,由于取得用户的行为特征值会有比较大的时间和空间开销,并且迭代计算也是复杂的一个过程,所以通过模型的参数w求得用户为水军的概率z。
假设有以下预测用户数据集:
用户 属性1 属性2 属性3 属性4
E 0.4 2.5 6.7 2.6
F 1 3.0 25.4 8.1
由模型参数w=(0.012,0.255,0.083,0.319)可得:
zE=w·cE=(0.012,0.255,0.083,0.319)·(0.4,2.5,6.7,2.6)=203
zF=w·cF=(0.012,0.255,0.083,0.319)·(1,3.0,25.4,8.1)=547
同样需要对每个用户的z值进行取负操作,所以:zE=-2.03,zF=-5.47,由zE>z′=-2.5,zF<z′可得用户E为水军,用户F为普通用户。
通过新浪数据开放平台抽取的数据,对模型的预测能力做了实验,实验结果如图1和图2。图3是模型的概率图结构示意图。
图1是模型在新浪数据集上的预测能力ROC曲线,曲线上黑点的位置表示最佳分类点位置(阈值),在此点处我们可以得出此阈值下分类结果中的灵敏度(True positive rate)约为70%,对应1-特异度(False positive rate)为7%。
图2表示取得不同阈值下所得的P-R曲线,在ROC曲线所示的最好分类点处也就是阈值取定0.57的时候,可以得到此时分类结果的查准率和查全率分别大概为85%和71%,说明模型在新浪数据集上的预测能力较为准确。

Claims (1)

1.一种基于概率图模型的微博水军识别方法,其特征在于:该方法具体步骤如下:
步骤一:设用户u通过量化后的属性特征向量为:c=(x1,x2,…,xn),行为特征为:{y1,y2,…,ym},定义4种用户属性特征c=(x1,x2,x3,x4)和4种用户行为特征{y1,y2,y3,y4},其中x1为用户类别,x2为用户活跃度,x3为用户粉丝值,x4为用户好友值;y1为微博原创比,y2为非空转发比,y3为原创微博交互性,y4为非营销活动参与性;
例如:用户u经过量化后的用户类别值为0.4,用户活跃度为1.4,用户粉丝值为3.0,用户好友值为5.6,则用户的属性特征向量为cu=(0.4,1.4,3.0,5.6);对此用户进行行为特征量化所得其微博原创比为0.1,非空转发比为0.3,原创微博交互性为0.5,非营销活动参与性为0.4,则其各行为特征分别取值为0.1,0.3,0.5,0.4;
步骤二:用户的属性特征初步决定着用户为水军的可能性,属性特征越高的用户,其为水军的概率越低;用常用的高斯分布来刻画当给定用户属性特征值后该用户为水军的条件概率:
P ( z ( i ) | x 1 ( i ) , x 2 ( i ) . . . x n ( i ) ) = N ( w T c ( x 1 ( i ) , x 2 ( i ) . . . x n ( i ) ) , v ) , v = 0.5
式中符号说明如下:c为量化后的用户属性特征向量,w为每个特征参数的权重,v为高斯分布的参数值,此处设定为0.5;
同时,用户是水军的概率决定了其各行为特征值的高低,用户为水军的概率越高其行为特征值越低;用Logistic函数来刻画当给定用户为水军的概率后其各行为特征值为1的概率:
P ( y t ( i ) = 1 | z ( i ) ) = 1 1 + e - ( &theta; t z ( i ) + b ) , b = - 1
式中符号说明如下:z为用户是水军的概率,θt为水军概率决定每一个行为特征的权重参数,b为Logistic函数的偏置参数,此处设定为-1;
由于可能产生过度拟合的问题,用高斯先验概率作为w的先验概率:
P ( w ) &Proportional; e - &lambda; w 2 w T w
假设学习样本的数量为D,利用刚才所述用户属性特征,行为特征与用户为水军的概率之间的关系结构,构建概率图模型如下:
P ( D | w ) P ( w ) = ( &Pi; i &Element; D P ( z ( i ) , y ( i ) | x 1 ( i ) , x 2 ( i ) . . . x n ( i ) , w ) ) P ( w )
= &Pi; i &Element; D P ( z ( i ) | x 1 ( i ) , x 2 ( i ) . . . x n ( i ) , w ) &Pi; t = 1 P ( y ( i ) = 1 | z ( i ) )
&Proportional; &Pi; i &Element; D ( e - 1 2 v ( w T c ( i ) - z ( i ) ) 2 &Pi; t = 1 m e - ( &theta; t z ( i ) + b ) ( 1 - y t ( i ) ) 1 + e - ( &theta; t z ( i ) + b ) ) * e - &lambda; w 2 w T w
利用最大似然估计方法、EM算法、矩估计方法在一定数量的样本数据上进行学习,可以估计w,θ的取值和z的取值,其中w,θ为模型的参数值,z为样本数据中各用户为水军的概率取值;
步骤三:利用得到参数取值后的模型,对于新的用户u,通过模型参数w和其属性特征cu={x1,x2,x3,x4},即能得出此用户为水军的概率z=w.cu
在得到每个用户其为水军概率z的取值后,由于在实际情况中,属性特征值越大的用户其为水军的概率越小,用户为水军的概率越小其各行为特征值越大,所以,需要对通过模型得到的用户为水军的概率值z取负,以满足实际情况;同时为了对用户进行是否为水军的分类,使用样本学习结果刻画的ROC曲线所得的最好阈值或者通过指定阈值方法,寻找阈值z′使得满足zi>z′的用户i即为水军用户。
CN201310008644.0A 2013-01-10 2013-01-10 一种基于概率图模型的微博水军识别方法 Active CN103077240B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310008644.0A CN103077240B (zh) 2013-01-10 2013-01-10 一种基于概率图模型的微博水军识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310008644.0A CN103077240B (zh) 2013-01-10 2013-01-10 一种基于概率图模型的微博水军识别方法

Publications (2)

Publication Number Publication Date
CN103077240A true CN103077240A (zh) 2013-05-01
CN103077240B CN103077240B (zh) 2015-09-23

Family

ID=48153770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310008644.0A Active CN103077240B (zh) 2013-01-10 2013-01-10 一种基于概率图模型的微博水军识别方法

Country Status (1)

Country Link
CN (1) CN103077240B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103412930A (zh) * 2013-08-17 2013-11-27 北京品友互动信息技术有限公司 一种互联网用户属性识别方法
CN103729678A (zh) * 2013-12-12 2014-04-16 中国科学院信息工程研究所 一种基于改进dbn模型的水军检测方法及系统
CN104239539A (zh) * 2013-09-22 2014-12-24 中科嘉速(北京)并行软件有限公司 一种基于多种信息融合的微博信息过滤方法
CN104967587A (zh) * 2014-05-12 2015-10-07 腾讯科技(深圳)有限公司 一种恶意账号的识别方法,及装置
CN105045857A (zh) * 2015-07-09 2015-11-11 中国科学院计算技术研究所 一种社交网络谣言识别方法及系统
CN105893484A (zh) * 2016-03-29 2016-08-24 西安交通大学 一种基于文本特征和行为特征的微博Spammer识别方法
CN105956184A (zh) * 2016-06-01 2016-09-21 西安交通大学 一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法
CN106156341A (zh) * 2016-07-14 2016-11-23 微额速达(上海)金融信息服务有限公司 互联网标注数据的身份判别方法
CN106897729A (zh) * 2016-06-28 2017-06-27 阿里巴巴集团控股有限公司 信息识别方法、模型训练方法、装置及处理设备
CN106919579A (zh) * 2015-12-24 2017-07-04 腾讯科技(深圳)有限公司 一种信息处理方法及装置、设备
CN106940732A (zh) * 2016-05-30 2017-07-11 国家计算机网络与信息安全管理中心 一种面向微博的疑似水军发现方法
CN107316204A (zh) * 2017-05-27 2017-11-03 银联智惠信息服务(上海)有限公司 识别持卡人属性的方法、装置、计算机可读介质及系统
CN107330081A (zh) * 2017-07-03 2017-11-07 深圳市比量科技传媒有限公司 一种信息特征提取方法
CN108174296A (zh) * 2018-01-02 2018-06-15 武汉斗鱼网络科技有限公司 恶意用户识别方法及装置
CN108763319A (zh) * 2018-04-28 2018-11-06 中国科学院自动化研究所 融合用户行为和文本信息的社交机器人检测方法和系统
CN109558555A (zh) * 2018-08-20 2019-04-02 湖北大学 基于人工免疫危险理论的微博水军检测方法及检测系统
CN110110079A (zh) * 2019-03-21 2019-08-09 中国人民解放军战略支援部队信息工程大学 一种社交网络垃圾用户检测方法
CN110297990A (zh) * 2019-05-23 2019-10-01 东南大学 众包营销微博与水军的联合检测方法及系统
CN110399547A (zh) * 2018-04-17 2019-11-01 百度在线网络技术(北京)有限公司 用于更新模型参数的方法、装置、设备和存储介质
CN110851852A (zh) * 2019-05-07 2020-02-28 中山大学 基于移动社交网络的数据访问控制策略生成方法
CN112153221A (zh) * 2020-09-16 2020-12-29 北京邮电大学 一种基于社交网络图计算的通信行为识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090055139A1 (en) * 2007-08-20 2009-02-26 Yahoo! Inc. Predictive discrete latent factor models for large scale dyadic data
CN101694652A (zh) * 2009-09-30 2010-04-14 西安交通大学 一种基于极速神经网络的网络资源个性化推荐方法
CN102117325A (zh) * 2011-02-24 2011-07-06 清华大学 动态社会网络用户行为的预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090055139A1 (en) * 2007-08-20 2009-02-26 Yahoo! Inc. Predictive discrete latent factor models for large scale dyadic data
CN101694652A (zh) * 2009-09-30 2010-04-14 西安交通大学 一种基于极速神经网络的网络资源个性化推荐方法
CN102117325A (zh) * 2011-02-24 2011-07-06 清华大学 动态社会网络用户行为的预测方法

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103412930A (zh) * 2013-08-17 2013-11-27 北京品友互动信息技术有限公司 一种互联网用户属性识别方法
CN104239539B (zh) * 2013-09-22 2017-11-07 中科嘉速(北京)并行软件有限公司 一种基于多种信息融合的微博信息过滤方法
CN104239539A (zh) * 2013-09-22 2014-12-24 中科嘉速(北京)并行软件有限公司 一种基于多种信息融合的微博信息过滤方法
CN103729678B (zh) * 2013-12-12 2016-10-05 中国科学院信息工程研究所 一种基于改进dbn模型的水军检测方法及系统
CN103729678A (zh) * 2013-12-12 2014-04-16 中国科学院信息工程研究所 一种基于改进dbn模型的水军检测方法及系统
US10270785B2 (en) 2014-05-12 2019-04-23 Tencent Technology (Shenzhen) Company Limited Method and apparatus for identifying malicious account
CN104967587B (zh) * 2014-05-12 2018-07-06 腾讯科技(深圳)有限公司 一种恶意账号的识别方法,及装置
CN104967587A (zh) * 2014-05-12 2015-10-07 腾讯科技(深圳)有限公司 一种恶意账号的识别方法,及装置
CN105045857A (zh) * 2015-07-09 2015-11-11 中国科学院计算技术研究所 一种社交网络谣言识别方法及系统
CN106919579A (zh) * 2015-12-24 2017-07-04 腾讯科技(深圳)有限公司 一种信息处理方法及装置、设备
CN105893484A (zh) * 2016-03-29 2016-08-24 西安交通大学 一种基于文本特征和行为特征的微博Spammer识别方法
CN106940732A (zh) * 2016-05-30 2017-07-11 国家计算机网络与信息安全管理中心 一种面向微博的疑似水军发现方法
CN105956184A (zh) * 2016-06-01 2016-09-21 西安交通大学 一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法
CN106897729A (zh) * 2016-06-28 2017-06-27 阿里巴巴集团控股有限公司 信息识别方法、模型训练方法、装置及处理设备
CN106156341A (zh) * 2016-07-14 2016-11-23 微额速达(上海)金融信息服务有限公司 互联网标注数据的身份判别方法
CN107316204A (zh) * 2017-05-27 2017-11-03 银联智惠信息服务(上海)有限公司 识别持卡人属性的方法、装置、计算机可读介质及系统
CN107330081A (zh) * 2017-07-03 2017-11-07 深圳市比量科技传媒有限公司 一种信息特征提取方法
CN108174296A (zh) * 2018-01-02 2018-06-15 武汉斗鱼网络科技有限公司 恶意用户识别方法及装置
CN108174296B (zh) * 2018-01-02 2019-09-10 武汉斗鱼网络科技有限公司 恶意用户识别方法及装置
CN110399547A (zh) * 2018-04-17 2019-11-01 百度在线网络技术(北京)有限公司 用于更新模型参数的方法、装置、设备和存储介质
CN108763319A (zh) * 2018-04-28 2018-11-06 中国科学院自动化研究所 融合用户行为和文本信息的社交机器人检测方法和系统
CN108763319B (zh) * 2018-04-28 2022-02-08 中国科学院自动化研究所 融合用户行为和文本信息的社交机器人检测方法和系统
CN109558555A (zh) * 2018-08-20 2019-04-02 湖北大学 基于人工免疫危险理论的微博水军检测方法及检测系统
CN110110079A (zh) * 2019-03-21 2019-08-09 中国人民解放军战略支援部队信息工程大学 一种社交网络垃圾用户检测方法
CN110110079B (zh) * 2019-03-21 2021-06-08 中国人民解放军战略支援部队信息工程大学 一种社交网络垃圾用户检测方法
CN110851852A (zh) * 2019-05-07 2020-02-28 中山大学 基于移动社交网络的数据访问控制策略生成方法
CN110851852B (zh) * 2019-05-07 2023-03-07 中山大学 基于移动社交网络的数据访问控制策略生成方法
CN110297990A (zh) * 2019-05-23 2019-10-01 东南大学 众包营销微博与水军的联合检测方法及系统
CN112153221A (zh) * 2020-09-16 2020-12-29 北京邮电大学 一种基于社交网络图计算的通信行为识别方法
CN112153221B (zh) * 2020-09-16 2021-06-29 北京邮电大学 一种基于社交网络图计算的通信行为识别方法

Also Published As

Publication number Publication date
CN103077240B (zh) 2015-09-23

Similar Documents

Publication Publication Date Title
CN103077240B (zh) 一种基于概率图模型的微博水军识别方法
Sun et al. Using Bayesian deep learning to capture uncertainty for residential net load forecasting
Straka et al. Predicting popularity of electric vehicle charging infrastructure in urban context
Chen et al. Ensemble correlation-based low-rank matrix completion with applications to traffic data imputation
CN108875776B (zh) 模型训练方法和装置、业务推荐的方法和装置、电子设备
CN106600052B (zh) 一种基于时空轨迹的用户属性与社会网络检测系统
CN102708153B (zh) 自适应在线社交网络热点话题发展趋势预测方法及系统
CN113422761B (zh) 基于对抗学习的恶意社交用户检测方法
CN104182474A (zh) 一种预流失用户的识别方法
Biloš et al. Uncertainty on asynchronous time event prediction
CN103617235A (zh) 一种基于粒子群算法的网络水军账号识别方法及系统
CN102955894A (zh) 一种基于用户细分的流失率预测的控制方法
CN105389505A (zh) 基于栈式稀疏自编码器的托攻击检测方法
CN103136331A (zh) 微博网络意见领袖识别方法
CN105046323B (zh) 一种正则化rbf网络多标签分类方法
CN109492076A (zh) 一种基于网络的社区问答网站答案可信评估方法
CN115438102B (zh) 时空数据异常识别方法、装置和电子设备
CN110751289A (zh) 基于Bagging_BP算法的在线学习行为分析方法
CN103793505A (zh) 基于用户-服务特征的网络服务协同过滤方法
Yuji The trust value calculating for social network based on machine learning
CN113971440A (zh) 一种基于深度聚类的无监督雷达信号分选方法
CN103617146A (zh) 一种基于硬件资源消耗的机器学习方法及装置
CN104217088A (zh) 运营商移动业务资源的优化方法与系统
CN109145175B (zh) 基于stacking集成学习算法的时空数据预测方法
Cui et al. A weighted network modeling approach for analyzing product competition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210531

Address after: 850000 building 4, Yunhui Road, core area, high tech Zone, Lhasa, Tibet Autonomous Region

Patentee after: WISEWEB TECHNOLOGY GROUP Co.,Ltd.

Address before: 100048, Fu Cheng Road, Beijing, Haidian District, No. 11

Patentee before: BEIJING TECHNOLOGY AND BUSINESS University

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210917

Address after: 5069, building 2, China Agricultural University international entrepreneurship Park, No. 10, Tianxiu Road, Haidian District, Beijing 100091

Patentee after: BEIJING WISEWEB BIG DATA TECHNOLOGY Co.,Ltd.

Address before: 850000 building 4, Yunhui Road, core area, high tech Zone, Lhasa, Tibet Autonomous Region

Patentee before: WISEWEB TECHNOLOGY GROUP Co.,Ltd.