CN110765171A - 一种不良用户甄别方法、存储介质、电子设备及系统 - Google Patents

一种不良用户甄别方法、存储介质、电子设备及系统 Download PDF

Info

Publication number
CN110765171A
CN110765171A CN201810746925.9A CN201810746925A CN110765171A CN 110765171 A CN110765171 A CN 110765171A CN 201810746925 A CN201810746925 A CN 201810746925A CN 110765171 A CN110765171 A CN 110765171A
Authority
CN
China
Prior art keywords
user
similarity
screened
bad
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810746925.9A
Other languages
English (en)
Other versions
CN110765171B (zh
Inventor
王璐
张文明
陈少杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201810746925.9A priority Critical patent/CN110765171B/zh
Publication of CN110765171A publication Critical patent/CN110765171A/zh
Application granted granted Critical
Publication of CN110765171B publication Critical patent/CN110765171B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种不良用户甄别方法、存储介质、电子设备及系统,用于直播平台通过计算待甄别用户和已知不良用户之间的相似度,判断待甄别用户是否是不良用户,该方法包括获取待甄别用户和不良用户的个性参数。根据个性参数:使用预设的观看相似度算法,计算待甄别用户和不良用户之间的观看相似度。使用预设的行为相似度算法,计算待甄别用户和不良用户之间的行为相似度。使用预设的网络地址相似度算法,计算待甄别用户和不良用户的网络地址相似度。使用预设的设备相似度算法,计算待甄别用户和不良用户的使用设备相似度。使用所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。

Description

一种不良用户甄别方法、存储介质、电子设备及系统
技术领域
本发明涉及大数据风险控制领域,具体涉及一种不良用户甄别方法、存储介质、电子设备及系统。
背景技术
目前,随着直播的发展,直播应用的越来越普及,越来越多的人前来观看直播。
然而随着观看人数的增长,观看直播平台的人群逐渐出现一些有着不良行为,甚至违法行为的用户,比如在直播间中宣传虚假信息的用户、通过弹幕发布色情链接的用户。
这些不良用户严重影响了直播间的直播氛围,同时其不良行为对特定的人群如孩童有毒害作用,因此,这些不良用户及其行为对平台的直播生态造成极大的负面影响。进而需要一种识别方法,能够识别不良用户。
现有的识别方法通常采用一些强规则,这些强规则通过一些较为明显的异常现象进行识别,但是强规则容易被破解,不良用户能够通过规避强规则保证不被发现。因此,直播平台需要一种新的不良用户识别方法,已解决上述问题。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种不良用户甄别方法、存储介质、电子设备及系统,能够根据用户的具体行为进行具体分析,更加精准的判断用户是否是不良用户。
为达到以上目的,本发明提供一种不良用户甄别方法,用于直播平台通过计算待甄别用户和已知不良用户之间的相似度,判断待甄别用户是否是不良用户,其包括:
获取待甄别用户和不良用户的个性参数,所述个性参数包括观看过的直播间、用户行为、IP地址和使用过的设备ID;
根据预设的观看相似度算法以及待甄别用户和不良用户观看过的直播间,计算待甄别用户和不良用户之间的观看相似度;
根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度;
根据预设的网络地址相似度算法以及待甄别用户和不良用户的IP地址,计算待甄别用户和不良用户的网络地址相似度;
根据预设的设备相似度算法以及待甄别用户和不良用户使用过的设备ID,计算待甄别用户和不良用户的使用设备相似度;
根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。
在上述技术方案的基础上,所述观看相似度算法具体公式为:
Figure BDA0001724588770000021
其中:R′表示待甄别用户u和不良用户v之间的观看相似度,Ruv表示在预设时间段内待甄别用户u和不良用户v共同观看过的直播间个数,Ru、Rv分别表示待甄别用户u和不良用户v观看的直播间集合,|Ru∩Rv|表示待甄别用户u和不良用户v均观看过的直播间个数。
在上述技术方案的基础上,所述根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度,具体包括以下步骤:
为用户行为设置N个行为特征指标,所述N为大于0的整数;
对应行为特征指标,对待甄别用户和不良用户的用户行为评分;
计算行为相似度X′
Figure BDA0001724588770000031
其中,xui表示待甄别用户u的用户行为的对应第i个行为特征指标的评分,xvi表示不良用户v的用户行为的对应第i个行为特征指标的评分。
在上述技术方案的基础上,所述网络地址相似度算法具体公式为:
Figure BDA0001724588770000032
其中,p′表示待甄别用户u和不良用户v的网络地址相似度,pi表示待甄别用户u和/或不良用户v使用的IP地址,Iu表示待甄别用户u使用的IP地址集合,Iv表示不良用户v使用的IP地址集合,Iu∩Iv表示待甄别用户u和不良用户v的共同IP地址集合,
Figure BDA0001724588770000033
表示待甄别用户u在预设时间段内观看第i个IP地址的次数,
Figure BDA0001724588770000034
表示不良用户v在预设时间段内观看第i个IP地址的次数。
在上述技术方案的基础上,所述使用设备相似度算法具体公式为:
Figure BDA0001724588770000041
其中,p′表示待甄别用户u和不良用户v的使用设备相似度,pi表示待甄别用户u和/或不良用户v使用的设备类型,Iu表示待甄别用户u使用的设备类型集合,Iv表示不良用户v使用的设备类型集合,Iu∩Iv表示待甄别用户u和不良用户v的共同设备类型集合,
Figure BDA0001724588770000042
表示待甄别用户u在预设时间段内使用第i种设备类型的次数,
Figure BDA0001724588770000043
表示不良用户v在预设时间段内使用第i种设备的次数。
在上述技术方案的基础上,所述根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户具体为:
为所述观看相似度、行为相似度、网络地址相似度和使用设备相似度设置对应的权重;
将所述观看相似度、行为相似度、网络地址相似度和使用设备相似度和对应的权重相乘后求和得到总相似度;
判断总相似度是否超过预设的相似度阈值,如果超过,则所述待甄别用户为不良用户。
本发明还提供一种存储介质,该存储介质上存储有计算机程序:所述计算机程序被处理器执行时实现以下步骤:
获取待甄别用户和不良用户的个性参数,所述个性参数包括观看过的直播间、用户行为、IP地址和使用过的设备ID;
根据预设的观看相似度算法以及待甄别用户和不良用户观看过的直播间,计算待甄别用户和不良用户之间的观看相似度;
根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度;
根据预设的网络地址相似度算法以及待甄别用户和不良用户的IP地址,计算待甄别用户和不良用户的网络地址相似度;
根据预设的设备相似度算法以及待甄别用户和不良用户使用过的设备ID,计算待甄别用户和不良用户的使用设备相似度;
根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。
在上述技术方案的基础上,所述观看相似度算法具体公式为:
Figure BDA0001724588770000051
其中:R′表示待甄别用户u和不良用户v之间的观看相似度,Ruv表示在预设时间段内待甄别用户u和不良用户v共同观看过的直播间个数,Ru、Rv分别表示待甄别用户u和不良用户v观看的直播间集合,|Ru∩Rv|表示待甄别用户u和不良用户v均观看过的直播间个数。
在上述技术方案的基础上,所述根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度,具体包括以下步骤:
为用户行为设置N个行为特征指标,所述N为大于0的整数;
对应行为特征指标,对待甄别用户和不良用户的用户行为评分;
计算行为相似度X′
Figure BDA0001724588770000061
其中,xui表示待甄别用户u的用户行为的对应第i个行为特征指标的评分,xvi表示不良用户v的用户行为的对应第i个行为特征指标的评分。
在上述技术方案的基础上,所述网络地址相似度算法具体公式为:
Figure BDA0001724588770000062
其中,p′表示待甄别用户u和不良用户v的网络地址相似度,pi表示待甄别用户u和/或不良用户v使用的IP地址,Iu表示待甄别用户u使用的IP地址集合,Iv表示不良用户v使用的IP地址集合,Iu∩Iv表示待甄别用户u和不良用户v的共同IP地址集合,
Figure BDA0001724588770000063
表示待甄别用户u在预设时间段内观看第i个IP地址的次数,
Figure BDA0001724588770000064
表示不良用户v在预设时间段内观看第i个IP地址的次数。
在上述技术方案的基础上,所述使用设备相似度算法具体公式为:
Figure BDA0001724588770000065
其中,p′表示待甄别用户u和不良用户v的使用设备相似度,pi表示待甄别用户u和/或不良用户v使用的设备类型,Iu表示待甄别用户u使用的设备类型集合,Iv表示不良用户v使用的设备类型集合,Iu∩Iv表示待甄别用户u和不良用户v的共同设备类型集合,
Figure BDA0001724588770000071
表示待甄别用户u在预设时间段内使用第i种设备类型的次数,
Figure BDA0001724588770000072
表示不良用户v在预设时间段内使用第i种设备的次数。
在上述技术方案的基础上,所述根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户具体为:
为所述观看相似度、行为相似度、网络地址相似度和使用设备相似度设置对应的权重;
将所述观看相似度、行为相似度、网络地址相似度和使用设备相似度和对应的权重相乘后求和得到总相似度;
判断总相似度是否超过预设的相似度阈值,如果超过,则所述待甄别用户为不良用户。
本发明还提供一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序:所述处理器执行所述计算机程序时实现以下步骤:
获取待甄别用户和不良用户的个性参数,所述个性参数包括观看过的直播间、用户行为、IP地址和使用过的设备ID;
根据预设的观看相似度算法以及待甄别用户和不良用户观看过的直播间,计算待甄别用户和不良用户之间的观看相似度;
根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度;
根据预设的网络地址相似度算法以及待甄别用户和不良用户的IP地址,计算待甄别用户和不良用户的网络地址相似度;
根据预设的设备相似度算法以及待甄别用户和不良用户使用过的设备ID,计算待甄别用户和不良用户的使用设备相似度;
根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。
在上述技术方案的基础上,所述观看相似度算法具体公式为:
Figure BDA0001724588770000081
其中:R′表示待甄别用户u和不良用户v之间的观看相似度,Ruv表示在预设时间段内待甄别用户u和不良用户v共同观看过的直播间个数,Ru、Rv分别表示待甄别用户u和不良用户v观看的直播间集合,|Ru∩Rv|表示待甄别用户u和不良用户v均观看过的直播间个数。
在上述技术方案的基础上,所述根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度,具体包括以下步骤:
为用户行为设置N个行为特征指标,所述N为大于0的整数;
对应行为特征指标,对待甄别用户和不良用户的用户行为评分;
计算行为相似度X′
Figure BDA0001724588770000082
其中,xui表示待甄别用户u的用户行为的对应第i个行为特征指标的评分,xvi表示不良用户v的用户行为的对应第i个行为特征指标的评分。
在上述技术方案的基础上,所述网络地址相似度算法具体公式为:
Figure BDA0001724588770000091
其中,p′表示待甄别用户u和不良用户v的网络地址相似度,pi表示待甄别用户u和/或不良用户v使用的IP地址,Iu表示待甄别用户u使用的IP地址集合,Iv表示不良用户v使用的IP地址集合,Iu∩Iv表示待甄别用户u和不良用户v的共同IP地址集合
Figure BDA0001724588770000092
表示待甄别用户u在预设时间段内观看第i个IP地址的次数,
Figure BDA0001724588770000093
表示不良用户v在预设时间段内观看第i个IP地址的次数。
在上述技术方案的基础上,所述使用设备相似度算法具体公式为:
Figure BDA0001724588770000094
其中,p′表示待甄别用户u和不良用户v的使用设备相似度,pi表示待甄别用户u和/或不良用户v使用的设备类型,Iu表示待甄别用户u使用的设备类型集合,Iv表示不良用户v使用的设备类型集合,Iu∩Iv表示待甄别用户u和不良用户v的共同设备类型集合,
Figure BDA0001724588770000095
表示待甄别用户u在预设时间段内使用第i种设备类型的次数,
Figure BDA0001724588770000096
表示不良用户v在预设时间段内使用第i种设备的次数。
在上述技术方案的基础上,所述根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户具体为:
为所述观看相似度、行为相似度、网络地址相似度和使用设备相似度设置对应的权重;
将所述观看相似度、行为相似度、网络地址相似度和使用设备相似度和对应的权重相乘后求和得到总相似度;
判断总相似度是否超过预设的相似度阈值,如果超过,则所述待甄别用户为不良用户。
本发明还提供一种不良用户甄别系统,其包括:
准备模块,用于获取待甄别用户和不良用户的个性参数,所述个性参数包括观看过的直播间、用户行为、IP地址和使用过的设备ID;
观看相似度计算模块,用于根据预设的观看相似度算法以及待甄别用户和不良用户观看过的直播间,计算待甄别用户和不良用户之间的观看相似度;
行为相似度计算模块,用于根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度;
网络地址相似度计算模块,用于根据预设的网络地址相似度算法以及待甄别用户和不良用户的IP地址,计算待甄别用户和不良用户的网络地址相似度;
使用设备相似度计算模块,用于根据预设的设备相似度算法以及待甄别用户和不良用户使用过的设备ID,计算待甄别用户和不良用户的使用设备相似度;
判断模块,用于综合所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。
在上述技术方案的基础上,所述判断模块包括:
权重获取子模块,用于为所述观看相似度、行为相似度、网络地址相似度和使用设备相似度设置对应的权重;
相似度计算子模块,用于将所述观看相似度、行为相似度、网络地址相似度和使用设备相似度和对应的权重相乘后求和得到总相似度
在上述技术方案的基础上,所述观看相似度算法具体公式为:
Figure BDA0001724588770000111
其中:R′表示待甄别用户u和不良用户v之间的观看相似度,Ruv表示在预设时间段内待甄别用户u和不良用户v共同观看过的直播间个数,Ru、Rv分别表示待甄别用户u和不良用户v观看的直播间集合,|Ru∩Rv|表示待甄别用户u和不良用户v均观看过的直播间个数。
在上述技术方案的基础上,所述根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度,具体包括以下步骤:
为用户行为设置N个行为特征指标,所述N为大于0的整数;
对应行为特征指标,对待甄别用户和不良用户的用户行为评分;
计算行为相似度X′
Figure BDA0001724588770000112
其中,xui表示待甄别用户u的用户行为的对应第i个行为特征指标的评分,xvi表示不良用户v的用户行为的对应第i个行为特征指标的评分。
在上述技术方案的基础上,所述网络地址相似度算法具体公式为:
Figure BDA0001724588770000121
其中,p′表示待甄别用户u和不良用户v的网络地址相似度,pi表示待甄别用户u和/或不良用户v使用的IP地址,Iu表示待甄别用户u使用的IP地址集合,Iv表示不良用户v使用的IP地址集合,Iu∩Iv表示待甄别用户u和不良用户v的共同IP地址集合,
Figure BDA0001724588770000122
表示待甄别用户u在预设时间段内观看第i个IP地址的次数,
Figure BDA0001724588770000123
表示不良用户v在预设时间段内观看第i个IP地址的次数。
在上述技术方案的基础上,所述使用设备相似度算法具体公式为:
Figure BDA0001724588770000124
其中,p′表示待甄别用户u和不良用户v的使用设备相似度,pi表示待甄别用户u和/或不良用户v使用的设备类型,Iu表示待甄别用户u使用的设备类型集合,Iv表示不良用户v使用的设备类型集合,Iu∩Iv表示待甄别用户u和不良用户v的共同设备类型集合,
Figure BDA0001724588770000125
表示待甄别用户u在预设时间段内使用第i种设备类型的次数,
Figure BDA0001724588770000126
表示不良用户v在预设时间段内使用第i种设备的次数。
在上述技术方案的基础上,所述根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户具体为:
为所述观看相似度、行为相似度、网络地址相似度和使用设备相似度设置对应的权重;
将所述观看相似度、行为相似度、网络地址相似度和使用设备相似度和对应的权重相乘后求和得到总相似度;
判断总相似度是否超过预设的相似度阈值,如果超过,则所述待甄别用户为不良用户。
与现有技术相比,本发明的优点在于:
(1)本发明一种不良用户甄别方法、存储介质、电子设备及系统根据用户的具体行为包括观看过的直播间、用户行为、IP地址、设备ID进行具体分析,更加精准的判断用户是否是不良用户
(2)本发明一种不良用户甄别方法、存储介质、电子设备及系统中的针对不同的相似度设置不同的权重,能够根据需求更有针对性的甄别不良用户。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面对实施例对应的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种不良用户甄别方法的流程图;
图2为本发明一种不良用户甄别系统的结构示意图;
图3为本发明一种不良用户甄别系统中功能模块的结构示意图。
图中:1-准备模块,2-观看相似度计算模块,3-行为相似度计算模块,4-网络地址相似度计算模块,5-使用设备相似度计算模块,6-判断模块,60-权重获取子模块,61-相似度计算子模块。
具体实施方式
以下结合附图对本发明的实施例作进一步详细说明。
实施例一
参见图1所示,本发明实施例提供一种不良用户甄别方法、存储介质、电子设备及系统,用于直播平台通过计算待甄别用户和已知不良用户之间的相似度,判断待甄别用户是否是不良用户,该实施例根据用户的个性参数,计算待甄别用户和不良用户之间的观看相似度、行为相似度、网络地址相似度和设备相似度,综合这些相似度能够更加精确地确认待甄别用户是否为不良用户。
实施例具体步骤包括:
S1:获取待甄别用户和不良用户的个性参数,所述个性参数包括观看过的直播间、用户行为、IP地址和使用过的设备ID。
要获取两个用户之间的相似度,首先需要获取用户的个性化的信息,即个性化参数。而个性化的参数涉及各个方面,如用户在直播平台上观看直播间的偏好值,在观看直播间时候的点击行为、打赏动作,连接直播平台的IP地址,观看直播间使用的设备等等,因此,需要对这些参数进行分类收集。
S2:根据预设的观看相似度算法以及待甄别用户和不良用户观看过的直播间,计算待甄别用户和不良用户之间的观看相似度。
部分不良用户在选择观看直播间的偏好上是很相似的,如一些发布广告的不良用户,其会偏向于进入人流量较大的直播间,然后发布广告,即这种不良用户在直播间的选择上是有很大的相似度的。因此,针对用户的观看过的直播间,使用预设的算法进行计算。
S3:根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度;
用户在观看时候的行为如用户在主播或者观众群处于何种状态时候,易于发布不良信息或者恶意攻击直播的语言,用户点击、发布弹幕的频率,用户在发弹幕时候涉及哪些语句及符号,如不文明用语、人身攻击、网站前后缀等等。对这些行为进行统计后,使用预设的行为相似度算法进行计算即可。
S4:根据预设的网络地址相似度算法以及待甄别用户和不良用户的IP地址,计算待甄别用户和不良用户的网络地址相似度。
有的用户可能从同一局域网中发出连接请求,并观看直播,其局域网的IP是固定或者相似的,因此网络地址,即IP地址也可以作为考量参数之一,经过预设的网络地址相似度进行计算后即可
S5:根据预设的设备相似度算法以及待甄别用户和不良用户使用过的设备ID,计算待甄别用户和不良用户的使用设备相似度;
存在部分用户在账号被封或者发布不良信息需求的情况下,使用同一设备进行不良行为,也存在多个不良用户使用相同的设备类型如服务器、移动端等等分别进行不良行为。这里设备ID可以指设备的具体名称、MAC地址也可以是设备的种类/类型。因此针对待甄别用户使用的设备ID使用预设的设备相似度算法计算的相似度能够在帮助进一步区分用户的相似度。
S6:根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。
经过步骤S1~S5,计算得到能够表征待甄别用户在各个方面和不良用户的相似度后,这些相似度都是以数值进行表示的,能够十分直观和客观的表现用户在各个方面的相似度,系统或者管理员能够根据这些数字综合并判断该待甄别用户是否为不良用户。
需要说明的是,上述的预设的观看相似度算法、预设的行为相似度算法、预设的网络地址相似度算法和预设的设备相似度算法,可以根据具体的数字进行计算的算式,也可以根据对应规则进行评分,并在得到评分后进行综合评定得到的数值,只要能够在其对应的方面反应待甄别用户在该方面上和不良用户相似的程度大小即可。
作为一个可选的实施方案,观看相似度算法具体公式为:
Figure BDA0001724588770000161
其中:R′表示待甄别用户u和不良用户v之间的观看相似度,Ruv表示在预设时间段内待甄别用户u和不良用户v共同观看过的直播间个数,Ru、Rv分别表示待甄别用户u和不良用户v观看的直播间集合,|Ru∩Rv|表示待甄别用户u和不良用户v均观看过的直播间个数。
本算法通过之间比较待甄别用户和不良用户之间共同观看的用户占他们观看的所有直播间的占比来反应相似度。共同观看直播间多的相似度高,观看共同直播间少的,相似度低。此外,共同观看直播间数目不变的情况下,待甄别用户和不良用户观看的直播间总数越多,其相似度越低,反之越高,也是符合人们的认知规律的,因此该算是能够较准确的反应待甄别用户和不良用户之间的相似度。
作为一个可选的实施方案,根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度,具体包括以下步骤:
为用户行为设置N个行为特征指标,所述N为大于0的整数;
对应行为特征指标,对待甄别用户和不良用户的用户行为评分;
计算行为相似度X′
其中,xui表示待甄别用户u的用户行为的对应第i个行为特征指标的评分,xvi表示不良用户v的用户行为的对应第i个行为特征指标的评分。
由于用户的行为特征有多个方面,部分特征并不能以直观的数字代表,因此优选在各个方面设置特征指标,并根据特征指标为用户的行为特征打分。通过上述的计算方法综合各个特征指标的数值进行计算,即可得到在模糊的行为上,使用数值表现的待甄别用户和不良用户相似的程度大小。
作为一个可选的实施方案,网络地址相似度算法具体公式为:
Figure BDA0001724588770000172
其中,p′表示待甄别用户u和不良用户v的网络地址相似度,pi表示待甄别用户u和/或不良用户v使用的IP地址,Iu表示待甄别用户u使用的IP地址集合,Iv表示不良用户v使用的IP地址集合,Iu∩Iv表示待甄别用户u和不良用户v的共同IP地址集合,
Figure BDA0001724588770000173
表示待甄别用户u在预设时间段内观看第i个IP地址的次数,
Figure BDA0001724588770000181
表示不良用户v在预设时间段内观看第i个IP地址的次数。
首先统计用户使用的网址,在使用集合的概念计算IP地址合集,通过获取集合中最小值并累加得到数字,如果用户u使用地址相近这该数值较高,反之则较低,因此该算法能够体现待甄别用户和不良用户在网络地址上的相似度。
作为一个可选的实施方案,权利要求1所述的一种不良用户甄别方法,其特征在于,所述使用设备相似度算法具体公式为:
Figure BDA0001724588770000182
其中,p′表示待甄别用户u和不良用户v的使用设备相似度,pi表示待甄别用户u和/或不良用户v使用的设备类型,Iu表示待甄别用户u使用的设备类型集合,Iv表示不良用户v使用的设备类型集合,Iu∩Iv表示待甄别用户u和不良用户v的共同设备类型集合,
Figure BDA0001724588770000183
表示待甄别用户u在预设时间段内使用第i种设备类型的次数,表示不良用户v在预设时间段内使用第i种设备的次数。
同网络地址,待甄别用户使用的设备ID和不良用户使用的设备ID越相似,得到的数值越大,反之越小,因此该算法能够体现待甄别用户和不良用户在设备ID上的相似度
作为一个优选的实施方案,所述根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户具体为:
为所述观看相似度、行为相似度、网络地址相似度和使用设备相似度设置对应的权重;
将所述观看相似度、行为相似度、网络地址相似度和使用设备相似度和对应的权重相乘后求和得到总相似度;
判断总相似度是否超过预设的相似度阈值,如果超过,则所述待甄别用户为不良用户。
在个性参数上不同,无法保证不同算法得到的相似度是基于同一计量标准的。类比长度上,一个长度是1厘米,另一是1米不能通过简单的1加1等于2得到最后的长度,而需要将1米乘以转换率/权值100,使得两个数值处于厘米同一计量单位,得到101厘米结果。同理,使用不同剂量算法得到的个性参数在不同方面的相似度可能处于不同的计量标准上,不能简单的相加得到总的相似度。因此在得到上述4个相似度后,相应设置4个对应的权值,经过转换后,调整这些相似度到一个同一的计量标准再相加,能够更准确的从数值上反应待甄别用户和不良用户的相似程度。
此外,设置权值的大小根据不同的判断需求来设置,如判断账号是否为同一用户或者同一团伙进行不良行为,则可以加大网络地址以及设备地址对应的权重。
举例来说,用户A和B共同观看的直播间数量为2,总共观看的数量为10;
用户A有三个IP,权重分别是IP1:0.5,IP2:0.2,IP3:0.3
用户B有两个IP,权重分别是IP1:0.2,IP4:0.8
用户A有两个设备,权重分别是DID1:0.6,DID2:0.4
用户A有两个设备,权重分别是DID1:0.3,DID3:0.7
权重系数全部取0.25,行为相似度算法的计算的结果是0.2,那么用户A、B的相似度是:
0.25*(2/10)+0.25*0.2+0.25*min(0.2,0.5)+0.25*min(0.3,0.6)=0.225
实施例二
对应上述不良用户甄别方法,本发明还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待甄别用户和不良用户的个性参数,所述个性参数包括观看过的直播间、用户行为、IP地址和使用过的设备ID;
根据预设的观看相似度算法以及待甄别用户和不良用户观看过的直播间,计算待甄别用户和不良用户之间的观看相似度;
根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度;
根据预设的网络地址相似度算法以及待甄别用户和不良用户的IP地址,计算待甄别用户和不良用户的网络地址相似度;
根据预设的设备相似度算法以及待甄别用户和不良用户使用过的设备ID,计算待甄别用户和不良用户的使用设备相似度;
根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。
需要说明的是,所述存储介质包括U盘、移动硬盘、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、磁碟或者光盘等各种可以存储程序代码的介质。这些存储戒指存储的计算机程序执行时,实现上述实施例的方法。
实施例三
对应上述不良用户甄别的方法,本发明还提供一种电子设备,该电子设备存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待甄别用户和不良用户的个性参数,所述个性参数包括观看过的直播间、用户行为、IP地址和使用过的设备ID;
根据预设的观看相似度算法以及待甄别用户和不良用户观看过的直播间,计算待甄别用户和不良用户之间的观看相似度;
根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度;
根据预设的网络地址相似度算法以及待甄别用户和不良用户的IP地址,计算待甄别用户和不良用户的网络地址相似度;
根据预设的设备相似度算法以及待甄别用户和不良用户使用过的设备ID,计算待甄别用户和不良用户的使用设备相似度;
根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。
需要说明的是,所述电子设备包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例的方法。
实施例四
参见图2所示,本发明实施例提供一种不良用户甄别系统,其包括:
准备模块(1),用于获取待甄别用户和不良用户的个性参数,所述个性参数包括观看过的直播间、用户行为、IP地址和使用过的设备ID;
观看相似度计算模块(2),用于根据预设的观看相似度算法以及待甄别用户和不良用户观看过的直播间,计算待甄别用户和不良用户之间的观看相似度;
行为相似度计算模块(3),用于根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度;
网络地址相似度计算模块(4),用于根据预设的网络地址相似度算法以及待甄别用户和不良用户的IP地址,计算待甄别用户和不良用户的网络地址相似度;
使用设备相似度计算模块(5),用于根据预设的设备相似度算法以及待甄别用户和不良用户使用过的设备ID,计算待甄别用户和不良用户的使用设备相似度;
判断模块(6),用于综合所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。
如图3所示,作为一个优选的实施方案,判断模块包括:
权重获取子模块(60),用于为所述观看相似度、行为相似度、网络地址相似度和使用设备相似度设置对应的权重;
相似度计算子模块(61),用于将所述观看相似度、行为相似度、网络地址相似度和使用设备相似度和对应的权重相乘后求和得到总相似度。
前述方法实施例中的各种变化方式和具体实例同样适用于本实施例的系统,通过前述方法的详细描述,本领域技术人员可以清楚的知道本实施例中系统的实施方法,所以为了说明书的简洁,在此不再详述。
总体来说,本发明实施例提供的一种不良用户甄别方法、存储介质、电子设备及系统,通过,相较于传统的技术等等,能够通过用户的特征信息中的4个方面:观看过的直播间、行为特征、网络地址以及使用设备计算相似度,能够通过数值的大小判断待甄别用户和不良用户的相似程度,使得甄别更加准确和迅速。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种不良用户甄别方法,用于直播平台通过计算待甄别用户和已知不良用户之间的相似度,判断待甄别用户是否是不良用户,其特征在于,其包括:
获取待甄别用户和不良用户的个性参数,所述个性参数包括观看过的直播间、用户行为、IP地址和使用过的设备ID;
根据预设的观看相似度算法以及待甄别用户和不良用户观看过的直播间,计算待甄别用户和不良用户之间的观看相似度;
根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度;
根据预设的网络地址相似度算法以及待甄别用户和不良用户的IP地址,计算待甄别用户和不良用户的网络地址相似度;
根据预设的设备相似度算法以及待甄别用户和不良用户使用过的设备ID,计算待甄别用户和不良用户的使用设备相似度;
根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。
2.如权利要求1所述的一种不良用户甄别方法,其特征在于,所述观看相似度算法具体公式为:
Figure FDA0001724588760000011
其中:R′表示待甄别用户u和不良用户v之间的观看相似度,Ruv表示在预设时间段内待甄别用户u和不良用户v共同观看过的直播间个数,Ru、Rv分别表示待甄别用户u和不良用户v观看的直播间集合,|Ru∩Rv|表示待甄别用户u和不良用户v均观看过的直播间个数。
3.如权利要求1所述的一种不良用户甄别方法,其特征在于,所述根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度,具体包括以下步骤:
为用户行为设置N个行为特征指标,所述N为大于0的整数;
对应行为特征指标,对待甄别用户和不良用户的用户行为评分;
计算行为相似度X′
Figure FDA0001724588760000021
其中,xui表示待甄别用户u的用户行为的对应第i个行为特征指标的评分,xvi表示不良用户v的用户行为的对应第i个行为特征指标的评分。
4.如权利要求1所述的一种不良用户甄别方法,其特征在于,所述网络地址相似度算法具体公式为:
Figure FDA0001724588760000022
其中,p′表示待甄别用户u和不良用户v的网络地址相似度,pi表示待甄别用户u和/或不良用户v使用的IP地址,Iu表示待甄别用户u使用的IP地址集合,Iv表示不良用户v使用的IP地址集合,Iu∩Iv表示待甄别用户u和不良用户v的共同IP地址集合,
Figure FDA0001724588760000023
表示待甄别用户u在预设时间段内观看第i个IP地址的次数,
Figure FDA0001724588760000031
表示不良用户v在预设时间段内观看第i个IP地址的次数。
5.权利要求1所述的一种不良用户甄别方法,其特征在于,所述使用设备相似度算法具体公式为:
Figure FDA0001724588760000032
其中,p′表示待甄别用户u和不良用户v的使用设备相似度,pi表示待甄别用户u和/或不良用户v使用的设备类型,Iu表示待甄别用户u使用的设备类型集合,Iv表示不良用户v使用的设备类型集合,Iu∩Iv表示待甄别用户u和不良用户v的共同设备类型集合,表示待甄别用户u在预设时间段内使用第i种设备类型的次数,
Figure FDA0001724588760000034
表示不良用户v在预设时间段内使用第i种设备的次数。
6.如权利要求1所述的一种不良用户甄别方法,其特征在于,所述根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户具体为:
为所述观看相似度、行为相似度、网络地址相似度和使用设备相似度设置对应的权重;
将所述观看相似度、行为相似度、网络地址相似度和使用设备相似度和对应的权重相乘后求和得到总相似度;
判断总相似度是否超过预设的相似度阈值,如果超过,则所述待甄别用户为不良用户。
7.一种存储介质,该存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现以下步骤:
获取待甄别用户和不良用户的个性参数,所述个性参数包括观看过的直播间、用户行为、IP地址和使用过的设备ID;
根据预设的观看相似度算法以及待甄别用户和不良用户观看过的直播间,计算待甄别用户和不良用户之间的观看相似度;
根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度;
根据预设的网络地址相似度算法以及待甄别用户和不良用户的IP地址,计算待甄别用户和不良用户的网络地址相似度;
根据预设的设备相似度算法以及待甄别用户和不良用户使用过的设备ID,计算待甄别用户和不良用户的使用设备相似度;
根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。
8.一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现以下步骤:
获取待甄别用户和不良用户的个性参数,所述个性参数包括观看过的直播间、用户行为、IP地址和使用过的设备ID;
根据预设的观看相似度算法以及待甄别用户和不良用户观看过的直播间,计算待甄别用户和不良用户之间的观看相似度;
根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度;
根据预设的网络地址相似度算法以及待甄别用户和不良用户的IP地址,计算待甄别用户和不良用户的网络地址相似度;
根据预设的设备相似度算法以及待甄别用户和不良用户使用过的设备ID,计算待甄别用户和不良用户的使用设备相似度;
根据所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。
9.一种不良用户甄别系统,其特征在于,其包括:
准备模块(1),用于获取待甄别用户和不良用户的个性参数,所述个性参数包括观看过的直播间、用户行为、IP地址和使用过的设备ID;
观看相似度计算模块(2),用于根据预设的观看相似度算法以及待甄别用户和不良用户观看过的直播间,计算待甄别用户和不良用户之间的观看相似度;
行为相似度计算模块(3),用于根据预设的行为相似度算法以及待甄别用户和不良用户的用户行为,计算待甄别用户和不良用户之间的行为相似度;
网络地址相似度计算模块(4),用于根据预设的网络地址相似度算法以及待甄别用户和不良用户的IP地址,计算待甄别用户和不良用户的网络地址相似度;
使用设备相似度计算模块(5),用于根据预设的设备相似度算法以及待甄别用户和不良用户使用过的设备ID,计算待甄别用户和不良用户的使用设备相似度;
判断模块(6),用于综合所述观看相似度、行为相似度、网络地址相似度和使用设备相似度,判断待甄别用户是否为不良用户。
10.如权利要求1所述的一种不良用户甄别系统,其特征在于,所述判断模块包括:
权重获取子模块(60),用于为所述观看相似度、行为相似度、网络地址相似度和使用设备相似度设置对应的权重;相似度计算子模块(61),用于将所述观看相似度、行为相似度、网络地址相似度和使用设备相似度和对应的权重相乘后求和得到总相似度。
CN201810746925.9A 2018-07-09 2018-07-09 一种不良用户甄别方法、存储介质、电子设备及系统 Active CN110765171B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810746925.9A CN110765171B (zh) 2018-07-09 2018-07-09 一种不良用户甄别方法、存储介质、电子设备及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810746925.9A CN110765171B (zh) 2018-07-09 2018-07-09 一种不良用户甄别方法、存储介质、电子设备及系统

Publications (2)

Publication Number Publication Date
CN110765171A true CN110765171A (zh) 2020-02-07
CN110765171B CN110765171B (zh) 2022-06-21

Family

ID=69326799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810746925.9A Active CN110765171B (zh) 2018-07-09 2018-07-09 一种不良用户甄别方法、存储介质、电子设备及系统

Country Status (1)

Country Link
CN (1) CN110765171B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114302216A (zh) * 2021-08-25 2022-04-08 上海哔哩哔哩科技有限公司 一种弹幕处理方法、装置、设备及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010071625A1 (en) * 2008-12-20 2010-06-24 I.D. Rank Security, Inc. Systems and methods for forensic analysis of network behavior
CN107517394A (zh) * 2017-09-01 2017-12-26 北京小米移动软件有限公司 识别非法用户的方法、装置及计算机可读存储介质
CN108134944A (zh) * 2017-12-14 2018-06-08 北京奇艺世纪科技有限公司 一种收入异常主播用户的识别方法、装置及电子设备
CN108174296A (zh) * 2018-01-02 2018-06-15 武汉斗鱼网络科技有限公司 恶意用户识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010071625A1 (en) * 2008-12-20 2010-06-24 I.D. Rank Security, Inc. Systems and methods for forensic analysis of network behavior
CN107517394A (zh) * 2017-09-01 2017-12-26 北京小米移动软件有限公司 识别非法用户的方法、装置及计算机可读存储介质
CN108134944A (zh) * 2017-12-14 2018-06-08 北京奇艺世纪科技有限公司 一种收入异常主播用户的识别方法、装置及电子设备
CN108174296A (zh) * 2018-01-02 2018-06-15 武汉斗鱼网络科技有限公司 恶意用户识别方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BO HU等: ""Joint pollution detection and attacker identification in peer-to-peer live streaming"", 《 2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING》 *
周亚东等: ""e-Learning中不良网络内容的识别与阻断技术"", 《中国科技论文在线》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114302216A (zh) * 2021-08-25 2022-04-08 上海哔哩哔哩科技有限公司 一种弹幕处理方法、装置、设备及系统
CN114302216B (zh) * 2021-08-25 2024-03-22 上海哔哩哔哩科技有限公司 一种弹幕处理方法、装置、设备及系统

Also Published As

Publication number Publication date
CN110765171B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
CN105160008B (zh) 一种定位推荐用户的方法及装置
CN110737859B (zh) 一种up主匹配方法及装置
CN105657471B (zh) 一种管理账户的方法和装置
CN110049372B (zh) 主播稳定留存率的预测方法、装置、设备及存储介质
CN104504149A (zh) 一种实现应用推荐的方法及装置
CN108322317A (zh) 一种账号识别关联方法及服务器
CN108460085A (zh) 一种基于用户日志的视频搜索排序训练集构建方法及装置
CN105915960A (zh) 一种用户类型的确定方法及装置
US20170245010A1 (en) Video playing detection method and apparatus
CN110732139A (zh) 检测模型的训练方法和用户数据的检测方法、装置
CN108366274B (zh) 一种刷播放量的检测方法和装置
CN110765171B (zh) 一种不良用户甄别方法、存储介质、电子设备及系统
CN103955846A (zh) 信息处理系统中控制多个终端智能反馈的控制方法及装置
CN109214634A (zh) 一种信息处理方法、装置及信息处理可读介质
CN112883275B (zh) 一种直播间推荐方法、装置、服务器及介质
CN104991935B (zh) 一种网站关注度的处理方法和装置
CN114036395A (zh) 内容推荐方法、装置、计算机设备及计算机可读存储介质
CN110139160B (zh) 一种预测系统及方法
CN114466214B (zh) 直播间人数统计方法及装置
CN110674632A (zh) 一种确定安全级别的方法及装置、存储介质和设备
CN110750681A (zh) 一种账号相似度计算方法、存储介质、电子设备及系统
CN111191109A (zh) 一种信息处理方法及装置、存储介质
CN113408470A (zh) 数据处理方法、装置、电子设备、存储介质及程序产品
CN104410874A (zh) 视频粘度信息的检测方法、装置和系统
CN109413459B (zh) 一种直播平台中用户的推荐方法以及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant