CN108174296A - 恶意用户识别方法及装置 - Google Patents
恶意用户识别方法及装置 Download PDFInfo
- Publication number
- CN108174296A CN108174296A CN201810000759.8A CN201810000759A CN108174296A CN 108174296 A CN108174296 A CN 108174296A CN 201810000759 A CN201810000759 A CN 201810000759A CN 108174296 A CN108174296 A CN 108174296A
- Authority
- CN
- China
- Prior art keywords
- user
- value
- suspicion
- degree value
- barrage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44213—Monitoring of end-user related data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4667—Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/4788—Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
Abstract
本申请一种恶意用户识别方法及装置,所述方法包括:获取多个用户的弹幕发送行为特征;根据所述弹幕发送行为特征,计算所述多个用户中每两个用户之间的相似程度值;将所述恶意用户的嫌疑程度值设置为第一初始嫌疑值,将所述待识别用户的嫌疑程度值设置为第二初始嫌疑值;针对每个用户,根据该用户当前的所述嫌疑程度值及该用户与其他用户之间的所述相似程度值,通过概率图模型对该用户的所述嫌疑程度值进行迭代计算;在经过多次所述迭代计算之后,将所述嫌疑程度值大于一个嫌疑度阈值的待识别用户作为恶意用户。如此,根据待识别用户与已确定的恶意用户在的弹幕发送行为特征上的关联,可以有效筛选出恶意行为特征不明显的恶意用户。
Description
技术领域
本申请涉及大数据处理技术领域,具体而言,涉及一种恶意用户识别方法及装置。
背景技术
直播平台是一种互联网社交平台,为主播用户提供了展示视频直播渠道及与其他用户线上交互的渠道。在直播平台上常存在一些恶意用户通过不正当手段谋求不正当的利益。例如,视频直播平台通过用户对主播的关注反映主播的影响力和关注度,恶意用户会可能通过营造大量虚假关注获得利益,这会破坏直播平台的生态,损害其他正常用户的利益。针对这种情况,需要对恶意用户进行识别,以屏蔽或显示这些恶意用户在直播平台上的行为。现有技术在进行恶意用户识别时,为了防止将正常用户识别为恶意用户,常采用较为严格的规则,将具有明显恶意行为特征的用户作为恶意用户,但是这样会遗漏一些恶意行为特征不明显的恶意用户。
发明内容
本申请的目的在于提供一种恶意用户识别方法,所述方法包括:
获取多个用户的弹幕发送行为特征,其中,所述多个用户中包括至少一个已确定的恶意用户及除所述恶意用户之外的待识别用户;
根据所述弹幕发送行为特征,计算所述多个用户中每两个用户之间的相似程度值;
将所述恶意用户的嫌疑程度值设置为第一初始嫌疑值,将所述待识别用户的嫌疑程度值设置为第二初始嫌疑值,其中,所述第一初始嫌疑值高于第二初始嫌疑值;
针对每个用户,根据该用户当前的所述嫌疑程度值及该用户与其他用户之间的所述相似程度值,通过概率图模型对该用户的所述嫌疑程度值进行迭代计算;
在经过多次所述迭代计算之后,将所述嫌疑程度值大于一个嫌疑度阈值的待识别用户作为恶意用户。
进一步地,在上述方法中,所述将所述嫌疑程度值大于一个嫌疑度阈值的待识别用户作为恶意用户的步骤,包括:
计算得到所述多个用户的嫌疑程度值的经验分布函数;
在所述经验分布函数上将上升斜率超过预设上升阈值的点对应的嫌疑程度值作为所述嫌疑度阈值;
将所述待识别用户中嫌疑程度值大于所述嫌疑度阈值的用户作为恶意用户。
进一步地,在上述方法中,所述通过概率图模型对该用户的所述嫌疑程度值进行迭代计算的步骤,包括:
通过概率图模型对每个用户的所述嫌疑程度值进行所述迭代计算;
针对每个用户,计算在执行本轮迭代计算前后所述嫌疑程度值的变化程度;
在每个用户对应的所述嫌疑程度值的变化程度均小于预设变化阈值时,停止迭代计算。
进一步地,在上述方法中,所述对该用户的所述嫌疑程度值进行迭代计算的步骤,包括:
通过概率图模型对每个用户的所述嫌疑程度值进行所述预设次数的迭代计算。
进一步地,在上述方法中,所述弹幕发送行为特征包括用户发送弹幕的直播间的集合及至少一种弹幕发送动作统计值;所述根据各用户的所述弹幕发送行为特征,计算每两个用户之间的相似程度值的步骤,包括:
根据每两个用户发送弹幕的直播间的集合计算所述两个用户之间的第一相似参数;
根据所述两个用户的每种所述弹幕发送动作统计值计算所述两个用户之间的第二相似参数;
根据所述第一相似参数及第二相似参数计算所述两个用户中间的相似程度值。
进一步地,在上述方法中,所述弹幕发送动作统计值的种类包括发送弹幕的数量、发送弹幕的时间段、发送弹幕的时间间隔、弹幕字数、弹幕中包含预设关键字的次数中的一种或多种。
进一步地,在上述方法中,所述通过概率图模型对该用户的所述嫌疑程度值进行迭代计算的公式为:
其中,Sk(i)为第i个用户在第k轮迭代计算中的嫌疑程度值,α为权重系数,α取值在0到1之间;wji是用户j和用户i之间的相似程度值。
进一步地,在上述方法中,所述第一初始嫌疑值为1,第二初始嫌疑值为0。
本申请的另一目的在于提供一种恶意用户识别装置,所述装置包括:
特征获取模块,用于获取多个用户的弹幕发送行为特征,其中,所述多个用户中包括至少一个已确定的恶意用户及除所述恶意用户之外的待识别用户;
相似度计算模块,用于根据所述弹幕发送行为特征性,计算所述多个用户中每两个用户之间的相似程度值;
初始化模块,用于将所述恶意用户的嫌疑程度值设置为第一初始嫌疑值,将所述待识别用户的嫌疑程度值设置为第二初始嫌疑值,其中,所述第一初始嫌疑值高于第二初始嫌疑值;
迭代计算模块,用于针对每个用户,根据该用户当前的所述嫌疑程度值及与其他用户之间的所述相似程度值,通过概率图模型对该用户的所述嫌疑程度值进行迭代计算;
识别模块,用于在经过多次所述迭代计算之后,将所述嫌疑程度值大于一个嫌疑度阈值的待识别用户作为恶意用户。
本申请的另一目的在于提供一种可读存储介质,存储有可执行的指令,所述指令再被一个或多个处理器执行时,实现本申请提供的所述恶意用户识别方法。
相对于现有技术而言,本申请具有以下有益效果:
本申请提供的恶意用户识别方法及装置,通过采用概率图算法,根据已知恶意用户的弹幕发送行为特征与待识别用户的弹幕行为特征计算,计算得到待识别用户的嫌疑程度值,并根据所述嫌疑程度值识别出恶意用户。如此,根据待识别用户与已确定的恶意用户在的弹幕发送行为特征上的关联,可以有效筛选出恶意行为特征不明显的恶意用户。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的数据处理设备的示意图;
图2为本申请实施例提供的恶意用户识别方法的流程示意图;
图3为步骤S120的子步骤示意图;
图4为本申请实施例提供的恶意用户识别装置的示意图。
图标:100-数据处理设备;110-恶意用户识别装置;111-特征获取模块;112-相似度计算模块;113-初始化模块;114-迭代计算模块;115-识别模块;120-存储器;130-处理器。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
此外,术语“水平”、“竖直”、“悬垂”等术语并不表示要求部件绝对水平或悬垂,而是可以稍微倾斜。如“水平”仅仅是指其方向相对“竖直”而言更加水平,并不是表示该结构一定要完全水平,而是可以稍微倾斜。
在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
经发明人研究发现,恶意用户通常呈一个较多数量的团体出现,其中有一些具有明显恶意行为特征的用户,可能有一些具有不明显的恶意行为特征的用户。在一个团体中的恶意用户一般具有相同或相似的恶意行为模式,这些恶意行为模式可能不是明显的,但却是相关联的。
故在本实施例中,发明人提出一种通过概率图模型,对嫌疑程度值进行传播迭代计算的方式,其他将与已确定的恶意用户具有相同行为模式的恶意用户筛选出来,这样可以准确地识别与已确定的恶意用户相关的,具有不明显的恶意行为的用户。
请参照图1,图1是本申请较佳实施例提供的数据处理设备100的方框示意图。所述数据处理设备100包括恶意用户识别装置110、存储器120、处理器130。
所述存储器120及处理器130各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述恶意用户识别装置110包括至少一个可以软件或固件(firmware)的形式存储于所述存储器120中或固化在所述数据处理设备100的操作系统(operating system,OS)中的软件功能模块。所述处理器130用于执行所述存储器120中存储的可执行模块,例如所述恶意用户识别装置110所包括的软件功能模块及计算机程序等。
其中,所述存储器120可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,存储器120用于存储程序,所述处理器130在接收到执行指令后,执行所述程序。
所述处理器130可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
请参照图2,图2为应用于图1所示的数据处理设备100的一种应用信息获取方法的流程图,以下将对所述方法包括各个步骤进行详细阐述。
步骤S110,获取多个用户的弹幕发送行为特征,其中,所述多个用户中包括至少一个已确定的恶意用户及除所述恶意用户之外的待识别用户。
在本实施例中,所述弹幕发送行为特征可以包括用户发送弹幕的直播间的集合及至少一种弹幕发送动作统计值,所述弹幕发送动作统计值的种类包括发送弹幕的数量、发送弹幕的时间段、发送弹幕的时间间隔、弹幕字数、弹幕中包含预设关键字的次数中的一种或多种。
步骤S120,根据所述弹幕发送行为特征,计算所述多个用户中每两个用户之间的相似程度值。
在本实施例中,请参照图3,步骤S120可以包括子步骤S121-S123。
子步骤S121,根据每两个用户发送弹幕的直播间的集合计算所述两个用户之间的第一相似参数。
子步骤S122,根据所述两个用户的每种所述弹幕发送动作统计值计算所述两个用户之间的第二相似参数。
子步骤S123,根据所述第一相似参数及第二相似参数计算所述两个用户中间的相似程度值。
例如,在本实施例中,记用户u和用户v之间相似程度值为wji,则有
其中,Ru与Rv分别为用户u和用户v发弹幕的直播间的集合,xui用户u第i个所述弹幕发送动作统计值,其中,所述弹幕发送动作统计值中有N个种类。w1与w2为权重系数,且满足w1+w2=1。
步骤S130,将所述恶意用户的嫌疑程度值设置为第一初始嫌疑值,将所述待识别用户的嫌疑程度值设置为第二初始嫌疑值,其中,所述第一初始嫌疑值高于第二初始嫌疑值。
在本实施例中,通过嫌疑程度值表征用户可能为恶意用户的程度,并通过概率图模型对所述程度值进行多次迭代计算,使所述嫌疑程度值更加准确。
在进行迭代计算之前,需要先对每个用户设置一个初始嫌疑值,再次初始嫌疑值的基础上进行迭代计算,在本实施例中,由于所述恶意用户的身份是已确定的,故将所述恶意用户的嫌疑程度值设置为一个较大的第一初始嫌疑值(如,设置为1),并将所述待识别用户的嫌疑程度值设置为一各与所述第一初始嫌疑值先比较小的第二初始嫌疑值(如,设置为0)。
步骤S140,针对每个用户,根据该用户当前的所述嫌疑程度值及该用户与其他用户之间的所述相似程度值,通过概率图模型对该用户的所述嫌疑程度值进行迭代计算。
在本实施例中,针对每个用户,通过以下公式迭代计算该用户的嫌疑程度值,
其中,Sk(i)为第i个用户在第k轮迭代计算中的嫌疑程度值,α为权重系数,α取值在0到1之间;wji是用户j和用户i之间的相似程度值。
基于上述设计,利用嫌疑程度值在概率图模型计算中传播的思路,将用户间的相似程度值表征传播概率,实现根据用户之间的相关性将刷关注的嫌疑程度值在概率图上进行传播,通过不断地迭代用户的嫌疑程度值会趋于一个稳定的分布。
假设有三个用户A、B、C,通过强规则可以识别出A用户为恶意用户,而B和C待识别用户,并设置权重系数为0.8。其中用户间的相似程度值分别是:
wAB=0.5
wAC=0.1
wBC=0.2
初始化嫌疑度值为:
S0(A)=1,S0(B)=0,S0(C)=0
在进行第一轮迭代计算时的结果为:
步骤S150,在经过多次所述迭代计算之后,将所述嫌疑程度值大于一个嫌疑度阈值的待识别用户作为恶意用户。
在本实施例的一种方式中,当各个用户的嫌疑程度值均收敛值一定程度时,停止迭代计算。
例如,所述数据处理设备100针对每个用户,计算在执行本轮迭代计算前后所述嫌疑程度值的变化程度。在每个用户对应的所述嫌疑程度值的变化程度均小于预设变化阈值时,停止迭代计算。其中,所述变化阈值可以为先对前一次迭代结果的一个变化百分比。
在本实施例的一种方式中,预先设定一个预设次数,对每个用户的所述嫌疑程度值进行所述预设次数的迭代计算。如,进行10次迭代计算。
在完成多次迭代计算后,所述数据处理设备100可以计算得到所述多个用户的嫌疑程度值的经验分布函数。在所述经验分布函数上将上升斜率超过预设上升阈值的点对应的嫌疑程度值作为所述嫌疑度阈值。如在所述经验分布函数上确定一个明显的拐点,所述经验分布函数在该拐点后出现明显上升,将该拐点对应的嫌疑程度值作为所述嫌疑度阈值。
然后,将所述待识别用户中嫌疑程度值大于所述嫌疑度阈值的用户作为恶意用户。
如此,通过本实施例提供的恶意用户识别方法,可以将具有明显恶意行为特征的恶意用户进行嫌疑程度值的传播计算,从而找到那些没有明确恶意行为特征的潜在风险用户。
请参照图4,本实施例还提供一种应用于图1所示数据处理设备100的恶意用户识别装置110,所述装置包括特征获取模块111、相似度计算模块112、初始化模块113、迭代计算模块114及识别模块115。
所述特征获取模块111,用于获取多个用户的弹幕发送行为特征,其中,所述多个用户中包括至少一个已确定的恶意用户及除所述恶意用户之外的待识别用户
本实施例中,所述特征获取模块111可用于执行图2所示的步骤S110,关于所述特征获取模块111的具体描述可参对所述步骤S110的描述。
所述相似度计算模块112,用于根据所述弹幕发送行为特征性,计算所述多个用户中每两个用户之间的相似程度值。
本实施例中,所述相似度计算模块112可用于执行图2所示的步骤S120,关于所述相似度计算模块112的具体描述可参对所述步骤S120的描述。
所述初始化模块113,用于将所述恶意用户的嫌疑程度值设置为第一初始嫌疑值,将所述待识别用户的嫌疑程度值设置为第二初始嫌疑值,其中,所述第一初始嫌疑值高于第二初始嫌疑值。
本实施例中,所述初始化模块113可用于执行图2所示的步骤S130,关于所述初始化模块113的具体描述可参对所述步骤S130的描述。
所述迭代计算模块114,用于针对每个用户,根据该用户当前的所述嫌疑程度值及与其他用户之间的所述相似程度值,通过概率图模型对该用户的所述嫌疑程度值进行迭代计算。
本实施例中,所述迭代计算模块114可用于执行图2所示的步骤S140,关于所述迭代计算模块114的具体描述可参对所述步骤S140的描述。
所述识别模块115,用于在经过多次所述迭代计算之后,将所述嫌疑程度值大于一个嫌疑度阈值的待识别用户作为恶意用户。
本实施例中,所述识别模块115可用于执行图2所示的步骤S150,关于所述识别模块115的具体描述可参对所述步骤S150的描述。
综上所述,本申请提供的恶意用户识别方法及装置,通过采用概率图算法,根据已知恶意用户的弹幕发送行为特征与待识别用户的弹幕行为特征计算,计算得到待识别用户的嫌疑程度值,并根据所述嫌疑程度值识别出恶意用户。如此,根据待识别用户与已确定的恶意用户在的弹幕发送行为特征上的关联,可以有效筛选出恶意行为特征不明显的恶意用户。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种恶意用户识别方法,其特征在于,所述方法包括:
获取多个用户的弹幕发送行为特征,其中,所述多个用户中包括至少一个已确定的恶意用户及除所述恶意用户之外的待识别用户;
根据所述弹幕发送行为特征,计算所述多个用户中每两个用户之间的相似程度值;
将所述恶意用户的嫌疑程度值设置为第一初始嫌疑值,将所述待识别用户的嫌疑程度值设置为第二初始嫌疑值,其中,所述第一初始嫌疑值高于第二初始嫌疑值;
针对每个用户,根据该用户当前的所述嫌疑程度值及该用户与其他用户之间的所述相似程度值,通过概率图模型对该用户的所述嫌疑程度值进行迭代计算;
在经过多次所述迭代计算之后,将所述嫌疑程度值大于一个嫌疑度阈值的待识别用户作为恶意用户。
2.根据权利要求1所述的方法,其特征在于,所述将所述嫌疑程度值大于一个嫌疑度阈值的待识别用户作为恶意用户的步骤,包括:
计算得到所述多个用户的嫌疑程度值的经验分布函数;
在所述经验分布函数上将上升斜率超过预设上升阈值的点对应的嫌疑程度值作为所述嫌疑度阈值;
将所述待识别用户中嫌疑程度值大于所述嫌疑度阈值的用户作为恶意用户。
3.根据权利要求1所述的方法,其特征在于,所述通过概率图模型对该用户的所述嫌疑程度值进行迭代计算的步骤,包括:
通过概率图模型对每个用户的所述嫌疑程度值进行所述迭代计算;
针对每个用户,计算在执行本轮迭代计算前后所述嫌疑程度值的变化程度;
在每个用户对应的所述嫌疑程度值的变化程度均小于预设变化阈值时,停止迭代计算。
4.根据权利要求1所述的方法,其特征在于,所述对该用户的所述嫌疑程度值进行迭代计算的步骤,包括:
通过概率图模型对每个用户的所述嫌疑程度值进行预设次数的迭代计算。
5.根据权利要求1所述的方法,其特征在于,所述弹幕发送行为特征包括用户发送弹幕的直播间的集合及至少一种弹幕发送动作统计值;所述根据所述弹幕发送行为特征,计算所述多个用户中每两个用户之间的相似程度值的步骤,包括:
根据每两个用户发送弹幕的直播间的集合计算所述两个用户之间的第一相似参数;
根据所述两个用户的每种所述弹幕发送动作统计值计算所述两个用户之间的第二相似参数;
根据所述第一相似参数及第二相似参数计算所述两个用户中间的相似程度值。
6.根据权利要求5所述的方法,其特征在于,所述弹幕发送动作统计值的种类包括发送弹幕的数量、发送弹幕的时间段、发送弹幕的时间间隔、弹幕字数、弹幕中包含预设关键字的次数中的一种或多种。
7.根据权利要求1所述的方法,其特征在于,所述通过概率图模型对该用户的所述嫌疑程度值进行迭代计算的公式为:
其中,Sk(i)为第i个用户在第k轮迭代计算中的嫌疑程度值,α为权重系数,α取值在0到1之间;wji是用户j和用户i之间的相似程度值。
8.根据权利要求7所述的方法,其特征在于,所述第一初始嫌疑值为1,第二初始嫌疑值为0。
9.一种恶意用户识别装置,其特征在于,所述装置包括:
特征获取模块,用于获取多个用户的弹幕发送行为特征,其中,所述多个用户中包括至少一个已确定的恶意用户及除所述恶意用户之外的待识别用户;
相似度计算模块,用于根据所述弹幕发送行为特征性,计算所述多个用户中每两个用户之间的相似程度值;
初始化模块,用于将所述恶意用户的嫌疑程度值设置为第一初始嫌疑值,将所述待识别用户的嫌疑程度值设置为第二初始嫌疑值,其中,所述第一初始嫌疑值高于第二初始嫌疑值;
迭代计算模块,用于针对每个用户,根据该用户当前的所述嫌疑程度值及与其他用户之间的所述相似程度值,通过概率图模型对该用户的所述嫌疑程度值进行迭代计算;
识别模块,用于在经过多次所述迭代计算之后,将所述嫌疑程度值大于一个嫌疑度阈值的待识别用户作为恶意用户。
10.一种可读存储介质,其特征在于,存储有可执行的指令,所述指令在被一个或多个处理器执行时,实现权利要求1-8任意一项所述的恶意用户识别方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810000759.8A CN108174296B (zh) | 2018-01-02 | 2018-01-02 | 恶意用户识别方法及装置 |
PCT/CN2018/084636 WO2019134307A1 (zh) | 2018-01-02 | 2018-04-26 | 恶意用户识别方法、装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810000759.8A CN108174296B (zh) | 2018-01-02 | 2018-01-02 | 恶意用户识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108174296A true CN108174296A (zh) | 2018-06-15 |
CN108174296B CN108174296B (zh) | 2019-09-10 |
Family
ID=62516946
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810000759.8A Active CN108174296B (zh) | 2018-01-02 | 2018-01-02 | 恶意用户识别方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108174296B (zh) |
WO (1) | WO2019134307A1 (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109003181A (zh) * | 2018-08-17 | 2018-12-14 | 腾讯科技(深圳)有限公司 | 可疑用户确定方法、装置、设备和计算机可读存储介质 |
CN109151518A (zh) * | 2018-08-06 | 2019-01-04 | 武汉斗鱼网络科技有限公司 | 一种被盗账号的识别方法、装置及电子设备 |
CN109255371A (zh) * | 2018-08-23 | 2019-01-22 | 武汉斗鱼网络科技有限公司 | 一种确定直播平台虚假关注用户的方法以及相关设备 |
CN109257617A (zh) * | 2018-09-30 | 2019-01-22 | 武汉斗鱼网络科技有限公司 | 一种确定直播平台中嫌疑用户的方法以及相关设备 |
CN109255391A (zh) * | 2018-09-30 | 2019-01-22 | 武汉斗鱼网络科技有限公司 | 一种识别恶意用户的方法、装置及存储介质 |
CN109451359A (zh) * | 2018-10-31 | 2019-03-08 | 武汉斗鱼网络科技有限公司 | 一种关注异常的检测方法、装置、设备和存储介质 |
CN109587248A (zh) * | 2018-12-06 | 2019-04-05 | 腾讯科技(深圳)有限公司 | 用户识别方法、装置、服务器及存储介质 |
CN109615461A (zh) * | 2018-11-09 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 目标用户识别方法、违规商户识别方法和装置 |
CN109840778A (zh) * | 2018-12-21 | 2019-06-04 | 上海拍拍贷金融信息服务有限公司 | 欺诈用户的识别方法及装置、可读存储介质 |
CN109905722A (zh) * | 2019-02-21 | 2019-06-18 | 武汉瓯越网视有限公司 | 一种确定嫌疑节点的方法以及相关设备 |
CN110197375A (zh) * | 2018-11-28 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 一种相似用户识别方法、装置、相似用户识别设备和介质 |
CN110222297A (zh) * | 2019-06-19 | 2019-09-10 | 武汉斗鱼网络科技有限公司 | 一种标签用户的识别方法以及相关设备 |
CN110427999A (zh) * | 2019-07-26 | 2019-11-08 | 武汉斗鱼网络科技有限公司 | 一种账号相关性评估方法、装置、设备及介质 |
CN110442801A (zh) * | 2019-07-26 | 2019-11-12 | 新华三信息安全技术有限公司 | 一种目标事件的关注用户的确定方法及装置 |
CN110765171A (zh) * | 2018-07-09 | 2020-02-07 | 武汉斗鱼网络科技有限公司 | 一种不良用户甄别方法、存储介质、电子设备及系统 |
CN111125192A (zh) * | 2019-12-20 | 2020-05-08 | 北京明略软件系统有限公司 | 一种确定对象之间相似度的方法和装置 |
CN111371767A (zh) * | 2020-02-20 | 2020-07-03 | 深圳市腾讯计算机系统有限公司 | 恶意账号识别方法、恶意账号识别装置、介质及电子设备 |
CN111476510A (zh) * | 2020-06-23 | 2020-07-31 | 武汉斗鱼鱼乐网络科技有限公司 | 一种风险用户识别的方法及系统、存储介质、设备 |
CN112153221A (zh) * | 2020-09-16 | 2020-12-29 | 北京邮电大学 | 一种基于社交网络图计算的通信行为识别方法 |
CN112667961A (zh) * | 2019-10-16 | 2021-04-16 | 武汉斗鱼网络科技有限公司 | 一种识别广告弹幕发布者的方法及系统 |
CN113159778A (zh) * | 2020-12-24 | 2021-07-23 | 西安四叶草信息技术有限公司 | 一种金融欺诈的检测方法及装置 |
WO2022068600A1 (zh) * | 2020-09-30 | 2022-04-07 | 百果园技术(新加坡)有限公司 | 异常用户检测模型训练方法、异常用户审核方法及装置 |
CN114302216A (zh) * | 2021-08-25 | 2022-04-08 | 上海哔哩哔哩科技有限公司 | 一种弹幕处理方法、装置、设备及系统 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113938692B (zh) * | 2020-07-13 | 2024-02-09 | 广州壹点通网络科技有限公司 | 一种视频直播的风险控制方法及装置 |
CN113761277A (zh) * | 2020-09-23 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 一种风控方法、装置、电子设备和存储介质 |
CN112632153B (zh) * | 2020-12-29 | 2023-10-20 | 国网安徽省电力有限公司 | 一种违约用电识别方法及装置 |
CN113609408B (zh) * | 2021-08-10 | 2023-05-02 | 公安部交通管理科学研究所 | 一种基于距离计算的机动车信息查询异常判别方法及系统 |
CN113726887B (zh) * | 2021-08-30 | 2024-03-15 | 广州虎牙科技有限公司 | 一种用户行为评估方法、装置、电子设备及计算机可读存储介质 |
CN114173138B (zh) * | 2021-10-22 | 2023-08-22 | 广州新特珑电子有限公司 | 一种处理异常视频up主的方法、装置、介质及设备 |
CN115396734B (zh) * | 2022-05-16 | 2024-03-08 | 北京大学 | 一种针对视频集中的弹幕和用户行为的可视化方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090055139A1 (en) * | 2007-08-20 | 2009-02-26 | Yahoo! Inc. | Predictive discrete latent factor models for large scale dyadic data |
CN103077240A (zh) * | 2013-01-10 | 2013-05-01 | 北京工商大学 | 一种基于概率图模型的微博水军识别方法 |
CN105915960A (zh) * | 2016-03-31 | 2016-08-31 | 广州华多网络科技有限公司 | 一种用户类型的确定方法及装置 |
CN107316205A (zh) * | 2017-05-27 | 2017-11-03 | 银联智惠信息服务(上海)有限公司 | 识别持卡人属性的方法、装置、计算机可读介质及系统 |
CN107451854A (zh) * | 2017-07-12 | 2017-12-08 | 阿里巴巴集团控股有限公司 | 确定用户类型的方法及装置、电子设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102724182B (zh) * | 2012-05-30 | 2015-03-25 | 北京像素软件科技股份有限公司 | 异常客户端的识别方法 |
US9503465B2 (en) * | 2013-11-14 | 2016-11-22 | At&T Intellectual Property I, L.P. | Methods and apparatus to identify malicious activity in a network |
CN104156447B (zh) * | 2014-08-14 | 2016-08-24 | 天格科技(杭州)有限公司 | 一种智能社交平台广告预警及处理方法 |
CN106452809B (zh) * | 2015-08-04 | 2021-07-13 | 北京奇虎科技有限公司 | 一种数据处理方法和装置 |
CN107093090A (zh) * | 2016-10-25 | 2017-08-25 | 北京小度信息科技有限公司 | 异常用户识别方法及装置 |
CN107481009B (zh) * | 2017-08-28 | 2020-08-21 | 广州虎牙信息科技有限公司 | 识别直播平台异常充值用户的方法、装置及终端 |
-
2018
- 2018-01-02 CN CN201810000759.8A patent/CN108174296B/zh active Active
- 2018-04-26 WO PCT/CN2018/084636 patent/WO2019134307A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090055139A1 (en) * | 2007-08-20 | 2009-02-26 | Yahoo! Inc. | Predictive discrete latent factor models for large scale dyadic data |
CN103077240A (zh) * | 2013-01-10 | 2013-05-01 | 北京工商大学 | 一种基于概率图模型的微博水军识别方法 |
CN105915960A (zh) * | 2016-03-31 | 2016-08-31 | 广州华多网络科技有限公司 | 一种用户类型的确定方法及装置 |
CN107316205A (zh) * | 2017-05-27 | 2017-11-03 | 银联智惠信息服务(上海)有限公司 | 识别持卡人属性的方法、装置、计算机可读介质及系统 |
CN107451854A (zh) * | 2017-07-12 | 2017-12-08 | 阿里巴巴集团控股有限公司 | 确定用户类型的方法及装置、电子设备 |
Cited By (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110765171B (zh) * | 2018-07-09 | 2022-06-21 | 武汉斗鱼网络科技有限公司 | 一种不良用户甄别方法、存储介质、电子设备及系统 |
CN110765171A (zh) * | 2018-07-09 | 2020-02-07 | 武汉斗鱼网络科技有限公司 | 一种不良用户甄别方法、存储介质、电子设备及系统 |
CN109151518A (zh) * | 2018-08-06 | 2019-01-04 | 武汉斗鱼网络科技有限公司 | 一种被盗账号的识别方法、装置及电子设备 |
CN109151518B (zh) * | 2018-08-06 | 2021-02-02 | 武汉斗鱼网络科技有限公司 | 一种被盗账号的识别方法、装置及电子设备 |
CN109003181B (zh) * | 2018-08-17 | 2022-05-13 | 腾讯科技(深圳)有限公司 | 可疑用户确定方法、装置、设备和计算机可读存储介质 |
CN109003181A (zh) * | 2018-08-17 | 2018-12-14 | 腾讯科技(深圳)有限公司 | 可疑用户确定方法、装置、设备和计算机可读存储介质 |
CN109255371B (zh) * | 2018-08-23 | 2021-06-15 | 武汉斗鱼网络科技有限公司 | 一种确定直播平台虚假关注用户的方法以及相关设备 |
CN109255371A (zh) * | 2018-08-23 | 2019-01-22 | 武汉斗鱼网络科技有限公司 | 一种确定直播平台虚假关注用户的方法以及相关设备 |
CN109255391A (zh) * | 2018-09-30 | 2019-01-22 | 武汉斗鱼网络科技有限公司 | 一种识别恶意用户的方法、装置及存储介质 |
CN109255391B (zh) * | 2018-09-30 | 2021-07-23 | 武汉斗鱼网络科技有限公司 | 一种识别恶意用户的方法、装置及存储介质 |
CN109257617B (zh) * | 2018-09-30 | 2021-11-09 | 武汉斗鱼网络科技有限公司 | 一种确定直播平台中嫌疑用户的方法以及相关设备 |
CN109257617A (zh) * | 2018-09-30 | 2019-01-22 | 武汉斗鱼网络科技有限公司 | 一种确定直播平台中嫌疑用户的方法以及相关设备 |
CN109451359A (zh) * | 2018-10-31 | 2019-03-08 | 武汉斗鱼网络科技有限公司 | 一种关注异常的检测方法、装置、设备和存储介质 |
CN109615461A (zh) * | 2018-11-09 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 目标用户识别方法、违规商户识别方法和装置 |
CN109615461B (zh) * | 2018-11-09 | 2022-04-29 | 创新先进技术有限公司 | 目标用户识别方法、违规商户识别方法和装置 |
CN110197375A (zh) * | 2018-11-28 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 一种相似用户识别方法、装置、相似用户识别设备和介质 |
CN109587248A (zh) * | 2018-12-06 | 2019-04-05 | 腾讯科技(深圳)有限公司 | 用户识别方法、装置、服务器及存储介质 |
CN109587248B (zh) * | 2018-12-06 | 2023-08-29 | 腾讯科技(深圳)有限公司 | 用户识别方法、装置、服务器及存储介质 |
CN109840778A (zh) * | 2018-12-21 | 2019-06-04 | 上海拍拍贷金融信息服务有限公司 | 欺诈用户的识别方法及装置、可读存储介质 |
CN109905722A (zh) * | 2019-02-21 | 2019-06-18 | 武汉瓯越网视有限公司 | 一种确定嫌疑节点的方法以及相关设备 |
CN109905722B (zh) * | 2019-02-21 | 2021-07-23 | 武汉瓯越网视有限公司 | 一种确定嫌疑节点的方法以及相关设备 |
CN110222297A (zh) * | 2019-06-19 | 2019-09-10 | 武汉斗鱼网络科技有限公司 | 一种标签用户的识别方法以及相关设备 |
CN110222297B (zh) * | 2019-06-19 | 2021-07-23 | 武汉斗鱼网络科技有限公司 | 一种标签用户的识别方法以及相关设备 |
CN110442801A (zh) * | 2019-07-26 | 2019-11-12 | 新华三信息安全技术有限公司 | 一种目标事件的关注用户的确定方法及装置 |
CN110427999A (zh) * | 2019-07-26 | 2019-11-08 | 武汉斗鱼网络科技有限公司 | 一种账号相关性评估方法、装置、设备及介质 |
CN110427999B (zh) * | 2019-07-26 | 2022-02-22 | 武汉斗鱼网络科技有限公司 | 一种账号相关性评估方法、装置、设备及介质 |
CN110442801B (zh) * | 2019-07-26 | 2021-11-19 | 新华三信息安全技术有限公司 | 一种目标事件的关注用户的确定方法及装置 |
CN112667961A (zh) * | 2019-10-16 | 2021-04-16 | 武汉斗鱼网络科技有限公司 | 一种识别广告弹幕发布者的方法及系统 |
CN111125192B (zh) * | 2019-12-20 | 2023-04-07 | 北京明略软件系统有限公司 | 一种确定对象之间相似度的方法和装置 |
CN111125192A (zh) * | 2019-12-20 | 2020-05-08 | 北京明略软件系统有限公司 | 一种确定对象之间相似度的方法和装置 |
CN111371767B (zh) * | 2020-02-20 | 2022-05-13 | 深圳市腾讯计算机系统有限公司 | 恶意账号识别方法、恶意账号识别装置、介质及电子设备 |
CN111371767A (zh) * | 2020-02-20 | 2020-07-03 | 深圳市腾讯计算机系统有限公司 | 恶意账号识别方法、恶意账号识别装置、介质及电子设备 |
CN111476510A (zh) * | 2020-06-23 | 2020-07-31 | 武汉斗鱼鱼乐网络科技有限公司 | 一种风险用户识别的方法及系统、存储介质、设备 |
CN112153221B (zh) * | 2020-09-16 | 2021-06-29 | 北京邮电大学 | 一种基于社交网络图计算的通信行为识别方法 |
CN112153221A (zh) * | 2020-09-16 | 2020-12-29 | 北京邮电大学 | 一种基于社交网络图计算的通信行为识别方法 |
WO2022068600A1 (zh) * | 2020-09-30 | 2022-04-07 | 百果园技术(新加坡)有限公司 | 异常用户检测模型训练方法、异常用户审核方法及装置 |
CN113159778A (zh) * | 2020-12-24 | 2021-07-23 | 西安四叶草信息技术有限公司 | 一种金融欺诈的检测方法及装置 |
CN113159778B (zh) * | 2020-12-24 | 2023-11-24 | 西安四叶草信息技术有限公司 | 一种金融欺诈的检测方法及装置 |
CN114302216A (zh) * | 2021-08-25 | 2022-04-08 | 上海哔哩哔哩科技有限公司 | 一种弹幕处理方法、装置、设备及系统 |
CN114302216B (zh) * | 2021-08-25 | 2024-03-22 | 上海哔哩哔哩科技有限公司 | 一种弹幕处理方法、装置、设备及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108174296B (zh) | 2019-09-10 |
WO2019134307A1 (zh) | 2019-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108174296A (zh) | 恶意用户识别方法及装置 | |
Cheng et al. | Staticgreedy: solving the scalability-accuracy dilemma in influence maximization | |
CN106355431B (zh) | 作弊流量检测方法、装置及终端 | |
US20180069883A1 (en) | Detection of Known and Unknown Malicious Domains | |
CN109151518B (zh) | 一种被盗账号的识别方法、装置及电子设备 | |
US20180330488A1 (en) | Muddy water detection using normalized semantic layers | |
CN109951725B (zh) | 一种直播间的推荐方法以及相关设备 | |
CN108390883A (zh) | 刷人气用户的识别方法、装置及终端设备 | |
CN109462612B (zh) | 一种僵尸网络中的攻击域名的确定方法及装置 | |
CN105391594A (zh) | 识别特征账号的方法及装置 | |
CN107968953A (zh) | 防作弊用户方法及装置 | |
CN109257617B (zh) | 一种确定直播平台中嫌疑用户的方法以及相关设备 | |
WO2023168856A1 (zh) | 一种关联场景推荐方法、装置、存储介质及电子装置 | |
CN110876072B (zh) | 一种批量注册用户识别方法、存储介质、电子设备及系统 | |
CN108090157B (zh) | 一种热点新闻挖掘方法、装置及服务器 | |
CN110222297B (zh) | 一种标签用户的识别方法以及相关设备 | |
CN113114631A (zh) | 一种物联网节点的信任度评价方法、装置、设备及介质 | |
CN108595685A (zh) | 一种数据处理方法及装置 | |
CN106257449A (zh) | 一种信息确定方法和装置 | |
CN110210885B (zh) | 挖掘潜在客户的方法、装置、设备及可读存储介质 | |
CN108495150B (zh) | 一种视频点击满意度的确定方法及装置 | |
CN112667961A (zh) | 一种识别广告弹幕发布者的方法及系统 | |
CN112543199B (zh) | Ip异常流量检测方法、系统、计算机设备及存储介质 | |
CN109905722B (zh) | 一种确定嫌疑节点的方法以及相关设备 | |
CN109995613B (zh) | 流量计算方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |