发明内容
本发明实施例的目的在于提供一种收入异常主播用户的识别方法、装置及电子设备,以提高识别收入异常主播用户的准确率。具体技术方案如下:
第一方面,本发明实施例提供了一种收入异常主播用户的识别方法,包括:
根据已访问直播平台的观众用户的充值记录,确定正常充值观众用户;
根据已访问直播平台的观众用户的访问记录,确定待定异常观众用户;
获得正常充值观众用户调用功能接口的第一频繁项集和待定异常观众用户调用功能接口的第二频繁项集;
所述第一频繁项集中包括:正常充值观众用户频繁使用的功能接口的信息;所述第二频繁项集中包括:待定异常观众用户频繁使用的功能接口的信息;
将所述第二频繁项集与所述第一频繁项集进行比较,获得第二频繁项集中与第一频繁项集不同的功能接口作为差异功能接口;
将满足预设异常接口条件的所述差异功能接口确定为异常功能接口;
将调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户;
获得直播平台的各个主播用户的收益记录;
根据各个主播用户的收益记录中来源于异常观众用户的信息,将满足异常来源条件的主播用户,识别为异常主播用户。
可选的,所述根据已访问直播平台的观众用户的充值记录,确定正常充值观众用户的步骤,包括:
将预定时间段内的充值金额满足预设金额阈值的观众用户,确定为正常充值观众用户。
可选的,所述根据已访问直播平台的观众用户的访问记录,确定待定异常观众用户的步骤,包括:
针对观众用户使用的每个IP地址,统计使用该IP地址的观众用户的第一数量;
将第一数量超过预设用户数量阈值的IP地址,确定为异常IP地址;
将使用所述异常IP地址的观众用户,确定为待定异常观众用户。
可选的,所述第一频繁项集中,正常充值观众用户频繁使用的功能接口的信息,包括:正常充值观众用户频繁使用的各个功能接口及各个功能接口被调用的次数;
所述第二频繁项集中,待定异常观众用户频繁使用的功能接口的信息,包括:待定异常观众用户频繁使用的各个功能接口及各个功能接口被调用的次数;
所述获得正常充值观众用户调用功能接口的第一频繁项集的步骤,包括:
统计所有正常充值观众用户调用的各个第一功能接口,以及每个第一功能接口被调用的次数,加入第一正常充值观众用户集合;
从第一正常充值观众用户中查找出被调用次数大于预设调用次数阈值的各个第二功能接口,确定为第一正常充值观众用户候选集合;
针对第一正常充值观众用户集合和第一正常充值观众用户候选集合,采用预设的Apriori算法及预设的支持度阈值,计算获得正常充值观众用户调用功能接口的第一频繁项集;
所述获得待定异常观众用户调用功能接口的第二频繁项集的步骤,包括:
统计所有待定异常观众用户调用的各个第二功能接口,以及每个第二功能接口被调用的次数,加入第一待定异常观众用户集合;
从第一待定异常观众用户集合中查找出被调用次数大于预设次数阈值的第四功能接口,确定为第一待定异常观众用户候选集合;
针对第一待定异常观众用户集合和第一待定异常观众用户候选集合,采用预设的Apriori算法及预设的支持度阈值,计算获得待定异常观众用户调用功能接口的第二频繁项集。
可选的,所述将所述第二频繁项集与所述第一频繁项集进行比较,获得第二频繁项集中与第一频繁项集不同的功能接口作为差异功能接口的步骤,包括:
获得在第二频繁项集中功能接口与第一频繁项集中功能接口之间的接口类型数量差异值;
获得第二频繁项集中与第一频繁项集中各个相同功能接口的调用次数差异值;
将满足预设异常接口条件的所述差异功能接口确定为异常功能接口的步骤,包括:
若第二频繁项集中与第一频繁项集中功能接口类型及数量完全相同,判断是否存在一个相同功能接口的调用次数差异值超过第一次数阈值;
若存在一个相同功能接口的调用次数差异值超过第一次数阈值,将第二频繁项集中功能接口的调用次数差异值超过第一次数阈值的功能接口确定为异常功能接口;
或者,若第二频繁项集中与第一频繁项集中功能接口类型及数量不完全相同,判断第二频繁项集中与第一频繁项集中的功能接口类型数量差异值是否超过数量阈值;
若所述第二频繁项集中与第一频繁项集中的功能接口类型数量差异值超过数量阈值,将第二频繁项集中与第一频繁项集中不同的功能接口确定为异常功能接口;
或者,若第二频繁项集中与第一频繁项集中的功能接口类型数量差异值没有超过数量阈值,则判断第二频繁项集中与第一频繁项集中是否存在一个相同功能接口的调用次数差异值超过第二次数阈值;
若第二频繁项集中与第一频繁项集中存在一个相同功能接口的调用次数差异值超过第二次数阈值,将第二频繁项集中相同功能接口的调用次数差异值超过第二次数阈值的功能接口确定为异常功能接口。
可选的,所述将调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户的步骤之前包括:
根据已访问直播平台的观众用户的访问记录,获取从平台获取收益的所述观众用户的收益记录;
所述将调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户的步骤,为:
根据所述观众用户的收益记录,将每个从平台获取过收益且调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户。
可选的,所述根据所述观众用户的收益记录,将每个从平台获取过收益且调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户的步骤,包括:
根据所述观众用户的收益记录,为每个从平台获取收益且调用过所述异常功能接口的目标观众用户设置第一预设风险值;
获得与所述目标观众用户使用相同的注册IP地址的同IP观众用户数量;
为同IP观众用户数量大于预设第一用户数量阈值的目标观众用户设置第二预设风险值;
获取与所述目标观众用户获取收益时使用相同的IP地址及房间号的同IP及房间号的观众用户数量;
为同IP及房间号的观众用户数量大于预设第二用户数量阈值的目标观众用户设置第三预设风险值;
判断每个目标观众用户的风险值总和是否超过预设风险阈值;
将风险值总和超过风险阈值的各个目标观众用户,确定为异常观众用户。
可选的,所述根据各个主播用户的收益记录中来源于异常观众用户的信息,将满足异常来源条件的主播用户,识别为异常主播用户的步骤,包括:
获取各个主播用户的收益记录中异常观众用户的数量和总观众用户数量;
判断异常观众用户的数量占总观众用户的数量的比例,是否大于预设的第一比例,如果是,则将所述主播用户识别为异常主播用户。
可选的,所述根据各个主播用户的收益记录中来源于异常观众用户的信息,将满足异常来源条件的主播用户,识别为异常主播用户的步骤,包括:
获得各个主播用户的总收益值,以及来源于异常观众用户的收益值;
判断所述来源于异常观众用户的收益值占总收益值的比例,是否大于预设的第二比例,如果是,则将所述主播用户识别为异常主播用户。
可选的,将主播用户识别为异常主播用户之后,还包括:
将异常主播用户的收益中,来源于异常观众用户的收益值确定为异常收益。
可选的,将异常主播用户的收益中,来源于异常观众用户的收益值确定为异常收益该方法还包括:
当接收到异常主播用户针对收益中异常收益的处理请求时,拒绝该收益处理请求。
第二方面,本发明实施例提供了一种收入异常主播用户的识别的装置,其特征在于,所述装置包括:
正常充值用户确定模块,用于根据已访问直播平台的观众用户的充值记录,确定正常充值观众用户;
待定异常用户确定模块,用于根据已访问直播平台的观众用户的访问记录,待定异常观众用户;
频繁项集获取模块,用于获得正常充值观众用户调用功能接口的第一频繁项集和待定异常观众用户调用功能接口的第二频繁项集;所述第一频繁项集中包括:正常充值观众用户频繁使用的功能接口的信息;所述第二频繁项集中包括:待定异常观众用户频繁使用的功能接口的信息;
比较模块,用于将所述第二频繁项集与所述第一频繁项集进行比较,获得第二频繁项集中与第一频繁项集不同的功能接口作为差异功能接口;
异常功能接口确定模块,用于将满足预设异常接口条件的所述差异功能接口确定为异常功能接口;
异常观众用户确定模块,用于将调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户;
收益记录获取模块,用于获得直播平台的各个主播用户的收益记录;
异常主播用户识别模块,用于根据各个主播用户的收益记录中来源于异常观众用户的信息,将满足异常来源条件的主播用户,识别为异常主播用户。
可选的,所述正常充值用户确定模块,具体用于:将预定时间段内的充值金额满足预设金额阈值的观众用户,确定为正常充值观众用户。
可选的,所述待定异常用户确定模块,具体用于:针对观众用户使用的每个IP地址,统计使用该IP地址的观众用户的第一数量;
将第一数量超过预设用户数量阈值的IP地址,确定为异常IP地址;
将使用所述异常IP地址的观众用户,确定为待定异常观众用户。
可选的,所述第一频繁项集中,正常充值观众用户频繁使用的功能接口的信息,包括:正常充值观众用户频繁使用的各个功能接口及各个功能接口被调用的次数;
所述第二频繁项集中,待定异常观众用户频繁使用的功能接口的信息,包括:待定异常观众用户频繁使用的各个功能接口及各个功能接口被调用的次数;
所述频繁项集获取模块,包括:第一频繁项集获取子模块和第二频繁项集获取子模块;
所述第一频繁项集获取子模块,具体用于:
统计所有正常充值观众用户调用的各个第一功能接口,以及每个第一功能接口被调用的次数,加入第一正常充值观众用户集合;
从第一正常充值观众用户集合中查找出被调用次数大于预设调用次数阈值的各个第二功能接口,确定为第一正常充值观众用户候选集合;
针对第一正常充值观众用户集合和第一正常充值观众用户候选集合,采用预设的Apriori算法及预设的支持度阈值,计算获得正常充值观众用户调用功能接口的第一频繁项集;
所述第二频繁项集获取子模块,具体用于:
统计所有待定异常观众用户调用的各个第三功能接口,以及每个第三功能接口被调用的次数,加入第一待定异常观众用户集合;
从第一待定异常观众用户集合中查找出被调用次数大于预设次数阈值的第四功能接口,确定为第一待定异常观众用户候选集合;
针对第一正常充值观众用户集合和第一待定异常观众用户候选集合,采用预设的Apriori算法及预设的支持度阈值,计算获得待定异常观众用户调用功能接口的第二频繁项集。
可选的,所述比较模块,包括:
功能类型差异获取子模块,具体用于:获得在第二频繁项集中功能接口与第一频繁项集中功能接口之间的接口类型数量差异值;
调用次数差异获取子模块,具体用于:获得在第二频繁项集中功能接口与第一频繁项集中各个相同功能接口调用次数差异值;
所述异常功能接口确定模块,具体用于:
若第二频繁项集中与第一频繁项集中功能接口类型及数量完全相同,判断是否存在一个相同功能接口的调用次数差异值超过第一次数阈值;
若存在一个相同功能接口的调用次数差异值超过第一次数阈值,将第二频繁项集中功能接口的调用次数差异值超过第一次数阈值的功能接口确定为异常功能接口;
或者,若第二频繁项集中与第一频繁项集中功能接口类型及数量不完全相同,判断第二频繁项集中与第一频繁项集中的功能接口类型数量差异值是否超过数量阈值;
若所述第二频繁项集中与第一频繁项集中的功能接口类型数量差异值超过数量阈值,将第二频繁项集中与第一频繁项集中不同的功能接口确定为异常功能接口;
或者,若第二频繁项集中与第一频繁项集中的功能接口类型数量差异值没有超过数量阈值,则判断第二频繁项集中与第一频繁项集中是否存在一个相同功能接口的调用次数差异值超过第二次数阈值;
若第二频繁项集中与第一频繁项集中存在一个相同功能接口的调用次数差异值超过第二次数阈值,将第二频繁项集中相同功能接口的调用次数差异值超过第二次数阈值的功能接口确定为异常功能接口。
可选的,所述异常观众用户确定模块,具体用于:根据已访问直播平台的观众用户的访问记录,获取从平台获取收益的所述观众用户的收益记录;
根据所述观众用户的收益记录,将每个从平台获取过收益且调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户。
可选的,所述异常观众用户确定模块包括:
收益记录获取子模块,用于根据已访问直播平台的观众用户的访问记录,获取从平台获取收益的所述观众用户的收益记录;
第一设置子模块,用于根据所述观众用户的收益记录,为每个从平台获取收益且调用过所述异常功能接口的目标观众用户设置第一预设风险值;
第一数量获取子模块,用于获得与所述目标观众用户使用相同的注册IP地址的同IP观众用户数量;
第二设置子模块,用于将同IP观众用户数量大于预设阈值的所述目标观众用户设置第二预设风险值;
第二数量获取子模块,用于获取与所述目标观众用户获取收益时使用相同的IP地址及房间号的同IP及房间号的观众用户数量;
第三设置子模块,用于为同IP及房间号的观众用户数量大于预设第二用户数量阈值的目标观众用户设置第三预设风险值;
风险判断子模块,用于判断每个目标观众用户的风险值总和是否超过预设风险阈值;
异常观众用户确定子模块,用于将风险值总和超过风险阈值的各个目标观众用户,确定为异常观众用户。
可选的,获取各个主播用户的收益记录中异常观众用户的数量和总观众用户数量;
判断异常观众用户的数量占总观众用户的数量的比例,是否大于预设的比例,如果来源于异常观众用户的收益值占总收益值的比例大于预设的第二比例,则将所述主播用户识别为异常主播用户。
可选的,所述异常主播用户识别模块,具体用于:
获得各个主播用户的总收益值,以及来源于异常观众用户的收益值;
判断所述来源于异常观众用户的收益值占总收益值的比例,是否大于预设的比例,如果是,则将所述主播用户识别为异常主播用户。
可选的,所述异常主播用户识别模块还包括:
收益确定子模块,具体用于:将异常主播用户的收益中,来源于异常观众用户的收益值确定为异常收益。
可选的,所述异常主播用户识别模块还包括:
请求处理子模块,具体用于:当接收到异常主播用户针对收益中的异常收益处理请求时,拒绝该收益处理请求。
在本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的一种收入异常主播用户的识别方法。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的一种收入异常主播用户的识别方法。
在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的一种收入异常主播用户的识别方法。
本发明实施例提供的一种收入异常主播用户的识别方法及装置,通过确定正常充值观众用户和待定异常观众用户,对比所述正常充值观众用户和待定异常观众用户的接口差异值确定异常功能接口,将调用过异常功能接口且满足预设异常行为条件的观众用户确定为异常观众用户,根据主播收益记录中来源于异常观众用户的信息,将满足异常来源条件的主播用户,识别为异常主播用户。可见,本方案可以智能识别收入异常主播,避免了因人工识别导致的错误,提升了识别收入异常主播的准确度。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例所提供的一种收入异常主播用户的识别方法,可以包括如下步骤:
S101,根据已访问直播平台的观众用户的充值记录,确定正常充值观众用户;
其中,已访问直播平台的观众用户的充值记录可以是存储在直播平台数据库中的历史充值记录或者实时充值记录,可以包括观众用户充值的金额、充值时的时间和充值时所使用的IP地址等信息。
通过观众用户充值的金额、充值时的时间和充值时所使用的IP地址信息可以区分正常观众用户与非正常观众用户,从而为确定异常观众用户作参考。
可以理解的,异常观众用户会模仿正常用户的行为方式充值,异常观众用户充值的记录中IP地址信息差异比较大、充值金额会相对较少,根据观众用户充值记录确定正常用户,可以快速直观的区分正常观众用户和非正常观众用户。
可选的,S101可以根据如下步骤实现:
根据已访问直播平台的观众用户的充值记录,将预定时间段内的充值金额满足预设金额阈值的观众用户,确定为正常充值观众用户。
其中,预定时间段是提前任意设定的时间段,例如一天、一周、一个月或一年等等。例如:某直播网站,会员用户的一年的金额规定为100元,例如,1年内充值满100的用户确定是正常充值观众用户。
S102,根据已访问直播平台的观众用户的访问记录,确定待定异常观众用户;
其中,已访问直播平台的观众用户的访问记录可以是存储在直播平台数据库中的历史访问记录或者实时访问记录,可以包括:观众用户访问直播平台所使用的IP地址、访问的时间和访问所使用的功能接口信息。
不良主播用户利用黑客技术模拟观众用户手段就是使用相同的IP地址登录多个用户账号。本步骤中针对这种情况,根据使用同一个IP地址的观众用户的数量来确定待定异常观众用户。
具体的,S102可以根据如下步骤实现:
第一步,针对观众用户使用的每个IP地址,统计使用该IP地址的观众用户的第一数量;
第二步,将第一数量超过预设用户数量阈值的IP地址,确定为异常IP地址;
第三步,将使用所述异常IP地址的观众用户,确定为待定异常观众用户。
S103,获得正常充值观众用户调用功能接口的第一频繁项集和待定异常观众用户调用功能接口的第二频繁项集,
其中,所述第一频繁项集中包括:正常充值观众用户频繁使用的功能接口的信息;所述第二频繁项集中包括:待定异常观众用户频繁使用的功能接口的信息;
S104,将所述第二频繁项集与所述第一频繁项集进行比较,获得第二频繁项集中与第一频繁项集不同的功能接口作为差异功能接口;
可选的,S104可以根据如下步骤实现:
第一步,获得第二频繁项集中功能接口与第一频繁项集中功能接口之间的接口数量差异值;
第二步,获得在第二频繁项集中功能接口与第一频繁项集中功能接口之间的接口类型数量差异值;
第三步,获得第二频繁项集中与第一频繁项集中各个相同功能接口的调用次数差异值;
S105,将满足预设异常接口条件的所述差异功能接口确定为异常功能接口;
S106,将调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户;
S107,获得直播平台的各个主播用户的收益记录;
其中,各个主播用户的收益记录中可以包含主播收益的第一总金额,各个观众用户的赠送的第一收益金额和访问所述主播用户的总观众用户的数量。
例如,主播用户A的收益记录中包含,主播用户A的收益总金额900元,观众用户1赠送100元,观众用户2赠送500元,观众用户3赠送300元,总观众用户数量3。
S108,根据各个主播用户的收益记录中来源于异常观众用户的信息,将满足异常来源条件的主播用户,识别为异常主播用户。
其中,所述异常观众用户的信息包括,异常观众用户的数量和异常观众用户赠送的第二收益金额。
可选的,S108,可以根据如下步骤实现:
获取各个主播用户的收益记录中异常观众用户的数量和总观众用户数量;
判断异常观众用户的数量占总观众用户的数量的比例,是否大于预设的第一比例,如果是,则将所述主播用户识别为异常主播用户。
例如,主播用户A的收益记录中包括:观众用户1赠送100元,观众用户2赠送500元,观众用户3赠送300元,总观众用户数量3人。假如,观众用户1和观众用户2是异常观众用户,异常观众用户数量是2,预设的第一比例设置为异常观众用户数量2与总观众用户数量3比值大于主播用户A是异常主播用户。
可选的,S108,还可以根据如下步骤实现:
获得各个主播用户的总收益值,以及来源于异常观众用户的收益值;
判断所述来源于异常观众用户的收益值占总收益值的比例,是否大于预设的第二比例,如果是,则将所述主播用户识别为异常主播用户。
例如,主播用户B的收益记录中包括:观众用户4赠送100元,观众用户5赠送500元,观众用户6赠送300元,总观众用户数量3人。假如,观众用户4和观众用户5是异常观众用户,主播用户B收益来源中有600元是异常观众用户赠送,预设的第二比例设置为来源于异常观众用户的收益600元与来源于总观众用户的收益900比值大于主播用户B是异常主播用户。
可选的,S108步骤实现之后还包括:
将异常主播用户的收益中,来源于异常观众用户的收益值确定为异常收益;
当接收到异常主播用户针对收益中异常收益的处理请求时,拒绝该收益处理请求。
例如,主播用户B是异常主播用户,主播用户B收益记录中有600元是来源于异常观众用户,将主播用户B收益记录中有600元记录为异常收入。当主播用户B从直播平台转出自己总收益中的异常收入600元,会将主播用户B发送的转出600元异常收入的请求拒绝或者忽略,不做处理。
在本实施例实现的过程中,可选的,步骤S103可以通过以下方式获得所述第一频繁项集和所述第二频繁项集。
可选的,如图2,获得所述第一频繁项集可以根据以下步骤实现:
S201,统计所有正常充值观众用户调用的各个第一功能接口,以及每个第一功能接口被调用的次数,加入第一正常充值观众用户集合;
S202,从第一正常充值观众用户中查找出被调用次数大于预设调用次数阈值的各个第二功能接口,确定为第一正常充值观众用户候选集合;
S203,针对第一待定异常观众用户集合和第一正常充值观众用户候选集合,采用预设的Apriori算法及预设的支持度阈值,计算获得正常充值观众用户调用功能接口的第一频繁项集。
其中,预设的支持度阈值是预先设定的一个数值。
Apriori算法是一种常见的计算频繁项集的算法,支持度阈值该算法中一个重要的参数,首先查找出被调用次数大于预设调用次数阈值的各个第二功能接口,确定为第一正常充值观众用户候选集合,再利用Apriori算法进行计算第一频繁项集,排除了不应该参与后续组合的接口元素,减少了数据运算量。
例如:假设a正常充值观众用户同时调用了打卡接口、点赞接口及赠送接口各100次;b正常充值观众用户同时调用了赠送接口及点赞接口各90次,c正常充值观众用户同时调用了充值接口、打卡接口及点赞接口各40次。
A、第一正常充值观众用户集合包括{打卡接口100次,点赞接口100次,赠送接口100次;赠送接口90次,点赞接口90次;充值接口40次,打卡接口40次,点赞接口40次},若设置的预设调用次数阈值是100次,第一正常充值观众用户候选集合包括:{打卡接口140次;点赞接口140次;赠送接口190次}。
B、利用第一正常充值观众用户候选集合自身连接产生集合L1,L1包括:{打卡接口140次,点赞接口140次;点赞接口140次,赠送接口190次;赠送接口190次,打卡接口140次};
C、计算L1集合中每项的支持度,L1集合第一项支持度是第二项支持度是第三项支持度是设置支持度阈值为
D、将L1集合中大于支持度阈值的集合项选出组成第二正常充值观众用户候选集合,例如,本次第二正常充值观众用户候选集合包括:{打卡接口140次,点赞接口140次;点赞接口140次,赠送接口190次};
E、利用第二正常充值观众用户候选集合自身连接产生集合L2,例如,本次L2包括:{打卡接口140次,点赞接口140次,赠送接口190次};
F、计算L2集合的支持度,重复返回D,直至产生的正常充值观众用户候选集合不满足Apriori定理,也就是说第N个正常充值观众用户候选集合项为空,将第N-1个正常充值观众用户候选集合作为第一频繁项集,其中N是正整数。需要说明的是每次重复计算过程产生的正常充值观众用户候选集合和集合项支持度与上次不同。
可以理解的是,观众用户访问平台会使用功能接口,正常观众用户使用功能接口的数量、接口的类型及不同功能接口的频次都比较固定,通过观众用户使用的接口情况,可以将观众用户使用功能接口的类型数量、接口的类型及不同功能接口的频次超过阈值的功能接口确定为异常功能接口。
可选的,如图3,获得所述第二频繁项集可以根据以下步骤实现:
S301,统计所有待定异常观众用户调用的各个第二功能接口,以及每个第二功能接口被调用的次数,加入第一待定异常观众用户集合;
S302,从第一待定异常观众用户集合中查找出被调用次数大于预设次数阈值的第四功能接口,确定为第一待定异常观众用户候选集合;
S303,针对第一待定异常观众用户集合和第一待定异常观众用户候选集合,采用预设的Apriori算法及预设的支持度阈值,计算获得待定异常观众用户调用功能接口的第二频繁项集。
需要说明的是,计算获得第二频繁项集的算法与获得第一频繁项集采用的算法相同,在此处不一一列举。
在本实施例实现的过程中,可选的,步骤S105,将满足预设异常接口条件的所述差异功能接口确定为异常功能接口,可以根据以下步骤实现:
若第二频繁项集中与第一频繁项集中功能接口类型及数量完全相同,判断是否存在一个相同功能接口的调用次数差异值超过第一次数阈值;
若存在一个相同功能接口的调用次数差异值超过第一次数阈值,将第二频繁项集中功能接口的调用次数差异值超过第一次数阈值的功能接口确定为异常功能接口;
或者,若第二频繁项集中与第一频繁项集中功能接口类型及数量不完全相同,判断第二频繁项集中与第一频繁项集中的功能接口类型数量差异值是否超过数量阈值;
若所述第二频繁项集中与第一频繁项集中的功能接口类型数量差异值超过数量阈值,将第二频繁项集中与第一频繁项集中不同的功能接口确定为异常功能接口;
或者,若第二频繁项集中与第一频繁项集中的功能接口类型数量差异值没有超过数量阈值,则判断第二频繁项集中与第一频繁项集中是否存在一个相同功能接口的调用次数差异值超过第二次数阈值;
若第二频繁项集中与第一频繁项集中存在一个相同功能接口的调用次数差异值超过第二次数阈值,将第二频繁项集中相同功能接口的调用次数差异值超过第二次数阈值的功能接口确定为异常功能接口。
下面,举2个实例来详细说明。
实例一:例如,第二频繁项集合包括:{打卡接口10次;观看直播接口5次;关注主播接口8};第一频繁项集合包括{打卡接口5次;观看直播接口4次;关注主播接口6}。
第二频繁项集中与第一频繁项集功能接口类型及数量完全相同,都有打卡接口、观看直播接口及关注主播接口。这种情况下,直接判断所述是否存在一个相同功能接口的调用次数差异值超过次数阈值。假设,预先设置的第一次数阈值为3。先计算出每种功能接口的次数差异值:打卡接口差异值是5,观看直播接口的差异值是1;关注主播接口差异值是2。打卡接口的差异值超过了第一次数阈值3。也就是说,这个实例中存在一个相同功能接口的调用次数差异值超过次数阈值。此时,打卡接口就被确定为异常功能接口。
实例二:例如,第二频繁项集合包括:{打卡接口10次;观看直播接口5次;赠送礼物接口11次;充值接口20次;评论接口5次}。第一频繁项集合包括{关注主播接口10次;赠送礼物接口7次}。
第二频繁项集合与第一频繁项集合中功能接口类型及数量不完全相同,这种情况下,先判断功能接口类型数量差异值是否超过数量阈值。
第二频繁项集合与第一频繁项集合中功能接口类型数量差异值是5,如果预设数量阈值是2,也就是说,这个实例中功能接口类型数量差异值超过了预定的数量阈值,第二频繁项集合中的打卡接口、观看直播接、充值接口及评论接口与第一频繁项集合中的不同,则确定第二频繁项集合中的打卡接口、观看直播接、充值接口及评论接口是异常功能接口。
如果第二频繁项集合与第一频繁项集合中功能接口类型数量差异值没有超过数量阈值,这种情况下,需要判断第二频繁项集中与第一频繁项集中是否存在一个相同功能接口的调用次数差异值超过第二次数阈值。
为了充分说明,这里继续使用上述实例二中的第二频繁项集合与第一频繁项集合的数据举例。
第二频繁项集合与第一频繁项集合中功能接口类型数量差异值是5,如果预设数量阈值是7,也就是说,这个实例中功能接口类型数量差异值没有超过阈值,此时需要再判断第二频繁项集中与第一频繁项集中是否存在一个相同功能接口的调用次数差异值超过次数阈值;假设,预先设置的第二次数阈值为3,赠送礼物接口的差异值是4。也就是说,这个实例中存在一个相同功能接口的调用次数差异值超过第二次数阈值。此时,赠送礼物接口就被确定为异常功能接口。
可以理解的是,通过第二频繁项集合中与第一频繁项集中接口的不同情况,分别对比功能接口类型数量差异值及相同功能接口的调用次数差异值是否超过各自阈值。避免因为不同情况设置同一条件,识别异常功能接口发生错误识别的机率,提高了识别异常功能接口的准确率。
在本实施例实现的过程中,可选的,步骤S106,将调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户,可以根据如下步骤实现:
第一步,根据已访问直播平台的观众用户的访问记录,获取从平台获取收益的所述观众用户的收益记录;
第二步,根据所述观众用户的收益记录,将每个调用过所述异常功能接口并且从平台获取过收益的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户。
在本实施例实现的过程中,可选的,如图4,步骤S106,将调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户,还可以根据如下步骤实现:
S401,根据已访问直播平台的观众用户的访问记录,获取从平台获取收益的所述观众用户的收益记录;
S402,根据所述观众用户的收益记录,为每个从平台获取收益且调用过所述异常功能接口的目标观众用户设置第一预设风险值;
S403,获得与所述目标观众用户使用相同的注册IP地址的同IP观众用户数量;
S404,为同IP观众用户数量大于预设第一用户数量阈值的目标观众用户设置第二预设风险值;
S405,获取与所述目标观众用户获取收益时使用相同的IP地址及房间号的同IP及房间号的观众用户数量;
S406,为同IP及房间号的观众用户数量大于预设第二用户数量阈值的目标观众用户设置第三预设风险值;
S407,判断每个目标观众用户的风险值总和是否超过预设风险阈值;
S408,将风险值总和超过风险阈值的各个目标观众用户,确定为异常观众用户。
例如:在观众用户访问记录中,记载了有从平台通过抢红包及收取礼物的方式得到了收益的记录。假如,观众用户1、观众用户2、观众用户3及观众用户4都从平台获取了收益;观众用户1还调用过异常功能接口,则观众用户1可以设置第一预设风险值20;观众用户1使用的注册IP地址是A,观众用户2和观众用户3使用的注册IP地址也是A,使用的注册IP地址A观众用户数量是3,大于设置的第一用户数量阈值2,观众用户1可以设置第二预设风险值30;观众用户1在获取收益时使用IP地址是B,而且访问的房间号是1000,观众用户2在获取收益时使用IP地址也是B,而且访问的房间号也是1000,则获取收益时使用IP地址也是B,而且访问的房间号是1000观众用户数量是2,大于设置的第二用户数量阈值1,观众用户1可以设置第三预设风险值25;观众用户1风险值总和是75,大于设置的预设风险阈值60,确定观众用户1为异常观众用户。
可以理解的是,设置第一、第二及第三预设风险值,根据目标观众用户风险值总和是否超过预设风险阈值,确定异常观众用户的方式,在多次设置目标观众用户预设风险值的情况下,可以提高确定异常观众用户的准确度。
相应于上述方法实施例,本发明实施例所提供的一种收入异常主播用户的识别装置。如图5所示,该识别装置包括:
正常充值用户确定模块501,用于根据已访问直播平台的观众用户的充值记录,确定正常充值观众用户。
待定异常用户确定模块502,用于根据已访问直播平台的观众用户的访问记录,待定异常观众用户;
频繁项集获取模块503,用于获得正常充值观众用户调用功能接口的第一频繁项集和待定异常观众用户调用功能接口的第二频繁项集;所述第一频繁项集中包括:正常充值观众用户频繁使用的功能接口的信息;所述第二频繁项集中包括:待定异常观众用户频繁使用的功能接口的信息;
比较模块504,用于将所述第二频繁项集与所述第一频繁项集进行比较,获得第二频繁项集中与第一频繁项集不同的功能接口作为差异功能接口;
异常功能接口确定模块505,用于将满足预设异常接口条件的所述差异功能接口确定为异常功能接口;
异常观众用户确定模块506,用于将调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户;
收益记录获取模块507,用于获得直播平台的各个主播用户的收益记录;
异常主播用户识别模块508,用于根据各个主播用户的收益记录中来源于异常观众用户的信息,将满足异常来源条件的主播用户,识别为异常主播用户。
具体的,所述正常充值用户确定模块501,具体用于:将预定时间段内的充值金额满足预设金额阈值的观众用户,确定为正常充值观众用户。
具体的,所述待定异常用户确定模块502,具体用于:针对观众用户使用的每个IP地址,统计使用该IP地址的观众用户的第一数量;
将第一数量超过预设用户数量阈值的IP地址,确定为异常IP地址;
将使用所述异常IP地址的观众用户,确定为待定异常观众用户。
具体的,所述频繁项集获取模块包括:第一频繁项集获取子模块,具体用于:
统计所有正常充值观众用户调用的各个第一功能接口,以及每个第一功能接口被调用的次数,加入第一正常充值观众用户集合;
从第一正常充值观众用户集合中查找出被调用次数大于预设调用次数阈值的各个第二功能接口,确定为第一正常充值观众用户候选集合;
针对第一正常充值观众用户集合和第一正常充值观众用户候选集合,采用预设的Apriori算法及预设的支持度阈值,计算获得正常充值观众用户调用功能接口的第一频繁项集;
第二频繁项集获取子模块,具体用于:
统计所有待定异常观众用户调用的各个第三功能接口,以及每个第三功能接口被调用的次数,加入第一待定异常观众用户集合;
从第一待定异常观众用户集合中查找出被调用次数大于预设次数阈值的第四功能接口,确定为第一待定异常观众用户候选集合;
针对第一待定异常观众用户集合和第一待定异常观众用户候选集合,采用预设的Apriori算法及预设的支持度阈值,计算获得待定异常观众用户调用功能接口的第二频繁项集。
具体的,所述比较模块包括:数量差异获取子模块,具体用于:获得在第二频繁项集中功能接口与第一频繁项集中功能接口之间的接口类型数量差异值;
调用次数差异获取子模块,具体用于:获得在第一频繁项集与在第二频繁项集中各个相同功能接口的调用次数差异值;
所述异常功能接口确定模块,具体用于:
若第二频繁项集中与第一频繁项集中功能接口类型及数量完全相同,判断是否存在一个相同功能接口的调用次数差异值超过第一次数阈值;
若存在一个相同功能接口的调用次数差异值超过第一次数阈值,将第二频繁项集中功能接口的调用次数差异值超过第一次数阈值的功能接口确定为异常功能接口;
或者,若第二频繁项集中与第一频繁项集中功能接口类型及数量不完全相同,判断第二频繁项集中与第一频繁项集中的功能接口类型数量差异值是否超过数量阈值;
若所述第二频繁项集中与第一频繁项集中的功能接口类型数量差异值超过数量阈值,将第二频繁项集中与第一频繁项集中不同的功能接口确定为异常功能接口;
或者,若第二频繁项集中与第一频繁项集中的功能接口类型数量差异值没有超过数量阈值,则判断第二频繁项集中与第一频繁项集中是否存在一个相同功能接口的调用次数差异值超过第二次数阈值;
若第二频繁项集中与第一频繁项集中存在一个相同功能接口的调用次数差异值超过第二次数阈值,将第二频繁项集中相同功能接口的调用次数差异值超过第二次数阈值的功能接口确定为异常功能接口。
具体的,所述异常观众用户确定模块,具体用于:根据已访问直播平台的观众用户的访问记录,获取从平台获取收益的所述观众用户的收益记录;
根据所述观众用户的收益记录,将每个从平台获取过收益且调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众用户确定为异常观众用户。
具体的,所述异常观众用户确定模块可以包括:
收益记录获取子模块,具体用于:根据已访问直播平台的观众用户的访问记录,获取从平台获取收益的所述观众用户的收益记录;
第一设置子模块,具体用于:根据所述观众用户的收益记录,为每个从平台获取收益且调用过所述异常功能接口的目标观众用户设置第一预设风险值;
第一数量获取子模块,具体用于:获得与所述目标观众用户使用相同的注册IP地址的同IP观众用户数量;
第二设置子模块,具体用于:将同IP观众用户数量大于预设阈值的所述目标观众用户设置第二预设风险值;
第二数量获取子模块,具体用于:获取与所述目标观众用户获取收益时使用相同的IP地址及房间号的同IP及房间号的观众用户数量;
第三设置子模块,具体用于:为同IP及房间号的观众用户数量大于预设第二用户数量阈值的目标观众用户设置第三预设风险值;
风险判断子模块,具体用于:判断每个目标观众用户的风险值总和是否超过预设风险阈值;
异常观众用户确定子模块,具体用于:将风险值总和超过风险阈值的各个目标观众用户,确定为异常观众用户。
具体的,所述异常主播用户识别模块,具体用于:
获取各个主播用户的收益记录中异常观众用户的数量和总观众用户数量;
判断异常观众用户的数量占总观众用户的数量的比例,是否大于预设的比例,如果来源于异常观众用户的收益值占总收益值的比例大于预设的第二比例,则将所述主播用户识别为异常主播用户。
具体的,所述异常主播用户识别模块,具体用于:
获得各个主播用户的总收益值,以及来源于异常观众用户的收益值;
判断所述来源于异常观众用户的收益值占总收益值的比例,是否大于预设的比例,如果是,则将所述主播用户识别为异常主播用户。
具体的,所述异常主播用户识别模块还可以包括:
收益确定子模块,具体用于:将异常主播用户的收益中,来源于异常观众用户的收益值确定为异常收益。
请求处理子模块,具体用于:当接收到异常主播用户针对收益中的异常收益处理请求时,拒绝该收益处理请求。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601、通信接口602、存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行处理器601上所存放的程序时,实现如下步骤:
根据已访问直播平台的观众用户的充值记录,确定正常充值观众用户;
根据已访问直播平台的观众用户的访问记录,确定待定异常观众用户;
所述第一频繁项集中包括:正常充值观众用户频繁使用的功能接口的信息;所述第二频繁项集中包括:待定异常观众用户频繁使用的功能接口的信息;
获得正常充值观众用户调用功能接口的第一频繁项集和待定异常观众用户调用功能接口的第二频繁项集;
将所述第二频繁项集与所述第一频繁项集进行比较,获得第二频繁项集中与第一频繁项集不同的功能接口作为差异功能接口;
将满足预设异常接口条件的所述差异功能接口确定为异常功能接口;
将调用过所述异常功能接口的观众用户中,满足预设异常行为条件的观众获得直播平台的各个主播用户的收益记录;
根据各个主播用户的收益记录中来源于异常观众用户的信息,将满足异常来源条件的主播用户,识别为异常主播用户。
本发明实施例提供的一种收入异常主播用户的电子设备,通过确定正常充值观众用户和待定异常观众用户,对比所述正常充值观众用户和待定异常观众用户的接口差异值确定异常功能接口,将调用过异常功能接口且满足预设异常行为条件的观众用户确定为异常观众用户,根据主播收益记录中来源于异常观众用户的信息,将满足异常来源条件的主播用户,识别为异常主播用户。可见,本方案可以智能识别收入异常主播,避免了因人工识别导致的错误,提升了识别收入异常主播的准确度。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的一种收入异常主播用户的识别方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的一种收入异常主播用户的识别方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置及电子设备而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。