CN111476510A

CN111476510A - 一种风险用户识别的方法及系统、存储介质、设备

Info

Publication number: CN111476510A
Application number: CN202010577011.1A
Authority: CN
Inventors: 王璐
Original assignee: Wuhan Douyu Network Technology Co Ltd
Current assignee: Wuhan Douyu Network Technology Co Ltd
Priority date: 2020-06-23
Filing date: 2020-06-23
Publication date: 2020-07-31
Anticipated expiration: 2040-06-23
Also published as: CN111476510B

Abstract

本发明公开了一种风险用户识别的方法，首先获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征；然后通过风险拦截，获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集；对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重，并基于所述历史风险用户样本集中每个用户的多个特征，获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数；基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，从参与所述网络直播平台当前活动的用户中识别出风险用户。该方法对新活动中的风险用户的识别准确率更高。

Description

一种风险用户识别的方法及系统、存储介质、设备

技术领域

本发明涉及网络直播技术领域，尤其涉及一种风险用户识别的方法及系统、存储介质、设备。

背景技术

在网络直播平台上，为了提高用户活跃度，经常会有很多互动活动。而一些非正常的风险用户则通过作弊行为参与这些活动，造成直播网络堵塞的问题，对平台的直播生态环境造成了极大的影响，同时还会损害其他正常账号的相关利益。对于风控系统，希望能够在活动开始之后能够有效防范这些风险用户的作弊行为，因此，需要一个行之有效的方法能够在事中就对这类行为进行识别。

现有技术中，通常根据历史活动事后识别的“黑名单”来识别新活动中可能出现的风险用户，但其对新活动中的风险用户识别准确率低。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的风险用户识别的方法及系统、存储介质、设备。

一方面，本申请通过本申请的一实施例提供如下技术方案：

一种风险用户识别的方法，用于网络直播平台，所述方法包括：

根据所述网络直播平台的历史活动数据，获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征；

通过风险拦截，获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集；

对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重，并基于所述历史风险用户样本集中每个用户的多个特征，获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数；

基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，从参与所述网络直播平台当前活动的用户中识别出风险用户。

可选的，在基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，从参与所述网络直播平台当前活动的用户中识别出风险用户之后，所述方法还包括：

对所述风险用户进行屏蔽。

可选的，所述通过风险拦截，获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集，具体包括：

判断用户在第二预设时间段内参与所述网络直播平台当前活动的频次是否大于预设频次；

将在第二预设时间段内参与所述网络直播平台当前活动的频次大于预设频次的用户识别为待定风险用户，获得待定风险用户样本集P。

可选的，所述对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重，获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数，具体包括：

对所述历史风险用户样本集S的用户权重和所述待定风险用户样本集P的用户权重进行初始化；

对所述历史风险用户样本集S的用户权重和所述待定风险用户样本集P的用户权重进行迭代更新，并将上一轮更新后的权重归一化，获得归一化后的权值

；其中，u是一个变量，表示样本全集

中任意一个用户，t表示迭代轮数；

基于所述历史风险用户样本集中每个用户的多个特征和归一化后的权值

，获得用户u每轮迭代预测标签为风险的概率；

基于所述用户u每轮迭代预测标签为风险的概率，判断所述用户u在第t轮迭代的预测标签是否为风险用户标签；

基于所述用户u在第t轮迭代的预测标签是否为风险用户标签的结果、所述待定风险用户样本集P中用户的实际标签以及所述归一化后的权值

，获得所述待定风险用户样本集第t轮迭代的错误率；

基于所述待定风险用户样本集P第t轮迭代的错误率，获得用户每轮迭代的权重调节系数。

可选的，所述基于所述历史风险用户样本集中每个用户的多个特征和归一化后的权值

，获得用户u每轮迭代预测标签为风险的概率，具体包括：

按照如下公式获得用户每轮迭代预测标签为风险的概率：

其中：

是用户u在第t轮预测标签为风险的概率，

表示用户u的第i个特征；

是在第t轮特征i的权重，

，

是该集合的元素个数。

可选的，所述基于所述待定风险用户样本集P第t轮迭代的错误率，获得用户每轮迭代的权重调节系数，具体包括：

按照如下公式获得用户第t轮迭代的权重调节系数：

其中，

是用户第t轮迭代权重调节系数，

是所述待定风险用户样本集P中用户在第t轮迭代的错误率；

按照如下公式获得所述待定风险用户样本集P中用户在第t轮迭代的错误率：

其中，

是用户u的预测标签，

是用户u的实际标签。

可选的，所述基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，从参与所述网络直播平台当前活动的用户中识别出风险用户，具体包括：

若参与所述网络直播平台当前活动中待定风险用户样本集以外的用户满足如下公式，则识别为风险用户：

其中，T是迭代的总轮次，

是T/2向上取整。

另一方面，本申请通过本申请的另一实施例提供一种风险用户识别的系统，用于网络直播平台，所述系统包括：

第一获得模块，用于根据所述网络直播平台的历史活动数据，获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征；

第二获得模块，用于通过风险拦截，获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集；

第三获得模块，用于对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重，并基于所述历史风险用户样本集中每个用户的多个特征，获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数；

风险识别模块，用于基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，从参与所述网络直播平台当前活动的用户中识别出风险用户。

本发明公开了一种可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述方法的步骤。

本发明公开了一种设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述方法的步骤。

本申请实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

在本发明的一个或多个实施例中的方法，根据所述网络直播平台的历史活动数据，获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征；通过风险拦截，获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集；由于历史风险用户样本集是根据网络直播平台的历史活动数据中获得的，也就是事后识别获得，其准确度较高；将其与参与当前活动的风险拦截下的用户集合同时进行处理，使得基于历史风险用户的特征，又包含了当前活动中的待定风险用户特征；在此基础上，对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重，以调节权重，并基于所述历史风险用户样本集中每个用户的多个特征，获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数；最后，基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，从参与所述网络直播平台当前活动的用户中识别出风险用户。因此，当前活动开始后，经过该方法，只需要通过历史风险用户样本集和待定风险用户样本集，迭代获得用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，即可对当前活动中实时参与的用户进行识别。相对于现有技术，不仅包含历史活动的“黑名单”，还结合了当前活动的待定风险用户集，因此，其对当前新活动中的风险用户的识别准确率更高，因此，可更高效的对新活动中的风险用户进行屏蔽，从而解决直播网络堵塞的问题。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明一种实施例中的风险用户识别的方法流程图；

图2是本发明一种实施例中的风险用户识别的系统构架图。

具体实施方式

本申请实施例通过提供一种风险用户识别的方法及系统，解决了现有的对风险用户识别准确率低的技术问题。

本申请实施例的技术方案为解决上述技术问题，总体思路如下：

一种风险用户识别的方法，用于网络直播平台，所述方法包括：根据所述网络直播平台的历史活动数据，获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征；通过风险拦截，获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集；对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重，并基于所述历史风险用户样本集中每个用户的多个特征，获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数；基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，从参与所述网络直播平台当前活动的用户中识别出风险用户。

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

首先说明，本文中出现的术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

实施例一

本实施提供了一种风险用户识别的方法，用于网络直播平台，参见图1，本实施例的方法包括如下步骤：

S101、根据所述网络直播平台的历史活动数据，获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征；

S102、通过风险拦截，获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集；

S103、对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重，并基于所述历史风险用户样本集中每个用户的多个特征，获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数；

S104、基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，从参与所述网络直播平台当前活动的用户中识别出风险用户。

需要说明的是，本实施例中的用户可以是参与直播的人，也可以是参与直播互动的电子设备，如智能机器人等。

本实施例提供的风险用户识别的方法可适用于对以不正当方式参与直播间活动的作弊用户进行识别的场景，即行业俗称为“褥羊毛”，例如直播间抽奖活动等。该方法可以由风险用户识别装置来执行，该装置可以由软件和/或硬件的方式来实现，通常集成于终端，例如与直播平台对应的服务器。

参见图1，本实施例方法的执行过程如下：

首先，执行S101、根据所述网络直播平台的历史活动数据，获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征。

其中，可以理解的是，历史活动数据是指该网络直播平台上，在过去一段时间进行的活动所产生的数据，包括参与的用户数据以及用户的行为、特征等。因此，在这些活动后，可以通过一些现有的成熟可靠的事后规则，如同设备下、同wifi下的用户数过多等规则，来较为准确的识别出参与历史活动的作弊用户，这些作弊用户形成了历史风险用户样本集。

为了后续通过用户特征来进行风险用户的识别，这里需要先对历史风险用户样本集中用户特征进行提取。示例性的，本实施例中，提取了如下三种客观存在的特征：用户在第一预设时间段内请求历史活动接口的次数、在第一预设时间段内参与历史活动使用的IP个数和在第一预设时间段内参与活动使用的设备个数。其中，第一预设时间段可以是过去一周、一个月等，这里并不受任何限制。

需要说明的是，选取上述三种特征的根据是：

在网络直播平台上，活动通常会有同一个IP和设备参加活动个数的限制，而黑产会通过切换IP代理和对设备信息进行修改绕过这个限制，因此，使用的IP个数以及设备个数是表征其身份的必要特征。基于此，可以将其使用的IP个数以及设备个数作为通用活动特征。由此可见，用户在第一预设时间段内请求历史活动接口的次数和在第一预设时间段内参与历史活动使用的IP个数是获得更准确的识别率所必不可少的核心参数。

此外，为了实现作弊行为，黑产一定会通过脚本会频繁对活动接口进行请求，因此，统计用户请求活动接口的次数作为一个显著的特征，也是获得更准确的识别率所必不可少的核心参数。

基于此，本领域技术人员显然可以理解，在本发明实施例步骤S101中选取的用户在第一预设时间段内请求历史活动接口的次数、在第一预设时间段内参与历史活动使用的IP个数和在第一预设时间段内参与活动使用的设备个数这三种特征均是进一步提高识别准确率所必不可少的信息参数，是用户使用后留下的痕迹，是客观存在的，并非人为主观因素的选取，而是为了解决技术问题必须对上述用户在第一预设时间段内请求历史活动接口的次数、在第一预设时间段内参与历史活动使用的IP个数和在第一预设时间段内参与活动使用的设备个数进行获取（也即符合自然规律的选取），以为下述S103提供数据基础。

提取用户上述特征后，对于每个用户可以形成一个特征向量

，特征向量中的第i维表示的是第i个特征。

接下来，执行S102，通过风险拦截，获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集。

在具体实施过程中，为了实时识别参与当前活动用户中的风险用户，在新活动开始之后，通过风险统一拦截服务获取嫌疑用户。其中，风险统一拦截服务设定了一些频次的规则，如在一段时间内参与活动的频次，高于这些频次的用户可以认为是新活动的嫌疑用户（在本实施例中称为待定风险用户）。

作为一种可选的实施方式，所述通过风险拦截，获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集，具体包括：

接下来，执行S103，对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重，并基于所述历史风险用户样本集中每个用户的多个特征，获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数。

在获得了待定风险用户样本集和历史风险用户样本集后，通过S103可获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数，作为S104中识别风险用户的输入参数。在具体实施过程中，可通过以下步骤获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数：

S113、对所述历史风险用户样本集S的用户权重和所述待定风险用户样本集P的用户权重进行初始化；

具体的，为了进行权重迭代更新，首选需要进行权重的初始化。示例性的，按照如下方式对所述历史风险用户样本集S的用户权重和所述待定风险用户样本集P的用户权重进行初始化：

对于历史风险用户样本集

，设定初始权重为

；

对于待定风险用户样本集

，设定初始权重为

。

由此可见，这里初始化的权重是均匀分配的，在后面的迭代中权重会不断地进行更新。

S123、对所述历史风险用户样本集S的用户权重和所述待定风险用户样本集P的用户权重进行迭代更新，并将上一轮更新后的权重归一化，获得归一化后的权值

；其中，u是一个变量，表示样本全集

中任意一个用户，t表示迭代轮数。

具体的，可按照以下公式对将上一轮更新后的权重归一化，获得归一化后的权值

：

其中：

是用户u在上一轮的权重，

是本轮更新后的权重；

是所有用户的上一轮的权重之和。

将上一轮更新后的权重归一化，使得样本权重之和为1，这里的归一化是针对所有用户而言的。

需要说明的是，进行权重归一化的好处是保证权重总和是一定的，若权重总和不一定那么每轮迭代的时候会因为权重量纲不一致造成计算的尺度不一致，这样会影响最终结果的准确性。

需要说明的是，本实施例中，u是一个变量，并不是特指，其取值范围随限定的不同而不同，示例性的，在这里u表示样本全集

中任意一个用户。

S133、基于所述历史风险用户样本集中每个用户的多个特征和归一化后的权值

，获得用户u每轮迭代预测标签为风险的概率。

具体的，为了在每轮迭代中对全集

中的用户进行分类，本实施例计算用户u每轮迭代预测标签为风险的概率。一方面，作为错误率计算和权重更新的依据，另一方面也可实现对待定风险用户样本集中待定风险用户是否确定为风险用户的识别。

示例性的，所述基于所述历史风险用户样本集中每个用户的多个特征和归一化后的权值

，获得用户u每轮迭代预测标签为风险的概率，具体包括：

按照如下公式获得用户每轮迭代预测标签为风险的概率：

其中：

是用户u在第t轮预测标签为风险的概率，

表示用户u的第i个特征；

是在第t轮特征i的权重，

，

是该集合的元素个数。

的计算原理为：对于在t轮各特征的加权变异系数，变异系数越大说明特征的贡献越大，因此权重越大；变异系数是标准差除以均值。在公式中，

表示的是特征加权后的平均值，其中

是权重系数，

表示的是特征加权后的标准差。由于每个用户的贡献是不一样的，因此计算加权平均值和标准差，最终得到变异系数。将特征的变异系数作为特征权重的原理是：变异系数越大，说明该特征的取值差异越大，包含的信息越多，于是需要赋予更大的权重。

的计算原理为：得到

后，通过概率函数

来计算第t轮预测标签为风险的概率，其中

表示

，即特征与权重乘积的累加之和，表示特征的综合影响。函数

是一个常用的概率函数，能够通过非线性变换将特征累加之和映射到0到1之间，从而能够设定阈值预测用户的标签。

S143、基于所述用户u每轮迭代预测标签为风险的概率，判断所述用户u在第t轮迭代的预测标签是否为风险用户标签。

在具体实施过程中，若

大于0.5，那么

则为风险用户标签（风险用户标签则代表其被识别为风险用户），否则是普通用户标签。其中，

是用户u的预测标签。

之所以选择0.5作为判定阈值，是因为：概率函数

是关于

中心对称的，当

时概率函数的取值是

，当

时概率函数的取值是

，选取0.5这个中间值可以保证标签判定是无偏的，即先验概率是一样的。原则上选择0.5作为判定阈值，除非认为某一类的先验概率更大，若认为嫌疑发生概率比正常高则调小阈值，反之则调大阈值。

S153、基于所述用户u在第t轮迭代的预测标签是否为风险用户标签的结果、所述待定风险用户样本集P中用户的实际标签以及所述归一化后的权值

，获得用户每轮迭代的权重调节系数。

具体的，通过待定风险用户样本集中各用户预测标签与实际标签之间的对应关系，可以判断出整个集合错误率，从而作每轮迭代权重调节的依据，并更新待定风险用户样本集中各用户的权重。

示例性的，基于所述用户u在第t轮迭代的预测标签是否为风险用户标签的结果、所述待定风险用户样本集P中用户的实际标签以及所述归一化后的权值

，获得用户每轮迭代的权重调节系数，具体包括：

首先，按照如下公式获得所述待定风险用户样本集P中用户在第t轮迭代的错误率：

其中，

是用户u的预测标签，

是用户u的实际标签，由于

中的用户都是通过风险拦截识别出来的待定风险用户，因此实际标签是风险用户。

需要说明的是，错误率的计算公式原理是：对于待定风险用户样本集

，若预测标签

和实际标签

不符，那么说明判断是错误的，此时示性函数

的值为0，反之则值为1。由于每个用户都是具有权重的，因此，将集合

中的用户的权重进行归一化

，而错误率则在0~1之间，以反映判断的错误率。

其次，按照如下公式获得用户第t轮迭代的权重调节系数：

其中，

是用户第t轮迭代权重调节系数，

是所述待定风险用户样本集P中用户在第t轮迭代的错误率；

公式的原理是：如果第t轮迭代的错误率越高，那么需要对错误样本权重的调节程度越大。为了让权重调节系数和错误率成正比，同时让错误率越大时调节的力度越大，本实施例选择了函数

，该函数的好处是当错误率

为0时，权重调节系数为0，样本集权重不会进行调整；当错误率

不断接近1时，样本调节系数会趋近于无穷大。

在具体实施过程中，经过T步迭代后收敛，最终可以得到不同的

，T是事前预设的参数，一般设置的越大结果越精确但是计算成本会高。因此，通常设置为50，或者在

不再变化（变化比率低于0.1%）时，停止迭代。则利用

，则可具体实现对待定风险用户样本集进行权重更新。

此外，按照如下公式对待定风险用户样本集进行权重更新：

其中：

是更新后的用户u的权重。

上述权重更新公式的原理是：对于历史风险用户样本集

，若该次判断是正确的，即

，那么说明该用户在本次活动中也比较可靠，于是增加用户的权重，增加的比例由权重调节系数控制，于是

；若该次判断是错误的，即

，那么用户的权重保持不变，于是

。对于待定风险用户样本集中的用户

，其整体置信程度是不如历史风险用户样本集中的用户，因此，若该次判断是正确的那么则保持用户的权重不变，即

，否则说明该用户不可靠，于是降低用户的权重，降低的比例由权重调节系数控制，即

。

接下来，执行S104, 基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，从参与所述网络直播平台当前活动的用户中识别出风险用户。

具体的，一方面，根据S143中的解释，若

大于0.5，那么

则为风险用户标签，风险用户标签则代表其被识别为风险用户，否则是普通用户标签，据此可以判断待定风险用户样本集中的用户是否为风险用户。

另一方面，若参与所述网络直播平台当前活动中待定风险用户样本集以外的用户满足如下公式，则识别为风险用户：

其中，T是迭代的总轮次，

是T/2向上取整。

需要说明的是，之所以要使用从第

轮开始的结果，其原因是随着迭代的不断进行，结果会越来越准确。因此，若在后面的迭代轮次中特征为x的用户计算得到的

大于0.5，那么该用户是一个风险用户的可能性越大。为了能综合反映后面若干轮次的识别结果，因此采用上述公式中所述形式，即将

进行连乘。公式中

表示的是用户在

到T轮每一轮中预测标签为风险用户标签的概率，由于每轮的调整系数是不一样的，调增系数越大说明错误率越高本轮的结果可信度越低。因此，在公式里面采用了

反映上述特点。1/2表示的是预测标签为风险用户标签的概率阈值，若在第t轮预测标签为风险用户标签，那么

。由于用户在有些轮次可能判定为风险用户标签、有些轮次可能判定为正常标签，因此，采用连乘的方式综合考虑各轮的综合判断结果。

由此可见，当前活动开始后，经过该方法，只需要通过历史风险用户样本集和待定风险用户样本集，迭代获得用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，即可对当前活动中实时参与的用户进行识别。相对于现有技术，不仅考虑了历史活动的“黑名单”，还融入了当前活动的待定风险用户集，因此，其对当前新活动中的风险用户的识别准确率更高。

作为一种可选的实施方式，在基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，从参与所述网络直播平台当前活动的用户中识别出风险用户之后，所述方法还包括：

对所述风险用户进行屏蔽，还可以限制其活动行为。以解决直播网络堵塞的问题，并可减少网络资源的占用。

下面以一个实际的例子，说明本实施例方法的实现过程：

提取历史风险用户样本集S，集合S的用户个数是150；待定风险用户样本集P，集合P中用户的个数是50。初始权重：

权重归一化，以第1轮迭代为例：

只考虑一个特征，假设样本

的特征是5，通过计算

，那么：

，

因此预测标签为风险用户标签

。

对所有P集合的用户进行计算，得到错误率

，于是：

对于风险样本特征是x=4，于是：

，

由于

，因此，将风险用户判定为当前活动的嫌疑用户。

在一种具体场景中，将本实施例的识别方法用于分享视频领取鱼丸的活动中。将获取鱼丸超过正常用户数量的用户视为风险用户，对于风险用户获取的鱼丸暂时冻结使其无法转移或消费。通过历史领取鱼丸活动的黑名单，日均可以识别风险用户10000；使用本专利所述方法，在上述黑名单的基础上可以额外识别风险用户4000，提升识别覆盖40%。

上述本申请实施例中的技术方案，至少具有如下的技术效果或优点：

本实施例的方法，根据所述网络直播平台的历史活动数据，获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征；通过风险拦截，获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集；由于历史风险用户样本集是根据网络直播平台的历史活动数据中获得的，也就是事后识别获得，其可信度较高；将其与参与当前活动的风险拦截下的用户集合同时进行处理，既融入了历史风险用户的特征，又考虑了当前活动中的待定风险用户特征；在此基础上，对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重，以调节权重，并基于所述历史风险用户样本集中每个用户的多个特征，获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数；最后，基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，从参与所述网络直播平台当前活动的用户中识别出风险用户。因此，当前活动开始后，经过该方法，只需要通过历史风险用户样本集和待定风险用户样本集，迭代获得用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数，即可对当前活动中实时参与的用户进行识别。相对于现有技术，不仅考虑了历史活动的“黑名单”，还融入了当前活动的待定风险用户集，因此，其对当前新活动中的风险用户的识别准确率更高，因此，可更高效的对新活动中的风险用户进行屏蔽，从而解决直播网络堵塞的问题。

实施例二

基于与实施例一同样的发明构思，本实施例提供一种风险用户识别的系统，用于网络直播平台，参见图2，所述系统包括：

由于本实施例所介绍的风险用户识别的系统为实现本申请实施例一种风险用户识别的方法所采用的系统，故而基于本申请实施例一中所介绍的风险用户识别的方法，本领域所属技术人员能够了解本实施例的系统的具体实施方式以及其各种变化形式，所以在此对于如何利用本中的系统实现实施例一中的方法不再详细介绍。只要本领域所属技术人员用于实现本申请实施例中风险用户识别的方法所采用的系统，都属于本申请所欲保护的范围。

基于与前述实施例中同样的发明构思，本发明实施例还提供一种可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前文任一所述方法的步骤。

基于与前述实施例中同样的发明构思，本发明实施例还提供一种设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现前文任一所述方法的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。