CN111476510A - 一种风险用户识别的方法及系统、存储介质、设备 - Google Patents
一种风险用户识别的方法及系统、存储介质、设备 Download PDFInfo
- Publication number
- CN111476510A CN111476510A CN202010577011.1A CN202010577011A CN111476510A CN 111476510 A CN111476510 A CN 111476510A CN 202010577011 A CN202010577011 A CN 202010577011A CN 111476510 A CN111476510 A CN 111476510A
- Authority
- CN
- China
- Prior art keywords
- user
- risk
- users
- sample set
- iteration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种风险用户识别的方法,首先获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征;然后通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集;对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,并基于所述历史风险用户样本集中每个用户的多个特征,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数;基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户。该方法对新活动中的风险用户的识别准确率更高。
Description
技术领域
本发明涉及网络直播技术领域,尤其涉及一种风险用户识别的方法及系统、存储介质、设备。
背景技术
在网络直播平台上,为了提高用户活跃度,经常会有很多互动活动。而一些非正常的风险用户则通过作弊行为参与这些活动,造成直播网络堵塞的问题,对平台的直播生态环境造成了极大的影响,同时还会损害其他正常账号的相关利益。对于风控系统,希望能够在活动开始之后能够有效防范这些风险用户的作弊行为,因此,需要一个行之有效的方法能够在事中就对这类行为进行识别。
现有技术中,通常根据历史活动事后识别的“黑名单”来识别新活动中可能出现的风险用户,但其对新活动中的风险用户识别准确率低。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的风险用户识别的方法及系统、存储介质、设备。
一方面,本申请通过本申请的一实施例提供如下技术方案:
一种风险用户识别的方法,用于网络直播平台,所述方法包括:
根据所述网络直播平台的历史活动数据,获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征;
通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集;
对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,并基于所述历史风险用户样本集中每个用户的多个特征,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数;
基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户。
可选的,在基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户之后,所述方法还包括:
对所述风险用户进行屏蔽。
可选的,所述通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集,具体包括:
判断用户在第二预设时间段内参与所述网络直播平台当前活动的频次是否大于预设频次;
将在第二预设时间段内参与所述网络直播平台当前活动的频次大于预设频次的用户识别为待定风险用户,获得待定风险用户样本集P。
可选的,所述对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数,具体包括:
对所述历史风险用户样本集S的用户权重和所述待定风险用户样本集P的用户权重进行初始化;
对所述历史风险用户样本集S的用户权重和所述待定风险用户样本集P的用户权重进行迭代更新,并将上一轮更新后的权重归一化,获得归一化后的权值;其中,u是一个变量,表示样本全集中任意一个用户,t表示迭代轮数;
基于所述用户u每轮迭代预测标签为风险的概率,判断所述用户u在第t轮迭代的预测标签是否为风险用户标签;
基于所述待定风险用户样本集P第t轮迭代的错误率,获得用户每轮迭代的权重调节系数。
按照如下公式获得用户每轮迭代预测标签为风险的概率:
其中:
可选的,所述基于所述待定风险用户样本集P第t轮迭代的错误率,获得用户每轮迭代的权重调节系数,具体包括:
按照如下公式获得用户第t轮迭代的权重调节系数:
按照如下公式获得所述待定风险用户样本集P中用户在第t轮迭代的错误率:
可选的,所述基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户,具体包括:
若参与所述网络直播平台当前活动中待定风险用户样本集以外的用户满足如下公式,则识别为风险用户:
另一方面,本申请通过本申请的另一实施例提供一种风险用户识别的系统,用于网络直播平台,所述系统包括:
第一获得模块,用于根据所述网络直播平台的历史活动数据,获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征;
第二获得模块,用于通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集;
第三获得模块,用于对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,并基于所述历史风险用户样本集中每个用户的多个特征,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数;
风险识别模块,用于基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户。
本发明公开了一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。
本发明公开了一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述方法的步骤。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
在本发明的一个或多个实施例中的方法,根据所述网络直播平台的历史活动数据,获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征;通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集;由于历史风险用户样本集是根据网络直播平台的历史活动数据中获得的,也就是事后识别获得,其准确度较高;将其与参与当前活动的风险拦截下的用户集合同时进行处理,使得基于历史风险用户的特征,又包含了当前活动中的待定风险用户特征;在此基础上,对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,以调节权重,并基于所述历史风险用户样本集中每个用户的多个特征,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数;最后,基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户。因此,当前活动开始后,经过该方法,只需要通过历史风险用户样本集和待定风险用户样本集,迭代获得用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,即可对当前活动中实时参与的用户进行识别。相对于现有技术,不仅包含历史活动的“黑名单”,还结合了当前活动的待定风险用户集,因此,其对当前新活动中的风险用户的识别准确率更高,因此,可更高效的对新活动中的风险用户进行屏蔽,从而解决直播网络堵塞的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明一种实施例中的风险用户识别的方法流程图;
图2是本发明一种实施例中的风险用户识别的系统构架图。
具体实施方式
本申请实施例通过提供一种风险用户识别的方法及系统,解决了现有的对风险用户识别准确率低的技术问题。
本申请实施例的技术方案为解决上述技术问题,总体思路如下:
一种风险用户识别的方法,用于网络直播平台,所述方法包括:根据所述网络直播平台的历史活动数据,获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征;通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集;对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,并基于所述历史风险用户样本集中每个用户的多个特征,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数;基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
首先说明,本文中出现的术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
实施例一
本实施提供了一种风险用户识别的方法,用于网络直播平台,参见图1,本实施例的方法包括如下步骤:
S101、根据所述网络直播平台的历史活动数据,获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征;
S102、通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集;
S103、对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,并基于所述历史风险用户样本集中每个用户的多个特征,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数;
S104、基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户。
需要说明的是,本实施例中的用户可以是参与直播的人,也可以是参与直播互动的电子设备,如智能机器人等。
本实施例提供的风险用户识别的方法可适用于对以不正当方式参与直播间活动的作弊用户进行识别的场景,即行业俗称为“褥羊毛”,例如直播间抽奖活动等。该方法可以由风险用户识别装置来执行,该装置可以由软件和/或硬件的方式来实现,通常集成于终端,例如与直播平台对应的服务器。
参见图1,本实施例方法的执行过程如下:
首先,执行S101、根据所述网络直播平台的历史活动数据,获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征。
其中,可以理解的是,历史活动数据是指该网络直播平台上,在过去一段时间进行的活动所产生的数据,包括参与的用户数据以及用户的行为、特征等。因此,在这些活动后,可以通过一些现有的成熟可靠的事后规则,如同设备下、同wifi下的用户数过多等规则,来较为准确的识别出参与历史活动的作弊用户,这些作弊用户形成了历史风险用户样本集。
为了后续通过用户特征来进行风险用户的识别,这里需要先对历史风险用户样本集中用户特征进行提取。示例性的,本实施例中,提取了如下三种客观存在的特征:用户在第一预设时间段内请求历史活动接口的次数、在第一预设时间段内参与历史活动使用的IP个数和在第一预设时间段内参与活动使用的设备个数。其中,第一预设时间段可以是过去一周、一个月等,这里并不受任何限制。
需要说明的是,选取上述三种特征的根据是:
在网络直播平台上,活动通常会有同一个IP和设备参加活动个数的限制,而黑产会通过切换IP代理和对设备信息进行修改绕过这个限制,因此,使用的IP个数以及设备个数是表征其身份的必要特征。基于此,可以将其使用的IP个数以及设备个数作为通用活动特征。由此可见,用户在第一预设时间段内请求历史活动接口的次数和在第一预设时间段内参与历史活动使用的IP个数是获得更准确的识别率所必不可少的核心参数。
此外,为了实现作弊行为,黑产一定会通过脚本会频繁对活动接口进行请求,因此,统计用户请求活动接口的次数作为一个显著的特征,也是获得更准确的识别率所必不可少的核心参数。
基于此,本领域技术人员显然可以理解,在本发明实施例步骤S101中选取的用户在第一预设时间段内请求历史活动接口的次数、在第一预设时间段内参与历史活动使用的IP个数和在第一预设时间段内参与活动使用的设备个数这三种特征均是进一步提高识别准确率所必不可少的信息参数,是用户使用后留下的痕迹,是客观存在的,并非人为主观因素的选取,而是为了解决技术问题必须对上述用户在第一预设时间段内请求历史活动接口的次数、在第一预设时间段内参与历史活动使用的IP个数和在第一预设时间段内参与活动使用的设备个数进行获取(也即符合自然规律的选取),以为下述S103提供数据基础。
接下来,执行S102,通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集。
在具体实施过程中,为了实时识别参与当前活动用户中的风险用户,在新活动开始之后,通过风险统一拦截服务获取嫌疑用户。其中,风险统一拦截服务设定了一些频次的规则,如在一段时间内参与活动的频次,高于这些频次的用户可以认为是新活动的嫌疑用户(在本实施例中称为待定风险用户)。
作为一种可选的实施方式,所述通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集,具体包括:
判断用户在第二预设时间段内参与所述网络直播平台当前活动的频次是否大于预设频次;
将在第二预设时间段内参与所述网络直播平台当前活动的频次大于预设频次的用户识别为待定风险用户,获得待定风险用户样本集P。
接下来,执行S103,对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,并基于所述历史风险用户样本集中每个用户的多个特征,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数。
在获得了待定风险用户样本集和历史风险用户样本集后,通过S103可获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数,作为S104中识别风险用户的输入参数。在具体实施过程中,可通过以下步骤获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数:
S113、对所述历史风险用户样本集S的用户权重和所述待定风险用户样本集P的用户权重进行初始化;
具体的,为了进行权重迭代更新,首选需要进行权重的初始化。示例性的,按照如下方式对所述历史风险用户样本集S的用户权重和所述待定风险用户样本集P的用户权重进行初始化:
由此可见,这里初始化的权重是均匀分配的,在后面的迭代中权重会不断地进行更新。
S123、对所述历史风险用户样本集S的用户权重和所述待定风险用户样本集P的用户权重进行迭代更新,并将上一轮更新后的权重归一化,获得归一化后的权值;其中,u是一个变量,表示样本全集中任意一个用户,t表示迭代轮数。
将上一轮更新后的权重归一化,使得样本权重之和为1,这里的归一化是针对所有用户而言的。
需要说明的是,进行权重归一化的好处是保证权重总和是一定的,若权重总和不一定那么每轮迭代的时候会因为权重量纲不一致造成计算的尺度不一致,这样会影响最终结果的准确性。
具体的,为了在每轮迭代中对全集中的用户进行分类,本实施例计算用户u每轮迭代预测标签为风险的概率。一方面,作为错误率计算和权重更新的依据,另一方面也可实现对待定风险用户样本集中待定风险用户是否确定为风险用户的识别。
按照如下公式获得用户每轮迭代预测标签为风险的概率:
其中:
的计算原理为:对于在t轮各特征的加权变异系数,变异系数越大说明特征的贡献越大,因此权重越大;变异系数是标准差除以均值。在公式中,表示的是特征加权后的平均值,其中是权重系数,表示的是特征加权后的标准差。由于每个用户的贡献是不一样的,因此计算加权平均值和标准差,最终得到变异系数。将特征的变异系数作为特征权重的原理是:变异系数越大,说明该特征的取值差异越大,包含的信息越多,于是需要赋予更大的权重。
的计算原理为:得到后,通过概率函数来计算第t轮预测标签为风险的概率,其中表示,即特征与权重乘积的累加之和,表示特征的综合影响。函数是一个常用的概率函数,能够通过非线性变换将特征累加之和映射到0到1之间,从而能够设定阈值预测用户的标签。
S143、基于所述用户u每轮迭代预测标签为风险的概率,判断所述用户u在第t轮迭代的预测标签是否为风险用户标签。
之所以选择0.5作为判定阈值,是因为:概率函数是关于中心对称的,当时概率函数的取值是,当时概率函数的取值是,选取0.5这个中间值可以保证标签判定是无偏的,即先验概率是一样的。原则上选择0.5作为判定阈值,除非认为某一类的先验概率更大,若认为嫌疑发生概率比正常高则调小阈值,反之则调大阈值。
具体的,通过待定风险用户样本集中各用户预测标签与实际标签之间的对应关系,可以判断出整个集合错误率,从而作每轮迭代权重调节的依据,并更新待定风险用户样本集中各用户的权重。
首先,按照如下公式获得所述待定风险用户样本集P中用户在第t轮迭代的错误率:
需要说明的是,错误率的计算公式原理是:对于待定风险用户样本集,若预测标签和实际标签不符,那么说明判断是错误的,此时示性函数的值为0,反之则值为1。由于每个用户都是具有权重的,因此,将集合中的用户的权重进行归一化,而错误率则在0~1之间,以反映判断的错误率。
公式的原理是:如果第t轮迭代的错误率越高,那么需要对错误样本权重的调节程度越大。为了让权重调节系数和错误率成正比,同时让错误率越大时调节的力度越大,本实施例选择了函数,该函数的好处是当错误率为0时,权重调节系数为0,样本集权重不会进行调整;当错误率不断接近1时,样本调节系数会趋近于无穷大。
在具体实施过程中,经过T步迭代后收敛,最终可以得到不同的,T是事前预设的参数,一般设置的越大结果越精确但是计算成本会高。因此,通常设置为50,或者在不再变化(变化比率低于0.1%)时,停止迭代。则利用,则可具体实现对待定风险用户样本集进行权重更新。
此外,按照如下公式对待定风险用户样本集进行权重更新:
上述权重更新公式的原理是:对于历史风险用户样本集,若该次判断是正确的,即,那么说明该用户在本次活动中也比较可靠,于是增加用户的权重,增加的比例由权重调节系数控制,于是;若该次判断是错误的,即,那么用户的权重保持不变,于是。对于待定风险用户样本集中的用户,其整体置信程度是不如历史风险用户样本集中的用户,因此,若该次判断是正确的那么则保持用户的权重不变,即,否则说明该用户不可靠,于是降低用户的权重,降低的比例由权重调节系数控制,即。
接下来,执行S104, 基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户。
另一方面,若参与所述网络直播平台当前活动中待定风险用户样本集以外的用户满足如下公式,则识别为风险用户:
需要说明的是,之所以要使用从第轮开始的结果,其原因是随着迭代的不断进行,结果会越来越准确。因此,若在后面的迭代轮次中特征为x的用户计算得到的大于0.5,那么该用户是一个风险用户的可能性越大。为了能综合反映后面若干轮次的识别结果,因此采用上述公式中所述形式,即将进行连乘。公式中表示的是用户在到T轮每一轮中预测标签为风险用户标签的概率,由于每轮的调整系数是不一样的,调增系数越大说明错误率越高本轮的结果可信度越低。因此,在公式里面采用了反映上述特点。1/2表示的是预测标签为风险用户标签的概率阈值,若在第t轮预测标签为风险用户标签,那么。由于用户在有些轮次可能判定为风险用户标签、有些轮次可能判定为正常标签,因此,采用连乘的方式综合考虑各轮的综合判断结果。
由此可见,当前活动开始后,经过该方法,只需要通过历史风险用户样本集和待定风险用户样本集,迭代获得用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,即可对当前活动中实时参与的用户进行识别。相对于现有技术,不仅考虑了历史活动的“黑名单”,还融入了当前活动的待定风险用户集,因此,其对当前新活动中的风险用户的识别准确率更高。
作为一种可选的实施方式,在基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户之后,所述方法还包括:
对所述风险用户进行屏蔽,还可以限制其活动行为。以解决直播网络堵塞的问题,并可减少网络资源的占用。
下面以一个实际的例子,说明本实施例方法的实现过程:
提取历史风险用户样本集S,集合S的用户个数是150;待定风险用户样本集P,集合P中用户的个数是50。初始权重:
权重归一化,以第1轮迭代为例:
在一种具体场景中,将本实施例的识别方法用于分享视频领取鱼丸的活动中。将获取鱼丸超过正常用户数量的用户视为风险用户,对于风险用户获取的鱼丸暂时冻结使其无法转移或消费。通过历史领取鱼丸活动的黑名单,日均可以识别风险用户10000;使用本专利所述方法,在上述黑名单的基础上可以额外识别风险用户4000,提升识别覆盖40%。
上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:
本实施例的方法,根据所述网络直播平台的历史活动数据,获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征;通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集;由于历史风险用户样本集是根据网络直播平台的历史活动数据中获得的,也就是事后识别获得,其可信度较高;将其与参与当前活动的风险拦截下的用户集合同时进行处理,既融入了历史风险用户的特征,又考虑了当前活动中的待定风险用户特征;在此基础上,对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,以调节权重,并基于所述历史风险用户样本集中每个用户的多个特征,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数;最后,基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户。因此,当前活动开始后,经过该方法,只需要通过历史风险用户样本集和待定风险用户样本集,迭代获得用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,即可对当前活动中实时参与的用户进行识别。相对于现有技术,不仅考虑了历史活动的“黑名单”,还融入了当前活动的待定风险用户集,因此,其对当前新活动中的风险用户的识别准确率更高,因此,可更高效的对新活动中的风险用户进行屏蔽,从而解决直播网络堵塞的问题。
实施例二
基于与实施例一同样的发明构思,本实施例提供一种风险用户识别的系统,用于网络直播平台,参见图2,所述系统包括:
第一获得模块,用于根据所述网络直播平台的历史活动数据,获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征;
第二获得模块,用于通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集;
第三获得模块,用于对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,并基于所述历史风险用户样本集中每个用户的多个特征,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数;
风险识别模块,用于基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户。
由于本实施例所介绍的风险用户识别的系统为实现本申请实施例一种风险用户识别的方法所采用的系统,故而基于本申请实施例一中所介绍的风险用户识别的方法,本领域所属技术人员能够了解本实施例的系统的具体实施方式以及其各种变化形式,所以在此对于如何利用本中的系统实现实施例一中的方法不再详细介绍。只要本领域所属技术人员用于实现本申请实施例中风险用户识别的方法所采用的系统,都属于本申请所欲保护的范围。
基于与前述实施例中同样的发明构思,本发明实施例还提供一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文任一所述方法的步骤。
基于与前述实施例中同样的发明构思,本发明实施例还提供一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前文任一所述方法的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种风险用户识别的方法,用于网络直播平台,其特征在于,所述方法包括:
根据所述网络直播平台的历史活动数据,获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征;
通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集;
对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,并基于所述历史风险用户样本集中每个用户的多个特征,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数;
基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户。
2.如权利要求1所述的方法,其特征在于,在基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户之后,所述方法还包括:
对所述风险用户进行屏蔽。
3.如权利要求2所述的方法,其特征在于,所述通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集,具体包括:
判断用户在第二预设时间段内参与所述网络直播平台当前活动的频次是否大于预设频次;
将在第二预设时间段内参与所述网络直播平台当前活动的频次大于预设频次的用户识别为待定风险用户,获得待定风险用户样本集P。
4.如权利要求3所述的方法,其特征在于,所述对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,并基于所述历史风险用户样本集中每个用户的多个特征,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数,具体包括:
对所述历史风险用户样本集S的用户权重和所述待定风险用户样本集P的用户权重进行初始化;
对所述历史风险用户样本集S的用户权重和所述待定风险用户样本集P的用户权重进行迭代更新,并将上一轮更新后的权重归一化,获得归一化后的权值;其中,u是一个变量,表示样本全集中任意一个用户,t表示迭代轮数;
基于所述用户u每轮迭代预测标签为风险的概率,判断所述用户u在第t轮迭代的预测标签是否为风险用户标签;
8.一种风险用户识别的系统,用于网络直播平台,其特征在于,所述系统包括:
第一获得模块,用于根据所述网络直播平台的历史活动数据,获得所述历史活动中的历史风险用户样本集以及所述历史风险用户样本集中每个用户的多个特征;
第二获得模块,用于通过风险拦截,获得参与所述网络直播平台当前活动中的待定风险用户所构成的待定风险用户样本集;
第三获得模块,用于对所述历史风险用户样本集的用户和所述待定风险用户样本集中的用户迭代更新权重,并基于所述历史风险用户样本集中每个用户的多个特征,获得用户每轮迭代预测标签为风险的概率和用户每轮迭代的权重调节系数;
风险识别模块,用于基于所述用户每轮迭代预测标签为风险的概率和所述用户每轮迭代的权重调节系数,从参与所述网络直播平台当前活动的用户中识别出风险用户。
9.一种可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7任一项所述方法的步骤。
10.一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010577011.1A CN111476510B (zh) | 2020-06-23 | 2020-06-23 | 一种风险用户识别的方法及系统、存储介质、设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010577011.1A CN111476510B (zh) | 2020-06-23 | 2020-06-23 | 一种风险用户识别的方法及系统、存储介质、设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111476510A true CN111476510A (zh) | 2020-07-31 |
CN111476510B CN111476510B (zh) | 2020-10-16 |
Family
ID=71763953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010577011.1A Active CN111476510B (zh) | 2020-06-23 | 2020-06-23 | 一种风险用户识别的方法及系统、存储介质、设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111476510B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112785157A (zh) * | 2021-01-22 | 2021-05-11 | 支付宝(杭州)信息技术有限公司 | 风险识别系统的更新方法及装置、风险识别方法及装置 |
CN112017043B (zh) * | 2020-10-26 | 2021-11-12 | 北京淇瑀信息科技有限公司 | 一种基于应用下载列表的风险预警方法、装置、及电子设备 |
CN114697698A (zh) * | 2022-05-10 | 2022-07-01 | 北京达佳互联信息技术有限公司 | 直播请求处理方法、装置、电子设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107093090A (zh) * | 2016-10-25 | 2017-08-25 | 北京小度信息科技有限公司 | 异常用户识别方法及装置 |
CN108174296A (zh) * | 2018-01-02 | 2018-06-15 | 武汉斗鱼网络科技有限公司 | 恶意用户识别方法及装置 |
CN108243191A (zh) * | 2018-01-10 | 2018-07-03 | 武汉斗鱼网络科技有限公司 | 风险行为识别方法、存储介质、设备及系统 |
CN108615119A (zh) * | 2018-05-09 | 2018-10-02 | 平安普惠企业管理有限公司 | 一种异常用户的识别方法及设备 |
CN108632097A (zh) * | 2018-05-14 | 2018-10-09 | 平安科技(深圳)有限公司 | 异常行为对象的识别方法、终端设备及介质 |
CN108985553A (zh) * | 2018-06-05 | 2018-12-11 | 中国平安人寿保险股份有限公司 | 一种异常用户的识别方法及设备 |
CN109858919A (zh) * | 2017-11-27 | 2019-06-07 | 阿里巴巴集团控股有限公司 | 异常账号的确定方法及装置、在线下单方法及装置 |
CN110135681A (zh) * | 2019-04-03 | 2019-08-16 | 平安科技(深圳)有限公司 | 风险用户识别方法、装置、可读存储介质及终端设备 |
US20200019905A1 (en) * | 2019-06-21 | 2020-01-16 | Lg Electronics Inc. | System and method for safety management |
CN110956547A (zh) * | 2019-11-28 | 2020-04-03 | 广州及包子信息技术咨询服务有限公司 | 一种基于搜索引擎的实时识别欺诈团伙的方法及系统 |
-
2020
- 2020-06-23 CN CN202010577011.1A patent/CN111476510B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107093090A (zh) * | 2016-10-25 | 2017-08-25 | 北京小度信息科技有限公司 | 异常用户识别方法及装置 |
CN109858919A (zh) * | 2017-11-27 | 2019-06-07 | 阿里巴巴集团控股有限公司 | 异常账号的确定方法及装置、在线下单方法及装置 |
CN108174296A (zh) * | 2018-01-02 | 2018-06-15 | 武汉斗鱼网络科技有限公司 | 恶意用户识别方法及装置 |
CN108243191A (zh) * | 2018-01-10 | 2018-07-03 | 武汉斗鱼网络科技有限公司 | 风险行为识别方法、存储介质、设备及系统 |
CN108615119A (zh) * | 2018-05-09 | 2018-10-02 | 平安普惠企业管理有限公司 | 一种异常用户的识别方法及设备 |
CN108632097A (zh) * | 2018-05-14 | 2018-10-09 | 平安科技(深圳)有限公司 | 异常行为对象的识别方法、终端设备及介质 |
CN108985553A (zh) * | 2018-06-05 | 2018-12-11 | 中国平安人寿保险股份有限公司 | 一种异常用户的识别方法及设备 |
CN110135681A (zh) * | 2019-04-03 | 2019-08-16 | 平安科技(深圳)有限公司 | 风险用户识别方法、装置、可读存储介质及终端设备 |
US20200019905A1 (en) * | 2019-06-21 | 2020-01-16 | Lg Electronics Inc. | System and method for safety management |
CN110956547A (zh) * | 2019-11-28 | 2020-04-03 | 广州及包子信息技术咨询服务有限公司 | 一种基于搜索引擎的实时识别欺诈团伙的方法及系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112017043B (zh) * | 2020-10-26 | 2021-11-12 | 北京淇瑀信息科技有限公司 | 一种基于应用下载列表的风险预警方法、装置、及电子设备 |
CN112785157A (zh) * | 2021-01-22 | 2021-05-11 | 支付宝(杭州)信息技术有限公司 | 风险识别系统的更新方法及装置、风险识别方法及装置 |
CN114697698A (zh) * | 2022-05-10 | 2022-07-01 | 北京达佳互联信息技术有限公司 | 直播请求处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111476510B (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111476510B (zh) | 一种风险用户识别的方法及系统、存储介质、设备 | |
EP4198775A1 (en) | Abnormal user auditing method and apparatus, electronic device, and storage medium | |
CN110351299B (zh) | 一种网络连接检测方法和装置 | |
CN108319974B (zh) | 数据处理方法、装置、存储介质和电子装置 | |
CN110166344B (zh) | 一种身份标识识别方法、装置以及相关设备 | |
CN111185003B (zh) | 实时云应用托管方法、装置、服务器和存储介质 | |
CN108390775B (zh) | 一种基于spice的用户体验质量评价方法及系统 | |
CN108805332B (zh) | 一种特征评估方法和装置 | |
CN113919923B (zh) | 直播推荐模型训练方法、直播推荐方法及相关设备 | |
CN111951008A (zh) | 一种风险预测方法、装置、电子设备和可读存储介质 | |
CN114742442A (zh) | 一种基于信任的参与者选取提高数据质量方法 | |
CN111510473B (zh) | 访问请求处理方法、装置、电子设备和计算机可读介质 | |
CN113158550A (zh) | 一种联邦学习方法、装置、电子设备及存储介质 | |
CN116760726A (zh) | 一种基于编解码算法的供应商作弊检测方法 | |
CN116362894A (zh) | 多目标学习方法、装置、电子设备及计算机可读存储介质 | |
CN113408470B (zh) | 数据处理方法、装置、电子设备、存储介质及程序产品 | |
CN113179224B (zh) | 用于内容分发网络的流量调度方法及装置 | |
CN115393100A (zh) | 资源推荐方法及装置 | |
CN112257098B (zh) | 规则模型的安全性的确定方法、装置 | |
Padala et al. | Learning Equilibrium Contributions in Multi-project Civic Crowdfunding | |
CN113962712A (zh) | 一种诈骗团伙的预测方法及相关设备 | |
CN112905987B (zh) | 账号识别方法、装置、服务器及存储介质 | |
CN114553587A (zh) | 一种应对云服务威胁的大数据分析方法及服务器 | |
CN110087230B (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN112529303A (zh) | 基于模糊决策的风险预测方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20200731 Assignee: Hubei Special Automobile Network Technology Co.,Ltd. Assignor: WUHAN DOUYU YULE NETWORK TECHNOLOGY Co.,Ltd. Contract record no.: X2023980034619 Denomination of invention: A method and system for identifying risk users, storage media, and equipment Granted publication date: 20201016 License type: Common License Record date: 20230414 |