CN107093085A - 异常用户识别方法及装置 - Google Patents
异常用户识别方法及装置 Download PDFInfo
- Publication number
- CN107093085A CN107093085A CN201610696819.5A CN201610696819A CN107093085A CN 107093085 A CN107093085 A CN 107093085A CN 201610696819 A CN201610696819 A CN 201610696819A CN 107093085 A CN107093085 A CN 107093085A
- Authority
- CN
- China
- Prior art keywords
- user
- value
- identified
- note
- scoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000012549 training Methods 0.000 claims description 42
- 238000010606 normalization Methods 0.000 claims description 17
- 108090000623 proteins and genes Proteins 0.000 claims description 7
- 238000005259 measurement Methods 0.000 description 6
- 235000012054 meals Nutrition 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000000205 computational method Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 108010074506 Transfer Factor Proteins 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0225—Avoiding frauds
Abstract
本申请实施例公开了异常用户识别方法及装置。所述方法包括:获取待识别用户的用户特征值和用户特征值正常范围;根据所述用户特征值及特征值正常范围确定所述待识别用户的用户特征中所存在的异常特征,所述异常特征是指所述待识别用户的用户特征值超出特征值正常范围的用户特征;根据所述异常特征的特征值及所述异常特征的特征权重值,计算所述待识别用户的用户评分;根据所述用户评分生成用以指示待识别用户是否为异常用户的识别结果。采用本申请所提供的方法及装置,可以利用多个异常特征的特征值综合计算待识别用户的用户评分,因而可以减少因异常特征选取不准造成识别异常用户识别准确率低的问题。
Description
技术领域
本申请涉及数据处理领域,尤其涉及异常用户设备方法及装置。
背景技术
随着B2C(Business to Customer)及O2O(Online to Offline)等各类电商平台的快速发展,越来越多的用户与顾客开始通过电商平台进行交易。由于对用户与顾客之间的交易进行补贴能够提升用户及顾客通过电商平台进行交易的积极性,因此为促进电商平台的进一步发展,越来越多的电商平台会采用满增、满减等方式对用户进行补贴。
出于获取更多的补贴,或吸引更多交易对象等目的,电商平台的一些用户,例如商家,会通过虚假交易来提升交易量,通过虚假交易来提升的交易量的用户通常被称为异常用户。为避免异常用户通过虚假交易来获取更多补贴,电商平台需要使用一定的对策从众多的用户中识别出异常用户。
技术人员经过研究发现,异常用户与正常用户相比,通常在用户特征上存在一些差异。例如,正常用户的日交易量波动值会在特定范围之内,而异常用户的日交易量波动值通常会超出该特定范围,即,异常用户相对于正常用户会存在日交易量波动异常,因此是否存在日交易量波动异常这一异常特征可以用于判定用户是否为异常用户。为识别出电商平台中的异常用户,可以首先由技术人员首先人工识别出一些异常用户及正常用户;然后再根据这些用户选出一个或多个可用于指示用户是否为异常用户的异常特征,然后根据用户是否存在所述异常特征来确定用户是否为异常用户。
但是在实际使用中,用户分布广泛且数量众多,因此异常特征选取的准确性会极大的影响异常用户识别的准确率。并且,在特定情况下,正常用户在特定情况下也会出现所述异常特征。例如,天气情况比较特殊时,正常用户的日交易量也会突然增加或减少,从而出现日交易量波动异常。因此,根据是否存在异常特征来判断用户是否为异常用户,很容易将正常用户识别成异常用户,从而造成识别准确率较低。
发明内容
本申请提供了异常用户识别方法及装置,以解决现有技术很容易将正常用户识别为异常用户,从而造成识别准确率低的问题。
第一方面,本申请提供了一种异常用户识别方法,包括:获取待识别用户的用户特征值和用户特征值正常范围;根据所述用户特征值及特征值正常范围确定所述待识别用户的用户特征中所存在的异常特征,所述异常特征是指所述待识别用户的用户特征值超出特征值正常范围的用户特征;根据所述异常特征的特征值及所述异常特征的特征权重值,计算所述待识别用户的用户评分;根据所述用户评分生成用以指示待识别用户是否为异常用户的识别结果。
可选的,所述计算所述待识别用户的用户评分包括:计算所述待识别用户的用户评分X,或其中,w0为预设常量调整因子,wi表示第i异常特征的特征权重值,xi表示第i异常特征的特征值,m为所述异常特征的数量,wk表示第k正常特征的特征权重值,xk表示第k正常特征的特征值,p为正常特征的数量,正常特征为所述用户特征中除所述异常特征之外的其他特征。
可选的,获取待识别用户的用户特征的特征值正常范围包括:获取所述用户组中每个用户在所述用户特征上的特征值;根据同组用户在所述用户特征上的特征值的平均值确定所述特征值正常范围。
可选的,每一个所述用户特征的特征权重值均为与所述用户组所对应的预设值。
可选的,所述同组用户是指与待识别用户属于同一预设地域范围内的用户。
可选的,所述方法还包括:当所述识别结果准确时,将所述识别结果作为训练样本加入到样本库;获取用于训练所述阈值范围与所述特征权重值的训练模型;使用所述样本库中的训练样本对所述训练模型进行训练,生成阈值范围训练值及特征权重训练值;使用所述阈值范围训练值更新所述阈值范围,并使用所述特征权重训练值更新所述特征权重值。
第二方面,本申请还提供了一种异常用户识别装置,包括:获取单元,用于获取待识别用户的用户特征值和用户特征值正常范围;确定单元,用于根据所述用户特征值及特征值正常范围确定所述待识别用户的用户特征中所存在的异常特征,所述异常特征是指所述待识别用户的用户特征值超出特征值正常范围的用户特征;计算单元,用于根据所述异常特征的特征值及所述异常特征的特征权重值,计算所述待识别用户的用户评分;生成单元,用于根据所述用户评分生成用以指示待识别用户是否为异常用户的识别结果。
可选的,所述用户评分计算单元,具体用于计算所述待识别用户的用户评分X,其中,或w0为预设常量调整因子,wi表示第i异常特征的特征权重值,xi表示第i异常特征的特征值,m为所述异常特征的数量,wk表示第k正常特征的特征权重值,xk表示第k正常特征的特征值,p为正常特征的数量,正常特征为所述用户特征中除所述异常特征之外的其他特征。
可选的,所述获取单元,还用于获取所述用户组中每个用户在所述用户特征上的特征值;根据同组用户在所述用户特征上的特征值的平均值确定所述特征值正常范围。
可选的,每一个所述用户特征的特征权重值均为与所述用户组所对应的预设值。
可选的,所述同组用户是指与待识别用户属于同一预设地域范围内的用户。
可选的,所述识别结果生成单元包括:归一化子单元,用于将所述用户评分归一化至预定区间,从而得到归一化评分;结果生成子单元,用于当所述归一化评分超出预设评分时,将所述待识别用户判定为异常用户;或者,用于当所述归一化评分未超出所述预设评分时,将所述待识别用户判定为正常用户。
可选的,所述装置还包括:训练样本添加单元,用于在所述识别结果准确时,将所述识别结果作为训练样本加入到样本库;训练模型选择单元,用于获取用于训练所述阈值范围与所述特征权重值的训练模型;模型训练单元,用于使用所述样本库中的训练样本对所述训练模型进行训练,生成阈值范围训练值及特征权重训练值;更新单元,用于使用所述阈值范围训练值更新所述阈值范围,并使用所述特征权重训练值更新所述特征权重值。
采用本申请所提供的技术方案,可以利用多个异常特征的特征值综合计算待识别用户的用户评分,因而可以减少因异常特征选取不准造成异常用户识别准确率低的问题。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请异常用户识别方法一个实施例的流程示意图;
图2为本申请异常用户识别方法另一个实施例的流程示意图;
图3为本申请异常用户识别方法装置一个实施例的结构示意图。
具体实施方式
参见图1,为本申请异常用户识别方法一个实施例的流程示意图。该方法可以有由用于识别,该方法包括如下步骤:
步骤101,获取待识别用户的用户特征值和用户特征值正常范围。
用于识别异常用户的服务器可以首先选定n个可用于判定异常用户的用户特征,其中,n的取值可以为任意正整数。通常情况下,n的取值越大,最终的判断结果越准确,但是判断过程所带来的资源开销也会越大,因此可以在实际使用中根据判断结果准确度的需求和资源开销限制来确定n的取值。当n的取值大于1时,所述n个用户特征可以分别用第1至第n用户特征表示,每一个用户特征都可以用于反映用户是否为异常用户。
可用于判定异常用户的用户特征的种类有多种,并且对不同类型的用户来说,可用于判定异常用户的用户特征也可能各不相同。以电商平台是外卖平台为例,所述用户特征可以包括:频繁下单的用户量占比,频繁下单可以是指用户在n分钟内超出m单。一段时间内只在这一家店下单的用户量占比;使用虚拟手机号的用户量占比;低浏览量用户的用户量占比,其中低浏览量用户是指在下单前浏览的用户页面少于预定值的用户;下单行为在预定秒数内完成的用户量占比;用户账号的绑定手机号与下单时填写的联系电话不一致的用户量占比;用户填写备注存在暗号的订单量占比;采用某种支付方式的用户量占比;从用户下单到配送员取到餐的时间;配送员取餐到送给用户的时间;或者商户地址与用户地址之间的距离等等。
在此需要说明的是,前述用户特征均与统计周期相关,同一类用户信息在不同的统计周期内可以作为不同的用户特征。例如,在多个不同的统计周期内的频繁下单的用户量占比可以作为多个不同的用户特征。
在所述用户特征被选定后,可以逐一确定每一个用户特征的用户特征值和所述用户特征的特征值正常范围。
具体来说,在识别异常用户时,可以按照一定的划分规则将所有的用户划分为一个以上的用户组,每个用户组所包含的用户可以均不互相重合。通常情况下,每一个所述用户组内所包含的用户都具有一个共同的特征。例如,可以按照用户所处的商圈或地域范围,将用户划分为多个用户组,从而使得同一用户组中的所有用户都位于同一商圈或地域范围之内。
在所述用户特征都确定之后,可以分别确定每个所述用户特征的阈值范围,其中所述阈值范围用于区分正常用户和疑似的异常用户。当某用户在某一用户特征上的特征值超出该用户特征的阈值范围时,则该用户可能为异常用户。其中,所述特征值是在一定统计周期内,用户特征所对应的取值,所述统计周期通常可以为至少一天。
其中,第k用户特征的阈值范围可以由与待识别用户属于同一用户组中的各个用户在第k用户特征上的特征值决定。其中,第k用户特征为所述n个用户特征中的任一个。例如,当第k用户特征为采用某种支付方式的用户量占比时,采用某种支付方式的用户量占比这一用户特征所对应的阈值范围可以由与待识别用户属于同一用户组中的各个用户采用某种支付方式的用户量占比决定。各个用户在第k用户特征上的特征值可以是在一个统计周期内的一个特征值,也可以是在多个统计周期内的多个特征值,其中,所述多个统计周期的长度可以相同也可以各不相同。
由于用户特征的阈值范围由同一用户组中的各个用户在所述用户特征上的特征值决定,对于同一个用户特征来说,不同用户组所对应的阈值范围也可能各不相同。因此采用该方式确定阈值范围,可以根据用户类型或位置的不同分别设定阈值范围,从而避免因为在用户数量较多时,为所有的用户设置同样的的阈值范围而造成异常用户识别不准确。由于用户特征的阈值范围由特征值决定,对于同一个用户特征来说,不同用户组所对应的阈值范围也可能各不相同,阈值范围更能反映用户是否为异常用户。
对于所述第n用户特征中任一个第k用户特征的阈值范围来说,都可以采用如下方式确定:首先获取所述用户组中每个用户在所述第i用户特征上的特征值;然后使用预定的计算方法根据所述特征值计算出所述阈值范围。其中,所述预定的计算方法可以是求平均值或者求加权平均值等。
具体来说,在确定第i用户特征的阈值范围时,如果所述待识别用户所属用户组中包含p个用户,那么可以首先获取所述p个用户中每个用户在所述第i用户特征上的特征值,从而得到p个特征值;然后计算出所述p个特征值的平均值;再根据所述平均值或作为所述阈值范围。在根据所述平均值或作为所述阈值范围时,可以直接将所述平均值作为是所述阈值范围的上限或下限,或者也可以根据所述平均值确定所述阈值范围的上限或下限。在根据所述平均值确定所述上限或下限时,可以在所述平均值的基础上增加或减少一定调整值后得到。
例如,当所述第i用户特征为频繁下单的用户量占比时,可以首先获取所述p个用户中每个用户的频繁下单的用户量占比,然后计算p个频繁下单的用户量占比的平均值,再将所述平均值所述频繁下单的用户量占比所对应阈值范围的上限,将0作为该阈值范围的下限。
又如,当所述第i用户特征为从用户下单到配送员取到餐的时间时,可以首先获取所述p个用户中每个用户从用户下单到配送员取到餐的时间,然后计算出从用户下单到配送员取到餐的时间的平均时间,再根据所述平均时间确定从用户下单到配送员取到餐的时间所对应的阈值范围,该阈值范围的上限可以是所述平均时间与允许幅度之和,下限则可以是所述平均时间与允许幅度之差。
除确定每一个所述用户特征的阈值范围之外,还要获取待识别用户在每一个所述用户特征上的用户特征值。当所述用户特征为n个时,需要获取n个用户特征值,其中每一个用户特征值与一个用户特征相对应。
步骤102,根据所述用户特征值及特征值正常范围确定所述待识别用户的用户特征中所存在的异常特征。
在各个阈值范围及各个用户特征值都确定后,可以根据所述用户特征值与所述阈值范围确定所述待识别用户所存在的异常特征。其中,所述异常特征是指待识别用户的用户特征值超出阈值范围的用户特征。所述异常特征的数量m为不小于0且不大于n的整数。
对于所述第n用户特征中任一个第k用户特征的阈值范围来说,如果待识别用户在第k用户特征上的用户特征值,超出第k用户特征的阈值范围;那么第k用户特征即为所述待识别用户所存在的异常特征。
步骤103,根据所述异常特征的特征值及所述异常特征的特征权重值,计算所述待识别用户的用户评分。
在异常特征确定之后,可以确定各个异常特征所对应的特征权重值,所述各个异常特征的特征权重值可以相等,例如,各个特征权重值均为1,或者,各个异常特征的权重也可以各不相等。
所述特征权重值可以为与所述用户组所对应的预设值,从而可以使得同一个异常特征对不同用户组中的用户来说有不同的特征权重值。例如,对第i异常特征来说,如果所述待识别用户属于第一用户组,那么第i异常特征的特征权重值可以为第一值,如果所述待识别用户属于第二用户组,那么第i异常特征的特征权重值可以为第二值,并且,第一值和第二值取值不同。
待识别用户的用户评分可以用如下公式计算:
其中,X为待识别用户的用户评分,w0为预设常量调整因子,wi表示第i异常特征的特征权重值,xi表示第i异常特征的特征值,m为所述异常特征的数量。所述预设常量调整因子用于误差调整,因此w0的取值可以为正数、负数或0。
为进一步增加识别结果的准确率,所述除可以根据所述异常特征计算所述用户评分之外,还可以同时根据正常特征及异常特征计算所述用户评分,其中,所述正常特征可以是所述用户特征中除所述异常特征之外的其他特征。用户评分也可以用如下公式计算:
其中,wk表示第k正常特征的特征权重值,xk表示第k正常特征的特征值,p为所述正常特征的数量,p与m之和为n。
采用此计算方式,由于正常用户也会存在一定的异常特征,采用此计算方式可以避免因某个异常特征的特征值过大,而导致误将正常用户识别为异常用户。
步骤104,根据所述用户评分生成用以指示待识别用户是否为异常用户的识别结果。
待识别用户的用户评分生成后,可以根据所述用户评分生成用以指示待识别用户是否为异常用户的识别结果。所述识别结果则可以用于指示待识别用户是否为异常用户。如果待识别用户的用户评分超过预设值,那么就可以认为所述待识别用户为异常用户;如果待识别用户的用户评分未超过预设值,那么就可以认为所述待识别用户为正常用户。
由于在异常特征数量较多时,不同用户的用户评分可能会存在数量级上的差异,从而导致技术人员无法直观验证作弊的判断结果;因此还可以将所述用户评分归一化至预定区间,从而得到归一化评分;然后根据归一化评分判断待识别用户是否为异常用户,例如,当所述归一化评分超出预设评分时,可以将所述待识别用户判定为异常用户;或者,将所述归一化评分未超出所述预设评分时,则可以将所述待识别用户判定为正常用户。通过归一化评分判定待识别用户是否为异常用户,可以使技术人员能够更方便更直观的验证判断结果。
采用本实施例,可以利用多个异常特征的特征值综合计算待识别用户的用户评分,因而可以减少因异常特征选取不准造成识别异常用户准确率低的问题。
由于在前述实施例中,所述阈值范围与所述特征权重值均为预先设定,而随着电商平台用户的不断变化,所述阈值范围与所述特征权重值也会不断发生变化,因此在实际使用中还可以根据对待识别用户的识别结果更新所述预设范围及特征权重值。因此,如图2所示,在步骤104之后,还可以包括:
步骤105,当所述识别结果准确时,将所述识别结果作为训练样本加入到样本库。
为调整所述预设范围及所述特征权重值,可以首先生成一个样本库。该样本库可以拥有收集使用前述实施例所述方法得到的识别结果。
在所述识别结果生成后,可以判断所述识别结果是否准确;如果识别结果准确的话,可以将所述识别结果作为训练样本加入到样本库,以便于进一步生成更优的特征权重值及阈值范围。
判断所述识别结果是否准确的方式有多种。例如,可以将所述识别结果与技术人员人工识别得出的识别结果进行比较,如果二者一致,则可以认为所述识别结果准确。或者,也可以将所述识别结果与采用其他方式识别得出的识别结果进行比较,如果二者一致,则可以认为所述识别结果准确。
步骤106,获取用于训练所述阈值范围与所述特征权重值的训练模型。
除生成样本库之外,还需要选择一个用于生成所述阈值范围与所述特征权重值的训练模型。所述训练模型的类型可以根据需要进行选择,包括但不限于逻辑回归模型(Logistic Regression,简称LR)、决策树、支持向量机(Support Vector Machine,简称SVM)、人工神经网络(Artificial Neural Network,简称ANN)、梯度递增决策树(GradientBoost Decision Tree,简称GBDT)等。
步骤107,使用所述样本库中的训练样本对所述训练模型进行训练,生成阈值范围训练值及特征权重训练值。
当所述样本库中收集到预定数量的识别结果过后,可以使用所述样本库中的训练样本对所述训练模型进行训练,从而生成阈值范围训练值及特征权重训练值。
以逻辑回归模型为例,计算所述特征权重的逻辑回归模型可以如下所示:
当所述训练样本库的识别结果达到一定数量后,可以根据识别结果计算出更准确的特征权重训练值。
步骤108,使用所述阈值范围训练值更新所述阈值范围,并使用所述特征权重训练值更新所述特征权重值。
在阈值范围训练值及特征权重训练值生成后,可以使用所述阈值范围训练值更新所述阈值范围,并使用所述特征权重训练值更新所述特征权重值。当再次进行异常用户识别时,可以使用更新后的特征化权重值及与之范围计算用户评分,从可以使用户评分更加准确,以进一步提升识别作弊时的识别准确率。
参见图3,为本申请异常用户识别装置一个实施例的结构示意图。
如图3所示,所述装置可以包括:获取单元301,确定单元302,计算单元303及生成单元304。
其中,获取单元301,用于获取待识别用户的用户特征值和用户特征值正常范围;确定单元302,用于根据所述用户特征值及阈值范围确定所述待识别用户所存在的异常特征,其中,所述异常特征是指所述待识别用户的用户特征值超出阈值范围的用户特征;计算单元303,用于根据所述异常特征的特征值及所述异常特征的特征权重值,计算所述待识别用户的用户评分;生成单元304,用于根据所述用户评分生成用以指示待识别用户是否为异常用户的识别结果,所述识别结果用户指示待识别用户是否为异常用户。
可选的,所述计算单元303,具体用于计算所述待识别用户的用户评分X,其中,或,为预设常量调整因子,wi表示第i异常特征的特征权重值,xi表示第i异常特征的特征值,m为所述异常特征的数量,wk表示第k正常特征的特征权重值,xk表示第k正常特征的特征值,p为正常特征的数量,正常特征为所述用户特征中除所述异常特征之外的其他特征。
可选的,所述阈值范围确定单元302包括:特征值获取子单元,用于获取所述用户组中每个用户在所述第k用户特征上的特征值;阈值范围计算子单元,用于根据同组用户在所述第k用户特征上的特征值的平均值确定所述阈值范围。
可选的,所述生成单元304包括:归一化子单元,用于将所述用户评分归一化至预定区间,从而得到归一化评分;结果生成子单元,用于当所述归一化评分超出预设评分时,将所述待识别用户判定为异常用户;或者,用于当所述归一化评分未超出所述预设评分时,将所述待识别用户判定为正常用户。
可选的,所述装置还可以包括:训练样本添加单元,用于在所述识别结果准确时,将所述识别结果作为训练样本加入到样本库;训练模型选择单元,用于获取用于训练所述阈值范围与所述特征权重值的训练模型;模型训练单元,用于使用所述样本库中的训练样本对所述训练模型进行训练,生成阈值范围训练值及特征权重训练值;更新单元,用于使用所述阈值范围训练值更新所述阈值范围,并使用所述特征权重训练值更新所述特征权重值。
具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的异常用户识别方法的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
以上所述的本发明实施方式并不构成对本发明保护范围的限定。
Claims (16)
1.一种异常用户识别方法,其特征在于,所述方法包括:
获取待识别用户的用户特征值和用户特征值正常范围;
根据所述用户特征值及特征值正常范围确定所述待识别用户的用户特征中所存在的异常特征;
根据所述异常特征的特征值及所述异常特征的特征权重值,计算所述待识别用户的用户评分;
根据所述用户评分生成用以指示待识别用户是否为异常用户的识别结果。
2.如权利要求1所述的方法,其特征在于,所述根据所述异常特征的特征值及所述异常特征的特征权重值,计算所述待识别用户的用户评分包括:
计算所述待识别用户的用户评分X,其中,w0为预设常量调整因子,wi表示第i异常特征的特征权重值,xi表示第i异常特征的特征值,m为所述异常特征的数量。
3.如权利要求1所述的方法,其特征在于,所述根据所述异常特征的特征值及所述异常特征的特征权重值,计算所述待识别用户的用户评分包括:
计算所述待识别用户的用户评分X,其中,w0为预设常量调整因子,wi表示第i异常特征的特征权重值,xi表示第i异常特征的特征值,m为所述异常特征的数量,wk表示第k正常特征的特征权重值,xk表示第k正常特征的特征值,p为正常特征的数量,正常特征为所述用户特征中除所述异常特征之外的其他特征。
4.如权利要求2或3所述的方法,其特征在于,所述用户特征的特征权重值均为与所述用户组所对应的预设值。
5.如权利要求1所述的方法,其特征在于,获取待识别用户的用户特征的特征值正常范围包括:
获取所述用户组中每个用户在所述用户特征上的特征值;
根据同组用户在所述用户特征上的特征值的平均值确定所述特征值正常范围。
6.如权利要求1所述的方法,其特征在于,所述同组用户是指与待识别用户属于同一预设地域范围内的用户。
7.如权利要求1所述的方法,其特征在于,所述根据所述用户评分生成用以指示待识别用户是否为异常用户的识别结果包括:
将所述用户评分归一化至预定区间,从而得到归一化评分;
当所述归一化评分超出预设评分时,将所述待识别用户判定为异常用户;或者,
当所述归一化评分未超出所述预设评分时,将所述待识别用户判定为正常用户。
8.如权利要求1所述的方法,其特征在于,还包括:
当所述识别结果准确时,将所述识别结果作为训练样本加入到样本库;
获取用于训练所述特征值正常范围与所述特征权重值的训练模型;
使用所述样本库中的训练样本对所述训练模型进行训练,生成特征值正常范围训练值及特征权重训练值;
使用所述特征值正常范围训练值更新所述特征值正常范围,并使用所述特征权重训练值更新所述特征权重值。
9.一种异常用户识别装置,其特征在于,所述装置包括:
获取单元,用于获取待识别用户的用户特征值和用户特征值正常范围;
确定单元,用于根据所述用户特征值及特征值正常范围确定所述待识别用户的用户特征中所存在的异常特征;
计算单元,用于根据所述异常特征的特征值及所述异常特征的特征权重值,计算所述待识别用户的用户评分;
生成单元,用于根据所述用户评分生成用以指示待识别用户是否为异常用户的识别结果。
10.如权利要求9所述的装置,其特征在于,
所述计算单元,具体用于计算所述待识别用户的用户评分X,其中,w0为预设常量调整因子,wi表示第i异常特征的特征权重值,xi表示第i异常特征的特征值,m为所述异常特征的数量。
11.如权利要求9所述的装置,其特征在于,
所述计算单元,具体用于计算所述待识别用户的用户评分X,其中,w0为预设常量调整因子,wi表示第i异常特征的特征权重值,xi表示第i异常特征的特征值,m为所述异常特征的数量,wk表示第k正常特征的特征权重值,xk表示第k正常特征的特征值,p为正常特征的数量,正常特征为所述用户特征中除所述异常特征之外的其他特征。
12.如权利要求10或11所述的装置,其特征在于,所述用户特征的特征权重值均为与所述用户组所对应的预设值。
13.如权利要求9所述的装置,其特征在于,
所述获取单元,还用于获取所述用户组中每个用户在所述用户特征上的特征值;根据同组用户在所述用户特征上的特征值的平均值确定所述特征值正常范围。
14.如权利要求9所述的装置,其特征在于,所述同组用户是指与待识别用户属于同一预设地域范围内的用户。
15.如权利要求9所述的装置,其特征在于,所述生成单元包括:
归一化子单元,用于将所述用户评分归一化至预定区间,从而得到归一化评分;
结果生成子单元,用于当所述归一化评分超出预设评分时,将所述待识别用户判定为异常用户;或者,用于当所述归一化评分未超出所述预设评分时,将所述待识别用户判定为正常用户。
16.如权利要求9所述的装置,其特征在于,所述装置还包括:
训练样本添加单元,用于在所述识别结果准确时,将所述识别结果作为训练样本加入到样本库;
训练模型选择单元,用于获取用于训练所述阈值范围与所述特征权重值的训练模型;
模型训练单元,用于使用所述样本库中的训练样本对所述训练模型进行训练,生成阈值范围训练值及特征权重训练值;
更新单元,用于使用所述阈值范围训练值更新所述阈值范围,并使用所述特征权重训练值更新所述特征权重值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610696819.5A CN107093085A (zh) | 2016-08-19 | 2016-08-19 | 异常用户识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610696819.5A CN107093085A (zh) | 2016-08-19 | 2016-08-19 | 异常用户识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107093085A true CN107093085A (zh) | 2017-08-25 |
Family
ID=59646070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610696819.5A Pending CN107093085A (zh) | 2016-08-19 | 2016-08-19 | 异常用户识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107093085A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108921569A (zh) * | 2018-06-01 | 2018-11-30 | 阿里巴巴集团控股有限公司 | 一种确定用户投诉类型的方法及装置 |
CN109902486A (zh) * | 2019-01-24 | 2019-06-18 | 平安科技(深圳)有限公司 | 电子装置、异常用户处理策略智能决策方法及存储介质 |
CN110533297A (zh) * | 2019-08-02 | 2019-12-03 | 中国银联股份有限公司 | 一种识别异常设备的方法及装置 |
CN110706026A (zh) * | 2019-09-25 | 2020-01-17 | 精硕科技(北京)股份有限公司 | 一种异常用户的识别方法、识别装置及可读存储介质 |
CN110717758A (zh) * | 2019-10-10 | 2020-01-21 | 支付宝(杭州)信息技术有限公司 | 异常交易识别方法和装置 |
CN110889745A (zh) * | 2019-11-22 | 2020-03-17 | 无线生活(北京)信息技术有限公司 | 一种智能识别抢购行为的方法及装置 |
CN110991241A (zh) * | 2019-10-31 | 2020-04-10 | 支付宝(杭州)信息技术有限公司 | 异常识别方法、设备及计算机可读介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060045934A1 (en) * | 2004-08-25 | 2006-03-02 | Cadbury Adams Usa Llc | Liquid-filled chewing gum composition |
CN103763152A (zh) * | 2014-01-07 | 2014-04-30 | 中国移动(深圳)有限公司 | 一种电信欺诈行为多维监测方法和系统 |
CN103970727A (zh) * | 2013-01-29 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 基于话题的反作弊方法、装置和服务器 |
CN104915843A (zh) * | 2015-06-12 | 2015-09-16 | 浙江力石科技股份有限公司 | 互联网交易信誉度评定方法 |
CN105404947A (zh) * | 2014-09-02 | 2016-03-16 | 阿里巴巴集团控股有限公司 | 用户质量侦测方法及装置 |
CN105678457A (zh) * | 2016-01-06 | 2016-06-15 | 成都小步创想畅联科技有限公司 | 基于地点挖掘的用户行为评估方法 |
-
2016
- 2016-08-19 CN CN201610696819.5A patent/CN107093085A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060045934A1 (en) * | 2004-08-25 | 2006-03-02 | Cadbury Adams Usa Llc | Liquid-filled chewing gum composition |
CN103970727A (zh) * | 2013-01-29 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 基于话题的反作弊方法、装置和服务器 |
CN103763152A (zh) * | 2014-01-07 | 2014-04-30 | 中国移动(深圳)有限公司 | 一种电信欺诈行为多维监测方法和系统 |
CN105404947A (zh) * | 2014-09-02 | 2016-03-16 | 阿里巴巴集团控股有限公司 | 用户质量侦测方法及装置 |
CN104915843A (zh) * | 2015-06-12 | 2015-09-16 | 浙江力石科技股份有限公司 | 互联网交易信誉度评定方法 |
CN105678457A (zh) * | 2016-01-06 | 2016-06-15 | 成都小步创想畅联科技有限公司 | 基于地点挖掘的用户行为评估方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108921569A (zh) * | 2018-06-01 | 2018-11-30 | 阿里巴巴集团控股有限公司 | 一种确定用户投诉类型的方法及装置 |
CN109902486A (zh) * | 2019-01-24 | 2019-06-18 | 平安科技(深圳)有限公司 | 电子装置、异常用户处理策略智能决策方法及存储介质 |
CN110533297A (zh) * | 2019-08-02 | 2019-12-03 | 中国银联股份有限公司 | 一种识别异常设备的方法及装置 |
CN110533297B (zh) * | 2019-08-02 | 2023-04-14 | 中国银联股份有限公司 | 一种识别异常设备的方法及装置 |
CN110706026A (zh) * | 2019-09-25 | 2020-01-17 | 精硕科技(北京)股份有限公司 | 一种异常用户的识别方法、识别装置及可读存储介质 |
CN110717758A (zh) * | 2019-10-10 | 2020-01-21 | 支付宝(杭州)信息技术有限公司 | 异常交易识别方法和装置 |
CN110991241A (zh) * | 2019-10-31 | 2020-04-10 | 支付宝(杭州)信息技术有限公司 | 异常识别方法、设备及计算机可读介质 |
CN110991241B (zh) * | 2019-10-31 | 2022-06-03 | 支付宝(杭州)信息技术有限公司 | 异常识别方法、设备及计算机可读介质 |
CN110889745A (zh) * | 2019-11-22 | 2020-03-17 | 无线生活(北京)信息技术有限公司 | 一种智能识别抢购行为的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107093085A (zh) | 异常用户识别方法及装置 | |
CN108846520B (zh) | 贷款逾期预测方法、装置以及计算机可读存储介质 | |
TWI584215B (zh) | 監控可疑交易的方法 | |
CN105677831B (zh) | 一种确定推荐商户的方法及装置 | |
CN109101989A (zh) | 一种商户分类模型构建和商户分类方法、装置及设备 | |
CN109242261A (zh) | 基于大数据评估保全风险的方法及终端设备 | |
CN106940702A (zh) | 连接短文本中实体提及与语义知识库中实体的方法和设备 | |
CN107944593A (zh) | 一种资源分配方法及装置,电子设备 | |
US20170024783A1 (en) | Methods and systems for ranking merchants | |
CN104517052B (zh) | 一种入侵检测方法及装置 | |
CN106485528A (zh) | 检测数据的方法和装置 | |
CN107185243A (zh) | 一种网络游戏外挂的识别方法 | |
CN110930218B (zh) | 一种识别欺诈客户的方法、装置及电子设备 | |
CN108320220A (zh) | 一种用户信用度的评估系统及方法 | |
CN107526810A (zh) | 建立点击率预估模型的方法及装置、展示方法及装置 | |
CN108200082A (zh) | Ota平台的用于识别用户恶意刷单的方法及系统 | |
CN109902441A (zh) | 一种基于kano模型原理的车辆性能指标权重分配系统及方法 | |
CN110458580A (zh) | 一种异常渠道检测方法、装置、介质及设备 | |
CN113407854A (zh) | 一种应用推荐方法、装置、设备及计算机可读存储介质 | |
CN111144899B (zh) | 识别虚假交易的方法及装置和电子设备 | |
CN108492049A (zh) | 一种基于逻辑回归的p2p平台运营风险评估的系统 | |
CN109299975B (zh) | 对象特征参数确定方法、装置、电子设备及可读存储介质 | |
CN105160003B (zh) | 一种基于地理位置的app检索排序方法及系统 | |
WO2014206088A1 (en) | Method and device for preventing use of game plug-ins in online games | |
CN109685643A (zh) | 贷款审核中风险等级确定方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100085 Beijing, Haidian District on the road to the information on the ground floor of the 1 to the 3 floor of the 2 floor, room 11, 202 Applicant after: Beijing Xingxuan Technology Co.,Ltd. Address before: 100085 Beijing, Haidian District on the road to the information on the ground floor of the 1 to the 3 floor of the 2 floor, room 11, 202 Applicant before: Beijing Xiaodu Information Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170825 |
|
RJ01 | Rejection of invention patent application after publication |