具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
为了解决上述问题,本说明书提供了一种风险识别方法,以下可以参考图1所示的例子介绍,该方法可以应用于业务平台的服务器,所述方法可以包括以下步骤:
步骤110:获取针对参与业务活动的商户所记录的登录设备和活动记录。
本说明书中,服务器采集并存储商户在参与活动期间产生的基础数据。所述基础数据包括但不限于:
(1)活动记录数据:交易数据、账务数据等;反映了商户在参与业务活动期间产生的交易情况、资金变动情况。
(2)基本信息数据:商户的LBS信息、所属行业、推广渠道、商户类型等;反映了商户的基本信息。
(3)日志行为数据:登录设备信息、登录时间等。反映了商户在参与业务活动期间登录账户使用的设备情况。
一般的,每个数据都可以按照<商户、业务日期>这一粒度进行存储。所述业务日期的单位可以基于业务需求进行配置。例如可以以天为单位,也可以以小时为单元,还可以以周或月为单位。
登录设备可以是指商户登录账号时所使用的设备。以下为了方便说明存在将登录设备简称为设备的情况。
登录设备信息的记录可以为<登录时间、商户ID、设备ID>。如图2a所示,在某个时间段内的设备登录信息中,商户和登录设备可以形成一个“二分图”。图2a中的左边节点可以表示商户、右边节点可以表示登录设备,并且商户与登录设备通过“边”(图中连线)建立关联关系,在商户与设备存在边时,就可以表示商户使用该设备登录过账户;例如图2a中商户A使用设备1进行登录。边可以记为<X,Y>,X表示商户,Y表示登录设备。商户之间不存在边连接,登录设备之间也不存在边连接。
在一实施例中,服务器可以是针对业务活动期间的某个时间段进行的风险识别,即服务器可以针对某个时间段对参与业务活动的商户进行风险识别,例如一天
步骤120:根据所述商户对应的登录设备,计算各个商户与其它商户共用设备的设备聚集度。
本说明书中,提供了一种用于记录使用共用登录设备的商户之间的关联关系的商户登录设备关系图。
如图2b所示的一种可视化的商户登录设备关系图,该商户登录设备关系图是基于图2a中的登录设备计算得到的。图2b中,节点仅表示商户,当商户与商户共同使用一台设备登录账户时,就会建立关联关系即商户与商户之间的连线“边”,并且边上还标注有共用登录设备的数量,如图2b中商户A与商户B之间存在1台共同使用的登录设备(结合图2a可知,共同使用的是设备1),商户C与商户D之间存在2台共同使用的登录设备(结合图2a可知,共同使用的是设备1、3)。
具体地,所述步骤120,可以包括:
A1:根据所述商户对应的登录设备,生成商户登录设备关系图;其中,所述商户登录设备关系图记录了使用共用登录设备的商户之间的关联关系;
A2:基于所述商户登录设备关系图,计算各个商户与其它商户共用登录设备的设备聚集度。
本实施例中,将登录设备信息转换到商户登录设备关系图的过程可以通过本说明书提供的一种数学计算公式实现:
具体地,所述步骤A1,可以包括:
A11:建立商户设备关系图为N*N的邻接矩阵A,令所述邻接矩阵A内每个元素A_i_j=0;其中1≤i≤N,1≤j≤N,N为商户数量;
A12:根据各个商户对应的登录设备,统计每台登录设备对应的商户集合;
A13:针对每台登录设备的商户集合,任取所述商户集合中2个商户进行排列,并令每种排列方式对应在邻接矩阵A中的元素A_i_j值加1;所述元素A_i_j值表示商户与商户之间共用登录设备的数量;
A14:将最终的邻接矩阵A确定为商户设备关系图。
举例说明:假设有3个商户A,B,C,2台设备1,2;
登录设备数据包含:
1、[设备1,商户A]
2、[设备1,商户B]
3、[设备1,商户C]
4、[设备2,商户A]
首先,建立3*3的邻接矩阵,并初始化该邻接矩阵;令邻接矩阵内的元素为0,得到:
该邻接矩阵A的元素都是0,说明书任何商户之间都没有关系,并且商户本身也没有使用过登录设备。
接着,遍历登录设备数据,统计每台登录设备对应的商户集合:
设备1有3条登录设备数据,对应的商户包括商户A、商户B和商户C,从而可以生成商户集合[A,B,C],将设备1与商户集合记为:[1,[A,B,C]]。
设备2有1条登录设备数据,对应的商户包括商户A,从而可以生成商户集合[A],将设备2与商户集合记为:[1,[A]]。
然后,分别对设备1和设备2对应的商户集合中任取2个商户进行排列:
针对设备1,商户集合[A,B,C]中任取2个商户进行排列,
存在6种不同的排列方式,具体包括[A,A]、[A,B]、[A,C]、[B,B]、[B,C]、[C,C];
针对设备2,商户集合[A]中任取2个商户进行排列,
存在1种不同的排列方式,具体包括[A,A]。
之后,将每种排列方式的商户对应在邻接矩阵A中的元素A_i_j值加1:
基于设备1的6种排列方式,邻接矩阵更新为:
基于设备2的1种排列方式,邻接矩阵再次更新为:
输出该邻接矩阵,其中每个元素的数值表示对应的商户之间登录设备的数量,例如商户A和商户A(商户A自身)使用过2台登录设备;商户A和商户B共同使用过1台登录设备,等等。
本实施例中,基于商户登录设备关系图计算设备聚集度的过程同样可以通过本说明书提供的另一种数学计算公式实现:
具体地,所述步骤A2,可以包括:
A21:针对每个商户,遍历商户登录设备关系图中该商户所有邻接商户,得到邻接商户集合;所述邻接商户为与商户具有共用登录设备的商户。
A22:令中间值S=0,遍历所述邻接商户集合中邻接商户的数值,在所述数值大于0时,令S加1;
A23:计算商户的设备聚合度Agg=S/Max(S,(N*N)/2)。
其中,Max(S,(N*N)/2)是指,选取S和(N*N)/2)中的较大值,然后Agg取值为S与这个较大值的比值。
以商户A为例,商户A的邻接商户集合[AB(1),AC(1)];另S=0,由于AB=1大于0,所以S+1=1;又由于AC=1大于0,所以S+1=2;最终商户的中间值S=2。
然后,商户A的Agg=2/Max(2,(2*2)/2)=1。
其它商户的Agg计算过程类似,不再进行赘述。
该实施例中,不仅利用商户登录设备关系图这样的拓扑数据,而且还结合了“边”和“节点”的信息(即商户与邻接商户的数值)从而可以计算出更为准确的设备聚集度。
步骤130:根据所述商户对应的活动记录,计算各个商户的资金回报率。
本说明书中所述资金回报率也可以称为投资回报率(Return on Inves tment,ROI)是业务平台提供给参与业务活动的商户的资金奖励(相当于投资成本,Inves tment)后,该商户利用资金奖励取得的经济回报(相当于回报产出,Return)。一般的ROI可以用于衡量商户盈利状况所使用的比率,或者也可以用于衡量商户经营效果和效率的一项综合性的指标。
具体地,所述资金回报率ROI可以包括以下至少一种:
活动资金消耗速度(Velocity),交易频率波动(Frequency)和所有消耗的活动资金(Fund)。
其中,活动资金消耗速度反映业务速度,交易频率波动反映了业务波动,所有消耗的活动资金反映了业务总量。这3个核心指标,简单实用,能够作为通用ROI模型,来评估商户业务质量,进一步识别业务风险。
相应地,所述步骤130,包括以下至少一种:
针对每个商户,获取商户参与业务活动消耗的最大活动资金(max_fund),以及消耗该最大活动资金所消耗的时间(time),并将最大活动资金与所消耗的时间的比值作为商户的活动资金消耗速度(Velocity=max_fund/time);
针对每个商户,获取商户参与业务活动消耗的最大活动资金,并将商户参与业务活动消耗的最大活动资金作为商户的所有消耗活动资源(Fund=max_fund);
针对每个商户,获取商户在参与业务活动前的交易频率(R_before)、参与业务活动后的交易频率(R_after),并将参与业务活动前后的交易频率的比值作为商户的交易频率波动(Frequency=R_after/R_before)。
如图3所示,可以用“活动消耗速度”、“交易频率波动”、“所有消耗的活动资金”这3个核心指标,即<Velocity,Frequency,Fund>评估每个商户的活动ROI数据。
步骤140:根据各个商户的设备聚集度和资金回报率,识别各个商户是否存在套取所述业务活动提供的资金的风险。
在计算出各个商户的设备聚集度和资金回报率之后,服务器就可以利用商户的设备聚集度和资金回报率识别并确定是否存在套取所述业务活动提供的资金的风险。
具体地,所述步骤140,可以包括:
B1:根据各个商户的设备聚集度和资金回报率,计算各个商户套取所述业务平台提供资金的异常分;
B2:再根据所述异常分确定各个商户是否存在套取所述业务平台提供资金的风险。
本说明书提供了一种计算异常分的算法,即B1可以包括:
B11:利用无监督异常检测算法,根据当前商户的设备聚集度和资金回报率计算当前商户的基础异常分;
B12:将各个商户的资金回报率包含的每种核心指标分别进行排序,获取当前商户的每种核心指标的排名;
B13:将当前商户的每种核心指标的排名累加后乘以所述基础异常分,得到当前商户的异常分。
如图4所示,可以将设备聚合度和ROI在<商户、业务日期>维度进行拼接,形成每天的商户特征数据<Agg,Velocity,Frequency,Fund>。
在一实施例中,在拼接所述商户特征数据时,还可以加入前述活动记录数据、基本信息数据中的任意特征,例如将“交易金额”、“交易笔数”、“留存率”等作为ROI中衍生指标进行补充;再或者将“商户LBS”、“设备类型”、“商户类型”、“行业”、“推广渠道”等作为其它维度的衍生指标进行补充。
通常,上述衍生指标一般是可以影响异常分的各个维度,将越多的影响维度进行计算可以使得异常分计算结果越趋于准确,但是也会造成计算复杂度的增加,所要消耗的计算资源、计算时间也越长;因此,根据实际需要,结合可用的计算资源,可以灵活调整衍生指标数量和哪些衍生指标的拼接。可见,本说明书提供的ROI数据可扩展性好,能够兼容其他的业务数据特征。
利用无监督异常检测算法,计算每个商户的基础异常分Score;其中,设备聚合度-ROI的商户特征数据越离散,基础异常分越高;反之,商户特征数据越聚集,基础异常分越高。
无监督异常检测算法属于机器学习的一种,无监督异常检测算法需要预先进行学习训练。在训练出符合要求的无监督异常检测算法后,就可以利用该无监督异常检测算法计算商户的基础异常分Score。
一般的,通过设置合理的函数,可以借助机器学习算法从采集到的海量训练集中找出规律。所述训练集可以是指打标了基础异常分的商户特征数据,可以记为<商户特征数据,基础异常分>。例如孤立森林算法(Isolation Forest)、支持向量机算法(如one-classSVM,单类支持向量机),局部异常因子算法(Local Outlier Factor,LOF)等无监督异常检测算法,都可以用于针对训练集进行模型训练,从而得出函数中各个参数的系数,最终得到统一的方程、算法或者计算公式。
例如,得到统一的用于计算基础异常分的算法如下:
Y_基础异常分=a*X_agg+b*X_Velocity+c*X_Frequency+d*X_Fund+e
公式1
其中,上述a,b,c,d,e等即为函数中各个参数的系数。
这样,在计算得到每个商户的设备聚合度agg、活动资金消耗速度(Velocity),交易频率波动(Frequency)和所有消耗的活动资金(Fund)之后,可以利用上述公式1计算每个商户的基础异常分(将当前商户的X_agg、X_Velocity、X_Frequency、X_Fund代入公式1,从而计算得到Y_基础异常分)。
所述孤立森林算法通常用于从所有样本点中选择孤立异常点,不再描述正常的样本点。在孤立森立中,异常被定义为容易被孤立的离群点(more likely to beseparated),可以将其理解为分布系数且离密度高的群体较远的点。在特征空间中,分布稀疏的区域表示时间发送在该区域的概率较低,因而可以认为落在这些分布稀疏区域里的数据是异常的。
基于孤立森林的异常检测包括两个步骤:训练阶段,基于训练集的子样本来建立孤立树iTree;测试阶段,用iTree为每一个测试样本计算异常分数。
在训练阶段,iTree的建立是通过对训练集的递归分隔来建立的,直到所有的样本被孤立,或者iTree达到了指定的高度。iTree的高度限制L与子样本数量ψ的关系为L=ceiling(log2(ψ))。由于只需要关注路径长度较小的那些异常点,而并不需要关注路径很长的正常点;因此,iTree只需要生长到平均高度,而不需要继续生长。
样本点x的路径长度h(x)为从iTree的根节点到叶子节点所经过的边的数量。
给定一个包含n个样本的数据集,树的平均路径长度为:
c(n)=2H(n-1)-2(n-1)/n;
其中H(i)为调和数,该值可以被估计为ln(i)+0.5772156649。c(n)为给定样本数n时,路径长度的平均值,用来标准化样本x的路径长度h(x)。
样本x的异常得分定义为
s(x,n)=2-E(h(x))/c(n)
其中,E(h(x))为样本x在孤立树中的路径长度的期望。由图5所示的s和E(h(x))的关系示意图可知:
当E(h(x))→c(n)时,s→0.5,即样本x的路径平均长度与树的平均路径长度相近时,则不能区分是不是异常。
当E(h(x))→0时,s→1,即x的异常分数接近1时,被判定为异常。
当E(h(x))→n-1时,s→0,被判定为正常。
本实施例中,孤立森林算法并非确定最终异常点,而是需要计算样本X的异常得分即可,也就是说在训练了孤立森林算法后,将当前商户的商户特征数据输入后,将中间计算过程中输出的异常得分作为商户的基础异常分即可。
在一实施例中,在计算出各个商户的异常分之后,进而可以根据所述异常分确定各个商户是否存在套取所述业务平台提供资金的风险,具体地:
将各个商户的异常分进行排序,将排在前预设比例的异常分对应的商户确定为存在套取所述业务平台提供资金的风险。
具体地,在计算出商户的基础异常分Score之后,利用各个商户的资金回报率包含的每个核心指标进行排名(根据取值从小到大排序),得到每个商户的3个排名:R_Velocity,R_Frequency,R_Fund,最终每个商户的异常分为:Score_F=Score*(R_Velocity+R_Frequency+R_Fund)。所述预设比例可以是预设的经验值。例如将异常分Score_F在前30%作为作为最终的风险商户。
该实施例中,在计算出基础异常分之后,通过商户的ROI核心指标的排名数据,加权更新异常分,能够让风险识别结果更加符合业务要求,识别结果更为准确。
在一实施例中,根据所述异常分确定各个商户是否存在套取所述业务平台提供资金的风险,可以包括:
可以是将异常分大于阈值的商户确定为存在套取所述业务平台提供资金的风险。
所述阈值可以是人为预先设定的经验值。
随着计算机技术的不断发展,特别是人工智能的进步,所述阈值还可以是通过机器学习计算得到的。例如,基于历史风险识别的阈值,通过机器学习算法可以计算出一个最优的阈值。
再有的,所述阈值还可以是基于大数据技术计算得到的。例如,通过海量数据,发现大部分风险识别时,设定的阈值均为0.5,则本实施例阈值也可以设定为0.5。
本实施例,针对业务活动场景,提供了一种通用的风险识别方案,通过计算参与业务活动商户的设备聚集度和资金回报率,并综合参考设备聚集度和资金回报率识别各个商户是否存在套取所述业务活动提供的资金的风险。由于设备聚集度是基于商户的登录设备数据计算的,属于“日志行为数据”;资金回报率是基于商户的活动数据计算的,属于“业务经营数据”;因此,该方案实现了有效兼容“业务经营数据”和“日志行为数据”,从而提升了识别准确率。
与前述风险识别方法实施例相对应,本说明书还提供了风险识别装置的实施例。所述装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在设备的处理器将非易失性存储器中对应的计算机业务程序指令读取到内存中运行形成的。从硬件层面而言,如图6所示,为本说明书风险识别装置所在设备的一种硬件结构图,除了图6所示的处理器、网络接口、内存以及非易失性存储器之外,实施例中装置所在的设备通常根据风险识别实际功能,还可以包括其他硬件,对此不再赘述。
请参见图7,为本说明书一实施例提供的风险识别装置的模块图,所述装置对应了图1所示实施例,所述装置包括:
获取单元310,获取针对参与业务活动的商户所记录的登录设备和活动记录;
第一计算单元320,根据所述商户对应的登录设备,计算各个商户与其它商户共用设备的设备聚集度;
第二计算单元330,根据所述商户对应的活动记录,计算各个商户的资金回报率;
识别单元340,根据各个商户的设备聚集度和资金回报率,识别各个商户是否存在套取所述业务活动提供的资金的风险
可选的,所述第一计算单元320,包括:
生成子单元,根据所述商户对应的登录设备,生成商户登录设备关系图;其中,所述商户登录设备关系图记录了使用共用登录设备的商户之间的关联关系;
第一计算子单元,基于所述商户登录设备关系图,计算各个商户与其它商户共用登录设备的设备聚集度。
可选的,所述生成子单元,包括:
建立子单元,建立商户设备关系图为N*N的邻接矩阵,令所述邻接矩阵内每个元素的值为0;其中,N为商户数量;
统计子单元,根据各个商户对应的登录设备,统计每台登录设备对应的商户集合;
更新子单元,针对每台登录设备的商户集合,任取所述商户集合中2个商户进行排列,并令每种排列方式对应在邻接矩阵中元素的值加1;所述元素的值表示商户与商户之间共用登录设备的数量。
可选的,所述第一计算子单元,包括:
遍历子单元,针对每个商户,遍历商户登录设备关系图中该商户所有邻接商户,得到邻接商户集合;
中间值计算子单元,令中间值S为0,遍历所述邻接商户集合中邻接商户的数值,在所述数值大于0时,令中间值S加1;
设备聚合度计算子单元,计算商户的设备聚合度Agg=S/Max(S,N*N/2)。
可选的,所述资金回报率包括以下至少一种:
活动资金消耗速度,交易频率波动和所有消耗的活动资金。
可选的,所述第二计算单元330,包括以下至少一种:
速度计算子单元,针对每个商户,获取商户参与业务活动消耗的最大活动资金,以及消耗该最大活动资金所消耗的时间,并将最大活动资金与所消耗的时间的比值作为商户的活动资金消耗速度;
资源计算子单元,针对每个商户,获取商户参与业务活动消耗的最大活动资金,并所述最大活动资金作为商户的所有消耗活动资源;
频率计算子单元,针对每个商户,获取商户在参与业务活动前后的交易频率,并将参与业务活动前后的交易频率的比值作为商户的交易频率波动。
可选的,所述识别单元340,包括:
第三计算子单元,根据各个商户的设备聚集度和资金回报率,计算各个商户套取所述业务平台提供资金的异常分;
确定子单元,根据所述异常分确定各个商户是否存在套取所述业务平台提供资金的风险。
可选的,所述第三计算子单元,包括:
基础异常分计算子单元,利用无监督异常检测算法,根据当前商户的设备聚集度和资金回报率计算当前商户的基础异常分;
排序子单元,将各个商户的资金回报率包含的每种核心指标分别进行排序,获取当前商户的每种核心指标的排名;
异常分计算子单元,将当前商户的每种核心指标的排名累加后乘以所述基础异常分,得到当前商户的异常分。
可选的,所述确定子单元,包括:
将各个商户的异常分进行排序,将排在前预设比例的异常分对应的商户确定为存在套取所述业务平台提供资金的风险。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上图7描述了风险识别装置的内部功能模块和结构示意,其实质上的执行主体可以为一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取针对参与业务活动的商户所记录的登录设备和活动记录;
根据所述商户对应的登录设备,计算各个商户与其它商户共用设备的设备聚集度;
根据所述商户对应的活动记录,计算各个商户的资金回报率;
根据各个商户的设备聚集度和资金回报率,识别各个商户是否存在套取所述业务活动提供的资金的风险。
可选的,所述根据所述商户对应的登录设备,计算各个商户与其它商户共用设备的设备聚集度,包括:
根据所述商户对应的登录设备,生成商户登录设备关系图;其中,所述商户登录设备关系图记录了使用共用登录设备的商户之间的关联关系;
基于所述商户登录设备关系图,计算各个商户与其它商户共用登录设备的设备聚集度。
可选的,所述根据所述商户对应的登录设备,生成商户登录设备关系图,包括:
建立商户设备关系图为N*N的邻接矩阵,令所述邻接矩阵内每个元素的值为0;其中,N为商户数量;
根据各个商户对应的登录设备,统计每台登录设备对应的商户集合;
针对每台登录设备的商户集合,任取所述商户集合中2个商户进行排列,并令每种排列方式对应在邻接矩阵中元素的值加1;所述元素的值表示商户与商户之间共用登录设备的数量。
可选的,所述基于所述商户登录设备关系图,计算各个商户与其它商户共用登录设备的设备聚集度,包括:
针对每个商户,遍历商户登录设备关系图中该商户所有邻接商户,得到邻接商户集合;
令中间值S=0,遍历所述邻接商户集合中邻接商户的数值,在所述数值大于0时,令S加1;
计算商户的设备聚合度Agg=S/Max(S,N*N/2)。
可选的,所述资金回报率包括以下至少一种:
活动资金消耗速度,交易频率波动和所有消耗的活动资金。
可选的,所述根据所述商户对应的活动记录,计算各个商户的资金回报率,包括以下至少一种:
针对每个商户,获取商户参与业务活动消耗的最大活动资金,以及消耗该最大活动资金所消耗的时间,并将最大活动资金与所消耗的时间的比值作为商户的活动资金消耗速度;
针对每个商户,获取商户参与业务活动消耗的最大活动资金,并所述最大活动资金作为商户的所有消耗活动资源;
针对每个商户,获取商户在参与业务活动前后的交易频率,并将参与业务活动前后的交易频率的比值作为商户的交易频率波动。
可选的,所述根据各个商户的设备聚集度和资金回报率,识别各个商户是否存在套取所述业务平台提供资金的风险,包括:
根据各个商户的设备聚集度和资金回报率,计算各个商户套取所述业务平台提供资金的异常分;
根据所述异常分确定各个商户是否存在套取所述业务平台提供资金的风险。
可选的,所述根据各个商户的设备聚集度和资金回报率,计算各个商户套取所述业务平台提供资金的异常分中,每个商户的异常分计算方式为:
利用无监督异常检测算法,根据当前商户的设备聚集度和资金回报率计算当前商户的基础异常分;
将各个商户的资金回报率包含的每种核心指标分别进行排序,获取当前商户的每种核心指标的排名;
将当前商户的每种核心指标的排名累加后乘以所述基础异常分,得到当前商户的异常分。
可选的,所述根据所述异常分确定各个商户是否存在套取所述业务平台提供资金的风险,包括:
将各个商户的异常分进行排序,将排在前预设比例的异常分对应的商户确定为存在套取所述业务平台提供资金的风险。
在上述电子设备的实施例中,应理解,该处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,而前述的存储器可以是只读存储器(英文:read-only memory,缩写:ROM)、随机存取存储器(英文:random access memory,简称:RAM)、快闪存储器、硬盘或者固态硬盘。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于电子设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本说明书的其它实施方案。本说明书旨在涵盖本说明书的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本说明书的一般性原理并包括本说明书未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本说明书的真正范围和精神由下面的权利要求指出。
应当理解的是,本说明书并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本说明书的范围仅由所附的权利要求来限制。