风险识别方法及其系统
技术领域
本说明书涉及电子商务技术领域。
背景技术
对于商户的风险评估(即这个商户是高风险商户还是低风险商户),通常是通过对该商户的历史交易数据进行分析得到的。然而,根据统计学的规律,需要相当多的历史数据才可以作出比较准确的评估。对于新的业务(或者说风险评估策略在该业务中是冷启动的),商户往往是新的(甚至在交易平台中该商户没有参与过其他的业务),交易数据很少,无法根据历史交易数据进行比较准确的评估。
发明内容
本说明书提供了一种风险识别方法及其系统,能够在商户的历史交易数据很少的情况下对该商户的风险进行更为准确的识别。
本申请公开了一种风险识别方法,包括:
获取与第一商户交易的用户集合;
根据所述用户集合中用户与其他商户交易的历史数据进行风险评估,得到所述用户集合中用户的风险信息;
根据所述用户集合中用户的风险信息对所述第一商户进行风险评估。
在一个优选例中,所述根据所述用户集合中用户与其他商户交易的历史数据进行风险评估,得到所述用户集合中用户的风险信息,进一步包括:
根据通过云端风险评估和边缘端风险评估相结合的方式来确定所述用户集合中用户的风险信息。
在一个优选例中,所述根据通过云端风险评估和边缘端风险评估相结合的方式来确定所述用户集合中用户的风险信息,进一步包括:
对于所述用户集合中的每一个用户,将该用户在云端和边缘端的风险评分进行归一化,再计算两者的平均值,得到该用户的风险评分。
在一个优选例中,所述边缘端风险评估进一步包括在边缘端执行的以下步骤:
获取当前用户对移动终端和应用程序的当前使用习惯数据;
将所述当前使用习惯数据与被存储的该用户历史使用习惯数据相比较;
根据比较结果确定该用户的风险评分。
在一个优选例中,所述使用习惯数据包括以下之一或其任意组合:
拿移动终端的姿势,解锁方式,移动终端的触屏方式,使用特定应用程序的常用功能,对特定应用程序的打开方式。
在一个优选例中,所述云端风险评估包括:
根据用户是否出现在预先设定名单上,确定该用户的风险评分。
在一个优选例中,所述云端风险评估包括:
针对当前的业务主体和业务元素,将所有可以得到的变量,按照业务的逻辑聚合到各个知识点模块上,计算每个变量的异常度,将各知识模块下各变量异常度相加,得到每个知识模块的异常度,取各个知识模块中异常度最大的值作为风险的量化评分。
在一个优选例中,所述异常度是将一个变量的变量值与该变量的中位数之差除以该中位数,将所得取绝对值后取自然对数再取绝对值得到。
在一个优选例中,所述根据所述用户集合中用户的风险信息对所述第一商户进行风险评估,进一步包括:
所述用户集合中用户的风险评分是所述第一商户的风险评分的一个正相关因子。
在一个优选例中,所述根据所述用户集合中用户的风险信息对所述第一商户进行风险评估之后,还包括:
如果所述第一商户的风险评分高于预定门限并且所述第一商户是线下的,则通过区域匹配,向覆盖所述第一商户线下地址的第三方服务系统发送对所述第一商户进行实地认证的指令。
在一个优选例中,所述获取与第一商户交易的用户集合之前,还包括:
查询所述第一商户是否出现在预先设定的名单上,该名单包括至少一个商户的信息和商户对应的风险级别信息;
如果所述第一商户是否出现在所述名单上,则直接根据所述名单上所述第一商户所对应的风险级别信息确定所述第一商户的风险级别。
本申请还公开了一种风险识别系统包括:
用户获取单元,用于获取与第一商户交易的用户集合;
用户风险评估单元,用于根据所述用户集合中用户与其他商户交易的历史数据进行风险评估,得到所述用户集合中用户的风险信息;
商户风险评估单元,用于根据所述用户集合中用户的风险信息对所述第一商户进行风险评估。
在一个优选例中,所述用户风险评估单元进一步包括:
云端风险评估子单元,用于在云端进行风险评估;
边缘端风险评估子单元,用于在边缘端进行风险评估;
综合子单元,用于综合地根据所述云端风险评估子单元和所述边缘端风险评估子单元输出的风险评估结果确定用户的风险信息。
在一个优选例中,所述综合子单元通过将一个用户在云端和边缘端的风险评分进行归一化,再计算两者的平均值,得到该用户的风险评分。
在一个优选例中,所述边缘端风险评估子单元通过以下方式对用户进行风险评估:
获取当前用户对移动终端和应用程序的当前使用习惯数据;
将所述当前使用习惯数据与被存储的该用户历史使用习惯数据相比较;
根据比较结果确定该用户的风险评分。
在一个优选例中,所述使用习惯数据包括以下之一或其任意组合:
拿移动终端的姿势,解锁方式,移动终端的触屏方式,使用特定应用程序的常用功能,对特定应用程序的打开方式。
在一个优选例中,所述云端风险评估子单元根据用户是否出现在预先设定名单上,确定该用户的风险评分。
在一个优选例中,所述云端风险评估子单元通过以下方式进行风险评估:
针对当前的业务主体和业务元素,将所有可以得到的变量按照业务的逻辑,聚合到各个知识点模块上,计算每个变量的异常度,将各知识模块下各变量异常度相加,得到每个知识模块的异常度,取各个知识模块中异常度最大的值作为风险的量化评分。
在一个优选例中,所述异常度是将一个变量的变量值与该变量的中位数之差除以该中位数,将所得取绝对值后取自然对数再取绝对值得到。
在一个优选例中,所述商户风险评估单元在根据所述用户集合中用户的风险信息对所述第一商户进行风险评估时,所述用户集合中用户的风险评分是所述第一商户的风险评分的一个正相关因子。
在一个优选例中,还包括:
认证单元,用于在所述第一商户的风险评分高于预定门限并且所述第一商户是线下商户时,则通过区域匹配,向覆盖所述第一商户线下地址的第三方服务系统发送对所述第一商户进行实地认证的指令。
在一个优选例中,还包括名单查询单元,用于查询所述第一商户是否出现在预先设定的名单上,该名单包括至少一个商户的信息和对应的风险级别信息,如果所述第一商户出现在所述名单上,则直接根据所述名单上所述第一商户所对应的风险级别信息确定所述第一商户的风险级别。
本申请还公开了一种风险识别系统包括:
存储器,用于存储计算机可执行指令;以及,
处理器,与所述存储器耦合,用于在执行所述计算机可执行指令时实现如前文描述的方法中的步骤。
本申请还公开了一种计算机可读存储介质所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如前文描述的方法中的步骤。
本说明书实施方式中,对于新的业务常常出现的新商户,即使交易数据很少,也能够地这些新商户的风险进行比较准确的评估。
本说明书中记载了大量的技术特征,分布在各个技术方案中,如果要罗列出本申请所有可能的技术特征的组合(即技术方案)的话,会使得说明书过于冗长。为了避免这个问题,本说明书上述发明内容中公开的各个技术特征、在下文各个实施方式和例子中公开的各技术特征、以及附图中公开的各个技术特征,都可以自由地互相组合,从而构成各种新的技术方案(这些技术方案均应该视为在本说明书中已经记载),除非这种技术特征的组合在技术上是不可行的。例如,在一个例子中公开了特征A+B+C,在另一个例子中公开了特征A+B+D+E,而特征C和D是起到相同作用的等同技术手段,技术上只要择一使用即可,不可能同时采用,特征E技术上可以与特征C相组合,则,A+B+C+D的方案因技术不可行而应当不被视为已经记载,而A+B+C+E的方案应当视为已经被记载。
附图说明
图1是根据本说明书第一实施方式的风险识别方法流程示意图;
图2是根据本说明书第二实施方式的风险识别系统结构示意图。
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
部分概念的说明:
云端:是指网络中能对其它设备提供服务的计算机系统。云端的实现方式是多种多样的,可以是单台的计算机设备,也可以是多台计算机设备的组合(例如集群服务器,云服务器等)。云端在一些应用场景中也可以被称为服务端,服务器等。
边缘端(Edge)风险识别:边缘端是一套部署在移动设备端的风险防控解决方案,它利用移动设备端的数据存储、数据采集、智能计算等能力实现前置的风险识别。
下面说明本说明书实施方式中的部分创新点:
本实施方式涉及风险防控的冷启动策略,也就是在风险未知,缺少黑样本数据、缺少历史数据的情况下,制定的风险防控策略。本申请的发明人发现,对于新的业务(或者说风险评估策略在该业务中是冷启动的),商户往往也是新的,交易数据很少,无法根据历史交易数据进行比较准确的评估,但是与该新商户交易的用户有很多却是老用户(即参加过该交易平台的其他商户或其他业务的交易),这些老用户的风险是可以用其他商户或其他业务的历史数据进行比较准确评估的(例如可以识别出一些用户是欺诈用户、赌博用户、刷单用户等),可以根据这些老用户的风险数据来评估与这些老用户交易的新商户的风险数据。其背后的客观自然规律是参与交易的商户和用户的风险数据的相关性,例如,如果一个商户有较大比例的交易是和高风险用户(例如刷单用户、欺诈用户等)进行的,那么这个商户是高风险商户的客观概率就会比较大。这种相关性是客观存在的,并非能够人为主观设定的,本说明书至少部分的实施方式通过应用这种客观自然规律取得了技术效果——在新商户的历史交易数据很少的情况下,也依然可以较为准确地得到对新商户的风险评估,而这种风险评估的结果是客观的,是可以在过了一段时间后回过来使用在后的交易数据验证的。
下面将结合附图对本说明书的实施方式作进一步地详细描述。
本说明书的第一实施方式涉及一种风险识别方法,其流程如图1所示,该方法包括以下步骤:
在步骤102中,获取与第一商户交易的用户集合。
此后进入步骤104,根据用户集合中各用户与其他商户交易的历史数据进行风险评估,得到用户集合中各用户的风险信息。
此后进入步骤106,根据用户集合中用户的风险信息对第一商户进行风险评估。在一个实施例中,用户集合中用户的风险评分是第一商户的风险评分的一个正相关因子。也就是说,第一商户的风险评分可以受多个因素(因子)的影响,用户集合中用户的风险评分是其中的一个,在其他因素不变的前提下,用户集合中用户的风险评分越高,第一商户的风险评分也相应越高。
通过上述方案,对于新的业务常常出现的新商户,即使交易数据很少,也能够地这些新商户的风险进行比较准确的评估。
在一个实施例中,步骤104中可以根据通过云端风险评估和边缘端风险评估相结合的方式来确定用户集合中用户的风险信息。例如,对于用户集合中的每一个用户,将该用户在云端和边缘端的风险评分进行归一化,再计算两者的平均值,得到该用户的风险评分。在其他实施例中也可以不是平均值,而是最大值、最小值、中位数、方差、加权平均数、几何平均数、调和平均数等。通过将云端风险评估和边缘端风险评估相结合的方式,充分利用了边缘端丰富的用户数据,弥补了云端数据的不足,同时结合了云端和边缘端综合的风险评分,通过互补的方式来提升策略的准确性。
在其他实施例中,也可以仅根据云端或边缘端的风险评估确定用户集合中用户的风险信息,还可以对用户集合中不同的用户使用不同的方式确定风险信息,例如,部分用户可以根据云端和边缘端相结合的方式确定其风险,部分用户可以仅根据云端或边缘端的风险评估确定其风险。
边缘端的风险评估可以采用各种不同的方式,例如一种方式为分析用户习惯数据是否有异常,具体地说:获取当前用户对移动终端和应用程序的当前使用习惯数据;将当前使用习惯数据与被存储的该用户历史使用习惯数据相比较;根据比较结果确定该用户的风险评分。其中使用习惯数据包括以下之一或其任意组合:拿移动终端的姿势、解锁方式、移动终端的触屏方式、使用特定应用程序的常用功能、对特定应用程序的打开方式等等。
云端的风险评估也可以采用各种不同的方式,例如,根据用户是否出现在预先设定名单上,确定该用户的风险评分,具体地说,如果一个用户出现在欺诈用户、或赌博用户、或刷单用户的名单上,则该用户为高风险用户,为该用户设置代表高风险的评分。又如,针对当前的业务主体和业务元素,将所有可以得到的变量,按照业务的逻辑,聚合到各个知识点模块上,计算每个变量的异常度,将各知识模块下各变量异常度相加,得到每个知识模块的异常度,取各个知识模块中异常度最大的值作为风险的量化评分。其中,异常度=|ln(|变量值-中位数/中位数|)|。本领域技术人员可以理解,之前的例子将异常度最大的值作为风险的量化评分,其实并不是一定要用最大值,可以根据不同的业务场景和风险类型,使用其他的计算方法,如最小值、中位数、方差、几何平均数、调和平均数等。
可选地,步骤106之后,还可以包括步骤:如果第一商户的风险评分高于预定门限并且第一商户是线下的,则通过区域匹配,向覆盖第一商户线下地址的第三方服务系统发送对第一商户进行实地认证的指令。第三方服务系统可以是众包形式的服务平台,例如微客等。在风险识别的基础上,通过微客的方式对识别的结果进行验证,不仅保证了策略的准确性,也积累相关的黑样本数据,为后续的策略迭代优化提供了有效的数据。此外,如果第一商户是线上的,可通过商户网址和APP(应用程序)的实测,例如判断网址是否虚假,APP是否存在赌博、欺诈的风险等。
可选地,步骤102之前,还包括步骤:查询第一商户是否出现在预先设定的名单上,该名单包括至少一个商户的信息和商户对应的风险级别信息。如果第一商户是否出现在名单上,则直接根据名单上第一商户所对应的风险级别信息确定第一商户的风险级别。其中,预先设定的名单可以是各式各样的。可选地,预先设定的名单包括黑名单,如法院失信名单、国际和国内的涉黄、涉恐名单以及其他业务上积累的黑名单,该黑名单上的商户或用户属于高风险级别,可以直接进行拒绝的处理。可选地,预先设定的名单包括可信名单(白名单),例如已知的医院、学校、医院等机构,包括一些世界500强、国内500强的公司、出租车、地铁等公共服务的公司,该可信名单上的商户或用户属于低风险级别,可以直接作业务上的放行处理。
可选地,对于老商户而言,则可以在云端和边缘端各自计算一个风险的评分,然后做归一化的处理,再计算两者的平均值,得到该老商户的风险分数。
本说明书的第二实施方式涉及一种风险识别系统,其结构如图2所示,该风险识别系统包括:
用户获取单元,用于获取与第一商户交易的用户集合。
用户风险评估单元,用于根据用户集合中用户与其他商户交易的历史数据进行风险评估,得到用户集合中用户的风险信息。
商户风险评估单元,用于根据用户集合中用户的风险信息对第一商户进行风险评估。在一个实施例中,用户集合中用户的风险评分是第一商户的风险评分的一个正相关因子。也就是说,第一商户的风险评分可以受多个因素(因子)的影响,用户集合中用户的风险评分是其中的一个,在其他因素不变的前提下,用户集合中用户的风险评分越高,第一商户的风险评分也相应越高。
在一个实施例中,用户风险评估单元进一步包括:
云端风险评估子单元,用于在云端进行风险评估;
边缘端风险评估子单元,用于在边缘端进行风险评估;和
综合子单元,用于综合地根据云端风险评估子单元和边缘端风险评估子单元输出的风险评估结果确定用户的风险信息。例如,综合子单元可以通过将一个用户在云端和边缘端的风险评分进行归一化,再计算两者的平均值,得到该用户的风险评分。当然,也可以不是平均值,而是最大值、最小值、中位数、方差、加权平均数、几何平均数、调和平均数等。
可选地,边缘端风险评估子单元的风险评估方式为:获取当前用户对移动终端和应用程序的当前使用习惯数据。将当前使用习惯数据与被存储的该用户历史使用习惯数据相比较。根据比较结果确定该用户的风险评分。其中,使用习惯数据可以是拿移动终端的姿势、解锁方式、移动终端的触屏方式、使用特定应用程序的常用功能、对特定应用程序的打开方式、等等。
可选地,云端风险评估子单元根据用户是否出现在预先设定名单上,确定该用户的风险评分。例如,如果一个用户出现在欺诈用户、赌博用户、刷单用户的名单上,则该用户为高风险用户,应当为该用户设置代表高风险的评分。
可选地,云端风险评估子单元通过以下方式进行风险评估:针对当前的业务主体和业务元素,将所有可以得到的变量,按照业务的逻辑,聚合到各个知识点模块上,计算每个变量的异常度,将各知识模块下各变量异常度相加,得到每个知识模块的异常度,取各个知识模块中异常度最大的值作为风险的量化评分。异常度有多种计算方法,例如,异常度是将一个变量的变量值与该变量的中位数之差除以该中位数,将所得取绝对值后取自然对数再取绝对值得到。
可选地,风险识别系统还包括认证单元,用于在第一商户的风险评分高于预定门限并且第一商户是线下的,则通过区域匹配,向覆盖第一商户线下地址的第三方服务系统发送对第一商户进行实地认证的指令。
可选地,风险识别系统还包括名单查询单元,用于查询第一商户是否出现在预先设定的名单上,该名单包括至少一个商户的信息和对应的风险级别信息,如果第一商户出现在名单上,则直接根据名单上第一商户所对应的风险级别信息确定第一商户的风险级别。
第一实施方式是与本实施方式相对应的方法实施方式,第一实施方式中的技术细节可以应用于本实施方式,本实施方式中的技术细节也可以应用于第一实施方式。
需要说明的是,本领域技术人员应当理解,上述风险识别系统的实施方式中所示的各模块的实现功能可参照前述风险识别方法的相关描述而理解。上述风险识别系统的实施方式中所示的各模块的功能可通过运行于处理器上的程序(可执行指令)而实现,也可通过具体的逻辑电路而实现。本说明书实施例上述风险识别系统如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本说明书各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本说明书实施例不限制于任何特定的硬件和软件结合。
相应地,本说明书实施方式还提供一种计算机可读存储介质,其中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现本说明书的各方法实施方式。计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于,相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读存储介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
此外,本说明书实施方式还提供一种风险识别系统,其中包括用于存储计算机可执行指令的存储器,以及,处理器;该处理器用于在执行该存储器中的计算机可执行指令时实现上述各方法实施方式中的步骤。
在一个实施例中,该处理器可以是中央处理单元(Central Processing Unit,简称“CPU”),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,简称“DSP”)、专用集成电路(Application Specific Integrated Circuit,简称“ASIC”)等。前述的存储器可以是只读存储器(read-only memory,简称“ROM”)、随机存取存储器(randomaccess memory,简称“RAM”)、快闪存储器(Flash)、硬盘或者固态硬盘等。本发明各实施方式所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。在一个实施例中,该风险识别系统还包括总线和通信接口。处理器、存储器和通信接口都通过总线相互连接。通信接口可以是无线通信接口也可以是有线通信接口,用于使得处理器能够与其他的装置通信。
需要说明的是,在本专利的申请文件中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本专利的申请文件中,如果提到根据某要素执行某行为,则是指至少根据该要素执行该行为的意思,其中包括了两种情况:仅根据该要素执行该行为、和根据该要素和其它要素执行该行为。多个、多次、多种等表达包括2个、2次、2种以及2个以上、2次以上、2种以上。
在本说明书提及的所有文献都被认为是整体性地包括在本说明书的公开内容中,以便在必要时可以作为修改的依据。此外应理解,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。
在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描述的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。