具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
正如背景技术部分陈述的,风险识别是指通过风险评程序,找出目标对象中的风险;目前的风险识别方案包括:基于模型的风险识别方案和基于策略的风险识别方案;前者在识别精度和运营成本上有明显优势,后者在机动性、经验沉淀、可解释性上有明显优势。
但是,有些业务(例如:支付业务)不同于传统金融业务(例如:信用贷款),其攻击手段变化迅速、场景转移频繁、需要快速而有针对性的风险应对,模型的黑盒属性和迭代慢的特点使其很难在风控中承担主要角色;而且,用户日益提升的支付便捷性诉求,对风险识别精度提出了更高要求,策略维护成本高和准确度有限的缺点阻碍了风控体系的进一步升级。
因此,急需一种新形态的风险识别体系,以同时满足抵御风险和提升精度的需求。
基于此,本发明提供一种风险识别方法,本方法先确定业务的风险因素,然后,通过量化的方式确定各风险因素的风险分布数据,并基于历史风控经验对各风险因素的风险分布数据进行优化,进而基于优化后的风险分布数据,对该业务的业务请求进行风险识别。与现有技术中通过策略或模型的风险识别方案相比,本方案结合策略和模型两者之长,通过量化和基于历史经验的优化的方式,以达到既能保证风险识别准确性,又能保证机动性的目的。
其中,风控是指风险控制,即风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或风险控制者减少风险事件发生时造成的损失;风险是指在特定场景下,特定时间内某个损失发生的可能性,或者说是在某一个特定时间段里,人们所期望达到的目标与实际出现的结果之间的差距;风险事件,是指造成风险的直接原因;风险因素,是指造成风险的间接原因,例如:对于支付业务来说,异地登录、新设备登录都是可能造成支付风险的风险因素;风险分布数据是指不同范围内风险发生的可能性,例如:对于支付业务,其风险因素同一设备登录的账号数的风险分布数据包括:账号数=1的风险值,账号数=2的风险值,账号数≥3的风险值;历史风控经验是指从大数据的角度统计分析各风险因素对业务造成的风险影响。
下面对本发明的应用场景进行示例性说明。
参见图1a,一种应用场景包括:业务方101、处理平台102和用户103,其中:
业务方101,可以是指业务所有方,用于开发新业务,并提供业务需求,以请求将新业务接入处理平台102;
用户方103,可以是指用户使用的设备,用于向处理平台102发起新业务的业务请求;
处理平台102,可以是指提供业务相关数据处理服务的平台(例如:业务方或者第三方的平台),其用于基于业务方101提供的新业务的业务需求进行量化策略的设计,并基于业务量化策略对用户方103的业务请求进行风险识别,以确定业务请求为风险/正常业务请求。
其中,用户使用的设备,可以是PC端,也可以是移动终端或者叫移动通信终端是指可以在移动中使用的计算机设备,广义的讲包括手机、笔记本、平板电脑、POS机甚至包括车载电脑,但是大部分情况下是指手机或者具有多种应用功能的智能手机以及平板电脑。
参见图1b,另一种应用场景包括:用户方103和处理平台102,其中:
用户方103,可以是指用户使用的设备,用于向处理平台102发起风险识别请求,该请求中携带目标对象的相关信息;
处理平台102,可以是指提供风险识别服务的平台,其用于基于目标对象的相关信息设计风险识别的量化策略,然后,基于该量化策略对目标对象进行风险识别,以确定目标对象是否存在风险。
其中,目标对象是指可能存在风险的对象,例如:上一应用场景中的业务或者该业务的业务请求。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图2为本说明书一实施例提供的一种风险识别方法的流程示意图,该方法可由图1a中的处理平台执行,参见图2,该方法具体可以包括如下步骤:
步骤220、确定待处理的第一业务对应的至少一个风险因素;
其中,第一业务可以是指进行或处理商业上相关的业务,例如:登录业务、下单业务、支付业务等等;对于不同业务,引发其风险事件的风险因素可能不同,例如:引发登录业务的风险事件的风险因素可能包括:登录位置(异地登录)、登录设备(是否为常用设备)等等;引发支付业务的风险事件的风险因素可能包括:支付方式(银行卡、第三方等)、支付验证方式(短信验证码、刷脸等)等等。
需要说明的是,步骤220的一种实现方式可以为:
确定预配置的多个风险因素与所述第一业务的相关度;将相关度大于预定相关阈值的风险因素作为所述第一业务对应的风险因素。具体可以示例为:
示例1、若该第一业务为已接入的、有相关历史风控经验的业务;
基于历史风控经验,确定已发生的风险事件及引发风险事件的风险因素;然后,对历史数据进行统计分析,确定引发风险事件可能性最高的多个风险因素,并配置为第一因素对应的风险因素。
示例2、若该第一业务为未接入、无相关历史风控经验的业务;
查找一个或多个与该第一业务相关联的已接入、有相关历史风控经验的业务(记为第二业务);然后,基于该第二业务的风险因素,为第一业务配置风险因素。
其中,历史风控经验是指对业务之前发生的风险事件及其对应的风险因素进行统计分析,并采取相关措施和方法的经验。
步骤220的另一种实现方式可以为:
确定第一业务关联的至少一个业务场景;确定第一业务在各个业务场景中的风险因素,作为所述业务请求的风险因素。
假设第一业务为支付业务,业务场景可包括:转账场景的支付业务、购物支付场景的支付业务、缴纳水电费场景的支付业务等。相应地,对于不同的业务场景,支付风险的薄弱点也可能是不同的,因此,风险因素也可不尽相同。
进一步地,可选择性的基于风险因素和第一业务的相关度对各业务场景中的更新因素进行筛选。
步骤240、量化所述至少一个风险因素,得到各风险因素对应的风险分布数据,并基于历史风控经验优化所述风险分布数据;
其中,量化是指使对象可以用数量来衡量,具体到此处是指基于预定规则、模型、策略等方式对各风险因素进行分析,以用数值进行表示,例如:对于设备登录账号数的风险因素,有一个账号登录记为1,有两个账号登录记为2;风险分布数据是指不同条件下的风险数据的分布,例如:在一个账号登录条件下,风险取值为m,在两个账号登录条件下,风险取值为n。
需要说明的是,步骤240中,量化步骤的一种实现方式可以为:
对每个风险因素的取值范围进行分组;训练该风险因素在各分组的风险值,并将训练结果作为该风险因素对应的风险分布数据。具体可以示例为:
首先,获取所述第一业务对应的样本集,所述样本集包括:正常业务请求样本和异常业务请求样本;
然后,统计分析异常业务请求样本发生风险事件时每个风险因素的取值,确定每个风险因素的取值范围,例如:1≤风险因素(设备登录账号数x)≤4;对该取值范围进行分组,得到分组1:x=1,分组2:x=2;分组3:3≤x≤4;
最后,基于正常业务请求样本和异常业务请求样本在该风险因素上的取值,训练出该风险因素在各分组的风险值,例如:分组1对应的风险值为0.2,分组2对应的风险值为0.0,分组3对应的风险值为0.5。
步骤240中,优化步骤的一种实现方式可以为:
基于历史风控经验,确定各风险因素对应的正常风险范围;确定风险值超出所述正常风险范围的异常风险因素,并进行优化。具体可以示例为:
由专家对历史风险事件发生时各风险因素的取值进行评价分析,得到各风险因素对应的正常风险范围。其中,专家评价法包括:首先根据评价对象的具体情况选定评价指标,对每个指标均定出评价等级,每个等级的标准用分值表示;然后以此为基准,由专家对评价对象进行分析和评价,确定各个指标的分值,采用加法评分法、乘法评分法或加乘评分法求出个评价对象的总分值,从而得到评价结果。
步骤260、基于优化后的风险分布数据,对所述第一业务的业务请求进行风险识别。其一种实现方式可以为:
步骤320、确定所述业务请求的至少一个风险因素的取值;具体可以示例为:
确定所述业务请求对应的业务场景;确定所述第一业务在所述业务场景的风险因素,作为所述业务请求的风险因素;确定各风险因素的取值。
步骤340、确定每个风险因素的取值所属分组对应的风险值,作为该风险因素对应的风险值;步骤340具体可以示例为:
先确定风险因素对应的风险分布数据,该风险分布数据包括:风险因素的取值范围的分组及各分组对应的风险值;然后,将具体某一业务请求的该风险因素的取值与风险分布数据进行对比,得到该取值所属分组及其对应的风险值;结合步骤240中的描述,假设该业务请求对应的设备登录账号数为2,则属于分组2:x=2,对应的风险值为0.0。
步骤360、基于每个风险因素对应的风险值,对所述业务请求进行风险识别。具体可以示例为:
基于每个风险因素对应的风险值,确定所述业务请求的风险值,例如:将各风险因素对应的风险值进行求和;若所述风险值大于预定风险阈值,则确定所述业务请求为风险业务请求;否则,确定为正常业务请求。
其中,预定风险阈值基于业务请求对应的金额、业务需求的安全等级等因素确定;一般为金额越大,预定风险阈值越小;安全等级越高,预定风险阈值越小。
可选的,业务的至少一个风险因素包括:多个风险维度关联的风险因素,基于此,所述方法还包括:
以风险维度为父节点,风险因素为子节点,生成所述第一业务的风险因素树并进行可视化展示,参见图5。
其中,风险维度包括:身份、行为、设备、环境、冲突、关系、场景、FTG等等;身份是指用户身份的风险特征、行为是指用户的操作行为的风险特征、设备是指用户设备的风险特征、环境是指用户所处环境的风险特征、冲突是指刻画与个体历史、群体属性特征的冲突、关系是指用户与对方之间的各方面关系、场景是指业务场景所特有的风险点、FTG用于刻画异常交易聚集性;知识是指各风险因素的取值对应的危险关系;模块是指维度对应的程序模块,用于以业务请求的风险因素的取值作为输入,输出各维度下的业务请求的风险值以及业务请求总的风险值。
基于该风险因素树,当出现业务请求的实际风险结果和风险识别结果不匹配的报错信息时,所述方法还包括:
步骤S1、基于所述风险因素树核实所述风险识别结果;其一种实现方式可以为:
基于所述风险因素树,遍历每个风险维度的风险因素对应的风险值;若查找出风险值异常的风险因素,则确定所述风险识别结果异常;否则,确定所述风险识别结果正常。
步骤S2、若确定所述风险识别结果存在异常,则优化所述风险因素树中的风险因素;否则,确定为误报,并发出误报提示。
参见图5,以一笔盗用支出未被识别为例,步骤S1和步骤S2具体可以示例为:
首先,对比量化打分和风险阈值之间的关系,量化打分得出的风险值为2.4,风险阈值为3,说明量化打分偏低,可能存在风险值过低的一个或多个维度;
其次,依次查看每个风险维度对应的风险值;身份:0.5、行为:0.5、设备:1.0、环境:0.9、冲突:0.8、关系:-2.0、场景:0.7、FTG:0.0;不难获知,关系维度的风险值比较低,因此,可着重核实关系维度的打分是否有误;
再次,依次查看关系维度下的各风险因素的风险值,该维度下有3个风险因素,风险值分别为-1.8、-0.2和0.0;其中,-1.8的风险值明显比较低,因此,可大体判定量化打分有误。为提高判断精度,可进一步地提示人工进行核实
可见,当出现风险误判的情况时,本方案可从量化分下探至各维度、各风险因素,一层层拆解原因,找到打分根源;若打分正确,则有效加速查询过程,快速定位到原因;若打分不符合预期,则可快速调整风险因素逻辑,并通过仿真平台验证调整后的打扰和风险覆盖情况,快速发布新版本迭代上线。而且,采用树状图谱全面有效的串联起了风险识别所用到的全部风险因素,有效的解决了风险因素的传承问题。
可选的,当所述第一业务为参与预定业务活动的业务时,所述方法还包括:
确定所述第一业务的各风险因素与所述预定业务活动的相关度;基于所述相关度,调整所述各风险因素对应的风险分布数据。
参见图6,以第一业务参与‘双11’等大促降级活动为例,确定中容易影响该活动的风险因素(即相关度大于预定阈值的风险因素)以及不容易影响该活动的风险因素(即相关度小于预定阈值的风险因素);对应前者,调整其风险值(WOE),对于后者,维持其风险值不变,进而得到调整后的量化策略,并选择性的估算调整后的打扰变化。
可见,本实施例先确定业务的风险因素,然后,通过量化的方式确定各风险因素的风险分布数据,并基于历史风控经验对各风险因素的风险分布数据进行优化,进而基于优化后的风险分布数据,对该业务的业务请求进行风险识别。与现有技术中通过策略或模型的风险识别方案相比,本方案结合策略和模型两者之长,通过对风险因素进行量化和基于历史经验的优化,以达到既能保证风险识别准确性,又能保证机动性的目的。
图7为本说明书另一实施例提供的风险识别方法的流程示意图,该方法可由图1b中的处理平台执行,参见图7,在上一实施例的基础上,本方法具体可以包括如下步骤:
步骤720、确定待上线的第三业务对应的至少一个风险因素中的第一类风险因素和第二类风险因素,所述第一类风险因素为存在于所述第一业务对应的至少一个风险因素中的风险因素,所述第二类风险因素为不存在于所述第一业务对应的至少一个风险因素中的风险因素;
步骤740、确定所述第二类风险因素对应的风险分布数据;
步骤760、基于所述第一类风险因素和所述第二类风险因素对应的风险分布数据,对所述第三业务的业务请求进行风险识别。
参见图8,本实施例可以示例为:
基于步骤720确定的第一类风险因素和第二类风险因素,确定需要调整的维度(场景维度)和无需调整的维度(身份维度、行为维度等等);对于后者,可基于步骤740和步骤760调整场景维度对应的程序模块,以使该程序模块适应第三业务;对于前者,则可复用其对应的程序模块;基于调整后的程序模块和复用的程序模块进行风险识别。
可见,本实施例仅需调整与新业务不适用的程序模块,对于通用的程序模块进行保留并复用,可避免对通用程序模块的重复分析造成的消耗,降低新业务量化策略的设计周期,以提高业务的上线效率。而且,对于已上线的业务,也可随时根据风险对抗情况进行策略调整,以适应新的风险形势。
图9为本说明书又一实施例提供的一种风险识别方法的流程示意图,该方法可由图1b中的处理平台执行,参见图9,该方法具体可以包括如下步骤:
步骤920、确定目标对象的至少一个风险因素;
步骤940、量化所述至少一个风险因素,得到各风险因素对应的风险分布数据,并基于历史风控经验优化所述风险分布数据;
步骤960、基于优化后的风险分布数据,对所述目标对象进行风险识别。
其中,目标对象是指任一需要分析风险发生可能性的事物,例如:图2对应的实施例中的业务或者业务请求。
可选的,确定目标对象的至少一个风险因素包括:
确定预配置的多个风险因素与所述目标对象的相关度;
将相关度大于预定相关阈值的风险因素作为所述目标对象对应的风险因素。
可选的,所述多个风险因素为基于历史风控经验配置的;或者,
所述多个风险因素为基于与所述目标对象相关联的对象的风险因素配置的。
可选的,量化所述至少一个风险因素,得到各风险因素对应的风险分布数据包括:
对每个风险因素的取值范围进行分组;
训练该风险因素在各分组的风险值,并将训练结果作为该风险因素对应的风险分布数据。
可选的,训练该风险因素在各分组的风险值包括:
获取所述目标对象对应的样本集,所述样本集包括:正常业务请求样本和异常业务请求样本;
基于各样本在该风险因素的取值,训练出该风险因素在各分组的风险值。
可选的,基于风控历史经验优化所述风险分布数据包括:
基于历史风控经验,确定各风险因素对应的正常风险范围;
确定风险值超出所述正常风险范围的异常风险因素,并进行优化。
可选的,基于优化后的风险分布数据,对所述目标对象进行风险识别包括:
确定所述目标对象的至少一个风险因素的取值;
确定每个风险因素的取值所属分组对应的风险值,作为该风险因素对应的风险值;
基于每个风险因素对应的风险值,对所述目标对象进行风险识别。
可选的,基于每个风险因素对应的风险值,对所述目标对象进行风险识别包括:
基于每个风险因素对应的风险值,确定所述目标对象的风险值;
若所述风险值大于预定风险阈值,则确定所述目标对象存在风险。
可选的,所述至少一个风险因素包括:多个风险维度关联的风险因素,所述方法还包括:
以风险维度为父节点,风险因素为子节点,生成所述目标对象的风险因素树并进行可视化展示。
可选的,还包括:
当出现目标对象的实际风险结果和风险识别结果不匹配的报错信息时,基于所述风险因素树核实所述风险识别结果;
若确定所述风险识别结果存在异常,则优化所述风险因素树中的风险因素;否则,发出误报提示。
可选的,基于所述风险因素树核实所述风险识别结果包括:
基于所述风险因素树,遍历每个风险维度的风险因素对应的风险值;
若查找出风险值异常的风险因素,则确定所述风险识别结果异常;否则,确定所述风险识别结果正常。
可选的,还包括:
确定其他对象对应的至少一个风险因素中的第一类风险因素和第二类风险因素,所述第一类风险因素为存在于所述目标对象对应的至少一个风险因素中的风险因素,所述第二类风险因素为不存在于所述目标对象对应的至少一个风险因素中的风险因素;
确定所述第二类风险因素对应的风险分布数据;
基于所述第一类风险因素和所述第二类风险因素对应的风险分布数据,对所述其他对象进行风险识别。
对于本实施例中的步骤,由于其与图2对应的实施例中的相关步骤相似,具体实现方式也对应相似,故,此处不再赘述。
可见,本实施例先确定可能引发目标对象出现风险事件的风险因素,然后,通过量化的方式确定各风险因素的风险分布数据,并基于历史风控经验对各风险因素的风险分布数据进行优化,进而基于优化后的风险分布数据,对该目标对象进行风险识别。与现有技术中通过策略或模型的风险识别方案相比,本方案结合策略和模型两者之长,通过对风险因素进行量化和基于历史经验的优化,以达到既能保证风险识别准确性,又能保证机动性的目的。
图10为本说明书又一实施例提供的一种风险识别方法的流程示意图,参见图10,该方法具体可以包括如下步骤:
步骤1020、量化策略搭建;包括:
第一步,搭建量化策略变量体系:该体系包括三层:
最底层为基础变量(风险因素)层,比如设备登陆账户次数、账户注册时长、用户常用位置等基础风险信息;
中间层为知识层,知识是基于对基础变量的黑白样本的量化统计结果和历史风控经验沉淀确定的,比如设备登陆账户次数取值为多少为低危,多少为高危;账户注册时长取值为多少为低危,多少为高危等。具体可使用知识(以变量形式存在)分Bin后的WOE值作为风险值,即风险因素不同取值范围(分组)对应的风险值,因其具备风险可累加的特性,可满足策略识别体系“模块化”的需求;
最上层为模块层,用于归纳总结知识分类;以盗用风险为例,每笔交易可从身份、行为、设备、环境、冲突、关系、场景、FTG八个维度进行风险打分,不同模块间相互独立、互不影响。
第二步,利用第一步中得到的模块层分数搭建量化策略体系
不同场景如转账到账户、外部商户、实物等,将共用设备、环境、行为、身份等公有模块,但会根据不同场景使用不同的场景模块,8个模块加和后形成当笔交易的量化得分,在策略中调用时会根据不同支付金额(意味着损失成本)使用不同分数值作为稽核阈值。
步骤1040、量化策略运营;分为三种情况:
情况1、已接入业务的日常风险应对:
当需要误抓或案件漏过时,可通过仿真平台从量化分下探至模块分、知识分,一层层拆解原因,找到打分根源:若最终打分正确,则有效加速了查询过程,快速定位到原因;若打分不符合预期,则可快速调整知识变量逻辑,并通过仿真平台验证调整后的打扰与风险覆盖情况,快速发布新版本迭代上线。
情况2、新业务场景策略部署:
当有新业务需要安全接入时,仅需根据新业务特点重新设计场景模块,而设备、环境等通用模块可被快速复用,减少重新训练成本,缩短业务上线等待时间,助力业务发展。
情况3、大促降级调整:
在过往的大促前夕,策略运营团队会花费近2周时间调整近千条策略,任务繁重,效率低下,出错率高。而基于量化策略体系,仅需根据大促特点对易受大促影响的识别变量,如“高频高金额交易”、“高危时间支付”等,进行针对性调整;而不需要改动“高危同机”等不受大促影响的风险变量。策略调整成本大幅减少,安全系数显著增强,风控拦截水位没有明显减低,不会造成批量风险漏过。
可见,本实施例针对模型识别体系过于偏向机器训练而忽视了专家经验;策略识别体系过于倚仗专家主观判断而缺少量化分析的情况,提出了量化策略体系,其是对两者的融合,体现在:在变量设计和筛选阶段使用和模型相近的方式,通过量化的方式计算每个知识的区分度、覆盖度等,计算在各个分Bin上的WOE值;但接下来不像传统模型一样直接进行机器训练,而是根据专家经验对知识训练结果进行检查和修正,对明显不符合常识的知识风险情况进行调整,这一步可有效减少因黑样本转移造成的“知识点遗忘”,提升识别体系的健壮度和稳定性,减少随攻防衍变而发生的风险识别能力退化。
以盗用风险为例,本实施例可实现如下技术效果:
1.整体打扰和资损率均达到历史最低水平(具体数据隐去);
2.策略量级缩减92%,日常维护成本大幅降低;
3.每日案件应对时间从35人时缩减至12人时,释放出大量的分析资源投入到新变量、新数据的开发中,进一步提升策略识别精度,减少风险漏过和误打扰。这样再次压缩了案件应对所需时间,形成一个良性循环;
对于上述方法实施方式,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施方式并不受所描述的动作顺序的限制,因为依据本发明实施方式,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施方式均属于优选实施方式,所涉及的动作并不一定是本发明实施方式所必须的。
图11为本说明书一实施例提供的一种风险识别装置的结构示意图,参见图11,该装置具体可以包括:确定模块111、量化策略模块112和风险识别模块113;其中:
确定模块111,用于确定待处理的第一业务对应的至少一个风险因素;
量化策略模块112,用于量化所述至少一个风险因素,得到各风险因素对应的风险分布数据,并基于风控历史经验优化所述风险分布数据;
风险识别模块113,用于基于优化后的风险分布数据,对所述第一业务的业务请求进行风险识别。
可选的,确定模块111,具体用于:
确定预配置的多个风险因素与所述第一业务的相关度;将相关度大于预定相关阈值的风险因素作为所述第一业务对应的风险因素。
可选的,所述多个风险因素为基于历史风控经验配置的;或者,
所述多个风险因素为基于与所述第一业务相关联的第二业务的风险因素配置的。
可选的,量化策略模块112,具体用于:
对每个风险因素的取值范围进行分组;训练该风险因素在各分组的风险值,并将训练结果作为该风险因素对应的风险分布数据。
可选的,量化策略模块112,具体用于:
获取所述第一业务对应的样本集,所述样本集包括:正常业务请求样本和异常业务请求样本;基于各样本在该风险因素的取值,训练出该风险因素在各分组的风险值。
可选的,量化策略模块112,还用于:
基于历史风控经验,确定各风险因素对应的正常风险范围;确定风险值超出所述正常风险范围的异常风险因素,并进行优化。
可选的,风险识别模块113,具体用于:
确定所述业务请求的至少一个风险因素的取值;确定每个风险因素的取值所属分组对应的风险值,作为该风险因素对应的风险值;基于每个风险因素对应的风险值,对所述业务请求进行风险识别。
可选的,风险识别模块113,还用于:
确定所述业务请求对应的业务场景;确定所述第一业务在所述业务场景的风险因素,作为所述业务请求的风险因素。
可选的,风险识别模块113,具体用于:
基于每个风险因素对应的风险值,确定所述业务请求的风险值;若所述风险值大于预定风险阈值,则确定所述业务请求为风险业务请求;否则,确定为正常业务请求。
可选的,所述至少一个风险因素包括:多个风险维度关联的风险因素,所述装置还包括:
建树模块,用于以风险维度为父节点,风险因素为子节点,生成所述第一业务的风险因素树并进行可视化展示。
可选的,装置还包括:
异常处理模块,用于当出现业务请求的实际风险结果和风险识别结果不匹配的报错信息时,基于所述风险因素树核实所述风险识别结果;若确定所述风险识别结果存在异常,则优化所述风险因素树中的风险因素;否则,发出误报提示。
可选的,异常处理模块,具体用于:
基于所述风险因素树,遍历每个风险维度的风险因素对应的风险值;若查找出风险值异常的风险因素,则确定所述风险识别结果异常;否则,确定所述风险识别结果正常。
可选的,装置还包括:
调整模块,用于当所述第一业务为参与预定业务活动的业务时,确定所述第一业务的各风险因素与所述预定业务活动的相关度;基于所述相关度,调整所述各风险因素对应的风险分布数据。
可选的,装置还包括:
新业务处理模块,用于确定待上线的第三业务对应的至少一个风险因素中的第一类风险因素和第二类风险因素,所述第一类风险因素为存在于所述第一业务对应的至少一个风险因素中的风险因素,所述第二类风险因素为不存在于所述第一业务对应的至少一个风险因素中的风险因素;确定所述第二类风险因素对应的风险分布数据;基于所述第一类风险因素和所述第二类风险因素对应的风险分布数据,对所述第三业务的业务请求进行风险识别。
可见,本实施例先确定业务的风险因素,然后,通过量化的方式确定各风险因素的风险分布数据,并基于历史风控经验对各风险因素的风险分布数据进行优化,进而基于优化后的风险分布数据,对该业务的业务请求进行风险识别。与现有技术中通过策略或模型的风险识别方案相比,本方案结合策略和模型两者之长,通过对风险因素进行量化和基于历史经验的优化,以达到既能保证风险识别准确性,又能保证机动性的目的。
图12为本说明书另一实施例提供的一种风险识别装置的结构示意图,参见图12,该装置具体可以包括:确定模块121、量化策略模块122和风险识别模块123;其中:
确定模块121,用于确定目标对象的至少一个风险因素;
量化策略模块122,用于量化所述至少一个风险因素,得到各风险因素对应的风险分布数据,并基于历史风控经验优化所述风险分布数据;
风险识别模块123,用于基于优化后的风险分布数据,对所述目标对象进行风险识别。
可选的,确定模块121,具体用于:
确定预配置的多个风险因素与所述目标对象的相关度;将相关度大于预定相关阈值的风险因素作为所述目标对象对应的风险因素。
可选的,所述多个风险因素为基于历史风控经验配置的;或者,
所述多个风险因素为基于与所述目标对象相关联的对象的风险因素配置的。
可选的,量化策略模块122,具体用于:
对每个风险因素的取值范围进行分组;训练该风险因素在各分组的风险值,并将训练结果作为该风险因素对应的风险分布数据。
可选的,量化策略模块122,具体用于:
获取所述目标对象对应的样本集,所述样本集包括:正常业务请求样本和异常业务请求样本;基于各样本在该风险因素的取值,训练出该风险因素在各分组的风险值。
可选的,量化策略模块122,具体用于:
基于历史风控经验,确定各风险因素对应的正常风险范围;确定风险值超出所述正常风险范围的异常风险因素,并进行优化。
可选的,风险识别模块123,具体用于:
确定所述目标对象的至少一个风险因素的取值;确定每个风险因素的取值所属分组对应的风险值,作为该风险因素对应的风险值;基于每个风险因素对应的风险值,对所述目标对象进行风险识别。
可选的,风险识别模块123,具体用于:
基于每个风险因素对应的风险值,确定所述目标对象的风险值;若所述风险值大于预定风险阈值,则确定所述目标对象存在风险。
可选的,所述至少一个风险因素包括:多个风险维度关联的风险因素,所述装置还包括:
建树模块,用于以风险维度为父节点,风险因素为子节点,生成所述目标对象的风险因素树并进行可视化展示。
可选的,装置还包括:
异常处理模块,用于当出现目标对象的实际风险结果和风险识别结果不匹配的报错信息时,基于所述风险因素树核实所述风险识别结果;若确定所述风险识别结果存在异常,则优化所述风险因素树中的风险因素;否则,发出误报提示。
可选的,异常处理模块,具体用于:
基于所述风险因素树,遍历每个风险维度的风险因素对应的风险值;若查找出风险值异常的风险因素,则确定所述风险识别结果异常;否则,确定所述风险识别结果正常。
可选的,还包括:
新对象处理模块,用于确定其他对象对应的至少一个风险因素中的第一类风险因素和第二类风险因素,所述第一类风险因素为存在于所述目标对象对应的至少一个风险因素中的风险因素,所述第二类风险因素为不存在于所述目标对象对应的至少一个风险因素中的风险因素;确定所述第二类风险因素对应的风险分布数据;基于所述第一类风险因素和所述第二类风险因素对应的风险分布数据,对所述其他对象进行风险识别。
可见,本实施例先确定可能引发目标对象出现风险事件的风险因素,然后,通过量化的方式确定各风险因素的风险分布数据,并基于历史风控经验对各风险因素的风险分布数据进行优化,进而基于优化后的风险分布数据,对该目标对象进行风险识别。与现有技术中通过策略或模型的风险识别方案相比,本方案结合策略和模型两者之长,通过对风险因素进行量化和基于历史经验的优化,以达到既能保证风险识别准确性,又能保证机动性的目的。
另外,对于上述装置实施方式而言,由于其与方法实施方式基本相似,所以描述的比较简单,相关之处参见方法实施方式的部分说明即可。而且,应当注意的是,在本发明的装置的各个部件中,根据其要实现的功能而对其中的部件进行了逻辑划分,但是,本发明不受限于此,可以根据需要对各个部件进行重新划分或者组合。
图13为本说明书一实施例提供的一种电子设备的结构示意图,参见图13,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成风险识别装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
网络接口、处理器和存储器可以通过总线系统相互连接。总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图13中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器可能包含高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器。
处理器,用于执行所述存储器存放的程序,并具体执行:
确定待处理的第一业务对应的至少一个风险因素;
量化所述至少一个风险因素,得到各风险因素对应的风险分布数据,并基于历史风控经验优化所述风险分布数据;
基于优化后的风险分布数据,对所述第一业务的业务请求进行风险识别。
或者,
确定目标对象的至少一个风险因素;
量化所述至少一个风险因素,得到各风险因素对应的风险分布数据,并基于历史风控经验优化所述风险分布数据;
基于优化后的风险分布数据,对所述目标对象进行风险识别。
上述如本申请图11-12所示实施例揭示的风险识别装置或管理者(Master)节点执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
风险识别装置还可执行图2-3,8-10的方法,并实现管理者节点执行的方法。
基于相同的发明创造,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行图2-3,8-10对应的实施例提供的风险识别方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。