具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本说明书实施例的思想在于,在生成某项业务所对应的风控策略时,通过自动化的方式确定部署风控策略所需要的特征及对应的特征值,以及,通过自动化的方式进行风险评分,即通过自动化的方式生成业务的风控策略;这样,既提高了风控策略的生成效率,还避免了人为经验对生成风控策略所产生的影响。基于此,本说明书实施例提供了一种风控策略的生成方法、装置、设备及存储介质。下述将一一详细进行介绍。
本说明书实施例提供的风控策略的生成方法的执行主体为计算机、电脑等终端设备,具体的,可以为安装在终端设备上的风控策略的生成装置。
需要说明的是,本说明书实施例中所提及的风控策略则用于在处理目标业务过程中对目标业务进行风险监控,从而识别出目标业务中的风险用户、或者风险设备等。
图1为本说明书实施例提供的风控策略的生成方法的方法流程图之一,图1所示的方法,至少包括如下步骤:
步骤102,获取目标业务的多个历史业务数据和历史业务数据标签;其中,该历史业务数据为与目标风控主体相关的业务数据,上述历史业务数据标签用于标识该历史业务数据所对应的事件是否为风险事件。
其中,上述目标业务可以为支付业务、购物业务、注册业务、营销业务、信用评估业务等任意类型的业务。上述目标业务可以为需要生成风控策略的任意业务,本说明书实施例并不对上述目标业务的具体业务类型进行限定。
一般的,在针对目标业务部署风控策略时,则是针对目标业务的某一个或者几个方面进行监控,例如,针对目标业务的业务设备或者用户进行监控。在本说明书实施例中,则将使用风控策略所监控的对象称为风控主体。例如,所生成的风控策略为对设备的风险进行监控,则上述步骤102中的目标风控主体则为该设备;若是所生成的风控策略为对用户进行监控,则上述步骤102中的目标风控主体则为用户。当然,在具体实施时,上述目标风控主体可以为一个或者多个,其具体数量可以基于需要生成的风控策略设定,本说明书实施例并不对此进行限定。
在具体实施时,可以从目标业务的业务数据库或者执行目标业务的业务平台获取上述历史业务数据。
需要说明的是,在本说明书实施例中,若是所获取的某条历史业务数据所对应的事件为风险事件,则可以将该历史业务数据标记为黑样本,若是所获取的某条历史业务数据所对应的事件为非风险事件,则可以将该历史业务数据标记为白样本。
例如,在一种具体实施方式中,若是所获取的某条历史业务数据为:
2018年9月12日13:30分,用户A通过XX设备扫码向用户B支付100元;若是该事件为风险事件,则可以将该历史业务数据标记为黑样本。
步骤104,根据上述多个历史业务数据和历史业务数据标签,按照预设的特征确定规则确定目标风控主体所对应的目标特征和目标特征的特征值。
在本说明书实施例中,若是存在多个目标风控主体,则需要确定出每个风控主体所对应的目标特征和目标特征所对应的特征值。
例如,在一种具体实施方式中,目标特征可以理解为“交易金额”、“交易时间”等字段,特征值可以理解为各字段所对应的字段值,如“交易金额”所对应的特征值可以为“100元”,“交易时间”所对应的特征值可以为“2018年12月16日13:00分”。
需要说明的是,在具体实施时,目标风控主体所对应的目标特征中的某些目标特征的特征值可以直接从历史业务数据中提取得出,某些目标特征的特征值则需要通过多个历史业务数据进行计算得出。上述特征值的具体确定方式可以根据具体目标特征以及实际需求所确定,本说明书实施例并不对此进行限定。
步骤106,基于各个目标特征所对应的特征值,采用设定的风险分值计算规则,分别计算目标风控主体的风险分值,以及,计算目标风控主体所对应的各个目标特征的风险分值。
其中,上述步骤106中,上述风险分值计算规则可以为证据权重(Weight ofEvidence,WOE)计算规则。
在具体实施时,可以根据目标风控所对应的目标特征的特征值计算目标风控主体的风险分值,根据各个目标特征的特征值分别计算每个目标特征的风险分值。
例如,在一种具体实施方式中,目标风控主体为三个,分别记为风控主体1、风控主体2和风控主体3,风控主体1所对应的目标特征有目标特征1、目标特征2和目标特征3,风控主体2所对应的目标特征有目标特征4、目标特征5和目标特征6,风控主体3所对应的目标特征有目标特征7和目标特征8,则依据目标特征1、目标特征2和目标特征3所对应的特征值计算风控主体1所对应的风险分值,依据目标特征4、目标特征5和目标特征6所对应的特征值计算风控主体2所对应的风险分值,依据目标特征7和目标特征8所对应的特征值计算风控主体3所对应的风险分值。
步骤108,基于目标风控主体及其对应的风险分值、各个目标特征及其对应的风险分值,生成针对目标业务的风控策略。
需要说明的是,上述步骤108中所生成的风控策略可以理解为针对不同的目标风控主体所设置的风控规则的集合,例如,所设置的风控规则可以为:
针对某目标风控主体的风险分值低于XX分值的业务,直接通过;目标风控主体的风险分值基于XX分值和YY分值之间的业务,进行人工审核;目标风控主体的风险分值高于YY分值的业务,可以直接拒绝执行。
上述步骤108在具体实施时,可以先基于各目标风控主体所对应的风险分值和各目标特征所对应的风险分值生成针对目标业务的风控策略,然后按照设定的风控策略效能评估指标对所生成的风控策略的效能进行评估,并基于评估结果不断对所生成的风控策略进行调整,直至所生成的风控策略满足效能评估要求为止,将最终调整后得到的风控策略部署至相应的业务系统。
在具体实施时,在对风控策略进行效能评估时,还需要使用各历史业务数据所对应的历史业务数据标签,具体的,所采用的效能评估指标可以包括AUC、接受者操作特性曲线(receiver operating characteristic curve,ROC)曲线、F1-Score等指标。
本说明书实施例所提供的风控策略的生成方法,生成风控策略的各个步骤均通过自动化的方式实现,即通过自动化的方式生成风控策略,即提高了风控策略的生成效率,同时还避免了人工经验对所生成的风控策略的准确性的影像,从而提高了所生成的风控策略的准确性。
其中,在具体实施时,上述步骤104中,根据多个历史业务数据和历史业务数据标签,按照预设的特征确定规则确定目标风控主体所对应的目标特征和目标特征的特征值,至少包括如下步骤一、步骤二和步骤三;
步骤一、根据上述多个历史业务数据和历史业务数据标签,确定历史业务数据的各个业务特征所对应的特征值。
步骤二、根据各个业务特征所对应的特征值和历史业务数据标签,对上述业务特征进行筛选,得到筛选后的业务特征及对应的特征值。
步骤三、按照设定的特征组合规则,对筛选后的业务特征进行组合,得到目标风控主体所对应的目标特征及目标特征的特征值。
在本说明书实施例中,通过上述步骤一所确定出的业务特征可能会存在冗余、无效或者不稳定的特征,因此,为了减少冗余、无效或者不稳定特征对生成的风控策略的精准度产生影响,在本说明书实施例中,还需要对步骤一所得到的各个业务特征进行筛选,保留业务特征中质量较高的特征。
另外,在具体实施时,可能存在某两个或者多个目标特征之间的相似度比较高的情况,例如,目标特征1为同设备一小时出现的用户数,目标特征2为同设备一天内出现的用户数,目标特征1和目标特征2均用于表征同设备出现的用户数,可以认为目标特征1和目标特征2为相关性较高的特征。为了提高风控策略的生成效率,减少上述重复特征的出现,在本说明书实施例中,则需要将上述相关性较高的特征合并为一个特征。
图2为本说明书实施例提供的风控策略的生成方法的方法流程图之二,图2所示的方法至少包括如下步骤:
步骤202,获取目标业务的多个历史业务数据和历史业务数据标签;其中,该历史业务数据为与目标风控主体相关的业务数据,历史业务数据标签用于标识历史业务数据所对应的事件是否为风险事件。
步骤204,根据上述多个历史业务数据和历史业务数据标签,确定历史业务数据的各个业务特征所对应的特征值。
步骤206,根据各个业务特征所对应的特征值和历史业务数据标签,对上述业务特征进行筛选,得到筛选后的业务特征及对应的特征值。
步骤208,按照设定的特征组合规则,对筛选后的业务特征进行组合,得到目标风控主体所对应的目标特征及目标特征的特征值。
步骤210,基于各个目标特征所对应的特征值,采用设定的风险分值计算规则,分别计算目标风控主体的风险分值,以及,计算目标风控主体所对应的各个目标特征的风险分值。
步骤212,基于目标风控主体及其对应的风险分值、各个目标特征及其对应的风险分值,生成针对目标业务的风控策略。
在本说明书实施例中,通过对得到的业务特征进行筛选、组合的方式,可以实现对业务的特征进行精简,最终保留的为高质量的、非重复的目标特征,有利于提高所生成的风控策略的精准度。
为便于理解,下述将详细介绍上述各个步骤的具体实现过程。
在一种具体实施方式中,上述步骤一中,根据多个历史业务数据和历史业务数据标签,确定历史业务数据的各个业务特征所对应的特征值,具体包括如下过程:
针对每个历史业务数据,根据该历史业务数据和该历史业务数据所对应的历史业务数据标签,确定各业务特征所对应的特征值;针对该业务特征中的指定业务特征,根据指定业务特征的特征类型,按照该特征类型所对应的计算规则,计算指定业务特征在包含该指定业务特征的所有历史业务数据中的特征值。
在具体实施时,针对每条历史业务数据,可以提取该历史业务数据中的各个业务指标所对应的指标值,将相应的业务指标作为业务特征,业务指标所对应的指标值作为该业务特征所对应的特征值。
例如,在一种具体实施方式中,所获取到的历史业务数据如下所示:
数据1、用户A通过设备1向用户B收取10元,黑样本;
数据2、用户A通过设备1向用户C收取15元,黑样本;
数据3、用户B通过设备2向用户C收取5元,白样本。
上述历史业务数据中的业务指标可以为“收款方”、“付款方”、“交易金额”、“设备”以及“风险案件”。则可以直接基于上述各历史业务数据及其对应的历史业务数据标签,提取出上述各业务指标所对应的指标值。所提取的各业务指标所对应的指标值如下表1所示。
表1
收款方 |
付款方 |
交易金额 |
设备 |
风险案件 |
用户A |
用户B |
10元 |
设备1 |
1 |
用户A |
用户C |
15元 |
设备1 |
1 |
用户B |
用户C |
5元 |
设备2 |
0 |
其中,在上述表1中,若是某历史业务数据所对应历史业务数据标签为黑样本,则表征该历史业务数据所对应的案件为风险案件,即“风险案件”这一业务指标所对应的指标值则为1,否则,“风险案件”这一业务指标所对应的指标值则为0。
在其他实施方式中,除了可以直接从历史业务数据中提取业务特征外,针对从历史业务数据中提取的某些业务指标,还可以按照该业务指标所属的指标类型对该业务指标进行变形计算,从而得到与该业务指标相关的其他业务特征所对应的特征值。
在具体实施时,上述业务指标所对应的指标类型可以为类别性、数值型和布尔类型等。针对类别性指标,所设置的计算规则可以为统计一段时间内的次数、去重统计个数等;针对数值型指标,所设置的计算规则可以对一段时间内的历史业务数据进行求和、平均值、最大值、最小值、方差和标准差等;针对布尔型指标,所设置的计算规则可以为对一段时间内的历史业务数据进行求和、平均值等。其中,上述一段时间的具体取值可以根据实际应用场景进行设置,例如,可以为1分钟,也可以为三个月,本说明书实施例并不对上述一段时间的具体取值进行限定。
为便于理解,下述将举例进行说明。
例如,在一种具体实施方式中,所获取到的历史业务数据如下所示:
2018年11月12日13:00分,用户A通过设备1向用户B收取100元;黑样本;
2018年11月12日13:05分,用户A通过设备1向用户C收取5元;黑样本;
2018年11月14日12:05分,用户A通过设备1向用户D收取10元;黑样本;
2018年11月15日09:05分,用于A通过设备2向用户F收取5元;白样本;
2018年11月08日09:08分,用户B通过设备3向用户F收取8元;白样本。
若是其中某个业务特征为“一天内通过设备A交易的总金额”,则需要分别统计2018年11月12日、2018年11月14日、2018年11月15日以及2018年11月08日通过设备1交易的金额的总和,所得到的特征值分别为105元、10元、0元和0元。当然,此处只是示例性说明,并不构成对本说明书实施例的限定。
具体的,可以预先编写针对各业务特征的特征值的生成代码,这样在具体实施时,可以直接通过执行上述代码,得到各个业务特征所对应的特征值,从而实现了上述业务特征的自动生成,即节约了大量的时间和人力成本,还避免了人为经验的干扰,从而可以提高所生成的业务特征的精准度和全面性。
具体的,在上述步骤二中,根据各个业务特征所对应的特征值和历史业务数据标签,对上述业务特征进行筛选,得到筛选后的业务特征及对应的特征值,具体包括如下过程:
根据各个历史业务数据标签,分别计算各个业务特征的信息价值指标(Information Value,IV)值,以及,根据各个业务特征所对应的特征值,计算上述业务特征中任意两个业务特征之间的相关系数;基于上述各个IV值和各个相关系数,对上述业务特征进行筛选。
一般的,通过某个特征的IV值可以衡量该特征对所生成的风控策略的影响程度,业务特征之间的相关系数可以用于衡量该业务特征之间的相关程度,因此,在本说明书实施例中,通过业务特征的IV值以及相关系数,可以筛除上述业务特征中冗余的、或者无效的、或者与所需要生成的风控策略相关性不大的特征,实现了对业务特征的精简;并且,在本说明书实施例中,通过IV值和相关系数等客观指标对业务特征进行筛选,避免了人为经验的干扰,使得所筛选的业务特征的准确性较高。
图3为本说明书实施例提供的风控策略的生成方法的方法流程图之三,图3所示的方法至少包括如下步骤:
步骤302,获取目标业务的多个历史业务数据和历史业务数据标签。
其中,上述历史业务数据为与目标风控主体相关的业务数据,历史业务数据标签用于标识该历史业务数据所对应的事件是否为风险事件。
步骤304,根据上述多个历史业务数据和历史业务数据标签,确定历史业务数据的各个业务特征所对应的特征值。
步骤306,根据各个历史业务数据标签,分别计算各个业务特征的IV值,以及,根据各个业务特征所对应的特征值,计算业务特征中任意两个业务特征之间的相关系数。
步骤308,基于各个IV值和各个相关系数,对上述业务特征进行筛选。
步骤310,按照设定的特征组合规则,对筛选后的业务进行组合,得到目标风控主体所对应的目标特征及目标特征的特征值。
步骤312,基于各个目标特征所对应的特征值,采用设定的风险分值计算规则,分别计算目标风控主体的风险分值,以及,计算目标风控主体所对应的各个目标特征的风险分值。
步骤314,基于目标风控主体及其对应的风险分值、各个目标特征及其对应的风险分值,生成针对目标业务的风控策略。
在具体实施时,上述根据各个历史业务数据标签,分别计算各个所述业务特征的IV值,具体包括:
分别确定每个业务特征所对应的历史业务数据中的非风险事件与所有历史业务数据中的非风险事件的第一比例,以及,确定每个业务特征所对应的历史业务数据中的风险事件与所有历史业务数据中的风险事件的第二比例;根据第一比例和第二比例,计算业务特征的IV值。
其中,上述业务特征所对应的历史业务数据可以理解为包含该业务特征的历史业务数据,或者用于生成该业务特征的历史业务数据。
在具体实施时,可以通过如下公式计算IV值:
其中,在上述公式中,IV表示业务特征的IV值,A表示第一比例,B表示第二比例。
当然,在某些情况下,可能会将所有的历史样本数据划分为多组,在具体实施时,可以分别计算每组内每个业务特征所对应的历史业务数据中的非风险事件与该组内的所有历史业务数据中的非风险事件的第一比例,以及,计算每组内每个业务特征所对应的历史业务数据中的风险事件与该组内的所有历史业务数据中的风险事件的第二比例。
在该种情况下,可以通过如下公式计算IV值:
其中,在上述公式中,Ai表示第i组内的第一比例,Bi表示第i组内的第二比例。
在具体实施时,上述基于信息价值指标和相关系数,对业务特征进行筛选,具体可以通过如下过程实现:
删除信息价值指标小于或等于第一设定阈值的业务特征;针对上述相关系数大于或等于第二设定阈值的任意两个业务特征,删除上述任意两个业务特征中IV值较小的一个业务特征。
图4为本说明书实施例提供的风控策略的生成方法的方法流程图之四,图4所示的方法至少包括如下步骤:
步骤402,获取目标业务的多个历史业务数据和历史业务数据标签。
其中,上述历史业务数据为与目标风控主体相关的业务数据,历史业务数据标签用于标识该历史业务数据所对应的事件是否为风险事件。
步骤404,根据上述多个历史业务数据和历史业务数据标签,确定历史业务数据的各个业务特征所对应的特征值。
步骤406,分别确定每个业务特征所对应的历史业务数据中的非风险事件与所有历史业务数据中的非风险事件的第一比例,以及,确定每个业务特征所对应的历史业务数据中的风险事件与所有历史业务数据中的风险事件的第二比例,根据第一比例和第二比例,计算业务特征的IV值。
步骤408,根据各上述业务特征所对应的特征值,计算任意两个业务特征之间的相关系数。
步骤410,删除信息价值指标小于或等于第一设定阈值的业务特征,以及,针对相关系数大于或等于第二设定阈值的任意两个业务特征,删除任意两个业务特征中IV值较小的一个业务特征。
步骤412,按照设定的特征组合规则,对筛选后的业务进行组合,得到目标风控主体所对应的目标特征及目标特征的特征值。
步骤414,基于各个目标特征所对应的特征值,采用设定的风险分值计算规则,分别计算目标风控主体的风险分值,以及,计算目标风控主体所对应的各个目标特征的风险分值。
步骤416,基于目标风控主体及其对应的风险分值、各个目标特征及其对应的风险分值,生成针对目标业务的风控策略。
在具体实施时,上述步骤三中,按照设定的特征组合规则,对筛选后的业务特征进行组合,得到目标风控主体所对应的目标特征及目标特征的特征值,具体包括:
对上述业务特征进行分组,确定每个目标风控主体所对应的业务特征组;针对每个业务特征组,计算该业务特征组中任意两个业务特征之间的相关系数;基于上述相关系数,对每个业务特征组中的相关系数大于或等于第三设定阈值的业务特征进行合并,得到目标风控主体所对应的目标特征及目标特征的特征值。
一般的,当所生成的风控策略存在多个目标风控主体时,针对不同的目标风控主体,其所对应的业务特征可能会存在区别,因此,在具体实施时,可以依据各目标风控主体所对应的业务特征对所有的业务特征进行分组,得到针对每个目标风控主体所对应的业务特征组。
针对每个业务特征组,里面可能会存在一些相关性比较高的业务特征,为了避免特征重复,在本说明书实施例中,可以将相关性较高的业务特征进行合并,合并为一个业务特征,合并后所得到的各个业务特征记为目标风控主体所对应的目标特征。
图5为本说明书实施例提供的风控策略的生成方法的方法流程图之五,图5所示的方法至少包括如下步骤:
步骤502,获取目标业务的多个历史业务数据和历史业务数据标签。
其中,上述历史业务数据为与目标风控主体相关的业务数据,历史业务数据标签用于标识该历史业务数据所对应的事件是否为风险事件。
步骤504,根据上述多个历史业务数据和历史业务数据标签,确定历史业务数据的各个业务特征所对应的特征值。
步骤506,根据各个业务特征所对应的特征值和历史业务数据标签,对上述业务特征进行筛选,得到筛选后的业务特征及对应的特征值。
步骤508,对上述业务特征进行分组,确定每个目标风控主体所对应的业务特征组。
步骤510,针对每个业务特征组,计算该业务特征组中的任意两个业务特征之间的相关系数。
步骤512,基于上述相关系数,对每个业务特征组中的相关系数大于或等于第三设定阈值的业务特征进行合并,得到目标风控主体所对应的目标特征及目标特征的特征值。
步骤514,基于各个目标特征所对应的特征值,采用设定的风险分值计算规则,分别计算目标风控主体的风险分值,以及,计算目标风控主体所对应的各个目标特征的风险分值。
步骤516,基于目标风控主体及其对应的风险分值、各个目标特征及其对应的风险分值,生成针对目标业务的风控策略。
具体的,在上述步骤106中,可以通过WOE的方式计算各目标风控主体的风险分值,以及,各目标特征的风险分值,下述将具体介绍其计算过程。
在具体实施时,可以针对每个目标特征的特征值,对该目标特征所对应的特征值进行分组,并确定每个分组的特征值所对应的历史业务数据中黑样本的占比和白样本的占比,通过如下公式计算每个分组所对应的WOE分值;
WOE=ln(p1/p2)
其中,在上述公式中,P1表示在该分组中被标记为黑样本的历史业务数据的占该目标特征所对应的所有历史样本数据中被标记为黑样本的历史业务数据的比例,P2表示在该分组中被标记为白样本的历史业务数据的占该目标特征所对应的所有历史样本数据中被标记为白样本的历史业务数据的比例。
为便于理解,下述将以业务特征为交易金额为例举例进行说明。
例如,对交易金额所对应的特征值进行的分组如表2所示。在表2中,黑样本个数则表示的是在该范围内的特征值所对应的历史业务数据中被标记为黑样本的历史业务数据的个数,白样本个数则表示的是在该范围内的特征值所对应的历史业务数据中被标记为白样本的历史业务数据的个数。
表2
组别 |
特征值范围 |
特征值个数 |
黑样本个数 |
白样本个数 |
1 |
<100 |
10个 |
3个 |
7个 |
2 |
≥100,且<200 |
50个 |
18个 |
32个 |
3 |
≥200 |
28个 |
10个 |
18个 |
针对上述组别1,则可以通过如下公式分别计算p1和p2:
p1=3/31
p2=7/57
WOE1=ln((3/31)/(7/57))
在计算出目标特征所对应的各个分组的WOE值后,将该目标特征所对应的各WOE值的和值作为该目标特征所对应的风险分值;将每个目标风控主体所对应的各个目标特征的风险分值的和值作为该目标风控主体所对应的风险分值。
当然,在具体实施时,为了防止所得到的各目标特征的风险分值以及目标风控主体所对应的风险分值过高或者过低,还可以预先设风险分值的取值范围,当所计算出的风险分值超过该取值范围后,则基于该取值范围对各风险分值进行调整。
在具体实施时,在生成上述风控策略后,还可执行如下步骤:
在风控策略运行时,确定风控策略所对应的评价指标的指标值;其中,评价指标包括风险覆盖率、策略准确率和用户打扰率中的一种或多种;根据评价指标的指标值,判断是否需要对风控策略进行优化。
若是需要对风控策略进行优化,则获取更多的历史业务数据,基于所获取的更多的历史业务数据对该风控策略进行优化。
图6为本说明书实施例提供的风控策略的生成方法的方法流程图之六,图6所示的方法至少包括如下步骤:
步骤602,获取目标业务的多个历史业务数据和历史业务数据标签。
步骤604,针对每个历史业务数据,根据该历史业务数据和该历史业务数据所对应的历史业务数据标签,确定各业务特征所对应的特征值。
步骤606,针对业务特征中的指定业务特征,根据该指定业务特征的特征类型,按照该特征类型所对应的计算规则,计算指定业务特征在包含该指定业务特征的所有历史业务数据中的特征值。
步骤608,分别确定每个业务特征所对应的历史业务数据中的非风险事件与所有历史业务数据中的非风险事件的第一比例,以及,确定每个业务特征所对应的历史业务数据中的风险事件与所有历史业务数据中的风险事件的第二比例,根据第一比例和第二比例,计算业务特征的IV值。
步骤610,根据各上述业务特征所对应的特征值,计算任意两个业务特征之间的相关系数。
步骤612,删除信息价值指标小于或等于第一设定阈值的业务特征,以及,针对相关系数大于或等于第二设定阈值的任意两个业务特征,删除任意两个业务特征中IV值较小的一个业务特征。
步骤614,对上述业务特征进行分组,确定每个目标风控主体所对应的业务特征组。
步骤616,针对每个业务特征组,计算该业务特征组中的任意两个业务特征之间的相关系数。
步骤618,基于上述相关系数,对每个业务特征组中的相关系数大于或等于第三设定阈值的业务特征进行合并,得到目标风控主体所对应的目标特征及目标特征的特征值。
步骤620,基于各个目标特征所对应的特征值,采用设定的风险分值计算规则,分别计算目标风控主体的风险分值,以及,计算目标风控主体所对应的各个目标特征的风险分值。
步骤622,基于目标风控主体及其对应的风险分值、各个目标特征及其对应的风险分值,生成针对目标业务的风控策略。
本说明书实施例提供的风控策略的生成方法,在生成目标业务的风控策略时,在获取到目标业务的历史业务数据和历史业务数据标签后,通过自动化的方式确定目标风控主体所对应的目标特征和目标特征的特征值,以及通过自动化的方式计算目标风控主体以及各个目标特征所对应的风险分值,从而基于上述历史业务数据标签和所得到的风险分值,生成针对目标业务的风控策略;即在本说明书实施例中,实现了风控策略的自动生成,既提高了风控策略的生成效率,降低了人力成本,还避免了人为经验对生成的风控策略的准确性的影响,即提高了所生成的风控策略的准确性。
基于本说明书实施例提供的方法,基于相同的思路,本说明书实施例还提供了一种风控策略的生成装置,用执行本说明书实施例提供的方法,图7为本说明书实施例提供的风控策略的生成装置的模块组成示意图,图7所示的装置,包括:
获取模块702,用于获取目标业务的多个历史业务数据和历史业务数据标签;其中,历史业务数据为与目标风控主体相关的业务数据,历史业务数据标签用于标识历史业务数据所对应的事件是否为风险事件;
第一确定模块704,用于根据多个历史业务数据和历史业务数据标签,按照预设的特征确定规则确定目标风控主体所对应的目标特征和目标特征的特征值;
计算模块706,用于基于各个目标特征所对应的特征值,采用设定的风险分值计算规则,分别计算目标风控主体的风险分值,以及,计算目标风控主体所对应的各个目标特征的风险分值;
生成模块708,用于基于目标风控主体及其对应的风险分值、各个目标特征及其对应的风险分值,生成针对目标业务的风控策略。
可选的,上述第一确定模块704,包括:
确定单元,用于根据多个历史业务数据和历史业务数据标签,确定历史业务数据的各个业务特征所对应的特征值;
筛选单元,用于根据各个业务特征所对应的特征值和历史业务数据标签,对业务特征进行筛选,得到筛选后的业务特征及对应的特征值;
合并单元,用于按照设定的特征组合规则,对筛选后的业务特征进行组合,得到目标风控主体所对应的目标特征及目标特征的特征值。
可选的,上述确定单元,具体用于:
针对每个历史业务数据,根据历史业务数据和该历史业务数据所对应的历史业务数据标签,确定各业务特征所对应的特征值;针对业务特征中的指定业务特征,根据指定业务特征的特征类型,按照特征类型所对应的计算规则,计算指定业务特征在包含该指定业务特征的所有历史业务数据中的特征值。
可选的,上述筛选单元,具体用于:
根据各个历史业务数据标签,分别计算各个业务特征的信息价值指标IV值,以及,根据各个业务特征所对应的特征值,计算业务特征中任意两个业务特征之间的相关系数;基于各个IV值和各个相关系数,对业务特征进行筛选。
可选的,上述筛选单元,还具体用于:
分别确定每个业务特征所对应的历史业务数据中的非风险事件与所有历史业务数据中的非风险事件的第一比例,以及,确定每个业务特征所对应的历史业务数据中的风险事件与所有历史业务数据中的风险事件的第二比例;根据第一比例和第二比例,计算业务特征的IV值。
可选的,上述筛选单元,还具体用于:
删除信息价值指标小于或等于第一设定阈值的业务特征;针对相关系数大于或等于第二设定阈值的任意两个业务特征,删除任意两个业务特征中IV值较小的一个业务特征。
可选的,上述合并单元,具体用于:
对业务特征进行分组,确定每个目标风控主体所对应的业务特征组;针对每个业务特征组,计算业务特征组中的任意两个业务特征之间的相关系数;基于相关系数,对每个业务特征组中的相关系数大于或等于第三设定阈值的业务特征进行合并,得到目标风控主体所对应的目标特征及目标特征的特征值。
可选的,风险分值计算规则为证据权重WOE计算规则。
可选的,本说明书实施例提供的装置还包括:
第二确定模块,用于在风控策略运行时确定风控策略所对应的评价指标的指标值;其中,评价指标包括风险覆盖率、策略准确率和用户打扰率中的一种或多种;
判断模块,用于根据评价指标的指标值,判断是否需要对风控策略进行优化。
本说明书实施例的风控策略的生成装置还可执行图1-图6中风控策略的生成装置执行的方法,并实现风控策略的生成装置在图1-图6所示实施例的功能,在此不再赘述。
本说明书实施例提供的风控策略的生成装置,在生成目标业务的风控策略时,在获取到目标业务的历史业务数据和历史业务数据标签后,通过自动化的方式确定目标风控主体所对应的目标特征和目标特征的特征值,以及通过自动化的方式计算目标风控主体以及各个目标特征所对应的风险分值,从而基于上述历史业务数据标签和所得到的风险分值,生成针对目标业务的风控策略;即在本说明书实施例中,实现了风控策略的自动生成,既提高了风控策略的生成效率,降低了人力成本,还避免了人为经验对生成的风控策略的准确性的影响,即提高了所生成的风控策略的准确性。
进一步地,基于上述图1至图6所示的方法,本说明书实施例还提供了一种风控策略的生成设备,如图8所示。
风控策略的生成设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器801和存储器802,存储器802中可以存储有一个或一个以上存储应用程序或数据。其中,存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对风控策略的生成设备中的一系列计算机可执行指令信息。更进一步地,处理器801可以设置为与存储器802通信,在风控策略的生成设备上执行存储器802中的一系列计算机可执行指令信息。风控策略的生成设备还可以包括一个或一个以上电源803,一个或一个以上有线或无线网络接口804,一个或一个以上输入输出接口805,一个或一个以上键盘806等。
在一个具体的实施例中,风控策略的生成设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对风控策略的生成设备中的一系列计算机可执行指令信息,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令信息:
获取目标业务的多个历史业务数据和历史业务数据标签;其中,历史业务数据为与目标风控主体相关的业务数据,历史业务数据标签用于标识历史业务数据所对应的事件是否为风险事件;
根据多个历史业务数据和历史业务数据标签,按照预设的特征确定规则确定目标风控主体所对应的目标特征和目标特征的特征值;
基于各个目标特征所对应的特征值,采用设定的风险分值计算规则,分别计算目标风控主体的风险分值,以及,计算目标风控主体所对应的各个目标特征的风险分值;
基于目标风控主体及其对应的风险分值、各个目标特征及其对应的风险分值,生成针对目标业务的风控策略。
可选的,计算机可执行指令信息在被执行时,根据多个历史业务数据和历史业务数据标签,按照预设的特征确定规则确定目标风控主体所对应的目标特征和目标特征的特征值,包括:
根据多个历史业务数据和历史业务数据标签,确定历史业务数据的各个业务特征所对应的特征值;
根据各个业务特征所对应的特征值和历史业务数据标签,对业务特征进行筛选,得到筛选后的业务特征及对应的特征值;
按照设定的特征组合规则,对筛选后的业务特征进行合并,得到目标风控主体所对应的目标特征及目标特征的特征值。
可选的,计算机可执行指令信息在被执行时,根据多个历史业务数据和历史业务数据标签,确定历史业务数据的各个业务特征所对应的特征值,包括:
针对每个历史业务数据,根据历史业务数据和该历史业务数据所对应的历史业务数据标签,确定各业务特征所对应的特征值;
针对业务特征中的指定业务特征,根据指定业务特征的特征类型,按照特征类型所对应的计算规则,计算指定业务特征在包含该指定业务特征的所有历史业务数据中的特征值。
可选的,计算机可执行指令信息在被执行时,根据各个业务特征所对应的特征值和历史业务数据标签,对业务特征进行筛选,得到筛选后的业务特征及对应的特征值,包括:
根据各个历史业务数据标签,分别计算各个业务特征的信息价值指标IV值,以及,根据各个业务特征所对应的特征值,计算业务特征中任意两个业务特征之间的相关系数;
基于各个IV值和各个相关系数,对业务特征进行筛选。
可选的,计算机可执行指令信息在被执行时,根据各个历史业务数据标签,分别计算各个业务特征的信息价值指标IV值,包括:
分别确定每个业务特征所对应的历史业务数据中的非风险事件与所有历史业务数据中的非风险事件的第一比例,以及,确定每个业务特征所对应的历史业务数据中的风险事件与所有历史业务数据中的风险事件的第二比例;
根据第一比例和第二比例,计算业务特征的IV值。
可选的,计算机可执行指令信息在被执行时,基于各个IV值和各个相关系数,对业务特征进行筛选,包括:
删除信息价值指标小于或等于第一设定阈值的业务特征;
针对相关系数大于或等于第二设定阈值的任意两个业务特征,删除任意两个业务特征中IV值较小的一个业务特征。
可选的,计算机可执行指令信息在被执行时,按照设定的特征组合规则,对筛选后的业务特征进行合并,得到目标风控主体所对应的目标特征及目标特征的特征值,包括:
对业务特征进行分组,确定每个目标风控主体所对应的业务特征组;
针对每个业务特征组,计算业务特征组中的任意两个业务特征之间的相关系数;
基于相关系数,对每个业务特征组中的相关系数大于或等于第三设定阈值的业务特征进行合并,得到目标风控主体所对应的目标特征及目标特征的特征值。
可选的,计算机可执行指令信息在被执行时,风险分值计算规则为证据权重WOE计算规则。
可选的,计算机可执行指令信息在被执行时,基于目标风控主体及其对应的风险分值、各个目标特征及其对应的风险分值,生成针对目标业务的风控策略之后,还可执行如下步骤:
在风控策略运行时,确定风控策略所对应的评价指标的指标值;其中,评价指标包括风险覆盖率、策略准确率和用户打扰率中的一种或多种;
根据评价指标的指标值,判断是否需要对风控策略进行优化。
本说明书实施例提供的风控策略的生成设备,在生成目标业务的风控策略时,在获取到目标业务的历史业务数据和历史业务数据标签后,通过自动化的方式确定目标风控主体所对应的目标特征和目标特征的特征值,以及通过自动化的方式计算目标风控主体以及各个目标特征所对应的风险分值,从而基于上述历史业务数据标签和所得到的风险分值,生成针对目标业务的风控策略;即在本说明书实施例中,实现了风控策略的自动生成,既提高了风控策略的生成效率,降低了人力成本,还避免了人为经验对生成的风控策略的准确性的影响,即提高了所生成的风控策略的准确性。
进一步地,基于上述图1至图6所示的方法,本说明书实施例还提供了一种存储介质,用于存储计算机可执行指令信息,一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令信息在被处理器执行时,能实现以下流程:
获取目标业务的多个历史业务数据和历史业务数据标签;其中,历史业务数据为与目标风控主体相关的业务数据,历史业务数据标签用于标识历史业务数据所对应的事件是否为风险事件;
根据多个历史业务数据和历史业务数据标签,按照预设的特征确定规则确定目标风控主体所对应的目标特征和目标特征的特征值;
基于各个目标特征所对应的特征值,采用设定的风险分值计算规则,分别计算目标风控主体的风险分值,以及,计算目标风控主体所对应的各个目标特征的风险分值;
基于目标风控主体及其对应的风险分值、各个目标特征及其对应的风险分值,生成针对目标业务的风控策略。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,根据多个历史业务数据和历史业务数据标签,按照预设的特征确定规则确定目标风控主体所对应的目标特征和目标特征的特征值,包括:
根据多个历史业务数据和历史业务数据标签,确定历史业务数据的各个业务特征所对应的特征值;
根据各个业务特征所对应的特征值和历史业务数据标签,对业务特征进行筛选,得到筛选后的业务特征及对应的特征值;
按照设定的特征组合规则,对筛选后的业务特征进行合并,得到目标风控主体所对应的目标特征及目标特征的特征值。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,根据多个历史业务数据和历史业务数据标签,确定历史业务数据的各个业务特征所对应的特征值,包括:
针对每个历史业务数据,根据历史业务数据和该历史业务数据所对应的历史业务数据标签,确定各业务特征所对应的特征值;
针对业务特征中的指定业务特征,根据指定业务特征的特征类型,按照特征类型所对应的计算规则,计算指定业务特征在包含该指定业务特征的所有历史业务数据中的特征值。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,根据各个业务特征所对应的特征值和历史业务数据标签,对业务特征进行筛选,得到筛选后的业务特征及对应的特征值,包括:
根据各个历史业务数据标签,分别计算各个业务特征的信息价值指标IV值,以及,根据各个业务特征所对应的特征值,计算业务特征中任意两个业务特征之间的相关系数;
基于各个IV值和各个相关系数,对业务特征进行筛选。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,根据各个历史业务数据标签,分别计算各个业务特征的信息价值指标IV值,包括:
分别确定每个业务特征所对应的历史业务数据中的非风险事件与所有历史业务数据中的非风险事件的第一比例,以及,确定每个业务特征所对应的历史业务数据中的风险事件与所有历史业务数据中的风险事件的第二比例;
根据第一比例和第二比例,计算业务特征的IV值。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,基于各个IV值和各个相关系数,对业务特征进行筛选,包括:
删除信息价值指标小于或等于第一设定阈值的业务特征;
针对相关系数大于或等于第二设定阈值的任意两个业务特征,删除任意两个业务特征中IV值较小的一个业务特征。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,按照设定的特征组合规则,对筛选后的业务特征进行合并,得到目标风控主体所对应的目标特征及目标特征的特征值,包括:
对业务特征进行分组,确定每个目标风控主体所对应的业务特征组;
针对每个业务特征组,计算业务特征组中的任意两个业务特征之间的相关系数;
基于相关系数,对每个业务特征组中的相关系数大于或等于第三设定阈值的业务特征进行合并,得到目标风控主体所对应的目标特征及目标特征的特征值。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,风险分值计算规则为证据权重WOE计算规则。
可选的,该存储介质存储的计算机可执行指令信息在被处理器执行时,基于目标风控主体及其对应的风险分值、各个目标特征及其对应的风险分值,生成针对目标业务的风控策略之后,还可执行如下步骤:
在风控策略运行时,确定风控策略所对应的评价指标的指标值;其中,评价指标包括风险覆盖率、策略准确率和用户打扰率中的一种或多种;
根据评价指标的指标值,判断是否需要对风控策略进行优化。
本说明书实施例提供的存储介质存储的计算机可执行指令信息在被处理器执行时,在生成目标业务的风控策略时,在获取到目标业务的历史业务数据和历史业务数据标签后,通过自动化的方式确定目标风控主体所对应的目标特征和目标特征的特征值,以及通过自动化的方式计算目标风控主体以及各个目标特征所对应的风险分值,从而基于上述历史业务数据标签和所得到的风险分值,生成针对目标业务的风控策略;即在本说明书实施例中,实现了风控策略的自动生成,既提高了风控策略的生成效率,降低了人力成本,还避免了人为经验对生成的风控策略的准确性的影响,即提高了所生成的风控策略的准确性。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令信息实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令信息到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令信息产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令信息也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令信息产生包括指令信息装置的制造品,该指令信息装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令信息也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令信息提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令信息、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令信息的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。