具体实施方式
本申请实施例提供一种用于风险决策的风险决策因子筛选方法及装置。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请的方案适用于多种应用场景。比如,可以用于信用产品运营方向业务提供商推荐风险决策因子或者信用产品;再比如,可以用于风险决策主体选择进行风险决策所基于的风险决策因子;等等。
下面对本申请的方案进行详细说明。
图1为本申请实施例提供的一种用于风险决策的风险决策因子筛选方法的流程示意图。从程序角度而言,该流程的执行主体可以是服务器上或者终端上的程序,比如,信用产品推荐程序、风控程序等。从设备角度而言,该流程的执行主体包括但不限于可作为上述服务器或者终端的以下至少一种设备:个人计算机、大中型计算机、计算机集群、手机、平板电脑、智能可穿戴设备、车机等。
图1中的流程可以包括以下步骤:
S101:获取正负样本对应于各待筛选风险决策因子的信用数据。
在本申请实施例中,所要筛选出的风险决策因子一般是用于风险决策的,正负样本可以与后续被风险决策的对象(比如,尚未确定是正样本还是负样本的新样本等)对应于同一业务主体,正负样本一定程度上可以反映出该业务主体的业务特点,正负样本及其相关数据可以由该业务主体提供。
在本申请实施例中,正负样本具体可以指多个正样本和/或多个负样本,正负样本是已经定性的(也不排除以后发生变化的可能)。比如,假定业务提供商是商户,正负样本可以是各用户在该商户的历史业务数据;其中,正样本对应的用户以往业务正常,可以认为风险较低,负样本对应的用户以往业务存在非正常现象(如用户未正常履约等),可以认为风险较高。
在本申请实施例中,风险决策因子可以有多种类型,每种类型可以有一个或多个的风险决策因子,对应于风险决策因子的信用数据可以是风险决策因子的具体取值。风险决策因子的具体取值可以反映用户的信用的高低程度,列举三种类型的风险决策因子作为示例:
分值型因子,以信用分数、信用等级为例,一般地,分数或等级越高,表示信用越高;
布尔型因子,以实名信息验证结果、身份验证结果为例,一般地,验证结果为真时,表示信用相对高,验证结果为假时,表示信用相对低;
代码型因子,以风险码为例,一般地,无风险码时,表示信用相对高,有风险码时,表示信用相对低。
S102:根据所述信用数据,对所述正负样本进行风险决策并统计,得到所述各待筛选风险决策因子分别的单独适用性数据。
在本申请实施例中,不同的待筛选风险决策因子可以分别有自己的单独适用性数据,待筛选风险决策因子的单独适用性数据可以反映:当单独基于该待筛选风险决策因子,对正负样本进行风险决策时,决策结果的可靠性,这种可靠性即反映了该待筛选风险决策因子对于正负样本或者正负样本的提供者的单独适用性。
待筛选风险决策因子的单独适用性也即:在单独采用该待筛选风险决策因子进行风险决策的场景下,该待筛选风险因子自己的适用程度。
单独适用性数据可以包括风险决策结果本身,也可以包括对于风险决策结果的进一步统计、提验或者引申得到的数据等。
S103:根据所述单独适用性数据,确定所述各待筛选风险决策因子中至少部分待筛选风险决策因子的联合适用性数据。
对于风险决策而言,不是随便采用什么风险决策因子都可以,往往需要满足一定的指标,比如,综合误杀率需要低于一定的阈值,成功拦截率需要高于一定的阈值,等等。在实际应用中,单个风险决策因子往往难以全部满足这些指标,则可以联合多个风险决策因子综合地进行风险决策,如此,更有可能全部满足这些指标。
根据上一段中的分析,在本申请实施例中,可以综合度量多个待筛选风险决策因子对于正负样本或者正负样本的提供者的联合适用性。被联合的至少部分待筛选风险决策因子可以共有同样的联合适用性数据,所述至少部分待筛选风险决策因子的联合适用性数据可以反映:当基于所述至少部分待筛选风险决策因子,综合地对正负样本进行风险决策时,决策结果的可靠性,这种可靠性即反映了所述至少部分待筛选风险决策因子对于正负样本或者正负样本的提供者的联合适用性。
至少部分待筛选风险决策因子的联合适用性也即:在联合采用所述至少部分待筛选风险决策因子综合地进行风险决策的场景下,所述至少部分待筛选风险决策因子作为一个整体的适用程度。
在本申请实施例中,可以一次或多次对各待筛选风险决策因子尝试组合,得到所述至少部分待筛选风险决策因子(可以称为:因子组合,因子组合中的因子即是被联合的因子)。
需要说明的是,当所述至少部分待筛选风险决策因子只包含一个待筛选风险决策因子时,所述至少部分待筛选风险决策因子的联合适用性数据可以只反映这一个待筛选风险决策因子的单独适用性。
S104:根据所述联合适用性数据,确定在所述各待筛选风险决策因子中筛选出的风险决策因子。
在本申请实施例中,各因子组合的联合适用性可能有差异,可以筛选出联合适用性相对高(比如,至少满足上述的指标)的因子组合,筛选出的因子组合中包含的待筛选风险决策因子即为筛选出的风险决策因子。
在实际应用中,联合适用性的高低未必是筛选时唯一考虑的指标。比如,也可能要求筛选出的风险决策因子的数量不能过高,在这种情况下,也可以优先考虑筛选出的风险决策因子的数量不超标的各因子组合,再进一步地在这些因子组合中筛选联合适用性高的风险决策因子;等等。
在本申请实施例中,筛选出的风险决策因子可以有多种用途。比如,可以向业务提供商推荐筛选出的风险决策因子对应的信用产品,以用于业务提供商对自己的用户的相关业务进行风险决策;再比如,可以直接基于筛选出的各风险决策因子,综合对相关业务进行风险决策;等等。
通过图1的方法,可以分别根据不同业务提供商提供的正负样本,对应地筛选出适用于不同业务提供商的风险决策因子,进而,有利于根据风险决策因子筛选结果,有针对性地向业务提供商推荐适用性较好的信用产品,有利于提高基于所推荐的信用产品包含的风险决策因子的风险决策结果的可靠性,因此,可以部分或全部地解决现有技术中的问题。
基于图1的方法,本申请实施例还提供了该方法的一些具体实施方案,以及扩展方案,下面进行说明。
在本申请的实施例中,以筛选风险决策因子为了推荐信用产品的场景为例。在该场景下,各待筛选风险决策因子可以来自于多个信用产品,每个信用产品有至少一个待筛选风险决策因子,对于步骤S104,所述根据所述联合适用性数据,确定在所述各待筛选风险决策因子中筛选出的风险决策因子后,还可以执行:确定筛选出的风险决策因子来自的信用产品;推荐确定出的信用产品。
进一步地,前面有提到,正负样本可以由被推荐方(比如,业务提供方等)提供;在这种情况下,所述推荐确定出的信用产品,具体可以包括:向所述被推荐方推荐确定出的信用产品,以用于所述被推荐方进行风险决策。
正负样本由被推荐方提供的优点在于:有利于提高基于正负样本筛选出的风险决策因子的适用性,因为,后续所述被推荐方进行风险决策的对象往往就是和正负样本类似的新样本,正负样本与新样本有一定的业务共性,则由被推荐方提供的正负样本的参考价值也更高。
关于正负样本中的每个样本具体是正样本还是负样本,可以由被推荐方直接指定,也可以由图1中的流程的执行主体自行分析确定。
在本申请实施例中,为了得到单独适用性数据,可以采用的具体实施方式可以有多种,为了便于理解,就其中一种展开说明。
风险决策的结果可以为接受或者拒绝,对于步骤S102,所述根据所述信用数据,对所述正负样本进行风险决策并统计,得到所述各待筛选风险决策因子分别的单独适用性数据,具体可以包括:分别针对所述各待筛选风险决策因子中的每个待筛选风险决策因子,执行:
在获取的所述信用数据中,确定所述正负样本对应于该待筛选风险决策因子的信用数据;
根据确定的信用数据,对所述正负样本进行风险决策并统计,得到正样本接受率、正样本拒绝率、负样本接受率、负样本拒绝率这四种数据中的至少一种数据(为了便于描述,统称为:决策统计数据);
根据所述至少一种数据,得到该待筛选风险决策因子的单独适用性数据。
在本申请实施例中,可以将决策统计数据直接作为单独适用性数据;也可以根据决策统计数据,进一步地计算得到单独适用性数据。对于后一种情况,单独适用性数据可以包含适用性表征值,且该适用性表征值并非决策统计数据本身。
以决策统计数据为正样本拒绝率和/或负样本拒绝率为例,所述根据所述至少一种数据,得到该待筛选风险决策因子的单独适用性数据,具体可以包括:根据所述正样本拒绝率和/或负样本拒绝率,计算适用性表征值;得到该待筛选风险决策因子的包含该适用性表征值的单独适用性数据,其中,该待筛选风险决策因子的单独适用性数据通过该适用性表征值反映单独适用性的高低程度。
适用性表征值可以只指一个表征值,也可以指若干个不同的表征值。假定适用性表征值指有效值和评价值,为了便于理解,如下表1列出了有效值、评价值的一种具体定义作为示例:
表1
在表1中,适用性表征值是根据正样本拒绝率和负样本拒绝率计算得到的。
需要说明的是,表1中的定义只是示例,并非限定。比如,适用性表征值也可以根据正样本接受率和负样本接受率计算得到,适用性表征值可以只指有效值或者只指评价值甚至可以指其他可表征适用性的值,等等。
在本申请实施例中,一般地,相比于对单独适用性相对低的待筛选风险决策因子进行组合,对单独适用性相对高的待筛选风险决策因子进行组合更有可能实现较高的联合适用性,这可以理解为强强联合。因此,得到各待筛选风险决策因子分别的单独适用性数据后,在尝试对各待筛选风险决策因子进行组合时,可以基于单独适用性数据,优先对单独适用性较高的待筛选风险决策因子进行组合,如此,有利于尽快确定风险决策因子筛选结果,各次组合的过程属于风险决策因子筛选过程。
例如,对于步骤S102,所述根据所述单独适用性数据,确定所述各待筛选风险决策因子中至少部分待筛选风险决策因子的联合适用性数据,具体可以包括:根据所述单独适用性数据,对所述各待筛选风险决策因子排序,得到待筛选风险决策因子序列;
根据预定的联合适用性指标,对所述待筛选风险决策因子序列进行遍历,针对遍历到的当前待筛选风险决策因子执行:
确定当前已选因子集合中包含的待筛选风险决策因子的联合适用性数据,作为第一数据,其中,当前已选因子集合在所述遍历开始时为空集;
根据所述联合适用性指标、所述第一数据,以及当前待筛选风险决策因子的单独适用性数据,确定当前待筛选风险决策因子与当前已选因子集合中包含的待筛选风险决策因子的联合适用性数据,作为第二数据;
判断所述第二数据是否均满足所述联合适用性指标;
若是,结束所述遍历过程;
否则,根据所述联合适用性指标,将当前待筛选风险决策因子选入或者不选入当前已选因子集合中,遍历至下一个待筛选风险决策因子,直至所述遍历完毕为止。
更具体地,所对应的单独适用性数据反映出的单独适用性越高的待筛选风险决策因子在所述待筛选风险决策因子序列中的顺序可以越靠前,在这种情况下,上述的遍历相应地可以是正序遍历。
从上例可以看出,通过基于单独适用性对各待筛选风险决策因子进行排序,有利于确定出优先组合哪些待筛选风险决策因子。上例中采用的具体组合方式是:根据单独适用性从高到底的顺序,逐一尝试着进行组合,已尝试组合成功的待筛选风险决策因子入选正式的因子组合(也即,当前已选因子集合),导致尝试组合失败的待筛选风险决策因子不入选正式的因子组合,直至正式的因子组合能够全部满足联合适用性指标,可以停止遍历过程。
当然,该具体组合方式也是示例,并非限定。比如,可以反向排序得到待筛选风险决策因子序列,进而再反序遍历;再比如,可以先对各待筛选风险决策因子进行分类,再分别根据单独适用性排序,然后,在优先对排序靠前的不同类型的待筛选风险决策因子进行组合,等等。
沿用上例,进一步地,对于步骤S104,所述根据所述联合适用性数据,确定在各待筛选风险决策因子中筛选出的风险决策因子,具体可以包括:在结束所述遍历过程后,将当前已选因子集合中包含的待筛选风险决策因子确定为在所述各待筛选风险决策因子中筛选出的风险决策因子。
在本申请实施例中,联合适用性数据可以根据决策统计数据和/或适用性表征值得到。也即,对于步骤S103,所述根据所述单独适用性数据,确定所述各待筛选风险决策因子中至少部分待筛选风险决策因子的联合适用性数据,具体可以包括:根据所述单独适用性数据和/或其所基于的所述至少一种数据,确定所述各待筛选风险决策因子中至少部分待筛选风险决策因子的联合适用性数据。
例如,可以根据正样本接受率和/或负样本接受率计算得到联合适用性数据,在这种情况下,正样本接受率和/或负样本接受率相应地可以包含于单独适用性数据中。
在本申请实施例中,联合适用性数据可以包含一种或多种数据。为了便于理解,沿用表1中的定义,如下列出了联合适用性数据的一种具体定义作为示例:
联合适用性数据可以包含综合误杀率、成功拦截率;相应地,上述的联合适用性指标可以是综合误杀率的最大容忍值(称为:误杀率阈值)、成功拦截率的最低目标值(称为:拦截率阈值);
综合误杀率=1-(1-当前的综合误杀率)*正样本接受率;
成功拦截率=1-(1-当前的成功拦截率)*负样本接受率;
其中,综合误杀率和成功拦截率的初始值均为0。
基于该示例以及表1中的定义,可以先根据评价值和有效值,对各待筛选风险决策因子进行排序(比如,可以优先按照评价值排序,顺序相同的进一步地根据有效值排序等)后遍历,针对遍历的每个待筛选风险决策因子进行综合误杀率和成功拦截率的试算,看待筛选风险决策因子能否选入当前已选因子集合:若试算的综合误杀率不大于误杀率阈值,则选入,并将当前的综合误杀率和成功拦截率对应地更新为试算的综合误杀率和成功拦截率,若试算的综合误杀率大于误杀率阈值,则不选入,也不执行所述更新的动作。如此,直至成功拦截率不小于拦截率阈值为止,可以结束遍历。
在示例的联合适用性数据具体定义中,通过联合适用性数据计算公式反映了以下本申请的部分发明思想:将单个的待筛选风险决策因子分别作为一个分类器,联合多个分类器可以形成一个联合分类器,用联合分类器进行风险决策时,只要构成联合分类器的任一分类器的决策结果是拒绝,则联合分类器的决策结果是拒绝,从而有利于更有效地阻止风险。后续在基于筛选出的风险决策因子进行风险决策时,可以按照本段中的思想实施。
不仅如此,由于是基于单独有效性排序结果进行组合的,因此,有利于筛选出尽量少的风险决策因子来构成符合指标要求的组合,
在本申请实施例中,前面也有提到,在一种该场景下,筛选风险决策因子是为了向被推荐方推荐信用产品,而信用产品可能包含多个风险决策因子。在这种情况下,处于成本考虑,被推荐方可能会希望被推荐的信用产品有效而且数量尽量少,为了满足这种需求,可以对上述的排序操作进行适应性地调整,具体地,可以综合考虑信用产品包含的各风险决策因子的单独有效性,对各信用产品进行排序,再遍历各信用产品,在遍历信用产品时,进一步地遍历信用产品包含的各风险决策因子。
根据上一段中的分析,所述根据所述单独适用性数据,对所述各待筛选风险决策因子排序得到待筛选风险决策因子序列,具体可以包括:若各待筛选风险决策因子来自于多个信用产品,每个信用产品有至少一个待筛选风险决策因子,根据所述单独适用性数据,对所述各待筛选风险决策因子对应的信用产品进行排序,得到信用产品序列,在所述信用产品序列中,对每个信用产品的待筛选风险决策因子分别进行排序,得到包含所述各待筛选风险决策因子的待筛选风险决策因子序列,其中,所对应的单独适用性数据反映出的单独适用性越高的待筛选风险决策因子在其来自的信用产品的待筛选风险决策因子排序结果中的顺序越靠前。
根据上面的说明,本申请实施例还提供了一种实际应用场景下,基于上述用于风险决策的风险决策因子筛选方法,推荐信用产品的一种具体实施方案的流程示意图,如图2所示。在图2的场景下,上述的单独适用性数据包括:正样本接受率、正样本拒绝率、负样本接受率、负样本拒绝率、有效值、评价值;上述的联合适用性数据包括:综合误杀率、成功拦截率;每条评分项包括对应的信用产品信息、对应的一个待筛选数据因子及其信用数据和单独适用性数据。
图2中的流程主要可以包括以下步骤:
查询被推荐方提供的各样本的相关数据,并确定正负样本;图2中给出了一个样本的例子,由于该样本对应的用户“张三”未正常履约,因此,被确定为负样本,各待筛选风险决策因子包括信用分数因子、风险码因子等;
遍历各待筛选风险决策因子,分别基于每个待筛选风险决策因子,对正负样本进行风险决策并统计得到一条评分项,得到的各条评分项添加到评分列表;待筛选风险决策因子可以为分值型因子,或者布尔型因子,或者代码型因子等;
评分列表按照各条评分项的评价值和有效值进行降序排列;
正序遍历评分列表中的各条评分项,通过在遍历过程中,试算综合误杀率和成功拦截率,并将试算结果与拦截率阈值和/或误杀率阈值进行比较,确定被筛选出的风险决策因子,在遍历过程中记录的评分项包含的待筛选风险决策因子即为被筛选出的风险决策因子;
根据筛选出的风险决策因子,推荐对应的信用产品。
在本申请实施例中,对于属于分值型因子的待筛选风险决策因子,可以在确定其单独适用性数据的过程中,确定合适的分值阈值,在基于该分值阈值对正负样本进行风险决策(一般地,低于该分值阈值,可以判定拒绝,不低于该分值阈值,可以判定接受)的情况下,待筛选风险决策因子的单独适用性可以达到相对好的水平。在具体实施时,可以将一个分值型因子视为一个总因子,总因子下,可以有多个可选的分值,每个分值可以代表总因子的一个子因子,所述合适的分值阈值所代表的子因子相比于其他子因子单独适用性可以更好,因此,可以用所述合适的分值阈值所代表的子因子来代表总因子。
具体地,当所述待筛选风险决策因子为所述分值型因子时,所述正负样本对应于所述待筛选风险决策因子的信用数据为分值;可以按照如下方法,得到所述待筛选风险决策因子的单独适用性数据:
确定分值区间,所述分值区间包含至少部分所述正负样本对应于所述待筛选风险决策因子的分值;在所述分值区间中选择不重复的多个分值,所选择的每个分值分别代表所述待筛选风险决策因子的一个子因子;确定各所述子因子分别的单独适用性数据;将对应的单独适应性数据反映出的单独适用性最高的所述子因子的单独适用性数据作为所述待筛选风险决策因子的单独适用性数据。
例如,所述确定包含至少部分所述正负样本对应于所述待筛选风险决策因子的信用数据的分值区间,具体可以包括:确定所述正负样本中正样本对应于所述待筛选风险决策因子的分值的均值,作为第一均值;以及确定所述正负样本中负样本对应于所述待筛选风险决策因子的分值的均值,作为第二均值;确定位于所述第一均值与所述第二均值之间的分值区间。
对于如何在所述分值区间中选择不重复的多个分值,也可以有多种具体实施方案,比如,可以随机选择,也可以固定间隔选择,等等。
例如,所述在所述分值区间中选择不重复的多个分值,具体可以包括:从所述分值区间的一个区间端点出发,按照指定的步长步进至所述分值区间的一个区间端点,根据所述步进的过程,对应地在所述分值区间中选择不重复的多个分值。所述指定的步长既可以为固定间隔。
根据上面对分值型因子的相关方案的说明,本申请实施例还提供了图2的场景中的分值型算法的一种具体实施方案的流程示意图,如图3所示。
假定分值越高,信用越高,图3中的流程主要可以包括以下步骤:
针对当前的分值型风险决策因子,计算正样本分值均值,以及计算负样本分值均值;
将计算的均值按指定的步长对齐,以便于运算;在图3中给出了两个例子,第一个例子中,指定的步长为1,对齐时去掉小数点之后的内容,第二个例子中,指定的步长为0.01,对齐时去掉小数点后两位之后的内容;
分值从负样本均值开始,按照步长累加到正样本均值,分别针对累加过程中得到的每个当前分值计算对应的评分项,并将当前分值及其对应的评分项添加到评分列表(该评分列表区别于图2中的评分列表);
上一段中的循环结束后,将评分列表中的各条评分项按评价值、有效值降序排列;
若首项评分项大于零,则返回首项评分项,首项评分项对应中的分值即为上述的合适的分值阈值。
上面对分值型因子进行了分析,类似地,再来看布尔型因子和代码型因子,与分值型因子不同,布尔型因子(具体取值为:真或者假)、代码型因子(具体取值为:有代码或者无代码)的具体取值一般只有两个,分别对应于接受和拒绝这两种风险决策结果,因此,无需再确定类似分值阈值的取值阈值,而是直接计算评分项即可。结合图4、图5进行说明。
图4为本申请实施例提供的图2的场景中的布尔型算法的一种具体实施方案的流程示意图。
图5为本申请实施例提供的图2的场景中的代码型算法的一种具体实施方案的流程示意图。
在图4、图5中,直接针对当前风险决策因子计算对应的评分项即可,评分项包含的内容可以包含单独适用性数据。
在本申请实施例中,以上实施例主要是基于正样本接受率、正样本拒绝率、负样本接受率、负样本拒绝率这四种数据中的至少一种数据,得到单独适用性数据以及联合适用性数据的。但这未必是唯一方案,在实际应用中,根据对正负样本进行风险决策得到的结果,进行统计、提验或者引申得到的数据均有可能作为:计算单独适用性数据以及联合适用性数据所使用的基础数据。
上面为本申请实施例提供的一种用于风险决策的风险决策因子筛选方法,基于同样的发明思路,本申请实施例还提供了对应的装置,如图6所示。
图6为本申请实施例提供的对应于图1的一种用于风险决策的风险决策因子筛选装置的结构示意图,虚线方框表示可选的模块,该装置可以位于图1中流程的执行主体上,包括:
信用数据获取模块601,获取正负样本对应于各待筛选风险决策因子的信用数据;
单独适用性数据模块602,根据所述信用数据,对所述正负样本进行风险决策并统计,得到所述各待筛选风险决策因子分别的单独适用性数据;
联合适用性数据模块603,根据所述单独适用性数据,确定所述各待筛选风险决策因子中至少部分待筛选风险决策因子的联合适用性数据;
筛选结果确定模块604,根据所述联合适用性数据,确定在所述各待筛选风险决策因子中筛选出的风险决策因子。
可选地,所述各待筛选风险决策因子来自于多个信用产品,每个信用产品有至少一个所述待筛选风险决策因子;
所述装置还包括:
信用产品推荐模块605,在所述筛选结果确定模块604根据所述联合适用性数据,确定在所述各待筛选风险决策因子中筛选出的风险决策因子后,确定筛选出的风险决策因子来自的信用产品;推荐确定出的信用产品。
可选地,所述正负样本由被推荐方提供;
所述信用产品推荐模块605推荐确定出的信用产品,具体包括:
所述信用产品推荐模块605向所述被推荐方推荐确定出的信用产品,以用于所述被推荐方进行风险决策。
可选地,所述风险决策的结果为接受或者拒绝;
所述单独适用性数据模块602根据所述信用数据,对所述正负样本进行风险决策并统计,得到所述各待筛选风险决策因子分别的单独适用性数据,具体包括:
所述单独适用性数据模块602分别针对所述各待筛选风险决策因子中的每个待筛选风险决策因子,执行:
在获取的所述信用数据中,确定所述正负样本对应于该待筛选风险决策因子的信用数据;
根据确定的信用数据,对所述正负样本进行风险决策并统计,得到正样本接受率、正样本拒绝率、负样本接受率、负样本拒绝率这四种数据中的至少一种数据;
根据所述至少一种数据,得到该待筛选风险决策因子的单独适用性数据。
可选地,所述单独适用性数据模块602根据所述至少一种数据,得到该待筛选风险决策因子的单独适用性数据,具体包括:
所述单独适用性数据模块602根据所述正样本拒绝率和/或负样本拒绝率,计算适用性表征值;
得到该待筛选风险决策因子的包含该适用性表征值的单独适用性数据,其中,该待筛选风险决策因子的单独适用性数据通过该适用性表征值反映单独适用性的高低程度。
可选地,该待筛选风险决策因子的单独适用性数据包含所述正样本接受率和/或所述负样本接受率。
可选地,所述联合适用性数据模块603根据所述单独适用性数据,确定所述各待筛选风险决策因子中至少部分待筛选风险决策因子的联合适用性数据,具体包括:
所述联合适用性数据模块603根据所述单独适用性数据和/或其所基于的所述至少一种数据,确定所述各待筛选风险决策因子中至少部分待筛选风险决策因子的联合适用性数据。
可选地,所述联合适用性数据模块603根据所述单独适用性数据,确定所述各待筛选风险决策因子中至少部分待筛选风险决策因子的联合适用性数据,具体包括:
所述联合适用性数据模块603根据所述单独适用性数据,对所述各待筛选风险决策因子排序,得到待筛选风险决策因子序列;
根据预定的联合适用性指标,对所述待筛选风险决策因子序列进行遍历,针对遍历到的当前待筛选风险决策因子执行:
确定当前已选因子集合中包含的待筛选风险决策因子的联合适用性数据,作为第一数据,其中,当前已选因子集合在所述遍历开始时为空集;
根据所述联合适用性指标、所述第一数据,以及当前待筛选风险决策因子的单独适用性数据,确定当前待筛选风险决策因子与当前已选因子集合中包含的待筛选风险决策因子的联合适用性数据,作为第二数据;
判断所述第二数据是否均满足所述联合适用性指标;
若是,结束所述遍历过程;
否则,根据所述联合适用性指标,将当前待筛选风险决策因子选入或者不选入当前已选因子集合中,遍历至下一个待筛选风险决策因子,直至所述遍历完毕为止。
可选地,所述联合适用性数据模块603根据所述单独适用性数据,对所述各待筛选风险决策因子排序得到待筛选风险决策因子序列,具体包括:
所述联合适用性数据模块603根据所述单独适用性数据,对所述各待筛选风险决策因子排序,得到待筛选风险决策因子序列,其中,所对应的单独适用性数据反映出的单独适用性越高的待筛选风险决策因子在所述待筛选风险决策因子序列中的顺序越靠前;或者,
若所述各待筛选风险决策因子来自于多个信用产品,每个信用产品有至少一个所述待筛选风险决策因子,根据所述单独适用性数据,对所述各待筛选风险决策因子对应的信用产品进行排序,得到信用产品序列,以及在所述信用产品序列中,对每个信用产品的待筛选风险决策因子分别进行排序,得到包含所述各待筛选风险决策因子的待筛选风险决策因子序列,其中,所对应的单独适用性数据反映出的单独适用性越高的待筛选风险决策因子在其来自的信用产品的待筛选风险决策因子排序结果中的顺序越靠前。
可选地,所述筛选结果确定模块604根据所述联合适用性数据,确定在各待筛选风险决策因子中筛选出的风险决策因子,具体包括:
所述筛选结果确定模块604在结束所述遍历过程后,将当前已选因子集合中包含的待筛选风险决策因子确定为在所述各待筛选风险决策因子中筛选出的风险决策因子。
可选地,所述待筛选风险决策因子为分值型因子,或者布尔型因子,或者代码型因子。
可选地,当所述待筛选风险决策因子为分值型因子时,所述正负样本对应于所述待筛选风险决策因子的信用数据为分值;
所述单独适用性数据模块602按照如下方式,得到所述待筛选风险决策因子的单独适用性数据:
确定分值区间,所述分值区间包含至少部分所述正负样本对应于所述待筛选风险决策因子的分值;
在所述分值区间中选择不重复的多个分值,所选择的每个分值分别代表所述待筛选风险决策因子的一个子因子;
确定各所述子因子分别的单独适用性数据;
将所对应的单独适应性数据反映出的单独适用性最高的所述子因子的单独适用性数据作为所述待筛选风险决策因子的单独适用性数据。
可选地,所述单独适用性数据模块602确定包含至少部分所述正负样本对应于所述待筛选风险决策因子的信用数据的分值区间,具体包括:
所述单独适用性数据模块602确定所述正负样本中正样本对应于所述待筛选风险决策因子的分值的均值,作为第一均值;以及确定所述正负样本中负样本对应于所述待筛选风险决策因子的分值的均值,作为第二均值;
确定位于所述第一均值与所述第二均值之间的分值区间。
可选地,所述单独适用性数据模块602在所述分值区间中选择不重复的多个分值,具体包括:
所述单独适用性数据模块602从所述分值区间的一个区间端点出发,按照指定的步长步进至所述分值区间的一个区间端点,根据所述步进的过程,对应地在所述分值区间中选择不重复的多个分值。
本申请实施例提供的装置与方法是对应的,因此,装置也具有与对应方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述对应装置的有益技术效果。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。