CN109816509A - 评分卡模型的生成方法、终端设备及介质 - Google Patents

评分卡模型的生成方法、终端设备及介质 Download PDF

Info

Publication number
CN109816509A
CN109816509A CN201811531633.XA CN201811531633A CN109816509A CN 109816509 A CN109816509 A CN 109816509A CN 201811531633 A CN201811531633 A CN 201811531633A CN 109816509 A CN109816509 A CN 109816509A
Authority
CN
China
Prior art keywords
data
model
attribute data
scorecard
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811531633.XA
Other languages
English (en)
Inventor
裴阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811531633.XA priority Critical patent/CN109816509A/zh
Publication of CN109816509A publication Critical patent/CN109816509A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明适用于数据处理技术领域,提供了评分卡模型的生成方法、终端设备及介质,该方法包括:获取与待生成的评分卡模型相对应的业务流程;确定业务流程所关联的各个历史对象,并获取历史对象的属性数据;构建条件生成式对抗网络模型,并基于各个历史对象的属性数据,对条件生成式对抗网络模型进行训练,得到数据采集模型;将属性数据输入所述数据采集模型,以通过数据采集模型分析处理属性数据后,输出样本数据;基于样本数据构建并训练评分卡模型。本发明避免了因历史对象的属性数据较少而产生较大统计偏差的问题,使得基于该样本数据所训练得到的评分卡模型能够具有更高的拟合度,保证了训练得到的A卡模型能够具有更高的泛化能力。

Description

评分卡模型的生成方法、终端设备及介质
技术领域
本发明属于数据处理技术领域,尤其涉及一种评分卡模型的生成方法、终端设备及计算机可读存储介质。
背景技术
信贷场景中的评分卡主要用于对客户在未来一段时间内的违约、逾期以及失联概率等进行预测,从而实现以具体数值的形式来衡量风险几率。申请评分卡模型(也称为A卡模型)是上述评分卡中的一种,可用于评估信贷业务申请者是否具备贷款申请条件。A卡模型所需处理的数据通常是申请者的背景变量,因此,在利用A卡模型来进行风控审核之前,往往要先收集多类信贷业务申请者的客户数据。
然而,由于实际申请流程中所积累的客户数据是有限的,故基于数目较少的客户数据所训练得到的A卡模型会产生较大的统计偏差,从而出现模型稳定性较差的问题。为了解决该问题,现有技术在A卡模型训练之前,还会对客户数据进行过采样和欠采样,但是,这类处理方式则会导致A卡模型容易产生过拟合的问题,由此降低了A卡模型的泛化能力。
发明内容
有鉴于此,本发明实施例提供了一种评分卡模型的生成方法、终端设备及计算机可读存储介质,以解决现有技术中A卡模型的稳定性以及泛化能力均较为低下的问题。
本发明实施例的第一方面提供了一种评分卡模型的生成方法,包括:
获取与待生成的评分卡模型相对应的业务流程;
确定所述业务流程所关联的各个历史对象,并获取所述历史对象的属性数据;
构建条件生成式对抗网络模型,并基于各个所述历史对象的属性数据,对所述条件生成式对抗网络模型进行训练,得到数据采集模型;
将所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述属性数据后,输出样本数据;
基于所述样本数据构建并训练所述评分卡模型。
本发明实施例的第一方面提供了一种评分卡模型的生成装置,包括:
第一获取单元,用于获取与待生成的评分卡模型相对应的业务流程;
确定单元,用于确定所述业务流程所关联的各个历史对象,并获取所述历史对象的属性数据;
第一训练单元,用于构建条件生成式对抗网络模型,并基于各个所述历史对象的属性数据,对所述条件生成式对抗网络模型进行训练,得到数据采集模型;
第一输出单元,用于将所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述属性数据后,输出样本数据;
第二训练单元,用于基于所述样本数据构建并训练所述评分卡模型。
本发明实施例的第三方面提供了一种终端设备,包括存储器以及处理器,所述存储器存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
获取与待生成的评分卡模型相对应的业务流程;
确定所述业务流程所关联的各个历史对象,并获取所述历史对象的属性数据;
构建条件生成式对抗网络模型,并基于各个所述历史对象的属性数据,对所述条件生成式对抗网络模型进行训练,得到数据采集模型;
将所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述属性数据后,输出样本数据;
基于所述样本数据构建并训练所述评分卡模型。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
获取与待生成的评分卡模型相对应的业务流程;
确定所述业务流程所关联的各个历史对象,并获取所述历史对象的属性数据;
构建条件生成式对抗网络模型,并基于各个所述历史对象的属性数据,对所述条件生成式对抗网络模型进行训练,得到数据采集模型;
将所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述属性数据后,输出样本数据;
基于所述样本数据构建并训练所述评分卡模型。
本发明实施例中,通过预先获取业务流程所关联的各个历史对象的属性数据,并利用该属性数据来对生成式对抗网络模型进行训练以生成数据采集模型,使得数据采集模型最终所输出的样本数据能够更好地模拟历史对象属性数据的分布情况,从而提高了数据采集模型的泛化效果;由于训练完成后的数据采集模型能够自动生成更多的样本数据,实现了对各类型样本数据的覆盖,故避免了因历史对象的属性数据较少而产生较大统计偏差的问题,实现了对正负样本不均衡数据的调整,由此也使得基于该样本数据所训练得到的评分卡模型能够具有更高的拟合度,保证了训练得到的A卡模型能够具有更高的泛化能力。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的评分卡模型的生成方法的实现流程图;
图2是本发明实施例提供的评分卡模型的生成方法S104的具体实现流程图;
图3是本发明另一实施例提供的评分卡模型的生成方法的实现流程图;
图4是本发明又一实施例提供的评分卡模型的生成方法的实现流程图;
图5是本发明实施例提供的评分卡模型的生成装置的结构框图;
图6是本发明实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明实施例提供的目标对象的跟踪方法的实现流程,该方法流程包括步骤S101至S105。各步骤的具体实现原理如下:
S101:获取与待生成的评分卡模型相对应的业务流程。
本发明实施例中,根据管理人员发出的控制指令,确定当前时刻待生成的评分卡模型的类型。评分卡模型包括但不限于用于评估信贷业务申请者是否具备贷款申请条件的申请评分卡模型(Application score card,A卡)、用于预测客户开户后一定时期内违约拖欠的风险概率的行为评分卡模型(Behavior score card,B卡)以及用于对逾期帐户预测催收策略反应的概率的催收评分卡模型(Collection score card,C卡)等。
不同的评分卡模型对应不同的业务流程,且评分卡模型以及业务流程标识的对应关系存储于一预设数据表中。其中,业务流程不仅包括贷款流程以及信用卡申请流程等各类信用业务的申请流程,还包括与客户数据相关的其他业务流程。例如,A卡模型与信贷申请流程对应;C卡模型与催收业务流程对应。
本发明实施例中,根据待生成的评分卡模型,从上述数据表中查询与该评分卡模型对应的业务流程标识,从而得知与待生成的评分卡模型相对应的业务流程。
S102:确定所述业务流程所关联的各个历史对象,并获取所述历史对象的属性数据。
本发明实施例中,在业务流程被触发时,基于资料信息卡的形式,接收客户上传的与个人信息相关的属性数据。属性数据包括但不限于客户的性别、年龄、职业、年收入信息、逾期还款信息以及不动产信息等。根据业务流程所对应的风险判断规则,对用户的各项属性数据进行检测处理,以判断该用户是否具备业务申请条件后,将该判断结果同样输出为客户对应的一项属性数据。
本发明实施例中,将属性数据经过检测处理的各个历史客户作为一个历史对象,并将其对象标识以及属性数据的对应关系存储至预设的信息库中。
优选地,为了便于对各项属性数据进行分类,可将每一业务流程所关联的各个历史对象的属性数据存储至同一信息库。此时,通过确定出业务流程所对应的信息库,并对该信息库所包含的各项属性数据进行读取,可实现对业务流程所关联的各个历史对象的属性数据的快速读取,提高了数据查询效率。
S103:构建条件生成式对抗网络模型,并基于各个所述历史对象的属性数据,对所述条件生成式对抗网络模型进行训练,得到数据采集模型。
本发明实施例中,构建条件生成式对抗网络模型(Conditional GenerativeAdversarial Networks,CGAN)。上述条件生成式对抗网络模型包含有两个对抗的网络模型,即生成网络(generator,生成网络G)以及判别网络(discriminator model,判别网络D)。其中,生成网络G用于获取上述各个历史对象的属性数据所对应的数据分布;判别网络D用于估计一个样本数据为真实客户对象的属性数据而非生成样本数据的概率。
对于上述生成网络G的构建,由于其主要用于获取上述各个历史对象的属性数据所对应的数据分布,因而本发明实施例中,先获取一个真实数据集x,并获取真实数据集x中的正负样本比例。其中,真实数据集x包含上述各个历史对象的属性数据;正样本为不满足业务申请条件的历史对象所对应的各项属性数据;负样本为满足业务申请条件的历史对象所对应的各项属性数据。通过获取上述两类历史对象的统计数目的比值,可确定出真实数据集x的正负样本比例。
作为本发明第一个实施例,在上述S103,构建条件生成式对抗网络模型,并基于各个所述历史对象的属性数据,对所述条件生成式对抗网络模型进行训练,得到数据采集模型的步骤中,所述生成网络的第一目标函数为:Loss(G)=log(1-D(G(z)));所述判别网络的第二目标函数为:Loss(D)=-(log(D(x))+log(1-D(G(z))))。
其中,D(x)表示输入的所述属性数据x经过所述判别网络D的处理后所得到的第一输出数据;G(z)表示输入向量z经过所述生成网络G处理后所得到的第二输出数据;所述输入向量z与所述属性数据x关联。
对于上述生成网络G以及判别网络D中的每一网络模型,当检测到其对应的损失函数的输出值小于预设阈值时,确定该网络模型对于属性数据的拟合程度较高,此时,停止调整该网络模型的网络结构参数。将网络结构参数确定后的生成网络G以及判别网络判别网络D进行串联,以组成得到用于生成样本数据的数据采集模型。其中,样本数据是指虚拟生成的客户对象的属性数据,且样本数据用于作为评分卡模型的训练样本。
S104:将所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述属性数据后,输出样本数据。
本发明实施例中,将上述预先收集得到的多个历史对象的属性数据输入数据采集模型。由于此类属性数据为真实客户对象的属性数据,故通过上述数据采集模型分析处理该属性数据后,可输出与此类属性数据具有相似数据分布的样本数据。
作为本发明的一个实施例,图2示出了本发明实施例提供的评分卡模型的生成方法S104的具体实现流程,详述如下:
S1041:通过预设算法生成噪声数据。
S1042:将所述噪声数据以及所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述噪声数据以及所述属性数据后,输出样本数据。
本发明实施例中,生成网络G的输入参数为通过预设算法所生成的噪声数据,包括但不限于可以是随机噪声、高斯噪声以及椒盐噪声等。由于生成网络G与判别网络D在结构上串联,故判别网络D的输入参数中包含有生成网络G的输出参数以及包含有上述历史对象的属性数据。
对于上述步骤S103中所训练完成的数据采集模型,基于其内部的处理逻辑,对生成网络G以及判别网络D的输入参数进行运算处理,从而构造并输出评分卡模型所需的样本数据。此时,该样本数据包括正样本数据以及负样本数据。
S105:基于所述样本数据构建并训练所述评分卡模型。
本发明实施例中,确定待生成的评分卡模型所对应的一套模型训练算法。以上述样本数据作为训练样本,基于该模型训练算法,构建并训练评分卡模型。
本发明实施例中,通过预先获取业务流程所关联的各个历史对象的属性数据,并利用该属性数据来对生成式对抗网络模型进行训练以生成数据采集模型,使得数据采集模型最终所输出的样本数据能够更好地模拟历史对象属性数据的分布情况,从而提高了数据采集模型的泛化效果;由于训练完成后的数据采集模型能够自动生成更多的样本数据,实现了对各类型样本数据的覆盖,故避免了因历史对象的属性数据较少而产生较大统计偏差的问题,实现了对正负样本不均衡数据的调整,由此也使得基于该样本数据所训练得到的评分卡模型能够具有更高的拟合度,保证了训练得到的A卡模型能够具有更高的泛化能力。
作为本发明的另一个实施例,如图3所示,在上述S105之后,还包括:
S106:获取待审核对象的属性数据,并将所述属性数据输入所述评分卡模型。
当前时刻需要评估其是否具备审批审核条件的客户对象为上述待审核对象。本发明实施例中,获取待审核对象所实时输入的属性数据,并将其属性数据输入训练完成后的评分卡模型。
S107:根据所述评分卡模型对所述待审核对象的信用进行评分,得到所述待审核对象对应的信用分值。
通过评分卡模型对该属性数据进行分析处理后,输出当前待审核对象对应的信用分值。其中,信用分值为客户逾期率预测指标的分数化,用于反应客户未来的逾期水平预测值。信用分值的高低与信贷风险水平成反比。分数越高,表示客户逾期风险越低;相反,分数越低,表示客户逾期风险越高。
S108:输出所述待审核对象关于其对应的所述信用分值的审批结果,包括:对于所述信用分值低于第一预设值的待审核对象,将其审批结果输出为拒绝审批;对于所述信用分值大于第二预设值的待审核对象,将其审批结果输出为审批通过。
本发明实施例中,第一预设值和第二预设值为预先设置好的参数阈值,其根据审核管理员所需的信用评分规则而制定。例如,第一预设值为30,第二预设值为80。
判断上述待审核对象的信用分值是否小于第一预设值,或者,判断上述待审核对象的信用分值是否大于第二预设值。若存在信用分值小于第一预设值的待审核对象,则将关于该待审核对象的审批结果输出为拒绝审批;若存在信用分值大于第二预设值的待审核对象,则将关于该待审核对象的审批结果输出为审批通过。
优选地,对于信用分值大于等于第一预设值且小于等于第二预设值的待审核对象,将与该待审核对象对应的属性数据以及信用分值进行列出,以提示审核管理员对该待审核对象进行人工审批处理,从而避免了因信用分值的细微计算误差而导致自动输出的审批结果出现错误,因而也提高了信用审批的准确度。
本发明实施例中,通过使用评分卡模型对待审核对象的信用进行评分,并且根据信用分值来对待审核对象进行筛选,直接输出待审核对象所对应的审批结果为审批通过还是拒绝审批,保证了审核管理员能够直观、快速且准确地得到风险提示信息,从而也实现了信贷业务申请的审核自动化,提高了审核效率。
作为本发明的又一个实施例,如图4所示,在上述S108之后,还包括:
S109:获取与所述审批结果对应的预定事件。
根据上述分析可知,待审核对象所对应的审批结果包括审批通过以及拒绝审批。本发明实施例中,不同的审批结果对应有不同的预定事件。示例性地,若待审核对象所对应的审批结果为审批通过,则与该审批结果对应的预定事件为未来预设时长内不存在逾期还款事件;若待审核对象所对应的审批结果为拒绝审批,则与该审批结果对应的预定事件为未来预设时长内存在逾期还款事件。
S110:检测所述待审核对象在预设时长内是否产生所述预定事件,并根据检测结果计算所述评分卡模型的审批准确率。
本发明实施例中,对待审核对象在未来预设时长内所执行的响应事件进行跟踪。若检测到该待审核对象在未来预设时长内出现与其审批结果对应的预定事件,则确定上述S108中所得到的审批结果为正常审批结果;反之,若检测到该待审核对象在未来预设时长内未出现与其审批结果对应的预定事件,则确定上述S108中所得到的审批结果为异常审批结果。
对于上述S108中所审核处理的多个待审核对象,根据每一待审核对象在当前步骤S110中所得到的正常审批结果以及异常审批结果的数值之比,计算出上述评分卡模型的审批准确率。
S111:基于所述审批准确率,对所述评分卡模型所对应的审批权重占比进行更新,以在再次执行所述输出所述待审核对象关于其对应的所述信用分值的审批结果的步骤时,根据所述信用分值以及所述审批权重占比,更新所述审批结果。
本发明实施例中,审批权重占比用于表示评分卡模型所直接计算得出的待审核对象的信用分值的可靠性程度。通过计算评分卡模型的审批准确率来调整评分卡模型的审批权重占比,并在再次执行上述步骤S108以获得具体的信用分值时,根据该审批权重占比来对信用分值进行动态调整,保证了调整后的信用分值能够较好地与待审核对象的正确审批结果进行拟合,提高了信贷审核的智能化程度以及准确度,保证了不断优化后所得到的评分卡模型能够输出准确率更高的风控判断结果。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于本发明实施例所提供的评分卡模型的生成方法,图5示出了本发明实施例提供的评分卡模型的生成装置的结构框图。为了便于说明,仅示出了与本实施例相关的部分。
参照图5,该装置包括:
第一获取单元51,用于获取与待生成的评分卡模型相对应的业务流程。
确定单元52,用于确定所述业务流程所关联的各个历史对象,并获取所述历史对象的属性数据。
第一训练单元53,用于构建条件生成式对抗网络模型,并基于各个所述历史对象的属性数据,对所述条件生成式对抗网络模型进行训练,得到数据采集模型。
第一输出单元54,用于将所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述属性数据后,输出样本数据。
第二训练单元55,用于基于所述样本数据构建并训练所述评分卡模型。
可选地,所述第一输出单元54包括:
生成子单元,用于通过预设算法生成噪声数据。
输出子单元,用于将所述噪声数据以及所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述噪声数据以及所述属性数据后,输出样本数据。
可选地,所述第一训练单元53包括:
构建子单元,用于构建条件生成式对抗网络模型,所述条件生成式对抗网络模型包括生成网络G以及判别网络D。
所述生成网络的第一目标函数为:Loss(G)=log(1-D(G(z)));
所述判别网络的第二目标函数为:Loss(D)=-(log(D(x))+log(1-D(G(z))));
其中,D(x)表示输入的所述属性数据x经过所述判别网络D的处理后所得到的第一输出数据;G(z)表示输入向量z经过所述生成网络G处理后所得到的第二输出数据;所述输入向量z与所述属性数据x关联。
可选地,所述评分卡模型的生成装置还包括:
第二获取单元,用于获取待审核对象的属性数据,并将所述属性数据输入所述评分卡模型。
评分单元,用于根据所述评分卡模型对所述待审核对象的信用进行评分,得到所述待审核对象对应的信用分值。
第二输出单元,用于输出所述待审核对象关于其对应的所述信用分值的审批结果,包括:
对于所述信用分值低于第一预设值的待审核对象,将其审批结果输出为拒绝审批;
对于所述信用分值大于第二预设值的待审核对象,将其审批结果输出为审批通过。
可选地,所述评分卡模型的生成装置还包括:
第三获取单元,用于获取与所述审批结果对应的预定事件。
检测单元,用于检测所述待审核对象在预设时长内是否产生所述预定事件,并根据检测结果计算所述评分卡模型的审批准确率;
更新单元,用于基于所述审批准确率,对所述评分卡模型所对应的审批权重占比进行更新,以在再次执行所述输出所述待审核对象关于其对应的所述信用分值的审批结果的步骤时,根据所述信用分值以及所述审批权重占比,更新所述审批结果。
本发明实施例中,通过预先获取业务流程所关联的各个历史对象的属性数据,并利用该属性数据来对生成式对抗网络模型进行训练以生成数据采集模型,使得数据采集模型最终所输出的样本数据能够更好地模拟历史对象属性数据的分布情况,从而提高了数据采集模型的泛化效果;由于训练完成后的数据采集模型能够自动生成更多的样本数据,实现了对各类型样本数据的覆盖,故避免了因历史对象的属性数据较少而产生较大统计偏差的问题,实现了对正负样本不均衡数据的调整,由此也使得基于该样本数据所训练得到的评分卡模型能够具有更高的拟合度,保证了训练得到的A卡模型能够具有更高的泛化能力。
图6是本发明一实施例提供的终端设备的示意图。如图6所示,该实施例的终端设备6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62,例如评分卡模型的生成程序。所述处理器60执行所述计算机程序62时实现上述各个评分卡模型的生成方法实施例中的步骤,例如图1所示的步骤101至105。或者,所述处理器60执行所述计算机程序62时实现上述各装置实施例中各模块/单元的功能,例如图5所示单元51至55的功能。
示例性的,所述计算机程序62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序62在所述终端设备6中的执行过程。
所述终端设备6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是终端设备6的示例,并不构成对终端设备6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述终端设备6的内部存储单元,例如终端设备6的硬盘或内存。所述存储器61也可以是所述终端设备6的外部存储设备,例如所述终端设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述终端设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种评分卡模型的生成方法,其特征在于,包括:
获取与待生成的评分卡模型相对应的业务流程;
确定所述业务流程所关联的各个历史对象,并获取所述历史对象的属性数据;
构建条件生成式对抗网络模型,并基于各个所述历史对象的属性数据,对所述条件生成式对抗网络模型进行训练,得到数据采集模型;
将所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述属性数据后,输出样本数据;
基于所述样本数据构建并训练所述评分卡模型。
2.如权利要求1所述的评分卡模型的生成方法,其特征在于,所述将所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述属性数据后,输出样本数据,包括:
通过预设算法生成噪声数据;
将所述噪声数据以及所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述噪声数据以及所述属性数据后,输出样本数据。
3.如权利要求1或2所述的评分卡模型的生成方法,其特征在于,所述构建条件生成式对抗网络模型,并基于各个所述历史对象的属性数据,对所述条件生成式对抗网络模型进行训练,得到数据采集模型,包括:
构建条件生成式对抗网络模型,所述条件生成式对抗网络模型包括生成网络G以及判别网络D;
所述生成网络的第一目标函数为:Loss(G)=log(1-D(G(z)));
所述判别网络的第二目标函数为:Loss(D)=-(log(D(x))+log(1-D(G(z))));
其中,D(x)表示输入的所述属性数据x经过所述判别网络D的处理后所得到的第一输出数据;G(z)表示输入向量z经过所述生成网络G处理后所得到的第二输出数据;所述输入向量z与所述属性数据x关联。
4.如权利要求1或2所述的评分卡模型的生成方法,其特征在于,在所述基于所述样本数据构建并训练所述评分卡模型之后,还包括:
获取待审核对象的属性数据,并将所述属性数据输入所述评分卡模型;
根据所述评分卡模型对所述待审核对象的信用进行评分,得到所述待审核对象对应的信用分值;
输出所述待审核对象关于其对应的所述信用分值的审批结果,包括:
对于所述信用分值低于第一预设值的待审核对象,将其审批结果输出为拒绝审批;
对于所述信用分值大于第二预设值的待审核对象,将其审批结果输出为审批通过。
5.如权利要求4所述的评分卡模型的生成方法,其特征在于,在所述输出所述待审核对象关于其对应的所述信用分值的审批结果之后,还包括:
获取与所述审批结果对应的预定事件;
检测所述待审核对象在预设时长内是否产生所述预定事件,并根据检测结果计算所述评分卡模型的审批准确率;
基于所述审批准确率,对所述评分卡模型所对应的审批权重占比进行更新,以在再次执行所述输出所述待审核对象关于其对应的所述信用分值的审批结果的步骤时,根据所述信用分值以及所述审批权重占比,更新所述审批结果。
6.一种评分卡模型的生成装置,其特征在于,包括:
第一获取单元,用于获取与待生成的评分卡模型相对应的业务流程;
确定单元,用于确定所述业务流程所关联的各个历史对象,并获取所述历史对象的属性数据;
第一训练单元,用于构建条件生成式对抗网络模型,并基于各个所述历史对象的属性数据,对所述条件生成式对抗网络模型进行训练,得到数据采集模型;
第一输出单元,用于将所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述属性数据后,输出样本数据;
第二训练单元,用于基于所述样本数据构建并训练所述评分卡模型。
7.如权利要求6所述的评分卡模型的生成装置,其特征在于,所述第一输出单元包括:
生成子单元,用于通过预设算法生成噪声数据;
输出子单元,用于将所述噪声数据以及所述属性数据输入所述数据采集模型,以通过所述数据采集模型分析处理所述噪声数据以及所述属性数据后,输出样本数据。
8.如权利要求6或7所述的评分卡模型的生成装置,其特征在于,所述第一训练单元包括:
构建子单元,用于构建条件生成式对抗网络模型,所述条件生成式对抗网络模型包括生成网络G以及判别网络D;
所述生成网络的第一目标函数为:Loss(G)=log(1-D(G(z)));
所述判别网络的第二目标函数为:Loss(D)=-(log(D(x))+log(1-D(G(z))));
其中,D(x)表示输入的所述属性数据x经过所述判别网络D的处理后所得到的第一输出数据;G(z)表示输入向量z经过所述生成网络G处理后所得到的第二输出数据;所述输入向量z与所述属性数据x关联。
9.一种终端设备,包括存储器以及处理器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
CN201811531633.XA 2018-12-14 2018-12-14 评分卡模型的生成方法、终端设备及介质 Pending CN109816509A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811531633.XA CN109816509A (zh) 2018-12-14 2018-12-14 评分卡模型的生成方法、终端设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811531633.XA CN109816509A (zh) 2018-12-14 2018-12-14 评分卡模型的生成方法、终端设备及介质

Publications (1)

Publication Number Publication Date
CN109816509A true CN109816509A (zh) 2019-05-28

Family

ID=66601728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811531633.XA Pending CN109816509A (zh) 2018-12-14 2018-12-14 评分卡模型的生成方法、终端设备及介质

Country Status (1)

Country Link
CN (1) CN109816509A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110544165A (zh) * 2019-09-02 2019-12-06 中诚信征信有限公司 一种信用风险评分卡创建方法、装置及电子设备
CN111126503A (zh) * 2019-12-27 2020-05-08 北京同邦卓益科技有限公司 一种训练样本的生成方法和装置
CN111325620A (zh) * 2020-02-17 2020-06-23 北京明略软件系统有限公司 信用评价模型的生成方法、装置及信用评价方法、装置
CN111651506A (zh) * 2020-06-28 2020-09-11 广州欧科信息技术股份有限公司 一种基于历史文化数据的层积性分析方法及装置
CN112150174A (zh) * 2019-06-27 2020-12-29 百度在线网络技术(北京)有限公司 一种广告配图方法、装置及电子设备
CN112733892A (zh) * 2020-12-28 2021-04-30 北京聚云科技有限公司 一种用于模型训练的数据交互方法及装置
CN112818406A (zh) * 2021-04-16 2021-05-18 北京瑞莱智慧科技有限公司 一种评分卡模型的预测方法及装置
CN113537666A (zh) * 2020-04-16 2021-10-22 马上消费金融股份有限公司 评测模型训练方法、评测和业务审核方法、装置及设备
CN114358920A (zh) * 2022-01-07 2022-04-15 北京百度网讯科技有限公司 迭代信用评分卡模型的方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170200265A1 (en) * 2016-01-11 2017-07-13 Kla-Tencor Corporation Generating simulated output for a specimen
CN106952239A (zh) * 2017-03-28 2017-07-14 厦门幻世网络科技有限公司 图像生成方法和装置
CN108053310A (zh) * 2017-11-24 2018-05-18 深圳市牛鼎丰科技有限公司 信用风险评分方法、装置、计算机设备及存储介质
CN108648074A (zh) * 2018-05-18 2018-10-12 深圳壹账通智能科技有限公司 基于支持向量机的贷款评估方法、装置及设备
CN108960425A (zh) * 2018-07-05 2018-12-07 广东工业大学 一种渲染模型训练方法、系统、设备、介质及渲染方法
CN108961040A (zh) * 2018-06-29 2018-12-07 重庆富民银行股份有限公司 用于授信贷款的贷款额度评估系统及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170200265A1 (en) * 2016-01-11 2017-07-13 Kla-Tencor Corporation Generating simulated output for a specimen
CN106952239A (zh) * 2017-03-28 2017-07-14 厦门幻世网络科技有限公司 图像生成方法和装置
CN108053310A (zh) * 2017-11-24 2018-05-18 深圳市牛鼎丰科技有限公司 信用风险评分方法、装置、计算机设备及存储介质
CN108648074A (zh) * 2018-05-18 2018-10-12 深圳壹账通智能科技有限公司 基于支持向量机的贷款评估方法、装置及设备
CN108961040A (zh) * 2018-06-29 2018-12-07 重庆富民银行股份有限公司 用于授信贷款的贷款额度评估系统及方法
CN108960425A (zh) * 2018-07-05 2018-12-07 广东工业大学 一种渲染模型训练方法、系统、设备、介质及渲染方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112150174A (zh) * 2019-06-27 2020-12-29 百度在线网络技术(北京)有限公司 一种广告配图方法、装置及电子设备
CN112150174B (zh) * 2019-06-27 2024-04-02 百度在线网络技术(北京)有限公司 一种广告配图方法、装置及电子设备
CN110544165B (zh) * 2019-09-02 2022-06-03 中诚信征信有限公司 一种信用风险评分卡创建方法、装置及电子设备
CN110544165A (zh) * 2019-09-02 2019-12-06 中诚信征信有限公司 一种信用风险评分卡创建方法、装置及电子设备
CN111126503A (zh) * 2019-12-27 2020-05-08 北京同邦卓益科技有限公司 一种训练样本的生成方法和装置
CN111126503B (zh) * 2019-12-27 2023-09-26 北京同邦卓益科技有限公司 一种训练样本的生成方法和装置
CN111325620A (zh) * 2020-02-17 2020-06-23 北京明略软件系统有限公司 信用评价模型的生成方法、装置及信用评价方法、装置
CN113537666B (zh) * 2020-04-16 2024-05-03 马上消费金融股份有限公司 评测模型训练方法、评测和业务审核方法、装置及设备
CN113537666A (zh) * 2020-04-16 2021-10-22 马上消费金融股份有限公司 评测模型训练方法、评测和业务审核方法、装置及设备
CN111651506A (zh) * 2020-06-28 2020-09-11 广州欧科信息技术股份有限公司 一种基于历史文化数据的层积性分析方法及装置
CN111651506B (zh) * 2020-06-28 2023-05-30 广州欧科信息技术股份有限公司 一种基于历史文化数据的层积性分析方法及装置
CN112733892A (zh) * 2020-12-28 2021-04-30 北京聚云科技有限公司 一种用于模型训练的数据交互方法及装置
CN112818406A (zh) * 2021-04-16 2021-05-18 北京瑞莱智慧科技有限公司 一种评分卡模型的预测方法及装置
CN114358920A (zh) * 2022-01-07 2022-04-15 北京百度网讯科技有限公司 迭代信用评分卡模型的方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109816509A (zh) 评分卡模型的生成方法、终端设备及介质
CN106682067B (zh) 一种基于交易数据的机器学习反欺诈监测系统
CN108898476A (zh) 一种贷款客户信用评分方法和装置
CN109035003A (zh) 基于机器学习的反欺诈模型建模方法和反欺诈监控方法
CN107767021A (zh) 一种风险控制方法及设备
JP6869347B2 (ja) リスク制御イベント自動処理の方法および装置
CN108665366A (zh) 确定用户风险等级的方法、终端设备及计算机可读存储介质
CN109117380A (zh) 一种软件质量评价方法、装置、设备及可读存储介质
CN109102386A (zh) 基于大数据的风险控制方法及装置
CN111709828A (zh) 一种资源处理方法、装置、设备及系统
CN113379530A (zh) 用户风险的确定方法、装置和服务器
CN110147389A (zh) 帐号处理方法和装置、存储介质及电子装置
US20190220924A1 (en) Method and device for determining key variable in model
CN110262919A (zh) 异常数据分析方法、装置、设备与计算机可读存储介质
CN111798310A (zh) 基于Cox回归和逻辑回归的拒绝推断方法及电子设备
CN107992978A (zh) 一种网贷平台的风险预警方法及相关装置
Ko et al. Keeping our rivers clean: Information-theoretic online anomaly detection for streaming business process events
CN115423499A (zh) 模型训练方法、价格预测方法、终端设备以及存储介质
CN113298121B (zh) 基于多数据源建模的消息发送方法、装置和电子设备
CN116228431A (zh) 一种异常交易账户确定方法、装置及电子设备
KR20110114181A (ko) 예측 정확성이 향상된 대출 심사 방법
CN107480703A (zh) 交易故障检测方法及装置
CN116611911A (zh) 基于支持向量机的信用风险预测方法及装置
CN117132383A (zh) 一种信贷数据处理方法、装置、设备及可读存储介质
CN113052422A (zh) 风控模型训练方法和用户信用评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination