CN107945003A - 信用评估方法及装置 - Google Patents

信用评估方法及装置 Download PDF

Info

Publication number
CN107945003A
CN107945003A CN201611265759.8A CN201611265759A CN107945003A CN 107945003 A CN107945003 A CN 107945003A CN 201611265759 A CN201611265759 A CN 201611265759A CN 107945003 A CN107945003 A CN 107945003A
Authority
CN
China
Prior art keywords
model
label
trained
credit
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611265759.8A
Other languages
English (en)
Inventor
陈尧
朱敏亭
赵之砚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Financial Technology Co Ltd Shanghai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Financial Technology Co Ltd Shanghai filed Critical OneConnect Financial Technology Co Ltd Shanghai
Priority to CN201611265759.8A priority Critical patent/CN107945003A/zh
Publication of CN107945003A publication Critical patent/CN107945003A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种信用评估方法及装置,该方法包括:当接收到对用户的信用评估请求时,调用预先建立的第二模型对该用户进行信用评估;其中,所述第二模型为先根据预设数量的客户样本数据建立第一模型,再针对由该第一模型确定出的各个样本数据的缺失变量进行每次填补后生成的中间训练集进行训练得到;获取该用户的信用评估结果。本发明提高用户信用状况评估的准确性。

Description

信用评估方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种信用评估方法及装置。
背景技术
目前,在金融、保险等领域,客户在办理某项业务时,业务机构(例如,银行、保险机构)通常会通过一种信用状况评价系统,可以基于用户的特定信息对客户个人综合信用状况进行评价。然后,目前业内采用的信用状况评价系统无法对用户做到全面的评估,大多集中于某些特定单一的维度变量,且变量缺失程度很高,评估方法较为单一,导致客户信用状况评估准确性较低,实际的应用价值有限。
发明内容
本发明的主要目的在于提供一种信用评估方法及装置,旨在提高客户信用状况评估的准确性。
为实现上述目的,本发明提供的一种信用评估方法,所述方法包括以下步骤:
当接收到对用户的信用评估请求时,调用预先建立的第二模型对该用户进行信用评估;其中,所述第二模型为先根据预设数量的客户样本数据建立第一模型,再针对由该第一模型确定出的各个样本数据的缺失变量进行每次填补后生成的中间训练集进行训练得到;
获取该用户的信用评估结果。
优选地,所述第二模型的训练方式包括:
对预设数量的无标签客户样本数据应用预先确定的分析算法进行分析,根据属性信息熵生成描述样本属性相关性的无向图;
将所述无向图根据预先确定的信息准则转为最优的第一模型,在所述第一模型中,每个无标签客户数据样本对应设置有一个标签形成标签数据;
从通过所述第一模型确定的标签数据中划分出第一比例的训练集,在所述训练集上,使用所述第一模型确定出各个标签数据的缺失变量,抽取出预设数量的缺失变量进行填补,针对每一个缺失变量的每次填补生成一个中间训练集;
利用每一个中间训练集中的标签数据训练第二模型,以得到多个训练好的第二模型。
优选地,所述当接收到对用户的信用评估请求时,调用预先建立的第二模型对该用户进行信用评估的步骤之前还包括:
对所有训练好的第二模型按照预设的加权规则进行加权平均,以得到复核第二模型;
从通过所述第一模型确定的标签数据中划分出第二比例的验证集,利用所述验证集验证所述复核第二模型的准确率,若准确率大于或者等于预设阈值,则训练结束,或者,若准确率小于预设阈值,则增加无标签客户样本数据的数量来进行训练直至所述复核第二模型的准确率达到预设阈值。
优选地,该方法还包括:
从通过所述第一模型确定的标签数据中划分出第三比例的测试集,所述第一比例、第二比例及第三比例的和为100%;
对训练好的复核第二模型使用所述测试集进行测试,并生成测试报告。
优选地,所述第一模型为贝叶斯网络模型,所述第二模型为逻辑回归模型。
此外,为实现上述目的,本发明还提供一种信用评估装置,所述信用评估装置包括:
评估模块,用于当接收到对用户的信用评估请求时,调用预先建立的第二模型对该用户进行信用评估;其中,所述第二模型为先根据预设数量的客户样本数据建立第一模型,再针对由该第一模型确定出的各个样本数据的缺失变量进行每次填补后生成的中间训练集进行训练得到;
获取模块,用于获取该用户的信用评估结果。
优选地,所述第二模型的训练方式包括:
对预设数量的无标签客户样本数据应用预先确定的分析算法进行分析,根据属性信息熵生成描述样本属性相关性的无向图;
将所述无向图根据预先确定的信息准则转为最优的第一模型,在所述第一模型中,每个无标签客户数据样本对应设置有一个标签形成标签数据;
从通过所述第一模型确定的标签数据中划分出第一比例的训练集,在所述训练集上,使用所述第一模型确定出各个标签数据的缺失变量,抽取出预设数量的缺失变量进行填补,针对每一个缺失变量的每次填补生成一个中间训练集;
利用每一个中间训练集中的标签数据训练第二模型,以得到多个训练好的第二模型。
优选地,所述第二模型的训练方式还包括:
对所有训练好的第二模型按照预设的加权规则进行加权平均,以得到复核第二模型;
从通过所述第一模型确定的标签数据中划分出第二比例的验证集,利用所述验证集验证所述复核第二模型的准确率,若准确率大于或者等于预设阈值,则训练结束,或者,若准确率小于预设阈值,则增加无标签客户样本数据的数量来进行训练直至所述复核第二模型的准确率达到预设阈值。
优选地,所述第二模型的训练方式还包括:
从通过所述第一模型确定的标签数据中划分出第三比例的测试集,所述第一比例、第二比例及第三比例的和为100%;对训练好的复核第二模型使用所述测试集进行测试,并生成测试报告。
优选地,所述第一模型为贝叶斯网络模型,所述第二模型为逻辑回归模型。
本发明提出的信用评估方法及装置,通过预先建立的第二模型来对用户进行信用评估。由于所述第二模型为针对预设数量的各个客户样本数据的缺失变量进行每次填补后生成的一个中间训练集而训练得到,因此,通过所述第二模型来对用户进行信用评估不仅能考虑用户提供的信息,还能针对用户提供信息中缺失的变量进行信用的全面评估,从而提高用户信用状况评估的准确性。
附图说明
图1为本发明信用评估方法第一实施例的流程示意图;
图2为本发明信用评估方法第二实施例的流程示意图;
图3为本发明信用评估方法第三实施例的流程示意图;
图4为本发明信用评估装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种信用评估方法。
参照图1,图1为本发明信用评估方法第一实施例的流程示意图。
在第一实施例中,该信用评估方法包括:
步骤S10,当接收到对用户的信用评估请求时,调用预先建立的第二模型对该用户进行信用评估;其中,所述第二模型为先根据预设数量的客户样本数据建立第一模型,再针对由该第一模型确定出的各个样本数据的缺失变量进行每次填补后生成的中间训练集进行训练得到;
本实施例中,接收用户发出的信用评估请求,例如,接收用户在手机、平板电脑、自助终端设备等终端上输入相关信息(例如,个人身份信息、个人收入信息等)后发送的信用评估请求,如接收用户在手机、平板电脑、自助终端设备等终端中预先安装的信用评估应用程序上输入相关信息后发送来的信用评估请求,或接收用户在手机、平板电脑、自助终端设备等终端中的浏览器系统上输入相关信息后发送来的信用评估请求。
在接收到对用户的信用评估请求后,调用预先建立的第二模型对该用户进行信用评估。该第二模型的建立过程如下:先根据预设数量的无标签客户样本数据建立第一模型,由该第一模型确定出各个样本数据的缺失变量,针对确定出的每一样本数据的缺失变量进行每一次填补后均会形成一个由该填补后的样本数据加上剩余样本数据所生成的一个中间训练集,对所有样本数据的缺失变量进行填补后会生成多个中间训练集,针对该中间训练集进行不断地学习、训练和优化,从而得到第二模型。例如,在一种具体的实施方式中,所述第一模型可以为贝叶斯网络模型,所述第二模型可以为逻辑回归模型;当然,也不限定所述第一模型、所述第二模型为其他模型。
在一种实施方式中,在根据预设数量的无标签客户样本数据建立第一模型后,可由该第一模型为每一无标签客户样本数据设置相应的标签,以形成带标签的样本数据。该标签可以是对应客户样本数据的信用评估评级等,这样,在后续针对每一带标签的样本数据进行填补形成中间训练集并针对该中间训练集进行训练后,即可在请求信用评估的用户输入的相关信息出现变量缺失的情况时,仍然能根据训练出的第二模型针对其缺失变量找到符合该用户特征的标签也即对应该用户的信用评估评级。
步骤S20,获取该用户的信用评估结果。
根据预先建立的第二模型对该用户进行信用评估的结果,获取最终对该用户的信用评估结果,并反馈至发送信用评估请求的终端或预先确定的终端,如手机、平板电脑、自助终端设备等。
本实施例通过预先建立的第二模型来对用户进行信用评估。由于所述第二模型为针对预设数量的各个无标签客户样本数据的缺失变量进行每次填补后生成的一个中间训练集而训练得到,因此,通过所述第二模型来对用户进行信用评估不仅能考虑用户提供的信息,还能针对用户提供信息中缺失的变量进行信用的全面评估,从而提高用户信用状况评估的准确性。
如图2所示,本发明第二实施例提出一种信用评估方法,在上述实施例的基础上,所述第二模型的训练方式包括:
步骤S30,对预设数量的无标签客户样本数据应用预先确定的分析算法(例如,Chordalysis算法)进行分析,根据属性信息熵生成描述样本属性相关性的无向图。
步骤S40,将生成的无向图根据预先确定的信息准则(例如,贝叶斯信息准则,Bayesian Information Criterion)转为最优的第一模型(例如,贝叶斯网络模型),在所述第一模型中,每个无标签客户数据样本对应有一个标签形成标签数据。例如,该标签可以是针对每个无标签客户数据样本所对应的确定无误或最合理的信用评估等级,通过所述第一模型为每个无标签客户数据样本设置一确定无误或最合理的信用评估等级作为标签,以形成每个无标签客户数据样本对应的具有标签的样本数据。
步骤S50,将通过所述第一模型确定的标签数据分为第一比例(例如,50%)的训练集;在所述训练集上,使用所述第一模型确定出各个标签数据的缺失变量,抽取出预设数量的缺失变量进行填补(例如,一个用户的投保数据缺失性别变量数据),针对每一个缺失变量的每次填补生成一个中间训练集。例如,训练集中包括N个标签数据,若针对一个标签数据的性别缺失变量填充的是“男性”,则由填充了“男性”变量数据的该标签数据与其他N-1个标签数据组成一个中间训练集;若针对另一个标签数据的性别缺失变量填充的是“女性”,则由填充了“女性”变量数据的该标签数据与其他N-1个标签数据又组成一个中间训练集。
步骤S60,利用每一个中间训练集中的标签数据训练第二模型(例如,逻辑回归模型),以得到多个训练好的第二模型。
本实施例中,对预设数量的无标签客户样本数据的属性信息进行分析获取第一模型如贝叶斯网络模型,通过该贝叶斯网络模型为每个无标签客户数据样本对应设置对应的信用评估等级的标签,并通过该贝叶斯网络模型确定出的标签数据的缺失变量进行填补,针对每一个缺失变量的每次填补生成一个中间训练集,基于形成的多个中间训练集进行训练得到第二模型如逻辑回归模型,即可在请求信用评估的用户输入的相关信息出现变量缺失的情况时,仍然能根据训练出的第二模型针对其缺失变量找到符合该用户特征的标签也即对应该用户的信用评估评级,从而实现对用户信用的全面评估,提高用户信用状况评估的准确性及实际应用价值。
如图3所示,本发明第三实施例提出一种信用评估方法,在上述实施例的基础上,在上述步骤S60之后还包括:
步骤S70,对所有训练好的第二模型按照预设的加权规则进行加权平均,以得到复核第二模型;
步骤S80,从通过所述第一模型确定的标签数据中划分出第二比例(例如,25%)的验证集,利用所述验证集验证所述复核第二模型的准确率,若准确率大于或者等于预设阈值,则训练结束,或者,若准确率小于预设阈值,则增加无标签客户样本数据的数量来进行训练直至所述复核第二模型的准确率达到预设阈值。
本实施例中,在利用每一个中间训练集中的标签数据训练得到多个训练好的第二模型之后,还对所有训练好的第二模型按照预设的加权规则进行加权平均,以得到复核第二模型,如可将各个标签数据中缺失变量最频繁的一类变量所对应训练出的第二模型的权重加重,将各个标签数据中缺失变量的数量最少的标签数据所对应的训练集训练出的第二模型的权重加重,将各个标签数据中缺失变量的数量最多的标签数据所对应的训练集训练出的第二模型的权重减小,等等,以得到最合理、最准确的复核第二模型。进一步地,还利用验证集来验证所述复核第二模型的准确率,若验证所述复核第二模型的准确率大于或者等于预设阈值,则训练结束,以所述复核第二模型来进行用户的信用评估。若验证所述复核第二模型的准确率小于预设阈值,则继续增加无标签客户样本数据的数量并重新执行上述各步骤来进行训练,直至所述复核第二模型的准确率达到预设阈值,从而保证对用户进行信用评估的高准确率。
进一步地,在其他实施例中,该方法还包括:
从通过所述第一模型确定的标签数据中划分出第三比例(例如,25%)的测试集,所述第一比例、第二比例及第三比例的和为100%;对训练好的复核第二模型使用所述测试集进行测试,并生成测试报告。例如,所述测试报告中可包括测试准确率,以在后续利用该复核第二模型来进行用户信用评估时供参考。
本发明进一步提供一种信用评估装置。
参照图4,图4为本发明信用评估装置一实施例的功能模块示意图。
在一实施例中,该信用评估装置包括:
评估模块01,用于当接收到对用户的信用评估请求时,调用预先建立的第二模型对该用户进行信用评估;其中,所述第二模型为先根据预设数量的客户样本数据建立第一模型,再针对由该第一模型确定出的各个样本数据的缺失变量进行每次填补后生成的中间训练集进行训练得到;
本实施例中,接收用户发出的信用评估请求,例如,接收用户在手机、平板电脑、自助终端设备等终端上输入相关信息(例如,个人身份信息、个人收入信息等)后发送的信用评估请求,如接收用户在手机、平板电脑、自助终端设备等终端中预先安装的信用评估应用程序上输入相关信息后发送来的信用评估请求,或接收用户在手机、平板电脑、自助终端设备等终端中的浏览器系统上输入相关信息后发送来的信用评估请求。
在接收到对用户的信用评估请求后,调用预先建立的第二模型对该用户进行信用评估。该第二模型的建立过程如下:先根据预设数量的无标签客户样本数据建立第一模型,由该第一模型确定出各个样本数据的缺失变量,针对确定出的每一样本数据的缺失变量进行每一次填补后均会形成一个由该填补后的样本数据加上剩余样本数据所生成的一个中间训练集,对所有样本数据的缺失变量进行填补后会生成多个中间训练集,针对该中间训练集进行不断地学习、训练和优化,从而得到第二模型。例如,在一种具体的实施方式中,所述第一模型可以为贝叶斯网络模型,所述第二模型可以为逻辑回归模型;当然,也不限定所述第一模型、所述第二模型为其他模型。
在一种实施方式中,在根据预设数量的无标签客户样本数据建立第一模型后,可由该第一模型为每一无标签客户样本数据设置相应的标签,以形成带标签的样本数据。该标签可以是对应客户样本数据的信用评估评级等,这样,在后续针对每一带标签的样本数据进行填补形成中间训练集并针对该中间训练集进行训练后,即可在请求信用评估的用户输入的相关信息出现变量缺失的情况时,仍然能根据训练出的第二模型针对其缺失变量找到符合该用户特征的标签也即对应该用户的信用评估评级。
获取模块02,用于获取该用户的信用评估结果。
根据预先建立的第二模型对该用户进行信用评估的结果,获取最终对该用户的信用评估结果,并反馈至发送信用评估请求的终端或预先确定的终端,如手机、平板电脑、自助终端设备等。
本实施例通过预先建立的第二模型来对用户进行信用评估。由于所述第二模型为针对预设数量的各个无标签客户样本数据的缺失变量进行每次填补后生成的一个中间训练集而训练得到,因此,通过所述第二模型来对用户进行信用评估不仅能考虑用户提供的信息,还能针对用户提供信息中缺失的变量进行信用的全面评估,从而提高用户信用状况评估的准确性。
进一步地,在上述实施例的基础上,所述第二模型的训练方式包括:
对预设数量的无标签客户样本数据应用预先确定的分析算法(例如,Chordalysis算法)进行分析,根据属性信息熵生成描述样本属性相关性的无向图。
将生成的无向图根据预先确定的信息准则(例如,贝叶斯信息准则,BayesianInformation Criterion)转为最优的第一模型(例如,贝叶斯网络模型),在所述第一模型中,每个无标签客户数据样本对应有一个标签形成标签数据。例如,该标签可以是针对每个无标签客户数据样本所对应的确定无误或最合理的信用评估等级,通过所述第一模型为每个无标签客户数据样本设置一确定无误或最合理的信用评估等级作为标签,以形成每个无标签客户数据样本对应的具有标签的样本数据。
将通过所述第一模型确定的标签数据分为第一比例(例如,50%)的训练集;在所述训练集上,使用所述第一模型确定出各个标签数据的缺失变量,抽取出预设数量的缺失变量进行填补(例如,一个用户的投保数据缺失性别变量数据),针对每一个缺失变量的每次填补生成一个中间训练集。例如,训练集中包括N个标签数据,若针对一个标签数据的性别缺失变量填充的是“男性”,则由填充了“男性”变量数据的该标签数据与其他N-1个标签数据组成一个中间训练集;若针对另一个标签数据的性别缺失变量填充的是“女性”,则由填充了“女性”变量数据的该标签数据与其他N-1个标签数据又组成一个中间训练集。
利用每一个中间训练集中的标签数据训练第二模型(例如,逻辑回归模型),以得到多个训练好的第二模型。
本实施例中,对预设数量的无标签客户样本数据的属性信息进行分析获取第一模型如贝叶斯网络模型,通过该贝叶斯网络模型为每个无标签客户数据样本对应设置对应的信用评估等级的标签,并通过该贝叶斯网络模型确定出的标签数据的缺失变量进行填补,针对每一个缺失变量的每次填补生成一个中间训练集,基于形成的多个中间训练集进行训练得到第二模型如逻辑回归模型,即可在请求信用评估的用户输入的相关信息出现变量缺失的情况时,仍然能根据训练出的第二模型针对其缺失变量找到符合该用户特征的标签也即对应该用户的信用评估评级,从而实现对用户信用的全面评估,提高用户信用状况评估的准确性及实际应用价值。
进一步地,在上述实施例的基础上,所述第二模型的训练方式还包括:
对所有训练好的第二模型按照预设的加权规则进行加权平均,以得到复核第二模型;
从通过所述第一模型确定的标签数据中划分出第二比例(例如,25%)的验证集,利用所述验证集验证所述复核第二模型的准确率,若准确率大于或者等于预设阈值,则训练结束,或者,若准确率小于预设阈值,则增加无标签客户样本数据的数量来进行训练直至所述复核第二模型的准确率达到预设阈值。
本实施例中,在利用每一个中间训练集中的标签数据训练得到多个训练好的第二模型之后,还对所有训练好的第二模型按照预设的加权规则进行加权平均,以得到复核第二模型,如可将各个标签数据中缺失变量最频繁的一类变量所对应训练出的第二模型的权重加重,将各个标签数据中缺失变量的数量最少的标签数据所对应的训练集训练出的第二模型的权重加重,将各个标签数据中缺失变量的数量最多的标签数据所对应的训练集训练出的第二模型的权重减小,等等,以得到最合理、最准确的复核第二模型。进一步地,还利用验证集来验证所述复核第二模型的准确率,若验证所述复核第二模型的准确率大于或者等于预设阈值,则训练结束,以所述复核第二模型来进行用户的信用评估。若验证所述复核第二模型的准确率小于预设阈值,则继续增加无标签客户样本数据的数量并重新执行上述各步骤来进行训练,直至所述复核第二模型的准确率达到预设阈值,从而保证对用户进行信用评估的高准确率。
进一步地,在上述实施例的基础上,所述第二模型的训练方式还包括:
从通过所述第一模型确定的标签数据中划分出第三比例(例如,25%)的测试集,所述第一比例、第二比例及第三比例的和为100%;对训练好的复核第二模型使用所述测试集进行测试,并生成测试报告。例如,所述测试报告中可包括测试准确率,以在后续利用该复核第二模型来进行用户信用评估时供参考。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件来实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上参照附图说明了本发明的优选实施例,并非因此局限本发明的权利范围。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本领域技术人员不脱离本发明的范围和实质,可以有多种变型方案实现本发明,比如作为一个实施例的特征可用于另一实施例而得到又一实施例。凡在运用本发明的技术构思之内所作的任何修改、等同替换和改进,均应在本发明的权利范围之内。

Claims (10)

1.一种信用评估方法,其特征在于,所述方法包括以下步骤:
当接收到对用户的信用评估请求时,调用预先建立的第二模型对该用户进行信用评估;其中,所述第二模型为先根据预设数量的客户样本数据建立第一模型,再针对由该第一模型确定出的各个样本数据的缺失变量进行每次填补后生成的中间训练集进行训练得到;
获取该用户的信用评估结果。
2.如权利要求1所述的信用评估方法,其特征在于,所述第二模型的训练方式包括:
对预设数量的无标签客户样本数据应用预先确定的分析算法进行分析,根据属性信息熵生成描述样本属性相关性的无向图;
将所述无向图根据预先确定的信息准则转为最优的第一模型,在所述第一模型中,每个无标签客户数据样本对应设置有一个标签形成标签数据;
从通过所述第一模型确定的标签数据中划分出第一比例的训练集,在所述训练集上,使用所述第一模型确定出各个标签数据的缺失变量,抽取出预设数量的缺失变量进行填补,针对每一个缺失变量的每次填补生成一个中间训练集;
利用每一个中间训练集中的标签数据训练第二模型,以得到多个训练好的第二模型。
3.如权利要求2所述的信用评估方法,其特征在于,所述当接收到对用户的信用评估请求时,调用预先建立的第二模型对该用户进行信用评估的步骤之前还包括:
对所有训练好的第二模型按照预设的加权规则进行加权平均,以得到复核第二模型;
从通过所述第一模型确定的标签数据中划分出第二比例的验证集,利用所述验证集验证所述复核第二模型的准确率,若准确率大于或者等于预设阈值,则训练结束,或者,若准确率小于预设阈值,则增加无标签客户样本数据的数量来进行训练直至所述复核第二模型的准确率达到预设阈值。
4.如权利要求3所述的信用评估方法,其特征在于,该方法还包括:
从通过所述第一模型确定的标签数据中划分出第三比例的测试集,所述第一比例、第二比例及第三比例的和为100%;
对训练好的复核第二模型使用所述测试集进行测试,并生成测试报告。
5.如权利要求1至4中任意一项所述的信用评估方法,其特征在于,所述第一模型为贝叶斯网络模型,所述第二模型为逻辑回归模型。
6.一种信用评估装置,其特征在于,所述信用评估装置包括:
评估模块,用于当接收到对用户的信用评估请求时,调用预先建立的第二模型对该用户进行信用评估;其中,所述第二模型为先根据预设数量的客户样本数据建立第一模型,再针对由该第一模型确定出的各个样本数据的缺失变量进行每次填补后生成的中间训练集进行训练得到;
获取模块,用于获取该用户的信用评估结果。
7.如权利要求6所述的信用评估装置,其特征在于,所述第二模型的训练方式包括:
对预设数量的无标签客户样本数据应用预先确定的分析算法进行分析,根据属性信息熵生成描述样本属性相关性的无向图;
将所述无向图根据预先确定的信息准则转为最优的第一模型,在所述第一模型中,每个无标签客户数据样本对应设置有一个标签形成标签数据;
从通过所述第一模型确定的标签数据中划分出第一比例的训练集,在所述训练集上,使用所述第一模型确定出各个标签数据的缺失变量,抽取出预设数量的缺失变量进行填补,针对每一个缺失变量的每次填补生成一个中间训练集;
利用每一个中间训练集中的标签数据训练第二模型,以得到多个训练好的第二模型。
8.如权利要求7所述的信用评估装置,其特征在于,所述第二模型的训练方式还包括:
对所有训练好的第二模型按照预设的加权规则进行加权平均,以得到复核第二模型;
从通过所述第一模型确定的标签数据中划分出第二比例的验证集,利用所述验证集验证所述复核第二模型的准确率,若准确率大于或者等于预设阈值,则训练结束,或者,若准确率小于预设阈值,则增加无标签客户样本数据的数量来进行训练直至所述复核第二模型的准确率达到预设阈值。
9.如权利要求8所述的信用评估装置,其特征在于,所述第二模型的训练方式还包括:
从通过所述第一模型确定的标签数据中划分出第三比例的测试集,所述第一比例、第二比例及第三比例的和为100%;对训练好的复核第二模型使用所述测试集进行测试,并生成测试报告。
10.如权利要求6至9中任意一项所述的信用评估装置,其特征在于,所述第一模型为贝叶斯网络模型,所述第二模型为逻辑回归模型。
CN201611265759.8A 2016-12-30 2016-12-30 信用评估方法及装置 Pending CN107945003A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611265759.8A CN107945003A (zh) 2016-12-30 2016-12-30 信用评估方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611265759.8A CN107945003A (zh) 2016-12-30 2016-12-30 信用评估方法及装置

Publications (1)

Publication Number Publication Date
CN107945003A true CN107945003A (zh) 2018-04-20

Family

ID=61929015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611265759.8A Pending CN107945003A (zh) 2016-12-30 2016-12-30 信用评估方法及装置

Country Status (1)

Country Link
CN (1) CN107945003A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596757A (zh) * 2018-04-23 2018-09-28 大连火眼征信管理有限公司 一种智能组合的个人信用评估方法及系统
CN109242671A (zh) * 2018-08-29 2019-01-18 厦门市七星通联科技有限公司 一种基于多视角不完整数据的信贷违约预测方法及系统
CN109300051A (zh) * 2018-09-17 2019-02-01 中国平安财产保险股份有限公司 基于数据分析的理赔服务处理方法、装置和计算机设备
CN109767312A (zh) * 2018-12-10 2019-05-17 江西师范大学 一种信用评估模型训练、评估方法与装置
CN110232403A (zh) * 2019-05-15 2019-09-13 腾讯科技(深圳)有限公司 一种标签预测方法、装置、电子设备及介质
CN110322341A (zh) * 2019-06-24 2019-10-11 阿里巴巴集团控股有限公司 信用标签的确定方法和装置
CN110598995A (zh) * 2019-08-15 2019-12-20 中国平安人寿保险股份有限公司 智能客户评级方法、装置及计算机可读存储介质
CN113011966A (zh) * 2021-03-18 2021-06-22 中国光大银行股份有限公司 基于深度学习的信用评分方法及装置
CN113537666A (zh) * 2020-04-16 2021-10-22 马上消费金融股份有限公司 评测模型训练方法、评测和业务审核方法、装置及设备
CN115730254A (zh) * 2022-12-06 2023-03-03 中电金信软件有限公司 一种扩充建模样本数据标签的方法及装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596757A (zh) * 2018-04-23 2018-09-28 大连火眼征信管理有限公司 一种智能组合的个人信用评估方法及系统
CN109242671A (zh) * 2018-08-29 2019-01-18 厦门市七星通联科技有限公司 一种基于多视角不完整数据的信贷违约预测方法及系统
CN109300051A (zh) * 2018-09-17 2019-02-01 中国平安财产保险股份有限公司 基于数据分析的理赔服务处理方法、装置和计算机设备
CN109767312B (zh) * 2018-12-10 2023-05-09 江西师范大学 一种信用评估模型训练、评估方法与装置
CN109767312A (zh) * 2018-12-10 2019-05-17 江西师范大学 一种信用评估模型训练、评估方法与装置
CN110232403A (zh) * 2019-05-15 2019-09-13 腾讯科技(深圳)有限公司 一种标签预测方法、装置、电子设备及介质
CN110322341A (zh) * 2019-06-24 2019-10-11 阿里巴巴集团控股有限公司 信用标签的确定方法和装置
CN110322341B (zh) * 2019-06-24 2024-01-05 创新先进技术有限公司 信用标签的确定方法和装置
CN110598995A (zh) * 2019-08-15 2019-12-20 中国平安人寿保险股份有限公司 智能客户评级方法、装置及计算机可读存储介质
CN110598995B (zh) * 2019-08-15 2023-08-25 中国平安人寿保险股份有限公司 智能客户评级方法、装置及计算机可读存储介质
CN113537666A (zh) * 2020-04-16 2021-10-22 马上消费金融股份有限公司 评测模型训练方法、评测和业务审核方法、装置及设备
CN113537666B (zh) * 2020-04-16 2024-05-03 马上消费金融股份有限公司 评测模型训练方法、评测和业务审核方法、装置及设备
CN113011966A (zh) * 2021-03-18 2021-06-22 中国光大银行股份有限公司 基于深度学习的信用评分方法及装置
CN115730254A (zh) * 2022-12-06 2023-03-03 中电金信软件有限公司 一种扩充建模样本数据标签的方法及装置
CN115730254B (zh) * 2022-12-06 2023-10-13 中电金信软件有限公司 一种扩充建模样本数据标签的方法及装置

Similar Documents

Publication Publication Date Title
CN107945003A (zh) 信用评估方法及装置
CN106952159B (zh) 一种不动产抵押品风险控制方法、系统及存储介质
CN109474483A (zh) 一种设备异常情况的检测方法、检测装置及终端设备
CN110097451B (zh) 一种银行业务的监控方法及装置
CN103796183B (zh) 一种垃圾短信识别方法及装置
CN110766558A (zh) 核保数据处理方法、装置、设备及计算机可读存储介质
CN107645562A (zh) 数据传输处理方法、装置、设备及系统
CN107545038B (zh) 一种文本分类方法与设备
CN111275491A (zh) 一种数据处理方法及装置
CN103064987A (zh) 一种虚假交易信息识别方法
CN107123122A (zh) 无参考图像质量评价方法及装置
CN107679046A (zh) 一种欺诈用户的检测方法及装置
CN113837323A (zh) 满意度预测模型的训练方法、装置、电子设备及存储介质
CN111815169A (zh) 业务审批参数配置方法及装置
CN117391292A (zh) 碳排放节能管理分析系统及方法
CN111340062A (zh) 一种映射关系确定方法及装置
CN115545103A (zh) 异常数据识别、标签识别方法和异常数据识别装置
CN113850669A (zh) 用户分群方法、装置、计算机设备及计算机可读存储介质
CN107016460A (zh) 用户换机预测方法及装置
CN109636083A (zh) 黑名单分析方法、装置、设备及计算机可读存储介质
CN115099934A (zh) 一种高潜客户识别方法、电子设备和存储介质
CN113946703A (zh) 一种图片漏检处理方法及其相关装置
CN113010664A (zh) 一种数据处理方法、装置及计算机设备
CN113782217A (zh) 人体健康状况分级方法及装置
CN112364121A (zh) 问卷pdf的自动创建方法、装置、存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20180530

Address after: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant after: Shenzhen one ledger Intelligent Technology Co., Ltd.

Address before: 200030 Xuhui District, Shanghai Kai Bin Road 166, 9, 10 level.

Applicant before: Shanghai Financial Technologies Ltd

TA01 Transfer of patent application right
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1250546

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180420

RJ01 Rejection of invention patent application after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1250546

Country of ref document: HK