CN112561691A - 一种客户授信预测方法、装置、设备及存储介质 - Google Patents
一种客户授信预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112561691A CN112561691A CN202011548397.XA CN202011548397A CN112561691A CN 112561691 A CN112561691 A CN 112561691A CN 202011548397 A CN202011548397 A CN 202011548397A CN 112561691 A CN112561691 A CN 112561691A
- Authority
- CN
- China
- Prior art keywords
- credit
- client
- training data
- model
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请提供了一种客户授信预测方法、装置、设备及存储介质,其中,方法包括:获取目标客户的客户特征,其中,目标客户的客户特征为从目标客户的交易数据、和/或征信数据、和/或损益数据中抽取出的能够反映目标客户的风险承受能力的数据;将目标客户的客户特征输入预先建立的客户授信模型,得到目标客户的授信得分,其中,客户授信模型采用标注有真实授信得分的训练客户特征训练得到;根据目标客户的授信得分,从预设的多个授信等级中确定目标客户的授信等级;根据目标客户的授信等级,确定目标客户的授信额度区间。本申请提供的客户授信预测方法能够针对目标客户预测出合理的授信额度。
Description
技术领域
本申请涉及信息预测技术领域,尤其涉及一种客户授信预测方法、装置、设备及存储介质。
背景技术
当前市场环境中,小微企业融资难,融资门槛高问题尚存,小微企业贷款难的根本问题在于风险难以管控。化解这一难题的关键之一是管控授信风险,控制住授信也就保证不同层次里面的客户空间,再针对分层数据对客户体验进行分层管理。
由于小微企业特征点复杂,规模小以及资金链易中断,导致很多小微企业风险承受能力较弱,进而导致在融资行为中,授信问题一直得不到较好的解决。目前,确定客户授信额度的方式多为,客户经理干预,或根据企业年报及近年企业发展情况来判定企业优劣,进而确定授额度。
然而,采用目前的客户授信额度确定方式确定出的授信额度往往不合理。企业授信是管控融资风险的第一道把门关,若要做到企业最优授信,就需要针对企业给出一个合理的授信额度,而如何给出合理的授信额度是当前亟需解决的问题。
发明内容
有鉴于此,本申请提供了一种客户授信预测方法、装置、设备及存储介质,用以针对目标客户,预测出合理的授信额度,其技术方案如下:
一种客户授信预测方法,包括:
获取目标客户的客户特征,其中,所述目标客户的客户特征为从所述目标客户的交易数据、和/或征信数据、和/或损益数据中抽取出的能够反映所述目标客户的风险承受能力的数据;
将所述目标客户的客户特征输入预先建立的客户授信模型,得到所述目标客户的授信得分,其中,所述客户授信模型采用标注有真实授信得分的训练客户特征训练得到;
根据所述目标客户的授信得分,从预设的多个授信等级中确定所述目标客户的授信等级;
根据所述目标客户的授信等级,确定所述目标客户的授信额度区间。
可选的,建立所述客户授信模型的过程包括:
利用第一训练数据集中的训练数据训练多个弱分类器;
确定训练后的每个弱分类器的分类错误率,并根据所述训练后的每个弱分类器的分类错误率确定所述训练后的每个弱分类器对应的权重;
基于所述训练后的每个弱分类器对应的权重,将所述训练后的多个弱分类器组合成强分类器,作为初始的客户授信模型,其中,所述初始的客户授信模型的输出根据输入和所述训练后的每个弱分类器对应的权重确定;
当获得由新的训练数据组成的第二训练数据集时,利用所述第二训练数据集中的训练数据训练所述初始的客户授信模型,以对所述初始的客户授信模型的性能进行优化;
其中,所述第一训练数据集中的每个训练数据和所述第二训练数据集中的每个训练数据为标注有真实授信得分的训练客户特征。
可选的,所述利用第一训练数据集中的训练数据训练多个弱分类器,包括:
利用所述第一训练数据集中的每个训练数据,以及所述第一训练数据集中每个训练数据的当前权重,逐个训练弱分类器,并在每训练完一个弱分类器后,根据该弱分类器对第一训练数据集中每个训练样本的分类结果,更新第一训练数据集中每个训练数据的当前权重,以便在训练下一个弱分类器时,以每个训练数据的更新后权重为依据。
可选的,所述利用所述第二训练数据集中的训练数据训练所述初始的客户授信模型,包括:
将所述第二训练数据集中的每条训练数据输入所述初始的客户授信模型,获得所述初始的客户授信模型中的每个弱分类器针对每条训练数据预测的授信得分;
根据所述初始的客户授信模型中每个弱分类器针对每条训练数据预测的授信得分,以及所述第二训练数据集中每条训练数据的真实授信得分,确定所述初始的客户授信模型中每个弱分类器的分类错误率;
根据所述初始的客户授信模型中每个弱分类器的分类错误率,对所述初始的客户授信模型中每个弱分类器对应的权重进行更新。
可选的,所述目标客户的客户特征包括以下特征中的一种或多种的组合:
资金流动比率、速动比率、现金比率、应收账款流转率、资本金利润率、成本利润率、股本比重,在投资率、金融资产余额、银行存款余额、投资余额。
一种客户授信预测装置,包括:客户特征获取模块、授信得分确定模块、授信等级确定模块和授信额度确定模块;
所述客户特征获取模块,用于获取目标客户的客户特征,其中,所述目标客户的客户特征为从所述目标客户的交易数据、和/或征信数据、和/或损益数据中抽取出的能够反映所述目标客户的风险承受能力的数据;
所述授信得分确定模块,用于将所述目标客户的客户特征输入预先建立的客户授信模型,得到所述目标客户的授信得分,其中,所述客户授信模型采用标注有真实授信得分的训练客户特征训练得到;
所述授信等级确定模块,用于根据所述目标客户的授信得分,从预设的多个授信等级中确定所述目标客户的授信等级;
所述授信额度确定模块,用于根据所述目标客户的授信等级,确定所述目标客户的授信额度区间。
可选的,所述客户授信预测装置还可以包括:初始模型构建模块和初始模型优化模块;
所述初始模型构建模块,用于利用第一训练数据集中的训练数据训练多个弱分类器,确定训练后的每个弱分类器的分类错误率,并根据所述训练后的每个弱分类器的分类错误率确定所述训练后的每个弱分类器对应的权重,基于所述训练后的每个弱分类器对应的权重,将所述训练后的多个弱分类器组合成强分类器,作为初始的客户授信模型,其中,所述初始的客户授信模型的输出根据输入和所述训练后的每个弱分类器对应的权重确定;
所述初始模型优化模块,用于当获得由新的训练数据组成的第二训练数据集时,利用所述第二训练数据集中的训练数据训练所述初始的客户授信模型,以对所述初始的客户授信模型的性能进行优化;
其中,所述第一训练数据集中的每个训练数据和所述第二训练数据集中的每个训练数据为标注有真实授信得分的训练客户特征。
可选的,所述所述初始模型优化模块在利用所述第二训练数据集中的训练数据训练所述初始的客户授信模型时,具体用于:
将所述第二训练数据集中的每条训练数据输入所述初始的客户授信模型,获得所述初始的客户授信模型中的每个弱分类器针对每条训练数据预测的授信得分;
根据所述初始的客户授信模型中每个弱分类器针对每条训练数据预测的授信得分,以及所述第二训练数据集中每条训练数据的真实授信得分,确定所述初始的客户授信模型中每个弱分类器的分类错误率;
根据所述初始的客户授信模型中每个弱分类器的分类错误率,对所述初始的客户授信模型中每个弱分类器对应的权重进行更新。
一种客户授信预测设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现上述任一项所述的客户授信预测方法的各个步骤。
一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现上述任一项所述的客户授信预测方法的各个步骤。
经由上述方案可知,本申请提供的客户授信预测方法、装置、设备及存储介质,首先获取目标客户的客户特征,然后将目标客户的客户特征输入预先建立的客户授信模型,得到目标客户的授信得分,接着根据目标客户的授信得分,从预设的多个授信等级中确定目标客户的授信等级,最后根据目标客户的授信等级,确定目标客户的授信额度区间。由于目标客户的客户特征为从目标客户的交易数据、和/或征信数据、和/或损益数据中抽取出的能够反映所述目标客户的风险承受能力的数据,客户授信模型用标注有真实授信得分的大量训练客户特征训练得到,因此,基于目标客户的客户特征和客户授信模型能够自动针对目标客户预测出较准确的授信得分,进而基于较准确的授信得分能够确定出较合理的授信额度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的客户授信预测方法的流程示意图;
图2为本申请实施例提供的授信得分、授信等级与授信额度区间的示意图;
图3为本申请实施例提供的建立客户授信模型的流程示意图;
图4为本申请实施例提供的客户授信预测装置的结构示意图;
图5为本申请实施例提供的客户授信预测设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了能够针对客户确定出合理的授信额度,本案发明人进行了研究,最终提出了客户授信预测方法,该方法能够较准确地预测出不同客户的授信额度,该方法可应用于具有数据处理能力的终端,也可应用于单个服务器或多个服务器组成的服务器集群,接下来通过下述实施例对本申请提供的客户授信预测方法进行介绍。
请参阅图1,示出了该客户授信预测方法的流程示意图,可以包括:
步骤S101:获取目标客户的客户特征。
其中,目标客户为待预测的客户。
具体的,获取目标客户的客户特征的过程可以包括:从目标客户的ERP系统获取目标客户的基本信息、三年交易数据资产负债信息,损益信息等;根据目标客户的基本信息从征信系统查询目标客户的征信信息;从目标客户的三年交易数据资产负债信息、损益信息、征信信息等信息中获取关键特征,比如资金流动比率、速动比率、现金比率、应收账款流转率、资本金利润率、成本利润率、股本比重、在投资率、金融资产余额、银行存款余额、投资余额等特征,作为目标客户的客户特征。
步骤S102:将目标客户的客户特征输入预先建立的客户授信模型,得到目标客户的授信得分。
其中,客户授信模型采用大量标注有真实授信得分的不同训练客户特征训练得到。需要说明的是,不同训练客户特征指的是不同客户的客户特征。
步骤S103:根据目标客户的授信得分,从预设的多个授信等级中确定目标客户的授信等级。
在本实施例中,可预设多个授信等级,每个授信等级对应一授信得分区间,在获得目标客户的授信得分后,可确定其所属的授信得分区间,进而将其所属的授信得分区间对应的授信等级,确定为目标客户的授信等级。
示例性的,如图2所示,可预设10个等级,分别为0级、1级、2级、3级、…、10级,其中,0级对应的授信得分区间为[0,0],1级对应的授信得分区间为(0,10],2级对应的授信得分区间为(11,20],3级对应的授信得分区间为(21,30],…,10级对应的授信得分区间为(91,100],假设目标客户的授信得分为80分,由于80分所属的得分区间为(71,80],而(71,80]对应的授信等级为8级,因此,目标客户的授信等级为8级。需要说明的是,授信得分越高,则授信等级越高。
步骤S104:根据目标客户的授信等级,确定目标客户的授信额度区间。
具体的,可预设授信额度峰值,将0~授信额度峰值划分为多个授信额度区间,并预设授信等级与授信额度区间的对应关系,在获得目标客户的授信等级后,根据授信等级与授信额度区间的对应关系,确定目标客户的授信等级对应的授信额度区间,作为目标客户的授信额度区间。
示例性的,如图2所示,可将0~授信额度峰值划分为3个授信额度区间,0级~3级对应第1个授信额度区间,4级~7级对应第2个授信额度区间,8级~10级对应第3个授信额度区间,假设目标客户的授信等级为8级,则目标客户对应的授信额度区间为第3个授信额度区间。
本申请实施例提供的客户授信预测方法,首先获取目标客户的客户特征,然后将目标客户的客户特征输入预先建立的客户授信模型,以得到目标客户的授信得分,接着根据目标客户的授信得分,从预设的多个授信等级中确定目标客户的授信等级,最后根据目标客户的授信等级,确定目标客户的授信额度区间。由于目标客户的客户特征为从目标客户的交易数据、和/或征信数据、和/或损益数据中抽取出的能够反映目标客户的风险承受能力的数据,客户授信模型用标注有真实授信得分的大量不同训练客户特征训练得到,因此,基于目标客户的客户特征和客户授信模型能够自动针对目标客户预测出较准确的授信得分,进而基于较准确的授信得分能够确定出较合理的授信额度。
经由上述实施例可知,目标客户的授信得分基于预先建立的客户授信模型确定,接下来对建立客户授信模型的过程进行介绍。
请参阅图3,示出了建立客户授信模型的流程示意图,可以包括:
步骤S301:利用第一训练数据集中的训练数据训练多个弱分类器。
其中,第一训练数据集中的每个训练数据为标注有真实授信得分的训练客户特征。
具体的,利用第一训练数据集中的训练数据训练多个弱分类器的过程包括:利用第一训练数据集中的每个训练数据,以及第一训练数据集中每个训练数据的当前权重,逐个训练弱分类器,并在每训练完一个弱分类器后,根据该弱分类器对第一训练数据集中每个训练样本的分类结果,更新第一训练数据集中每个训练数据的当前权重。
经由上述过程可知,第一训练数据集中每个训练数据的权重在每训练完一个弱分类器后,都会进行更新,第一训练数据集中每个训练数据的初始权重可预设为相同的权重值,该权重值可根据第一训练数据集中训练数据的数量确定。
示例性的,第一训练数据集中包括N个训练数据,可设置每个训练数据的初始权重均为1/N,利用N个训练数据以及N个训练数据的初始权重训练第一个弱分类器,在训练完第一个弱分类器后,根据训练过程中第一个弱分类器对每个训练数据的分类结果,更新每个训练数据的当前权重,假设第一个弱分类器对某个训练数据正确分类,则增大该训练数据的权重,假设第一个弱分类器对某个训练数据错误分类,则减小该训练数据的权重,在更新完各个训练数据的权重后,利用N个训练数据和N个训练数据的当前权重(即进行首次更新后的权重)训练第二个弱分类器,在训练完第二个弱分类器后,根据训练过程中第二个弱分类器对每个训练数据的分类结果,更新每个训练数据的当前权重,即进行第二次权重更新,在完成第二次权重更新后,利用N个训练数据和N个训练数据的当前权重(即进行第二次更新后的权重)训练第三个弱分类器,以此类推,直至训练完预设数量的弱分类器。
步骤S302:确定训练后的每个弱分类器的分类错误率,并根据训练后的每个弱分类器的分类错误率确定训练后的每个弱分类器对应的权重。
确定训练后的一弱分类器的分类错误率的过程可以包括:将测试数据集中的每个测试数据输入该弱分类器进行分类;根据该弱分类器对每个测试数据的分类结果以及每个测试数据的真实分类结果,确定该弱分类器错误分类的测试数据的数量;根据该弱分类器错误分类的测试数据的数量和测试数据集中测试数据的总数量,确定该弱分类器的分类错误率。
经由上述方式可获得训练后的每个弱分类器的分类错误率,在获得训练后的每个弱分类器的分类错误率后,可按下式确定训练后的每个弱分类器对应的权重:
alphai=0.5*ln(1-εi/max(εi,1e-16)) (1)
其中,εi为训练后的第i个弱分类器的分类错误率,alphai为训练后的第i个弱分类器对应的权重,分类错误率较低的弱分类器对应的权重较大,分类错误率较高的弱分类器对应的权重较小。
步骤S303:基于训练后的每个弱分类器对应的权重,将训练后的多个弱分类器组合成强分类器,作为初始的客户授信模型。
其中,初始的客户授信模型的输出根据输入和每个弱分类器对应的权重确定,具体的,将初始的客户授信模型中各个弱分类的输出加权求和的结果,作为初始的客户授信模型的最终输出结果,每个弱分类器的输出对应的权重即为该弱分类器对应的权重。
步骤S304:当获得由新的训练数据组成的第二训练数据集时,利用所述第二训练数据集中的训练数据训练初始的客户授信模型,以对所述初始的客户授信模型的性能进行优化。
其中,第二训练数据集中的每个训练数据为标注有真实授信得分的训练客户特征。
需要说明的是,第二训练数据集中可以包括第一训练数据集中未涉及客户的客户特征,比如,第一训练数据集中包括A客户的客户特征、B客户的客户特征、C客户的客户特征和D客户的客户特征,则第二训练数据集中可以包括E客户的客户特征、F客户的客户特征、G客户的客户特征等,另外,第二训练数据集还可以包括第一训练数据集中涉及的客户的不同客户特征,比如,第一训练数据集中包括A客户的客户特征a1,则第二训练数据集中包括A客户的客户特征a2。
具体的,利用第二训练数据集中的训练数据训练初始的客户授信模型的过程可以包括:
步骤S3041、将第二训练数据集中的每条训练数据输入初始的客户授信模型,获得初始的客户授信模型中每个弱分类器针对第二训练数据集中每条训练数据预测的授信得分。
步骤S3042、根据初始的客户授信模型中每个弱分类器针对第二训练数据集中每条训练数据预测的授信得分,以及第二训练数据集中每条训练数据的真实授信得分,确定初始的客户授信模型中每个弱分类器的分类错误率。
具体的,针对初始的客户授信模型中每个弱分类器,根据该弱分类器对第二训练数据集中每条训练数据预测的授信得分,以及第二训练数据集中每条训练数据的真实授信得分,确定该弱分类器错误预测的训练数据的数量,根据该弱分类器错误预测的训练数据的数量以及第二训练数据集训练数据的总数量,确定该弱分类器的分类错误率,以得到初始的客户授信模型中每个弱分类器的分类错误率。
步骤S3043、根据初始的客户授信模型中每个弱分类器的分类错误率,对初始的客户授信模型中每个弱分类器对应的权重进行更新。
具体的,根据初始的客户授信模型中每个弱分类器的分类错误率,以及第二训练数据集在训练数据总集上所占的比重,对初始的客户授信模型中每个弱分类器对应的权重进行更新。其中,训练数据总集为由第一训练数据集中的训练数据和第二训练数据集中的训练数据组成的数据集。
经由上述过程获得的客户授信预测模型能够准确预测出不同客户的授信得分,进而基于准确的授信得分能够确定出合理的授信额度。
本申请实施例还提供了一种客户授信预测装置,下面对本申请实施例提供的客户授信预测装置进行描述,下文描述的客户授信预测装置与上文描述的客户授信预测方法可相互对应参照。
请参阅图4,示出了本实施例提供的客户授信预测装置的结构示意图,可以包括:客户特征获取模块401、授信得分确定模块402、授信等级确定模块403和授信额度确定模块404。
客户特征获取模块401,用于获取待预测的目标客户的客户特征。
授信得分确定模块402,用于将所述目标客户的客户特征输入预先建立的客户授信模型,得到所述目标客户的授信得分,其中,所述客户授信模型采用标注有真实授信得分的训练客户特征训练得到。
授信等级确定模块403,用于根据所述目标客户的授信得分,从预先的多个授信等级中确定所述目标客户的授信等级。
授信额度确定模块404,用于根据所述目标客户的授信等级,确定所述目标客户的授信额度区间。
在一种可能的实现方式中,客户特征获取模块401获取的目标客户的客户特征包括以下特征中的一种或多种的组合:资金流动比率、速动比率、现金比率、应收账款流转率、资本金利润率、成本利润率、股本比重,在投资率、金融资产余额、银行存款余额、投资余额。
在一种可能的实现方式中,上述实施例提供的客户授信预测装置还可以包括:初始模型构建模块和初始模型优化模块。
所述初始模型构建模块,用于利用第一训练数据集中的训练数据训练多个弱分类器,确定训练后的每个弱分类器的分类错误率,并根据训练后的每个弱分类器的分类错误率确定训练后的每个弱分类器对应的权重,将训练后的多个弱分类器组合成强分类器,作为初始的客户授信模型,其中,所述初始的客户授信模型的输出根据输入和每个弱分类器对应的权重确定。
所述初始模型优化模块,用于当获得由新的训练数据组成的第二训练数据集时,利用所述第二训练数据集中的训练数据训练所述初始的客户授信模型,以对所述初始的客户授信模型的性能进行优化。
其中,所述第一训练数据集中的每个训练数据和所述第二训练数据集中的每个训练数据为标注有真实授信得分的训练客户特征。
在一种可能的实现方式中,所述初始模型构建模块在利用第一训练数据集中的训练数据训练多个弱分类器时,具体用于:利用所述第一训练数据集中的每个训练数据,以及所述第一训练数据集中每个训练数据的当前权重,逐个训练弱分类器,并在每训练完一个弱分类器后,根据该弱分类器对第一训练数据集中每个训练样本的分类结果,更新第一训练数据集中每个训练数据的当前权重,以便在训练下一个弱分类器时,以每个训练数据的更新后权重为依据。
在一种可能的实现方式中,上述的初始模型优化模块在利用所述第二训练数据集中的训练数据训练所述初始的客户授信模型时,具体用于:将所述第二训练数据集中的每条训练数据输入所述初始的客户授信模型,获得所述初始的客户授信模型中的每个弱分类器针对每条训练数据预测的授信得分;根据所述初始的客户授信模型中每个弱分类器针对每条训练数据预测的授信得分,以及所述第二训练数据集中每条训练数据的真实授信得分,确定所述初始的客户授信模型中每个弱分类器的分类错误率;根据所述初始的客户授信模型中每个弱分类器的分类错误率,对所述初始的客户授信模型中每个弱分类器对应的权重进行更新。
本申请实施例还提供了一种客户授信预测设备,请参阅图5,示出了该客户授信预测设备的结构示意图,该客户授信预测设备可以包括:至少一个处理器501,至少一个通信接口502,至少一个存储器503和至少一个通信总线504;
在本申请实施例中,处理器501、通信接口502、存储器503、通信总线504的数量为至少一个,且处理器501、通信接口502、存储器503通过通信总线504完成相互间的通信;
处理器501可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
存储器503可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器;
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
获取目标客户的客户特征,其中,所述目标客户的客户特征为从所述目标客户的交易数据、和/或征信数据、和/或损益数据中抽取出的能够反映所述目标客户的风险承受能力的数据;
将所述目标客户的客户特征输入预先建立的客户授信模型,得到所述目标客户的授信得分,其中,所述客户授信模型采用标注有真实授信得分的训练客户特征训练得到;
根据所述目标客户的授信得分,从预设的多个授信等级中确定所述目标客户的授信等级;
根据所述目标客户的授信等级,确定所述目标客户的授信额度区间。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的程序,所述程序用于:
获取目标客户的客户特征,其中,所述目标客户的客户特征为从所述目标客户的交易数据、和/或征信数据、和/或损益数据中抽取出的能够反映所述目标客户的风险承受能力的数据;
将所述目标客户的客户特征输入预先建立的客户授信模型,得到所述目标客户的授信得分,其中,所述客户授信模型采用标注有真实授信得分的训练客户特征训练得到;
根据所述目标客户的授信得分,从预设的多个授信等级中确定所述目标客户的授信等级;
根据所述目标客户的授信等级,确定所述目标客户的授信额度区间。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种客户授信预测方法,其特征在于,包括:
获取目标客户的客户特征,其中,所述目标客户的客户特征为从所述目标客户的交易数据、和/或征信数据、和/或损益数据中抽取出的能够反映所述目标客户的风险承受能力的数据;
将所述目标客户的客户特征输入预先建立的客户授信模型,得到所述目标客户的授信得分,其中,所述客户授信模型采用标注有真实授信得分的训练客户特征训练得到;
根据所述目标客户的授信得分,从预设的多个授信等级中确定所述目标客户的授信等级;
根据所述目标客户的授信等级,确定所述目标客户的授信额度区间。
2.根据权利要求1所述的客户授信预测方法,其特征在于,建立所述客户授信模型的过程包括:
利用第一训练数据集中的训练数据训练多个弱分类器;
确定训练后的每个弱分类器的分类错误率,并根据所述训练后的每个弱分类器的分类错误率确定所述训练后的每个弱分类器对应的权重;
基于所述训练后的每个弱分类器对应的权重,将所述训练后的多个弱分类器组合成强分类器,作为初始的客户授信模型,其中,所述初始的客户授信模型的输出根据输入和所述训练后的每个弱分类器对应的权重确定;
当获得由新的训练数据组成的第二训练数据集时,利用所述第二训练数据集中的训练数据训练所述初始的客户授信模型,以对所述初始的客户授信模型的性能进行优化;
其中,所述第一训练数据集中的每个训练数据和所述第二训练数据集中的每个训练数据为标注有真实授信得分的训练客户特征。
3.根据权利要求2所述的客户授信预测方法,其特征在于,所述利用第一训练数据集中的训练数据训练多个弱分类器,包括:
利用所述第一训练数据集中的每个训练数据,以及所述第一训练数据集中每个训练数据的当前权重,逐个训练弱分类器,并在每训练完一个弱分类器后,根据该弱分类器对第一训练数据集中每个训练样本的分类结果,更新第一训练数据集中每个训练数据的当前权重,以便在训练下一个弱分类器时,以每个训练数据的更新后权重为依据。
4.根据权利要求2所述的客户授信预测方法,其特征在于,所述利用所述第二训练数据集中的训练数据训练所述初始的客户授信模型,包括:
将所述第二训练数据集中的每条训练数据输入所述初始的客户授信模型,获得所述初始的客户授信模型中的每个弱分类器针对每条训练数据预测的授信得分;
根据所述初始的客户授信模型中每个弱分类器针对每条训练数据预测的授信得分,以及所述第二训练数据集中每条训练数据的真实授信得分,确定所述初始的客户授信模型中每个弱分类器的分类错误率;
根据所述初始的客户授信模型中每个弱分类器的分类错误率,对所述初始的客户授信模型中每个弱分类器对应的权重进行更新。
5.根据权利要求1所述的客户授信预测方法,其特征在于,所述目标客户的客户特征包括以下特征中的一种或多种的组合:
资金流动比率、速动比率、现金比率、应收账款流转率、资本金利润率、成本利润率、股本比重、在投资率、金融资产余额、银行存款余额、投资余额。
6.一种客户授信预测装置,其特征在于,包括:客户特征获取模块、授信得分确定模块、授信等级确定模块和授信额度确定模块;
所述客户特征获取模块,用于获取目标客户的客户特征,其中,所述目标客户的客户特征为从所述目标客户的交易数据、和/或征信数据、和/或损益数据中抽取出的能够反映所述目标客户的风险承受能力的数据;
所述授信得分确定模块,用于将所述目标客户的客户特征输入预先建立的客户授信模型,得到所述目标客户的授信得分,其中,所述客户授信模型采用标注有真实授信得分的训练客户特征训练得到;
所述授信等级确定模块,用于根据所述目标客户的授信得分,从预设的多个授信等级中确定所述目标客户的授信等级;
所述授信额度确定模块,用于根据所述目标客户的授信等级,确定所述目标客户的授信额度区间。
7.根据权利要求6所述的客户授信预测装置,其特征在于,还包括:初始模型构建模块和初始模型优化模块;
所述初始模型构建模块,用于利用第一训练数据集中的训练数据训练多个弱分类器,确定训练后的每个弱分类器的分类错误率,并根据所述训练后的每个弱分类器的分类错误率确定所述训练后的每个弱分类器对应的权重,基于所述训练后的每个弱分类器对应的权重,将所述训练后的多个弱分类器组合成强分类器,作为初始的客户授信模型,其中,所述初始的客户授信模型的输出根据输入和所述训练后的每个弱分类器对应的权重确定;
所述初始模型优化模块,用于当获得由新的训练数据组成的第二训练数据集时,利用所述第二训练数据集中的训练数据训练所述初始的客户授信模型,以对所述初始的客户授信模型的性能进行优化;
其中,所述第一训练数据集中的每个训练数据和所述第二训练数据集中的每个训练数据为标注有真实授信得分的训练客户特征。
8.根据权利要求7所述的客户授信预测装置,其特征在于,所述所述初始模型优化模块在利用所述第二训练数据集中的训练数据训练所述初始的客户授信模型时,具体用于:
将所述第二训练数据集中的每条训练数据输入所述初始的客户授信模型,获得所述初始的客户授信模型中的每个弱分类器针对每条训练数据预测的授信得分;
根据所述初始的客户授信模型中每个弱分类器针对每条训练数据预测的授信得分,以及所述第二训练数据集中每条训练数据的真实授信得分,确定所述初始的客户授信模型中每个弱分类器的分类错误率;
根据所述初始的客户授信模型中每个弱分类器的分类错误率,对所述初始的客户授信模型中每个弱分类器对应的权重进行更新。
9.一种客户授信预测设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~5中任一项所述的客户授信预测方法的各个步骤。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~5中任一项所述的客户授信预测方法的各个步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011548397.XA CN112561691A (zh) | 2020-12-24 | 2020-12-24 | 一种客户授信预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011548397.XA CN112561691A (zh) | 2020-12-24 | 2020-12-24 | 一种客户授信预测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112561691A true CN112561691A (zh) | 2021-03-26 |
Family
ID=75033175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011548397.XA Pending CN112561691A (zh) | 2020-12-24 | 2020-12-24 | 一种客户授信预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112561691A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191875A (zh) * | 2021-04-30 | 2021-07-30 | 中国银行股份有限公司 | 新用户的授信方法及装置、电子设备、存储介质 |
CN113362176A (zh) * | 2021-06-29 | 2021-09-07 | 中国农业银行股份有限公司 | 数据处理方法和数据处理装置 |
CN117437040A (zh) * | 2023-12-21 | 2024-01-23 | 广州平云小匠科技股份有限公司 | 授信风险等级的更新方法、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107492033A (zh) * | 2017-08-30 | 2017-12-19 | 广东信基蜂巢科技有限责任公司 | 一种基于风控模型的信用评估方法及装置 |
CN108921689A (zh) * | 2018-06-29 | 2018-11-30 | 重庆富民银行股份有限公司 | 贷款风险监控系统及方法 |
CN108961040A (zh) * | 2018-06-29 | 2018-12-07 | 重庆富民银行股份有限公司 | 用于授信贷款的贷款额度评估系统及方法 |
CN109447783A (zh) * | 2018-09-21 | 2019-03-08 | 深圳市买买提信息科技有限公司 | 授信方法、装置、终端设备及存储介质 |
CN109685649A (zh) * | 2018-12-28 | 2019-04-26 | 上海点融信息科技有限责任公司 | 基于人工智能确定授信额度的方法、装置及存储介质 |
CN110060144A (zh) * | 2019-03-18 | 2019-07-26 | 平安科技(深圳)有限公司 | 额度模型训练方法、额度评估方法、装置、设备及介质 |
CN110458693A (zh) * | 2019-08-08 | 2019-11-15 | 中国建设银行股份有限公司 | 一种企业贷款自动审批方法、装置、存储介质及电子设备 |
CN111708883A (zh) * | 2020-06-01 | 2020-09-25 | 江苏苏宁银行股份有限公司 | 一种基于机器学习和设备指纹的授信额度确定方法及装置 |
CN111833196A (zh) * | 2020-07-13 | 2020-10-27 | 北京逸风金科软件有限公司 | 基于大数据征信的金融风控模型构建方法和装置 |
-
2020
- 2020-12-24 CN CN202011548397.XA patent/CN112561691A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107492033A (zh) * | 2017-08-30 | 2017-12-19 | 广东信基蜂巢科技有限责任公司 | 一种基于风控模型的信用评估方法及装置 |
CN108921689A (zh) * | 2018-06-29 | 2018-11-30 | 重庆富民银行股份有限公司 | 贷款风险监控系统及方法 |
CN108961040A (zh) * | 2018-06-29 | 2018-12-07 | 重庆富民银行股份有限公司 | 用于授信贷款的贷款额度评估系统及方法 |
CN109447783A (zh) * | 2018-09-21 | 2019-03-08 | 深圳市买买提信息科技有限公司 | 授信方法、装置、终端设备及存储介质 |
CN109685649A (zh) * | 2018-12-28 | 2019-04-26 | 上海点融信息科技有限责任公司 | 基于人工智能确定授信额度的方法、装置及存储介质 |
CN110060144A (zh) * | 2019-03-18 | 2019-07-26 | 平安科技(深圳)有限公司 | 额度模型训练方法、额度评估方法、装置、设备及介质 |
CN110458693A (zh) * | 2019-08-08 | 2019-11-15 | 中国建设银行股份有限公司 | 一种企业贷款自动审批方法、装置、存储介质及电子设备 |
CN111708883A (zh) * | 2020-06-01 | 2020-09-25 | 江苏苏宁银行股份有限公司 | 一种基于机器学习和设备指纹的授信额度确定方法及装置 |
CN111833196A (zh) * | 2020-07-13 | 2020-10-27 | 北京逸风金科软件有限公司 | 基于大数据征信的金融风控模型构建方法和装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191875A (zh) * | 2021-04-30 | 2021-07-30 | 中国银行股份有限公司 | 新用户的授信方法及装置、电子设备、存储介质 |
CN113362176A (zh) * | 2021-06-29 | 2021-09-07 | 中国农业银行股份有限公司 | 数据处理方法和数据处理装置 |
CN113362176B (zh) * | 2021-06-29 | 2024-03-22 | 中国农业银行股份有限公司 | 数据处理方法和数据处理装置 |
CN117437040A (zh) * | 2023-12-21 | 2024-01-23 | 广州平云小匠科技股份有限公司 | 授信风险等级的更新方法、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10943186B2 (en) | Machine learning model training method and device, and electronic device | |
Wall | Some financial regulatory implications of artificial intelligence | |
Crook et al. | Recent developments in consumer credit risk assessment | |
Du Jardin | Bankruptcy prediction using terminal failure processes | |
CN112561691A (zh) | 一种客户授信预测方法、装置、设备及存储介质 | |
CN111275546B (zh) | 金融客户欺诈风险识别方法及装置 | |
JP2007502484A (ja) | 不活性顧客を予測するための方法およびシステム | |
CN111008896A (zh) | 金融风险预警方法、装置、电子设备及存储介质 | |
CN110310123B (zh) | 风险判断方法和装置 | |
CN112101520A (zh) | 风险评估模型训练方法、业务风险评估方法及其他设备 | |
US20220366488A1 (en) | Transmitting proactive notifications based on machine learning model predictions | |
Lizares et al. | Corporate financial distress: The case of publicly listed firms in an emerging market economy | |
RU2680760C1 (ru) | Компьютеризированный способ разработки и управления моделями скоринга | |
CN110930218A (zh) | 一种识别欺诈客户的方法、装置及电子设备 | |
Giannopoulos et al. | Predicting SME loan delinquencies during recession using accounting data and SME characteristics: The case of Greece | |
US20220207420A1 (en) | Utilizing machine learning models to characterize a relationship between a user and an entity | |
Liu | New issues in credit scoring application | |
KR102282144B1 (ko) | 기업 가치 평가 시스템 | |
JP7298286B2 (ja) | モデル提供プログラム、モデル提供方法及びモデル提供装置 | |
CN112419025A (zh) | 用户数据处理方法和装置、存储介质、电子设备 | |
CN111461863A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
US20150170269A1 (en) | Real estate market condition indicator | |
Tan et al. | Investment recommendation with total capital value maximization in online P2P lending | |
Oelerich et al. | Evaluation of rating systems | |
Yim et al. | Predicting financial distress in the Australian financial service industry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |