CN112232945B - 一种确定个人客户授信的方法及装置 - Google Patents

一种确定个人客户授信的方法及装置 Download PDF

Info

Publication number
CN112232945B
CN112232945B CN202011103531.5A CN202011103531A CN112232945B CN 112232945 B CN112232945 B CN 112232945B CN 202011103531 A CN202011103531 A CN 202011103531A CN 112232945 B CN112232945 B CN 112232945B
Authority
CN
China
Prior art keywords
client
target
personal
characteristic
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011103531.5A
Other languages
English (en)
Other versions
CN112232945A (zh
Inventor
喻明月
桑静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN202011103531.5A priority Critical patent/CN112232945B/zh
Publication of CN112232945A publication Critical patent/CN112232945A/zh
Application granted granted Critical
Publication of CN112232945B publication Critical patent/CN112232945B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请提供了一种确定个人客户授信的方法及装置,方法包括:获取目标个人客户对应的第一特征数据集合和客户流失情况;获取目标个人客户对应的目标特征项集合,并根据目标个人客户对应的目标特征项集合,从目标个人客户对应的第一特征数据集合中获取目标特征数据,组成目标个人客户对应的目标特征数据集合;将目标个人客户对应的目标特征数据集合和客户流失情况输入预先建立的个人客户授信模型,得到目标个人客户对应的授信值。本申请提供的确定个人客户授信的方法为专门针对个人客户提出的方案,其能够很好地适用于供应链上的个人客户授信问题。

Description

一种确定个人客户授信的方法及装置
技术领域
本申请涉及数据处理技术领域,尤其涉及一种确定个人客户授信的方法及装置。
背景技术
在当前供应链融资产品体系中,多数银行都将目光聚焦于核心企业上下游的公司或企业,法人供应链融资产品层出不穷,市场竞争强烈,然而,基于自然人的供应链融资产品却很少,出现该情况的原因在于,个人信息相比法人信息,其信息量更为庞大,所含信息更为复杂,处理起来难度大,难以适应现有的授信确定方法,即个人客户的授信值难以确定。
基于自然人的供应链融资产品很少,会导致很多自然人比如农户等城镇低收入人群难以贷款,更难享受普惠带来的便利,鉴于该问题,目前亟需一种能够确定个人客户授信的方案。
发明内容
有鉴于此,本申请提供了一种确定个人客户授信的方法及装置,用以确定个人客户的授信值,其技术方案如下:
一种确定个人客户授信的方法,包括:
获取目标个人客户对应的第一特征数据集合和客户流失情况,其中,所述第一特征数据集合包括所述目标个人客户的多个特征数据,每个特征数据包括特征项和该特征项对应的特征值;
获取所述目标个人客户对应的目标特征项集合,并根据所述目标个人客户对应的目标特征项集合,从所述目标个人客户对应的第一特征数据集合中获取目标特征数据,组成所述目标个人客户对应的目标特征数据集合;
将所述目标个人客户对应的目标特征数据集合和客户流失情况输入预先建立的个人客户授信模型,得到所述目标个人客户对应的授信值,其中,所述个人客户授信模型以训练个人客户对应的目标特征数据集合和客户流失情况为训练样本,以训练个人客户对应的真实授信值为样本标签训练得到。
其中,建立所述个人客户授信模型的过程包括:
获取训练样本集,其中,所述训练样本集包括多个客户类型分别对应的个人客户集合中各个人客户分别对应的目标特征数据集合和客户流失情况,一个人客户对应的目标特征数据集合和客户流失情况作为一个训练样本;
利用所述训练样本集中的训练样本和训练样本对应的样本标签,分别训练逻辑回归模型、随机森林模型以及XGBoost模型,得到训练后的三个模型;
采用测试样本集测试所述训练后的三个模型的准确度,将准确度最高的模型确定为个人客户授信模型。
可选的,获取一个人客户对应的客户流失情况,包括:
获取该个人客户对应的交易情况数据,以及,该个人客户和与该个人客户相关的核心企业的特定数据,其中,所述特定数据包括:客户基本信息、客户等级、核心企业信用等级、还款来源评价、核心企业风险情况、核心企业ERP交易数据和客户征信;
根据该个人客户对应的交易情况数据,以及,该个人客户和与该个人客户相关的核心企业的特定数据,获取该个人客户对应的客户流失情况。
可选的,获取一个人客户对应的目标特征项集合,包括:
从预先确定的、多个客户类型分别对应的目标特征项集合中,确定该个人客户所属的客户类型所对应的目标特征项集合,作为该个人客户对应的目标特征项集合。
可选的,确定所述多个客户类型分别对应的目标特征项集合,包括:
获取多个个人客户分别对应的第二特征数据集合;
根据所述多个个人客户分别对应的第二特征数据集合,对所述多个个人客户进行聚类,获得多个客户类型分别对应的个人客户集合;
获取所述多个客户类型分别对应的个人客户集合中各个人客户分别对应的第一特征数据集合;
对于每个客户类型,根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的目标特征项集合,以得到所述多个客户类型分别对应的目标特征项集合。
可选的,获取一个人客户对应的第一特征数据集合,包括:
获取该个人客户对应的特征数据总集;
从该个人客户对应的特征数据总集中,选取预设个与授信相关的特征数据;
根据选取出的预设个特征数据,按预设的特征衍生策略,衍生出新的特征数据;
对选取出的预设个特征数据和衍生出的特征数据进行预处理,将预处理后的特征数据组成该客户对应的第一特征数据集合。
可选的,所述对选取出的预设个特征数据和衍生出的特征数据进行预处理,包括:
对选取出的预设个特征数据和衍生出的特征数据进行如下处理中的一种或多种:
缺失值填充、盖帽处理、非稳定特征去除、连续型特征分箱。
可选的,所述根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的目标特征项集合,包括:
根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的特征项总集中每个特征项的重要度,其中,该客户类型对应的特征项总集由该客户类型对应的个人客户集合中个人客户所对应的第一特征数据集合中的特征项组成;
根据该客户类型对应的特征项总集中每个特征项的重要度,从该客户类型对应的特征项总集中选取预设个特征项;
对所述预设个特征项进行聚类,获得多类特征项;
获取每类特征项中的最优特征项,由获得的所有最优特征项组成该客户类型对应的目标特征项集合。
一种确定个人客户授信的装置,包括:数据获取模块、目标特征项集合获取模块、目标特征数据集合获取模块和个人授信确定模块;
所述数据获取模块,用于获取目标个人客户对应的第一特征数据集合和客户流失情况,其中,所述第一特征数据集合包括所述目标个人客户的多个特征数据,每个特征数据包括特征项和该特征项对应的特征值;
所述目标特征项集合获取模块,用于获取所述目标个人客户对应的目标特征项集合;
所述目标特征数据集合获取模块,用于根据所述目标个人客户对应的目标特征项集合,从所述目标个人客户对应的第一特征数据集合中获取目标特征数据,组成所述目标个人客户对应的目标特征数据集合;
所述个人授信确定模块,用于将所述目标个人客户对应的目标特征数据集合和客户流失情况输入预先建立的个人客户授信模型,得到所述目标个人客户对应的授信值,其中,所述个人客户授信模型以训练个人客户对应的目标特征数据集合和客户流失情况为训练样本,以训练个人客户对应的真实授信值为样本标签训练得到。
所述确定个人客户授信的装置还包括:个人客户授信模型构建模块;
所述个人客户授信模型构建模块包括:训练样本获取模块、模型训练模块和个人客户授信模型确定模块;
所述训练样本获取模块,用于获取训练样本集,其中,所述训练样本集中包括多个客户类型分别对应的个人客户集合中各个人客户分别对应的目标特征数据集合和客户流失情况,一个人客户对应的目标特征集合和客户流失情况作为一个训练样本;
所述模型训练模块,用于利用所述训练样本集中的训练样本和训练样本对应的样本标签,分别训练逻辑回归模型、随机森林模型以及XGBoost模型,得到训练后的三个模型;
所述个人客户授信模型确定模块,用于采用测试样本集测试所述训练后的三个模型的准确度,将准确度最高的模型确定为个人客户授信模型
经由上述方案可知,本申请提供的确定个人客户授信的方法及装置,首先获取目标个人客户对应的第一特征数据集合和客户流失情况,然后获取目标个人客户对应的目标特征项集合,并根据目标个人客户对应的目标特征项集合,从目标个人客户对应的第一特征数据集合中获取目标特征数据,组成目标个人客户对应的目标特征数据集合,最后将目标个人客户对应的目标特征数据集合和客户流失情况输入预先建立的个人客户授信模型,从而得到目标个人客户对应的授信值,由此可见,通过本申请提供的确定个人客户授信的方法,能够确定出个人客户的授信值。本申请提供的确定个人客户授信的方法为专门针对个人客户授信提出的方案,其能够很好地适用于供应链上的个人客户授信问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的确定个人客户授信的方法的流程示意图;
图2为本申请实施例提供的建立个人客户授信模型的流程示意图;
图3为本申请实施例提供的确定多个客户类型分别对应的目标特征项集合的流程示意图;
图4为本申请实施例提供的确定个人客户授信的装置的结构示意图;
图5为本申请实施例提供的确定个人客户授信的设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,示出了本申请实施例提供的确定个人客户授信的方法的流程示意图,该方法可以包括:
步骤S101:获取目标个人客户对应的第一特征数据集合和客户流失情况。
其中,目标个人客户对应的第一特征数据集合包括目标个人客户的多个特征数据,每个特征数据包括特征项和该特征项对应的特征值。
需要说明的是,本实施例中的特征项为特征的抽象描述,特征项对应的特征值为特征的具体描述,示例性的,“客户等级:X级别”为一特征数据,则“客户等级”为特征项,“X级别”为特征项“客户等级”对应的特征值。
步骤S102:获取目标个人客户对应的目标特征项集合。
其中,目标个人客户对应的目标特征项集合中的特征项为目标个人客户对应的第一特征数据集合所包含的特征项中,较为重要的特征项。
步骤S103:根据目标个人客户对应的目标特征项集合,从目标个人客户对应的第一特征数据集合中获取目标特征数据,组成目标个人客户对应的目标特征数据集合。
具体的,从目标个人客户对应的第一特征数据集合中,获取包含目标个人客户对应的目标特征项集合中特征项的特征数据,由获得的特征数据组成目标个人客户对应的目标特征数据集合。
示例性的,目标个人客户对应的目标特征项集合为{f1,f2,…,fn},则从目标个人客户对应的第一特征数据集合中获取包含f1、f2、…、fn的特征数据,将获得的特征数据组成目标个人客户对应的目标特征数据集合。
步骤S104:将目标个人客户对应的目标特征数据集合和客户流失情况输入预先建立的个人客户授信模型,得到目标个人客户对应的授信值。
其中,个人客户授信模型以训练个人客户对应的目标特征数据集合和客户流失情况为训练样本,以训练个人客户对应的真实授信值为样本标签训练得到。
本申请实施例提供的确定个人客户授信的方法,首先获取目标个人客户对应的第一特征数据集合和客户流失情况,然后获取目标个人客户对应的目标特征项集合,并根据目标个人客户对应的目标特征项集合,从目标个人客户对应的第一特征数据集合中获取目标特征数据,组成目标个人客户对应的目标特征数据集合,最后将目标个人客户对应的目标特征数据集合和客户流失情况输入预先建立的个人客户授信模型,从而得到目标个人客户对应的授信值,由此可见,通过本申请实施例提供的确定个人客户授信的方法,能够确定出个人客户的授信值。本申请实施例提供的确定个人客户授信的方法为专门针对个人客户授信提出的方案,其能够很好地适用于供应链上的个人客户授信问题。
上述实施例中提到,目标个人客户对应的授信值可利用预先建立的个人客户授信模型确定,接下来对建立个人客户授信模型的过程进行介绍。
请参阅图2,示出了建立个人客户授信模型的流程示意图,可以包括:
步骤S201:获取训练样本集。
其中,训练样本集中包括多个客户类型分别对应的个人客户集合中各个人客户分别对应的目标特征数据集合和客户流失情况,一个人客户对应的目标特征数据集合和客户流失情况作为一个训练样本。
训练样本集中的每个训练样本都对应一样本标签,该样本标签为该训练样本所对应的个人客户的真实授信值。
步骤S202:利用训练样本集中的训练样本和训练样本对应的样本标签,分别训练逻辑回归模型、随机森林模型以及XGBoost模型,得到训练后的三个模型。
需要说明的是,训练逻辑回归模型、随机森林模型以及XGBoost模型的方式基本相同,即,将训练样本输入模型,获得模型预测的授信值,(本实施例将模型预测的授信值称之为训练样本对应的“预测授信值”),根据训练样本对应的预测授信值和训练样本对应的真实授信值确定模型的预测损失,根据模型的预测损失更新模型的参数。
步骤S203:采用测试样本集测试训练后的三个模型的准确度,将准确度最高的模型确定为个人客户授信模型。
对于每个训练后模型,将测试样本集中的每个测试样本输入该训练后模型进行预测,以得到测试样本集中每个测试样本对应的预测授信值,根据测试样本集中每个测试样本对应的预测授信值和真实授信值,确定该训练后模型的准确度。
需要说明的是,若一测试样本对应的预测授信值与该测试样本对应的真实授信值相同,或者二者差值的绝对值小于预设值,则可认为训练后模型针对该测试样本预测出了正确的授信值。假设测试样本集中总共有100个测试样本,一训练后模型针对90个测试样本测试样本预测出了正确的授信值,则该训练后模型的准确度为90%。
上述内容提到,训练样本集中的一个训练样本为多个客户类型分别对应的个人客户集合中一个人客户对应的目标特征数据集合和客户流失情况,接下来对确定一个人客户对应的目标特征数据集合和客户流失情况的具体过程进行介绍。
首先对确定一个人客户对应的目标特征数据集合的实现过程进行介绍。
确定一个人客户对应的目标特征数据集合的实现过程可以包括:从预先确定的、多个客户类型分别对应的目标特征项集合中,确定该个人客户所属的客户类型所对应的目标特征项集合,作为该个人客户对应的目标特征项集合。其中,多个客户类型分别对应的目标特征项集合中特征项的数量相同。
示例性的,多个客户类型分别为“农养殖客户”、“个体经商户”、“牧渔业户”和“小微企业主,“农养殖客户”这一客户类型对应的目标特征项集合为{f1,f2,…,fn},“个体经商户”这一客户类型对应的目标特征项集合为{g1,g2,…,gn},“牧渔业户”这一客户类型对应的目标特征项集合为{k1,k2,…,kn},“小微企业主”这一客户类型对应的目标特征项集合为{p1,p2,…,pn},假设一个人客户所属的客户类型为“农养殖客户”,则该个人客户所属客户类型对应的目标特征项集合即为{f1,f2,…,fn}。
请参阅图3,示出了确定多个客户类型分别对应的目标特征项集合的流程示意图,可以包括:
步骤S301:获取多个个人客户分别对应的第二特征数据集合。
其中,每个个人客户对应的第二特征数据集中的特征数据可以包括:个人客户存在背景、经营模式、盈利周期、贷款风险等。
步骤S302:根据多个个人客户分别对应的第二特征数据集合,对多个个人客户进行聚类,获得多个客户类型分别对应的个人客户集合。
在本实施例中,可采用聚类算法(比如K-means聚类算法)对多个个人客户分别对应的第二特征数据集合中的特征数据进行聚类,以将多个个人客户划分为多类,比如,可结合业务经验,将多个个人客户分为4类,分别为农养殖客户、个体经商户、牧渔业户和小微企业主,这四类个人客户的盈利周期不同,其中,农养殖客户的盈利周期>12个月,个体经商户的盈利周期>6个月,牧渔业户的盈利周期>18个月,小微企业主的盈利周期>3个月。
步骤S303:获取多个客户类型中每个客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合。
具体的,获取一个人客户对应的第一特征数据集合的过程包括:
步骤a1、获取该个人客户对应的特征数据总集。
其中,该个人客户对应的特征数据总集中包括该个人客户的所有特征数据,比如客户基本信息、客户等级、核心企业ERP交易数据、客户征信等等。
步骤a2、从该个人客户对应的特征数据总集中,选取预设个与授信相关的特征数据。
具体的,可从客户基本信息、客户等级、核心企业信用等级、还款来源评价、核心企业风险情况、核心企业ERP交易数据、客户征信等方面,从目标个人客户对应的特征数据总集中,选取预设个(比如M个)特征数据。
步骤a3、根据选取出的预设个特征数据,按预设的特征衍生策略,衍生出新的特征数据。
其中,预设的特征衍生策略可以但不限定为汇总特征、组合特征、统计学方法、业务定义。
比如,可按目标个人客户所属客户类型对应的盈利周期对选取出的特征进行汇总衍生,以提高特征的显著性,使其更加符合业务逻辑;可将反映客户基本情况的特征数据组合,比如,将客户基本信息、客户等级、核心企业信用等级等进行组合,以得到组合特征;可通过统计学方法对特征数据进行统计,以衍生出平均值、最大值、最小值、标准差等特征;还可从业务角度对特征进行衍生。
需要说明的是,进行特征衍生的目的在于,增加特征个数,缩小较大数据的差距,改变数据分布等。
步骤a4、对选取出的预设个特征数据和衍生出的特征数据进行预处理,将预处理后的特征数据组成该个人客户对应的第一特征数据集合。
其中,预处理可以包括以下处理中的一种或多种:缺失值填充、盖帽处理、非稳定特征去除、连续型特征分箱。
其中,缺失值填充指的是,对缺失值所占比例低于预设比例(比如90%)的特征数据进行填充,填充规则为:对于数值型变量,填充均值或者填充0,对于枚举型变量,填充众数。需要说明的是,若一特征变量中缺失值所占比例大于或等于预设比例(比如90%),则直接将该特征数据删除。
示例性的,一特征数据中有100个特征值,预设比例为90%,假设该特征数据中缺失值少于90个,则取未缺失特征值的均值,用该均值对缺失值进行填充,若该特征数据中缺失值多于或等于90个,则直接将该特征数据删除。
其中,盖帽处理针对的是金额类特征数据,对于金额类特征数据,如果特征值大于预设的最大值,则将特征值设置为该预设最大值,如果特征值小于预设的最小值,则将该特征值设置为该预设的最小值。
其中,非稳定特征去除指的是,计算特征数据的PSI(群体稳定性指标),根据特征数据的PSI确定特征数据的稳定性情况,若特征数据稳定性较差,则将该特征数据去除。
其中,连续型特征分箱针对的是连续型特征数据,对于连续型特征数据,将其按区间做分块映射,实现连续型特征离散化。可选的,可通过基于决策树的最大熵计算分箱阈值,进而基于分箱阈值将连续型特征转换为离散型特征。
步骤S304、对于每个客户类型,根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的目标特征项集合,以得到多个客户类型分别对应的目标特征项集合。
具体的,根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的目标特征项集合,包括:
步骤b1、根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的特征项总集中每个特征项的重要度。
需要说明的是,一客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合中的特征项相同,比如,个人客户A和个人客户B均为个体经商户,则个人客户A对应的第一特征数据集合中的特征项与个人客户B对应的第一特征数据集合中的特征项相同。
在本实施例中,一客户类型对应的特征项总集由该客户类型对应的个人客户集合中个人客户对应的第一特征数据集合中的特征项组成。
步骤b2、根据该客户类型对应的特征项总集中每个特征项的重要度,从该客户类型对应的特征项总集中选取预设个(比如N个)特征项。
可以理解的是,对于授信值预测而言,特征项总集中各特征项的重要度并不一样,为了在保证预测效果的前提下提高预测效率,本实施例根据该客户类型对应的特征项总集中每个特征项的重要度,从该客户类型对应的特征项总集中选取预设个相对比较重要的特征项。
步骤b3、对预设个特征项进行聚类,获得多类特征项,获取每类特征项中的最优特征项,由获得的所有最优特征项组成该客户类型对应的目标特征项集合。
为了进一步提高预测效率,本实施例对于同一类型的特征项,只保留一个,优选的,只保留最优的特征项。具体的,本实施例首先对通过步骤b2获得的预设个特征项进行聚类(比如可采用K-means聚类算法进行聚类),以获得多类特征项,然后从每类特征项中挑选最优特征项,由挑选出的所有最优特征项组成该客户类型对应的目标特征项集合。可选的,可将每类特征项的类中心作最优特征项。
上述内容对确定一个人客户对应的目标特征数据集合的具体实现过程进行了介绍,接下来对确定一个人客户对应的客户流失情况的具体实现过程进行介绍。
确定一个人客户对应的客户流失情况的过程可以包括:获取该个人客户对应的交易情况数据,以及,该个人客户和与该个人客户相关的核心企业的特定数据,根据该个人客户对应的交易情况数据,以及,该个人客户和与该个人客户相关的核心企业的特定数据,获取该个人客户对应的客户流失情况。
其中,该个人客户和与该个人客户相关的核心企业的特定数据可以包括:客户基本信息、客户等级、核心企业信用等级、还款来源评价、核心企业风险情况、核心企业ERP交易数据和客户征信等。
具体的,可将每类个人客户根据客户个人授信划分多个档次,每降低一个档次视为流失,若个人客户为农养殖客户,则该个人客户的客户交易量及订单下降,授信降档(风险值上升),视为客户流失,若个人客户为个体经商户,则该个人客户的客户交易量及订单下降,授信降档(风险值上升),视为客户流失;若个人客户为牧渔业户,则客户规模、征信下降、授信降档(风险值上升),视为客户流失;若个人客户为小微企业主,则客户交易量周期下降、授信降档(风险值上升),视为客户流失。
需要说明的是,本实施例中,一个人客户对应的客户流失情况可以包括该客户是否存在客户流失情况,若存在客户流失情况,还可包括客户流失率,可选的,客户流失率可通过交易下降比例表征。
与上述确定个人客户授信的方法相对应,本申请实施例还提供了一种确定个人客户授信的装置,请参阅图4,示出了该装置的结构示意图,该装置可以包括:数据获取模块401、目标特征项集合获取模块402、目标特征数据集合获取模块403和个人授信确定模块404。
数据获取模块401,用于获取目标个人客户对应的第一特征数据集合和客户流失情况。
其中,所述第一特征数据集合包括所述目标个人客户的多个特征数据,每个特征数据包括特征项和该特征项对应的特征值。
目标特征项集合获取模块402,用于获取所述目标个人客户对应的目标特征项集合。
目标特征数据集合获取模块403,用于根据所述目标个人客户对应的目标特征项集合,从所述目标个人客户对应的第一特征数据集合中获取目标特征数据,组成所述目标个人客户对应的目标特征数据集合。
个人授信确定模块404,用于将所述目标个人客户对应的目标特征数据集合和客户流失情况输入预先建立的个人客户授信模型,得到所述目标个人客户对应的授信值。
其中,所述个人客户授信模型以训练个人客户对应的目标特征数据集合和客户流失情况为训练样本,以训练个人客户对应的真实授信值为样本标签训练得到。
通过本申请实施例提供的确定个人客户授信的装置,能够确定出个人客户的授信值。本申请实施例提供的确定个人客户授信的装置为专门针对个人客户授信提出的方案,其能够很好地适用于供应链上的个人客户授信问题。
在一种可能的实现方式中,上述实施例提供的确定个人客户授信的装置还可以包括:个人客户授信模型构建模块。
所述个人客户授信模型构建模块包括:训练样本获取模块、模型训练模块和个人客户授信模型确定模块。
所述训练样本获取模块,用于获取训练样本集。
其中,所述训练样本集中包括多个客户类型分别对应的个人客户集合中各个人客户分别对应的目标特征数据集合和客户流失情况,一个人客户对应的目标特征集合和客户流失情况作为一个训练样本。
所述模型训练模块,用于利用所述训练样本集中的训练样本和训练样本对应的样本标签,分别训练逻辑回归模型、随机森林模型以及XGBoost模型,得到训练后的三个模型。
所述个人客户授信模型确定模块,用于采用测试样本集测试所述训练后的三个模型的准确度,将准确度最高的模型确定为个人客户授信模型。
在一种可能的实现方式中,所述训练样本获取模块在获取一个人客户对应的客户流失情况时,具体用于获取该个人客户对应的交易情况数据,以及,该个人客户和与该个人客户相关的核心企业的特定数据;根据该个人客户对应的交易情况数据,以及,该个人客户和与该个人客户相关的核心企业的特定数据,获取该个人客户对应的客户流失情况。其中,所述特定数据包括:客户基本信息、客户等级、核心企业信用等级、还款来源评价、核心企业风险情况、核心企业ERP交易数据和客户征信。
在一种可能的实现方式中,在一种可能的实现方式中,所述训练样本获取模块在获取一个人客户对应的目标特征项集合时,具体用于从预先确定的、多个客户类型分别对应的目标特征项集合中,确定该个人客户所属的客户类型所对应的目标特征项集合,作为该个人客户对应的目标特征项集合。
在一种可能的实现方式中,上述实施例提供的确定个人客户授信的装置还可以包括:第二特征数据集合获取模块、个人客户聚类模块、第一特征数据集合获取模块和特征项集合确定模块。
第二特征数据集合获取模块,用于获取多个个人客户分别对应的第二特征数据集合。
个人客户聚类模块,用于根据所述多个个人客户分别对应的第二特征数据集合,对所述多个个人客户进行聚类,获得多个客户类型分别对应的个人客户集合。
第一特征数据集合获取模块,用于获取所述多个客户类型分别对应的个人客户集合中各个人客户分别对应的第一特征数据集合。
特征项集合确定模块,用于对于每个客户类型,根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的目标特征项集合,以得到所述多个客户类型分别对应的目标特征项集合。
在一种可能的实现方式中,第一特征数据集合获取模块在获取一个人客户对应的第一特征数据集合时,具体用于获取该个人客户对应的特征数据总集;从该个人客户对应的特征数据总集中,选取预设个与授信相关的特征数据;根据选取出的预设个特征数据,按预设的特征衍生策略,衍生出新的特征数据;对选取出的预设个特征数据和衍生出的特征数据进行预处理,将预处理后的特征数据组成该客户对应的第一特征数据集合。
在一种可能的实现方式中,第一特征数据集合获取模块在对选取出的预设个特征数据和衍生出的特征数据进行预处理时,具体用于对选取出的预设个特征数据和衍生出的特征数据进行如下处理中的一种或多种:缺失值填充、盖帽处理、非稳定特征去除、连续型特征分箱。
在一种可能的实现方式中,特征项集合确定模块在根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的目标特征项集合时,具体用于根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的特征项总集中每个特征项的重要度,其中,该客户类型对应的特征项总集由该客户类型对应的个人客户集合中个人客户所对应的第一特征数据集合中的特征项组成;根据该客户类型对应的特征项总集中每个特征项的重要度,从该客户类型对应的特征项总集中选取预设个特征项;对所述预设个特征项进行聚类,获得多类特征项;获取每类特征项中的最优特征项,由获得的所有最优特征项组成该客户类型对应的目标特征项集合。
本申请实施例还提供了一种确定个人客户授信的设备,请参阅图5,示出了该设备的结构示意图,该设备可以包括:至少一个处理器501,至少一个通信接口502,至少一个存储器503和至少一个通信总线504;
在本申请实施例中,处理器501、通信接口502、存储器503、通信总线504的数量为至少一个,且处理器501、通信接口502、存储器503通过通信总线504完成相互间的通信;
处理器501可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
存储器503可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器;
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
获取目标个人客户对应的第一特征数据集合和客户流失情况,其中,所述第一特征数据集合包括所述目标个人客户的多个特征数据,每个特征数据包括特征项和该特征项对应的特征值;
获取所述目标个人客户对应的目标特征项集合,并根据所述目标个人客户对应的目标特征项集合,从所述目标个人客户对应的第一特征数据集合中获取目标特征数据,组成所述目标个人客户对应的目标特征数据集合;
将所述目标个人客户对应的目标特征数据集合和客户流失情况输入预先建立的个人客户授信模型,得到所述目标个人客户对应的授信值,其中,所述个人客户授信模型以训练个人客户对应的目标特征数据集合和客户流失情况为训练样本,以训练个人客户对应的真实授信值为样本标签训练得到。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的程序,所述程序用于:
获取目标个人客户对应的第一特征数据集合和客户流失情况,其中,所述第一特征数据集合包括所述目标个人客户的多个特征数据,每个特征数据包括特征项和该特征项对应的特征值;
获取所述目标个人客户对应的目标特征项集合,并根据所述目标个人客户对应的目标特征项集合,从所述目标个人客户对应的第一特征数据集合中获取目标特征数据,组成所述目标个人客户对应的目标特征数据集合;
将所述目标个人客户对应的目标特征数据集合和客户流失情况输入预先建立的个人客户授信模型,得到所述目标个人客户对应的授信值,其中,所述个人客户授信模型以训练个人客户对应的目标特征数据集合和客户流失情况为训练样本,以训练个人客户对应的真实授信值为样本标签训练得到。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种确定个人客户授信的方法,其特征在于,包括:
获取目标个人客户对应的第一特征数据集合和客户流失情况,其中,所述第一特征数据集合包括所述目标个人客户的多个特征数据,每个特征数据包括特征项和该特征项对应的特征值;
获取所述目标个人客户对应的目标特征项集合,并根据所述目标个人客户对应的目标特征项集合,从所述目标个人客户对应的第一特征数据集合中获取目标特征数据,组成所述目标个人客户对应的目标特征数据集合;
将所述目标个人客户对应的目标特征数据集合和客户流失情况输入预先建立的个人客户授信模型,得到所述目标个人客户对应的授信值,其中,所述个人客户授信模型以训练个人客户对应的目标特征数据集合和客户流失情况为训练样本,以训练个人客户对应的真实授信值为样本标签训练得到;
其中,获取一个人客户对应的目标特征项集合,包括:
从预先确定的、多个客户类型分别对应的目标特征项集合中,确定该个人客户所属的客户类型所对应的目标特征项集合,作为该个人客户对应的目标特征项集合;
其中,确定所述多个客户类型分别对应的目标特征项集合,包括:
获取多个个人客户分别对应的第二特征数据集合;
根据所述多个个人客户分别对应的第二特征数据集合,对所述多个个人客户进行聚类,获得多个客户类型分别对应的个人客户集合;
获取所述多个客户类型分别对应的个人客户集合中各个人客户分别对应的第一特征数据集合;
对于每个客户类型,根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的目标特征项集合,以得到所述多个客户类型分别对应的目标特征项集合。
2.根据权利要求1所述的确定个人客户授信的方法,其特征在于,建立所述个人客户授信模型的过程包括:
获取训练样本集,其中,所述训练样本集包括多个客户类型分别对应的个人客户集合中各个人客户分别对应的目标特征数据集合和客户流失情况,一个人客户对应的目标特征数据集合和客户流失情况作为一个训练样本;
利用所述训练样本集中的训练样本和训练样本对应的样本标签,分别训练逻辑回归模型、随机森林模型以及XGBoost模型,得到训练后的三个模型;
采用测试样本集测试所述训练后的三个模型的准确度,将准确度最高的模型确定为个人客户授信模型。
3.根据权利要求1或2所述的确定个人客户授信的方法,其特征在于,获取一个人客户对应的客户流失情况,包括:
获取该个人客户对应的交易情况数据,以及,该个人客户和与该个人客户相关的核心企业的特定数据,其中,所述特定数据包括:客户基本信息、客户等级、核心企业信用等级、还款来源评价、核心企业风险情况、核心企业ERP交易数据和客户征信;
根据该个人客户对应的交易情况数据,以及,该个人客户和与该个人客户相关的核心企业的特定数据,获取该个人客户对应的客户流失情况。
4.根据权利要求1所述的确定个人客户授信的方法,其特征在于,获取一个人客户对应的第一特征数据集合,包括:
获取该个人客户对应的特征数据总集;
从该个人客户对应的特征数据总集中,选取预设个与授信相关的特征数据;
根据选取出的预设个特征数据,按预设的特征衍生策略,衍生出新的特征数据;
对选取出的预设个特征数据和衍生出的特征数据进行预处理,将预处理后的特征数据组成该客户对应的第一特征数据集合。
5.根据权利要求4所述的确定个人客户授信的方法,其特征在于,所述对选取出的预设个特征数据和衍生出的特征数据进行预处理,包括:
对选取出的预设个特征数据和衍生出的特征数据进行如下处理中的一种或多种:
缺失值填充、盖帽处理、非稳定特征去除、连续型特征分箱。
6.根据权利要求1所述的确定个人客户授信的方法,其特征在于,所述根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的目标特征项集合,包括:
根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的特征项总集中每个特征项的重要度,其中,该客户类型对应的特征项总集由该客户类型对应的个人客户集合中个人客户
所对应的第一特征数据集合中的特征项组成;
根据该客户类型对应的特征项总集中每个特征项的重要度,从该客户类型对应的特征项总集中选取预设个特征项;
对所述预设个特征项进行聚类,获得多类特征项;
获取每类特征项中的最优特征项,由获得的所有最优特征项组成该客户类型对应的目标特征项集合。
7.一种确定个人客户授信的装置,其特征在于,包括:数据获取模块、目标特征项集合获取模块、目标特征数据集合获取模块、个人授信确定模块和个人客户授信模型构建模块;
所述数据获取模块,用于获取目标个人客户对应的第一特征数据集合和客户流失情况,其中,所述第一特征数据集合包括所述目标个人客户的多个特征数据,每个特征数据包括特征项和该特征项对应的特征值;
所述目标特征项集合获取模块,用于获取所述目标个人客户对应的目标特征项集合;
所述目标特征数据集合获取模块,用于根据所述目标个人客户对应的目标特征项集合,从所述目标个人客户对应的第一特征数据集合中获取目标特征数据,组成所述目标个人客户对应的目标特征数据集合;
所述个人授信确定模块,用于将所述目标个人客户对应的目标特征数据集合和客户流失情况输入预先建立的个人客户授信模型,得到所述目标个人客户对应的授信值,其中,所述个人客户授信模型以训练个人客户对应的目标特征数据集合和客户流失情况为训练样本,以训练个人客户对应的真实授信值为样本标签训练得到;
所述个人客户授信模型构建模块包括:训练样本获取模块、模型训练模块和个人客户授信模型确定模块;
所述训练样本获取模块,用于获取训练样本集,其中,所述训练样本集中包括多个客户类型分别对应的个人客户集合中各个人客户分别对应的目标特征数据集合和客户流失情况,一个人客户对应的目标特征集合和客户流失情况作为一个训练样本;
所述模型训练模块,用于利用所述训练样本集中的训练样本和训练样本对应的样本标签,分别训练逻辑回归模型、随机森林模型以及XGBoost模型,得到训练后的三个模型;
所述个人客户授信模型确定模块,用于采用测试样本集测试所述训练后的三个模型的准确度,将准确度最高的模型确定为个人客户授信模型;
其中,所述训练样本获取模块在获取一个人客户对应的目标特征项集合时,具体用于从预先确定的、多个客户类型分别对应的目标特征项集合中,确定该个人客户所属的客户类型所对应的目标特征项集合,作为该个人客户对应的目标特征项集合;
其中,第二特征数据集合获取模块、个人客户聚类模块、第一特征数据集合获取模块和特征项集合确定模块;
第二特征数据集合获取模块,用于获取多个个人客户分别对应的第二特征数据集合;
个人客户聚类模块,用于根据所述多个个人客户分别对应的第二特征数据集合,对所述多个个人客户进行聚类,获得多个客户类型分别对应的个人客户集合;
第一特征数据集合获取模块,用于获取所述多个客户类型分别对应的个人客户集合中各个人客户分别对应的第一特征数据集合;
特征项集合确定模块,用于对于每个客户类型,根据该客户类型对应的个人客户集合中各个人客户分别对应的第一特征数据集合,确定该客户类型对应的目标特征项集合,以得到所述多个客户类型分别对应的目标特征项集合。
CN202011103531.5A 2020-10-15 2020-10-15 一种确定个人客户授信的方法及装置 Active CN112232945B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011103531.5A CN112232945B (zh) 2020-10-15 2020-10-15 一种确定个人客户授信的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011103531.5A CN112232945B (zh) 2020-10-15 2020-10-15 一种确定个人客户授信的方法及装置

Publications (2)

Publication Number Publication Date
CN112232945A CN112232945A (zh) 2021-01-15
CN112232945B true CN112232945B (zh) 2023-10-13

Family

ID=74117336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011103531.5A Active CN112232945B (zh) 2020-10-15 2020-10-15 一种确定个人客户授信的方法及装置

Country Status (1)

Country Link
CN (1) CN112232945B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723710B (zh) * 2021-09-13 2024-02-27 中国银行股份有限公司 一种客户流失预测方法、系统、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678619A (zh) * 2016-01-07 2016-06-15 中国联合网络通信集团有限公司 贷款额度评估方法及装置
CN110837931A (zh) * 2019-11-08 2020-02-25 中国农业银行股份有限公司 客户流失预测方法、装置及存储介质
CN110866767A (zh) * 2018-08-27 2020-03-06 中国移动通信集团江西有限公司 电信用户满意度的预测方法、装置、设备及介质
CN111524001A (zh) * 2020-04-27 2020-08-11 中国银行股份有限公司 用户授信额度的预测方法、装置和相关设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678619A (zh) * 2016-01-07 2016-06-15 中国联合网络通信集团有限公司 贷款额度评估方法及装置
CN110866767A (zh) * 2018-08-27 2020-03-06 中国移动通信集团江西有限公司 电信用户满意度的预测方法、装置、设备及介质
CN110837931A (zh) * 2019-11-08 2020-02-25 中国农业银行股份有限公司 客户流失预测方法、装置及存储介质
CN111524001A (zh) * 2020-04-27 2020-08-11 中国银行股份有限公司 用户授信额度的预测方法、装置和相关设备

Also Published As

Publication number Publication date
CN112232945A (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
CN110837931B (zh) 客户流失预测方法、装置及存储介质
CN103927675B (zh) 判断用户年龄段的方法及装置
Ahituv A systematic approach toward assessing the value of an information system
CN112464094B (zh) 信息推荐方法、装置、电子设备及存储介质
CN106933956B (zh) 数据挖掘方法和装置
CN106952159B (zh) 一种不动产抵押品风险控制方法、系统及存储介质
CN108388955A (zh) 基于随机森林和逻辑回归的客户服务策略制定方法、装置
CN112559900B (zh) 产品推荐方法、装置、计算机设备和存储介质
CN106228399A (zh) 一种基于大数据的券商客户风险偏好分类方法
CN113656691A (zh) 数据预测方法、装置及存储介质
CN110910207A (zh) 一种提升商品推荐多样性的方法及系统
CN115526652A (zh) 一种基于机器学习的客户流失预警方法及系统
CN111861679A (zh) 一种基于人工智能的商品推荐方法
CN112232945B (zh) 一种确定个人客户授信的方法及装置
CN109767333A (zh) 选基方法、装置、电子设备及计算机可读存储介质
CN112308623A (zh) 基于监督学习的优质客户流失预测方法、装置及存储介质
De Crombrugghe et al. Statistical Demand Functions for Food in the USA and the Netherlands
Han et al. Second-hand car price prediction based on a mixed-weighted regression model
Pavelková et al. Passenger car sales projections: Measuring the accuracy of a sales forecasting model
CN116109357A (zh) 一种汽车在线评论综合评分计算方法、系统及介质
CN114926261A (zh) 汽车金融用户申请欺诈概率预测方法及介质
CN115393098A (zh) 理财产品信息推荐方法及装置
CN113407827A (zh) 基于用户价值分类的信息推荐方法、装置、设备及介质
CN112927092A (zh) 理赔趋势预测方法、装置、设备及存储介质
Krusinskas et al. THE RESEARCH OF RELIABILITY OF BANKRUPTCY PREDICTION MODELS IN LITHUANIAN COMPANIES.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant