CN112598500A

CN112598500A - 一种无额度客户的授信处理方法及系统

Info

Publication number: CN112598500A
Application number: CN202011520720.2A
Authority: CN
Inventors: 雷文烨; 张越; 史博慧; 张瑶; 李腾
Original assignee: China Construction Bank Corp
Current assignee: China Construction Bank Corp
Priority date: 2020-12-21
Filing date: 2020-12-21
Publication date: 2021-04-02

Abstract

本发明公开了一种无额度客户的授信处理方法及系统，该方法包括：获取无额度客户的客户数据；根据所述客户数据，在无额度客户中筛选出达到预设要求的第一客户群；以历史放款且到期后未逾期或逾期在预设范围内的客户数据作为建模样本，将放款额作为目标变量，利用机器学习算法进行拟合训练，建立授信额度测算模型；根据所述第一客户群的客户数据，利用所述授信额度测算模型预测客户的授信额度；设置额度调节系数；利用所述额度调节系数对授信额度进行调整，输出无额度客户的最终授信额度；本发明可以最大限度发掘优质的无额度客户，避免优质潜在客户的流失，同时还能对风险进行有效控制，降低授信额度的不良率。

Description

一种无额度客户的授信处理方法及系统

技术领域

本发明涉及互联网金融技术领域，尤指一种无额度客户的授信处理方法及系统。

背景技术

目前，针对现在小微企业授信难、授信贵的现状，分析其根本问题就是数据鸿沟的广泛存在，金融机构对于沉淀的大量数据无法有效应用并转化为一些有价值的决策依据。因此现有银行审批授信业务一般仅为资质优良的第一梯队客户提供贷款，其缺点在于无法精细化评测风险，只能一刀切地只给头部客户授信。

在现有的业务场景中，存在有资质良好的客户的资金需求不被满足，银行无法在保证低不良率前提下提高业务量。小微企业数据缺失及造假情况较多，更进一步增加授信难度，使得小微企业授信过程失真失准。银行很难比较全面、准确地掌握中小微企业的财务状况、运行情况、风险状况。当一部分小微企业都存在财务数据不齐全、不准确、不真实的现象时，银行也就无法对企业提出合理的授信，无法控制信贷风险，导致原本该被授信的优良企业无法取得授信的问题发生，流失潜在的优质客户。

因此，亟需一种可以克服上述问题，能够客观、合理的对无额度客户进行授信的技术方案。

发明内容

为解决现有技术存在的问题，本发明提出了一种无额度客户的授信处理方法及系统。本发明充分使用客户数据，通过多变量运算和时间维度的衍生将原始数据生成具有业务含义的衍生特征，应用机器学习算法建立无额度客户授信模型，将无额度客户授信模型应用于无额度客户，综合无额度客户的整体数据计算基础授信额度，根据风险系数对额度进行调整作为最终授信额度，实现为优质的无额度客户授信的目的，避免优质潜在客户的流失，同时还能够对风险进行有效的控制，降低收地额度的不良率。

在本发明实施例的第一方面，提出了一种无额度客户的授信处理方法，该方法包括：

获取无额度客户的客户数据；

根据所述客户数据，在无额度客户中筛选出达到预设要求的第一客户群；

以历史放款且到期后未逾期或逾期在预设范围内的客户数据作为建模样本，将放款额作为目标变量，利用机器学习算法进行拟合训练，建立授信额度测算模型；

根据所述第一客户群的客户数据，利用所述授信额度测算模型预测客户的授信额度；

设置额度调节系数；

利用所述额度调节系数对授信额度进行调整，输出无额度客户的最终授信额度。

进一步的，根据所述客户数据，在无额度客户中筛选出达到预设要求的第一客户群，包括：

根据无额度客户的客户资质和数据覆盖度，筛选出客户资质及数据覆盖度达到预设要求的客户。

进一步的，根据无额度客户的客户资质和数据覆盖度，筛选出客户资质及数据覆盖度达到预设要求的客户，包括：

根据无额度客户的客户数据，利用数据输入评分卡模型进行风险评分；

根据所述风险评分对无额度客户进行分档排序，并计算每一档的平均逾期率；

根据所述平均逾期率设置分数线，将所述分数线作为按照客户资质筛选时的分数指标；

设置按照数据覆盖度筛选时的覆盖度指标；

根据所述覆盖度指标，在无额度客户的客户数据选取对应的数据；

根据无额度客户的风险评分及选取的数据，筛选出达到分数指标及覆盖度指标的客户。

进一步的，设置的覆盖度指标至少包括：近一定时间内的客户数据中存在外部税务数据、对公流水或客户贡献度数据。

进一步的，以历史放款且到期后未逾期或逾期在预设范围内的客户数据作为建模样本，将放款额作为目标变量，利用机器学习算法进行拟合训练，建立授信额度测算模型，包括：

对客户数据进行关联、整合及清洗处理，得到有效数据集；

根据所述有效数据集，通过特征衍生形成授信额度模型所需的特征；

对衍生的特征进行多类型筛选；

对筛选后的特征进行预处理，将预处理后的特征作为建模样本。

进一步的，所述有效数据集至少包括：企业主的基础信息、行为信息、信用卡信息、贷款信息及资产信息，企业的基础信息、交易信息、负债信息，及场景相关数据。

进一步的，根据所述有效数据集，通过特征衍生形成授信额度模型所需的特征，包括：

根据所述有效数据集，采用透传、统计聚合及特征交叉进行特征衍生，形成授信额度模型所需的特征。

进一步的，根据所述有效数据集，采用透传、统计聚合及特征交叉进行特征衍生，形成授信额度模型所需的特征，包括：

在采用透传进行特征衍生时，对于数值类型的字段且一个样本只有单一条记录的数据，直接透传为入模特征；若为分类型变量，进行类型合并后透传为入模特征；

在采用统计聚合进行特征衍生时，对于流水数据或明细类型的数据，划分不同的时间窗口并计算每个窗口内的统计变量，衍生出新的特征；对于分类型变量的数据，计算类型的出现次数及出现类型的种类，衍生出新的特征；

在采用特征交叉进行特征衍生时，通过特征之间的多维交叉，通过分类型变量和数值变量的数据进行组合，分不同类别的数值变量进行统计聚合，衍生出新的特征。

进一步的，对衍生的特征进行多类型筛选，包括：

对衍生的特征进行相关性筛选、缺失值筛选、单值率筛选及取值过多情况筛选，得到筛选后的特征。

进一步的，对衍生的特征进行相关性筛选、缺失值筛选、单值率筛选及取值过多情况筛选，得到筛选后的特征，包括：

在进行相关性筛选时，分别将衍生变量与目标变量进行相关性计算，保留相关性大于第一阈值的衍生变量；

在进行缺失值筛选时，计算衍生变量的缺失率，删除缺失率大于第二阈值的衍生变量；

在进行单值率筛选时，计算离散类型的衍生变量的取值情况，删除取值唯一的离散衍生变量；

在进行取值过多情况筛选时，计算离散类型的衍生变量的取值情况，删除取值个数超第三阈值的离散衍生变量。

进一步的，对筛选后的特征进行预处理，将预处理后的特征作为建模样本，包括：

对筛选后的特征进行对数变换、异常值处理及缺失值填充，得到预处理后的特征。

进一步的，对筛选后的特征进行对数变换、异常值处理及缺失值填充，得到预处理后的特征，包括：

在进行对数变换时，根据筛选后的特征，将金额类型的衍生变量进行对数变换处理；

在进行异常值处理时，对出现异常值的衍生变量进行修改；

在进行缺失值填充时，对离散变量的缺失值，利用默认字符串进行填充，对连续变量缺失值，利用0进行填充。

以历史放款且到期后未逾期或逾期天数30天以内的客户数据作为建模样本，将放款额作为目标变量，运用LightGBM算法进行拟合训练，建立授信额度测算模型。

进一步的，该方法还包括：

根据已放款客户的客户数据，设置测试集及外推集；

将建立的授信额度测算模型应用在所述测试集及外推集，计算所述授信额度测算模型的评估指标，得到模型的均方根误差及拟合程度；

根据所述模型的均方根误差及拟合程度对模型进行评估，选取授信额度测算模型。

进一步的，设置额度调节系数，包括：

根据设置的分数线，在分数线以上的分数区间中选取一个分数区间设置基准额度调节系数，根据其它分数区间的逾期率设置相应的额度调节系数。

进一步的，利用所述额度调节系数对授信额度进行调整，输出无额度客户的最终授信额度，包括：

无额度客户的最终授信额度的计算式为：

L＝L1×C；

其中，L为最终授信额度；L1为预测的授信额度；C为额度调节系数。

在本发明实施例的第二方面，提出了一种无额度客户的授信处理系统，该系统包括：

数据获取模块，用于获取无额度客户的客户数据；

客户筛选模块，用于根据所述客户数据，在无额度客户中筛选出达到预设要求的第一客户群；

模型建立模块，用于以历史放款且到期后未逾期或逾期在预设范围内的客户数据作为建模样本，将放款额作为目标变量，利用机器学习算法进行拟合训练，建立授信额度测算模型；

授信额度测算模块，用于根据所述第一客户群的客户数据，利用所述授信额度测算模型预测客户的授信额度；

调节系数设置模块，用于设置额度调节系数；

最终授信额度计算模块，用于利用所述额度调节系数对授信额度进行调整，输出无额度客户的最终授信额度。

在本发明实施例的第三方面，提出了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现无额度客户的授信处理方法。

在本发明实施例的第四方面，提出了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现无额度客户的授信处理方法。

本发明提出的无额度客户的授信处理方法及系统通过获取无额度客户的客户数据；根据所述客户数据，在无额度客户中筛选出达到预设要求的第一客户群；以历史放款且到期后未逾期或逾期在预设范围内的客户数据作为建模样本，将放款额作为目标变量，利用机器学习算法进行拟合训练，建立授信额度测算模型；根据所述第一客户群的客户数据，利用所述授信额度测算模型预测客户的授信额度；设置额度调节系数；利用所述额度调节系数对授信额度进行调整，输出无额度客户的最终授信额度，最大限度发掘优质的无额度客户，避免了优质潜在客户的流失，同时还能对风险进行有效控制，降低授信额度的不良率。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明一实施例的无额度客户的授信处理方法流程示意图。

图2是本发明一具体实施例的授信处理方法流程示意图。

图3是本发明一具体实施例的本发明一具体实施例的分档排序示意图。

图4是本发明一实施例的额度调节系数的设置示意图。

图5是本发明一实施例的无额度客户的授信处理系统架构示意图。

图6是本发明一实施例的计算机设备结构示意图。

具体实施方式

下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明，而并非以任何方式限制本发明的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本发明的实施方式，提出了一种无额度客户的授信处理方法及系统。该方法及系统利用机器学习技术建立无额度客户授信模型，为现有授信模型下的无额度客户计算授信额度，在控制风险的基础上，达到为优质的无额度客户授信的目的。

在本发明实施例中，需要说明的术语有：

信用贷款：借款人无需提供抵押品或者第三方担保，仅凭自身信用程度作为还款保证的贷款。

AUM值：客户贡献度，是衡量客户对银行贡献度的一个标志。AUM包括客户在银行的存款和通过银行购买的各种投资产品等个人金融资产。投资主要包括基金、国债、保险及投资理财产品等。

下面参考本发明的若干代表性实施方式，详细阐释本发明的原理和精神。

图1是本发明一实施例的无额度客户的授信处理方法流程示意图。如图1所示，该方法包括：

步骤S1，获取无额度客户的客户数据；

步骤S2，根据所述客户数据，在无额度客户中筛选出达到预设要求的第一客户群；

步骤S3，以历史放款且到期后未逾期或逾期在预设范围内的客户数据作为建模样本，将放款额作为目标变量，利用机器学习算法进行拟合训练，建立授信额度测算模型；

步骤S4，根据所述第一客户群的客户数据，利用所述授信额度测算模型预测客户的授信额度；

步骤S5，设置额度调节系数；

步骤S6，利用所述额度调节系数对授信额度进行调整，输出无额度客户的最终授信额度。

为了对上述无额度客户的授信处理方法进行更为清楚的解释，下面结合每一步进行详细说明。

参考图2，为本发明一具体实施例的授信处理方法流程示意图。如图2所示，在客户发起贷款申请并授权银行查询客户及其企业相关信息之后，银行系统将判断该笔申请是否符合贷款准入规则。满足所有准入规则条件情况下，系统将测算客户各现有授信方案下可贷金额，每一授信方案将主要运用单一场景下的数据源作为授信依据。如果客户有任一授信方案可贷金额大于0，则继续提交审批并进行签约开户。如果客户所有授信方案测算结果均为0额度，将进入本发明的无额度客户的授信处理流程(虚线框)。

步骤S1，获取无额度客户的客户数据。

步骤S2，客户筛选。

根据无额度客户的客户资质和数据覆盖度，筛选出客户资质及数据覆盖度达到预设要求的客户，该些客户属于优质且适用于使用授信模型的客户。

基于客户资质进行筛选的具体流程为：

根据无额度客户的客户数据，利用数据输入评分卡模型进行风险评分。根据所述风险评分对无额度客户进行分档排序，并计算每一档的平均逾期率。根据所述平均逾期率设置分数线，将所述分数线作为按照客户资质筛选时的分数指标。筛选出客户资质达到分数指标的客户。

客户风险评分是有效的客户风险评价指标。在小微贷款申请流程中，客户发起申请并授权后，系统会调取数据输入评分卡模型对客户进行打分；利用该评分对客户进行分档排序，并根据各分段的历史违约情况，确定后续客户的分数线。

参考图3，为本发明一具体实施例的分档排序示意图。如图3所示，将分数按照50分一档进行划分，其中客户占比为每个分数区间内无额度客户占总体无额度客户比例，客户累计占比为改行分区区间及以下无额度客户占总体无额度客户比例，历史违约情况是同样分数区间的已放款客户的历史逾期情况。

如图3所示，500分以上的客户历史还款表现较好，选择500分以上客户进行后续授信模型额度测算。

基于数据覆盖度进行筛选的具体流程为：

设置按照数据覆盖度筛选时的覆盖度指标；其中，覆盖度指标至少包括：近一定时间内的客户数据中存在外部税务数据、对公流水或客户贡献度数据。根据所述覆盖度指标，在无额度客户的客户数据选取对应的数据。根据选取的数据，筛选出符合覆盖度指标的客户。

在客户数据缺失过多情况下，模型会测算出一个接近于整体平均的额度，不能起到根据客户综合情况准确授信的作用。因此，需要客户至少满足下列三个条件之一：近6个月有外部税务数据，近90天有对公流水，近6个月有AUM；说明客户数据足以让模型做出判断，才进入下一流程。

步骤S3，建立模型。

以历史放款且到期后未逾期或逾期在预设范围内的客户数据作为建模样本，将放款额作为目标变量，利用机器学习算法进行拟合训练，建立授信额度测算模型。

在现有授信方案中，每一方案的授信依据仅来自于一种类型的数据，如，利用客户行内AUM，工资流水，企业缴税情况分别算出一种额度。对于无额度客户，虽然每单一类型数据不足以试算出额度，但通过运用特征工程和机器学习算法，可以深入挖掘还款能力，综合各类型数据进行授信。

对此，本发明在建立模型前，先对特征进行了处理，为建模提供丰富的样本，具体流程为：

步骤S311，对客户数据进行关联、整合及清洗处理，得到有效数据集；

步骤S312，根据所述有效数据集，通过特征衍生形成授信额度模型所需的特征；

步骤S313，对衍生的特征进行多类型筛选；

步骤S314，对筛选后的特征进行预处理，将预处理后的特征作为建模样本。

下面针对步骤S311至步骤S314进行详细说明：

步骤S311：

经客户授权后，可以获取企业及客户本人(企业主)的信息，将相关数据进行关联、整合、清洗后，留下有效的数据集。特征信息主要涵盖的方面如表1所示。

表1特征信息

步骤S312：

根据所述有效数据集，采用透传、统计聚合及特征交叉进行特征衍生，形成授信额度模型所需的特征。其中，

在采用透传进行特征衍生时，对于数据为数值类型的字段且一个样本只有单一条记录的数据，直接透传为入模特征；如，年龄、学历等。

若为分类型变量，若类型过多，可以进行类型合并后透传为入模特征；如，学生专业、公司类型、职业等，然后再透传。

在采用统计聚合进行特征衍生时，对于流水数据或明细类型的数据，划分不同的时间窗口并计算每个窗口内的统计变量，衍生出新的特征；对于分类型变量的数据，计算类型的出现次数及出现类型的种类，衍生出新的特征。

对于流水或这明细类型的数据，如，贷款明细、交易流水、代发工资记录等，每个人都可能有多条不同时间发生的流水记录。对于这类流水特征，通常会划分不同的时间窗口计算各窗口内的统计变量，如，对于数值型字段计算求和、均值、分位数、最小值、最大值、标准差。

通过特征之间的多维交叉并结合上述两种特征衍生方法，可以进一步衍生特征更多特征。可以通过一个分类型变量和一个数值变量组合的方式，分不同类别对数值变量进行统计聚合；如，结合贷款类型和贷款余额两个字段，衍生出车贷余额、房贷余额、消费贷余额等。

步骤S313：

对衍生的特征进行相关性筛选、缺失值筛选、单值率筛选及取值过多情况筛选，得到筛选后的特征。其中，

在进行相关性筛选时，分别将衍生变量与目标变量进行相关性计算，保留相关性大于第一阈值的衍生变量。

在本实施例中，分别对衍生变量中相关度大于0.9的变量集合进行筛选，根据衍生变量与目标变量的相关性高低，保留与目标变量相关性高的一个衍生变量。

如，“行内近5月纳税月份数”和“行内近3月纳税月份数”两个衍生变量的相关系数为0.97，两者与目标变量的相关系数分别为0.226和0.221，则保留“行内近5月纳税月份数”。

在进行缺失值筛选时，计算衍生变量的缺失率，删除缺失率大于第二阈值的衍生变量。

在本实施例中，删除缺失率在80％以上的衍生变量。如，“企业代发工资人数”缺失值为90％，将该特征进行删除。

在进行单值率筛选时，计算离散类型的衍生变量的取值情况，删除取值唯一的离散衍生变量。如，“企业主国籍地区代码”均为中国，对建模无用，将该特征进行删除。

在本实施例中，可以删除取值个数超过50个的离散变量，如，“行业细类”的个数非常多，对于建模并无太大作用，使用“行业大类”即可。

经过上述变量筛选，最后保留446个衍生变量。

步骤S314：

对筛选后的特征进行对数变换、异常值处理及缺失值填充，得到预处理后的特征。其中，

在进行对数变换时，根据筛选后的特征，将金额类型的衍生变量进行对数变换处理。

在本实施例中，对于部分连续变量，尤其是金额类衍生变量，会出现显著授信额度测算模型的右偏差，当随着衍生变量的增加，目标变量的方差也增大。对数变换可以减少右偏差，并确保目标变量的波动相对稳定。

在进行异常值处理时，对出现异常值的衍生变量进行修改。

在本实施例中，部分衍生变量由于原始数据录入和后续操作等问题，会出现异常值，如，企业主年龄小于18岁。可以通过人为修改的方式，将异常值修改为业务规定范围取值。

经过上述处理后，以历史放款且到期后未逾期或逾期天数30天以内的客户数据作为建模样本，将放款额作为目标变量，运用LightGBM算法进行拟合训练，建立授信额度测算模型。

LigthGBM算法是一种机器学习的集合算法，是对GBDT算法的高效实现，GBDT算法的主要思想是利用弱分类器(决策树)迭代训练以得到最优模型，而LigthGBM算法采用损失函数的负梯度作为当前决策树的残差近似值，去拟合新的决策树，该模型具有训练效果好、不易过拟合、速度快等优点。

在本实施例中，模型样本划分可以参考表2所示。

表2模型样本

客户分类	样本集	时间段
			已放款客户	训练集	2018.09.01-2018.11.11
已放款客户	测试集	2018.09.01-2018.11.11
			已放款客户	外推集	2018.11.12-2018.11.30
无额度客户	训练集	2018.09.01-2018.11.30

进一步的，在建立授信额度测算模型之后，可以计算模型的一些指标，对模型进行评估。具体流程为：

步骤S321，根据已放款客户的客户数据，设置测试集及外推集；

步骤S322，将建立的授信额度测算模型应用在所述测试集及外推集，计算所述授信额度测算模型的评估指标，得到模型的均方根误差及拟合程度；

其中，均方根误差(RMSE，Root Mean Squared Error)，用来衡量观测值同真值之间的偏差，反映出测量的精密度。

R2Score(the coefficient of determination)，判断的是预测模型和真实数据的拟合程度。

步骤S323，根据所述模型的均方根误差及拟合程度对模型进行评估，选取授信额度测算模型。

其中，RMSE越小代表模型拟合效果越好，R2Score越大代表模型拟合效果越好。参考表2，可以根据训练集上训练得到的模型应用在测试集和外推集上，根据两个指标确定一个拟合效果好且稳定的模型。

步骤S4，根据所述第一客户群的客户数据，利用所述授信额度测算模型预测客户的授信额度。

步骤S5，设置额度调节系数。

在本实施例中，再次利用基于小微企业客户违约概率的风险评分模型来计算分层系数，对授信额度进一步调整，优化无额度客户的授信模型。

首先，选择一个分数区间设定一个基准的额度调节系数，然后基于各分数区间代表逾期率不同，设定不同的额度调节系数。

参考图4，为本发明一实施例的额度调节系数的设置示意图。如图4所示，选择500分以上的无额度客户进行额度模型测算，假设根据已放款客户情况，该分数区间客户的整体历史逾期率0.6％，600-650分数区间逾期率与之相近，可以认为这部分客户资质接近与整体平均情况，不需要对授信模型的额度结果做调整，对应的调节系数，设定为1(基准的额度调节系数)。对于该分数段以上客户，可以认为优于整体，给予更高的额度，故额度调节系数大于1；反之，该分数段以下客户的额度调节系数小于1。

其中，无额度客户的最终授信额度的计算式为：

L＝L1×C；

本发明提出的无额度客户的授信处理方法在授信对象、数据使用、授信流程、分层系数制定等多方面进行了改进。其中，

在授信对象上，能够为现有授信模型下的无额度客户计算授信额度，拒绝其中风险较高的小微企业，挖掘出有潜力的优质小微企业。在控制风险的前提下，提高贷款收益，尽可能的满足有贷款意愿、且有还款能力的众多小微企业的贷款需求，推动小微企业的发展，促进社会经济的提升，实现进一步的普惠。

在无额度客户的授信处理过程中，除了使用企业的交易流水、税务等数据外，在企业主数据方面还考虑了企业主信用卡、代发工资、行内贷款等数据，在企业数据方面考虑了企业的基本信息、征信数据、工商数据，交易流水数据等，通过多变量运算和时间维度的衍生将原始数据生成具有业务含义的衍生特征，从多个维度对企业进行额度计算，全面灵活运用数据信息，既综合考虑了小微企业及其企业主的数据，又解决了非行内客户缺少行内数据而无法授信的情况。

在授信流程中，利用机器学习模型，使用现有授信模型下，申请贷款有额度的这部分客户的多维度数据及其授信额度，通过先进的LightGBM机器学习技术建立授信模型，应用于现有授信模型下的无额度客户，为有价值的无额度客户通过机器学习模型计算授信额度，提高了授信额度计算的准确度和科学性。

采用基于小微企业客户违约概率的风险模型来优化无额度客户的授信模型。结合准入模型的评分和评分区间坏额度的情况，对客户的风险等级进行划分，制定分层系数，使得额度不良率得以降低。

相较于现有技术，本发明提出的无额度客户的授信处理方法至少存在以下优点：

对于缺少行内数据的小微企业和企业主，利用其场景数据、工商数据或者征信数据，结合多个维度的数据，全面灵活运用数据信息，推算企业的授信金额，以解决缺失行内数据或行内数据不够丰富而授信金额测算不准确的问题。

每个企业的授信金额都经由企业自身数据测算得出，可以基于企业实际情况得到个性化的授信金额，再乘以根据企业自身风险特征得到的风险系数，确保每个小微企业客户都有其量身定制的授信金额测算过程，解决目前信贷流程中客户授信金额“一刀切”，没有针对企业特点进行有效细分的问题。

利用基于小微企业客户违约概率的风险模型来计算分层系数，对授信额度进一步调整，优化无额度客户的授信模型。不同于人工计算，这一做法使得调节系数得以量化计算，脱离主观判断，降低谬误偏差，提高计算效率，有效降低额度不良率。

需要说明的是，尽管在上述实施例及附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

在介绍了本发明示例性实施方式的方法之后，接下来，参考图5对本发明示例性实施方式的无额度客户的授信处理系统进行介绍。

无额度客户的授信处理系统的实施可以参见上述方法的实施，重复之处不再赘述。以下所使用的术语“模块”或者“单元”，可以是实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

基于同一发明构思，本发明还提出了一种无额度客户的授信处理系统，如图5所示，该系统包括：

数据获取模块510，用于获取无额度客户的客户数据；

客户筛选模块520，用于根据所述客户数据，在无额度客户中筛选出达到预设要求的第一客户群；

模型建立模块530，用于以历史放款且到期后未逾期或逾期在预设范围内的客户数据作为建模样本，将放款额作为目标变量，利用机器学习算法进行拟合训练，建立授信额度测算模型；

授信额度测算模块540，用于根据所述第一客户群的客户数据，利用所述授信额度测算模型预测客户的授信额度；

调节系数设置模块550，用于设置额度调节系数；

最终授信额度计算模块560，用于利用所述额度调节系数对授信额度进行调整，输出无额度客户的最终授信额度。

在一实施例中，客户筛选模块520具体用于：根据无额度客户的客户资质和数据覆盖度，筛选出客户资质及数据覆盖度达到预设要求的客户。

其中，客户筛选模块520包括：

风险评分单元，用于根据无额度客户的客户数据，利用数据输入评分卡模型进行风险评分；

分档排序单元，用于根据所述风险评分对无额度客户进行分档排序，并计算每一档的平均逾期率；

分数指标设置单元，用于根据所述平均逾期率设置分数线，将所述分数线作为按照客户资质筛选时的分数指标；

覆盖度指标设置单元，设置按照数据覆盖度筛选时的覆盖度指标；其中，设置的覆盖度指标至少包括：近一定时间内的客户数据中存在外部税务数据、对公流水或客户贡献度数据。

数据选取单元，用于根据所述覆盖度指标，在无额度客户的客户数据选取对应的数据；

客户筛选单元，用于根据无额度客户的风险评分及选取的数据，筛选出达到分数指标及覆盖度指标的客户。

在一实施例中，模型建立模块530包括：

数据处理单元，用于对客户数据进行关联、整合及清洗处理，得到有效数据集；其中，所述有效数据集至少包括：企业主的基础信息、行为信息、信用卡信息、贷款信息及资产信息，企业的基础信息、交易信息、负债信息，及场景相关数据。

特征衍生单元，用于根据所述有效数据集，通过特征衍生形成授信额度模型所需的特征；

筛选单元，用于对衍生的特征进行多类型筛选；

预处理单元，用于对筛选后的特征进行预处理，将预处理后的特征作为建模样本。

在一实施例中，特征衍生单元具体用于：

其中，在采用透传进行特征衍生时，对于数值类型的字段且一个样本只有单一条记录的数据，直接透传为入模特征；若为分类型变量，进行类型合并后透传为入模特征；

在一实施例中，筛选单元具体用于：

其中，在进行相关性筛选时，分别将衍生变量与目标变量进行相关性计算，保留相关性大于第一阈值的衍生变量；

在一实施例中，预处理单元具体用于：

其中，在进行对数变换时，根据筛选后的特征，将金额类型的衍生变量进行对数变换处理；

在进行异常值处理时，对出现异常值的衍生变量进行修改；

进一步的，模型建立模块530具体用于：

在一实施例中，模型建立模块530还包括：

数据集设置单元，用于根据已放款客户的客户数据，设置测试集及外推集；

评估指标计算单元，用于将建立的授信额度测算模型应用在所述测试集及外推集，计算所述授信额度测算模型的评估指标，得到模型的均方根误差及拟合程度；

模型评估单元，用于根据所述模型的均方根误差及拟合程度对模型进行评估，选取授信额度测算模型。

在一实施例中，调节系数设置模块550具体用于：

在一实施例中，最终授信额度计算模块560计算无额度客户的最终授信额度的计算式为：

L＝L1×C；

应当注意，尽管在上文详细描述中提及了无额度客户的授信处理系统的若干模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之，上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。

基于前述发明构思，如图6所示，本发明还提出了一种计算机设备600，包括存储器610、处理器620及存储在存储器610上并可在处理器620上运行的计算机程序630，所述处理器620执行所述计算机程序630时实现前述无额度客户的授信处理方法。

基于前述发明构思，本发明提出了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现前述无额度客户的授信处理方法。

本发明提出的无额度客户的授信处理方法及系统通过获取无额度客户的客户数据；根据所述客户数据，在无额度客户中筛选出达到预设要求的第一客户群；以历史放款且到期后未逾期或逾期在预设范围内的客户数据作为建模样本，将放款额作为目标变量，利用机器学习算法进行拟合训练，建立授信额度测算模型；根据所述第一客户群的客户数据，利用所述授信额度测算模型预测客户的授信额度；设置额度调节系数；利用所述额度调节系数对授信额度进行调整，输出无额度客户的最终授信额度，最大限度发掘优质的无额度客户，避免优质潜在客户的流失，同时还能对风险进行有效控制，降低授信额度的不良率。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种无额度客户的授信处理方法，其特征在于，该方法包括：

获取无额度客户的客户数据；

设置额度调节系数；

2.根据权利要求1所述的无额度客户的授信处理方法，其特征在于，根据所述客户数据，在无额度客户中筛选出达到预设要求的第一客户群，包括：

3.根据权利要求2所述的无额度客户的授信处理方法，其特征在于，根据无额度客户的客户资质和数据覆盖度，筛选出客户资质及数据覆盖度达到预设要求的客户，包括：

设置按照数据覆盖度筛选时的覆盖度指标；

4.根据权利要求3所述的无额度客户的授信处理方法，其特征在于，设置的覆盖度指标至少包括：近一定时间内的客户数据中存在外部税务数据、对公流水或客户贡献度数据。

5.根据权利要求1所述的无额度客户的授信处理方法，其特征在于，以历史放款且到期后未逾期或逾期在预设范围内的客户数据作为建模样本，将放款额作为目标变量，利用机器学习算法进行拟合训练，建立授信额度测算模型，包括：

对客户数据进行关联、整合及清洗处理，得到有效数据集；

对衍生的特征进行多类型筛选；

6.根据权利要求5所述的无额度客户的授信处理方法，其特征在于，所述有效数据集至少包括：企业主的基础信息、行为信息、信用卡信息、贷款信息及资产信息，企业的基础信息、交易信息、负债信息，及场景相关数据。

7.根据权利要求5所述的无额度客户的授信处理方法，其特征在于，根据所述有效数据集，通过特征衍生形成授信额度模型所需的特征，包括：

8.根据权利要求7所述的无额度客户的授信处理方法，其特征在于，根据所述有效数据集，采用透传、统计聚合及特征交叉进行特征衍生，形成授信额度模型所需的特征，包括：

9.根据权利要求5所述的无额度客户的授信处理方法，其特征在于，对衍生的特征进行多类型筛选，包括：

10.根据权利要求9所述的无额度客户的授信处理方法，其特征在于，对衍生的特征进行相关性筛选、缺失值筛选、单值率筛选及取值过多情况筛选，得到筛选后的特征，包括：

11.根据权利要求5所述的无额度客户的授信处理方法，其特征在于，对筛选后的特征进行预处理，将预处理后的特征作为建模样本，包括：

12.根据权利要求11所述的无额度客户的授信处理方法，其特征在于，对筛选后的特征进行对数变换、异常值处理及缺失值填充，得到预处理后的特征，包括：

在进行异常值处理时，对出现异常值的衍生变量进行修改；

13.根据权利要求1所述的无额度客户的授信处理方法，其特征在于，以历史放款且到期后未逾期或逾期在预设范围内的客户数据作为建模样本，将放款额作为目标变量，利用机器学习算法进行拟合训练，建立授信额度测算模型，包括：

14.根据权利要求11所述的无额度客户的授信处理方法，其特征在于，该方法还包括：

根据已放款客户的客户数据，设置测试集及外推集；

15.根据权利要求3所述的无额度客户的授信处理方法，其特征在于，设置额度调节系数，包括：

16.根据权利要求15所述的无额度客户的授信处理方法，其特征在于，利用所述额度调节系数对授信额度进行调整，输出无额度客户的最终授信额度，包括：

无额度客户的最终授信额度的计算式为：

L＝L1×C；

17.一种无额度客户的授信处理系统，其特征在于，该系统包括：

数据获取模块，用于获取无额度客户的客户数据；

调节系数设置模块，用于设置额度调节系数；

18.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至16任一所述方法。

19.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1至16任一所述方法。