CN112508684B - 一种基于联合卷积神经网络的催收风险评级方法及系统 - Google Patents

一种基于联合卷积神经网络的催收风险评级方法及系统 Download PDF

Info

Publication number
CN112508684B
CN112508684B CN202011403995.8A CN202011403995A CN112508684B CN 112508684 B CN112508684 B CN 112508684B CN 202011403995 A CN202011403995 A CN 202011403995A CN 112508684 B CN112508684 B CN 112508684B
Authority
CN
China
Prior art keywords
data
neural network
convolutional neural
data information
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011403995.8A
Other languages
English (en)
Other versions
CN112508684A (zh
Inventor
邹英华
许世伟
彭戈
董希伟
马刚
甘厚勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Citic Bank Corp Ltd
Original Assignee
China Citic Bank Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Citic Bank Corp Ltd filed Critical China Citic Bank Corp Ltd
Priority to CN202011403995.8A priority Critical patent/CN112508684B/zh
Publication of CN112508684A publication Critical patent/CN112508684A/zh
Application granted granted Critical
Publication of CN112508684B publication Critical patent/CN112508684B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于联合卷积神经网络的催收风险评级方法及系统,通过获得第一历史催收数据信息;对第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息;对第一训练样本数据信息进行预处理,获得第一待输入数据,其中,第一待输入数据为尺寸归一化为相同记录数量的数据;按照预设要求,构建卷积神经网络模型;将第一训练样本数据信息输入至卷积神经网络模型中,完成对卷积神经网络模型的训练;将第一待测数据信息输入至训练完成后的卷积神经网络模型中;获得卷积神经网络模型的第一输出结果,第一输出结果为第一行为风险归类结果,达到了降低了催收风险评级成本,提高了催收风险评级准确率的技术效果。

Description

一种基于联合卷积神经网络的催收风险评级方法及系统
技术领域
本发明涉及催收风险评级技术领域,尤其涉及一种基于联合卷积神经网络的催收风险评级方法及系统。
背景技术
目前,很多银行贷款、信用卡等逾期后的催收业务大多交由第三方债务催收公司进行催缴。通过这种金融服务外包的方式催收主要有以下几种形式:电话催收、家访催收、暴力催收和法律催收。通过每笔逾期贷款的逾期天数来决定使用哪种形式的催收方式,并未对逾期还款的客户种类进行区分,从而不能达到精准催收的效果。若能在催收的早期阶段就能对逾期还款的客户进行精细化分类,也就是把将要变为不良客户的高风险客户和可以主动还款的低风险客户区分开来,对前者尽快采取强硬的催收手段,而对后者仅做提醒,不仅提高了催收效率,还能降低催收成本。应用技术手段可以让客户分类的实现更加合理和高效,为国内商业银行优化资源配置、增强个人业务贷后催收管理能力提供借鉴与参考。传统催收对于客户的评级,大多采用人工分析或简单模型的方式。对于人工评级的方法,既耗时耗力,结果又与评级业务员的经验与主观判断强关联,容易造成结果误判;而对于简单模型的方法,如决策树或者逻辑回归等,一般只基于少量指标或客户的最近一条记录进行分析,无法综合客户的全部历史记录,使得模型的泛化能力弱,导致模型对新数据欠佳的分类结果,具有局限性。而卷积神经网络替代了以上特征提取方法,其深层结构使其能够自动提取数据的深度鲁棒信息,利于分类器的训练和最终的目标检测。
但本发明申请人发现现有技术至少存在如下技术问题:
现有技术中的卷积神经网络在提取特征时,未使用到浅层特征信息,会导致网络出现梯度消失的问题,使得网络训练困难。同时普通的卷积网络对不同排序数据的输入,会得到不同的输出结果,会对风险分类结果造成影响。
发明内容
本发明实施例提供了一种基于联合卷积神经网络的催收风险评级方法及系统,解决了现有技术中的卷积神经网络在提取特征时,未使用到浅层特征信息,导致网络出现梯度消失,使得网络训练困难,同时还存在风险分类结果准确度差的技术问题,达到了降低催收风险评级成本,提高催收风险评级准确率,能够提高客户的风险评分精度,可行性和鲁棒性高的技术效果。
鉴于上述问题,提出了本申请实施例以便提供一种基于联合卷积神经网络的催收风险评级方法及系统。
第一方面,本发明提供了一种基于联合卷积神经网络的催收风险评级方法,所述方法包括:步骤1:获得第一历史催收数据信息;步骤2:对所述第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息,其中,所述第一训练样本数据信息为带有风险评级等级标签的数据,所述第一待测数据信息为待评级行为记录数据;步骤3:对所述第一训练样本数据信息进行预处理,获得第一待输入数据,其中,所述第一待输入数据为尺寸归一化为相同记录数量的数据,且所述第一待输入数据为单人历史行为数据Fl0;步骤4:按照预设要求,构建卷积神经网络模型;步骤5:将所述第一训练样本数据信息输入至所述卷积神经网络模型中,采用交叉熵损失函数、反向传播算法对所述卷积神经网络模型参数进行调整之后,将softmax回归作为分类算法,完成对所述卷积神经网络模型的训练;步骤6:将所述第一待测数据信息输入至训练完成后的所述卷积神经网络模型中;步骤7:获得所述卷积神经网络模型的第一输出结果,其中,所述第一输出结果为第一行为风险归类结果。
第二方面,本发明提供了一种基于联合卷积神经网络的催收风险评级系统,所述系统包括:
第一获得单元,所述第一获得单元用于获得第一历史催收数据信息;
第二获得单元,所述第二获得单元用于对所述第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息,其中,所述第一训练样本数据信息为带有风险评级等级标签的数据,所述第一待测数据信息为待评级行为记录数据;
第一执行单元,所述第一执行单元用于对所述第一训练样本数据信息进行预处理,获得第一待输入数据,其中,所述第一待输入数据为尺寸归一化为相同记录数量的数据,其中,所述第一待输入数据为单人历史行为数据Fl0
第一构建单元,所述第一构建单元用于按照预设要求,构建卷积神经网络模型;
第二执行单元,所述第二执行单元用于将所述第一训练样本数据信息输入至所述卷积神经网络模型中,采用交叉熵损失函数、反向传播算法对所述卷积神经网络模型参数进行调整之后,将softmax回归作为分类算法,完成对所述卷积神经网络模型的训练;
第一输入单元,所述第一输入单元用于将所述第一待测数据信息输入至训练完成后的所述卷积神经网络模型中;
第三获得单元,所述第三获得单元用于获得所述卷积神经网络模型的第一输出结果,其中,所述第一输出结果为第一行为风险归类结果。
第三方面,本发明提供了一种基于联合卷积神经网络的催收风险评级系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述第一方面的方法的步骤。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本发明实施例提供的一种基于联合卷积神经网络的催收风险评级方法及系统,通过设计并实现联合卷积层用于局部特征提取,其中,联合卷积层首先联合所有浅层的特征图,将所有数据记录对应的浅层特征向量拼接后,再经过MLP进行特征提取得到该记录的输出特征向量,然后将所有记录的输出特征向量组合得到客户数据的特征图;使用预处理后的客户数据作为样本集训练网络,并将训练后的卷积神经网络处理待测数据,根据卷积神经网络的输出向量判断当前客户的风险评分,从而解决了现有技术中的卷积神经网络在提取特征时,未使用到浅层特征信息,导致网络出现梯度消失,使得网络训练困难,同时还存在风险分类结果准确度差的技术问题,达到了降低了催收风险评级成本,提高了催收风险评级准确率,能够提高客户的风险评分精度,可行性和鲁棒性高的技术效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
图1为本发明实施例中一种基于联合卷积神经网络的催收风险评级方法的流程示意图;
图2为本发明实施例中一种基于联合卷积神经网络的催收风险评级方法的另一流程示意图;
图3为本发明实施例中一种基于联合卷积神经网络的催收风险评级方法的基于联合卷积的深度神经网络示意图;
图4为本发明实施例中一种基于联合卷积神经网络的催收风险评级方法的联合卷积层UConv结构图;
图5为本发明实施例中一种基于联合卷积神经网络的催收风险评级方法的客户单条记录指标示意图;
图6为本发明实施例中一种基于联合卷积神经网络的催收风险评级系统的结构示意图;
图7为本发明实施例中另一种示例性电子设备的结构示意图。
附图标记说明:第一获得单元11,第二获得单元12,第一执行单元13,第一构建单元14,第二执行单元15,第一输入单元16,第三获得单元17,接收器301,处理器302,发送器303,存储器304,总线接口306。
具体实施方式
本发明实施例提供了一种基于联合卷积神经网络的催收风险评级方法及系统,用于解决现有技术中的卷积神经网络在提取特征时,未使用到浅层特征信息,导致网络出现梯度消失,使得网络训练困难,同时还存在风险分类结果准确度差的技术问题,达到了降低催收风险评级成本,提高催收风险评级准确率,能够提高客户的风险评分精度,可行性和鲁棒性高的技术效果。
下面,将参考附图详细的描述根据本申请的示例实施例。显然,所描述的实施例仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
传统催收对于客户的评级,大多采用人工分析或简单模型的方式。对于人工评级的方法,既耗时耗力,结果又与评级业务员的经验与主观判断强关联,容易造成结果误判;而对于简单模型的方法,如决策树或者逻辑回归等,一般只基于少量指标或客户的最近一条记录进行分析,无法综合客户的全部历史记录,使得模型的泛化能力弱,导致模型对新数据欠佳的分类结果,具有局限性。而卷积神经网络替代了以上特征提取方法,其深层结构使其能够自动提取数据的深度鲁棒信息,利于分类器的训练和最终的目标检测。但是,现有技术中的卷积神经网络在提取特征时,未使用到浅层特征信息,会导致网络出现梯度消失的问题,使得网络训练困难。同时普通的卷积网络对不同排序数据的输入,会得到不同的输出结果,会对风险分类结果造成影响。
针对上述技术问题,本发明提供的技术方案总体思路如下:
本申请实施例提供了一种基于联合卷积神经网络的催收风险评级方法,所述方法包括:步骤1:获得第一历史催收数据信息;步骤2:对所述第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息,其中,所述第一训练样本数据信息为带有风险评级等级标签的数据,所述第一待测数据信息为待评级行为记录数据;步骤3:对所述第一训练样本数据信息进行预处理,获得第一待输入数据,其中,所述第一待输入数据为尺寸归一化为相同记录数量的数据,其中,所述第一待输入数据为单人历史行为数据Fl0;步骤4:按照预设要求,构建卷积神经网络模型;步骤5:将所述第一训练样本数据信息输入至所述卷积神经网络模型中,采用交叉熵损失函数、反向传播算法对所述卷积神经网络模型参数进行调整之后,将softmax回归作为分类算法,完成对所述卷积神经网络模型的训练;步骤6:将所述第一待测数据信息输入至训练完成后的所述卷积神经网络模型中;步骤7:获得所述卷积神经网络模型的第一输出结果,其中,所述第一输出结果为第一行为风险归类结果。
在介绍了本申请基本原理后,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
实施例一
图1为本发明实施例中一种基于联合卷积神经网络的催收风险评级方法的流程示意图。如图1、2所示,本发明实施例提供了一种基于联合卷积神经网络的催收风险评级方法,所述方法包括:
步骤100:获得第一历史催收数据信息;
步骤200:对所述第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息,其中,所述第一训练样本数据信息为带有风险评级等级标签的数据,所述第一待测数据信息为待评级行为记录数据;
具体而言,第一历史催收数据信息即为本实施例中的相关样本数据信息,在得到第一历史催收数据信息之后,需要按照需求对第一历史催收数据信息进行相应的样本划分,进而得到第一训练样本数据信息与第一待测数据信息,其中,第一训练样本数据信息为带有风险评级等级标签的数据,第一待测数据信息为待评级行为记录数据。换句话说,也就是将历史催收信息数据集中的样本划分为训练集与待测集,达到便于后续对所有训练集样本进行均匀升或降采样,实现尺寸归一化为相同记录数量的n×d大小的待输入数据的目的。
步骤300:对所述第一训练样本数据信息进行预处理,获得第一待输入数据,其中,所述第一待输入数据为尺寸归一化为相同记录数量的数据,其中,所述第一待输入数据为单人历史行为数据Fl0
进一步的,为了达到对训练数据进行预处理,并获得第一待输入数据的效果,本申请实施例步骤300还包括:
步骤310:获得现存行为数据信息;
步骤320:根据所述现存行为数据信息,确定所有客户记录数量的中位数,并根据所述所有客户记录数量的中位数,获得输入的单个客户数据的条数n;
步骤330:分别判断所述所有客户的客户数据的条数是否满足n条记录;
步骤340:如果所述客户数据的条数少于所述n条记录,则从所述现存行为数据信息中按照随机抽样的方式,复制并扩充为n×d大小的客户数据,其中,d为每条历史记录的维度;
步骤350:如果所述客户数据的条数多于所述n条记录,则从所述现存行为数据信息中按照时间降采样为n×d大小的客户数据。
具体而言,本实施例中的基于联合卷积神经网络的催收风险评级方法包含训练阶段和测试阶段,训练阶段具体包括:首先,需要对第一训练样本数据信息进行预处理,使得训练数据归一化为相同记录数量的n×d大小的待输入数据Fl0,进一步的,对于训练时输入的客户信息,也可以是人造的数据,或者是其历史征信数据记录,本实施例中不做具体限制。具体的方法为:首先,需要根据现存行为数据,确定所有单个客户记录数量的中位数,作为用于输入的单个客户数据的条数n。对少于n条记录的客户数据,随机抽样选取现存数据,复制并扩充为n×d大小的客户数据。对多于n条记录的客户数据,按时间选取最新的n条记录,降采样为n×d大小的客户数据。
步骤400:按照预设要求,构建卷积神经网络模型;
进一步的,为了达到对输入数据Fl0进行局部特征提取得到最终的局部特征图Fl的效果,本申请实施例步骤400还包括:
步骤410:获得所述卷积神经网络模型的基础信息,其中,所述卷积神经网络模型的包括10层,具体包括:四个联合卷积层、其中,所述四个联合卷积层分别为第一联合卷积层u_conv1,第二联合卷积层u_conv2,第三联合卷积层u_conv3,第四联合卷积层u_conv4,全局特征提取的MLP层m_1、最大池化Max Pooing层和一个由三层的MLP与一个softmax回归层组成的分类器,其中,所述卷积神经网络模型的输入数据为大小为n×d的单人历史行为记录数据Fl0
步骤420:根据所述基础信息,将所述单人历史行为记录数据Fl0依次通过所述第一联合卷积层u_conv1输出大小为n×64的特征图Fl1、通过所述第二联合卷积层u_conv2得到大小为n×64的特征图Fl2、通过所述第三联合卷积层u_conv3得到大小为n×64特征图Fl3、通过所述第四联合卷积层u_conv4得到大小为n×128的特征图Fl4
步骤430:将所述Fl0、所述Fl1、所述Fl2、所述Fl3、所述Fl4进行拼接,获得大小为n×323的局部特征图Fl
步骤440:将所述Fl输入至所述全局特征提取的MLP层m_1中,获得大小为n×1024的全局特征图FG
步骤450:将所述FG输入所述最大池化Max Pooing层中,获得大小为1×1024的全局特征向量VG
步骤460:将所述VG输入所述分类器中,其中,所述分类器中三层的MLP的第一层包括512个1×1的卷积核、第二层包括256个1×1的卷积核、第三层包括s个1×1的卷积核,其中,s为样本中风险等级数目;
步骤470:将所述分类器的输出结果输入至所述softmax回归层中,获得大小为1×s的输出向量。
具体而言,在构建本实施例中的联合卷积神经网络模型时,本实施例中以网络为10层作为优选,即网络共包括10层,具体为:四个联合卷积层UConv:u_conv1,u_conv2,u_conv3,u_conv4、一个全局特征提取的MLP层m_1、一个最大池化Max Pooing层和一个由三层的MLP与一个softmax回归层组成的分类器,其中,网络的输入为大小为n×d的单人历史行为记录数据Fl0
进一步的,如前所述,本实施例中的基于联合卷积神经网络的催收风险评级方法包含训练阶段和测试阶段,对训练数据进行预处理之后,需要进行局部特征提取,即对输入数据Fl0进行局部特征提取得到最终的局部特征图Fl,同时使用联合卷积层UConv进行局部特征提取。其中,卷积神经网络工作过程具体为:如图3所示,网络堆叠了四个联合卷积层u_conv1、u_conv2、u_cov3、u_cov4的作用为进行局部特征提取:经过u_conv1层输出大小为n×64的特征图Fl1;经过u_conv2层输出大小为n×64的特征图Fl2;经过u_conv3层输出大小为n×64特征图Fl3;经过u_conv4层输出大小为n×128的特征图Fl4;最后,将Fl0、Fl1、Fl2、Fl3、Fl4进行拼接,即得到了大小为n×323的局部特征图Fl
在得到局部特征图Fl后,为了得到网络输出,具体步骤如下:首先,将Fl输入到全局特征提取的MLP层m_1中,得到了大小为n×1024的全局特征图FG;接着,将FG输入最大池化层中,得到大小为1×1024的全局特征向量VG;进一步的,将提取到的全局特征向量VG作为分类器的输入,即就是将VG输入分类器;分类器由3层MLP和一个softmax回归层组成,3层MLP分别有256个1×1的卷积核、128个1×1的卷积核,s个1×1的卷积核,s为样本中的客户催收风险级别的标签类别数;最后输入softmax回归层得到大小为1×s的输出向量,输出向量值之和为1,每个值为输入样本属于对应标签的预测概率。选取概率值最大的标签作为预测风险评级结果。
进一步的,为了进一步达到对输入数据Fl0进行局部特征提取得到最终的局部特征图Fl,并获得模型的输出结果的效果,本申请实施例步骤400还包括:
步骤480:根据第L+1层(L∈{0,1,2,3})联合卷积层u_conv(L+1),将所有浅层Fl0,...,FlL中每条记录i的特征向量(xi0,...,xiL)进行拼接之后,经过组合后输入组成所述联合卷积层的单层MLP中,进行特征提取,获得记录i的特征向量xi(L+1)
其中,所述xi(L+1)的计算公式为:
x=hΘ(cat(xi0,...,xiL)) (1);
其中,下标0,1,2,…,L为所述联合卷积层u_conv(L+1)前的所有特征提取层的输出特征图,下标0为输入Fl0,xiL为记录i在FlL中的特征向量,cat(*)函数将所有模块层的对应记录i的特征向量进行拼接,hΘ(*)为卷积核大小为1×1的MLP运算;
步骤490:将所有记录的特征向量xi(L+1)组合输出特征图Fl(L+1),其中,第L+1层联合卷积层u_conv(L+1)的输出特征图Fl(L+1)计算公式具体为:
Fl(L+1)=(x1(L+1),x2(L+1),...,xn(L+1)) (2)。
具体而言,在得到输入数据Fl0之后,需要对输入数据Fl0进行局部特征提取并得到最终的局部特征图Fl,其中,本实施例中使用联合卷积层UConv进行局部特征提取。联合卷基层UConv层由浅层特征拼接步骤和一个单层的MLP组成,相比与一般的卷积网络,增加了特征拼接步骤组成了联合特征。使用联合特征的优点在于,联合浅层特征进行特征提取,可以很大程度上避免网络训练时因网络梯度消失,而导致训练困难的问题。同时在高层特征空间联合浅层特征,能够让网络利用更多的浅层的细粒度特征信息,使得网络的泛化性更强,分类性能更强。
联合卷积层的结构如图4所示,联合卷积层是由特征拼接步骤、一个特征提取的单层MLP组成,具体为:对于第L+1层联合卷积层u_conv(L+1),L的范围是{0,1,2,3},u_conv(L+1)的工作过程为:将第L+1层前所有浅层Fl0,...,FlL中第i条记录的特征向量(xi0,...,xiL)进行拼接,再组合后输入MLP进行特征提取输出记录i的特征向量xi(L+1);因此xi(L+1)计算如下:
x=hΘ(cat(xi0,...,xiL)) (1);
下标0,1,2,…,L为联合卷积层u_conv(L+1)前的所有特征提取层的输出特征图,下标0代表输入数据Fl0。xiL表示记录i在FlL中的特征向量,即FlL中第i行。cat(*)函数将之前所有模块层的对应记录i的特征向量进行拼接。hΘ(*)代表卷积核大小为1×1的MLP运算。最后输出记录i的特征向量xi(L+1)
最终所有记录的特征向量xi(L+1)组合输出特征图Fl(L+1)。因此第L+1层联合卷积层u_conv(L+1)的输出特征图Fl(L+1)计算公式如下:
Fl(L+1)=(x1(L+1),x2(L+1),...,xn(L+1)) (2);
其中,Fl(L+1)中第i条记录的特征向量xi(L+1)计算如下:
xi(L+1)=hΘ(cat(xi0,...,xiL)) (3);
下标0,1,2,…,L为联合卷积层u_conv(L+1)前的所有联合卷积层的输出特征图,下标0代表输入数据Fl0;xiL表示记录i在FlL中的特征向量,即FlL中第i行;cat(*)函数将之前所模块层的对应记录i的特征向量进行拼接,hΘ(*)代表卷积核大小为1×1的MLP运算,最后输出记录i的特征向量xi(L+1),将所有记录的特征向量组合输出特征图Fl(L+1)
步骤500:将所述第一训练样本数据信息输入至所述卷积神经网络模型中,采用交叉熵损失函数、反向传播算法对所述卷积神经网络模型参数进行调整之后,将softmax回归作为分类算法,完成对所述卷积神经网络模型的训练;
进一步的,为了达到对卷积神经网络模型进行准确训练的效果,本申请实施例步骤500还包括:
步骤510:获得初始化数据信息;
步骤520:根据所述初始化数据信息,对所述卷积神经网络模型进行初始化;
步骤530:将所述第一训练样本数据信息输入至所述初始化后的卷积神经网络模型中之后,获得输出为1×s的当前预测分类结果,其中,所述当前预测分类结果与当前预测标签结果
Figure BDA0002818040430000131
一一对应;
步骤530:将所述当前预测标签结果
Figure BDA0002818040430000132
与实际标签结果y进行计算之后,获得所述交叉熵损失函数;
其中,所述交叉熵损失函数具体为:
Figure BDA0002818040430000133
步骤540:在训练时最小化所述交叉熵损失函数,通过所述反向传播算法调整所述卷积神经网络模型参数,以使得所述卷积神经网络模型达到收敛状态。
具体而言,在对构建的深度神经网络进行训练时,需要:将训练样本集中的样本输入CNN网络,使用交叉熵损失函数,结合反向传播算法调整CNN参数,利用softmax回归作为分类算法,完成CNN的训练;其中,卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。卷积神经网络具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类,因此也被称为“平移不变人工神经网络”。
进一步的,对卷积神经网络模型进行训练的过程具体为:首先,需要对网络进行初始化,即采用一些不同的小随机数初始化网络中待训练参数;接着,向初始化后的网络中输入训练样本与标签来训练网络,并得到输出为1×s的当前预测分类结果;其中,训练样本包括:输入单人历史行为数据和理想输出向量,当单人历史行为数据输入深度网络中后经过逐层变换,最后传送到最后一层输出层,得到实际输出的当前1×s的预测分类结果;然后,在一般的交叉熵损失函数中增加一项基于类特征相似约束项作为新的损失函数,结合反向传播算法调整网络参数,利用softmax回归作为分类算法,完成网络的训练,具体为:
训练中使用交叉熵损失函数,即通过将输出的当前预测标签结果
Figure BDA0002818040430000141
与真实标签结果y计算得到交叉熵损失函数,如下:
Figure BDA0002818040430000142
换句话说,也就是在在训练时对网络进行初始化后,通过最小化损失函数,使用反向传播算法调整网络参数,最终将网络训练收敛。因此,通过构建了一个深度网络模型对客户进行自动化风险评级,相比于简单模型的方法,可以使用客户的全部历史记录进行分类学习,使得模型对数据分类性能好;同时使用联合卷积层进行特征提取,加速了网络训练,也更不容易产生过拟合的问题。
步骤600:将所述第一待测数据信息输入至训练完成后的所述卷积神经网络模型中;
步骤700:获得所述卷积神经网络模型的第一输出结果,其中,所述第一输出结果为第一行为风险归类结果。
进一步的,为了达到对获得准确的风险评级结果,提高催收风险评级准确率,能够提高客户的风险评分精度,可行性和鲁棒性高的效果,本申请实施例步骤700还包括:
步骤710:对所述第一待测数据信息进行升或降采样,获得尺寸归一化为相同记录数量的n×d的个人历史行为数据;
步骤720:保持网络中所有的参数一致,将所述第一待测数据信息输入至所述卷积神经网络模型中,获得大小为1×s的输出结果;
步骤730:根据所述大小为1×s的输出结果,获得第一行为风险归类结果,其中,所述第一行为风险归类结果为所述大小为1×s的输出结果中的最大值。
具体而言,当卷积神经网络模型训练完成之后,需要将第一待测数据信息输入至卷积神经网络模型中,也就是将待评级行为记录数据输入网络得到评级结果。在测试阶段主要是对待测数据进行风险评级,测试阶段具体步骤如下:首先,对所有待测集样本进行升或降采样,实现尺寸归一化为相同记录数量的的n×d的个人历史行为数据;接着,保持网络中所有的参数不变,将测试样本由网络输入,得到大小为1×s的输出,选择最大值对应的风险类别标签作为当前行为人的风险类别,即得到当前行为人的行为风险归类结果;
因此,本实施例中的基于联合卷积神经网络的催收风险评级方法包含训练阶段和测试阶段,使用训练集训练网络,训练完成后保存网络参数,之后使用网络对测试数据进行分类,验证网络的分类性能。在训练时首先将预处理尺寸归一化后的训练样本,即单人历史行为数据输入网络,经过多层的局部特征提取层得到最终的局部特征图;将局部特征图输入全局特征提取的层m_1中得到全局特征图;对全局特征图使用最大池化得到全局特征向量;将全局特征向量输入分类器训练网络。在测试验证阶段,将催收待评级数据输入训练好的网络,根据输出向量得到预测的催收评级结果,将预测结果与实际风险评级进行比对验证模型的有效性。即,通过构建带有风险评级等级标签的数据集作为样本集对网络进行训练,最后将待评级历史行为数据输入训练后的网络,根据网络的输出向量得到客户风险评级结果。从而解决了现有技术中对于客户的风险分类大多基于人工识别或简单模型的方法,通过本实施例中基于深度网络模型的方法,可以提供一个客观且鲁棒的自动化分类方法,相比于人工识别的方法,降低了人工分类成本,且可以提供一个客观的分类结果;相比于简单模型的方法,既可以应用于不同记录数量的所有客户,同时该模型更加健壮,分类准确率更高,同时在得到新的数据后,可以使用更多的数据可以更好地扩展修复,进一步达到了降低了风险评级的成本,提高了风险评级的准确率和客观性,具有较好的可行性和鲁棒性。
进一步的,为了达到对模型优化的效果,本申请实施例步骤700还包括:
步骤740:获得第一优化指令;
步骤750:根据所述第一优化指令,将所述大小为1×s的输出结果,输入至所述卷积神经网络模型;
步骤750:重复进行所述步骤5,对所述卷积神经网络模型进行优化。
具体而言,当得到新的带有风险等级标注的数据后,相应的生成第一优化指令,根据第一优化指令可以将新的带有风险等级标注的数据输入网络,重复训练步骤,对网络进行优化。即就是在获取并得到新的训练数据后,使用新数据持续训练网络。具体的:当得到了新的训练数据后,可以将数据少量多次的输入网络进行训练,保证网络模型评级分类规则不会发生突变。
进一步的,为了使用系统中的存量数据,对网络进行训练,使得网络能够用于新客户数据的自动风险评级分类,本实施例中以下述方法为例进行阐述:
首先,对催收客户存量历史数据进行预处理:具体的:首先,需要获取系统中的6000条用户数据,每个客户的历史数据,确定每条记录的维度,如图5所示。从3个一级指标,12个二级指标进行量化。因此单个客户的每条历史记录的维度为1×12大小。统计历史数据中每个客户的记录数量的中位数为10条,因此确定网络的输入为10×12的客户历史数据。按照训练与测试样本数据5:1的比例进行划分,最终选取5000个10×12的客户数据作为训练数据,1000个10×12的客户数据作为测试数据;进一步的,由于每个客户历史记录数量不同,因此需要对每个客户数据进行归一化到相同的10×12的大小。具体为:对少于10条记录的客户数据,随机抽样选取现存数据,复制并扩充为10×12大小的网络输入数据;对多于10条记录的客户数据,按时间选取最新的10条记录,降采样为10×12大小的网络输入数据;进一步的,训练测试数据的标签采用5级分类风险级别标准,以1至5分来表示风险的高低,分值越大表示客户风险越高,每个客户对应的风险级别标签由业务专家根据客户的历史数据进行评价确定。
接着,需要进行深度神经网络的设计,具体为:对一般的卷积神经网络中的卷积层进行改进,将其替换为联合卷积层UConv:u_conv1,u_conv2,u_conv 3,u_conv 4。具体为:首先调用python的tf.concat函数将所有浅层特征图(包含原始输入记录数据)进行拼接,然后输入单层的MLP层进行特征提取。最终构建后的网络包括10个层:四个局部特征提取层u_conv1,u_conv2,u_conv3,u_conv4、一个全局特征提取的MLP层m_1、一个最大池化层和一个由三个MLP层与一个softmax回归层组成的多类别分类器,输入是大小为10×12的客户历史数据。为了得到用于客户风险分类的全局特征向量,经过网络层包含以下步骤:首先,经过conv_1层输出大小为10×64的特征图Fl1,经过u_conv2层得到得到大小为10×64的特征图Fl2,经过u_conv3层得到大小为10×64特征图Fl3,经过u_conv4层得到大小为10×128的特征图Fl4,至此网络的局部特征提取工作结束;接着,将Fl0、Fl1、Fl2、Fl3、Fl4使用python的concat函数进行拼接,即得到了大小为10×323的局部特征图Fl,将Fl输入到全局特征提取的层m_1中得到了大小为10×1024的全局特征图FG;然后,将FG输入最大池化层中,最大池化层按列取最大值,得到大小为1×1024的全局特征向量VG;进一步的,将VG输入分类器。分类器由4层MLP和一个softmax回归层组成,4层MLP分别由256个1×1的卷积核、256个1×1的卷积核、128个1×1的卷积核,5个1×1的卷积核的卷积神经网络组成。最后输入softmax回归层得到大小为1×5的输出。
进一步的,需要训练构建的深度神经网络:将训练样本集中的客户记录样本数据输入,使用交叉熵损失函数,结合反向传播算法调整网络参数,利用softmax回归作为分类算法,完成网络的训练,具体步骤如下:首先,对网络进行初始化:用一些不同的小随机数初始化网络中待训练参数;接着,向初始化后的网络中输入训练样本与其对应的大小1×5的标签,来训练网络并得到实时输出的1×5的当前预测分类结果。训练样本包括:输入客户数据和理想输出向量,当客户数据输入深度网络中后经过逐层变换,最后传送到最后一层输出层,得到实际输出的1×5的当前预测分类结果,其中的每个维度值代表输入数据预测为每个风险等级的概率,选择其中最大的概率值对应的标签项作为预测结果。进一步的,使用交叉熵损失函数作为训练时的损失函数,结合反向传播算法调整网络参数,利用softmax回归作为分类算法,完成网络的训练。
最后,对待测客户数据进行风险评级分类,具体步骤如下:如前所述,对每个待测客户数据进行均匀升降采样为大小10×12的客户历史行为数据。保持网络中所有的参数不变,将待测数据由网络输入,得到大小为1×5的输出,选择其中最大值对应的标签类别,作为最终的客户风险等级结果。
实施例二
基于与前述实施例中一种基于联合卷积神经网络的催收风险评级方法同样的发明构思,本发明还提供一种基于联合卷积神经网络的催收风险评级系统,如图6所示,所述系统包括:
第一获得单元11,所述第一获得单元11用于获得第一历史催收数据信息;
第二获得单元12,所述第二获得单元12用于对所述第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息,其中,所述第一训练样本数据信息为带有风险评级等级标签的数据,所述第一待测数据信息为待评级行为记录数据;
第一执行单元13,所述第一执行单元13用于对所述第一训练样本数据信息进行预处理,获得第一待输入数据,其中,所述第一待输入数据为尺寸归一化为相同记录数量的数据,其中,所述第一待输入数据为单人历史行为数据Fl0
第一构建单元14,所述第一构建单元14用于按照预设要求,构建卷积神经网络模型;
第二执行单元15,所述第二执行单元15用于将所述第一训练样本数据信息输入至所述卷积神经网络模型中,采用交叉熵损失函数、反向传播算法对所述卷积神经网络模型参数进行调整之后,将softmax回归作为分类算法,完成对所述卷积神经网络模型的训练;
第一输入单元16,所述第一输入单元16用于将所述第一待测数据信息输入至训练完成后的所述卷积神经网络模型中;
第三获得单元17,所述第三获得单元17用于获得所述卷积神经网络模型的第一输出结果,其中,所述第一输出结果为第一行为风险归类结果。
进一步的,所述系统还包括:
第四获得单元,所述第四获得单元用于获得现存行为数据信息;
第三执行单元,所述第三执行单元用于根据所述现存行为数据信息,确定所有客户记录数量的中位数,并根据所述所有客户记录数量的中位数,获得输入的单个客户数据的条数n;
第一判断单元,所述第一判断单元用于分别判断所述所有客户的客户数据的条数是否满足n条记录;
第四执行单元,所述第四执行单元用于如果所述客户数据的条数少于所述n条记录,则从所述现存行为数据信息中按照随机抽样的方式,复制并扩充为n×d大小的客户数据,其中,d为每条历史记录的维度;
第五执行单元,所述第五执行单元用于如果所述客户数据的条数多于所述n条记录,则从所述现存行为数据信息中按照时间降采样为n×d大小的客户数据。
进一步的,所述系统还包括:
第五获得单元,所述第五获得单元用于获得所述卷积神经网络模型的基础信息,其中,所述卷积神经网络模型的包括10层,具体包括:四个联合卷积层、其中,所述四个联合卷积层分别为第一联合卷积层u_conv1,第二联合卷积层u_conv2,第三联合卷积层u_conv3,第四联合卷积层u_conv4,全局特征提取的MLP层m_1、最大池化Max Pooing层和一个由三层的MLP与一个softmax回归层组成的分类器,其中,所述卷积神经网络模型的输入数据为大小为n×d的单人历史行为记录数据Fl0
第一输出单元,所述第一输出单元用于根据所述基础信息,将所述单人历史行为记录数据Fl0依次通过所述第一联合卷积层u_conv1输出大小为n×64的特征图Fl1、通过所述第二联合卷积层u_conv2得到大小为n×64的特征图Fl2、通过所述第三联合卷积层u_conv3得到大小为n×64特征图Fl3、通过所述第四联合卷积层u_conv4得到大小为n×128的特征图Fl4
第六获得单元,所述第六获得单元用于将所述Fl0、所述Fl1、所述Fl2、所述Fl3、所述Fl4进行拼接,获得大小为n×323的局部特征图Fl
第七获得单元,所述第七获得单元用于将所述Fl输入至所述全局特征提取的MLP层m_1中,获得大小为n×1024的全局特征图FG
第八获得单元,所述第八获得单元用于将所述FG输入所述最大池化Max Pooing层中,获得大小为1×1024的全局特征向量VG
第一输入单元,所述第一输入单元用于将所述VG输入所述分类器中,其中,所述分类器中三层的MLP的第一层包括512个1×1的卷积核、第二层包括256个1×1的卷积核、第三层包括s个1×1的卷积核,其中,s为样本中风险等级数目;
第二输入单元,所述第二输入单元用于将所述分类器的输出结果输入至所述softmax回归层中,获得大小为1×s的输出向量。
进一步的,所述系统还包括:
第六执行单元,所述第六执行单元用于根据第L+1层(L∈{0,1,2,3})联合卷积层u_conv(L+1),将所有浅层Fl0,...,FlL中每条记录i的特征向量(xi0,...,xiL)进行拼接之后,经过组合后输入组成所述联合卷积层的单层MLP中,进行特征提取,获得记录i的特征向量xi(L+1)
其中,所述xi(L+1)的计算公式为:
x=hΘ(cat(xi0,...,xiL)) (1);
其中,下标0,1,2,…,L为所述联合卷积层u_conv(L+1)前的所有特征提取层的输出特征图,下标0为输入Fl0,xiL为记录i在FlL中的特征向量,cat(*)函数将所有模块层的对应记录i的特征向量进行拼接,hΘ(*)为卷积核大小为1×1的MLP运算;
第二输出单元,所述第二输出单元用于将所有记录的特征向量xi(L+1)组合输出特征图Fl(L+1),其中,第L+1层联合卷积层u_conv(L+1)的输出特征图Fl(L+1)计算公式具体为:
Fl(L+1)=(x1(L+1),x2(L+1),...,xn(L+1)) (2)。
进一步的,所述系统还包括:
第九获得单元,所述第九获得单元用于获得初始化数据信息;
第七执行单元,所述第七执行单元用于根据所述初始化数据信息,对所述卷积神经网络模型进行初始化;
第十获得单元,所述第十获得单元用于将所述第一训练样本数据信息输入至所述初始化后的卷积神经网络模型中之后,获得输出为1×s的当前预测分类结果,其中,所述当前预测分类结果与当前预测标签结果
Figure BDA0002818040430000231
一一对应;
第十一获得单元,所述第十一获得单元用于将当前预测标签结果
Figure BDA0002818040430000232
与实际标签结果y进行计算之后,获得所述交叉熵损失函数,其中,所述交叉熵损失函数具体为:
Figure BDA0002818040430000233
第八执行单元,所述第八执行单元用于在训练时最小化所述交叉熵损失函数,通过所述反向传播算法调整所述卷积神经网络模型参数,以使得所述卷积神经网络模型达到收敛状态。
进一步的,所述系统还包括:
第十二获得单元,所述第十二获得单元用于对所述第一待测数据信息进行升或降采样,获得尺寸归一化为相同记录数量的n×d的个人历史行为数据;
第十三获得单元,所述第十三获得单元用于保持网络中所有的参数一致,将所述第一待测数据信息输入至所述卷积神经网络模型中,获得大小为1×s的输出结果;
第十四获得单元,所述第十四获得单元用于根据所述大小为1×s的输出结果,获得第一行为风险归类结果,其中,所述第一行为风险归类结果为所述大小为1×s的输出结果中的最大值。
进一步的,所述系统还包括:
第十五获得单元,所述第十五获得单元用于获得第一优化指令;
第三输入单元,所述第三输入单元用于根据所述第一优化指令,将所述大小为1×s的输出结果,输入至所述卷积神经网络模型;
第一优化单元,所述第一优化单元用于重复进行所述步骤5,对所述卷积神经网络模型进行优化。
前述图1实施例一中的一种基于联合卷积神经网络的催收风险评级方法的各种变化方式和具体实例同样适用于本实施例的一种基于联合卷积神经网络的催收风险评级系统,通过前述对一种基于联合卷积神经网络的催收风险评级方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种基于联合卷积神经网络的催收风险评级系统的实施方法,所以为了说明书的简洁,在此不再详述。
实施例三
基于与前述实施例中一种基于联合卷积神经网络的催收风险评级方法同样的发明构思,本发明还提供一种示例性电子设备,如图7所示,包括存储器304、处理器302及存储在存储器304上并可在处理器302上运行的计算机程序,所述处理器302执行所述程序时实现前文所述一种基于联合卷积神经网络的催收风险评级方法的任一方法的步骤。
其中,在图7中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口306在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器302负责管理总线300和通常的处理,而存储器304可以被用于存储处理器302在执行操作时所使用的数据。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本发明实施例提供的一种基于联合卷积神经网络的催收风险评级方法及系统,通过步骤1:获得第一历史催收数据信息;步骤2:对所述第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息,其中,所述第一训练样本数据信息为带有风险评级等级标签的数据,所述第一待测数据信息为待评级行为记录数据;步骤3:对所述第一训练样本数据信息进行预处理,获得第一待输入数据,其中,所述第一待输入数据为尺寸归一化为相同记录数量的数据,其中,所述第一待输入数据为单人历史行为数据Fl0;步骤4:按照预设要求,构建卷积神经网络模型;步骤5:将所述第一训练样本数据信息输入至所述卷积神经网络模型中,采用交叉熵损失函数、反向传播算法对所述卷积神经网络模型参数进行调整之后,将softmax回归作为分类算法,完成对所述卷积神经网络模型的训练;步骤6:将所述第一待测数据信息输入至训练完成后的所述卷积神经网络模型中;步骤7:获得所述卷积神经网络模型的第一输出结果,其中,所述第一输出结果为第一行为风险归类结果,从而解决了现有技术中的卷积神经网络在提取特征时,未使用到浅层特征信息,导致网络出现梯度消失,使得网络训练困难,同时还存在风险分类结果准确度差的技术问题,达到了降低了催收风险评级成本,提高了催收风险评级准确率,能够提高客户的风险评分精度,可行性和鲁棒性高的技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种基于联合卷积神经网络的催收风险评级方法,其中,所述方法包括:
步骤1:获得第一历史催收数据信息;
步骤2:对所述第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息,其中,所述第一训练样本数据信息为带有风险评级等级标签的数据,所述第一待测数据信息为待评级行为记录数据;
步骤3:对所述第一训练样本数据信息进行预处理,获得第一待输入数据,其中,所述第一待输入数据为尺寸归一化为相同记录数量的数据,且所述第一待输入数据为单人历史行为数据Fl0
步骤4:按照预设要求,构建卷积神经网络模型;
步骤5:将所述第一训练样本数据信息输入至所述卷积神经网络模型中,采用交叉熵损失函数、反向传播算法对所述卷积神经网络模型参数进行调整之后,将softmax回归作为分类算法,完成对所述卷积神经网络模型的训练;在训练时最小化所述交叉熵损失函数,通过所述反向传播算法调整所述卷积神经网络模型参数,以使得所述卷积神经网络模型达到收敛状态;
步骤6:将所述第一待测数据信息输入至训练完成后的所述卷积神经网络模型中;
步骤7:获得所述卷积神经网络模型的第一输出结果,其中,所述第一输出结果为第一行为风险归类结果。
2.如权利要求1所述的方法,其中,在所述步骤3中,所述方法包括:
获得现存行为数据信息;
根据所述现存行为数据信息,确定所有客户记录数量的中位数,并根据所述所有客户记录数量的中位数,获得输入的单个客户数据的条数n;
分别判断所述所有客户的客户数据的条数是否满足n条记录;
如果所述客户数据的条数少于所述n条记录,则从所述现存行为数据信息中按照随机抽样的方式,复制并扩充为n×d大小的客户数据,其中,d为每条历史记录的维度;
如果所述客户数据的条数多于所述n条记录,则从所述现存行为数据信息中按照时间降采样为所述n×d大小的客户数据。
3.如权利要求1所述的方法,其中,在所述步骤4中,所述方法包括:
获得所述卷积神经网络模型的基础信息,其中,所述卷积神经网络模型的包括10层,具体包括:四个联合卷积层、其中,所述四个联合卷积层分别为第一联合卷积层u_conv1、第二联合卷积层u_conv2、第三联合卷积层u_conv3、第四联合卷积层u_conv4,全局特征提取的MLP层m_1、最大池化Max Pooing层和一个由三层的MLP与一个softmax回归层组成的分类器,其中,所述卷积神经网络模型的输入数据为大小为n×d的单人历史行为记录数据Fl0
根据所述基础信息,将所述单人历史行为记录数据Fl0依次通过所述第一联合卷积层u_conv1输出大小为n×64的特征图Fl1、通过所述第二联合卷积层u_conv2得到大小为n×64的特征图Fl2、通过所述第三联合卷积层u_conv3得到大小为n×64特征图Fl3、通过所述第四联合卷积层u_conv4得到大小为n×128的特征图Fl4
将所述Fl0、所述Fl1、所述Fl2、所述Fl3、所述Fl4进行拼接,获得大小为n×323的局部特征图Fl
将所述Fl输入至所述全局特征提取的MLP层m_1中,获得大小为n×1024的全局特征图FG
将所述FG输入至所述最大池化Max Pooing层中,获得大小为1×1024的全局特征向量VG
将所述VG输入至所述分类器中,其中,所述分类器中三层的MLP的第一层包括512个1×1的卷积核、第二层包括256个1×1的卷积核、第三层包括s个1×1的卷积核,其中,s为样本中风险等级数目;
将所述分类器的输出结果输入至所述softmax回归层中,获得大小为1×s的输出向量。
4.如权利要求3所述的方法,其中,所述联合卷积层具体包括:
根据第L+1层(L∈{0,1,2,3})联合卷积层u_conv(L+1),将所有浅层Fl0,...,FlL中每条记录i的特征向量(xi0,...,xiL)进行拼接之后,经过组合后输入组成所述联合卷积层的单层MLP中,进行特征提取,获得记录i的特征向量xi(L+1)
其中,所述特征向量xi(L+1)的计算公式为:
x=hΘ(cat(xi0,...,xiL)) (1);
其中,下标0,1,2,…,L为所述联合卷积层u_conv(L+1)前的所有特征提取层的输出特征图,下标0为输入Fl0,xiL为记录i在FlL中的特征向量,cat(*)函数将所有模块层的对应记录i的特征向量进行拼接,hΘ(*)为卷积核大小为1×1的MLP运算;
将所有记录的特征向量xi(L+1)组合输出特征图Fl(L+1),其中,第L+1层联合卷积层u_conv(L+1)的输出特征图Fl(L+1)计算公式具体为:
Fl(L+1)=(x1(L+1),x2(L+1),...,xn(L+1)) (2)。
5.如权利要求1所述的方法,其中,在所述步骤5中,所述方法包括:
获得初始化数据信息;
根据所述初始化数据信息,对所述卷积神经网络模型进行初始化;
将所述第一训练样本数据信息输入至所述初始化后的卷积神经网络模型中之后,获得输出为1×s的当前预测分类结果,其中,所述当前预测分类结果与当前预测标签结果
Figure FDA0003862224320000041
一一对应;
将所述当前预测标签结果
Figure FDA0003862224320000042
与实际标签结果y进行计算之后,获得所述交叉熵损失函数,其中,所述交叉熵损失函数具体为:
Figure FDA0003862224320000043
6.如权利要求1所述的方法,其中,在所述步骤7中,所述方法包括:
对所述第一待测数据信息进行升或降采样,获得尺寸归一化为相同记录数量的n×d的个人历史行为数据;
保持网络中所有的参数一致,将所述第一待测数据信息输入至所述卷积神经网络模型中,获得大小为1×s的输出结果;
根据所述大小为1×s的输出结果,获得第一行为风险归类结果,其中,所述第一行为风险归类结果为所述大小为1×s的输出结果中的最大值。
7.如权利要求6所述的方法,其中,所述方法还包括:
获得第一优化指令;
根据所述第一优化指令,将所述大小为1×s的输出结果,输入至所述卷积神经网络模型;
重复进行所述步骤5,对所述卷积神经网络模型进行优化。
8.一种基于联合卷积神经网络的催收风险评级系统,其特征在于,所述系统包括:
第一获得单元,所述第一获得单元用于获得第一历史催收数据信息;
第二获得单元,所述第二获得单元用于对所述第一历史催收数据信息进行样本划分之后,获得第一训练样本数据信息与第一待测数据信息,其中,所述第一训练样本数据信息为带有风险评级等级标签的数据,所述第一待测数据信息为待评级行为记录数据;
第一执行单元,所述第一执行单元用于对所述第一训练样本数据信息进行预处理,获得第一待输入数据,其中,所述第一待输入数据为尺寸归一化为相同记录数量的数据,且所述第一待输入数据为单人历史行为数据Fl0
第一构建单元,所述第一构建单元用于按照预设要求,构建卷积神经网络模型;
第二执行单元,所述第二执行单元用于将所述第一训练样本数据信息输入至所述卷积神经网络模型中,采用交叉熵损失函数、反向传播算法对所述卷积神经网络模型参数进行调整之后,将softmax回归作为分类算法,完成对所述卷积神经网络模型的训练;
第一输入单元,所述第一输入单元用于将所述第一待测数据信息输入至训练完成后的所述卷积神经网络模型中;
第三获得单元,所述第三获得单元用于获得所述卷积神经网络模型的第一输出结果,其中,所述第一输出结果为第一行为风险归类结果。
9.一种基于联合卷积神经网络的催收风险评级系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述方法的步骤。
CN202011403995.8A 2020-12-04 2020-12-04 一种基于联合卷积神经网络的催收风险评级方法及系统 Active CN112508684B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011403995.8A CN112508684B (zh) 2020-12-04 2020-12-04 一种基于联合卷积神经网络的催收风险评级方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011403995.8A CN112508684B (zh) 2020-12-04 2020-12-04 一种基于联合卷积神经网络的催收风险评级方法及系统

Publications (2)

Publication Number Publication Date
CN112508684A CN112508684A (zh) 2021-03-16
CN112508684B true CN112508684B (zh) 2023-03-07

Family

ID=74969904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011403995.8A Active CN112508684B (zh) 2020-12-04 2020-12-04 一种基于联合卷积神经网络的催收风险评级方法及系统

Country Status (1)

Country Link
CN (1) CN112508684B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723593B (zh) * 2021-08-26 2024-01-09 国网山东省电力公司济南供电公司 一种基于神经网络的切负荷预测方法及系统
CN115511124B (zh) * 2022-09-27 2023-04-18 上海网商电子商务有限公司 一种基于售后维修记录的客户分级方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292317B (zh) * 2017-06-26 2020-07-28 西安电子科技大学 基于浅层特征与t矩阵深度学习的极化sar分类方法
CN107688784A (zh) * 2017-08-23 2018-02-13 福建六壬网安股份有限公司 一种基于深层特征和浅层特征融合的字符识别方法及存储介质
CN110298574B (zh) * 2019-06-21 2023-06-13 国网辽宁省电力有限公司鞍山供电公司 一种基于卷积神经网络的用电用户缴费风险评级方法
CN110602113B (zh) * 2019-09-19 2021-05-25 中山大学 一种基于深度学习的层次化钓鱼网站检测方法
CN110674305B (zh) * 2019-10-10 2023-05-12 天津师范大学 一种基于深层特征融合模型的商品信息分类方法
CN111428557A (zh) * 2020-02-18 2020-07-17 深圳壹账通智能科技有限公司 基于神经网络模型的手写签名的自动校验的方法和装置
CN111368909B (zh) * 2020-03-03 2021-05-11 温州大学 一种基于卷积神经网络深度特征的车标识别方法

Also Published As

Publication number Publication date
CN112508684A (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
CN109302410B (zh) 一种内部用户异常行为检测方法、系统及计算机存储介质
CN110310114B (zh) 对象分类方法、装置、服务器及存储介质
CN110751557A (zh) 一种基于序列模型的异常资金交易行为分析方法及系统
CN112508684B (zh) 一种基于联合卷积神经网络的催收风险评级方法及系统
CN107392217B (zh) 计算机实现的信息处理方法及装置
CN112700324A (zh) 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法
CN110930038A (zh) 一种贷款需求识别方法、装置、终端及存储介质
CN116777591A (zh) 还款能力预测模型的训练方法、还款能力预测方法及装置
CN117688455B (zh) 一种基于数据质量与强化学习的元任务小样本分类方法
CN113554228B (zh) 还款率预测模型的训练方法及还款率的预测方法
CN114612239A (zh) 基于算法、大数据、人工智能的股票舆情监测和风控系统
CN114519508A (zh) 基于时序深度学习和法律文书信息的信用风险评估方法
Rofik et al. The Optimization of Credit Scoring Model Using Stacking Ensemble Learning and Oversampling Techniques
CN111340102B (zh) 评估模型解释工具的方法和装置
CN117575773A (zh) 业务数据的确定方法、装置、计算机设备、存储介质
CN116821759A (zh) 类别标签的识别预测方法、装置和处理器及电子设备
CN111340356A (zh) 评估模型解释工具的方法和装置
CN116128339A (zh) 客户信用评估方法及装置、存储介质及电子设备
CN113177733B (zh) 基于卷积神经网络的中小微企业数据建模方法及系统
CN115358330A (zh) 客户端用户流失预测方法、装置、设备及存储介质
CN114612231A (zh) 股票量化交易方法、装置、终端设备及可读存储介质
CN113516511A (zh) 一种金融产品购买预测方法、装置及电子设备
CN118260683B (zh) 一种基于大数据的反欺诈模型训练方法及系统
CN112862602B (zh) 一种用户请求的确定方法及存储介质、电子装置
CN116842454B (zh) 基于支持向量机算法的金融资产分类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant