CN113011966A - 基于深度学习的信用评分方法及装置 - Google Patents
基于深度学习的信用评分方法及装置 Download PDFInfo
- Publication number
- CN113011966A CN113011966A CN202110292942.1A CN202110292942A CN113011966A CN 113011966 A CN113011966 A CN 113011966A CN 202110292942 A CN202110292942 A CN 202110292942A CN 113011966 A CN113011966 A CN 113011966A
- Authority
- CN
- China
- Prior art keywords
- data
- credit
- training
- related data
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 20
- 238000013077 scoring method Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 43
- 239000013598 vector Substances 0.000 claims abstract description 33
- 238000007781 pre-processing Methods 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims description 76
- 238000012360 testing method Methods 0.000 claims description 29
- 230000015654 memory Effects 0.000 claims description 28
- 238000011156 evaluation Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 12
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 241001522296 Erithacus rubecula Species 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000008034 disappearance Effects 0.000 description 5
- 238000004880 explosion Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明实施例提供了一种基于深度学习的信用评分方法及装置,该方法包括:获取用户的信用相关数据,对该信用相关数据进行数据预处理;对经过该数据预处理的该信用相关数据进行特征向量提取,得到数据特征向量;将该数据特征向量输入GRU模型,得到该用户的信用评分结果。通过本发明的上述实施例,可以解决相关技术中的信用评分模型预测准确率低以及难以高效利用用户的信用数据的问题,达到快速对用户的信用进行评分、快速授信、改善用户体验、高效利用用户的信用数据的效果。
Description
技术领域
本发明实施例涉及计算机领域,具体而言,涉及一种基于深度学习的信用评分方法及装置。
背景技术
个人信用评分又叫“消费者信用评分”,是评估申贷人或借款人违约风险的一种统计方法。该方法通过利用数据挖掘技术对发卡行积累的大量客户历史数据进行分析,寻找出有关客户信用风险的特征值和规律,建立相应的数学模型,为新的申请者或已有的客户进行风险评估。
目前,常用的信用评分模型包括决策树模型、logistic回归模型、K最邻近模型、贝叶斯网络、支持向量机等。在进行个人信用评分的预测过程中,这些评分模型均直接采用原始特征建立信用风险评估模型,没有考虑特征的非线性特点,难以精准判断信用状态带,评估结果有待提升。
针对相关技术中的信用评分模型预测准确率低以及难以高效利用用户的信用数据的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种基于深度学习的信用评分方法及装置,以至少解决相关技术中的信用评分模型预测准确率低以及难以高效利用用户的信用数据的问题。
根据本发明的一个实施例,提供了一种基于深度学习的信用评分方法,包括:获取用户的信用相关数据,对所述信用相关数据进行数据预处理;对经过所述数据预处理的所述信用相关数据进行特征向量提取,得到数据特征向量;将所述数据特征向量输入门控循环单元(Gated Recurrent Unit,简称为GRU)模型,得到所述用户的信用评分结果。
在一个示例性实施例中,在将所述数据特征向量输入门控循环单元GRU模型之前,还可以包括:训练和评估所述GRU模型。
在一个示例性实施例中,训练和评估所述GRU模型,可以包括:对训练评估数据进行划分,将所述训练评估数据划分为训练集和测试集;对所述训练集和测试集进行特征提取,并根据经过特征提取的所述训练集与测试集对所述GRU模型进行训练和评估。
在一个示例性实施例中,对所述信用相关数据进行数据预处理,至少可以包括以下之一:删除所述信用相关数据中的重复数据,删除所述信用相关数据中的异常数据,删除所述信用相关数据中的缺失数据,对所述信用相关数据中的缺失数据进行单值填补,对所述信用相关数据中的缺失数据进行多重填补。
在一个示例性实施例中,所述GRU模型可以为交叉熵损失函数模型或hinge-loss损失函数模型。
根据本发明的另一个实施例,提供了一种基于深度学习的信用评分装置,包括:处理模块,用于获取用户的信用相关数据,对所述信用相关数据进行数据预处理;提取模块,用于对经过所述数据预处理的所述信用相关数据进行特征向量提取,得到数据特征向量;输入模块,用于将所述数据特征向量输入门控循环单元GRU模型,得到所述用户的信用评分结果。
在一个示例性实施例中,还可以包括:训练评估模块,用于在将所述数据特征向量输入门控循环单元GRU模型之前,训练和评估所述GRU模型。
在一个示例性实施例中,所述训练评估模块,可以包括:划分单元,用于对训练评估数据进行划分,将所述训练评估数据划分为训练集和测试集;训练评估单元,用于对所述训练集和测试集进行特征提取,并根据经过特征提取的所述训练集与测试集对所述GRU模型进行训练和评估。
在一个示例性实施例中,所述处理模块,还可以用于至少通过以下之一方式对所述信用相关数据进行数据预处理:删除所述信用相关数据中的重复数据,删除所述信用相关数据中的异常数据,删除所述信用相关数据中的缺失数据,对所述信用相关数据中的缺失数据进行单值填补,对所述信用相关数据中的缺失数据进行多重填补。
根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明的上述实施例,由于GRU模型能够有效捕捉长序列之间的语义关系,缓解梯度消失或爆炸现象,并且结构和计算比传统的信用评分模型更简单,因此,基于GRU模型得到用户的信用评分结果可以解决相关技术中的信用评分模型预测准确率低的问题,并且,由于将用户的信用相关数据输入GRU模型,对用户的信用相关数据进行分析,因此,可以解决相关技术中的难以高效利用用户的信用数据的问题,达到快速对用户的信用进行评分、快速授信、改善用户体验、高效利用用户的信用数据的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种基于深度学习的信用评分方法的计算机终端的硬件结构框图;
图2是根据本发明实施例的基于深度学习的信用评分方法的流程图;
图3是根据本发明可选实施例的GRU模型的示意图;
图4是根据本发明实施例的基于深度学习的信用评分装置的结构框图;
图5是根据本发明可选实施例的基于深度学习的信用评分装置的结构框图;
图6是根据本发明可选实施例的基于GRU模型的个人信用评分方法的流程示意图;
图7是根据本发明可选实施例的基于GRU模型的个人信用评分装置的结构框图;
图8是根据本发明可选实施例的基于GRU模型的个人信用评分电子装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了更好的理解本发明实施例以及可选实施例的技术方案,以下对本发明实施例以及可选实施例中可能出现的应用场景进行说明,但不用于限定以下场景的应用。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种基于深度学习的信用评分方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的基于深度学习的信用评分方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
可选地,在本实施例中,上述终端可以包括但不限于以下至少之一:手机(如Android手机、iOS手机等)、笔记本电脑、平板电脑、掌上电脑、移动互联网设备(MobileInternet Devices,简称为MID)、PAD、台式电脑等。上述网络可以包括但不限于:有线网络,无线网络,其中,该有线网络包括:局域网、城域网和广域网,该无线网络包括:蓝牙、WIFI及其他实现无线通信的网络。上述服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。上述只是一种示例,本实施例对此不做任何限定。
在本实施例中提供了一种运行于上述计算机终端的基于深度学习的信用评分方法,图2是根据本发明实施例的基于深度学习的信用评分方法的流程图,如图2所示,该流程包括如下步骤:
步骤S201,获取用户的信用相关数据,对所述信用相关数据进行数据预处理。
步骤S202,对经过所述数据预处理的所述信用相关数据进行特征向量提取,得到数据特征向量。
步骤S203,将所述数据特征向量输入门控循环单元GRU模型,得到所述用户的信用评分结果。
在本实施例中,具体而言,可以将特征向量输入经训练的信用模型中,其中所述信用模型采用GRU模型。
在本实施例中,具体而言,GRU是对循环神经网络(Recurrent Neural Networks,简称为RNN)的一种改进,可以解决RNN模型存在的长期依赖问题,同长短时记忆结构(LongShort-Term Memroy,简称为LSTM)一样能够有效捕捉长序列之间的语义关联,缓解梯度消失或爆炸现象,同时结构和计算比LSTM简单,可以解决RNN模型存在的长期依赖问题,训练速度较快。
图3是根据本发明可选实施例的GRU模型的示意图,如图3所示,GRU的门控结构相比LSTM减少到了两个,分别为更新门和重置门,更新门用于控制前一时刻的状态信息被带入到当前状态中的程度,更新门的值越大说明前一时刻的状态信息带入越多。重置门用于控制忽略前一时刻的状态信息的程度,重置门的值越小说明忽略得越多。
在图3中,计算公式如下:
zt=σ(Wz·[ht-1,xt]) (1)
rt=σ(Wr·[ht-1,xt]) (2)
结合上述计算公式和图3,公式(1)、(2)分别是更新门和重置门,更新门的作用类似于LSTM中的遗忘门和输入门,它决定了要忘记哪些信息以及哪些新信息需要被添加,体现在公式(4)中。重置门用于决定遗忘先前信息(上一时刻的隐藏状态ht-1)中的那些对当前时刻计算不重要的部分,用于计算当前的候选隐藏状态ht-1。
在本实施例的步骤S203之前,还可以包括:训练和评估所述GRU模型。
在本实施例中,训练和评估所述GRU模型,可以包括:对训练评估数据进行划分,将所述训练评估数据划分为训练集和测试集;对所述训练集和测试集进行特征提取,并根据经过特征提取的所述训练集与测试集对所述GRU模型进行训练和评估。
在本实施例中,具体而言,可以对数据进行随机抽样和划分,将数据分成训练集与测试集,并进行特征提取,分别得到训练集与测试集。
在本实施例中,具体而言,可以使用训练集数据对GRU模型进行训练,使用测试集数据对经过训练的GRU模型进行评估。
在本实施例中,步骤S201至少可以包括以下之一:删除所述信用相关数据中的重复数据,删除所述信用相关数据中的异常数据,删除所述信用相关数据中的缺失数据,对所述信用相关数据中的缺失数据进行单值填补,对所述信用相关数据中的缺失数据进行多重填补。
在本实施例中,所述GRU模型可以为交叉熵损失函数模型或hinge-loss损失函数模型。
在本实施例中,具体而言,在交叉熵损失函数模型中,随着预测概率偏离实际标签,交叉熵损失会逐渐增加。
在本实施例中,具体而言,hinge-loss损失函数模型又称为铰链损失函数模型。在该模型中,Hinge损失可以用来解决间隔最大化问题,在一定的安全间隔内(通常是1),正确类别的分数应高于所有错误类别的分数之和。
通过上述步骤,由于GRU模型能够有效捕捉长序列之间的语义关系,缓解梯度消失或爆炸现象,并且结构和计算比传统的信用评分模型更简单,因此,基于GRU模型得到用户的信用评分结果可以解决相关技术中的信用评分模型预测准确率低的问题,并且,由于将用户的信用相关数据输入GRU模型,对用户的信用相关数据进行分析,因此,可以解决相关技术中的难以高效利用用户的信用数据的问题,达到快速对用户的信用进行评分、快速授信、改善用户体验、高效利用用户的信用数据的效果。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种基于深度学习的信用评分装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”和“单元”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本发明实施例的基于深度学习的信用评分装置的结构框图,如图4所示,该装置包括处理模块10、提取模块20和输入模块30。
所述处理模块10,用于获取用户的信用相关数据,对所述信用相关数据进行数据预处理。
所述提取模块20,用于对经过所述数据预处理的所述信用相关数据进行特征向量提取,得到数据特征向量。
所述输入模块30,用于将所述数据特征向量输入GRU模型,得到所述用户的信用评分结果。
图5是根据本发明可选实施例的基于深度学习的信用评分装置的结构框图,如图5所示,该装置除包括图4所示的所有模块外,还包括训练评估模块40,所述训练评估模块40可以包括划分单元41和训练评估单元42。
所述训练评估模块40,用于在将所述数据特征向量输入GRU模型之前,训练和评估所述GRU模型。
所述划分单元41,用于对训练评估数据进行划分,将所述训练评估数据划分为训练集和测试集。
所述训练评估单元42,用于对所述训练集和测试集进行特征提取,并根据经过特征提取的所述训练集与测试集对所述GRU模型进行训练和评估。
所述处理模块,还可以用于至少通过以下之一方式对所述信用相关数据进行数据预处理:删除所述信用相关数据中的重复数据,删除所述信用相关数据中的异常数据,删除所述信用相关数据中的缺失数据,对所述信用相关数据中的缺失数据进行单值填补,对所述信用相关数据中的缺失数据进行多重填补。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
为了便于对本发明所提供的技术方案的理解,下面将结合具体场景的实施例进行详细阐述。
本实施例公开了一种个人信用评分方法和装置、存储介质及电子装置。其中,该方法包括:获得用户信用相关的原始数据,例如用户信息,交易流水,信贷数据、税务信息等,对数据进行处理后对数据进行变换,将数据转化成统一的格式,例如数值型数据格式。之后输入经过训练的深度神经网络模型,例如GRU模型,从而得到个人信用评分结果。通过本实施例的方法,可以用较快的速度对用户的信用进行评分,意味着可以快速授信,改善用户体验,并且该方法使用深度学习的方法对用户交易的流水数据进行分析,可以更好的利用用户消费时的时序信息。
在本实施例中,由于GRU可以同LSTM一样能够有效捕捉长序列之间的语义关系,缓解梯度消失或爆炸现象,效果优于传统的RNN,并且结构和计算比LSTM更简单,运算速度也比RNN快,因此,通过本实施例的方法,可以用较快的速度对用户的信用进行评分,意味着可以快速授信,改善用户体验,并且该方法使用深度学习的方法对用户交易的流水数据进行分析,可以更好地利用用户消费时的时序信息。
在本实施例中,LSTM是传统RNN的变体,与经典RNN相比能够有效捕捉长序列之间的语义关联,环节梯度消失或爆炸现象,LSTM结构复杂,核心结构可以分为四个部分解析。
图6是根据本发明可选实施例的基于GRU模型的个人信用评分方法的流程示意图,如图6所示,该流程包括如下步骤:
步骤S601,数据采集。
在本实施例的步骤S601中,可以包括:采集用户原始数据,所述数据包括但不限于:用户基本信息、银行交易流水、信贷数据、等金融机构产生的数据,还可以包括政府部门和其他公共事业机构产生的数据,例如,税务信息,电力公司,网络运营商等产生的市民信用,还可以包括网络产生的数据,目前网络产生大量的社交、电商、打车等数据,成为个人信用数据的重要来源,有效的补充了传统的单一的数据采集渠道。
步骤S602,数据预处理。
在本实施例的步骤S602中,由于个人信用信息数据来源复杂,且数据采集口径不一致等,原始数据中存在重复数据,异常数据和缺失数据,因此可以对数据进行处理以供后续使用。
在本实施例的步骤S602中,具体而言,可以删除不符合要求的数据。之后对数据进行变换,将数据转化成统一的格式,例如数值型数据格式。
在本实施例的步骤S602中,具体而言,为了保证足够的样本,还可以采用单值填补或多重填补的方式对缺失值进行填补。
步骤S603,数据特征提取。
在本实施例的步骤S603中,可以包括:对数据进行随机抽样划分,得到训练集与测试集,并进行特征提取,分别得到训练集与测试集的特征数据。
在本实施例的步骤S603中,具体而言,如果训练集中坏客户比例过多,好客户的特征会被淹没,在这样训练集上建立的个人信用评分模型可能会拒绝很多信用良好的客户的贷款申请,造成优质客户的流失。因此,为了保证训练集中数据的平衡,可以对好客户进行欠抽样,对坏客户进行过抽样。按照设定的好坏客户的比例,例如1:1进行抽样。
步骤S604,GRU模型训练和评估。
在本实施例的步骤S604中,可以包括:使用训练集对GRU模型进行训练。将测试集的特征数据输入经过训练的模型后,得到预测样本,将预测样本和测试样本相比较,对GRU模型进行评估。
在本实施例的步骤S604中,具体而言,每个用户特征可以用于描述用户样本数据在某一方面的信息。比如,在信用贷款业务中,用户样本数据的用户特征可以包括:欠款金额、欠款时长、逾期还款金额、逾期还款时长、逾期率等。
在本实施例的步骤S604中,具体而言,对模型训练的过程是误差的反向传播、更新模型参数的过程,通过训练不断更新模型中的参数,使得损失值尽量小。模型的训练过程中,每一时刻的GRU网络的权值参数都可以是共享的。上一时刻GRU网络的输出,可以作为当前时刻GRU网络的部分输入。
在本实施例的步骤S604中,具体而言,损失函数可以选择交叉熵损失函数,或hinge-loss损失函数。
步骤S605,结果输出。
在本实施例的步骤S605中,可以基于所述经训练和评估的GRU模型得到个人信用评分。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本实施例并不受所描述的动作顺序的限制,因为依据本实施例,某些步骤可以采用其他顺序或者同时进行。其次,本邻域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本实施例所必须的。
根据本实施例的又一方面,还提供了一种个人信用评分装置,图7是根据本发明可选实施例的基于GRU模型的个人信用评分装置的结构框图,如图7所示,该装置包括数据采集模块M10、数据预处理模块M20、特征提取模块M30、GRU模型训练和评估模块M40和结果输出模块M50。
所述数据采集模块M10,用于采集用户原始数据,所述数据包括但不限于:用户基本信息、银行交易流水、信贷数据、等金融机构产生的数据,还可以包括政府部门和其他公共事业机构产生的数据,例如,税务信息,电力公司,网络运营商等产生的市民信用,还可以包括网络产生的数据,目前网络产生大量的社交、电商、打车等数据,成为个人信用数据的重要来源,有效的补充了传统的单一的数据采集渠道。
在本实施例中,由于个人信用信息数据来源复杂,且数据采集口径不一致等,原始数据中存在重复数据,异常数据和缺失数据,因此需要对数据进行处理以供后续使用。
所述数据预处理模块M20,可以用于删除不符合要求的数据。之后对数据进行变换,将数据转化成统一的格式,例如数值型数据格式。
在本发明的另一实施例中,为了保证足够的样本,还可以采用单值填补或多重填补的方式对缺失值进行填补。
所述特征提取模块M30,用于对数据进行随机抽样划分,得到训练集与测试集,并进行特征提取,分别得到训练集与测试集的特征数据。
在本发明另一实施例中,如果训练集中坏客户比例过多,好客户的特征会被淹没,在这样训练集上建立的个人信用评分模型可能会拒绝很多信用良好的客户的贷款申请,造成优质客户的流失,为了保证训练集中数据的平衡,可以对好客户进行欠抽样,对坏客户进行过抽样。按照设定的好坏客户的比例,例如1:1进行抽样。
所述GRU模型训练和评估模块M40,用于使用训练集对GRU模型进行训练。将测试集的特征数据输入经过训练的模型后,得到预测样本,将预测样本和测试样本相比较,对GRU模型进行评估。
对模型训练的过程是误差的反向传播、更新模型参数的过程,通过训练不断更新模型中的参数,使得损失值尽量小。模型的训练过程中,每一时刻的GRU网络的权值参数都是共享的。上一时刻GRU网络的输出,作为当前时刻GRU网络的部分输入。
在本发明另一实施例中,损失函数可以选择交叉熵损失函数,或hinge-loss损失函数。
所述结果输出模块M50,用于基于所述经训练和评估的GRU模型得到个人信用评分。
根据本实施例的又一个方面,还提供了一种用于实施上述个人信用评分方法的电子装置,图8是根据本发明可选实施例的基于GRU模型的个人信用评分电子装置的结构示意图,如图8所示,该电子装置包括存储器802和处理器804,该存储器802中存储有计算机程序,该处理器804被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,本领域普通技术人员可以理解,图8所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图8其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图8中所示更多或者更少的组件(如网络接口等),或者具有与图8所示不同的配置。
其中,存储器802可用于存储软件程序以及模块,如本实施例中的个人信用评分方法和装置对应的程序指令/模块,处理器804通过运行存储在存储器802内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的聚类方法。存储器802可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器802可进一步包括相对于处理器804远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器802具体可以但不限于用于存储目标对象的目标高度等信息。作为一种示例,如图8所示,上述存储器802中可以但不限于包括上述个人信用评分装置,本示例中不再赘述。
可选地,上述的传输装置806用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置806包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置806为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子装置还可以包括:显示器808和连接总线810,用于连接上述电子装置中的各个模块部件。
在其他实施例中,上述终端或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(P2P,Peer To Peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行各个实施例方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在各个实施例中的各功能单元可以集成在一个第一处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上仅是本实施例的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取用户的信用相关数据,对所述信用相关数据进行数据预处理;
S2,对经过所述数据预处理的所述信用相关数据进行特征向量提取,得到数据特征向量;
S3,将所述数据特征向量输入GRU模型,得到所述用户的信用评分结果。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
在一个示例性实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取用户的信用相关数据,对所述信用相关数据进行数据预处理;
S2,对经过所述数据预处理的所述信用相关数据进行特征向量提取,得到数据特征向量;
S3,将所述数据特征向量输入GRU模型,得到所述用户的信用评分结果。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种基于深度学习的信用评分方法,其特征在于,包括:
获取用户的信用相关数据,对所述信用相关数据进行数据预处理;
对经过所述数据预处理的所述信用相关数据进行特征向量提取,得到数据特征向量;
将所述数据特征向量输入门控循环单元GRU模型,得到所述用户的信用评分结果。
2.根据权利要求1所述的方法,其特征在于,在将所述数据特征向量输入门控循环单元GRU模型之前,还包括:
训练和评估所述GRU模型。
3.根据权利要求2所述的方法,其特征在于,训练和评估所述GRU模型,包括:
对训练评估数据进行划分,将所述训练评估数据划分为训练集和测试集;
对所述训练集和测试集进行特征提取,并根据经过特征提取的所述训练集与测试集对所述GRU模型进行训练和评估。
4.根据权利要求1所述的方法,其特征在于,对所述信用相关数据进行数据预处理,至少包括以下之一:
删除所述信用相关数据中的重复数据,删除所述信用相关数据中的异常数据,删除所述信用相关数据中的缺失数据,对所述信用相关数据中的缺失数据进行单值填补,对所述信用相关数据中的缺失数据进行多重填补。
5.根据权利要求1所述的方法,其特征在于,所述GRU模型为交叉熵损失函数模型或hinge-loss损失函数模型。
6.一种基于深度学习的信用评分装置,其特征在于,包括:
处理模块,用于获取用户的信用相关数据,对所述信用相关数据进行数据预处理;
提取模块,用于对经过所述数据预处理的所述信用相关数据进行特征向量提取,得到数据特征向量;
输入模块,用于将所述数据特征向量输入门控循环单元GRU模型,得到所述用户的信用评分结果。
7.根据权利要求6所述的装置,其特征在于,还包括:
训练评估模块,用于在将所述数据特征向量输入门控循环单元GRU模型之前,训练和评估所述GRU模型。
8.根据权利要求7所述的装置,其特征在于,所述训练评估模块,包括:
划分单元,用于对训练评估数据进行划分,将所述训练评估数据划分为训练集和测试集;
训练评估单元,用于对所述训练集和测试集进行特征提取,并根据经过特征提取的所述训练集与测试集对所述GRU模型进行训练和评估。
9.根据权利要求6所述的装置,其特征在于,
所述处理模块,还用于至少通过以下之一方式对所述信用相关数据进行数据预处理:删除所述信用相关数据中的重复数据,删除所述信用相关数据中的异常数据,删除所述信用相关数据中的缺失数据,对所述信用相关数据中的缺失数据进行单值填补,对所述信用相关数据中的缺失数据进行多重填补。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至5任一项中所述的方法的步骤。
11.一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至5任一项中所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110292942.1A CN113011966A (zh) | 2021-03-18 | 2021-03-18 | 基于深度学习的信用评分方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110292942.1A CN113011966A (zh) | 2021-03-18 | 2021-03-18 | 基于深度学习的信用评分方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113011966A true CN113011966A (zh) | 2021-06-22 |
Family
ID=76402661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110292942.1A Pending CN113011966A (zh) | 2021-03-18 | 2021-03-18 | 基于深度学习的信用评分方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113011966A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114119107A (zh) * | 2021-12-28 | 2022-03-01 | 大汉电子商务有限公司 | 一种钢贸企业交易测评方法、装置、设备及存储介质 |
CN117151797A (zh) * | 2023-09-05 | 2023-12-01 | 中铁商业保理有限公司 | 基于综合数据分析的企业信用评估系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017215403A1 (zh) * | 2016-06-12 | 2017-12-21 | 腾讯科技(深圳)有限公司 | 一种用户信用评估方法、装置及存储介质 |
CN107945003A (zh) * | 2016-12-30 | 2018-04-20 | 上海壹账通金融科技有限公司 | 信用评估方法及装置 |
CN108280757A (zh) * | 2017-02-13 | 2018-07-13 | 腾讯科技(深圳)有限公司 | 用户信用评估方法及装置 |
CN110232405A (zh) * | 2019-05-24 | 2019-09-13 | 东方银谷(北京)科技发展有限公司 | 用于个人信用评估的方法及装置 |
CN110490424A (zh) * | 2019-07-23 | 2019-11-22 | 阿里巴巴集团控股有限公司 | 一种基于卷积神经网络的进行风险评估的方法和装置 |
RU2723448C1 (ru) * | 2019-05-24 | 2020-06-11 | Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) | Способ расчета кредитного рейтинга клиента |
CN111400754A (zh) * | 2020-03-11 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 保护用户隐私的用户分类系统的构建方法及装置 |
CN112288042A (zh) * | 2020-12-18 | 2021-01-29 | 蚂蚁智信(杭州)信息技术有限公司 | 行为预测系统的更新方法及装置、存储介质和计算设备 |
CN112329816A (zh) * | 2020-10-09 | 2021-02-05 | 北京嘀嘀无限科技发展有限公司 | 数据分类方法、装置、电子设备和可读存储介质 |
US20210075875A1 (en) * | 2019-09-09 | 2021-03-11 | Adobe Inc. | Utilizing a recommendation system approach to determine electronic communication send times |
-
2021
- 2021-03-18 CN CN202110292942.1A patent/CN113011966A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017215403A1 (zh) * | 2016-06-12 | 2017-12-21 | 腾讯科技(深圳)有限公司 | 一种用户信用评估方法、装置及存储介质 |
CN107945003A (zh) * | 2016-12-30 | 2018-04-20 | 上海壹账通金融科技有限公司 | 信用评估方法及装置 |
CN108280757A (zh) * | 2017-02-13 | 2018-07-13 | 腾讯科技(深圳)有限公司 | 用户信用评估方法及装置 |
CN110232405A (zh) * | 2019-05-24 | 2019-09-13 | 东方银谷(北京)科技发展有限公司 | 用于个人信用评估的方法及装置 |
RU2723448C1 (ru) * | 2019-05-24 | 2020-06-11 | Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) | Способ расчета кредитного рейтинга клиента |
CN110490424A (zh) * | 2019-07-23 | 2019-11-22 | 阿里巴巴集团控股有限公司 | 一种基于卷积神经网络的进行风险评估的方法和装置 |
US20210075875A1 (en) * | 2019-09-09 | 2021-03-11 | Adobe Inc. | Utilizing a recommendation system approach to determine electronic communication send times |
CN111400754A (zh) * | 2020-03-11 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 保护用户隐私的用户分类系统的构建方法及装置 |
CN112329816A (zh) * | 2020-10-09 | 2021-02-05 | 北京嘀嘀无限科技发展有限公司 | 数据分类方法、装置、电子设备和可读存储介质 |
CN112288042A (zh) * | 2020-12-18 | 2021-01-29 | 蚂蚁智信(杭州)信息技术有限公司 | 行为预测系统的更新方法及装置、存储介质和计算设备 |
Non-Patent Citations (1)
Title |
---|
顾笑风: "基于神经网络的个人信用风险评估模型研究", CNKI优秀硕士学位论文全文库, pages 7 - 56 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114119107A (zh) * | 2021-12-28 | 2022-03-01 | 大汉电子商务有限公司 | 一种钢贸企业交易测评方法、装置、设备及存储介质 |
CN117151797A (zh) * | 2023-09-05 | 2023-12-01 | 中铁商业保理有限公司 | 基于综合数据分析的企业信用评估系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108648074B (zh) | 基于支持向量机的贷款评估方法、装置及设备 | |
CN109063966B (zh) | 风险账户的识别方法和装置 | |
CN108133418A (zh) | 实时信用风险管理系统 | |
CN108346048B (zh) | 一种调整风险参数的方法、风险识别方法及装置 | |
CN109583904A (zh) | 异常操作检测模型的训练方法、异常操作检测方法及装置 | |
CN110442712B (zh) | 风险的确定方法、装置、服务器和文本审理系统 | |
US11227217B1 (en) | Entity transaction attribute determination method and apparatus | |
CN110147389B (zh) | 帐号处理方法和装置、存储介质及电子装置 | |
CN112085615A (zh) | 图神经网络的训练方法及装置 | |
CN113011966A (zh) | 基于深度学习的信用评分方法及装置 | |
CN110930038A (zh) | 一种贷款需求识别方法、装置、终端及存储介质 | |
CN111815169A (zh) | 业务审批参数配置方法及装置 | |
CN113902473A (zh) | 业务预测系统的训练方法及装置 | |
CN110197426A (zh) | 一种信用评分模型的建立方法、装置及可读存储介质 | |
CN114782161A (zh) | 识别风险用户的方法、装置、存储介质及电子装置 | |
CN111756837A (zh) | 信息推送方法、装置、设备及计算机可读存储介质 | |
CN111127185A (zh) | 信贷欺诈识别模型构建方法及装置 | |
CN114154672A (zh) | 一种用于客户流失预测的数据挖掘方法 | |
CN109241249B (zh) | 一种确定突发问题的方法及装置 | |
CN111681044A (zh) | 积分兑换作弊行为处理方法及装置 | |
CN113902576A (zh) | 基于深度学习的信息推送方法、装置、电子设备及介质 | |
CN110163761B (zh) | 基于图像处理的可疑项目成员识别方法及装置 | |
CN112950354A (zh) | 账户的信用评分方法、装置和存储介质及电子装置 | |
CN113256404A (zh) | 数据处理方法及装置 | |
CN112116358A (zh) | 一种交易欺诈行为的预测方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |