CN110717817A - 贷前审核方法及装置、电子设备和计算机可读存储介质 - Google Patents
贷前审核方法及装置、电子设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN110717817A CN110717817A CN201910750196.9A CN201910750196A CN110717817A CN 110717817 A CN110717817 A CN 110717817A CN 201910750196 A CN201910750196 A CN 201910750196A CN 110717817 A CN110717817 A CN 110717817A
- Authority
- CN
- China
- Prior art keywords
- credit
- blacklist
- target object
- label
- loan
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 72
- 238000011156 evaluation Methods 0.000 claims abstract description 55
- 238000011835 investigation Methods 0.000 claims abstract description 29
- 238000013210 evaluation model Methods 0.000 claims abstract description 27
- 238000004422 calculation algorithm Methods 0.000 claims description 41
- 238000003064 k means clustering Methods 0.000 claims description 27
- 238000012552 review Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 7
- 238000012550 audit Methods 0.000 claims 1
- 238000010801 machine learning Methods 0.000 abstract description 9
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Accounting & Taxation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Finance (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Technology Law (AREA)
- Probability & Statistics with Applications (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提出了一种贷前审核方法及装置、电子设备和计算机可读存储介质,涉及人工智能技术领域,该方法包括:获取目标对象的征信信息;根据所述征信信息,判断所述目标对象是否存在于指定黑名单集合中的任一黑名单中;根据判断结果,为所述目标对象生成标签集合,其中,所述标签集合中的标签与所述指定黑名单集合中的黑名单一一对应;将所述标签集合输入以样本对象及其对应的样本标签集合作为训练样本训练得到的贷前信用评估模型中;通过所述贷前信用评估模型输出对所述目标对象的贷前信用评估结果。通过本发明的技术方案,能够通过机器学习方式实现对借贷人贷前信用的精确评估,能够提升贷前评估的有效性。
Description
【技术领域】
本发明涉及人工智能技术领域,尤其涉及一种贷前审核方法及装置、电子设备和计算机可读存储介质。
【背景技术】
银行等金融机构十分看重借贷人的个人信用记录,如果借贷人因为信用不好而被银行列入黑名单,那么,短时间内不能再次向银行申请贷款。
目前,一般根据银行内部的黑名单确定借贷人的贷前信用。然而,由于在现有的业务模型中,黑名单涉及不同业务的方方面面,多种多样,其设定没有统一的标准,这往往造成本身具有信贷能力的借贷人会因存在于某一黑名单上而直接被否决,不利于信贷业务的开展。若要对这些被拒的借贷人进行进一步评估,还需启动人工评估流程,会消耗大量人工成本。
因此,如何避免借贷人因贷前评估不合理而被拒贷,成为目前亟待解决的技术问题。
【发明内容】
本发明实施例提供了一种贷前审核方法及装置、电子设备和计算机可读存储介质,旨在解决相关技术中本身具有信贷能力的借贷人会因基于黑名单的不合理评估而被拒贷技术问题,能够提升贷前评估的有效性,减少借贷人因贷前评估不合理而被拒贷的情况。
第一方面,本发明实施例提供了一种贷前审核方法,包括:获取目标对象的征信信息;根据所述征信信息,判断所述目标对象是否存在于指定黑名单集合中的任一黑名单中;根据判断结果,为所述目标对象生成标签集合,其中,所述标签集合中的标签与所述指定黑名单集合中的黑名单一一对应;将所述标签集合输入以样本对象及其对应的样本标签集合作为训练样本训练得到的贷前信用评估模型中;通过所述贷前信用评估模型输出对所述目标对象的贷前信用评估结果。
在本发明上述实施例中,可选地,所述目标对象包括自然人和/或企业;所述指定黑名单集合包括失信对象黑名单、司法负面黑名单和多头借贷黑名单中的一种或多种,以及,所述指定黑名单集合中每种黑名单的数量为一个或多个。
在本发明上述实施例中,可选地,所述通过所述贷前信用评估模型输出对所述目标对象的贷前信用评估结果的步骤,具体包括:通过预设的K均值聚类算法对所述标签集合进行聚类计算,得到所述标签集合对应的聚类结果;将所述聚类结果对应的指定信贷结果确定为所述目标对象的贷前信用评估结果。
在本发明上述实施例中,可选地,所述预设的K均值聚类算法具体包括:随机选择与所述指定信贷结果相同数量的在前聚类中心;根据所述标签集合中的每个标签与所述在前聚类中心的相对位置关系,将所述每个标签分配至与自身距离最近的目标在前聚类中心;根据所述每个标签的实际分配信息,重新确定与所述指定信贷结果相同数量的在后聚类中心;在所述在后聚类中心中,为所述每个标签选择与自身距离最近的目标在后聚类中心;循环所述将所述每个标签分配的步骤与重新确定聚类中心的步骤,至所述在后聚类中心与所述在前聚类中心相同。
在本发明上述实施例中,可选地,在所述获取目标对象的征信信息的步骤之前,还包括:以所述样本对象及其对应的所述样本标签集合作为训练样本,以所述样本对象的贷前信用评估结果作为训练结果,训练所述贷前信用评估模型。
第二方面,本发明实施例提供了一种贷前审核装置,包括:征信信息获取单元,用于获取目标对象的征信信息;黑名单判断单元,用于根据所述征信信息,判断所述目标对象是否存在于指定黑名单集合中的任一黑名单中;标签生成单元,用于根据判断结果,为所述目标对象生成标签集合,其中,所述标签集合中的标签与所述指定黑名单集合中的黑名单一一对应;标签输入单元,用于将所述标签集合输入以样本对象及其对应的样本标签集合作为训练样本训练得到的贷前信用评估模型中;贷前评估单元,用于通过所述贷前信用评估模型输出对所述目标对象的贷前信用评估结果。
在本发明上述实施例中,可选地,所述目标对象包括自然人和/或企业;所述指定黑名单集合包括失信对象黑名单、司法负面黑名单和多头借贷黑名单中的一种或多种,以及,所述指定黑名单集合中每种黑名单的数量为一个或多个。
在本发明上述实施例中,可选地,所述贷前评估单元具体用于:通过预设的K均值聚类算法对所述标签集合进行聚类计算,得到所述标签集合对应的聚类结果,并将所述聚类结果对应的指定信贷结果确定为所述目标对象的贷前信用评估结果。
在本发明上述实施例中,可选地,所述预设的K均值聚类算法具体用于:随机选择与所述指定信贷结果相同数量的在前聚类中心;根据所述标签集合中的每个标签与所述在前聚类中心的相对位置关系,将所述每个标签分配至与自身距离最近的目标在前聚类中心;根据所述每个标签的实际分配信息,重新确定与所述指定信贷结果相同数量的在后聚类中心;在所述在后聚类中心中,为所述每个标签选择与自身距离最近的目标在后聚类中心;循环所述将所述每个标签分配的步骤与重新确定聚类中心的步骤,至所述在后聚类中心与所述在前聚类中心相同。
在本发明上述实施例中,可选地,还包括:模型训练单元,用于在所述征信信息获取单元获取所述目标对象的所述征信信息之前,以所述样本对象及其对应的所述样本标签集合作为训练样本,以所述样本对象的贷前信用评估结果作为训练结果,训练所述贷前信用评估模型。
第三方面,本发明实施例提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述第一方面中任一项所述的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述第一方面中任一项所述的方法流程。
以上技术方案,针对相关技术中的本身具有信贷能力的借贷人会因基于黑名单的不合理评估而被拒贷技术问题,提供了一种基于机器学习的贷前审核方法,可避免具有还贷能力的借贷人因被黑名单一票否决而被拒贷的情况。
具体来说,可从目标对象的征信信息中提取出多种标签,目标对象的征信信息示出了目标对象是否存在于某些黑名单中,比如,若目标对象存在于失信对象黑名单,则为其生成失信标签,若目标对象未存在于失信对象黑名单,则为其生成未失信标签。由于黑名单的类型多种多样,由此,便可为目标对象生成具有大量标签的标签集合,以供根据标签集合代表的目标对象的征信情况进一步判断是否可为其提供贷款。
接着,将所述标签集合输入以样本对象及其对应的样本标签集合作为训练样本训练得到的贷前信用评估模型中,贷前信用评估模型是以所述样本对象及其对应的所述样本标签集合作为训练样本,以所述样本对象的贷前信用评估结果作为训练结果,训练得到的,其可以看作为一个对象的标签集合与其贷前信用所应有的具象关联关系,因此,通过贷前信用评估模型对目标对象的标签集合进行评估后,可得到对目标对象的贷前信用评估结果。
通过以上技术方案,能够通过机器学习方式实现对借贷人贷前信用的精确评估,减少具有可靠还贷能力的借贷人因贷前评估不合理而被拒贷的情况发生,能够提升贷前评估的有效性,有助于借贷业务的展开。同时,此评估方式大大减少了人工评估的工作量,减少了人力成本,提升了贷前评估的效率和准确性。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了根据本发明的一个实施例的贷前审核方法的流程图;
图2示出了根据本发明的另一个实施例的贷前审核方法的流程图;
图3示出了根据本发明的一个实施例的K均值聚类算法的流程图;
图4示出了根据本发明的一个实施例提供的一种训练样本对应的点的示意图;
图5示出了根据本发明的一个实施例提供的一种随机挑选中心点的示意图;
图6示出了根据本发明的一个实施例提供的一种随机挑选中心点后的分类结果示意图;
图7示出了根据本发明的一个实施例提供的一种分类后类中心点移动的示意图;
图8示出了根据本发明的一个实施例提供的一种迭代示意图;
图9示出了根据本发明的一个实施例提供的一种训练好的K均值聚类算法分类示意图;
图10示出了根据本发明的一个实施例提供的一种训练好的K均值聚类算法分类结果示意图;
图11示出了根据本发明的一个实施例的贷前审核装置的框图;
图12示出了根据本发明的一个实施例的电子设备的框图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
图1示出了根据本发明的一个实施例的贷前审核方法的流程图。
如图1所示,根据本发明的一个实施例的贷前审核方法的流程包括:
步骤102,获取目标对象的征信信息。
其中,所述目标对象包括自然人和/或企业,也就是说,申请贷款的可以是个人用户,如申请放贷,也可以是企业用户,如申请创业基金。
步骤104,根据所述征信信息,判断所述目标对象是否存在于指定黑名单集合中的任一黑名单中。
其中,所述指定黑名单集合包括但不限于失信对象黑名单、司法负面黑名单和多头借贷黑名单中的一种或多种,以及,所述指定黑名单集合中每种黑名单的数量为一个或多个。
步骤106,根据判断结果,为所述目标对象生成标签集合,其中,所述标签集合中的标签与所述指定黑名单集合中的黑名单一一对应。
可从目标对象的征信信息中提取出多种标签,目标对象的征信信息示出了目标对象是否存在于某些黑名单中,比如,若目标对象存在于失信对象黑名单,则为其生成失信标签,若目标对象未存在于失信对象黑名单,则为其生成未失信标签。由于黑名单的类型多种多样,由此,便可为目标对象生成具有大量标签的标签集合,以供根据标签集合代表的目标对象的征信情况进一步判断是否可为其提供贷款。
步骤108,将所述标签集合输入以样本对象及其对应的样本标签集合作为训练样本训练得到的贷前信用评估模型中。
步骤110,通过所述贷前信用评估模型输出对所述目标对象的贷前信用评估结果。
将所述标签集合输入以样本对象及其对应的样本标签集合作为训练样本训练得到的贷前信用评估模型中,贷前信用评估模型是以所述样本对象及其对应的所述样本标签集合作为训练样本,以所述样本对象的贷前信用评估结果作为训练结果,训练得到的,其可以看作为一个对象的标签集合与其贷前信用所应有的具象关联关系,因此,通过贷前信用评估模型对目标对象的标签集合进行评估后,可得到对目标对象的贷前信用评估结果。
通过以上技术方案,能够通过机器学习方式实现对借贷人贷前信用的精确评估,减少具有可靠还贷能力的借贷人因贷前评估不合理而被拒贷的情况发生,能够提升贷前评估的有效性,有助于借贷业务的展开。同时,此评估方式大大减少了人工评估的工作量,减少了人力成本,提升了贷前评估的效率和准确性。
图2示出了根据本发明的另一个实施例的贷前审核方法的流程图。
如图2所示,根据本发明的另一个实施例的贷前审核方法的流程包括:
步骤202,以样本对象及其对应的样本标签集合作为训练样本,以所述样本对象的贷前信用评估结果作为训练结果,训练贷前信用评估模型。
该贷前信用评估模型是利用机器学习算法,经过对训练样本进行机器学习算法处理得到的。其中,建立该贷前信用评估模型所使用的机器学习算法可以为回归算法、聚类算法、随机森林决策树算法、卷积神经网络学习算法、支持向量机等算法中的一种,本发明在后续步骤中主要对K均值聚类算法进行展开描述。
此处,可以深度学习算法为例,具体说明贷前信用评估模型的建立过程:
首先,利用大数据技术获取大量借贷对象的样本标签集合作为样本数据,并且为这些样本数据标定贷前信用评估结果,将得到的样本数据作为输入训练样本数据,将标定的贷前信用评估结果确定为输出训练样本数据。
其次,在得到输入训练样本数据和输出训练样本数据之后,将输入训练样本数据和输出训练样本数据作向量化处理,得到输入训练样本数据对应的输入特征向量,和输出训练样本数据对应的基准特征向量值;然后,将输入特征向量和基准特征向量输入到初始深度学习网络模型中进行学习训练,得到贷前信用评估模型。
建立的贷前信用评估模型包括输入层、隐藏层、输出层。输入层用于接收目标对象的标签集合对应的输入向量;隐藏层是输入层和输出层之间的连接,也称中间层,该隐藏层主要用于对输入层中的目标对象的标签集合进行分析、权衡等处理,得到处理结果,从而将处理结构输入到输出层;输出层用于对于隐藏层输入的处理结果形成输出结果并输出。
步骤204,获取目标对象的征信信息。
其中,所述目标对象包括自然人和/或企业,也就是说,申请贷款的可以是个人用户,如申请放贷,也可以是企业用户,如申请创业基金。
步骤206,根据所述征信信息,判断所述目标对象是否存在于指定黑名单集合中的任一黑名单中。
其中,所述指定黑名单集合包括但不限于失信对象黑名单、司法负面黑名单和多头借贷黑名单中的一种或多种,以及,所述指定黑名单集合中每种黑名单的数量为一个或多个。
步骤208,根据判断结果,为所述目标对象生成标签集合,其中,所述标签集合中的标签与所述指定黑名单集合中的黑名单一一对应。
可从目标对象的征信信息中提取出多种标签,目标对象的征信信息示出了目标对象是否存在于某些黑名单中,比如,若目标对象存在于失信对象黑名单,则为其生成失信标签,若目标对象未存在于失信对象黑名单,则为其生成未失信标签。由于黑名单的类型多种多样,由此,便可为目标对象生成具有大量标签的标签集合,以供根据标签集合代表的目标对象的征信情况进一步判断是否可为其提供贷款。
步骤210,将所述标签集合输入以样本对象及其对应的样本标签集合作为训练样本训练得到的贷前信用评估模型中。
步骤212,通过预设的K均值聚类算法对所述标签集合进行聚类计算,得到所述标签集合对应的聚类结果。
步骤214,将所述聚类结果对应的指定信贷结果确定为所述目标对象的贷前信用评估结果。
下面通过图3对预设的K均值聚类算法进行展开描述,图3示出了根据本发明的一个实施例的K均值聚类算法的流程图。
如图3所示,根据本发明的一个实施例的K均值聚类算法的具体步骤包括:
步骤302,随机选择与指定信贷结果相同数量的在前聚类中心。
步骤304,根据标签集合中的每个标签与所述在前聚类中心的相对位置关系,将所述每个标签分配至与自身距离最近的目标在前聚类中心。
步骤306,根据所述每个标签的实际分配信息,重新确定与所述指定信贷结果相同数量的在后聚类中心。
步骤308,在所述在后聚类中心中,为所述每个标签选择与自身距离最近的目标在后聚类中心。
步骤310,循环所述将所述每个标签分配的步骤与重新确定聚类中心的步骤,至所述在后聚类中心与所述在前聚类中心相同。
综上可知,K均值聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
其中,K均值聚类算法依赖于一个优化目标函数实现,也可以叫为需要最小化的代价函数,此函数能够帮助调试学习算法,以确保K均值聚类算法是在正确运行中,帮助K均值聚类算法找到更好的类并且避免局部最优解。
本实施例中步骤302至步骤310中,循环将每个标签进行分配以及重新确定聚类中心的过程中所使用的优化目标函数为:
其中,J为代价函数,m为训练样本总数,i为训练样本标识,i=1,2,…,m,c(i)为训练样本i的索引值,x(i)为训练样本的值,K为类总数量,k为类标识,k=1,2,…,K,μk为类k的中心值,μc(i)为训练样本i所属类中心值。
J函数的参数是c(1),…,c(i),…,c(m)以及μ1,…,μk,…,μK,随着K均值聚类算法的执行过程,这些参数将不断变化,本步骤的优化目标就是所有的1/m乘以i=1到m个项的求和,也即每个样本x(i)到x(i)所属的类中心点之间距离的平方值。
换句话说,K均值聚类算法训练过程就是找到参数c(i)和μk,也就是说,找到能够最小化代价函数J的c(i)和μk。下面集合上述优化目标函数详细说明K均值聚类算法的运算过程:
1、随机确定K个类的中心值μk。如随机挑选K个训练样本作为K个类的中心,其值作为μk。
2、在μk不变的情况下,将已打标签的样本数据作为训练样本代入K均值聚类算法的目标函数,得到使目标函数最小的c(i)。
3、在保持使目标函数最小的c(i)不变的情况下,将已打标签的样本数据作为训练样本再次代入K均值聚类算法的目标函数,得到使目标函数最小的μk。
4、重复执行步骤202和203,直至前后2次得到的μk差小于第一预设阈值。
5、将后一次得到的c(i)和μk确定为训练后的c(i)和μk。
其中,μk为属于类k的所有训练样本的平均值。c(i)为满足下述条件的类标识:
ρk为类k的密度,Nk为属于类k的训练样本数量。
在dik时,一般采用欧式距离。欧式距离并未考虑数据本身的属性。即数据本身较为集中时,计算的欧式距离相差不大,数据本身分散时,计算的欧式距离相差较大。但分散数据也可能属于同一类,简单的基于欧式距离会造成分类不准。为了避免这种情况,本实施例在计算距离时,还考虑同类中其他训练样本的分布密度。根据分布密度合理的得到各个类的距离,再基于距离确定训练样本点是否属于该类。
上述将已打标签的样本数据作为训练样本,训练K均值聚类算法的目标函数的过程实际是将每一个点划分给各自所属的类中心,即对代价函数J进行最小化的过程,使得参数c(1),…,c(i),…,c(m)同时保持最近的类中心μ1,…,μk,…,μK固定不变。
本实施例提供的上述方案不是改变类中心的位置,而是选择c(1),…,c(i),…,c(m)来最小化这个代价函数J,即把些点划分到离它们最近的类中心,因为这样才会保证每个训练样本到对应类中心的距离最短。
例如,通过如下方式实现:
另外,上述方案实际上是选择了能够最小化代价函数J的μ的值(即能够最小化代价函数J的所有类的中心值μ1,…,μk,…,μK),也就是最小化代价函数J。
具体的是把这两组变量在这两部分中分割开来最小化代价函数J。首先是c作为变量然后是μ作为变量,先关于c求J的最小值然后关于μ求J的最小值,反复循环。
例如,训练样本对应的点如图4所示,若将其分为两类,则按照本步骤提供的训练算法,其实现过程为:
随机挑选图4中的两个点分别作为2个类的中心,如图5所示的×、☆点,训练K均值聚类算法的目标函数是一个迭代过程。
先将图5中所有的训练样本对应的点根据其距离×、☆的距离分配到类中。如图6所示(实心点被分配到以×为中心的类中,空心点被分配到以☆为中心的类中)。
计算各类中心点的平均值(即平均下来的位置),将相应的类中心移动到这个均值处,其移动过程如图7所示。
参见图8,进行继续迭代,直至再继续迭代,类中心不会再做改变(或者改变很小,如改变的差值小于第一预设值)。
训练好的K均值聚类算法的目标函数可以得到任何一个输入数据所属类,尤其对不易分离的聚类有很好的效果。例如,图9所示对于不同身高、体重的人群衬衫的尺寸是相差很多的,若利用训练好的K均值聚类算法的目标函数进行聚类分析,形成3个类,即三种类,可以确定输入数据所属码数(L、M或S),如图10所示,实现市场细分Marketsegmentation的一个隔离。
总的来说,将所述标签集合输入以样本对象及其对应的样本标签集合作为训练样本训练得到的贷前信用评估模型中,贷前信用评估模型是以所述样本对象及其对应的所述样本标签集合作为训练样本,以所述样本对象的贷前信用评估结果作为训练结果,训练得到的,其可以看作为一个对象的标签集合与其贷前信用所应有的具象关联关系,因此,通过贷前信用评估模型对目标对象的标签集合进行评估后,可得到对目标对象的贷前信用评估结果。
通过以上技术方案,能够通过机器学习方式实现对借贷人贷前信用的精确评估,减少具有可靠还贷能力的借贷人因贷前评估不合理而被拒贷的情况发生,能够提升贷前评估的有效性,有助于借贷业务的展开。同时,此评估方式大大减少了人工评估的工作量,减少了人力成本,提升了贷前评估的效率和准确性。
图11示出了根据本发明的一个实施例的贷前审核装置的框图。
如图11所示,根据本发明的一个实施例的贷前审核装置300,包括:征信信息获取单元302,用于获取目标对象的征信信息;黑名单判断单元304,用于根据所述征信信息,判断所述目标对象是否存在于指定黑名单集合中的任一黑名单中;标签生成单元306,用于根据判断结果,为所述目标对象生成标签集合,其中,所述标签集合中的标签与所述指定黑名单集合中的黑名单一一对应;标签输入单元308,用于将所述标签集合输入以样本对象及其对应的样本标签集合作为训练样本训练得到的贷前信用评估模型中;贷前评估单元310,用于通过所述贷前信用评估模型输出对所述目标对象的贷前信用评估结果。
该贷前审核装置300使用图1至图10示出的实施例中任一项所述的方案,因此,具有上述所有技术效果,在此不再赘述。贷前审核装置300还具有以下技术特征:
在本发明上述实施例中,可选地,所述目标对象包括自然人和/或企业;所述指定黑名单集合包括失信对象黑名单、司法负面黑名单和多头借贷黑名单中的一种或多种,以及,所述指定黑名单集合中每种黑名单的数量为一个或多个。
在本发明上述实施例中,可选地,所述贷前评估单元310具体用于:通过预设的K均值聚类算法对所述标签集合进行聚类计算,得到所述标签集合对应的聚类结果,并将所述聚类结果对应的指定信贷结果确定为所述目标对象的贷前信用评估结果。
在本发明上述实施例中,可选地,所述预设的K均值聚类算法具体用于:随机选择与所述指定信贷结果相同数量的在前聚类中心;根据所述标签集合中的每个标签与所述在前聚类中心的相对位置关系,将所述每个标签分配至与自身距离最近的目标在前聚类中心;根据所述每个标签的实际分配信息,重新确定与所述指定信贷结果相同数量的在后聚类中心;在所述在后聚类中心中,为所述每个标签选择与自身距离最近的目标在后聚类中心;循环所述将所述每个标签分配的步骤与重新确定聚类中心的步骤,至所述在后聚类中心与所述在前聚类中心相同。
在本发明上述实施例中,可选地,还包括:模型训练单元,用于在所述征信信息获取单元302获取所述目标对象的所述征信信息之前,以所述样本对象及其对应的所述样本标签集合作为训练样本,以所述样本对象的贷前信用评估结果作为训练结果,训练所述贷前信用评估模型。
图12示出了本发明的一个实施例的终端的框图。
如图12所示,本发明的一个实施例的电子设备1200,包括至少一个存储器1202。以及,与所述至少一个存储器1202通信连接的处理器1204。其中,所述存储器存储有可被所述至少一个处理器1204执行的指令,所述指令被设置为用于执行上述图1至图10实施例中任一项所述的方案。因此,该电子设备1200具有和图1至图10实施例中任一项相同的技术效果,在此不再赘述。
本发明实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
另外,本发明实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述图1至图10实施例中任一项所述的方法流程。
以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,能够通过机器学习方式实现对借贷人贷前信用的精确评估,减少具有可靠还贷能力的借贷人因贷前评估不合理而被拒贷的情况发生,能够提升贷前评估的有效性,有助于借贷业务的展开。同时,此评估方式大大减少了人工评估的工作量,减少了人力成本,提升了贷前评估的效率和准确性。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (10)
1.一种贷前审核方法,其特征在于,包括:
获取目标对象的征信信息;
根据所述征信信息,判断所述目标对象是否存在于指定黑名单集合中的任一黑名单中;
根据判断结果,为所述目标对象生成标签集合,其中,所述标签集合中的标签与所述指定黑名单集合中的黑名单一一对应;
将所述标签集合输入以样本对象及其对应的样本标签集合作为训练样本训练得到的贷前信用评估模型中;
通过所述贷前信用评估模型输出对所述目标对象的贷前信用评估结果。
2.根据权利要求1所述的贷前审核方法,其特征在于,
所述目标对象包括自然人和/或企业;
所述指定黑名单集合包括失信对象黑名单、司法负面黑名单和多头借贷黑名单中的一种或多种,以及,所述指定黑名单集合中每种黑名单的数量为一个或多个。
3.根据权利要求1所述的贷前审核方法,其特征在于,所述通过所述贷前信用评估模型输出对所述目标对象的贷前信用评估结果的步骤,具体包括:
通过预设的K均值聚类算法对所述标签集合进行聚类计算,得到所述标签集合对应的聚类结果;
将所述聚类结果对应的指定信贷结果确定为所述目标对象的贷前信用评估结果。
4.根据权利要求3所述的贷前审核方法,其特征在于,所述预设的K均值聚类算法具体包括:
随机选择与所述指定信贷结果相同数量的在前聚类中心;
根据所述标签集合中的每个标签与所述在前聚类中心的相对位置关系,将所述每个标签分配至与自身距离最近的目标在前聚类中心;
根据所述每个标签的实际分配信息,重新确定与所述指定信贷结果相同数量的在后聚类中心;
在所述在后聚类中心中,为所述每个标签选择与自身距离最近的目标在后聚类中心;
循环所述将所述每个标签分配的步骤与重新确定聚类中心的步骤,至所述在后聚类中心与所述在前聚类中心相同。
5.根据权利要求1至4中任一项所述的贷前审核方法,其特征在于,在所述获取目标对象的征信信息的步骤之前,还包括:
以所述样本对象及其对应的所述样本标签集合作为训练样本,以所述样本对象的贷前信用评估结果作为训练结果,训练所述贷前信用评估模型。
6.一种贷前审核装置,其特征在于,包括:
征信信息获取单元,用于获取目标对象的征信信息;
黑名单判断单元,用于根据所述征信信息,判断所述目标对象是否存在于指定黑名单集合中的任一黑名单中;
标签生成单元,用于根据判断结果,为所述目标对象生成标签集合,其中,所述标签集合中的标签与所述指定黑名单集合中的黑名单一一对应;
标签输入单元,用于将所述标签集合输入以样本对象及其对应的样本标签集合作为训练样本训练得到的贷前信用评估模型中;
贷前评估单元,用于通过所述贷前信用评估模型输出对所述目标对象的贷前信用评估结果。
7.根据权利要求6所述的贷前审核装置,其特征在于,
所述目标对象包括自然人和/或企业;
所述指定黑名单集合包括失信对象黑名单、司法负面黑名单和多头借贷黑名单中的一种或多种,以及,所述指定黑名单集合中每种黑名单的数量为一个或多个。
8.根据权利要求6所述的贷前审核装置,其特征在于,所述贷前评估单元具体用于:
通过预设的K均值聚类算法对所述标签集合进行聚类计算,得到所述标签集合对应的聚类结果,并将所述聚类结果对应的指定信贷结果确定为所述目标对象的贷前信用评估结果。
9.一种电子设备,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述权利要求1至5中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1至5中任一项所述的方法流程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910750196.9A CN110717817A (zh) | 2019-08-14 | 2019-08-14 | 贷前审核方法及装置、电子设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910750196.9A CN110717817A (zh) | 2019-08-14 | 2019-08-14 | 贷前审核方法及装置、电子设备和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110717817A true CN110717817A (zh) | 2020-01-21 |
Family
ID=69209406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910750196.9A Pending CN110717817A (zh) | 2019-08-14 | 2019-08-14 | 贷前审核方法及装置、电子设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110717817A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709833A (zh) * | 2020-06-16 | 2020-09-25 | 中国银行股份有限公司 | 用户信用的评估方法及装置 |
TWI742528B (zh) * | 2020-02-05 | 2021-10-11 | 玉山商業銀行股份有限公司 | 智能型貸款審核方法與系統 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001009787A2 (en) * | 1999-07-30 | 2001-02-08 | Autobytel.Com, Inc. | Electronic financing system |
US20090299911A1 (en) * | 2008-05-29 | 2009-12-03 | Clark Richard Abrahams | Computer-Implemented Systems And Methods For Loan Evaluation Using A Credit Assessment Framework |
US20150142631A1 (en) * | 2013-11-20 | 2015-05-21 | Shortsave, Inc. | Method and system for underperforming credit analysis |
CN106373006A (zh) * | 2016-09-07 | 2017-02-01 | 派生科技集团股份有限公司 | 一种通过大数据建模来评判用户信用及还款意愿的方法 |
CN106780012A (zh) * | 2016-12-29 | 2017-05-31 | 深圳微众税银信息服务有限公司 | 一种互联网信贷方法及系统 |
CN106897918A (zh) * | 2017-02-24 | 2017-06-27 | 上海易贷网金融信息服务有限公司 | 一种混合式机器学习信用评分模型构建方法 |
CN107657525A (zh) * | 2017-08-29 | 2018-02-02 | 深圳市佰仟金融服务有限公司 | 一种贷款审批方法及服务器 |
CN107886425A (zh) * | 2017-10-25 | 2018-04-06 | 上海壹账通金融科技有限公司 | 信贷评估方法、装置、设备及计算机可读存储介质 |
CN107993143A (zh) * | 2017-11-23 | 2018-05-04 | 深圳大管加软件与技术服务有限公司 | 一种信贷风险评估方法及系统 |
CN108269186A (zh) * | 2018-01-23 | 2018-07-10 | 平安好房(上海)电子商务有限公司 | 用户信息验证方法、装置、设备及可读存储介质 |
CN109345371A (zh) * | 2018-08-30 | 2019-02-15 | 成都数联铭品科技有限公司 | 个人征信报告回溯方法及系统 |
CN109636083A (zh) * | 2018-10-16 | 2019-04-16 | 深圳壹账通智能科技有限公司 | 黑名单分析方法、装置、设备及计算机可读存储介质 |
CN109711733A (zh) * | 2018-12-28 | 2019-05-03 | 上海盛付通电子支付服务有限公司 | 用于生成聚类模型的方法、电子设备和计算机可读介质 |
CN109710687A (zh) * | 2018-11-23 | 2019-05-03 | 泰康保险集团股份有限公司 | 基于区块链的投保处理方法、装置及电子设备 |
CN109978680A (zh) * | 2019-03-18 | 2019-07-05 | 杭州绿度信息技术有限公司 | 一种细分客群信贷业务风控差异化定价的风控方法和系统 |
CN110033365A (zh) * | 2019-04-11 | 2019-07-19 | 湖北风口网络科技有限公司 | 一种个人信用贷款审批系统及方法 |
-
2019
- 2019-08-14 CN CN201910750196.9A patent/CN110717817A/zh active Pending
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001009787A2 (en) * | 1999-07-30 | 2001-02-08 | Autobytel.Com, Inc. | Electronic financing system |
US20090299911A1 (en) * | 2008-05-29 | 2009-12-03 | Clark Richard Abrahams | Computer-Implemented Systems And Methods For Loan Evaluation Using A Credit Assessment Framework |
US20150142631A1 (en) * | 2013-11-20 | 2015-05-21 | Shortsave, Inc. | Method and system for underperforming credit analysis |
CN106373006A (zh) * | 2016-09-07 | 2017-02-01 | 派生科技集团股份有限公司 | 一种通过大数据建模来评判用户信用及还款意愿的方法 |
CN106780012A (zh) * | 2016-12-29 | 2017-05-31 | 深圳微众税银信息服务有限公司 | 一种互联网信贷方法及系统 |
CN106897918A (zh) * | 2017-02-24 | 2017-06-27 | 上海易贷网金融信息服务有限公司 | 一种混合式机器学习信用评分模型构建方法 |
CN107657525A (zh) * | 2017-08-29 | 2018-02-02 | 深圳市佰仟金融服务有限公司 | 一种贷款审批方法及服务器 |
WO2019080407A1 (zh) * | 2017-10-25 | 2019-05-02 | 深圳壹账通智能科技有限公司 | 信贷评估方法、装置、设备及计算机可读存储介质 |
CN107886425A (zh) * | 2017-10-25 | 2018-04-06 | 上海壹账通金融科技有限公司 | 信贷评估方法、装置、设备及计算机可读存储介质 |
CN107993143A (zh) * | 2017-11-23 | 2018-05-04 | 深圳大管加软件与技术服务有限公司 | 一种信贷风险评估方法及系统 |
CN108269186A (zh) * | 2018-01-23 | 2018-07-10 | 平安好房(上海)电子商务有限公司 | 用户信息验证方法、装置、设备及可读存储介质 |
CN109345371A (zh) * | 2018-08-30 | 2019-02-15 | 成都数联铭品科技有限公司 | 个人征信报告回溯方法及系统 |
CN109636083A (zh) * | 2018-10-16 | 2019-04-16 | 深圳壹账通智能科技有限公司 | 黑名单分析方法、装置、设备及计算机可读存储介质 |
CN109710687A (zh) * | 2018-11-23 | 2019-05-03 | 泰康保险集团股份有限公司 | 基于区块链的投保处理方法、装置及电子设备 |
CN109711733A (zh) * | 2018-12-28 | 2019-05-03 | 上海盛付通电子支付服务有限公司 | 用于生成聚类模型的方法、电子设备和计算机可读介质 |
CN109978680A (zh) * | 2019-03-18 | 2019-07-05 | 杭州绿度信息技术有限公司 | 一种细分客群信贷业务风控差异化定价的风控方法和系统 |
CN110033365A (zh) * | 2019-04-11 | 2019-07-19 | 湖北风口网络科技有限公司 | 一种个人信用贷款审批系统及方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI742528B (zh) * | 2020-02-05 | 2021-10-11 | 玉山商業銀行股份有限公司 | 智能型貸款審核方法與系統 |
CN111709833A (zh) * | 2020-06-16 | 2020-09-25 | 中国银行股份有限公司 | 用户信用的评估方法及装置 |
CN111709833B (zh) * | 2020-06-16 | 2023-10-31 | 中国银行股份有限公司 | 用户信用的评估方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111080442A (zh) | 信用评分模型的构建方法、装置、设备及存储介质 | |
CN110909165B (zh) | 数据处理方法、装置、介质及电子设备 | |
US11126827B2 (en) | Method and system for image identification | |
CN108961032A (zh) | 借贷处理方法、装置以及服务器 | |
CN107403311B (zh) | 账户用途的识别方法及装置 | |
CN111783039B (zh) | 风险确定方法、装置、计算机系统和存储介质 | |
CN112990294B (zh) | 行为判别模型的训练方法、装置、电子设备及存储介质 | |
CN111798047A (zh) | 风控预测方法、装置、电子设备及存储介质 | |
CN110135850A (zh) | 一种信息处理方法和相关装置 | |
CN111611390B (zh) | 一种数据处理方法及装置 | |
CN115174250B (zh) | 网络资产安全评估方法、装置、电子设备及存储介质 | |
CN110929525A (zh) | 一种网贷风险行为分析检测方法、装置、设备和存储介质 | |
CN108932646A (zh) | 基于运营商的用户标签验证方法、装置和电子设备 | |
CN112434884A (zh) | 一种供应商分类画像的建立方法及装置 | |
CN111062440B (zh) | 一种样本选择方法、装置、设备及存储介质 | |
CN110717817A (zh) | 贷前审核方法及装置、电子设备和计算机可读存储介质 | |
CN114169439A (zh) | 异常通信号码的识别方法、装置、电子设备和可读介质 | |
CN111553685B (zh) | 确定交易路由通道的方法、装置、电子设备和存储介质 | |
CN112035736B (zh) | 信息推送方法、装置及服务器 | |
CN113569957A (zh) | 一种业务对象的对象类型识别方法、装置及存储介质 | |
CN113487320A (zh) | 欺诈交易检测方法、装置、计算机设备和存储介质 | |
CN110888987B (zh) | 一种贷款中介的识别方法、系统、设备及存储介质 | |
CN114547448B (zh) | 数据处理、模型训练方法、装置、设备、存储介质及程序 | |
CN116228484B (zh) | 基于量子聚类算法的课程组合方法及装置 | |
CN110245302B (zh) | 用于识别欺诈案件的策略生成方法及装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |