CN110334936B - 一种信贷资质评分模型的构建方法、装置和设备 - Google Patents

一种信贷资质评分模型的构建方法、装置和设备 Download PDF

Info

Publication number
CN110334936B
CN110334936B CN201910573168.4A CN201910573168A CN110334936B CN 110334936 B CN110334936 B CN 110334936B CN 201910573168 A CN201910573168 A CN 201910573168A CN 110334936 B CN110334936 B CN 110334936B
Authority
CN
China
Prior art keywords
user
indexes
feature
saliency
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910573168.4A
Other languages
English (en)
Other versions
CN110334936A (zh
Inventor
娄敏嫣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201910573168.4A priority Critical patent/CN110334936B/zh
Publication of CN110334936A publication Critical patent/CN110334936A/zh
Application granted granted Critical
Publication of CN110334936B publication Critical patent/CN110334936B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Abstract

本申请实施例公开了一种信贷资质评分模型的构建方法、装置和电子设备,该方法包括:获取具有预设资质的多个用户的用户画像特征数据,所述用户画像特征数据包括多个特征指标,所述预设资质的用户为信贷资质大于或等于预设阈值的用户;基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,以获取所述多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个所述聚类群组对应于一个显著度,所述显著度用于表征所述聚类群组包含的用户在所述多个用户中的占比;基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标对应的预设权重,构建信贷资质评分模型。

Description

一种信贷资质评分模型的构建方法、装置和设备
技术领域
本申请涉及计算机软件技术领域,尤其涉及一种信贷资质评分模型的构建方法、装置和电子设备。
背景技术
目前,对于有良好信用贷款记录的用户的信贷资质的认证,往往能够通过一些训练好的模型对用户进行信贷资质的认证,即可以将用户的一些信贷记录数据作为模型的输入,以输出用户的信贷资质。
然而,对于一些没有信贷记录的用户,即新用户而言,由于考核其信用贷款记录方面的数据较为匮乏,难以通过现有的模型对其信贷资质进行有效认证,此时其信贷资质的认证往往是需要依靠相关认证人员基于历史经验进行手动认证的。因此,如何快速准确地对缺乏信用记录的用户进行信贷资质的认证仍然亟待解决。
发明内容
本申请实施例的目的是提供一种信贷资质评分模型的构建方法、装置及电子设备,在对一些无信贷记录的准新用户进行信贷资质认证时,能够减少对相关信贷资质认证人员配合的依赖,或不依赖于相关信贷资质认证人员的配合,达到准确认证的效果。
为解决上述技术问题,本申请实施例是这样实现的:
第一方面,提出了一种信贷资质评分模型的构建方法,该方法包括:
获取具有预设资质的多个用户的用户画像特征数据,所述用户画像特征数据包括多个特征指标,所述预设资质的用户为信贷资质大于或等于预设阈值的用户;
基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,以获取所述多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个所述聚类群组对应于一个显著度,所述显著度用于表征所述聚类群组包含的用户在所述多个用户中的占比;
基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标对应的预设权重,构建信贷资质评分模型。
第二方面,提出了一种生物特征认证识别检测装置,该装置包括:
获取单元,获取具有预设资质的多个用户的用户画像特征数据,所述用户画像特征数据包括多个特征指标,所述预设资质的用户为具有信贷资质且信贷资质大于或等于预设阈值的用户;
训练单元,基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,以获取所述多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个所述聚类群组对应于一个显著度,所述显著度用于表征所述聚类群组包含的用户在所述多个用户中的占比;
构建单元,基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标对应的预设权重,构建信贷资质评分模型。
第三方面,提出了一种电子设备,该电子设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取具有预设资质的多个用户的用户画像特征数据,所述用户画像特征数据包括多个特征指标,所述预设资质的用户为信贷资质大于或等于预设阈值的用户;
基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,以获取所述多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个所述聚类群组对应于一个显著度,所述显著度用于表征所述聚类群组包含的用户在所述多个用户中的占比;
基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标对应的预设权重,构建信贷资质评分模型。
第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取具有预设资质的多个用户的用户画像特征数据,所述用户画像特征数据包括多个特征指标,所述预设资质的用户为信贷资质大于或等于预设阈值的用户;
基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,以获取所述多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个所述聚类群组对应于一个显著度,所述显著度用于表征所述聚类群组包含的用户在所述多个用户中的占比;
基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标对应的预设权重,构建信贷资质评分模型。
由以上本申请实施例提供的技术方案可见,本申请实施例方案至少具备如下一种技术效果:
通过获取具有预设资质的多个用户的用户画像特征数据,该用户画像特征数据包括多个特征指标,其中预设资质的用户为信贷资质大于或等于预设阈值的用户,并能基于该多个特征指标对多个用户的用户画像特征数据进行聚类训练,以获取多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个聚类群组对应于一个显著度,显著度用于表征聚类群组包含的用户在多个用户中的占比,再基于多个特征指标对应的聚类群组的显著度和多个特征指标对应的预设权重,构建信贷资质评分模型。这样对于一些无信贷记录的准新用户进行信贷资质认证时,能够减少对相关信贷资质认证人员配合的依赖,或不依赖于相关信贷资质认证人员的配合,直接基于该信贷资质评分模型和该准新用户的用户画像特征数据,准确确定出该准新用户的信贷资质评分。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书的一个实施例提供的一种信贷资质评分模型的构建方法的实现流程示意图。
图2是本说明书的一个实施例提供的信贷资质评分模型的构建方法应用在一种实际场景中的流程图。
图3是本说明书的一个实施例提供的信贷资质评分模型的构建装置的结构示意图。
图4是说明书的一个实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1是本说明书一个或多个实施例提供的一种信贷资质评分模型的构建方法的实现流程示意图图。图1的方法可由信贷资质评分模型的构建装置执行,或者说,图1的方法可由服务器执行,包括:
S110,获取具有预设资质的多个用户的用户画像特征数据,该用户画像特征数据包括多个特征指标,该预设资质的用户为信贷资质大于或等于预设阈值的用户。
可选地,在对一些无信贷记录的准新用户进行信贷资质认证时,为了能够减少对相关信贷资质认证人员配合的依赖,或不依赖于相关信贷资质认证人员的配合,本说明书一个或多个实施例可以获取具有预设资质的多个用户的用户画像特征数据,并基于多个特征指标对这些用户的用户画像特征数据进行无监督聚类训练,得到多个特征指标对应的聚类群组的显著度。基于此构建的信贷资质评分模型由于不涉及用户的信贷记录,那么在对一些无信贷记录的准新用户进行信贷资质认证时,则可以基于该准新用户的用户画像特征数据以及信贷资质评分模型,确定该准新用户的信贷资质。
为了使得构建的信贷资质评分模型能够准确地确定准新用户的信贷资质,本说明书实施例中的特征指标可以从具有良好信贷资质的用户的信贷记录以外的其他数据着手,比如用户的IP地址是否合法、用户的交易记录是否存在异常、用户的社交能力的强弱等多个特征指标来构建信贷资质评分模型。可选地,上述多个特征指标包括下述至少一种:
IP地址的类型;
常驻地址的特征;
手机号码的特征;
身份信息;
交易记录;
手机型号;
社交能力。
其中,IP地址包括虚拟IP地址、国外的IP地址、出现归属地异常的IP地址。常驻地址的特征可以包括是否有住宅、以及住宅区域的房价等级等特征。手机号码的特征包括手机号码是否为推销号码、手机号码是否存在欠费情况、手机号码是否与多张卡绑定等。身份信息包括身份证的归属地、年龄等信息。交易记录包括每月消费水平、乘车记录等记录。手机型号包括手机品牌和对应的型号。社交能力包括社交圈的质量、存在社交关系的人数等。
S120,基于多个特征指标对多个用户的用户画像特征数据进行聚类训练,以获取多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个聚类群组对应于一个显著度,显著度用于表征聚类群组包含的用户在多个用户中的占比。
其中,基于多个特征指标对多个用户的用户画像特征数据进行聚类训练,具体可以基于多个特征指标对多个用户的用户画像特征数据进行无监督聚类训练。
可选地,在实际应用中显著度可以通过证据权重(Weight of Evidence,WOE)来表征。
对于无监督的模型训练来说,需要对没有概念标记(分类)的训练样本进行学习,以发现训练样本集中的结构性知识。在无监督的模型训练中,所有的标记(分类)是未知的。无监督训练模型的算法,可以包括所有的聚类算法,比如k-means、主成分分析(PrincipalComponent Analysis,PCA)、高斯混合模型(gaussian mixture model,GMM)等等。
其中,以IP地址为例,这些不同类型的IP地址具备的特征也不相同,基于此,可以对IP地址进行无监督训练,得到IP地址的特征对应的多个聚类群组,每个聚类群组对应于一个显著度,即该聚类群组包含的IP地址的数量在IP地址的总数量中的占比。由于这些IP地址均来自信贷资质良好的用户,那么可以确定若某个用户的IP地址的显著度越高,则表明该用户的信贷资质越好的可能性越高。
可选地,由于多个用户的用户画像特征数据中也可能会包括一些异常或者多余的数据,比如用户画像特征数据中可能会出现多个特征指标以外的数据,为了减小这些异常或多余的数据对构建信贷资质评分模型造成的额外负担,本说明书实施例可以对多个用户的用户画像特征数据进行数据清洗操作。
可选地,由于不同的特征指标对应的量纲不同,比如身份信息中的年龄通常为两位数、而常驻地的特征则包括具体的地理位置,为了统一不同的特征指标对应的量纲,以便构建信贷资质评分模型,本说明书实施例可以对多个用户的用户画像特征数据进行归一化处理。
那么,对信贷资质评分模型的评分基于多个特征指标对多个用户的用户画像特征数据进行聚类训练,包括:
对多个用户的用户画像特征数据进行预处理,得到经过预处理后的多个用户的用户画像特征数据,预处理包括如下至少一种:数据清洗操作、归一化操作;
基于多个特征指标,对预处理后的多个用户的用户画像特征数据进行聚类训练。
应理解,由于多个用户的用户画像特征数据中包括多个特征指标,为了准确地确定各个特征指标对应的多个聚类群组的显著度,本说明书实施例可以基于多个特征指标,将多个用户的用户画像特征数据进行归类,得到多个特征指标对应的多个群组的用户画像特征数据,再对每个群组的用户画像特征数据进行聚类训练。那么,基于多个特征指标对多个用户的用户画像特征数据进行聚类训练,包括:
基于多个特征指标,将多个用户的用户画像特征数据进行归类,以得到多个特征指标对应的多个群组的用户画像特征数据;
分别对多个群组的用户画像特征数据进行聚类训练。
其中,为了确定各个群组的用户画像特征数据中显著度较高的聚类群组,本说明书实施例分别对多个群组的用户画像特征数据进行聚类训练,具体可以分别对多个群组的用户画像特征数据进行无监督聚类训练。
S130,基于多个特征指标对应的聚类群组的显著度和多个特征指标对应的预设权重,构建信贷资质评分模型。
可选地,在构建信贷资质评分模型之后,可以基于该信贷资质评分模型对一些无信贷记录的准新用户进行信贷资质评分。那么,在基于多个特征指标对应的聚类群组的显著度和多个特征指标对应的预设权重,构建信贷资质评分模型之后,该方法还包括:
获取待评分用户的用户画像特征数据;
基于待评分用户的用户画像特征数据和信贷资质评分模型,确定待评分用户的信贷资质评分。
应理解,该待评分用户的用户画像特征数据包括多个特征指标,比如可以包括待评分用户的IP地址的类型、常驻地址的特征、手机号码的特征、身份信息、交易记录、手机型号和社交能力中的一种或几种的组合。
可选地,基于待评分用户的用户画像特征数据和信贷资质评分模型,确定待评分用户的信贷资质评分,包括:
基于信贷资质评分模型,分别确定待评分用户的用户画像特征数据对应的多个特征指标的显著度;
基于待评分用户的用户画像特征数据对应的多个特征指标的显著度、和信贷资质评分模型中的多个特征指标对应的预设权重,确定待评分用户的信贷资质评分。
以多个特征指标包括待评分用户的IP地址的类型、常驻地址的特征、手机号码的特征、身份信息、交易记录、手机型号和社交能力为例,那么,基于信贷资质评分模型,可以分别确定待评分用户的IP地址的类型的第一显著度、待评分用户的常驻地址的特征的第二显著度、待评分用户的手机号码的特征的第三显著度、待评分用户的身份信息的第四显著度、待评分用户的交易记录的第五显著度、待评分用户的手机型号的第六显著度和待评分用户的社交能力的第七显著度。
在确定了待评分用户的各个特征指标对应的显著度之后,再基于信贷资质评分模型中的多个特征指标对应的预设权重,即IP地址的第一预设权重、常驻地址的特征的第二预设权重、手机号码的特征的第三预设权重、身份信息的第四预设权重、交易记录的第五预设权重、手机型号的第六预设权重和社交能力的第七预设权重,确定带评分用户的信贷资质评分。
可选地,基于待评分用户的用户画像特征数据对应的多个特征指标的显著度、和信贷资质评分模型中的多个特征指标对应的预设权重,确定待评分用户的信贷资质评分,包括:
基于待评分用户的用户画像特征数据对应的多个特征指标的显著度、和信贷资质评分模型中的多个特征指标对应的预设权重,确定待评分用户的用户画像特征数据对应的多个特征指标的显著度的加权之和;
基于待评分用户的用户画像特征数据对应的多个特征指标的显著度的加权之和,确定待评分用户的信贷资质评分。
继续以多个特征指标包括待评分用户的IP地址的类型、常驻地址的特征、手机号码的特征、身份信息、交易记录、手机型号和社交能力为例,确定待评分用户的信贷资质评分具体可以通过下述公式来确定:待评分用户的信贷资质评分=第一显著度×第一预设权重+第二显著度×第二预设权重+第三显著度×第三预设权重+第四显著度×第四预设权重+第五显著度×第五预设权重+第六显著度×第六预设权重+第七显著度×第七预设权重。
下面以图2所示的一种实际场景中的流程图为例,对本说明书实施例提供的信贷资质评分模型的构建方法进行详细说明,如图2所示,包括:
S21,基于多个特征指标对多个用户的用户画像特征数据进行分类,以获取多个特征指标对应的多个群组的用户画像特征数据,其中,该多个用户为已具备信贷资质且信贷资质良好的用户;
如图2所示,可以将这多个用户的用户画像特征数据按照IP地址、常驻地址、手机号码、身份特征、交易记录、手机型号以及社交能力进行分类,也就是说,将多个用户的用户画像特征数据的所有IP地址归为一类、所有的常驻地址归为一类、……、以及将所有的社交能力归为一类。
S22,对每个特征指标对应的用户画像特征数据进行无监督聚类训练;
即分别对IP地址群组、常驻地址群组、手机号码群组、身份特征群组、交易记录群组、手机型号群组以及社交能力群组进行无监督聚类训练,应理解,为便于计算信贷资质评分,可以先对IP地址群组、常驻地址群组、手机号码群组、身份特征群组、交易记录群组、手机型号群组以及社交能力群组中的数据进行归一化处理和数据清洗处理,再基于归一化处理和数据清洗处理之后的数据进行无监督聚类训练。
S23,获取每个特征指标对应的多个聚类群组、以及每个聚类群组在对应的特征指标所在群组中的显著度,即WOE分值。
如图2所示,假设经过无监督聚类训练后分别得到N个IP群(IP群1~IP群N)、N个常驻地群(常驻地群1~常驻地群N)、N个手机号群(手机号群1~手机号群N)、N个身份群(身份群1~身份群N)、N个交易群(交易群1~交易群N)、N个手机群(手机群1~手机群N)以及N个社交群(社交群1~社交群N),以及这些群在各个群组中的显著度。
S24,通过公式新的资质评分=多个特征指标的显著度的加权之和,来构建信贷资质评分模型。
通过获取具有预设资质的多个用户的用户画像特征数据,该用户画像特征数据包括多个特征指标,其中预设资质的用户为信贷资质大于或等于预设阈值的用户,并能基于该多个特征指标对多个用户的用户画像特征数据进行聚类训练,以获取多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个聚类群组对应于一个显著度,显著度用于表征聚类群组包含的用户在多个用户中的占比,再基于多个特征指标对应的聚类群组的显著度和多个特征指标对应的预设权重,构建信贷资质评分模型。这样对于一些无信贷记录的准新用户进行信贷资质认证时,能够减少对相关信贷资质认证人员配合的依赖,或不依赖于相关信贷资质认证人员的配合,直接基于该信贷资质评分模型和该准新用户的用户画像特征数据,准确确定出该准新用户的信贷资质评分。
图3是本说明书实施例提供的一种信贷资质评分模型的构建装置300的结构示意图,在一种软件实施方式中,该信贷资质评分模型的构建装置300可包括获取单元301、训练单元302和构建单元303,其中:
获取单元301,获取具有预设资质的多个用户的用户画像特征数据,所述用户画像特征数据包括多个特征指标,所述预设资质的用户为具有信贷资质且信贷资质大于或等于预设阈值的用户;
训练单元302,基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,以获取所述多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个所述聚类群组对应于一个显著度,所述显著度用于表征所述聚类群组包含的用户在所述多个用户中的占比;
构建单元303,基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标对应的预设权重,构建信贷资质评分模型。
通过获取单元301获取具有预设资质的多个用户的用户画像特征数据,该用户画像特征数据包括多个特征指标,其中预设资质的用户为信贷资质大于或等于预设阈值的用户,并能提供训练单元302基于该多个特征指标对多个用户的用户画像特征数据进行聚类训练,以获取多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个聚类群组对应于一个显著度,显著度用于表征聚类群组包含的用户在多个用户中的占比,再通过构建单元303基于多个特征指标对应的聚类群组的显著度和多个特征指标对应的预设权重,构建信贷资质评分模型。这样对于一些无信贷记录的准新用户进行信贷资质认证时,能够减少对相关信贷资质认证人员配合的依赖,或不依赖于相关信贷资质认证人员的配合,直接基于该信贷资质评分模型和该准新用户的用户画像特征数据,准确确定出该准新用户的信贷资质评分。
可选地,在一种实施方式中,所述训练单元302,用于:
对所述多个用户的用户画像特征数据进行预处理,得到经过所述预处理后的多个用户的用户画像特征数据,所述预处理包括如下至少一种:数据清洗操作、归一化操作;
基于所述多个特征指标,对所述预处理后的多个用户的用户画像特征数据进行聚类训练。
可选地,在一种实施方式中,所述训练单元302,用于:
基于所述多个特征指标,将所述多个用户的用户画像特征数据进行归类,以得到所述多个特征指标对应的多个群组的用户画像特征数据;
分别对所述多个群组的用户画像特征数据进行聚类训练。
可选地,在一种实施方式中,在所述构建单元303基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标的预设权重,构建信贷资质评分模型之后,所述装置还包括:
第一获取单元304,获取待评分用户的用户画像特征数据;
第一确定单元305,基于所述待评分用户的用户画像特征数据和所述信贷资质评分模型,确定所述待评分用户的信贷资质评分。
可选地,在一种实施方式中,所述第一确定单元305,用于:
基于所述信贷资质评分模型,分别确定所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度;
基于所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度、和所述信贷资质评分模型中的所述多个特征指标对应的预设权重,确定所述待评分用户的信贷资质评分。
可选地,在一种实施方式中,所述第一确定单元305,用于:
基于所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度、和所述信贷资质评分模型中的所述多个特征指标对应的预设权重,确定所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度的加权之和;
基于所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度的加权之和,确定所述待评分用户的信贷资质评分。
可选地,在一种实施方式中,所述多个特征指标包括下述至少一种:
IP地址的类型;
常驻地址的特征;
手机号码的特征;
身份信息;
交易记录;
手机型号;
社交能力。
信贷资质评分模型的构建装置300能够实现图1~图2的方法实施例的方法,具体可参考图1~图2所示实施例的信贷资质评分模型的构建方法,不再赘述。
图4是本申请的一个实施例电子设备的结构示意图。请参考图4,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成信贷资质评分模型的构建装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取具有预设资质的多个用户的用户画像特征数据,所述用户画像特征数据包括多个特征指标,所述预设资质的用户为信贷资质大于或等于预设阈值的用户;
基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,以获取所述多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个所述聚类群组对应于一个显著度,所述显著度用于表征所述聚类群组包含的用户在所述多个用户中的占比;
基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标对应的预设权重,构建信贷资质评分模型。
上述如本申请图1~图2所示实施例揭示的信贷资质评分模型的构建装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1~图2的方法,并实现信贷资质评分模型的构建装置在图1~图2所示实施例的功能,本申请实施例在此不再赘述。
当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:
获取具有预设资质的多个用户的用户画像特征数据,所述用户画像特征数据包括多个特征指标,所述预设资质的用户为信贷资质大于或等于预设阈值的用户;
基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,以获取所述多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个所述聚类群组对应于一个显著度,所述显著度用于表征所述聚类群组包含的用户在所述多个用户中的占比;
基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标对应的预设权重,构建信贷资质评分模型。
当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
总之,以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

Claims (8)

1.一种信贷资质评分模型的构建方法,包括:
获取具有预设资质的多个用户的用户画像特征数据,所述用户画像特征数据包括多个特征指标,所述预设资质的用户为信贷资质大于或等于预设阈值的用户;
基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,以获取所述多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个所述聚类群组对应于一个显著度,所述显著度用于表征所述聚类群组包含的用户在所述多个用户中的占比;
基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标对应的预设权重,构建信贷资质评分模型;
获取待评分用户的用户画像特征数据;
基于所述信贷资质评分模型,分别确定所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度;
基于所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度、和所述信贷资质评分模型中的所述多个特征指标对应的预设权重,确定所述待评分用户的信贷资质评分。
2.如权利要求1所述的方法,基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,包括:
对所述多个用户的用户画像特征数据进行预处理,得到经过所述预处理后的多个用户的用户画像特征数据,所述预处理包括如下至少一种:数据清洗操作、归一化操作;
基于所述多个特征指标,对所述预处理后的多个用户的用户画像特征数据进行聚类训练。
3.如权利要求1所述的方法,基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,包括:
基于所述多个特征指标,将所述多个用户的用户画像特征数据进行归类,以得到所述多个特征指标对应的多个群组的用户画像特征数据;
分别对所述多个群组的用户画像特征数据进行聚类训练。
4.如权利要求1所述的方法,基于所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度、和所述信贷资质评分模型中的所述多个特征指标对应的预设权重,确定所述待评分用户的信贷资质评分,包括:
基于所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度、和所述信贷资质评分模型中的所述多个特征指标对应的预设权重,确定所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度的加权之和;
基于所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度的加权之和,确定所述待评分用户的信贷资质评分。
5.如权利要求1~4中任一所述的方法,所述多个特征指标包括下述至少一种:
IP地址的类型;
常驻地址的特征;
手机号码的特征;
身份信息;
交易记录;
手机型号;
社交能力。
6.一种信贷资质评分模型的构建装置,包括:
获取单元,获取具有预设资质的多个用户的用户画像特征数据,所述用户画像特征数据包括多个特征指标,所述预设资质的用户为具有信贷资质且信贷资质大于或等于预设阈值的用户;
训练单元,基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,以获取所述多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个所述聚类群组对应于一个显著度,所述显著度用于表征所述聚类群组包含的用户在所述多个用户中的占比;
构建单元,基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标对应的预设权重,构建信贷资质评分模型;
第二获取单元,获取待评分用户的用户画像特征数据;
第一确定单元,基于所述信贷资质评分模型,分别确定所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度;
第二确定单元,基于所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度、和所述信贷资质评分模型中的所述多个特征指标对应的预设权重,确定所述待评分用户的信贷资质评分。
7.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取具有预设资质的多个用户的用户画像特征数据,所述用户画像特征数据包括多个特征指标,所述预设资质的用户为信贷资质大于或等于预设阈值的用户;
基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,以获取所述多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个所述聚类群组对应于一个显著度,所述显著度用于表征所述聚类群组包含的用户在所述多个用户中的占比;
基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标对应的预设权重,构建信贷资质评分模型;
获取待评分用户的用户画像特征数据;
基于所述信贷资质评分模型,分别确定所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度;
基于所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度、和所述信贷资质评分模型中的所述多个特征指标对应的预设权重,确定所述待评分用户的信贷资质评分。
8.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取具有预设资质的多个用户的用户画像特征数据,所述用户画像特征数据包括多个特征指标,所述预设资质的用户为信贷资质大于或等于预设阈值的用户;
基于所述多个特征指标对所述多个用户的用户画像特征数据进行聚类训练,以获取所述多个特征指标对应的聚类群组的显著度,其中,一个特征指标对应的聚类群组的数量为多个,一个所述聚类群组对应于一个显著度,所述显著度用于表征所述聚类群组包含的用户在所述多个用户中的占比;
基于所述多个特征指标对应的聚类群组的显著度和所述多个特征指标对应的预设权重,构建信贷资质评分模型;
获取待评分用户的用户画像特征数据;
基于所述信贷资质评分模型,分别确定所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度;
基于所述待评分用户的用户画像特征数据对应的所述多个特征指标的显著度、和所述信贷资质评分模型中的所述多个特征指标对应的预设权重,确定所述待评分用户的信贷资质评分。
CN201910573168.4A 2019-06-28 2019-06-28 一种信贷资质评分模型的构建方法、装置和设备 Active CN110334936B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910573168.4A CN110334936B (zh) 2019-06-28 2019-06-28 一种信贷资质评分模型的构建方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910573168.4A CN110334936B (zh) 2019-06-28 2019-06-28 一种信贷资质评分模型的构建方法、装置和设备

Publications (2)

Publication Number Publication Date
CN110334936A CN110334936A (zh) 2019-10-15
CN110334936B true CN110334936B (zh) 2023-09-29

Family

ID=68143419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910573168.4A Active CN110334936B (zh) 2019-06-28 2019-06-28 一种信贷资质评分模型的构建方法、装置和设备

Country Status (1)

Country Link
CN (1) CN110334936B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348657A (zh) * 2020-10-21 2021-02-09 深圳乐信软件技术有限公司 目标信贷用户的确定方法、装置、计算机设备及存储介质
CN112308703A (zh) * 2020-11-02 2021-02-02 创新奇智(重庆)科技有限公司 用户分群方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104730041A (zh) * 2013-12-20 2015-06-24 武汉新瑞达激光工程有限责任公司 一种提高激光探针塑料识别精度的方法及其装置
WO2016127883A1 (zh) * 2015-02-12 2016-08-18 阿里巴巴集团控股有限公司 一种图像区域检测方法及装置
CN105894028A (zh) * 2016-03-31 2016-08-24 百度在线网络技术(北京)有限公司 用户识别方法和装置
CN106447490A (zh) * 2016-09-26 2017-02-22 广州速鸿信息科技有限公司 一种基于用户画像的征信应用方法
CN107807997A (zh) * 2017-11-08 2018-03-16 北京奇虎科技有限公司 基于大数据的用户画像构造方法、装置及计算设备
CN107818506A (zh) * 2017-09-30 2018-03-20 上海壹账通金融科技有限公司 电子装置、信贷风险控制方法及存储介质
CN108303624A (zh) * 2018-01-31 2018-07-20 舒天才 一种基于声音信号分析的开关柜局部放电检测方法
CN108366045A (zh) * 2018-01-02 2018-08-03 北京奇艺世纪科技有限公司 一种风控评分卡的设置方法和装置
CN108596393A (zh) * 2018-04-28 2018-09-28 国信优易数据有限公司 一种金融电子资源预测模型的训练方法和装置
CN108961032A (zh) * 2017-05-25 2018-12-07 腾讯科技(深圳)有限公司 借贷处理方法、装置以及服务器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040030639A1 (en) * 2002-02-22 2004-02-12 Lendingtree, Inc. Method and computer network for co-ordinating a loan over the internet

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104730041A (zh) * 2013-12-20 2015-06-24 武汉新瑞达激光工程有限责任公司 一种提高激光探针塑料识别精度的方法及其装置
WO2016127883A1 (zh) * 2015-02-12 2016-08-18 阿里巴巴集团控股有限公司 一种图像区域检测方法及装置
CN105894028A (zh) * 2016-03-31 2016-08-24 百度在线网络技术(北京)有限公司 用户识别方法和装置
CN106447490A (zh) * 2016-09-26 2017-02-22 广州速鸿信息科技有限公司 一种基于用户画像的征信应用方法
CN108961032A (zh) * 2017-05-25 2018-12-07 腾讯科技(深圳)有限公司 借贷处理方法、装置以及服务器
CN107818506A (zh) * 2017-09-30 2018-03-20 上海壹账通金融科技有限公司 电子装置、信贷风险控制方法及存储介质
CN107807997A (zh) * 2017-11-08 2018-03-16 北京奇虎科技有限公司 基于大数据的用户画像构造方法、装置及计算设备
CN108366045A (zh) * 2018-01-02 2018-08-03 北京奇艺世纪科技有限公司 一种风控评分卡的设置方法和装置
CN108303624A (zh) * 2018-01-31 2018-07-20 舒天才 一种基于声音信号分析的开关柜局部放电检测方法
CN108596393A (zh) * 2018-04-28 2018-09-28 国信优易数据有限公司 一种金融电子资源预测模型的训练方法和装置

Also Published As

Publication number Publication date
CN110334936A (zh) 2019-10-15

Similar Documents

Publication Publication Date Title
CN109544166B (zh) 一种风险识别方法和装置
WO2019169977A1 (zh) 一种信息转化率的预测、信息推荐方法和装置
CN110826006B (zh) 基于隐私数据保护的异常采集行为识别方法和装置
US11379845B2 (en) Method and device for identifying a risk merchant
CN107563757B (zh) 数据风险识别的方法及装置
TWI764148B (zh) 風險預測和風險預測模型的訓練方法、裝置及電子設備
CN109598414B (zh) 风险评估模型训练、风险评估方法、装置及电子设备
CN108416616A (zh) 投诉举报类别的排序方法和装置
CN110009474B (zh) 一种信用风险评估方法、装置和电子设备
CN109034583A (zh) 异常交易识别方法、装置及电子设备
CN109271611B (zh) 一种数据校验方法、装置及电子设备
CN111126623B (zh) 一种模型更新方法、装置及设备
CN108550046A (zh) 一种资源和营销推荐方法、装置及电子设备
CN109064217B (zh) 基于用户等级的核身策略确定方法、装置及电子设备
CN110751515A (zh) 一种基于用户消费行为的决策方法和装置、电子设备及存储介质
CN110334936B (zh) 一种信贷资质评分模型的构建方法、装置和设备
CN109635953A (zh) 一种特征衍生方法、装置及电子设备
CN111582872A (zh) 异常账号检测模型训练、异常账号检测方法、装置及设备
CN111783126A (zh) 一种隐私数据识别方法、装置、设备和可读介质
CN111275071B (zh) 预测模型训练、预测方法、装置及电子设备
CN110929285B (zh) 一种隐私数据的处理方法及装置
CN110163470B (zh) 事件评估方法及装置
CN116189215A (zh) 自动审核方法、装置、电子设备及存储介质
CN114782224A (zh) 基于用户特征的网页考评作弊监测方法、装置及电子设备
CN110458393B (zh) 一种风险识别方案的确定方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40016180

Country of ref document: HK

TA01 Transfer of patent application right

Effective date of registration: 20200924

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200924

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant