CN113744049A - 个人征信评分获取方法、装置、服务器及介质 - Google Patents

个人征信评分获取方法、装置、服务器及介质 Download PDF

Info

Publication number
CN113744049A
CN113744049A CN202111098734.4A CN202111098734A CN113744049A CN 113744049 A CN113744049 A CN 113744049A CN 202111098734 A CN202111098734 A CN 202111098734A CN 113744049 A CN113744049 A CN 113744049A
Authority
CN
China
Prior art keywords
risk
type
dimension
dimensional coordinates
credit investigation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111098734.4A
Other languages
English (en)
Other versions
CN113744049B (zh
Inventor
徐一茗
敖倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202111098734.4A priority Critical patent/CN113744049B/zh
Publication of CN113744049A publication Critical patent/CN113744049A/zh
Application granted granted Critical
Publication of CN113744049B publication Critical patent/CN113744049B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Technology Law (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请公开了个人征信评分获取方法、装置、服务器及介质,可应用于人工智能领域、大数据领域、物联网领域、移动互联领域或金融领域或金融领域。从多个目标征信维度得到待测用户的征信信息,即目标征信维度对应的各维度类型的三维坐标,使得针对待测用户的个人征信评估更加全面,计算得到的个人征信评分更加准确。实现了获得待测用户的个人征信评分的目的。

Description

个人征信评分获取方法、装置、服务器及介质
技术领域
本申请涉及个人征信评估技术领域,更具体的说,是涉及个人征信评分获取方法、装置、服务器及介质。
背景技术
目前个人征信评估应用比较广泛,例如,用户在向银行进行贷款时,银行需要对用户进行个人征信评估,以便获知该用户的个人征信评分,从而评估该用户是否可以按时还款。
因此,如何获得用户的个人征信评分是本领域急需解决的技术难题。
发明内容
有鉴于此,本申请提供了一种个人征信评分获取方法、装置、服务器及介质。
为实现上述目的,本申请提供如下技术方案:
根据本公开实施例的第一方面,提供一种个人征信评分获取方法,包括:
获取待测用户的目标征信维度对应的各维度类型的三维坐标,所述目标征信维度包括:存单记录、贷款记录、透支消费记录、逾期还款记录、延时缴费记录、非透支消费记录、投资记录、提前结束投资记录、收入记录以及退货退款记录中的至少一个,所述目标征信维度的每一维度类型的三维坐标包括:第一数目、第二数目以及第三数目,所述第一数目表征在所述目标征信维度下属于所述维度类型的记录的总条数,所述第二数目表征在所述目标征信维度下属于所述维度类型的记录的总金额,所述第三数目表征在所述目标征信维度下所述维度类型对应的风险字段数目,所述维度类型对应的风险字段数目是指针对所述维度类型的评价内容和/或预设描述内容中包含的与高风险的相关度大于或等于预设阈值的字段的数目;
从预先设置的征信维度与风险等级的对应关系中,查找所述目标征信维度对应的风险等级;
将所述目标征信维度中风险等级高于或等于预设风险等级的目标征信维度划分至高风险征信维度集合;
将所述目标征信维度中风险等级低于所述预设风险等级的目标征信维度划分至低风险征信维度集合;
将所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个高风险区域,每一所述高风险区域对应一个高风险集合,所述高风险集合包含属于同一簇的所述三维坐标;
将所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个低风险区域,每一所述低风险区域对应一个低风险集合,所述低风险集合包含属于同一簇所述三维坐标;
从预先存储的区域与评分的对应关系中,查找所述多个高风险区域和所述多个低风险区域分别对应的评分;
基于所述多个高风险区域分别对应的评分和权重值,以及,所述多个低风险区域分别对应的评分和权重值,计算得到所述待测用户的个人征信评分,所述高风险区域的权重值为位于所述高风险区域的三维坐标包含的所述第一数目之和与所有所述目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和的比值,所述低风险区域的权重值为位于所述低风险区域的三维坐标包含的所述第一数目之和与所有所述目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和的比值。
根据本公开实施例的第二方面,提供一种个人征信评分获取装置,包括:
第一获取模块,用于获取待测用户的目标征信维度对应的各维度类型的三维坐标,所述目标征信维度包括:存单记录、贷款记录、透支消费记录、逾期还款记录、延时缴费记录、非透支消费记录、投资记录、提前结束投资记录、收入记录以及退货退款记录中的至少一个,所述目标征信维度的每一维度类型的三维坐标包括:第一数目、第二数目以及第三数目,所述第一数目表征在所述目标征信维度下属于所述维度类型的记录的总条数,所述第二数目表征在所述目标征信维度下属于所述维度类型的记录的总金额,所述第三数目表征在所述目标征信维度下所述维度类型对应的风险字段数目,所述维度类型对应的风险字段数目是指针对所述维度类型的评价内容和/或预设描述内容中包含的与高风险的相关度大于或等于预设阈值的字段的数目;
第一查找模块,用于从预先设置的征信维度与风险等级的对应关系中,查找所述目标征信维度对应的风险等级;
第一划分模块,用于将所述目标征信维度中风险等级高于或等于预设风险等级的目标征信维度划分至高风险征信维度集合;
第二划分模块,用于将所述目标征信维度中风险等级低于所述预设风险等级的目标征信维度划分至低风险征信维度集合;
第一聚类模块,用于将所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个高风险区域,每一所述高风险区域对应一个高风险集合,所述高风险集合包含属于同一簇的所述三维坐标;
第二聚类模块,用于将所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个低风险区域,每一所述低风险区域对应一个低风险集合,所述低风险集合包含属于同一簇所述三维坐标;
第二查找模块,用于从预先存储的区域与评分的对应关系中,查找所述多个高风险区域和所述多个低风险区域分别对应的评分;
第一计算模块,用于基于所述多个高风险区域分别对应的评分和权重值,以及,所述多个低风险区域分别对应的评分和权重值,计算得到所述待测用户的个人征信评分,所述高风险区域的权重值为位于所述高风险区域的三维坐标包含的所述第一数目之和与所有所述目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和的比值,所述低风险区域的权重值为位于所述低风险区域的三维坐标包含的所述第一数目之和与所有所述目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和的比值。
根据本公开实施例的第三方面,提供一种服务器,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的个人征信评分获取方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如第一方面所述的个人征信评分获取方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,可直接加载到计算机的内部存储器,所述存储器为第三方面所示的所述服务器包含的存储器中,并含有软件代码,所述计算机程序经由计算机载入并执行后能够实现如第一方面所述的个人征信评分获取方法。
经由上述的技术方案可知,本申请提供的个人征信评分获取方法中,从多个目标征信维度得到待测用户的征信信息,即目标征信维度对应的各维度类型的三维坐标,使得针对待测用户的个人征信评估更加全面,计算得到的个人征信评分更加准确。在建立各目标征信维度的各维度类型的关联的过程中,巧妙的采用三维坐标轴的方式,将各目标征信维度的各维度类型建立关联,即将各目标征信维度的各维度类型的三维坐标放入三维坐标轴上,即建立了各目标征信维度的各维度类型的关联;从预先设置的征信维度与风险等级的对应关系中,查找所述目标征信维度对应的风险等级;将所述目标征信维度中风险等级高于或等于预设风险等级的目标征信维度划分至高风险征信维度集合;将所述目标征信维度中风险等级低于所述预设风险等级的目标征信维度划分至低风险征信维度集合;将所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个高风险区域;将所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个低风险区域;从预先存储的区域与评分的对应关系中,查找所述多个高风险区域和所述多个低风险区域分别对应的评分;基于所述多个高风险区域分别对应的评分和权重值,以及,所述多个低风险区域分别对应的评分和权重值,计算得到所述待测用户的个人征信评分,从而实现了获得待测用户的个人征信评分的目的。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例涉及的硬件架构的结构图;
图2为本申请实施例提供的一种个人征信评分获取方法的流程图;
图3为本申请实施例提供的高风险总区域和低风险总区域的示意图;
图4为本申请实施例提供的第一球体的示意图;
图5为本申请实施例提供的第二球体的示意图;
图6为本申请实施例提供的个人征信评分获取装置的结构图;
图7是根据一示例性实施例示出的一种用于服务器的装置的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种个人征信评分获取方法、装置、服务器以及计算机可读存储介质,在介绍本申请实施例提供的技术方案之前,先对本申请实施例涉及的硬件架构进行说明。
请参阅附图1,为本申请实施例涉及的硬件架构的结构图,该硬件架构包括:服务器11以及至少一个电子设备12。
示例性的,服务器11可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务器中心。服务器11可以包括处理器、存储器以及网络接口等。
示例性的,电子设备12可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如,手机、笔记本电脑、平板电脑、掌上电脑、个人计算机、可穿戴设备、智能电视、PAD等。
应注意的是,图1仅仅是一种示例,电子设备的类型可以有多种,不限于图1中的笔记本电脑。
本申请提供的技术方案可以应用于多种应用场景,例如,贷款应用场景、信用卡办理应用场景等。
示例性的,在贷款应用场景中,电子设备12可以为银行的柜台的电脑。
示例性的,电子设备12的使用人员可以将表征用户身份的身份信息输入至电子设备12,电子设备12可以将身份信息发送至服务器11。服务器11将所述身份信息对应的用户作为待测用户,执行本申请实施例提及的个人征信评分获取方法。示例性的,服务器11可以将得到的待测用户的个人征信评分发送至电子设备12。
示例性的,身份信息可以为:身份证号、生物特征信息、银行卡号、医保卡编号、驾驶证编号中的至少一个。
示例性的,生物特征信息包括但不限于以下至少一个:指纹、虹膜、掌纹、步态、人脸。
本领域技术人员应能理解上述电子设备和服务器仅为举例,其他现有的或今后可能出现的电子设备或服务器如可适用于本公开,也应包含在本公开保护范围以内,并在此以引用方式包含于此。
下面结合上述硬件架构对本申请实施例提供的个人征信评分获取方法进行说明,该方法可以应用于如图1所示的服务器。
如图2所示,为本申请实施例提供的一种个人征信评分获取方法的流程图,该方法在实施过程中包括以下步骤S21至步骤S28。
步骤S21:获取待测用户的目标征信维度对应的各维度类型的三维坐标。
所述目标征信维度包括:存单记录、贷款记录、透支消费记录、逾期还款记录、延时缴费记录、非透支消费记录、投资记录、提前结束投资记录、收入记录以及退货退款记录中的至少一个,所述目标征信维度的每一维度类型的三维坐标包括:第一数目、第二数目以及第三数目,所述第一数目表征在所述目标征信维度下属于所述维度类型的记录的总条数,所述第二数目表征在所述目标征信维度下属于所述维度类型的记录的总金额,所述第三数目表征在所述目标征信维度下所述维度类型对应的风险字段数目,所述维度类型对应的风险字段数目是指针对所述维度类型的评价内容和/或预设描述内容中包含的与高风险的相关度大于或等于预设阈值的字段的数目。
下面对每个征信维度进行说明。
在一可选实现方式中,获取待测用户的存单记录对应的各维度类型的三维坐标的方法包括以下步骤A11至步骤A12。
存单记录是指:待测用户将存款进行存储的记录。
步骤A11:获取所述待测用户的存单记录对应的各存单类型的存单参数,所述存单类型的存单参数包括:所述存单类型下的存款记录总条数,所述存单类型下的存款总金额,所述存单类型的所述风险字段数目。
示例性的,存单类型包括但不限于以下至少一个:银行定期存单类型、银行活期存单类型、支付应用定期存单类型、支付应用活期存单类型。
银行定期存单类型是指,将款项存储在银行中,且,在约定期限到达后可以取出。示例性的,银行定期存单类型还可以按照定期存款期限划分为多个银行定期存单类型。
银行活期存单类型是指,将款项存储在银行中,且,可以随时从银行中取出。
支付应用定期存单类型是指,将款项存储在支付应用中,且,在约定期限到达后可以取出。示例性的,支付应用定期存单类型还可以按照定期存款期限划分为多个支付应用定期存单类型。
支付应用活期存单类型是指,将款项存储在支付应用中,且,可以随时从支付应用中取出。
下面举例对存单参数进行说明。下面以银行定期存单类型为例对存单参数进行说明。如表1所示的银行定期存单信息表。
表1待测用户的银行定期存单信息表
存款时间 定期存单编号 定期存款期限 存储金额
2021年6月1日 00001 2年 20000
2021年7月1日 00002 1年 30000
2021年8月1日 00002 3年 40000
假设表1为待测用户的银行定期存单信息表,则可以通过表1得到银行定期存单类型的存款记录总条数为3条,银行定期存单类型下的存款总金额为90000。
可以理解的是,不同存单类型对于待测用户而言的风险程度不同,例如,银行金融机构比支付应用对应的金融机构更加稳定,所以,将款项存储至银行的风险低于将款项存储至支付应用对应的金融机构的风险。
步骤A12:将所述存款记录总条数确定为所述存单类型的三维坐标的第一数目,将所述存单类型下的存款总金额确定为所述存单类型的三维坐标的第二数目,将所述存单类型的所述风险字段数目确定为所述存单类型的三维坐标的第三数目。
在一可选实现方式中,获取待测用户的贷款记录对应的各贷款类型的三维坐标的方法包括以下步骤A21至步骤A22。
贷款记录是指:待测用户向金融机构进行贷款的记录。
示例性的,待测用户可能因为购买衣、食、住、行中至少一类物品进行的贷款。
步骤A21:获取所述待测用户的贷款记录对应的各贷款类型的贷款参数,所述贷款类型的贷款参数包括:属于所述贷款类型的贷款记录的总条数,属于所述贷款类型的贷款总金额,所述贷款类型的所述风险字段数目。
示例性的,贷款类型包括但不限于以下至少一个:银行个人无抵押贷款类型、银行个人有抵押贷款类型、银行企业无抵押贷款类型、银行企业有抵押贷款类型、非银行金融机构个人有抵押贷款类型、非银行金融机构个人无抵押贷款类型、非银行金融机构企业有抵押贷款类型、非银行金融机构企业无抵押贷款类型。
将非银行金融机构个人有抵押贷款类型、非银行金融机构个人无抵押贷款类型、非银行金融机构企业有抵押贷款类型、非银行金融机构企业无抵押贷款类型,统称为非银行金融机构贷款类型。
非银行金融机构贷款类型是指,通过向非银行类金融机构进行贷款,例如,小微贷。
示例性的,可以基于金融机构的不同,将非银行金融机构贷款类型再细分为多个贷款类型,即不同金融机构对应的非银行金融机构贷款类型不同。
步骤A22:将属于所述贷款类型的贷款记录的条数确定为所述贷款类型的三维坐标的第一数目,将属于所述贷款类型的贷款总金额确定为所述贷款类型的三维坐标的第二数目,将所述贷款类型的所述风险字段数目确定为所述贷款类型的三维坐标的第三数目。
在一可选实现方式中,获取待测用户的透支消费记录对应的各透支途径的三维坐标的方法包括以下步骤A31至步骤A32。
透支消费记录是指:待测用户在进行支付时,支付金额大于余额的记录。
示例性的,余额为大于或等于0的任意数值。
示例性的,待测用户可能因为衣、食、住、行进行透支,或,因为投资进行透支。
步骤A31:获取所述待测用户的所述透支消费记录对应的各透支途径的透支参数,所述透支途径的透支参数包括:通过所述透支途径进行透支的透支总次数、通过所述透支途径进行透支的透支总金额、所述透支途径的所述风险字段数目。
示例性的,透支途径包括但不限于以下至少一个:信用卡透支途径、支付应用透支途径。
示例性的,可以基于支付应用的不同,将支付应用透支途径划分为多个支付应用透支途径,例如,花呗支付途径或白条支付途径。
示例性的,透支途径包括但不限于以下至少一个:购买生活用品的透支类型、购买车辆的透支类型、购买房屋的透支类型、购买投资产品的透支类型。
步骤A32:将所述透支总次数确定为所述透支途径的三维坐标中的所述第一数目,将所述透支总金额确定为所述透支途径的三维坐标中的所述第二数目,将所述透支途径的所述风险字段数目确定为所述透支途径的三维坐标中的所述第三数目。
在一可选实现方式中,获取待测用户的逾期还款记录对应的各逾期还款途径的三维坐标的方法包括以下步骤A41至步骤A44。
逾期还款是指,待测用户在透支以后,需要在规定期限内还款,若未在规定期限内还款则为逾期还款。
示例性的,待测用户在购买衣食住行等任何物品时,均可以进行透支。
逾期还款记录是指,待测用户进行逾期还款的记录。
步骤A41:获取所述待测用户的所述逾期还款记录对应的各逾期还款途径的逾期还款参数,所述逾期还款参数包括:通过所述逾期还款途径进行透支后逾期还款的总次数、通过所述逾期还款途径进行透支后逾期还款的逾期时长、通过所述逾期还款途径进行透支后逾期还款的总金额、所述逾期还款途径的所述风险字段数目。
示例性的,若通过所述逾期还款途径进行透支后逾期还款的总次数为1,则逾期时长即为通过所述逾期还款途径进行透支后逾期还款的逾期时长;若通过所述逾期还款途径进行透支后逾期还款的总次数大于或等于2,则逾期时长为多次逾期还款的逾期时长的均值,或,逾期时长为多次逾期还款的逾期时长的最大值,或,逾期时长为多次逾期还款的逾期时长的最小值。
示例性的,逾期还款途径与透支途径有关,逾期还款途径包括但不限于以下至少一个:信用卡还款途径、支付应用还款途径。
示例性的,可以基于支付应用的不同,将支付应用还款途径划分为多个支付应用还款途径,例如,花呗支付途径或白条支付途径。
步骤A42:将通过所述逾期还款途径进行透支后逾期还款的总次数确定为所述逾期还款途径的三维坐标中的所述第一数目。
步骤A43:将通过所述逾期还款途径进行透支后逾期还款的总金额确定为所述逾期还款途径的三维坐标中的所述第二数目。
步骤A44:基于所述逾期时长以及所述逾期还款途径的所述风险字段数目,得到所述逾期还款途径的三维坐标中的所述第三数目。
示例性的,第三数目=第一预设值*逾期时长+第二预设值*逾期还款途径的风险字段数目。
示例性的,第一预设值可以为大于或等于0且小于或等于1的任意数值,第二预设值可以为大于或等于0且小于或等于1的任意数值。
在一可选实现方式中,获取待测用户的延时缴费记录对应的各缴费途径的三维坐标的方法包括以下步骤A51至步骤A52。
延时缴费记录是指:在规定的期限内应该缴纳一定的费用,但是在规定的期限内并未缴纳。
例如,用户需要缴纳水费、电费或电话费,水费、电费和电话费可以延时缴纳。
步骤A51:获取所述待测用户的延时缴费记录对应的各缴费途径的缴费参数,所述缴费途径的缴费参数包括:属于所述缴费途径的缴费记录的总条数,属于所述缴费途径的缴费总金额,所述缴费途径的所述风险字段数目。
示例性的,缴费途径包括但不限于以下至少一个:银行卡缴费途径、信用卡缴费途径、支付应用缴费途径。
示例性的,可以基于支付应用的不同,将支付应用缴费途径划分为多个支付应用缴费途径,例如,花呗支付途径或白条支付途径。
步骤A52:将属于所述缴费途径的缴费记录的总条数确定为所述缴费途径的三维坐标的第一数目,将属于所述缴费途径的缴费总金额确定为所述缴费途径的三维坐标的第二数目,将所述缴费途径的所述风险字段数目确定为所述缴费途径的三维坐标的第三数目。
在一可选实现方式中,获取待测用户的非透支消费记录对应的各消费类型的三维坐标的方法包括以下步骤A61至步骤A62。
非透支消费记录是指:在进行消费时,选用已有存款进行支付,且,支付金额小于或等于已有存款金额。
示例性的,待测用户可以因为衣、食、住或行进行消费。
步骤A61:获取所述待测用户的非透支消费记录对应的各消费类型的消费参数,所述消费类型的消费参数包括:属于所述消费类型的消费记录的总条数,属于所述消费类型的消费总金额,所述消费类型的所述风险字段数目。
示例性的,消费类型包括但不限于以下至少一个:银行卡消费类型、支付应用消费类型。
示例性的,不同支付应用对应的支付应用消费类型不同。
示例性的,消费类型包括但不限于以下至少一个:购买生活用品的消费类型、购买车辆的消费类型、购买房屋的消费类型、购买投资产品的消费类型。
步骤A62:将属于所述消费类型的消费记录的总条数确定为所述消费类型的三维坐标的第一数目,将属于所述消费类型的消费总金额确定为所述消费类型的三维坐标的第二数目,将所述消费类型的所述风险字段数目确定为所述消费类型的三维坐标的第三数目。
在一可选实现方式中,获取待测用户的投资记录对应的各投资类型的三维坐标的方法包括以下步骤A71至步骤A72。
投资记录是指:待测用户进行投资的记录。
步骤A71:获取所述待测用户的投资记录对应的各投资类型的投资参数,所述投资类型的投资参数包括:属于所述投资类型的投资总次数,属于所述投资类型的投资总金额,所述投资类型的所述风险字段数目。
示例性的,投资类型包括但不限于以下至少一个:投资股票类型、投资基金类型、投资黄金类型、投资期货类型。
步骤A72:将属于所述投资类型的投资总次数确定为所述投资类型的三维坐标的第一数目,将属于所述投资类型的投资总金额确定为所述投资类型的三维坐标的第二数目,将所述投资类型的所述风险字段数目确定为所述投资类型的三维坐标的第三数目。
在一可选实现方式中,获取待测用户的提前结束投资记录的各结束投资类型的三维坐标的方法包括以下步骤A81至步骤A82。
提前结束投资记录是指:待测用户进行投资后,在投资结束时间内不能将投资的款项取出,若待测用户需要使用款项,在投资结束时间之前结束投资,则会产生提前结束投资记录。
步骤A81:获取所述待测用户的提前结束投资记录的各结束投资类型的结束投资参数,所述结束投资类型的结束投资参数包括:属于所述结束投资类型的投资总次数,属于所述结束投资类型的投资总金额,所述结束投资类型的所述风险字段数目。
示例性的,结束投资类型包括但不限于以下至少一个:投资股票类型、投资基金类型、投资黄金类型、投资期货类型。
步骤A82:将属于所述结束投资类型的投资总次数确定为所述结束投资类型的三维坐标的第一数目,将属于所述结束投资类型的投资总金额确定为所述结束投资类型的三维坐标的第二数目,将所述结束投资类型的所述风险字段数目确定为所述结束投资类型的三维坐标的第三数目。
在一可选实现方式中,获取待测用户的收入记录的各收入类型的三维坐标的方法包括以下步骤A91至步骤A92。
收入记录是指:待测用户每隔设定时间段,待测用户的用户账户会接受一定的款项,这些款项即为收入记录。
示例性的,收入类型包括但不限于以下至少一个:工资收入类型、投资收入类型、房租收入类型。
步骤A91:获取所述待测用户的收入记录的各收入类型的收入参数,所述收入类型的收入参数包括:属于所述收入类型的收入记录的总条数,属于所述收入类型的收入总金额,所述收入类型的所述风险字段数目。
步骤A92:将属于所述收入类型的收入记录的总条数确定为所述收入类型的三维坐标的第一数目,将属于所述收入类型的收入总金额确定为所述收入类型的三维坐标的第二数目,将所述收入类型的所述风险字段数目确定为所述收入类型的三维坐标的第三数目。
在一可选实现方式中,获取待测用户的退货退款记录的各退货退款类型的三维坐标的方法包括以下步骤A01至步骤A02。
退货退款记录是指:待测用户在购买商品后,对商品进行了退货退款操作,此时,会产生退货退款记录。
步骤A01:获取所述待测用户的退货退款记录的各退货退款类型的退货退款参数,所述退货退款类型的退货退款参数包括:属于所述退货退款类型的退货退款总次数,属于所述退货退款类型的退货退款总金额,所述退货退款类型的所述风险字段数目。
示例性的,退货退款类型包括但不限于:生活用品退货退款类型、投资商品退货退款类型、车辆退货退款类型。
步骤A02:将属于所述退货退款类型的退货退款总次数确定为所述退货退款类型的三维坐标的第一数目,将属于所述退货退款类型的退货退款总金额确定为所述退货退款类型的三维坐标的第二数目,将所述退货退款类型的所述风险字段数目确定为所述退货退款类型的三维坐标的第三数目。
下面对获取目标信息的所述风险字段数目的方法进行说明。目标信息可以为上述的“存单类型”或“贷款类型”或“透支途径”或“逾期还款途径”或“缴费途径”或“消费类型”或“投资类型”或“结束投资类型”或“收入类型”或“退货退款类型”。
获取目标信息的风险字段数目的方法包括但不限于以下两种。
第一种实现方式包括以下步骤B11至步骤B15。
可以理解的是,大量用户可能针对目标信息进行过评价,所以可以基于评价内容得到目标信息的风险字段数目。
步骤B11:获取针对目标信息的多个用户分别对应的评论内容集合,所述评论内容集合包括至少一个评论时刻对应的评论内容。
在一可选实现方式中,一个用户对目标信息可能进行一次或多次评价,从而得到一个或多个评论内容,即用户对应的评论内容集合包含的评论内容的数目为一个或多个。
步骤B12:对于每一评论内容,将所述评论内容输入至预先构建的风险估计模型,以得到所述风险估计模型输出的评论内容的风险分数。
由于评论内容是针对目标信息的,所以风险评估模型输出的风险分数表征发布该评论内容的用户认为目标信息存在的风险。
若风险分数越高,说明用户认为目标信息存在的风险越大,若风险分数越低,说明用户认为目标信息存在的风险越小。
在训练风险估计模型的过程中涉及机器学习中的人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术中至少一种。
示例性的,风险估计模型可以为神经网络模型、逻辑回归模型、线性回归模型、支持向量机(SVM)、Adaboost、XGboost、Transformer-Encoder模型中任一种模型。
示例性的,神经网络模型可以为基于循环神经网络的模型、基于卷积神经网络的模型、基于Transformer-encoder的分类模型中的任一种。
示例性的,风险估计模型可以为基于循环神经网络的模型、基于卷积神经网络的模型以及基于Transformer-encoder的分类模型的深度混合模型。
示例性的,风险估计模型可以为基于注意力的深度模型、基于记忆网络的深度模型、基于深度学习的短文本分类模型中任一种。
基于深度学习的短文本分类模型为循环神经网络(RNN)或卷积神经网络(CNN)或者基于循环神经网络或卷积神经网络的变种。
示例性的,可以在已经预训练好的模型上做一些简单的领域适应性改造,以得到风险估计模型。
示例性的,“简单的领域适应性改造”包括但不限于在已经预训练好的模型上,再次利用大规模无监督领域语料进行二次预训练,和/或,通过模型蒸馏的方式对已经预训练好的模型进行模型压缩。
步骤B13:对于每一用户,基于所述用户对应的评论内容集合包含的评论内容的风险分数,以及,所述用户对应的评论内容集合包含的评论内容的权重,计算得到所述用户对应的评论内容集合的目标风险分数;所述评论内容集合包含的评论内容的权重与差值呈负相关,所述差值为当前时刻与所述评论内容对应的评论时刻的差值。
可以理解的是,随着时间流逝,同一用户针对目标信息的看法可能会发生变化,所以同一个用户针对目标信息可能有多个评价内容,但是越靠近当前时间的评价内容越接近用户当前时间的真实想法,所以评论内容集合包含的评论内容的权重与差值呈负相关。即差值越大,评论内容的权重越小,差值越小,评论内容的权重越大。
示例性的,可以预先设置权重与差值的对应关系。
示例性的,若用户的评论内容集合包括评论内容11、评论内容12以及评论内容13;若评论内容11对应风险分数1、评论内容12对应风险分数2、评论内容13对应风险分数3,评论内容11对应的目标差值的权重为权重11、评论内容12对应的目标差值的权重为权重12、评论内容13对应的目标差值的权重为权重13,其中,权重11<权重12<权重13。
则评论内容集合的目标风险分数=情感分数1*权重11+情感分数2*权重12+情感分数3*权重13。
步骤B14:从多个用户对应的评论内容集合的目标风险分数中,筛选出高于或等于预设阈值的目标风险分数的评论内容集合。
本申请实施例中将每个用户的评论内容集合看作针对目标信息的一个评论。若评论内容集合的目标风险分数较低,说明用户认为目标信息的风险较低。若评论内容集合的目标风险分数较高,说明用户认为目标信息的风险较高。
步骤B15:将高于或等于预设阈值的目标风险分数的评论内容集合的数目确定为风险字段数目。
第二种实现方式包括以下步骤B21至步骤B23。
可以理解的是,金融机构可以预先针对目标信息进行说明。本申请实施例称金融机构针对目标信息进行的说明为预设描述内容。
例如,基金的预设描述内容包括但不限于:风险指标、基金规模、基金档案中的至少一个。
步骤B21:将目标信息对应的预设描述内容进行划分,以得到多个词汇。
步骤B22:从多个词汇中,获得与高风险相关度高于或等于预设阈值的词汇的词汇总数目。
步骤B23:将所述词汇总数目确定为所述风险字段数目。
第三种实现方式包括第一种实现方式的步骤B11至步骤B14以及第二种实现方式的步骤B21至步骤B22,以及步骤B31。
步骤B31:将步骤B14得到的“高于或等于预设阈值的目标风险分数的评论内容集合的数目”与步骤B22得到的词汇总数目的均值确定为目标信息的风险字段数目。
本申请实施例中,目标征信维度对应的各维度类型的参数可以从属于银行的服务器得到,和/或,从金融服务应用对应的服务器得到。
步骤S22:从预先设置的征信维度与风险等级的对应关系中,查找所述目标征信维度对应的风险等级。
示例性的,可以人为设置每个征信维度的风险等级。
示例性的,可以基于GMM高斯混合模型得到每个征信维度的风险等级。
步骤S23:将所述目标征信维度中风险等级高于或等于预设风险等级的目标征信维度划分至高风险征信维度集合。
可以理解的是,每个目标征信维度对应的维度类型均有一个三维坐标,所以高风险征信维度集合包含的目标征信维度对应的维度类型的三维坐标组成了一个高风险总区域。
步骤S24:将所述目标征信维度中风险等级低于所述预设风险等级的目标征信维度划分至低风险征信维度集合。
可以理解的是,每个目标征信维度对应的维度类型均有一个三维坐标,所以低风险征信维度集合包含的目标征信维度对应的维度类型的三维坐标组成了一个低风险总区域。
为了对高风险总区域和低风险总区域进行说明,下面举例进行说明。
如图3所示,为本申请实施例提供的高风险总区域和低风险总区域的示意图。
由于是三维坐标轴,为了示出立体感,在三维坐标轴上画出两个球体。
假设高风险征信维度集合包含2个目标征信维度,2个目标征信维度分别对应的维度类型的总数目为5,则具有5个三维坐标,假设,5个三维坐标分别为:三维坐标1、三维坐标2、三维坐标3、三维坐标4以及三维坐标5。
示例性的,包含三维坐标1、三维坐标2、三维坐标3、三维坐标4以及三维坐标5等5个三维坐标的最小区域即为高风险总区域。
如图3所示,包含三维坐标1、三维坐标2、三维坐标3、三维坐标4以及三维坐标5的多面体即为高风险总区域(用实线条连接)。
假设低风险征信维度集合包含3个目标征信维度,3个目标征信维度分别对应的维度类型的总数目为3,则具有3个三维坐标,假设,3个三维坐标分别为:三维坐标6、三维坐标7、三维坐标8。
示例性的,包含三维坐标6、三维坐标7、三维坐标8等3个三维坐标的最小区域即为低风险总区域(用虚线条连接)。
如图3所示,包含三维坐标6、三维坐标7以及三维坐标8的三角形即为低风险总区域。
本申请实施例并不对高风险总区域和低风险总区域的区域形状进行限定,例如,可以为线条或多边形或多面体。
步骤S25:将所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个高风险区域。
每一所述高风险区域对应一个高风险集合,所述高风险集合包含属于同一簇的所述三维坐标。
高风险区域对应的高风险集合包含的三维坐标位于该高风险区域内。
示例性的,可以使用K-Means算法或DBSCAN(Density-Based Spatial Clusteringof Applications with Noise,具有噪声的基于密度的聚类方法)算法进行聚类。
可以理解的是,位于不同高风险区域中的三维坐标中风险字段数目不同,示例性的,可以按照位于高风险区域的三维坐标包含的第三数目的均值或按照位于高风险区域的三维坐标包含的第三数目的最大值,降序对多个高风险区域进行排序,假设排序后的多个高风险区域分别为:AR1区域、BR1区域、CR1区域、DR1区域。
步骤S26:将所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个低风险区域。
每一所述低风险区域对应一个低风险集合,所述低风险集合包含属于同一簇所述三维坐标。
低风险区域对应的低风险集合包含的三维坐标位于该低风险区域内。
示例性的,可以使用K-Means算法或DBSCAN(Density-Based Spatial Clusteringof Applications with Noise,具有噪声的基于密度的聚类方法)算法进行聚类。
可以理解的是,位于不同低风险区域中的三维坐标中风险字段数目不同,示例性的,可以按照位于低风险区域的三维坐标包含的第三数目的均值或按照位于低风险区域的三维坐标包含的第三数目的最小值,升序对多个低风险区域进行排序,假设排序后的多个低风险区域分别为:AR0区域、BR0区域、CR0区域、DR0区域。
步骤S27:从预先存储的区域与评分的对应关系中,查找所述多个高风险区域和所述多个低风险区域分别对应的评分。
示例性的,位于高风险区域的三维坐标包含的第三数目的均值越大或位于高风险区域的三维坐标包含的第三数目的最大值越大,高风险区域的评分越低,反之越高。
示例性的,位于低风险区域的三维坐标包含的第三数目的均值越小或位于低风险区域的三维坐标包含的第三数目的最小值越小,低风险区域的评分越高,反之越低。
假设排序后的多个高风险区域分别为:AR1区域、BR1区域、CR1区域、DR1区域。排序后的多个低风险区域分别为:AR0区域、BR0区域、CR0区域、DR0区域。示例性的,如表2所示,为预先存储的区域与评分的对应关系。
表2区域与评分的对应关系
Figure BDA0003270037740000191
如表2所示,示例性的,可以将多个高风险区域的评分设置为负值,多个低风险区域的评分设置为正值。位于高风险区域的三维坐标包含的第三数目的均值越大或位于高风险区域的三维坐标包含的第三数目的最大值越大,说明高风险区域的风险等级越高,则对应的评分越小。位于低风险区域的三维坐标包含的第三数目的均值越小或位于低风险区域的三维坐标包含的第三数目的最小值越小,说明低风险区域的风险等级越低,则对应的评分越高。
表2仅为示例,并不限定高风险区域的数目和低风险区域的数目,并不限定各高风险区域的评分和各低风险区域的评分。
步骤S28:基于所述多个高风险区域分别对应的评分和权重值,以及,所述多个低风险区域分别对应的评分和权重值,计算得到所述待测用户的个人征信评分。
所述高风险区域的权重值为位于所述高风险区域的三维坐标包含的所述第一数目之和与所有所述目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和的比值,所述低风险区域的权重值为位于所述低风险区域的三维坐标包含的所述第一数目之和与所有所述目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和的比值。
下面举例说明权重值的获取过程。
假设多个高风险区域的总数目为3个,分别为高风险区域1、高风险区域2以及高风险区域3;高风险区域1包含2个三维坐标,2个三维坐标包含的第一数目之和为50;高风险区域2包含3个三维坐标,3个三维坐标包含的第一数目之和为30;高风险区域3包含1个三维坐标,1个三维坐标包含的第一数目之和为10。
假设多个低风险区域的总数目为2个,分别为低风险区域1、低风险区域2;低风险区域1包含3个三维坐标,3个三维坐标包含的第一数目之和为100;低风险区域2包含4个三维坐标,4个三维坐标包含的第一数目之和为110。
综上,所有目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和=50+30+10+100+110=300。高风险区域1的权重值=50/300=1/6;高风险区域2的权重值=30/300=1/10;高风险区域3的权重值=10/300=1/30;低风险区域1的权重值=100/300=1/3;低风险区域2的权重值=110/300=11/30。
假设高风险区域1、高风险区域2、高风险区域3、低风险区域1、低风险区域2的评分分别为:-5、-4、-3、10、6,则待测用户的个人征信评分=1/6*(-5)+1/10*(-4)+1/30*(-3)+1/3*10+11/30*6。
由于高风险区域的权重值是基于位于高风险区域的三维坐标包含的第一数目之和/所有目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和,所以高风险区域的权重值更加符合实际情况。
由于低风险区域的权重值是基于位于低风险区域的三维坐标包含的第一数目之和/所有目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和,所以低风险区域的权重值更加符合实际情况。
本申请实施例之所有设置三维坐标而非二维坐标,是为了让高风险总区域和低风险总区域的关联性更强。例如,本申请实施例中提及的上述步骤仅利用到了三维坐标中的第一数目和第三数目,三维坐标中的第二数目是使得各三维坐标在三维坐标轴的布局上更加符合待测用户的资金流动情况。从而使得各三维坐标的关联性更强。
本申请实施例提供的个人征信评分获取方法中,从多个目标征信维度得到待测用户的征信信息,即目标征信维度对应的各维度类型的三维坐标,使得针对待测用户的个人征信评估更加全面,计算得到的个人征信评分更加准确。在建立各目标征信维度的各维度类型的关联的过程中,巧妙的采用三维坐标轴的方式,将各目标征信维度的各维度类型建立关联,即将各目标征信维度的各维度类型的三维坐标放入三维坐标轴上,即建立了各目标征信维度的各维度类型的关联;从预先设置的征信维度与风险等级的对应关系中,查找所述目标征信维度对应的风险等级;将所述目标征信维度中风险等级高于或等于预设风险等级的目标征信维度划分至高风险征信维度集合;将所述目标征信维度中风险等级低于所述预设风险等级的目标征信维度划分至低风险征信维度集合;将所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个高风险区域;将所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个低风险区域;从预先存储的区域与评分的对应关系中,查找所述多个高风险区域和所述多个低风险区域分别对应的评分;基于所述多个高风险区域分别对应的评分和权重值,以及,所述多个低风险区域分别对应的评分和权重值,计算得到所述待测用户的个人征信评分,从而实现了获得待测用户的个人征信评分的目的。
在一可选实现方式中,步骤S25的实现方式有多种,本申请实施例提供但不限于以下方法,该方法在实施过程中包括以下步骤C11至步骤C16。
步骤C11:从所述高风险征信维度集合中,获得包含的第三数目最大的第一目标三维坐标。
示例性的,若高风险征信维度集合中目标征信维度的各维度类型的三维坐标包含的第三数目最大的目标三维坐标的数目可以为一个或多个。若目标三维坐标的数目为一个,则第一目标三维坐标即为该目标三维坐标;若目标三维坐标的数目为多个,则第一目标三维坐标可以为多个目标三维坐标中人一个,或者,第一目标三维坐标可以为多个目标三维坐标的中心点。
步骤C12:确定以所述第一目标三维坐标为球心的第一球体,所述第一球体为在不包括所述低风险征信维度集合中征信维度对应的各维度类型的三维坐标的情况下的最大球体。
示例性的,可以计算低风险征信维度集合包含的目标维度的维度类型的三维坐标分别与第一目标三维坐标的距离,获得第一距离=min{低风险征信维度集合包含的目标维度的维度类型的三维坐标分别与第一目标三维坐标的距离}。计算高风险征信维度集合包含的目标维度的维度类型的三维坐标分别与第一目标三维坐标的第二距离,第一球体的半径=max{小于所述第一距离的多个第二距离}。
步骤C13:划分所述第一球体内部,以得到与所述第一球体具有相同球心的至少一个球体。
步骤C14:将所述第一球体与所述至少一个球体中半径最小的球体所占区域,确定为第一高风险区域。
步骤C15:将所述第一球体与所述至少一个球体中相邻两个球体之间的区域,确定为第二高风险区域。
示例性的,第二高风险区域的数目可以为一个或多个。
若存在多个第二高风险区域,各第二高风险区域的评分与各第二高风险区域与第一目标三维坐标的距离呈正相关。
步骤C16:将高风险总区域去除所述第一球体所在区域,以得到第三高风险区域,所述高风险总区域为所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标组成的区域。
为了本领域技术人员更加理解本申请实施例下面对上述实现过程举例进行说明。
假设高风险征信维度集合包含的目标维度的维度类型的三维坐标的总数目为100,100个三维坐标中包含的第三数目最大的第一目标三维坐标为三维坐标A,则第一球体40如图4所示。
假设步骤C13得到与第一球体相同球心的一个球体,如图4所示球体41。步骤C14中“第一球体与所述至少一个球体中半径最小的球体”为球体41,即球体41所占区域为第一高风险区域,如三维坐标B位于第一高风险区域。由于第一高风险区域距离三维坐标A最近,所以第一高风险区域的评分最低。步骤C15中第一球体与球体41相邻,两个球体之间的区域即为第二高风险区域,如三维坐标C位于第二高风险区域。
示例性的,位于球体41上的三维坐标D和三维坐标E,可以看作是位于球体41所占区域(即第一高风险区域)的三维坐标。
示例性的,位于第一球体40上的三维坐标F可以看作是位于球体41与第一球体40之间的区域(即第二高风险区域)的三维坐标。
假设三维坐标G为低风险征信维度集合包含的目标维度的维度类型的三维坐标;三维坐标H为高风险征信维度集合包含的目标维度的维度类型的三维坐标,但是三维坐标H和三维坐标G与三维坐标A的距离相同。由于第一球体不能包括三维坐标G,所以第一球体的半径小于三维坐标A与三维坐标G之间的距离,即三维坐标H不位于第一球体40内部。本申请实施例称三维坐标H位于的区域为第三高风险区域。
示例性的,预先设置的区域与评分的对应关系中,第一高风险区域的评分<第二高风险区域的评分<第三高风险区域的评分。
在一可选实现方式中,步骤S26的实现方式有多种,本申请实施例提供但不限于以下方法,该方法在实施过程中包括以下步骤D11至步骤D16。
步骤D11:从所述低风险征信维度集合中,获得包含的第三数目最小的第二目标三维坐标。
示例性的,若低风险征信维度集合中目标征信维度的各维度类型的三维坐标包含的第三数目最小的目标三维坐标的数目可以为一个或多个。若目标三维坐标的数目为一个,则第二目标三维坐标即为该目标三维坐标;若目标三维坐标的数目为多个,则第二目标三维坐标可以为多个目标三维坐标中人一个,或者,第二目标三维坐标可以为多个目标三维坐标的中心点。
步骤D12:确定以所述第二目标三维坐标为球心的第二球体,所述第二球体为在不包括所述高风险征信维度集合中征信维度对应的各维度类型的三维坐标的情况下的最大球体。
示例性的,可以计算高风险征信维度集合包含的目标维度的维度类型的三维坐标分别与第二目标三维坐标的距离,获得第三距离=min{高风险征信维度集合包含的目标维度的维度类型的三维坐标分别与第二目标三维坐标的距离}。计算低风险征信维度集合包含的目标维度的维度类型的三维坐标分别与第二目标三维坐标的第四距离,第二球体的半径=max{小于所述第三距离的多个第四距离}。
步骤D13:划分所述第二球体内部,以得到与所述第二球体具有相同球心的至少一个球体。
步骤D14:将所述第二球体与所述至少一个球体中半径最小的球体所占区域,确定为第一低风险区域。
步骤D15:将所述第二球体与所述至少一个球体中相邻两个球体之间的区域,确定为第二低风险区域。
示例性的,第二低风险区域的数目可以为一个或多个。
若存在多个第二低风险区域,各第二低风险区域的评分与各第二低风险区域与第二目标三维坐标的距离呈负相关。即第二低风险区域与第二目标三维坐标的距离越小,评分越高,反之越低。
步骤D16:将低风险总区域去除所述第二球体所在区域,以得到第三低风险区域,所述低风险总区域为所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标组成的区域。
为了本领域技术人员更加理解本申请实施例下面对上述实现过程举例进行说明。
假设低风险征信维度集合包含的目标维度的维度类型的三维坐标的总数目为200,200个三维坐标中包含的风险字段数目最小的第二目标三维坐标为三维坐标J,则第二球体50如图5所示。
假设步骤D13得到与第二球体相同球心的一个球体,如图5所示球体51。步骤D14中“第二球体与所述至少一个球体中半径最小的球体”为球体51,即球体51所占区域为第一低风险区域,如三维坐标K位于第一低风险区域。由于第一低风险区域距离三维坐标J最近,所以第一低风险区域的评分最高。步骤D15中第二球体与球体51相邻,两个球体之间的区域即为第二低风险区域,如三维坐标N位于第二低风险区域。
示例性的,位于球体51上的三维坐标L和三维坐标M,可以看作是位于球体51所占区域(即第一低风险区域)的三维坐标。
示例性的,位于第二球体50上的的三维坐标P可以看作是位于球体51与第二球体50之间的区域(即第二低风险区域)的三维坐标。
假设三维坐标Q为低风险征信维度集合包含的目标维度的维度类型的三维坐标;三维坐标R为高风险征信维度集合包含的目标维度的维度类型的三维坐标,但是三维坐标Q和三维坐标R与三维坐标J的距离相同,由于第二球体不能包括三维坐标R,所以第二球体的半径小于三维坐标J与三维坐标R的距离,即三维坐标Q不位于第二球体50内部。本申请实施例中称三维坐标Q位于的区域为第三低风险区域。
示例性的,预先设置的区域与评分的对应关系中,第一低风险区域的评分>第二低风险区域的评分>第三低风险区域的评分。
在一可选实现方式中,本申请实施例还提供了个人征信评分获取方法的另一种实现方式。该实现方式涉及以下步骤F101至步骤F110。
步骤F101:从多个征信维度中筛选出未被选取过的目标征信维度。
目标征信维度的数目可以为一个或多个。
步骤F102:获取待测用户的目标征信维度对应的各维度类型的三维坐标。
步骤F103:从预先设置的征信维度与风险等级的对应关系中,查找所述目标征信维度对应的风险等级。
步骤F104:将所述目标征信维度中风险等级高于或等于预设风险等级的目标征信维度划分至高风险征信维度集合。
步骤F105:将所述目标征信维度中风险等级低于所述预设风险等级的目标征信维度划分至低风险征信维度集合。
示例性的,若目标征信维度的数目为一个,则仅存在高风险征信维度集合或低风险征信维度集合;示例性的,若目标征信维度的数目为多个,则可能仅存在高风险征信维度集合或低风险征信维度集合,可能同时存在高风险征信维度集合和低风险征信维度集合。
步骤F106:将所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个高风险区域。
步骤F107:将所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个低风险区域。
步骤F108:从预先存储的区域与评分的对应关系中,查找所述多个高风险区域和所述多个低风险区域分别对应的评分。
步骤F108:基于所述多个高风险区域分别对应的评分和权重值,以及,所述多个低风险区域分别对应的评分和权重值,计算得到所述待测用户的个人征信评分。
步骤F109:检测所述多个征信维度中各征信维度均被选取过,若否,返回步骤F101,若是,执行步骤F110。
这样在多次执行步骤F101至步骤F109后,可以得到多个个人征信评分。
步骤F110:基于所述待测用户对应的多个个人征信评分,计算得到所述待测用户的第一目标个人征信评分。
示例性的,第一目标个人征信评分=多个个人征信评分的均值。
示例性的,第一个目标个人征信评分=多个个人征信评分的加权均值。
每个个性征信评分的权重值与计算得到个性征信评分的目标征信维度有关,示例性的,每个个性征信评分的权重值=计算得到个性征信评分的目标征信维度的权重值。
在一可选实现方式中,还包括以下步骤G11至步骤G12。
步骤G11:将多个所述高风险区域的权重值、多个所述低风险区域的权重值、所述目标征信维度对应的各维度类型的三维坐标,以及,每一所述三维坐标所在的目标区域输入至预先构建的资金流动预测模型,所述目标区域为所述高风险区域或低风险区域。
在训练风资金流动预测模型的过程中涉及机器学习中的人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术中至少一种。
示例性的,资金流动预测模型可以为神经网络模型、逻辑回归模型、线性回归模型、支持向量机(SVM)、Adaboost、XGboost、Transformer-Encoder模型中任一种模型。
示例性的,神经网络模型可以为基于循环神经网络的模型、基于卷积神经网络的模型、基于Transformer-encoder的分类模型中的任一种。
示例性的,风险估计模型可以为基于循环神经网络的模型、基于卷积神经网络的模型以及基于Transformer-encoder的分类模型的深度混合模型。
示例性的,资金流动预测模型可以为基于注意力的深度模型、基于记忆网络的深度模型、基于深度学习的短文本分类模型中任一种。
基于深度学习的短文本分类模型为循环神经网络(RNN)或卷积神经网络(CNN)或者基于循环神经网络或卷积神经网络的变种。
示例性的,可以在已经预训练好的模型上做一些简单的领域适应性改造,以得到资金流动预测模型。
示例性的,“简单的领域适应性改造”包括但不限于在已经预训练好的模型上,再次利用大规模无监督领域语料进行二次预训练,和/或,通过模型蒸馏的方式对已经预训练好的模型进行模型压缩。
步骤G12:通过所述资金流动预测模型得到所述待测用户将来设定时间段的资金流动信息以及所述待测用户针对所述资金流动信息的行为信息。
示例性的,未来设定时间段可以为未来一天或未来一个星期或未来一个月或未来一年。
示例性的,资金流动信息包括但不限于以下至少一个:将要进行存单的各存单类型的款项、将要进行贷款的各贷款类型的款项、将要进行透支消费的各透支途径的款项、将要缴费的各缴费途径的款项、将要非透支消费的各消费类型的款项、将要投资的各投资类型的款项、将要得到的收入的各收入类型的款项。
示例性的,针对所述资金流动信息的行为信息包括但不限于以下至少一个:将要逾期还款的逾期还款途径、将要提前结束投资的结束投资类型、将要进行退货退款的退货退款类型。
综上,通过待测用户将来设定时间段的资金流动信息以及所述待测用户针对所述资金流动信息的行为信息,可以分析待测用户的户最常用的资金配置模式和资金使用途径,并从多征信维度分析,追踪资金流动途径,提高待测用户分析准确性,预测待测用户未来期望资金使用情况,推测信用风险程度。
在一可选实现方式中,可以基于步骤S28得到的个人征信评分、所述资金流动信息以及所述待测用户针对所述资金流动信息的行为信息,计算得到所述待测用户的第二目标个人征信评分。
在一可选实现方式中,可以基于步骤F110得到的第一目标个人征信评分、所述资金流动信息以及所述待测用户针对所述资金流动信息的行为信息,计算得到所述待测用户的第二目标个人征信评分。
上述本申请公开的实施例中详细描述了方法,对于本申请的方法可采用多种形式的装置实现,因此本申请还公开了一种装置,下面给出具体的实施例进行详细说明。
如图6所示,为本申请实施例提供的个人征信评分获取装置的结构图,该装置包括:第一获取模块61、第一查找模块62、第一划分模块63、第二划分模块64、第一聚类模块65、第二聚类模块66、第二查找模块67以及第一计算模块68,其中:
第一获取模块61,用于获取待测用户的目标征信维度对应的各维度类型的三维坐标,所述目标征信维度包括:存单记录、贷款记录、透支消费记录、逾期还款记录、延时缴费记录、非透支消费记录、投资记录、提前结束投资记录、收入记录以及退货退款记录中的至少一个,所述目标征信维度的每一维度类型的三维坐标包括:第一数目、第二数目以及第三数目,所述第一数目表征在所述目标征信维度下属于所述维度类型的记录的总条数,所述第二数目表征在所述目标征信维度下属于所述维度类型的记录的总金额,所述第三数目表征在所述目标征信维度下所述维度类型对应的风险字段数目,所述维度类型对应的风险字段数目是指针对所述维度类型的评价内容和/或预设描述内容中包含的与高风险的相关度大于或等于预设阈值的字段的数目;
第一查找模块62,用于从预先设置的征信维度与风险等级的对应关系中,查找所述目标征信维度对应的风险等级;
第一划分模块63,用于将所述目标征信维度中风险等级高于或等于预设风险等级的目标征信维度划分至高风险征信维度集合;
第二划分模块64,用于将所述目标征信维度中风险等级低于所述预设风险等级的目标征信维度划分至低风险征信维度集合;
第一聚类模块65,用于将所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个高风险区域,每一所述高风险区域对应一个高风险集合,所述高风险集合包含属于同一簇的所述三维坐标;
第二聚类模块66,用于将所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个低风险区域,每一所述低风险区域对应一个低风险集合,所述低风险集合包含属于同一簇所述三维坐标;
第二查找模块67,用于从预先存储的区域与评分的对应关系中,查找所述多个高风险区域和所述多个低风险区域分别对应的评分;
第一计算模块68,用于基于所述多个高风险区域分别对应的评分和权重值,以及,所述多个低风险区域分别对应的评分和权重值,计算得到所述待测用户的个人征信评分,所述高风险区域的权重值为位于所述高风险区域的三维坐标包含的所述第一数目之和与所有所述目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和的比值,所述低风险区域的权重值为位于所述低风险区域的三维坐标包含的所述第一数目之和与所有所述目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和的比值。
在一可选实现方式中,第一聚类模块包括:
第一获取单元,用于从所述高风险征信维度集合中,获得包含的第三数目最大的第一目标三维坐标;
第一确定单元,用于确定以所述第一目标三维坐标为球心的第一球体,所述第一球体为在不包括所述低风险征信维度集合中征信维度对应的各维度类型的三维坐标的情况下的最大球体;
第一划分单元,用于划分所述第一球体内部,以得到与所述第一球体具有相同球心的至少一个球体;
第二确定单元,用于将所述第一球体与所述至少一个球体中半径最小的球体所占区域,确定为第一高风险区域;
第三确定单元,用于将所述第一球体与所述至少一个球体中相邻两个球体之间的区域,确定为第二高风险区域;
第二获取单元,用于将高风险总区域去除所述第一球体所在区域,以得到第三高风险区域,所述高风险总区域为所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标组成的区域。
在一可选实现方式中,第二聚类模块包括:
第三获取单元,用于从所述低风险征信维度集合中,获得包含的第三数目最小的第二目标三维坐标;
第四确定单元,用于确定以所述第二目标三维坐标为球心的第二球体,所述第二球体为在不包括所述高风险征信维度集合中征信维度对应的各维度类型的三维坐标的情况下的最大球体;
第二划分单元,用于划分所述第二球体内部,以得到与所述第二球体具有相同球心的至少一个球体;
第五确定单元,用于将所述第二球体与所述至少一个球体中半径最小的球体所占区域,确定为第一低风险区域;
第六确定单元,用于将所述第二球体与所述至少一个球体中相邻两个球体之间的区域,确定为第二低风险区域;
第四获取单元,用于将低风险总区域去除所述第二球体所在区域,以得到第三低风险区域,所述低风险总区域为所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标组成的区域。
在一可选实现方式中,第一获取模块包括:
第五获取单元,用于获取所述待测用户的存单记录对应的各存单类型的存单参数,所述存单类型的存单参数包括:所述存单类型下的存款记录总条数,所述存单类型下的存款总金额,所述存单类型的所述风险字段数目;
第七确定单元,用于将所述存款记录总条数确定为所述存单类型的三维坐标的第一数目,将所述存单类型下的存款总金额确定为所述存单类型的三维坐标的第二数目,将所述存单类型的所述风险字段数目确定为所述存单类型的三维坐标的第三数目;
和/或,
第六获取单元,用于获取所述待测用户的贷款记录对应的各贷款类型的贷款参数,所述贷款类型的贷款参数包括:属于所述贷款类型的贷款记录的总条数,属于所述贷款类型的贷款总金额,所述贷款类型的所述风险字段数目;
第八确定单元,用于将属于所述贷款类型的贷款记录的条数确定为所述贷款类型的三维坐标的第一数目,将属于所述贷款类型的贷款总金额确定为所述贷款类型的三维坐标的第二数目,将所述贷款类型的所述风险字段数目确定为所述贷款类型的三维坐标的第三数目;
和/或,
第七获取单元,用于获取所述待测用户的所述透支消费记录对应的各透支途径的透支参数,所述透支途径的透支参数包括:通过所述透支途径进行透支的透支总次数、通过所述透支途径进行透支的透支总金额、所述透支途径的所述风险字段数目;
第九确定单元,用于将所述透支总次数确定为所述透支途径的三维坐标中的所述第一数目,将所述透支总金额确定为所述透支途径的三维坐标中的所述第二数目,将所述透支途径的所述风险字段数目确定为所述透支途径的三维坐标中的所述第三数目;
和/或,
第八获取单元,用于获取所述待测用户的所述逾期还款记录对应的各逾期还款途径的逾期还款参数,所述逾期还款参数包括:通过所述逾期还款途径进行透支后逾期还款的总次数、通过所述逾期还款途径进行透支后逾期还款的逾期时长、通过所述逾期还款途径进行透支后逾期还款的总金额、所述逾期还款途径的所述风险字段数目;
第十确定单元,用于将通过所述逾期还款途径进行透支后逾期还款的总次数确定为所述逾期还款途径的三维坐标中的所述第一数目;
第十一确定单元,用于将通过所述逾期还款途径进行透支后逾期还款的总金额确定为所述逾期还款途径的三维坐标中的所述第二数目;
第九获取单元,用于基于所述逾期时长以及所述逾期还款途径的所述风险字段数目,得到所述逾期还款途径的三维坐标中的所述第三数目;
和/或,
第十获取单元,用于获取所述待测用户的延时缴费记录对应的各缴费途径的缴费参数,所述缴费途径的缴费参数包括:属于所述缴费途径的缴费记录的总条数,属于所述缴费途径的缴费总金额,所述缴费途径的所述风险字段数目;
第十二确定单元,用于将属于所述缴费途径的缴费记录的总条数确定为所述缴费途径的三维坐标的第一数目,将属于所述缴费途径的缴费总金额确定为所述缴费途径的三维坐标的第二数目,将所述缴费途径的所述风险字段数目确定为所述缴费途径的三维坐标的第三数目;
和/或,
第十一获取单元,用于获取所述待测用户的非透支消费记录对应的各消费类型的消费参数,所述消费类型的消费参数包括:属于所述消费类型的消费记录的总条数,属于所述消费类型的消费总金额,所述消费类型的所述风险字段数目;
第十三确定单元,用于将属于所述消费类型的消费记录的总条数确定为所述消费类型的三维坐标的第一数目,将属于所述消费类型的消费总金额确定为所述消费类型的三维坐标的第二数目,将所述消费类型的所述风险字段数目确定为所述消费类型的三维坐标的第三数目;
和/或,
第十二获取单元,用于获取所述待测用户的投资记录对应的各投资类型的投资参数,所述投资类型的投资参数包括:属于所述投资类型的投资总次数,属于所述投资类型的投资总金额,所述投资类型的所述风险字段数目;
第十四确定单元,用于将属于所述投资类型的投资总次数确定为所述投资类型的三维坐标的第一数目,将属于所述投资类型的投资总金额确定为所述投资类型的三维坐标的第二数目,将所述投资类型的所述风险字段数目确定为所述投资类型的三维坐标的第三数目;
和/或,
第十三获取单元,用于获取所述待测用户的提前结束投资记录的各结束投资类型的结束投资参数,所述结束投资类型的结束投资参数包括:属于所述结束投资类型的投资总次数,属于所述结束投资类型的投资总金额,所述结束投资类型的所述风险字段数目;
第十五确定单元,用于将属于所述结束投资类型的投资总次数确定为所述结束投资类型的三维坐标的第一数目,将属于所述结束投资类型的投资总金额确定为所述结束投资类型的三维坐标的第二数目,将所述结束投资类型的所述风险字段数目确定为所述结束投资类型的三维坐标的第三数目;
和/或,
第十四获取单元,用于获取所述待测用户的收入记录的各收入类型的收入参数,所述收入类型的收入参数包括:属于所述收入类型的收入记录的总条数,属于所述收入类型的收入总金额,所述收入类型的所述风险字段数目;
第十六确定单元,用于将属于所述收入类型的收入记录的总条数确定为所述收入类型的三维坐标的第一数目,将属于所述收入类型的收入总金额确定为所述收入类型的三维坐标的第二数目,将所述收入类型的所述风险字段数目确定为所述收入类型的三维坐标的第三数目;
和/或,
第十五获取单元,用于获取所述待测用户的退货退款记录的各退货退款类型的退货退款参数,所述退货退款类型的退货退款参数包括:属于所述退货退款类型的退货退款总次数,属于所述退货退款类型的退货退款总金额,所述退货退款类型的所述风险字段数目;
第十七确定单元,用于将属于所述退货退款类型的退货退款总次数确定为所述退货退款类型的三维坐标的第一数目,将属于所述退货退款类型的退货退款总金额确定为所述退货退款类型的三维坐标的第二数目,将所述退货退款类型的所述风险字段数目确定为所述退货退款类型的三维坐标的第三数目。
在一可选实现方式中,还包括:
筛选模块,用于从多个征信维度中筛选出未被选取过的所述目标征信维度;
触发模块,用于在所述计算模块计算得到所述待测用户的个人征信评分后,若所述多个征信维度中各征信维度未均被选取过,触发所述筛选模块,以得到所述待测用户对应的多个个人征信评分;
所述个人征信评分获取装置还包括:
第二计算模块,用于基于所述待测用户对应的多个个人征信评分,计算得到所述待测用户的第一目标个人征信评分。
在一可选实现方式中,还包括:
输入模块,用于将多个所述高风险区域的权重值、多个所述低风险区域的权重值、所述目标征信维度对应的各维度类型的三维坐标,以及,每一所述三维坐标所在的目标区域输入至预先构建的资金流动预测模型,所述目标区域为所述高风险区域或低风险区域;
预测模块,用于通过所述资金流动预测模型得到所述待测用户将来设定时间段的资金流动信息以及所述待测用户针对所述资金流动信息的行为信息。
在一可选实现方式中,还包括:
第三计算模块,用于基于所述待测用户的个人征信评分、所述资金流动信息以及所述待测用户针对所述资金流动信息的行为信息,计算得到所述待测用户的第二目标个人征信评分。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是根据一示例性实施例示出的一种用于服务器的装置的框图。
服务器包括但不限于:处理器71、存储器72、网络接口73、I/O控制器74以及通信总线75。
需要说明的是,本领域技术人员可以理解,图7中示出的服务器的结构并不构成对服务器的限定,服务器可以包括比图7所示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图7对服务器的各个构成部件进行具体的介绍:
处理器71是服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器72内的软件程序和/或模块,以及调用存储在存储器72内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。处理器71可包括一个或多个处理单元;示例性的,处理器71可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器71中。
处理器71可能是一个中央处理器(Central Processing Unit,CPU),或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
存储器72可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM)721和只读存储器(Read-Only Memory,ROM)722,也可能还包括大容量存储设备723,例如至少1个磁盘存储器等。当然,该服务器还可能包括其他业务所需要的硬件。
其中,上述的存储器72,用于存储上述处理器71可执行指令。上述处理器71能够实现本申请实施例提供的个人征信评分获取方法。
一个有线或无线网络接口73被配置为将服务器连接到网络。
处理器71、存储器72、网络接口73和I/O控制器74可以通过通信总线75相互连接,该通信总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。
在示例性实施例中,服务器可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述个人征信评分获取方法。
在示例性实施例中,本公开实施例提供了一种包括指令的存储介质,例如包括指令的存储器72,上述指令可由服务器的处理器71执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机可读存储介质,可直接加载到计算机的内部存储器,例如上述存储器72中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现上述个人征信评分获取方法任一实施例所示步骤。
在示例性实施例中,还提供一种计算机程序产品,可直接加载到计算机的内部存储器,例如所述服务器包含的存储器中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现上述所述个人征信评分获取方法任一实施例所示步骤。
需要说明的是,本发明提供的个人征信评分获取方法、装置、服务器及介质可用于人工智能领域、大数据领域、物联网领域、移动互联领域或金融领域。上述仅为示例,并不对本发明提供的个人征信评分获取方法、装置、服务器及介质的应用领域进行限定。
需要说明的是,本说明书中的各个实施例中记载的特征可以相互替换或者组合。对于装置或系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种个人征信评分获取方法,其特征在于,包括:
获取待测用户的目标征信维度对应的各维度类型的三维坐标,所述目标征信维度包括:存单记录、贷款记录、透支消费记录、逾期还款记录、延时缴费记录、非透支消费记录、投资记录、提前结束投资记录、收入记录以及退货退款记录中的至少一个,所述目标征信维度的每一维度类型的三维坐标包括:第一数目、第二数目以及第三数目,所述第一数目表征在所述目标征信维度下属于所述维度类型的记录的总条数,所述第二数目表征在所述目标征信维度下属于所述维度类型的记录的总金额,所述第三数目表征在所述目标征信维度下所述维度类型对应的风险字段数目,所述维度类型对应的风险字段数目是指针对所述维度类型的评价内容和/或预设描述内容中包含的与高风险的相关度大于或等于预设阈值的字段的数目;
从预先设置的征信维度与风险等级的对应关系中,查找所述目标征信维度对应的风险等级;
将所述目标征信维度中风险等级高于或等于预设风险等级的目标征信维度划分至高风险征信维度集合;
将所述目标征信维度中风险等级低于所述预设风险等级的目标征信维度划分至低风险征信维度集合;
将所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个高风险区域,每一所述高风险区域对应一个高风险集合,所述高风险集合包含属于同一簇的所述三维坐标;
将所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个低风险区域,每一所述低风险区域对应一个低风险集合,所述低风险集合包含属于同一簇所述三维坐标;
从预先存储的区域与评分的对应关系中,查找所述多个高风险区域和所述多个低风险区域分别对应的评分;
基于所述多个高风险区域分别对应的评分和权重值,以及,所述多个低风险区域分别对应的评分和权重值,计算得到所述待测用户的个人征信评分,所述高风险区域的权重值为位于所述高风险区域的三维坐标包含的所述第一数目之和与所有所述目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和的比值,所述低风险区域的权重值为位于所述低风险区域的三维坐标包含的所述第一数目之和与所有所述目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和的比值。
2.根据权利要求1所述个人征信评分获取方法,其特征在于,所述将所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个高风险区域步骤包括:
从所述高风险征信维度集合中,获得包含的第三数目最大的第一目标三维坐标;
确定以所述第一目标三维坐标为球心的第一球体,所述第一球体为在不包括所述低风险征信维度集合中征信维度对应的各维度类型的三维坐标的情况下的最大球体;
划分所述第一球体内部,以得到与所述第一球体具有相同球心的至少一个球体;
将所述第一球体与所述至少一个球体中半径最小的球体所占区域,确定为第一高风险区域;
将所述第一球体与所述至少一个球体中相邻两个球体之间的区域,确定为第二高风险区域;
将高风险总区域去除所述第一球体所在区域,以得到第三高风险区域,所述高风险总区域为所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标组成的区域。
3.根据权利要求1所述个人征信评分获取方法,其特征在于,所述将所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个低风险区域步骤包括:
从所述低风险征信维度集合中,获得包含的第三数目最小的第二目标三维坐标;
确定以所述第二目标三维坐标为球心的第二球体,所述第二球体为在不包括所述高风险征信维度集合中征信维度对应的各维度类型的三维坐标的情况下的最大球体;
划分所述第二球体内部,以得到与所述第二球体具有相同球心的至少一个球体;
将所述第二球体与所述至少一个球体中半径最小的球体所占区域,确定为第一低风险区域;
将所述第二球体与所述至少一个球体中相邻两个球体之间的区域,确定为第二低风险区域;
将低风险总区域去除所述第二球体所在区域,以得到第三低风险区域,所述低风险总区域为所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标组成的区域。
4.根据权利要求1至3任一所述个人征信评分获取方法,其特征在于,所述获取待测用户的目标征信维度对应的各维度类型的三维坐标步骤包括:
获取所述待测用户的存单记录对应的各存单类型的存单参数,所述存单类型的存单参数包括:所述存单类型下的存款记录总条数,所述存单类型下的存款总金额,所述存单类型的所述风险字段数目;
将所述存款记录总条数确定为所述存单类型的三维坐标的第一数目,将所述存单类型下的存款总金额确定为所述存单类型的三维坐标的第二数目,将所述存单类型的所述风险字段数目确定为所述存单类型的三维坐标的第三数目;
和/或,
获取所述待测用户的贷款记录对应的各贷款类型的贷款参数,所述贷款类型的贷款参数包括:属于所述贷款类型的贷款记录的总条数,属于所述贷款类型的贷款总金额,所述贷款类型的所述风险字段数目;
将属于所述贷款类型的贷款记录的条数确定为所述贷款类型的三维坐标的第一数目,将属于所述贷款类型的贷款总金额确定为所述贷款类型的三维坐标的第二数目,将所述贷款类型的所述风险字段数目确定为所述贷款类型的三维坐标的第三数目;
和/或,
获取所述待测用户的所述透支消费记录对应的各透支途径的透支参数,所述透支途径的透支参数包括:通过所述透支途径进行透支的透支总次数、通过所述透支途径进行透支的透支总金额、所述透支途径的所述风险字段数目;
将所述透支总次数确定为所述透支途径的三维坐标中的所述第一数目,将所述透支总金额确定为所述透支途径的三维坐标中的所述第二数目,将所述透支途径的所述风险字段数目确定为所述透支途径的三维坐标中的所述第三数目;
和/或,
获取所述待测用户的所述逾期还款记录对应的各逾期还款途径的逾期还款参数,所述逾期还款参数包括:通过所述逾期还款途径进行透支后逾期还款的总次数、通过所述逾期还款途径进行透支后逾期还款的逾期时长、通过所述逾期还款途径进行透支后逾期还款的总金额、所述逾期还款途径的所述风险字段数目;
将通过所述逾期还款途径进行透支后逾期还款的总次数确定为所述逾期还款途径的三维坐标中的所述第一数目;
将通过所述逾期还款途径进行透支后逾期还款的总金额确定为所述逾期还款途径的三维坐标中的所述第二数目;
基于所述逾期时长以及所述逾期还款途径的所述风险字段数目,得到所述逾期还款途径的三维坐标中的所述第三数目;
和/或,
获取所述待测用户的延时缴费记录对应的各缴费途径的缴费参数,所述缴费途径的缴费参数包括:属于所述缴费途径的缴费记录的总条数,属于所述缴费途径的缴费总金额,所述缴费途径的所述风险字段数目;
将属于所述缴费途径的缴费记录的总条数确定为所述缴费途径的三维坐标的第一数目,将属于所述缴费途径的缴费总金额确定为所述缴费途径的三维坐标的第二数目,将所述缴费途径的所述风险字段数目确定为所述缴费途径的三维坐标的第三数目;
和/或,
获取所述待测用户的非透支消费记录对应的各消费类型的消费参数,所述消费类型的消费参数包括:属于所述消费类型的消费记录的总条数,属于所述消费类型的消费总金额,所述消费类型的所述风险字段数目;
将属于所述消费类型的消费记录的总条数确定为所述消费类型的三维坐标的第一数目,将属于所述消费类型的消费总金额确定为所述消费类型的三维坐标的第二数目,将所述消费类型的所述风险字段数目确定为所述消费类型的三维坐标的第三数目;
和/或,
获取所述待测用户的投资记录对应的各投资类型的投资参数,所述投资类型的投资参数包括:属于所述投资类型的投资总次数,属于所述投资类型的投资总金额,所述投资类型的所述风险字段数目;
将属于所述投资类型的投资总次数确定为所述投资类型的三维坐标的第一数目,将属于所述投资类型的投资总金额确定为所述投资类型的三维坐标的第二数目,将所述投资类型的所述风险字段数目确定为所述投资类型的三维坐标的第三数目;
和/或,
获取所述待测用户的提前结束投资记录的各结束投资类型的结束投资参数,所述结束投资类型的结束投资参数包括:属于所述结束投资类型的投资总次数,属于所述结束投资类型的投资总金额,所述结束投资类型的所述风险字段数目;
将属于所述结束投资类型的投资总次数确定为所述结束投资类型的三维坐标的第一数目,将属于所述结束投资类型的投资总金额确定为所述结束投资类型的三维坐标的第二数目,将所述结束投资类型的所述风险字段数目确定为所述结束投资类型的三维坐标的第三数目;
和/或,
获取所述待测用户的收入记录的各收入类型的收入参数,所述收入类型的收入参数包括:属于所述收入类型的收入记录的总条数,属于所述收入类型的收入总金额,所述收入类型的所述风险字段数目;
将属于所述收入类型的收入记录的总条数确定为所述收入类型的三维坐标的第一数目,将属于所述收入类型的收入总金额确定为所述收入类型的三维坐标的第二数目,将所述收入类型的所述风险字段数目确定为所述收入类型的三维坐标的第三数目;
和/或,
获取所述待测用户的退货退款记录的各退货退款类型的退货退款参数,所述退货退款类型的退货退款参数包括:属于所述退货退款类型的退货退款总次数,属于所述退货退款类型的退货退款总金额,所述退货退款类型的所述风险字段数目;
将属于所述退货退款类型的退货退款总次数确定为所述退货退款类型的三维坐标的第一数目,将属于所述退货退款类型的退货退款总金额确定为所述退货退款类型的三维坐标的第二数目,将所述退货退款类型的所述风险字段数目确定为所述退货退款类型的三维坐标的第三数目。
5.根据权利要求1所述个人征信评分获取方法,其特征在于,在所述获取待测用户的目标征信维度对应的各维度类型的三维坐标步骤之前,还包括:
从多个征信维度中筛选出未被选取过的所述目标征信维度;
在所述基于所述多个高风险区域分别对应的评分和权重值,以及,所述多个低风险区域分别对应的评分和权重值,计算得到所述待测用户的个人征信评分步骤之后,还包括:
返回所述从多个征信维度中筛选出未被选取过的目标征信维度步骤,直至所述多个征信维度中各征信维度均被选取过,以得到所述待测用户对应的多个个人征信评分;
所述个人征信评分获取方法还包括:
基于所述待测用户对应的多个个人征信评分,计算得到所述待测用户的第一目标个人征信评分。
6.根据权利要求1、2、3或5任一所述个人征信评分获取方法,其特征在于,还包括:
将多个所述高风险区域的权重值、多个所述低风险区域的权重值、所述目标征信维度对应的各维度类型的三维坐标,以及,每一所述三维坐标所在的目标区域输入至预先构建的资金流动预测模型,所述目标区域为所述高风险区域或低风险区域;
通过所述资金流动预测模型得到所述待测用户将来设定时间段的资金流动信息以及所述待测用户针对所述资金流动信息的行为信息。
7.根据权利要求6所述个人征信评分获取方法,其特征在于,还包括:
基于所述待测用户的个人征信评分、所述资金流动信息以及所述待测用户针对所述资金流动信息的行为信息,计算得到所述待测用户的第二目标个人征信评分。
8.一种个人征信评分获取装置,其特征在于,包括:
第一获取模块,用于获取待测用户的目标征信维度对应的各维度类型的三维坐标,所述目标征信维度包括:存单记录、贷款记录、透支消费记录、逾期还款记录、延时缴费记录、非透支消费记录、投资记录、提前结束投资记录、收入记录以及退货退款记录中的至少一个,所述目标征信维度的每一维度类型的三维坐标包括:第一数目、第二数目以及第三数目,所述第一数目表征在所述目标征信维度下属于所述维度类型的记录的总条数,所述第二数目表征在所述目标征信维度下属于所述维度类型的记录的总金额,所述第三数目表征在所述目标征信维度下所述维度类型对应的风险字段数目,所述维度类型对应的风险字段数目是指针对所述维度类型的评价内容和/或预设描述内容中包含的与高风险的相关度大于或等于预设阈值的字段的数目;
第一查找模块,用于从预先设置的征信维度与风险等级的对应关系中,查找所述目标征信维度对应的风险等级;
第一划分模块,用于将所述目标征信维度中风险等级高于或等于预设风险等级的目标征信维度划分至高风险征信维度集合;
第二划分模块,用于将所述目标征信维度中风险等级低于所述预设风险等级的目标征信维度划分至低风险征信维度集合;
第一聚类模块,用于将所述高风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个高风险区域,每一所述高风险区域对应一个高风险集合,所述高风险集合包含属于同一簇的所述三维坐标;
第二聚类模块,用于将所述低风险征信维度集合包含的目标征信维度对应的各维度类型的三维坐标按照三维坐标包含的所述第三数目进行聚类,以得到多个低风险区域,每一所述低风险区域对应一个低风险集合,所述低风险集合包含属于同一簇所述三维坐标;
第二查找模块,用于从预先存储的区域与评分的对应关系中,查找所述多个高风险区域和所述多个低风险区域分别对应的评分;
第一计算模块,用于基于所述多个高风险区域分别对应的评分和权重值,以及,所述多个低风险区域分别对应的评分和权重值,计算得到所述待测用户的个人征信评分,所述高风险区域的权重值为位于所述高风险区域的三维坐标包含的所述第一数目之和与所有所述目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和的比值,所述低风险区域的权重值为位于所述低风险区域的三维坐标包含的所述第一数目之和与所有所述目标征信维度分别对应的各维度类型的三维坐标包含的第一数目之和的比值。
9.一种服务器,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7任一所述的个人征信评分获取方法。
10.一种计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如权利要求1至7中任一项所述的个人征信评分获取方法。
CN202111098734.4A 2021-09-18 2021-09-18 个人征信评分获取方法、装置、服务器及介质 Active CN113744049B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111098734.4A CN113744049B (zh) 2021-09-18 2021-09-18 个人征信评分获取方法、装置、服务器及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111098734.4A CN113744049B (zh) 2021-09-18 2021-09-18 个人征信评分获取方法、装置、服务器及介质

Publications (2)

Publication Number Publication Date
CN113744049A true CN113744049A (zh) 2021-12-03
CN113744049B CN113744049B (zh) 2024-05-24

Family

ID=78739929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111098734.4A Active CN113744049B (zh) 2021-09-18 2021-09-18 个人征信评分获取方法、装置、服务器及介质

Country Status (1)

Country Link
CN (1) CN113744049B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012097171A2 (en) * 2011-01-13 2012-07-19 Jeffrey Stewart Systems and methods for using online social footprint for affecting lending performance and credit scoring
CN106897918A (zh) * 2017-02-24 2017-06-27 上海易贷网金融信息服务有限公司 一种混合式机器学习信用评分模型构建方法
CN111062444A (zh) * 2019-12-21 2020-04-24 湖南大学 信用风险预测方法、系统、终端及存储介质
CN111932367A (zh) * 2020-08-13 2020-11-13 中国银行股份有限公司 贷前信用评估方法及装置
CN112508589A (zh) * 2019-08-26 2021-03-16 珠海格力电器股份有限公司 个体征信值评估方法及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012097171A2 (en) * 2011-01-13 2012-07-19 Jeffrey Stewart Systems and methods for using online social footprint for affecting lending performance and credit scoring
CN106897918A (zh) * 2017-02-24 2017-06-27 上海易贷网金融信息服务有限公司 一种混合式机器学习信用评分模型构建方法
CN112508589A (zh) * 2019-08-26 2021-03-16 珠海格力电器股份有限公司 个体征信值评估方法及计算机可读存储介质
CN111062444A (zh) * 2019-12-21 2020-04-24 湖南大学 信用风险预测方法、系统、终端及存储介质
CN111932367A (zh) * 2020-08-13 2020-11-13 中国银行股份有限公司 贷前信用评估方法及装置

Also Published As

Publication number Publication date
CN113744049B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
Ala’raj et al. Modelling customers credit card behaviour using bidirectional LSTM neural networks
Abdou et al. Credit scoring, statistical techniques and evaluation criteria: a review of the literature
Roa et al. Super-app behavioral patterns in credit risk models: Financial, statistical and regulatory implications
CN110599336B (zh) 一种金融产品购买预测方法及系统
Chen Classifying credit ratings for Asian banks using integrating feature selection and the CPDA-based rough sets approach
CN108133013A (zh) 信息处理方法、装置、计算机设备和存储介质
CN111325550A (zh) 一种欺诈交易行为识别方法和装置
CN112488719A (zh) 一种账户风险识别方法和装置
CN111708883A (zh) 一种基于机器学习和设备指纹的授信额度确定方法及装置
CN113407854A (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
Talaat et al. Toward interpretable credit scoring: integrating explainable artificial intelligence with deep learning for credit card default prediction
CN111242356A (zh) 一种财富走势预测方法、装置、设备及存储介质
CN112232950A (zh) 针对借贷风险的评估方法及装置、设备、计算机可读存储介质
Simumba et al. Alternative scoring factors using non-financial data for credit decisions in agricultural microfinance
Singh et al. ML‐Based Interconnected Affecting Factors with Supporting Matrices for Assessment of Risk in Stock Market
CN110796379A (zh) 业务渠道的风险评估方法、装置、设备及存储介质
CN113744049B (zh) 个人征信评分获取方法、装置、服务器及介质
CN107305662A (zh) 识别违规账户的方法及装置
CN109886299A (zh) 一种用户画像方法、装置、可读存储介质及终端设备
CN114187104A (zh) 交易风险检测方法、装置、计算机设备和存储介质
CN111461420A (zh) 模型预测结果的解释方法和装置
US20230351783A1 (en) Application of heuristics to handwritten character recognition to identify names using neural network techniques
Glushchenko et al. Assessment Of An Individual'S Credit Solvency By Credit Organizations
Koski et al. Investor Attention and Technology Salience: Does Personal Data Related Innovation Boost Firm Value?
Chi Managing credit risk and the cost of equity with machine learning techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant