CN113052692A - 数据处理的方法、装置、电子设备及计算机可读存储介质 - Google Patents

数据处理的方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113052692A
CN113052692A CN202110611512.1A CN202110611512A CN113052692A CN 113052692 A CN113052692 A CN 113052692A CN 202110611512 A CN202110611512 A CN 202110611512A CN 113052692 A CN113052692 A CN 113052692A
Authority
CN
China
Prior art keywords
vector
financial information
user
information
credit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110611512.1A
Other languages
English (en)
Inventor
张翼
温佳豪
尤鸣宇
韩煊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qingsongchou Information Technology Co ltd
Original Assignee
Beijing Qingsongchou Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qingsongchou Information Technology Co ltd filed Critical Beijing Qingsongchou Information Technology Co ltd
Priority to CN202110611512.1A priority Critical patent/CN113052692A/zh
Publication of CN113052692A publication Critical patent/CN113052692A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请提供了一种数据处理的方法、装置、电子设备及计算机可读存储介质,该方法包括:将目标用户的第一金融信息对应的第一金融信息向量,以及每个关联用户的第二金融信息对应的第二金融信息向量按照预设顺序输入到目标信用风险评级模型中,提取第一金融信息向量的关键特征得到第一特征向量,以及提取每个第二金融信息向量的关键特征得到第二特征向量;根据第一特征向量和每个第二特征向量得到目标用户对应的第一编码向量;根据第一编码向量得到目标用户的第一信用等级向量;根据第一信用等级向量确定目标用户的第一信用等级。本申请通过使用目标用户及其关联用户的金融信息进行评级的方法,提高了用户信用等级评定的准确率。

Description

数据处理的方法、装置、电子设备及计算机可读存储介质
技术领域
本申请涉及计算机技术领域,尤其是涉及一种数据处理的方法、装置、电子设备及计算机可读存储介质。
背景技术
用户信用等级评定指的是银行、金融机构或专业评估机构,根据用户提交的资料和以往的业务情况,通过分析用户的信用、品质、偿还能力等指标,对用户的信用等级进行评定。
现有技术中,在进行用户信用等级评定时,通常使用用户自己的身份信息进行评定。但是人具有社会属性,所谓社会属性是指在实践活动的基础上人与人之间发生的各种关系,人的社会属性会影响每个人的信用等级,而现有技术中仅仅使用用户个人的身份信息进行信用等级评级,并未考虑到人的社会属性对每个人信用等级的影响,因此使用现有技术中的方法对用户进行信用等级评定是不够准确的。
发明内容
有鉴于此,本申请的目的在于提供一种数据处理的方法、装置、电子设备及计算机可读存储介质,以提高用户信用等级评定的准确率。
第一方面,本申请实施例提供了一种数据处理的方法,包括:
获取目标用户的第一金融信息和至少一个关联用户的第二金融信息;
根据所述第一金融信息,确定第一金融信息向量;以及针对每个所述关联用户,根据所述第二金融信息,确定第二金融信息向量;
将所述第一金融信息向量和每个所述第二金融信息向量按照预设顺序输入到训练完成后的目标信用风险评级模型中,得到所述目标信用风险评级模型输出的所述目标用户对应的第一信用等级向量;其中,所述目标信用风险评级模型包括嵌入层、编码部分和全连接层,在所述目标信用风险评级模型中,将所述第一金融信息向量和每个所述第二金融信息向量按照所述预设顺序输入到所述嵌入层中,提取所述第一金融信息向量的关键特征得到所述目标用户对应的第一特征向量,以及提取每个所述第二金融信息向量的关键特征得到每个关联用户对应的第二特征向量;将所述嵌入层输出的所述第一特征向量和每个所述第二特征向量按照所述预设顺序输入到所述编码部分,输出用于表示每个所述关联用户的第二金融信息以及所述目标用户的第一金融信息对所述目标用户的信用等级评定造成的影响结果的第一编码向量;将所述第一编码向量输入到所述全连接层,输出所述目标用户对应的第一信用等级向量;
根据所述第一信用等级向量,确定所述目标用户的第一信用等级。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述获取至少一个关联用户的第二金融信息之前,还包括:
针对每个所述关联用户,向所述关联用户发送获取所述关联用户的第二金融信息的请求;
针对每个所述关联用户,接收所述关联用户的回应信息;所述回应信息中包括所述关联用户的第二金融信息,以及所述关联用户同意所述目标用户使用所述关联用户的第二金融信息进行信用等级评定的证明材料。
结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述关联用户包括第一关联用户和第二关联用户,其中所述第一关联用户包括所述目标用户的配偶、父母、直系成年兄弟姐妹和成年子女中的至少一个,所述第二关联用户包括所述目标用户的商业合作伙伴、担保人中的至少一个;
所述获取至少一个关联用户的第二金融信息,包括:
根据所述目标信用风险评级模型在训练时使用的训练样本中的第一关联样本的个数与第二关联样本的个数,确定所述目标信用风险评级模型在使用时所述关联用户中所述第一关联用户的个数以及所述第二关联用户的个数;
根据所述关联用户中所述第一关联用户的个数以及所述第二关联用户的个数,获取至少一个所述关联用户的第二金融信息。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中,
所述第一金融信息和所述第二金融信息的类型均包括数值型信息和/或非数值型信息;
所述根据所述第一金融信息,确定第一金融信息向量;以及针对每个所述关联用户,根据所述第二金融信息,确定第二金融信息向量,包括:
当所述第一金融信息为非数值型信息时,对所述第一金融信息中的非数值型信息进行独热编码,得到用于表示所述第一金融信息中的非数值型信息的第一子金融信息向量;
当所述第一金融信息为数值型信息时,根据所述第一金融信息中的数值型信息,确定用于表示所述第一金融信息中的数值型信息的第二子金融信息向量;
将所述第一子金融信息向量和所述第二子金融信息向量进行组合,得到用于表示所述第一金融信息的第一金融信息向量;
当所述第二金融信息为非数值型信息时,对所述第二金融信息中的非数值型信息进行独热编码,得到用于表示所述第二金融信息中的非数值型信息的第三子金融信息向量;
当所述第二金融信息为数值型信息时,根据所述第二金融信息中的数值型信息,确定用于表示所述第二金融信息中的数值型信息的第四子金融信息向量;
针对每个所述关联用户,将所述关联用户的所述第三子金融信息向量和所述第四子金融信息向量进行组合,得到用于表示所述关联用户对应的第二金融信息的第二金融信息向量。
结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中,所述编码部分包括至少一个结构相同参数不同的编码器,每个所述编码器的输出为下一个编码器的输入;其中每个所述编码器均包括注意力层、第一残差单元、第一层标准化、前馈网络、第二残差单元以及第二层标准化;
所述将所述嵌入层输出的所述第一特征向量和每个所述第二特征向量按照所述预设顺序输入到所述编码部分,输出用于表示每个所述关联用户的第二金融信息以及所述目标用户的第一金融信息对所述目标用户的信用等级评定造成的影响结果的第一编码向量,包括:
将所述嵌入层输出的所述第一特征向量和每个所述第二特征向量按照所述预设顺序输入到第一个编码器的注意力层,输出所述目标用户对应的第一关联向量,以及每个所述关联用户对应的第二关联向量;其中,在所述注意力层,分别对所述第一特征向量和每个所述第二特征向量进行线性变换,得到所述目标用户对应的第一查询向量、第一关键向量和第一信息向量,以及得到每个所述关联用户分别对应的第二查询向量、第二关键向量和第二信息向量;根据所述第一查询向量、所述第一关键向量和所述第一信息向量,以及每个关联用户对应的所述第二查询向量、所述第二关键向量和所述第二信息向量,计算得到所述目标用户对应的第一关联向量以及每个关联用户对应的第二关联向量;
将所述第一关联向量和每个所述第二关联向量按照所述预设顺序输入到第一个编码器的第一残差单元,输出所述目标用户对应的第一融合向量以及每个所述关联用户对应的第二融合向量;在所述第一残差单元中,将所述第一特征向量和所述第一关联向量相加,得到所述目标用户对应的第一融合向量;以及针对每个关联用户,将所述关联用户对应的第二特征向量和第二关联向量相加,得到所述关联用户对应的第二融合向量;
将所述第一融合向量和每个所述第二融合向量按照所述预设顺序输入到第一个编码器的第一层标准化,对所述第一融合向量和每个所述第二融合向量分别进行标准化处理,得到所述目标用户对应的第一标准化向量以及每个所述关联用户对应的第二标准化向量;
将所述第一标准化向量和每个所述第二标准化向量按照所述预设顺序输入到第一个编码器的前馈网络,分别对所述第一标准化向量和每个所述第二标准化向量进行线性变换,得到所述目标用户对应的第三特征向量以及每个所述关联用户对应的第四特征向量;
将所述第三特征向量和每个所述第四特征向量按照所述预设顺序输入到第一个编码器的第二残差单元,输出所述目标用户对应的第三融合向量以及每个所述关联用户对应的第四融合向量;在所述第二残差单元中,将所述第一标准化向量和所述第三特征向量相加,得到所述目标用户对应的第三融合向量;针对每个关联用户,将所述关联用户对应的第二标准化向量和第四特征向量相加,得到所述关联用户对应的第四融合向量;
将所述第三融合向量以及每个所述第四融合向量按照所述预设顺序输入到第一个编码器的第二层标准化中,对所述第三融合向量以及每个所述第四融合向量进行标准化处理,得到所述目标用户对应的第三标准化向量以及每个所述关联用户对应的第四标准化向量;
将所述第三标准化向量以及每个所述第四标准化向量按照所述预设顺序输入到下一个编码器中,进行与在第一个编码器中相同的处理,直至最后一个编码器的第二层标准化中输出所述目标用户对应的第三标准化向量,将最后一个编码器输出的第三标准化向量作为所述目标用户的第一编码向量。
结合第一方面,本申请实施例提供了第一方面的第五种可能的实施方式,其中,所述获取目标用户和至少一个关联用户的第一金融信息之前,还包括:
获取训练样本的第三金融信息和至少一个关联样本的第四金融信息,以及训练样本的第一等级标签和每个关联样本对应的第二等级标签;
根据所述第三金融信息的类型,对第三金融信息进行预处理,得到用于表示所述第三金融信息的第三金融信息向量;以及针对每个所述关联样本,根据所述第四金融信息的类型,对所述第四金融信息进行预处理,得到用于表示该关联用户对应的第四金融信息的第四金融信息向量;
将所述第三金融信息向量和每个所述关联样本各自对应的所述第四金融信息向量按照所述预设顺序输入到待训练的信用风险评级模型中,得到所述信用风险评级模型输出的所述训练样本对应的第二信用等级向量以及每个所述关联样本对应的第三信用等级向量;其中,所述信用风险评级模型包括嵌入层、编码部分和全连接层,在所述信用风险评级模型中,将所述第三金融信息向量和每个所述第四金融信息向量按照所述预设顺序输入到所述嵌入层中,提取所述第三金融信息向量的关键特征得到所述训练样本对应的第五特征向量,以及提取每个所述第四金融信息向量的关键特征得到每个所述关联样本对应的第六特征向量;将所述嵌入层输出的所述第五特征向量和每个所述第六特征向量按照所述预设顺序输入到所述编码部分,输出用于表示每个所述关联样本的第四金融信息以及所述训练样本的第三金融信息对所述训练样本的信用等级评定造成的影响结果的第二编码向量,以及针对每个关联样本,输出用于表示所述训练样本的第三金融信息和所述关联样本的第四金融信息对所述关联样本的信用等级评定造成的影响结果的第三编码向量;将所述第二编码向量和每个关联样本对应的所述第三编码向量按照所述预设顺序输入到所述全连接层,输出所述训练样本对应的第二信用等级向量以及每个所述关联样本对应的第三信用等级向量;
根据所述第二信用等级向量、每个所述第三信用等级向量以及所述第一等级标签和每个所述第二等级标签,计算得到所述第二信用等级向量和所述第三信用等级向量与所述第一等级标签和所述第二等级标签之间的第一损失数值;
根据所述第二编码向量以及每个所述第三编码向量之间的相关系数,计算得到第二损失数值;
根据所述第一损失数值和所述第二损失数值,以及预先设定的权重,确定损失数值;
当所述损失数值不小于预设损失数值时,利用损失数值对信用风险评级模型进行本轮训练;
当所述损失数值小于预设损失数值时,将所述信用风险评级模型确定为训练完成后的目标信用风险评级模型。
第二方面,本申请实施例还提供一种数据处理的装置,包括:
第一获取模块,用于获取目标用户的第一金融信息和至少一个关联用户的第二金融信息;
第一确定模块,用于根据所述第一金融信息,确定第一金融信息向量;以及针对每个所述关联用户,根据所述第二金融信息,确定第二金融信息向量;
第一输入输出模块,用于将所述第一金融信息向量和每个所述第二金融信息向量按照预设顺序输入到训练完成后的目标信用风险评级模型中,得到所述目标信用风险评级模型输出的所述目标用户对应的第一信用等级向量;其中,所述目标信用风险评级模型包括嵌入层、编码部分和全连接层,在所述目标信用风险评级模型中,将所述第一金融信息向量和每个所述第二金融信息向量按照所述预设顺序输入到所述嵌入层中,提取所述第一金融信息向量的关键特征得到所述目标用户对应的第一特征向量,以及提取每个所述第二金融信息向量的关键特征得到每个关联用户对应的第二特征向量;将所述嵌入层输出的所述第一特征向量和每个所述第二特征向量按照所述预设顺序输入到所述编码部分,输出用于表示每个所述关联用户的第二金融信息以及所述目标用户的第一金融信息对所述目标用户的信用等级评定造成的影响结果的第一编码向量;将所述第一编码向量输入到所述全连接层,输出所述目标用户对应的第一信用等级向量;
第二确定模块,用于根据所述第一信用等级向量,确定所述目标用户的第一信用等级。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,所述获取至少一个关联用户的第一金融信息之前,还包括:
发送模块,用于针对每个所述关联用户,向该关联用户发送获取该关联用户的第二金融信息的请求;
接收模块,用于针对每个所述关联用户,接收所述关联用户的回应信息;所述回应信息中包括所述关联用户的第二金融信息,以及所述关联用户同意所述目标用户使用所述关联用户的第二金融信息进行信用等级评定的证明材料。
结合第二方面,本申请实施例提供了第二方面的第二种可能的实施方式,其中,所述关联用户包括第一关联用户和第二关联用户,其中所述第一关联用户包括所述目标用户的配偶、父母、直系成年兄弟姐妹和成年子女中的至少一个,所述第二关联用户包括所述目标用户的商业合作伙伴、担保人中的至少一个;
所述获取至少一个关联用户的第二金融信息时,具体用于:
根据所述目标信用风险评级模型在训练时使用的训练样本中的第一关联样本的个数与第二关联样本的个数,确定所述目标信用风险评级模型在使用时所述关联用户中所述第一关联用户的个数以及所述第二关联用户的个数;
根据所述关联用户中所述第一关联用户的个数以及所述第二关联用户的个数,获取至少一个所述关联用户的第二金融信息。
结合第二方面,本申请实施例提供了第二方面的第三种可能的实施方式,其中,所述第一金融信息和所述第二金融信息的类型均包括数值型信息和/或非数值型信息;
所述根据所述第一金融信息,确定第一金融信息向量;以及针对每个所述关联用户,根据所述第二金融信息,确定第二金融信息向量时,具体用于:
当所述第一金融信息为非数值型信息时,对所述第一金融信息中的非数值型信息进行独热编码,得到用于表示所述第一金融信息中的非数值型信息的第一子金融信息向量;
当所述第一金融信息为数值型信息时,根据所述第一金融信息中的数值型信息,确定用于表示所述第一金融信息中的数值型信息的第二子金融信息向量;
将所述第一子金融信息向量和所述第二子金融信息向量进行组合,得到用于表示所述第一金融信息的第一金融信息向量;
当所述第二金融信息为非数值型信息时,对所述第二金融信息中的非数值型信息进行独热编码,得到用于表示所述第二金融信息中的非数值型信息的第三子金融信息向量;
当所述第二金融信息为数值型信息时,根据所述第二金融信息中的数值型信息,确定用于表示所述第二金融信息中的数值型信息的第四子金融信息向量;
针对每个所述关联用户,将所述关联用户的所述第三子金融信息向量和所述第四子金融信息向量进行组合,得到用于表示所述关联用户对应的第二金融信息的第二金融信息向量。
结合第二方面,本申请实施例提供了第二方面的第四种可能的实施方式,其中,所述编码部分包括至少一个结构相同参数不同的编码器,每个所述编码器的输出为下一个编码器的输入;其中每个所述编码器均包括注意力层、第一残差单元、第一层标准化、前馈网络、第二残差单元以及第二层标准化;
所述将所述嵌入层输出的所述第一特征向量和每个所述第二特征向量按照所述预设顺序输入到所述编码部分,输出用于表示每个所述关联用户的第二金融信息以及所述目标用户的第一金融信息对所述目标用户的信用等级评定造成的影响结果的第一编码向量,具体用于:
将所述嵌入层输出的所述第一特征向量和每个所述第二特征向量按照所述预设顺序输入到第一个编码器的注意力层,输出所述目标用户对应的第一关联向量,以及每个所述关联用户对应的第二关联向量;其中,在所述注意力层,分别对所述第一特征向量和每个所述第二特征向量进行线性变换,得到所述目标用户对应的第一查询向量、第一关键向量和第一信息向量,以及得到每个所述关联用户分别对应的第二查询向量、第二关键向量和第二信息向量;根据所述第一查询向量、所述第一关键向量和所述第一信息向量,以及每个关联用户对应的所述第二查询向量、所述第二关键向量和所述第二信息向量,计算得到所述目标用户对应的第一关联向量以及每个关联用户对应的第二关联向量;
将所述第一关联向量和每个所述第二关联向量按照所述预设顺序输入到第一个编码器的第一残差单元,输出所述目标用户对应的第一融合向量以及每个所述关联用户对应的第二融合向量;在所述第一残差单元中,将所述第一特征向量和所述第一关联向量相加,得到所述目标用户对应的第一融合向量;以及针对每个关联用户,将所述关联用户对应的第二特征向量和第二关联向量相加,得到所述关联用户对应的第二融合向量;
将所述第一融合向量和每个所述第二融合向量按照所述预设顺序输入到第一个编码器的第一层标准化,对所述第一融合向量和每个所述第二融合向量分别进行标准化处理,得到所述目标用户对应的第一标准化向量以及每个所述关联用户对应的第二标准化向量;
将所述第一标准化向量和每个所述第二标准化向量按照所述预设顺序输入到第一个编码器的前馈网络,分别对所述第一标准化向量和每个所述第二标准化向量进行线性变换,得到所述目标用户对应的第三特征向量以及每个所述关联用户对应的第四特征向量;
将所述第三特征向量和每个所述第四特征向量按照所述预设顺序输入到第一个编码器的第二残差单元,输出所述目标用户对应的第三融合向量以及每个所述关联用户对应的第四融合向量;在所述第二残差单元中,将所述第一标准化向量和所述第三特征向量相加,得到所述目标用户对应的第三融合向量;针对每个关联用户,将所述关联用户对应的第二标准化向量和第四特征向量相加,得到所述关联用户对应的第四融合向量;
将所述第三融合向量以及每个所述第四融合向量按照所述预设顺序输入到第一个编码器的第二层标准化中,对所述第三融合向量以及每个所述第四融合向量进行标准化处理,得到所述目标用户对应的第三标准化向量以及每个所述关联用户对应的第四标准化向量;
将所述第三标准化向量以及每个所述第四标准化向量按照所述预设顺序输入到下一个编码器中,进行与在第一个编码器中相同的处理,直至最后一个编码器的第二层标准化中输出所述目标用户对应的第三标准化向量,将最后一个编码器输出的第三标准化向量作为所述目标用户的第一编码向量。
结合第二方面,本申请实施例提供了第二方面的第五种可能的实施方式,其中,所述获取目标用户和至少一个关联用户的第一金融信息之前,还包括:
第二获取模块,用于获取训练样本的第三金融信息和至少一个关联样本的第四金融信息,以及训练样本的第一等级标签和每个关联样本对应的第二等级标签;
处理模块,用于根据所述第三金融信息的类型,对第三金融信息进行预处理,得到用于表示所述第三金融信息的第三金融信息向量;以及针对每个所述关联样本,根据所述第四金融信息的类型,对所述第四金融信息进行预处理,得到用于表示该关联用户对应的第四金融信息的第四金融信息向量;
第二输入输出模块,用于将所述第三金融信息向量和每个所述关联样本各自对应的所述第四金融信息向量按照所述预设顺序输入到待训练的信用风险评级模型中,得到所述信用风险评级模型输出的所述训练样本对应的第二信用等级向量以及每个所述关联样本对应的第三信用等级向量;其中,所述信用风险评级模型包括嵌入层、编码部分和全连接层,在所述信用风险评级模型中,将所述第三金融信息向量和每个所述第四金融信息向量按照所述预设顺序输入到所述嵌入层中,提取所述第三金融信息向量的关键特征得到所述训练样本对应的第五特征向量,以及提取每个所述第四金融信息向量的关键特征得到每个所述关联样本对应的第六特征向量;将所述嵌入层输出的所述第五特征向量和每个所述第六特征向量按照所述预设顺序输入到所述编码部分,输出用于表示每个所述关联样本的第四金融信息以及所述训练样本的第三金融信息对所述训练样本的信用等级评定造成的影响结果的第二编码向量,以及针对每个关联样本,输出用于表示所述训练样本的第三金融信息和所述关联样本的第四金融信息对所述关联样本的信用等级评定造成的影响结果的第三编码向量;将所述第二编码向量和每个关联样本对应的所述第三编码向量按照所述预设顺序输入到所述全连接层,输出所述训练样本对应的第二信用等级向量以及每个所述关联样本对应的第三信用等级向量;
第一计算模块,用于根据所述第二信用等级向量、每个所述第三信用等级向量以及所述第一等级标签和每个所述第二等级标签,计算得到所述第二信用等级向量和所述第三信用等级向量与所述第一等级标签和所述第二等级标签之间的第一损失数值;
第二计算模块,用于根据所述第二编码向量以及每个所述第三编码向量之间的相关系数,计算得到第二损失数值;
第三确定模块,用于根据所述第一损失数值和所述第二损失数值,以及预先设定的权重,确定损失数值;
训练模块,用于当所述损失数值不小于预设损失数值时,利用损失数值对信用风险评级模型进行本轮训练;
第四确定模块,用于当所述损失数值小于预设损失数值时,将所述信用风险评级模型确定为训练完成后的目标信用风险评级模型。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面中任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,中任一种可能的实施方式中的步骤。
在本申请中,通过使用目标用户的金融信息以及该目标用户对应的至少一个关联用户的金融信息,对该目标用户的信用等级评定造成的影响结果,确定目标用户的信用等级。本申请中通过人的社会属性,即人与人之间的关联关系,使用目标用户及其关联用户的金融信息对目标用户的信用等级进行评定,提高了目标用户信用等级评定的准确率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种数据处理的方法的流程图;
图2示出了本申请实施例所提供的目标信用风险评级模型的结构示意图;
图3示出了本申请实施例所提供的编码部分的结构示意图;
图4示出了本申请实施例所提供的一种数据处理的装置的结构示意图;
图5示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有技术中,在进行用户信用等级评定时,通常使用用户的个人信息进行评定。但是人具有社会属性,所谓社会属性是指在实践活动的基础上人与人之间发生的各种关系,人的社会属性会影响每个人的信用等级,而现有技术中仅仅使用用户个人的身份信息进行信用等级评级,并未考虑到人的社会属性对每个人信用等级的影响,因此使用现有技术中的方法对用户进行信用等级评定是不够准确的。
进一步地,使用现有技术进行信用等级评定时,当用户的信用等级较低且该用户还想要进行业务申请(例如贷款)时,可能会存在着通过财产转移或者借用他人(亲友)的身份信息进行申请的欺诈行为,由于银行及其他金融机构并不能识别出进行业务申请的用户是否是替代他人(信用等级较低的用户)进行申请,因此当信用等级较低的用户借用他人(信用等级较高的用户)的身份信息进行贷款时,此时银行或其他金融机构可能会将贷款借用给信用等级较低的用户,这使得商业银行或金融机构向外贷款的风险较高。所以现有技术的方法无法避免目标用户使用其亲友身份信息进行贷款,无法降低银行或其他金融机构向外贷款的风险,无法保证银行或其他金融机构的业务安全以及收益率。
考虑到上述问题,基于此,本申请实施例提供了一种数据处理的方法、装置、电子设备及可读存储介质,下面通过实施例进行描述。
实施例一:
为便于对本实施例进行理解,首先对本申请实施例所公开的一种数据处理的方法进行详细介绍。如图1示出了本申请实施例所提供的一种数据处理的方法的流程图,如图1所示,该方法包括以下步骤:
S101:获取目标用户的第一金融信息和至少一个关联用户的第二金融信息。
目标用户指的是需要进行信用风险等级评估但还未进行评估的用户,具体地,目标用户在向银行等金融机构申请贷款或进行其他业务申请之前,需要先进行用户信用风险等级评估。关联用户指的是与目标用户有一定的关联关系的用户,具体地,关联用户包括但不限于目标用户的直系亲属以及商业合作伙伴、担保人等。
金融信息指的是对用户进行信用风险等级评估时所需要的用户的个人信息,具体地,金融信息包括但不限于用户的个人身份信息(例如姓名、性别、国籍、民族、身份证件种类号码、职业、联系方式、婚姻状况、家庭状况、住所或工作单位地址、照片等)、个人财产信息(例如个人收入状况、拥有的不动产状况、拥有的车辆状况、纳税额、公积金缴存金额等)、个人账户信息(例如账号、账户开立时间、开户行、账户余额、账户交易情况等)、个人信用信息(例如信用卡还款情况、贷款偿还情况以及个人在经济活动中形成的,能够反映其信用状况的其他信息)以及个人金融交易信息(例如银行金融机构在支付结算、理财、保险箱等中间业务过程中获取、保存、留存的个人信息和客户在通过银行金融机构与保险公司、证券公司、基金公司、期货公司等第三方机构发生业务关系时产生的个人信息等)等。
第一金融信息指的是目标用户的金融信息,第二金融信息指的是该目标用户的关联用户的金融信息,其中第一金融信息与第二金融信息中所包含的指标相同。例如当第一金融信息中包括目标用户的个人身份信息、个人财产信息时,第二金融信息中同样包括目标用户对应的关联用户的个人身份信息、个人财产信息。具体地,每个关联用户对应一个第二金融信息。
在对目标用户的信用等级进行评定时,关联用户的个数根据信用风险评级模型在训练时使用的关联样本的个数决定,例如,对信用风险评级模型进行训练时,始终使用一个训练样本以及4个关联样本,那么当信用风险评级模型训练完成后,在实际使用中,需要使用1个目标用户以及4个关联用户的金融信息对目标用户进行信用等级评定。这里补充说明的是,关联用户的个数不限于此,可以根据实际需要进行设置。
S102:根据第一金融信息的,确定第一金融信息向量;以及针对每个关联用户,根据第二金融信息,确定第二金融信息向量。
根据第一金融信息中每项信息所属的类型,对第一金融信息中的每项信息分别进行预处理,得到用于表示第一金融信息的第一金融信息向量。其中,第一金融信息向量中包含该目标用户对应的第一金融信息中的所有信息,具体地,该目标用户对应一个第一金融信息向量。
针对每个关联用户,根据该关联用户的第二金融信息中每项信息所属的类型,对第二金融信息中的每项信息分别进行预处理,得到用于表示该关联用户对应的第二金融信息的第二金融信息向量。其中,第二金融信息向量中包含该关联用户对应的第二金融信息中的所有信息,具体地,每个关联用户对应一个第二金融信息向量。
S103:将第一金融信息向量和每个第二金融信息向量按照预设顺序输入到训练完成后的目标信用风险评级模型中,得到目标信用风险评级模型输出的目标用户对应的第一信用等级向量;其中,目标信用风险评级模型包括嵌入层、编码部分和全连接层,在目标信用风险评级模型中,将第一金融信息向量和每个第二金融信息向量按照预设顺序输入到嵌入层中,提取第一金融信息向量的关键特征得到目标用户对应的第一特征向量,以及提取每个第二金融信息向量的关键特征得到每个关联用户对应的第二特征向量;将嵌入层输出的第一特征向量和每个第二特征向量按照预设顺序输入到编码部分,输出用于表示每个关联用户的第二金融信息以及目标用户的第一金融信息对目标用户的信用等级评定造成的影响结果的第一编码向量;将第一编码向量输入到全连接层,输出目标用户对应的第一信用等级向量。
在本申请的实施例中,目标信用风险评级模型(user Risk Rating Network,RRNet)指的是训练完成后的用于评估目标用户信用等级的模型。在对目标用户的信用等级进行评估时,将目标用户的第一金融信息向量以及每个关联用户对应的第二金融信息向量按照预设顺序输入到目标信用风险评级模型中,其中预设顺序是信用风险评级模型在训练时确定的,预设顺序指的是训练样本(目标用户)与关联样本(关联用户)对应的向量的排列顺序,具体地排列顺序可以根据关联用户与目标用户的亲近关系决定,例如信用风险评级模型在每一轮训练中,使用1个训练样本x0与4个关联样本x1、x2、x3、x4,其中关联样本x1与训练样本的亲近关系最强,从x1到x4亲近关系依次减弱,按照x0、x1、x2、x3、x4的顺序将每个用户对应的金融向量输入到信用风险评级模型中对其进行训练,那么在使用目标信用风险评级模型时,仍然保持固定的顺序(关联用户与目标用户之间的亲近关系依次减弱的排列顺序)将第一金融信息向量与各个第二金融信息向量输入到目标信用风险评级模型中。目标信用风险评级模型输出目标用户对应的用于表示目标用户信用等级的第一信用等级向量。
如图2示出了本申请实施例所提供的目标信用风险评级模型的结构示意图,如图2所示,目标信用风险评级模型包括嵌入层(Embedding)、编码部分(Encoder)和全连接层,在目标信用风险评级模型中,将第一金融信息向量和每个第二金融信息向量按照预设顺序输入到嵌入层中,嵌入层输出第一金融信息向量(目标用户)对应的第一特征向量,以及每个第二金融信息向量(每个关联用户)对应的第二特征向量。其中,目标用户对应一个第一特征向量,每个关联用户对应一个第二特征向量。在嵌入层中,提取第一金融信息向量中的关键特征得到第一特征向量,提取每个第二金融信息向量中的关键特征得到每个关联用户对应的第二特征向量。
在本申请的实施例中,第一金融信息向量中包含了第一金融信息中的所有信息,也就是说第一金融信息向量中既包含了对用户信用等级评定影响较大的信息,也包含了一些对用户信用等级评定影响较小的信息,这使得第一金融信息向量中所包含的信息数据维度较高、信息内容较稀疏。因此通过嵌入层,提取出了第一金融信息向量中能够反映目标用户的财务(贷款偿还能力)的信息,同理提取出了每个第二金融信息向量中能够反映各个关联用户的财务的信息。
由于第一金融信息向量与第二金融信息向量中包含的指标相同,因此第一金融信息向量与第二金融信息向量的行列数相同。具体地,在嵌入层中通过提取第一金融信息向量与第二金融信息向量中的关键信息(能够反映用户的贷款偿还能力的信息),对第一金融信息向量与第二金融信息向量进行降维,将每个向量拉入到目标信用风险评级模型的维度以便目标信用风险评级模型进行后续的计算。
可选的,将高维度的1个第一金融信息向量(y0表示第一金融信息向量)与4个第二金融信息向量(y1、y2、y3、y4表示4个第二金融信息向量)输入到嵌入层中,输出1个目标用户对应的1个1×64的第一特征向量(f0表示第一特征向量),以及4个关联用户对应的4个1×64的第二特征向量(f1、f 2、f 3、f 4表示4个第二特征向量)。其中第一特征向量与第二特征向量的行列数相同。
在编码部分,将嵌入层输出的第一特征向量(f0)和每个第二特征向量(f1、f 2、f 3、f 4)按照f0、f1、f 2、f 3、f 4这样的预设顺序输入到编码部分,编码部分输出用于表示每个关联用户的第二金融信息以及目标用户的第一金融信息对目标用户的信用等级评定造成的影响结果的第一编码向量,可选的第一编码向量的行列数与第一特征向量和第二特征向量的行列数相同。其中,在编码部分中,根据目标用户自己的第一金融信息以及各个关联用户的第二金融信息,对目标用户的信用等级评定所产生的影响,确定目标用户的编码向量,也就是说目标用户在信用等级评定时,不仅要考虑到自身的金融信息的影响也要考虑到其他关联用户的金融信息对自己的影响。
在本申请的实施例中,通过这个步骤,可以避免目标用户使用与其相关联的用户的财务(金融)信息进行贷款。具体地,当用户A的信用等级较低但用户A还想要进行贷款时,可能会使用与用户A相关联的用户B的金融信息进行贷款,当用户B使用自己的金融信息替代用户A进行贷款时,由于用户B的关联用户中包括用户A,因此,当对用户B的信用等级进行评定时,由于用户A的信用等级较低,使得用户B的信用等级受到用户A的信用等级的影响,避免了用户B贷款成功后将贷款金额给到用户A使用(用户A的信用等级较低,偿还能力有限),从而降低商业银行或金融机构向外贷款的风险,保证了商业银行或金融机构的业务安全以及收益率。
进一步地,由于本申请实施例中,使用关联用户的金融信息对目标用户的信用等级进行评定时,由于是根据预设顺序将目标用户的信息以及各个关联用户的信息输入到目标信用风险评级模型中,其中预设顺序是目标信用风险评级模型在训练时确定的,并且预设顺序是根据各个关联用户与目标用户的亲近关系确定的,因此这使得与目标用户越亲近的关联用户的金融信息对目标用户的信用等级评定时产生的影响越大,可选的,预设顺序中越靠前的关联用户对目标用户的信用等级评定时产生的影响越大。
在全连接层中,将编码部分输出的第一编码向量输入到全连接层中,全连接层输出目标用户对应的第一信用等级向量,其中第一信用等级向量可以表示目标用户的信用等级,并且第一信用等级向量的行列数受到用户信用等级的级别个数决定。在一个具体的实施例中,将用户信用等级分为9个级别,将目标用户对应的1个1×64的第一编码向量输入到全连接层,输出该目标用户对应的1个1×9的第一信用等级向量,其中第一信用等级向量中每一列上的数值分别表示该目标用户在每一列所对应的用户信用等级上的可能性的大小,数值越大表示目标用户在相应的列所对应的用户信用等级上的可能性越大。例如,第一信用等级向量为(1,3,9,4,3,2,6,7,3),由此可知该目标用户在第三等级上的可能性最大。
S104:根据第一信用等级向量,确定目标用户的第一信用等级。
在本申请的实施例中,将第一信用等级向量输入到softmax(归一化指数函数)中,得到该目标用户在每个用户信用等级上的概率,根据概率最大值所对应的用户信用等级,进而确定目标用户的第一信用等级。
在一种可能的实施方式中,在执行步骤S101获取至少一个关联用户的第二金融信息之前,具体还可以按照以下步骤执行:
S1001:针对每个关联用户,向该关联用户发送获取该关联用户的第二金融信息的请求。
在本申请的实施例中,在获取关联用户的第二金融信息之前,需要向每个关联用户分别发送一个获取该关联用户的第二金融信息的请求。
S1002:针对每个关联用户,接收该关联用户的回应信息;回应信息中包括该关联用户的第二金融信息,以及该关联用户同意目标用户使用该关联用户的第二金融信息进行信用等级评定的证明材料。
当接收到关联用户的回应信息以后,根据关联用户的第二金融信息对目标用户的信用等级进行评级。其中针对每个关联用户,回应信息中包括该关联用户的第二金融信息,以及该关联用户同意目标用户使用该关联用户的第二金融信息进行信用等级评定的证明材料。
在本申请的实施例中,由于本申请中需要获取到目标用户对应的关联用户的第二金融信息,因此需要向每个关联用户发送获取该关联用户的第二金融信息的请求,并接收该关联用户返回的包含第二金融信息以及同意目标用户使用该关联用户的第二金融信息进行信用等级评定的证明材料的回应信息。通过本申请中的方法,不仅可以使得目标用户准确获取到其关联用户的第二金融信息,还可以根据关联用户返回的证明材料确定该关联用户是否是自愿同意目标用户使用该关联用户的第二金融信息进行信用等级评定,避免目标用户私自获取关联用户的第二金融信息。
在一种可能的实施方式中,关联用户包括第一关联用户和第二关联用户,其中第一关联用户包括目标用户的配偶、父母、直系成年兄弟姐妹和成年子女中的至少一个,第二关联用户包括目标用户的商业合作伙伴、担保人中的至少一个;在执行步骤S101获取至少一个关联用户的第二金融信息时,具体可以按照以下步骤执行:
S1011:根据目标信用风险评级模型在训练时使用的训练样本中的第一关联样本的个数与第二关联样本的个数,确定目标信用风险评级模型在使用时关联用户中第一关联用户的个数以及第二关联用户的个数。
在本申请的实施例中,关联用户是银行或其他金融机构选定的,并不是目标用户自己选定的,避免目标用户只选择信用等级较好的关联用户。
具体地,关联用户包括第一关联用户和第二关联用户,其中第一关联用户按照优先级顺序包括目标用户的配偶、父母、直系成年兄弟姐妹和成年子女中的至少一个,第二关联用户包括目标用户的商业合作伙伴、担保人中的至少一个。在确定目标用户的关联用户时,根据目标信用风险评级模型在训练时使用的训练样本中的第一关联样本的个数与第二关联样本的个数确定,例如目标信用风险评级模型在训练时使用了3个第一关联样本,1个第二关联样本,那么使用该目标信用风险评级模型对目标用户进行信用等级评定时,需要从第一关联用户中按照优先级顺序(与目标用户的亲近关系)选择3个第一关联用户,从第二关联用户中选择1个第二关联用户。其中从第一关联用户中按照优先级顺序(与目标用户的亲近关系)选择第一关联用户时具体是,当目标用户有配偶时,将配偶作为其中一个第一关联用户,当目标用户没有配偶时,将目标用户的父母作为其中一个第一关联用户,按照优先级顺序,直至选择出3个第一关联用户。
S1012:根据关联用户中第一关联用户的个数以及第二关联用户的个数,获取至少一个关联用户的第二金融信息。
根据关联用户中第一关联用户的个数以及第二关联用户的个数,确定出目标用户的第一关联用户与第二关联用户,从而获取每个第一关联用户的第二金融信息以及每个第二关联用户的第二金融信息。
在本申请的实施例中,由于每个关联用户与目标用户之间的关联关系的亲近程度不同,而亲近程度的不同会导致关联用户对目标用户信用等级评定的影响程度的大小不同。因此本申请中,通过目标信用风险评级模型在训练时所使用的训练样本中的第一关联样本的个数与第二关联样本的个数,来确定目标信用风险评级模型在使用时第一关联用户与第二关联用户的个数,使得目标信用风险评级模型输出信用等级向量更能准确的表示出目标用户的信用等级。
在一种可能的实施方式中,第一金融信息和第二金融该信息的类型均包括数值型信息和/或非数值型信息;在执行步骤S102根据第一金融信息,确定第一金融信息向量;以及针对每个关联用户,根据第二金融信息,确定第二金融信息向量时,具体可以按照以下步骤执行:
S1021:当第一金融信息为非数值型信息时,对第一金融信息中的非数值型信息进行独热编码,得到用于表示第一金融信息中的非数值型信息的第一子金融信息向量。
在本申请的实施例中,第一金融信息包括数值型信息和非数值型信息中的至少一种。其中,数值型信息指的是可以用具体的数字表示的信息,例如目标用户的工资、银行卡余额等;非数值型信息指的是不能用具体的数字表示的,需要通过选项的形式展示的信息,例如,目标用户的职业、婚姻状况等。
当第一金融信息为非数值型信息时,在一个具体的例子中,当非数值型信息为目标用户的婚姻状况时,将婚姻状况信息用选项的形式展示给用户供用户选择,例如,a.未婚;b.已婚;c.丧偶;d.离婚。当该目标用户选择a(未婚)时,通过对该非数值型信息(婚姻状况)进行独热编码,根据该非数值型信息(婚姻状况)的类别总数(4个选项)以及用户的选择(例如选择a选项),可以将该非数值型信息(婚姻状况)编码为1000。其中1000为第一子金融信息向量中的一个元素,将该目标用户对应的所有非数值型信息编码成的元素组合成一个该目标用户对应的第一子金融信息向量。
在本申请的实施例中,当第一金融信息中只包含非数值型信息时,直接将第一子金融信息向量作为用于表示第一金融信息的第一金融信息向量。
S1022:当第一金融信息为数值型信息时,根据第一金融信息中的数值型信息,确定用于表示第一金融信息中的数值型信息的第二子金融信息向量。
当第一金融信息为数值型信息时,可以直接将该数值型信息转换成向量的形式,在一个具体的例子中,当数值型信息为目标用户的工资时,并且该目标用户的工资为6000元时,可以将该数值型信息(工资)转换为6000,其中6000为第二子金融信息向量中的一个元素。将该目标用户对应的所有数值型信息转换成的元素组合成一个该目标用户对应的第二子金融信息向量。
在本申请的实施例中,当第一金融信息中只包含数值型信息时,直接将第二子金融信息向量作为用于表示第一金融信息的第一金融信息向量。
S1023:将第一子金融信息向量和第二子金融信息向量进行组合,得到用于表示第一金融信息的第一金融信息向量。
在本申请的实施例中,当第一金融信息中同时包含数值型信息和非数值型信息时,将用于表示该目标用户的非数值型信息的第一子金融信息向量和用于表示该目标用户的数值型信息的第二子金融信息向量进行组合/拼接(将多个向量组合成一个向量),得到用于表示该目标用户的第一金融信息的第一金融信息向量。
S1024:当第二金融信息为非数值型信息时,对第二金融信息中的非数值型信息进行独热编码,得到用于表示第二金融信息中的非数值型信息的第三子金融信息向量。
当第二金融信息为非数值型信息时,在一个具体的例子中,当非数值型信息为关联用户的婚姻状况时,同步骤S1021中的方法,将婚姻状况信息用选项的形式展示给用户供用户选择,例如,a.未婚;b.已婚;c.丧偶;d.离婚。当该关联用户选择d(例如选择选项d离婚)时,通过对该非数值型信息(婚姻状况)进行独热编码,根据该非数值型信息(婚姻状况)的类别总数(4个选项)以及用户的选择(选择选项d),可以将该非数值型信息(婚姻状况)编码为0001。其中0001为第二子金融信息向量中的一个元素,将该关联用户对应的所有非数值型信息编码成的元素组合成一个该关联用户对应的第三子金融信息向量。
在本申请的实施例中,当第二金融信息中只包含非数值型信息时,直接将第三子金融信息向量作为用于表示第二金融信息的第二金融信息向量。
S1025:当第二金融信息为数值型信息时,根据第二金融信息中的数值型信息,确定用于表示第二金融信息中的数值型信息的第四子金融信息向量。
当第二金融信息为数值型信息时,可以直接将该数值型信息转换成向量的形式,在一个具体的例子中,当数值型信息为关联用户的工资时,并且该关联用户的工资为3500元时,可以将该数值型信息(工资)转换为3500,其中3500为第四子金融信息向量中的一个元素。将该关联用户对应的所有数值型信息转换成的元素组合成一个该关联用户对应的第四子金融信息向量。
在本申请的实施例中,当第二金融信息中只包含数值型信息时,直接将第四子金融信息向量作为用于表示第二金融信息的第二金融信息向量。
S1026:针对每个关联用户,将该关联用户的第三子金融信息向量和第四子金融信息向量进行组合,得到用于表示该关联用户对应的第二金融信息的第二金融信息向量。
在本申请的实施例中,当第二金融信息中同时包含数值型信息和非数值型信息时,针对每个关联用户,将用于表示该关联用户的非数值型信息的第三子金融信息向量和用于表示该关联用户的数值型信息的第四子金融信息向量进行组合/拼接,得到用于表示该关联用户的第二金融信息的第二金融信息向量。
在本申请的实施例中,由于第一金融信息中所包含的信息类型不同,本申请中针对不同类型的信息进行不同的处理,使得得到的第一金融信息向量能够准确表示出目标用户的第一金融信息中的全部信息。同理由于第二金融信息中所包含的信息类型不同,本申请中针对不同类型的信息进行不同的处理,使得得到的第二金融信息向量能够准确表示出关联用户的第二金融信息中的全部信息。
在一种可能的实施方式中,编码部分包括至少一个结构相同参数不同的编码器,每个编码器的输出为下一个编码器的输入;其中每个编码器均包括注意力层、第一残差单元、第一层标准化、前馈网络、第二残差单元以及第二层标准化;在步骤S103将嵌入层输出的第一特征向量和每个第二特征向量按照预设顺序输入到编码部分,输出用于表示每个关联用户的第二金融信息以及目标用户的第一金融信息对目标用户的信用等级评定造成的影响结果的第一编码向量时,具体可以按照步骤S1031到S1037执行:
S1031:将嵌入层输出的第一特征向量和每个第二特征向量按照预设顺序输入到第一个编码器的注意力层,输出目标用户对应的第一关联向量,以及每个关联用户对应的第二关联向量;其中,在注意力层,分别对第一特征向量和每个第二特征向量进行线性变换,得到目标用户对应的第一查询向量、第一关键向量和第一信息向量,以及得到每个关联用户分别对应的第二查询向量、第二关键向量和第二信息向量;根据第一查询向量、第一关键向量和第一信息向量,以及每个关联用户对应的第二查询向量、第二关键向量和第二信息向量,计算得到目标用户对应的第一关联向量以及每个关联用户对应的第二关联向量。
如图3示出了本申请实施例所提供的编码部分的结构示意图,如图3所示,编码部分包括至少一个结构相同但参数不同的编码器,每个编码器的输出为下一个编码器的输入。可选的,编码部分可以包括三个串联连接的编码器。其中每个编码器均包括注意力层、第一残差单元、第一层标准化、前馈网络、第二残差单元以及第二层标准化。
在一个具体的实施例中,如图3所示,当关联用户有4个时,将嵌入层输出的目标用户的第一特征向量(f0)和4个关联用户的第二特征向量(f1、f 2、f 3、f 4)按照预设顺序(f0、f1、f 2、f 3、f 4)输入到第一个编码器的注意力层,第一个编码器的注意力层输出目标用户对应的第一关联向量。具体地,在第一个编码器的注意力层,对第一特征向量(f0)进行三次不同的线性变换,得到目标用户对应的第一查询向量(q0)、第一关键向量(k0)和第一信息向量(v0);以及分别对4个第二特征向量进行三次不同的线性变换,得到4个关联用户分别对应的第二查询向量(q1,q2,q3,q4)、第二关键向量(k1,k2,k3,k4)和第二信息向量(v1,v2,v3,v4)。其中,q是query的缩写,k是key的缩写,v是value的缩写,右下角的角标0-4用于区分每个用户(包括目标用户和各个关联用户)对应的query、key和value。
将第一查询向量(q0)、第一关键向量(k0)和第一信息向量(v0),以及4个第二查询向量(q1,q2,q3,q4)、第二关键向量(k1,k2,k3,k4)和第二信息向量(v1,v2,v3,v4)输入到下述5个公式中,分别得到目标用户对应的第一关联向量(z0),以及4个关联用户对应的4个第二关联向量(z1,z2,z3,z4)。其中,第一特征向量、第二特征向量、第一查询向量、第一关键向量、第一信息向量、每个第二查询向量、每个第二关键向量和每个第二信息向量的行列数相同。
Figure M_210528110446452_452103001
Figure M_210528110446655_655228001
Figure M_210528110446702_702103001
Figure M_210528110446748_748978001
Figure M_210528110446795_795853001
其中•表示向量点乘,dk为k(key)的维度,在一个具体的实施例中,嵌入层输出的第一特征向量和第二特征向量(f0、f1、f 2、f 3、f 4)均为1×64的行向量,通过线性变换得到的第一查询向量(q0)、第一关键向量(k0)和第一信息向量(v0),以及第二查询向量(q1,q2,q3,q4)、第二关键向量(k1,k2,k3,k4)和第二信息向量(v1,v2,v3,v4)也均为1×64的行向量,因此当关键向量k(包括例如第一关键向量至第四关键向量)为1×64的行向量时,dk=64,即
Figure M_210528110446827_827103001
。当维度越大时,点积结果越大,导致softmax的梯度很小,因此通过将点积结果除以
Figure M_210528110446858_858353002
获得,减轻因为维度大对梯度产生的影响。
在本申请的实施例中,计算目标用户的第一关联向量时,基于上述公式1,其中,使用目标用户的第一查询向量(q0)乘以第一关键向量(k0),将得到的数值作为目标用户的金融信息对目标用户进行信用等级评定时的影响的权重大小,再将该权重乘以第一信息向量(v0)得到目标用户的金融信息对目标用户自身产生的影响结果;同理使用目标用户的第一查询向量(q0)分别乘以各个关联用户的第二关键向量(q1,q2,q3,q4),将得到的各个数值作为各个关联用户对应的权重,具体地该权重表示关联用户的第二金融信息对目标用户进行信用等级评定时的影响的权重大小,将该权重乘以各个关联用户对应的第二信息向量(v1,v2,v3,v4)得到各个关联用户的第二金融信息对目标用户产生的影响结果。通过对目标用户的第一金融信息对目标用户自身产生的影响结果以及各个关联用户的第二金融信息对目标用户产生的影响结果求和得到第一关联向量。
在本申请的实施例中,计算关联用户的第二关联向量时,基于上述公式2-公式5,使用每个关联用户的第二查询向量分别乘以目标用户的第一关键向量(k0),将得到的数值作为目标用户的第一金融信息对关联用户进行信用等级评定时的影响的权重大小,再将该权重乘以第一信息向量(v0)得到目标用户的第一金融信息对关联用户产生的影响结果;使用关联用户的第二查询向量乘以关联用户自身的第二关键向量,将得到的数值作为该关联用户的第二金融信息对该关联用户自身进行信用等级评定时的影响的权重大小,再将该权重乘以该关联用户的第二信息向量得到关联用户的金融信息对关联用户自身产生的影响结果。通过对关联用户的第二金融信息对关联用户自身产生的影响结果以及目标用户的第一金融信息对关联用户产生的影响结果求和得到各个关联用户的第二关联向量。
S1032:将第一关联向量和每个第二关联向量按照预设顺序输入到第一个编码器的第一残差单元,输出目标用户对应的第一融合向量以及每个关联用户对应的第二融合向量;在第一残差单元中,将第一特征向量和第一关联向量相加,得到目标用户对应的第一融合向量;以及针对每个关联用户,将该关联用户对应的第二特征向量和第二关联向量相加,得到该关联用户对应的第二融合向量。
在一个具体的实施例中,如图3所示,将第一关联向量(z0)和每个第二关联向量(z1,z2,z3,z4)按照z0,z1,z2,z3,z4这样的预设顺序输入到第一个编码器的第一残差单元中,第一个编码器的第一残差单元输出目标用户对应的第一融合向量以及每个关联用户对应的第二融合向量。具体地,在第一个编码器的第一残差单元中,为了避免梯度消失问题,本申请通过第一残差单元将注意力层的输入直接与输出进行矩阵的加法运算,即将第一特征向量和第一关联向量相加,得到目标用户对应的第一融合向量(例如s0);以及针对每个关联用户,将该关联用户对应的第二特征向量和第二关联向量相加,得到该关联用户对应的第二融合向量(例如s1,s2,s3,s4)。
S1033:将第一融合向量和每个第二融合向量按照预设顺序输入到第一个编码器的第一层标准化,对第一融合向量和每个第二融合向量分别进行标准化处理,得到目标用户对应的第一标准化向量以及每个关联用户对应的第二标准化向量。
在一个具体的实施例中,如图3所示,将第一融合向量(s0)和每个第二融合向量(s1,s2,s3,s4)按照预设顺序(s0,s1,s2,s3,s4)输入到第一个编码器的第一层标准化中,第一个编码器的第一层标准化输出目标用户对应的第一标准化向量以及每个关联用户对应的第二标准化向量。在第一个编码器的第一层标准化中,为了加速模型的收敛速度使用层标准化,层标准化不同于批标准化,将每次输入到该层的5个1×64向量(s0,s1,s2,s3,s4)视为一个样本,层标准化即对单个样本输入到该层的数据计算均值和方差进行标准化处理。
S1034:将第一标准化向量和每个第二标准化向量按照预设顺序输入到第一个编码器的前馈网络,分别对第一标准化向量和每个第二标准化向量进行线性变换,得到目标用户对应的第三特征向量以及每个关联用户对应的第四特征向量。
在一个具体的实施例中,将第一标准化向量和每个第二标准化向量按照预设顺序输入到第一个编码器的前馈网络,第一个编码器的前馈网络输出目标用户对应的第三特征向量以及每个关联用户对应的第四特征向量。在第一个编码器的前馈网络中,前馈网络为全连接,分别对第一标准化向量和每个第二标准化向量进行线性变换。
S1035:将第三特征向量和每个第四特征向量按照预设顺序输入到第一个编码器的第二残差单元,输出目标用户对应的第三融合向量以及每个关联用户对应的第四融合向量;在第二残差单元中,将第一标准化向量和第三特征向量相加,得到目标用户对应的第三融合向量;针对每个关联用户,将该关联用户对应的第二标准化向量和第四特征向量相加,得到该关联用户对应的第四融合向量。
在一个具体的实施例中,将第三特征向量和每个第四特征向量按照预设顺序输入到第一个编码器的第二残差单元,第一个编码器的第二残差单元输出目标用户对应的第三融合向量以及每个关联用户对应的第四融合向量。在第二残差单元中,通过第二残差单元将前馈网络的输入直接与输出进行矩阵的加法运算,即将第一标准化向量和第三特征向量相加,得到目标用户对应的第三融合向量;针对每个关联用户,将该关联用户对应的第二标准化向量和第四特征向量相加,得到该关联用户对应的第四融合向量。
S1036:将第三融合向量以及每个第四融合向量按照预设顺序输入到第一个编码器的第二层标准化中,对第三融合向量以及每个第四融合向量进行标准化处理,得到目标用户对应的第三标准化向量以及每个关联用户对应的第四标准化向量。
在一个具体的实施例中,将第三融合向量以及每个第四融合向量按照预设顺序输入到第一个编码器的第二层标准化中,第一个编码器的第二层标准化输出目标用户对应的第三标准化向量以及每个关联用户对应的第四标准化向量。在第一个编码器的第二层标准化中,将每次输入到该层的向量(第三融合向量以及每个第四融合向量)视为一个样本,层标准化即对单个样本输入到该层的数据计算均值和方差进行标准化处理。
S1037:将第三标准化向量以及每个第四标准化向量按照预设顺序输入到下一个编码器中,进行与在第一个编码器中相同的处理,直至最后一个编码器的第二层标准化中输出目标用户对应的第三标准化向量,将最后一个编码器输出的第三标准化向量作为目标用户的第一编码向量。
在一个具体的实施例中,将第三标准化向量以及每个第四标准化向量按照预设顺序输入到下一个编码器中,即将第一个编码器的第二层标准化中输出的第三标准化向量以及每个第四标准化向量按照预设顺序输入到第二个编码器的注意力层,进行与在第一个编码器中相同的处理,直至最后一个编码器的第二层标准化中输出目标用户对应的第三标准化向量,将最后一个编码器输出的第三标准化向量作为目标用户的第一编码向量。
在本申请的实施例中,通过在每个编码器的注意力层提取出的用于表示目标用户的第一金融信息对目标用户自身产生的影响结果以及各个关联用户的第二金融信息对目标用户产生的影响结果的第一关联向量,从而确定出了目标用户的社会属性对目标用户的信用等级评定造成的影响;通过在每个编码器的残差单元中的运算避免了梯度消失问题;通过在每个编码器的层标准化中的运算加速了模型的收敛速度;本申请中通过使用目标用户的社会属性(关联用户的第二金融信息)对目标用户的信用等级进行评定,并且通过多次执行上述过程(在多个编码器中均执行上述过程),使得提取出的用于表示目标用户的第一金融信息对目标用户自身产生的影响结果以及各个关联用户的第二金融信息对目标用户产生的影响结果的第一关联向量更准确,进而提高了目标用户信用等级评定的准确率。
在一种可能的实施方式中,在步骤S101获取目标用户和至少一个关联用户的第一金融信息之前,具体还可以按照步骤S10101到S10108执行:
S10101:获取训练样本的第三金融信息和至少一个关联样本的第四金融信息,以及训练样本的第一等级标签和每个关联样本对应的第二等级标签。
在对信用风险评级模型进行训练时,首先要获取到训练样本的第三金融信息和至少一个关联样本的第四金融信息,以及训练样本的第一等级标签和每个关联样本对应的第二等级标签。其中第三金融信息指的是训练样本的金融信息,第四金融信息指的是该训练样本的关联样本的金融信息,其中第三金融信息与第四金融信息中所包含的指标相同,进一步地,第一金融信息、第二金融信息、第三金融信息与第四金融信息中所包含的指标相同。即对信用风险评级模型进行训练时使用的金融信息的指标与该信用风险评级模型在实际使用时所使用的金融信息的指标相同。其中,每个关联样本对应一个第四金融信息。
第一信用等级标签指的是对训练样本的信用等级进行标注的信息,每个训练样本对应一个第一信用等级标签,第二信用等级标签指的是对关联样本的信用等级进行标注的信息,每个关联样本对应一个第二信用等级标签。
S10102:根据第三金融信息的类型,对第三金融信息进行预处理,得到用于表示第三金融信息的第三金融信息向量;以及针对每个关联样本,根据第四金融信息的类型,对第四金融信息进行预处理,得到用于表示该关联用户对应的第四金融信息的第四金融信息向量。
在本申请的实施例中,第三金融信息和第四金融信息中包括的类型与第一金融信息和第二金融信息中包括的类型相同,其中对第三金融信息进行预处理的方法与对第一金融信息进行预处理的方法相同,并且对第四金融信息进行预处理的方法与对第二金融信息进行预处理的方法相同,具体参见前述内容。通过对训练样本的第三金融信息和每个关联样本的第四金融信息进行预处理,得到训练样本对应的用于表示第三金融信息的第三金融信息向量,以及得到用于表示每个关联用户对应的第四金融信息的第四金融信息向量。
S10103:将第三金融信息向量和每个关联样本各自对应的第四金融信息向量按照预设顺序输入到待训练的信用风险评级模型中,得到信用风险评级模型输出的训练样本对应的第二信用等级向量以及每个关联样本对应的第三信用等级向量;其中,信用风险评级模型包括嵌入层、编码部分和全连接层,在信用风险评级模型中,将第三金融信息向量和每个第四金融信息向量按照预设顺序输入到嵌入层中,提取第三金融信息向量的关键特征得到训练样本对应的第五特征向量,以及提取每个第四金融信息向量的关键特征得到每个关联样本对应的第六特征向量;将嵌入层输出的第五特征向量和每个第六特征向量按照预设顺序输入到编码部分,输出用于表示每个关联样本的第四金融信息以及训练样本的第三金融信息对训练样本的信用等级评定造成的影响结果的第二编码向量,以及针对每个关联样本,输出用于表示训练样本的第三金融信息和该关联样本的第四金融信息对该关联样本的信用等级评定造成的影响结果的第三编码向量;将第二编码向量和每个关联样本对应的第三编码向量按照预设顺序输入到全连接层,输出训练样本对应的第二信用等级向量以及每个关联样本对应的第三信用等级向量。
在本申请的实施例中,信用风险评级模型指的是待训练的用于评估目标用户信用等级的模型。在对信用风险等级模型进行训练时,将第三金融信息向量和每个关联样本各自对应的第四金融信息向量按照预设顺序输入到待训练的信用风险评级模型中,得到信用风险评级模型输出的训练样本对应的第二信用等级向量以及每个关联样本对应的第三信用等级向量。
具体地,信用风险评级模型包括嵌入层、编码部分和全连接层,在信用风险评级模型中,将第三金融信息向量和每个第四金融信息向量按照预设顺序输入到嵌入层中,嵌入层输出第三金融信息向量(训练样本)对应的第五特征向量和每个第四金融信息向量(每个关联用户)对应的第六特征向量。其中每个关联样本对应一个第六特征向量。在嵌入层中,提取第三金融信息向量的关键特征得到训练样本对应的第五特征向量,以及提取每个第四金融信息向量的关键特征得到每个关联样本对应的第六特征向量。
在编码部分,将嵌入层输出的第五特征向量和每个第六特征向量按照预设顺序输入到编码部分,编码部分输出用于表示每个关联样本的第四金融信息以及训练样本的第三金融信息对训练样本的信用等级评定造成的影响结果的第二编码向量,以及针对每个关联样本,输出用于表示训练样本的第三金融信息和该关联样本的第四金融信息对该关联样本的信用等级评定造成的影响结果的第三编码向量。
具体地,编码部分包括至少一个结构相同但参数不同的编码器,每个编码器的输出为下一个编码器的输入。可选的,编码部分可以包括三个串联连接的编码器。每个编码器均包括注意力层、第一残差单元、第一层标准化、前馈网络、第二残差单元以及第二层标准化。其中,信用风险评级模型在训练时编码部分的编码器的个数与该信用风险评级模型训练完成后,进行实际使用时,编码器的个数相同,即信用风险评级模型中编码器的个数与目标信用风险评级模型中编码器的个数相同。信用风险评级模型在训练时,编码部分每一层的处理过程与目标信用风险评级模型中的编码部分中每一层的处理过程相同,具体参见上述内容。
在全连接层中,将第二编码向量和每个关联样本对应的第三编码向量按照预设顺序输入到全连接层中,全连接层输出训练样本对应的第二信用等级向量以及每个关联样本对应的第三信用等级向量,其中第二信用等级向量可以表示信用风险评级模型预测出的训练样本的信用等级,第三信用等级向量可以表示信用风险评级模型预测出的关联样本的信用等级,并且第二信用等级向量和第三信用等级向量的行列数受到用户信用等级的级别个数决定。具体地,信用风险评级模型在训练时设置的用户信用等级的级别个数与该信用风险评级模型训练完成后,实际使用时用户信用等级的级别个数相同。其中第二信用等级向量中每一列上的数值分别表示信用风险评级模型预测出的该训练用户在每一列所对应的用户信用等级上的可能性的大小,第三信用等级向量中每一列上的数值分别表示信用风险评级模型预测出的该关联用户在每一列所对应的用户信用等级上的可能性的大小。
S10104:根据第二信用等级向量、每个第三信用等级向量以及第一等级标签和每个第二等级标签,计算得到第二信用等级向量和第三信用等级向量与第一等级标签和第二等级标签之间的第一损失数值。
在本申请的实施例中,将第二信用等级向量和第三信用等级向量输入到softmax(归一化指数函数)中,得到训练样本以及关联样本在每个用户信用等级上的概率。
在一个具体的实施例中,将训练样本和关联样本在每个用户信用等级上的概率以及训练样本的第一等级标签和关联样本的第二等级标签输入到下面的公式中,计算得到第二信用等级向量和第三信用等级向量与第一等级标签和第二等级标签之间的第一损失数值(lossce)。
Figure M_210528110446889_889603001
其中,M为每次进行用户信用等级评级的用户个数(包括训练样本与关联样本的总个数),K为用户信用等级的级别个数,yi,k为第i个用户属于第k个用户信用等级的标签,若该用户的标签显示为第一级别时,即yi,k=1,其余的用户信用等级的标签为0;pi,k为信用风险评级模型输出的第i个用户属于第k个用户信用等级的概率。
S10105:根据第二编码向量以及每个第三编码向量之间的相关系数,计算得到第二损失数值。
在本申请的实施例中,计算训练样本的第二编码向量以及各个关联样本的第三编码向量之间的相关系数(第二编码向量与每个第三编码向量的相关系数,以及第三编码向量之间的相关系数),得到相关系数矩阵,其中相关系数矩阵中第m行第n列表示第m个用户(包括训练样本和关联样本)的编码向量和第n个用户的编码向量之间的相关系数。例如当训练样本的个数为1个,关联样本的个数为4个时,得到一个5×5的相关系数矩阵C,将相关系数矩阵C的上三角元素求和得到第二损失数值。
Figure M_210528110446952_952103001
S10106:根据第一损失数值和第二损失数值,以及预先设定的权重,确定损失数值。
在本申请的实施例中,根据第一损失数值lossce和第二损失数值lossy,以及预先设定的权重w1和w2,确定损失数值,具体地根据以下公式确定损失数值:
Figure M_210528110446983_983353001
S10107:当损失数值不小于预设损失数值时,利用损失数值对信用风险评级模型进行本轮训练。
在本申请的实施例中,当损失数值不小于预设损失数值时,将损失数值反向传播给信用风险评级模型,对信用风险评级模型中的参数进行更新,具体地,对信用风险评级模型中的嵌入层中的参数、注意力层中计算q(例如包括q0,q1,q2,q3,q4)、k(例如包括k0,k1,k2,k3,k4)、v(例如包括v0,v1,v2,v3,v4)时的线性变换参数,前馈网络中的参数以及全连接层中的参数进行更新。
S10108:当损失数值小于预设损失数值时,将信用风险评级模型确定为训练完成后的目标信用风险评级模型。
在本申请的实施例中,当损失数值小于预设损失数值时,将信用风险评级模型确定为训练完成后的目标信用风险评级模型。具体地,将信用风险评级模型中的嵌入层、编码部分的各个层以及全连接层确定为目标信用风险评级模型中的嵌入层、编码部分的各个层以及全连接层。
在对信用风险评级模型进行训练时,通过使用训练样本及其关联样本的金融信息对信用风险评级模型进行训练,以使信用风险评级模型能够学会提取出训练样本及其关联样本的金融信息对训练样本的信用等级的影响信息,从而使用关联用户的金融信息来辅助目标用户的信用等级评定,进而提高目标信用风险评级模型评估目标用户的信用等级的准确率。
实施例二:
基于相同的技术构思,本申请实施例还提供一种数据处理的装置,图4示出了本申请实施例所提供的一种数据处理的装置的结构示意图,如图4所示,该装置包括:
第一获取模块401,用于获取目标用户的第一金融信息和至少一个关联用户的第二金融信息;
第一确定模块402,用于根据第一金融信息,确定第一金融信息向量;以及针对每个关联用户,根据第二金融信息,确定第二金融信息向量;
第一输入输出模块403,用于将第一金融信息向量和每个第二金融信息向量按照预设顺序输入到训练完成后的目标信用风险评级模型中,得到目标信用风险评级模型输出的目标用户对应的第一信用等级向量;其中,目标信用风险评级模型包括嵌入层、编码部分和全连接层,在目标信用风险评级模型中,将第一金融信息向量和每个第二金融信息向量按照预设顺序输入到嵌入层中,提取第一金融信息向量的关键特征得到目标用户对应的第一特征向量,以及提取每个第二金融信息向量的关键特征得到每个关联用户对应的第二特征向量;将嵌入层输出的第一特征向量和每个第二特征向量按照预设顺序输入到编码部分,输出用于表示每个关联用户的第二金融信息以及目标用户的第一金融信息对目标用户的信用等级评定造成的影响结果的第一编码向量;将第一编码向量输入到全连接层,输出目标用户对应的第一信用等级向量;
第二确定模块404,用于根据第一信用等级向量,确定目标用户的第一信用等级。
可选的,前述第一获取模块401在获取至少一个关联用户的第二金融信息之前,还包括:
发送模块,用于针对每个关联用户,向所述关联用户发送获取所述关联用户的第二金融信息的请求;
接收模块,用于针对每个关联用户,接收所述关联用户的回应信息;回应信息中包括所述关联用户的第二金融信息,以及所述关联用户同意目标用户使用所述关联用户的第二金融信息进行信用等级评定的证明材料。
可选的,关联用户包括第一关联用户和第二关联用户,其中第一关联用户包括目标用户的配偶、父母、直系成年兄弟姐妹和成年子女中的至少一个,第二关联用户包括目标用户的商业合作伙伴、担保人中的至少一个;前述第一获取模块401在获取至少一个关联用户的第二金融信息时,具体用于:
根据目标信用风险评级模型在训练时使用的训练样本中的第一关联样本的个数与第二关联样本的个数,确定目标信用风险评级模型在使用时关联用户中第一关联用户的个数以及第二关联用户的个数;
根据关联用户中第一关联用户的个数以及第二关联用户的个数,获取至少一个关联用户的第二金融信息。
可选的,第一金融信息和第二金融该信息的类型均包括数值型信息和/或非数值型信息;前述第一确定模块402在根据第一金融信息,确定第一金融信息向量;以及针对每个关联用户,根据第二金融信息,确定第二金融信息向量时,具体用于:
当第一金融信息为非数值型信息时,对第一金融信息中的非数值型信息进行独热编码,得到用于表示第一金融信息中的非数值型信息的第一子金融信息向量;
当第一金融信息为数值型信息时,根据第一金融信息中的数值型信息,确定用于表示第一金融信息中的数值型信息的第二子金融信息向量;
将第一子金融信息向量和第二子金融信息向量进行组合,得到用于表示第一金融信息的第一金融信息向量;
当第二金融信息为非数值型信息时,对第二金融信息中的非数值型信息进行独热编码,得到用于表示第二金融信息中的非数值型信息的第三子金融信息向量;
当第二金融信息为数值型信息时,根据第二金融信息中的数值型信息,确定用于表示第二金融信息中的数值型信息的第四子金融信息向量;
针对每个关联用户,将该关联用户的第三子金融信息向量和第四子金融信息向量进行组合,得到用于表示该关联用户对应的第二金融信息的第二金融信息向量。
可选的,编码部分包括至少一个结构相同参数不同的编码器,每个编码器的输出为下一个编码器的输入;其中每个编码器均包括注意力层、第一残差单元、第一层标准化、前馈网络、第二残差单元以及第二层标准化;前述第一输入输出模块403在将嵌入层输出的第一特征向量和每个第二特征向量按照预设顺序输入到编码部分,输出用于表示每个关联用户的第二金融信息以及目标用户的第一金融信息对目标用户的信用等级评定造成的影响结果的第一编码向量时,具体用于:
将嵌入层输出的第一特征向量和每个第二特征向量按照预设顺序输入到第一个编码器的注意力层,输出目标用户对应的第一关联向量,以及每个关联用户对应的第二关联向量;其中,在注意力层,分别对第一特征向量和每个第二特征向量进行线性变换,得到目标用户对应的第一查询向量、第一关键向量和第一信息向量,以及得到每个关联用户分别对应的第二查询向量、第二关键向量和第二信息向量;根据第一查询向量、第一关键向量和第一信息向量,以及每个关联用户对应的第二查询向量、第二关键向量和第二信息向量,计算得到目标用户对应的第一关联向量以及每个关联用户对应的第二关联向量;
将第一关联向量和每个第二关联向量按照预设顺序输入到第一个编码器的第一残差单元,输出目标用户对应的第一融合向量以及每个关联用户对应的第二融合向量;在第一残差单元中,将第一特征向量和第一关联向量相加,得到目标用户对应的第一融合向量;以及针对每个关联用户,将该关联用户对应的第二特征向量和第二关联向量相加,得到该关联用户对应的第二融合向量;
将第一融合向量和每个第二融合向量按照预设顺序输入到第一个编码器的第一层标准化,对第一融合向量和每个第二融合向量分别进行标准化处理,得到目标用户对应的第一标准化向量以及每个关联用户对应的第二标准化向量;
将第一标准化向量和每个第二标准化向量按照预设顺序输入到第一个编码器的前馈网络,分别对第一标准化向量和每个第二标准化向量进行线性变换,得到目标用户对应的第三特征向量以及每个关联用户对应的第四特征向量;
将第三特征向量和每个第四特征向量按照预设顺序输入到第一个编码器的第二残差单元,输出目标用户对应的第三融合向量以及每个关联用户对应的第四融合向量;在第二残差单元中,将第一标准化向量和第三特征向量相加,得到目标用户对应的第三融合向量;针对每个关联用户,将该关联用户对应的第二标准化向量和第四特征向量相加,得到该关联用户对应的第四融合向量;
将第三融合向量以及每个第四融合向量按照预设顺序输入到第一个编码器的第二层标准化中,对第三融合向量以及每个第四融合向量进行标准化处理,得到目标用户对应的第三标准化向量以及每个关联用户对应的第四标准化向量;
将第三标准化向量以及每个第四标准化向量按照预设顺序输入到下一个编码器中,进行与在第一个编码器中相同的处理,直至最后一个编码器的第二层标准化中输出目标用户对应的第三标准化向量,将最后一个编码器输出的第三标准化向量作为目标用户的第一编码向量。
可选的,前述第一获取模块401在获取目标用户和至少一个关联用户的第一金融信息之前,还包括:
第二获取模块,用于获取训练样本的第三金融信息和至少一个关联样本的第四金融信息,以及训练样本的第一等级标签和每个关联样本对应的第二等级标签;
处理模块,用于根据第三金融信息的类型,对第三金融信息进行预处理,得到用于表示第三金融信息的第三金融信息向量;以及针对每个关联样本,根据第四金融信息的类型,对第四金融信息进行预处理,得到用于表示该关联用户对应的第四金融信息的第四金融信息向量;
第二输入输出模块,用于将第三金融信息向量和每个关联样本各自对应的第四金融信息向量按照预设顺序输入到待训练的信用风险评级模型中,得到信用风险评级模型输出的训练样本对应的第二信用等级向量以及每个关联样本对应的第三信用等级向量;其中,信用风险评级模型包括嵌入层、编码部分和全连接层,在信用风险评级模型中,将第三金融信息向量和每个第四金融信息向量按照预设顺序输入到嵌入层中,提取第三金融信息向量的关键特征得到训练样本对应的第五特征向量,以及提取每个第四金融信息向量的关键特征得到每个关联样本对应的第六特征向量;将嵌入层输出的第五特征向量和每个第六特征向量按照预设顺序输入到编码部分,输出用于表示每个关联样本的第四金融信息以及训练样本的第三金融信息对训练样本的信用等级评定造成的影响结果的第二编码向量,以及针对每个关联样本,输出用于表示训练样本的第三金融信息和该关联样本的第四金融信息对该关联样本的信用等级评定造成的影响结果的第三编码向量;将第二编码向量和每个关联样本对应的第三编码向量按照预设顺序输入到全连接层,输出训练样本对应的第二信用等级向量以及每个关联样本对应的第三信用等级向量;
第一计算模块,用于根据第二信用等级向量、每个第三信用等级向量以及第一等级标签和每个第二等级标签,计算得到第二信用等级向量和第三信用等级向量与第一等级标签和第二等级标签之间的第一损失数值;
第二计算模块,用于根据第二编码向量以及每个第三编码向量之间的相关系数,计算得到第二损失数值;
第三确定模块,用于根据第一损失数值和第二损失数值,以及预先设定的权重,确定损失数值;
训练模块,用于当损失数值不小于预设损失数值时,利用损失数值对信用风险评级模型进行本轮训练;
第四确定模块,用于当损失数值小于预设损失数值时,将信用风险评级模型确定为训练完成后的目标信用风险评级模型。
实施例三:
基于相同的技术构思,本申请实施例还提供一种电子设备,图5示出了本申请实施例所提供的一种电子设备的结构示意图,如图5所示,该电子设备500包括:处理器501、存储器502和总线503,存储器存储有处理器可执行的机器可读指令,当电子设备运行时,处理器501与存储器502之间通过总线503通信,处理器501执行机器可读指令,以执行实施例一中所述的方法步骤。
实施例四:
本申请实施例四还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行实施例一中所述的方法步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种数据处理的方法,其特征在于,包括:
获取目标用户的第一金融信息和至少一个关联用户的第二金融信息;
根据所述第一金融信息,确定第一金融信息向量;以及针对每个所述关联用户,根据所述第二金融信息,确定第二金融信息向量;
将所述第一金融信息向量和每个所述第二金融信息向量按照预设顺序输入到训练完成后的目标信用风险评级模型中,得到所述目标信用风险评级模型输出的所述目标用户对应的第一信用等级向量;其中,所述目标信用风险评级模型包括嵌入层、编码部分和全连接层,在所述目标信用风险评级模型中,将所述第一金融信息向量和每个所述第二金融信息向量按照所述预设顺序输入到所述嵌入层中,提取所述第一金融信息向量的关键特征得到所述目标用户对应的第一特征向量,以及提取每个所述第二金融信息向量的关键特征得到每个关联用户对应的第二特征向量;将所述嵌入层输出的所述第一特征向量和每个所述第二特征向量按照所述预设顺序输入到所述编码部分,输出用于表示每个所述关联用户的第二金融信息以及所述目标用户的第一金融信息对所述目标用户的信用等级评定造成的影响结果的第一编码向量;将所述第一编码向量输入到所述全连接层,输出所述目标用户对应的第一信用等级向量;
根据所述第一信用等级向量,确定所述目标用户的第一信用等级。
2.根据权利要求1所述的数据处理的方法,其特征在于,所述获取至少一个关联用户的第二金融信息之前,还包括:
针对每个所述关联用户,向所述关联用户发送获取所述关联用户的第二金融信息的请求;
针对每个所述关联用户,接收所述关联用户的回应信息;所述回应信息中包括所述关联用户的第二金融信息,以及所述关联用户同意所述目标用户使用所述关联用户的第二金融信息进行信用等级评定的证明材料。
3.根据权利要求1所述的数据处理的方法,其特征在于,所述关联用户包括第一关联用户和第二关联用户,其中所述第一关联用户包括所述目标用户的配偶、父母、直系成年兄弟姐妹和成年子女中的至少一个,所述第二关联用户包括所述目标用户的商业合作伙伴、担保人中的至少一个;
所述获取至少一个关联用户的第二金融信息,包括:
根据所述目标信用风险评级模型在训练时使用的训练样本中的第一关联样本的个数与第二关联样本的个数,确定所述目标信用风险评级模型在使用时所述关联用户中所述第一关联用户的个数以及所述第二关联用户的个数;
根据所述关联用户中所述第一关联用户的个数以及所述第二关联用户的个数,获取至少一个所述关联用户的第二金融信息。
4.根据权利要求1所述的数据处理的方法,其特征在于,所述第一金融信息和所述第二金融信息的类型均包括数值型信息和/或非数值型信息;
所述根据所述第一金融信息,确定第一金融信息向量;以及针对每个所述关联用户,根据所述第二金融信息,确定第二金融信息向量,包括:
当所述第一金融信息为非数值型信息时,对所述第一金融信息中的非数值型信息进行独热编码,得到用于表示所述第一金融信息中的非数值型信息的第一子金融信息向量;
当所述第一金融信息为数值型信息时,根据所述第一金融信息中的数值型信息,确定用于表示所述第一金融信息中的数值型信息的第二子金融信息向量;
将所述第一子金融信息向量和所述第二子金融信息向量进行组合,得到用于表示所述第一金融信息的第一金融信息向量;
当所述第二金融信息为非数值型信息时,对所述第二金融信息中的非数值型信息进行独热编码,得到用于表示所述第二金融信息中的非数值型信息的第三子金融信息向量;
当所述第二金融信息为数值型信息时,根据所述第二金融信息中的数值型信息,确定用于表示所述第二金融信息中的数值型信息的第四子金融信息向量;
针对每个所述关联用户,将所述关联用户的所述第三子金融信息向量和所述第四子金融信息向量进行组合,得到用于表示所述关联用户对应的第二金融信息的第二金融信息向量。
5.根据权利要求1所述的数据处理的方法,其特征在于,所述编码部分包括至少一个结构相同参数不同的编码器,每个所述编码器的输出为下一个编码器的输入;其中每个所述编码器均包括注意力层、第一残差单元、第一层标准化、前馈网络、第二残差单元以及第二层标准化;
所述将所述嵌入层输出的所述第一特征向量和每个所述第二特征向量按照所述预设顺序输入到所述编码部分,输出用于表示每个所述关联用户的第二金融信息以及所述目标用户的第一金融信息对所述目标用户的信用等级评定造成的影响结果的第一编码向量,包括:
将所述嵌入层输出的所述第一特征向量和每个所述第二特征向量按照所述预设顺序输入到第一个编码器的注意力层,输出所述目标用户对应的第一关联向量,以及每个所述关联用户对应的第二关联向量;其中,在所述注意力层,分别对所述第一特征向量和每个所述第二特征向量进行线性变换,得到所述目标用户对应的第一查询向量、第一关键向量和第一信息向量,以及得到每个所述关联用户分别对应的第二查询向量、第二关键向量和第二信息向量;根据所述第一查询向量、所述第一关键向量和所述第一信息向量,以及每个关联用户对应的所述第二查询向量、所述第二关键向量和所述第二信息向量,计算得到所述目标用户对应的第一关联向量,以及每个关联用户对应的第二关联向量;
将所述第一关联向量和每个所述第二关联向量按照所述预设顺序输入到第一个编码器的第一残差单元,输出所述目标用户对应的第一融合向量以及每个所述关联用户对应的第二融合向量;在所述第一残差单元中,将所述第一特征向量和所述第一关联向量相加,得到所述目标用户对应的第一融合向量;以及针对每个关联用户,将所述关联用户对应的第二特征向量和第二关联向量相加,得到所述关联用户对应的第二融合向量;
将所述第一融合向量和每个所述第二融合向量按照所述预设顺序输入到第一个编码器的第一层标准化,对所述第一融合向量和每个所述第二融合向量分别进行标准化处理,得到所述目标用户对应的第一标准化向量以及每个所述关联用户对应的第二标准化向量;
将所述第一标准化向量和每个所述第二标准化向量按照所述预设顺序输入到第一个编码器的前馈网络,分别对所述第一标准化向量和每个所述第二标准化向量进行线性变换,得到所述目标用户对应的第三特征向量以及每个所述关联用户对应的第四特征向量;
将所述第三特征向量和每个所述第四特征向量按照所述预设顺序输入到第一个编码器的第二残差单元,输出所述目标用户对应的第三融合向量以及每个所述关联用户对应的第四融合向量;在所述第二残差单元中,将所述第一标准化向量和所述第三特征向量相加,得到所述目标用户对应的第三融合向量;针对每个关联用户,将所述关联用户对应的第二标准化向量和第四特征向量相加,得到所述关联用户对应的第四融合向量;
将所述第三融合向量以及每个所述第四融合向量按照所述预设顺序输入到第一个编码器的第二层标准化中,对所述第三融合向量以及每个所述第四融合向量进行标准化处理,得到所述目标用户对应的第三标准化向量以及每个所述关联用户对应的第四标准化向量;
将所述第三标准化向量以及每个所述第四标准化向量按照所述预设顺序输入到下一个编码器中,进行与在第一个编码器中相同的处理,直至最后一个编码器的第二层标准化中输出所述目标用户对应的第三标准化向量,将最后一个编码器输出的第三标准化向量作为所述目标用户的第一编码向量。
6.根据权利要求1所述的数据处理的方法,其特征在于,所述获取目标用户和至少一个关联用户的第一金融信息之前,还包括:
获取训练样本的第三金融信息和至少一个关联样本的第四金融信息,以及训练样本的第一等级标签和每个关联样本对应的第二等级标签;
根据所述第三金融信息的类型,对第三金融信息进行预处理,得到用于表示所述第三金融信息的第三金融信息向量;以及针对每个所述关联样本,根据所述第四金融信息的类型,对所述第四金融信息进行预处理,得到用于表示该关联用户对应的第四金融信息的第四金融信息向量;
将所述第三金融信息向量和每个所述关联样本各自对应的所述第四金融信息向量按照所述预设顺序输入到待训练的信用风险评级模型中,得到所述信用风险评级模型输出的所述训练样本对应的第二信用等级向量以及每个所述关联样本对应的第三信用等级向量;其中,所述信用风险评级模型包括嵌入层、编码部分和全连接层,在所述信用风险评级模型中,将所述第三金融信息向量和每个所述第四金融信息向量按照所述预设顺序输入到所述嵌入层中,提取所述第三金融信息向量的关键特征得到所述训练样本对应的第五特征向量,以及提取每个所述第四金融信息向量的关键特征得到每个所述关联样本对应的第六特征向量;将所述嵌入层输出的所述第五特征向量和每个所述第六特征向量按照所述预设顺序输入到所述编码部分,输出用于表示每个所述关联样本的第四金融信息以及所述训练样本的第三金融信息对所述训练样本的信用等级评定造成的影响结果的第二编码向量,以及针对每个关联样本,输出用于表示所述训练样本的第三金融信息和所述关联样本的第四金融信息对所述关联样本的信用等级评定造成的影响结果的第三编码向量;将所述第二编码向量和每个关联样本对应的所述第三编码向量按照所述预设顺序输入到所述全连接层,输出所述训练样本对应的第二信用等级向量以及每个所述关联样本对应的第三信用等级向量;
根据所述第二信用等级向量、每个所述第三信用等级向量以及所述第一等级标签和每个所述第二等级标签,计算得到所述第二信用等级向量和所述第三信用等级向量与所述第一等级标签和所述第二等级标签之间的第一损失数值;
根据所述第二编码向量以及每个所述第三编码向量之间的相关系数,计算得到第二损失数值;
根据所述第一损失数值和所述第二损失数值,以及预先设定的权重,确定损失数值;
当所述损失数值不小于预设损失数值时,利用损失数值对信用风险评级模型进行本轮训练;
当所述损失数值小于预设损失数值时,将所述信用风险评级模型确定为训练完成后的目标信用风险评级模型。
7.一种数据处理的装置,其特征在于,包括:
第一获取模块,用于获取目标用户的第一金融信息和至少一个关联用户的第二金融信息;
第一确定模块,用于根据所述第一金融信息,确定第一金融信息向量;以及针对每个所述关联用户,根据所述第二金融信息,确定第二金融信息向量;
第一输入输出模块,用于将所述第一金融信息向量和每个所述第二金融信息向量按照预设顺序输入到训练完成后的目标信用风险评级模型中,得到所述目标信用风险评级模型输出的所述目标用户对应的第一信用等级向量;其中,所述目标信用风险评级模型包括嵌入层、编码部分和全连接层,在所述目标信用风险评级模型中,将所述第一金融信息向量和每个所述第二金融信息向量按照所述预设顺序输入到所述嵌入层中,提取所述第一金融信息向量的关键特征得到所述目标用户对应的第一特征向量,以及提取每个所述第二金融信息向量的关键特征得到每个关联用户对应的第二特征向量;将所述嵌入层输出的所述第一特征向量和每个所述第二特征向量按照所述预设顺序输入到所述编码部分,输出用于表示每个所述关联用户的第二金融信息以及所述目标用户的第一金融信息对所述目标用户的信用等级评定造成的影响结果的第一编码向量;将所述第一编码向量输入到所述全连接层,输出所述目标用户对应的第一信用等级向量;
第二确定模块,用于根据所述第一信用等级向量,确定所述目标用户的第一信用等级。
8.根据权利要求7所述的数据处理的装置,其特征在于,所述获取至少一个关联用户的第二金融信息之前,还包括:
发送模块,用于针对每个所述关联用户,向所述关联用户发送获取所述关联用户的第二金融信息的请求;
接收模块,用于针对每个所述关联用户,接收所述关联用户的回应信息;所述回应信息中包括所述关联用户的第二金融信息,以及所述关联用户同意所述目标用户使用所述关联用户的第二金融信息进行信用等级评定的证明材料。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至6任一所述的数据处理的方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至6任一所述的数据处理的方法的步骤。
CN202110611512.1A 2021-06-02 2021-06-02 数据处理的方法、装置、电子设备及计算机可读存储介质 Pending CN113052692A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110611512.1A CN113052692A (zh) 2021-06-02 2021-06-02 数据处理的方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110611512.1A CN113052692A (zh) 2021-06-02 2021-06-02 数据处理的方法、装置、电子设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN113052692A true CN113052692A (zh) 2021-06-29

Family

ID=76518648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110611512.1A Pending CN113052692A (zh) 2021-06-02 2021-06-02 数据处理的方法、装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113052692A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115098508A (zh) * 2022-07-04 2022-09-23 成都秦川物联网科技股份有限公司 基于物联网的智慧城市核查列表生成方法、系统及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115098508A (zh) * 2022-07-04 2022-09-23 成都秦川物联网科技股份有限公司 基于物联网的智慧城市核查列表生成方法、系统及装置

Similar Documents

Publication Publication Date Title
US11443380B2 (en) System and method of providing and recording personalized context-specific advice in the form of an artificial intelligence view of a hierarchical portfolio
Hisano et al. Prediction of ESG compliance using a heterogeneous information network
Muslim et al. New model combination meta-learner to improve accuracy prediction P2P lending with stacking ensemble learning
CN113177700B (zh) 一种风险评估方法、系统、电子设备及存储介质
CN111260189A (zh) 一种风险控制方法、装置、计算机系统及可读存储介质
CN114997916A (zh) 潜在用户的预测方法、系统、电子设备和存储介质
CN109858927A (zh) 一种商户审核方法、装置、计算机可读存储介质及服务器
CN115526700A (zh) 风险的预测方法、装置及电子设备
CN113052692A (zh) 数据处理的方法、装置、电子设备及计算机可读存储介质
López-Díaz et al. A stochastic comparison of customer classifiers with an application to customer attrition in commercial banking
CN116800831A (zh) 一种业务数据推送方法、装置、存储介质及处理器
CN114119191A (zh) 风控方法、逾期预测方法、模型训练方法及相关设备
CN115345727B (zh) 一种识别欺诈贷款申请的方法及装置
CN115511606A (zh) 对象识别方法、装置、设备及存储介质
CN113052693B (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
Li et al. Research on Efficiency in Credit Risk Prediction Using Logistic‐SBM Model
CN112967134B (zh) 网络训练方法、风险用户识别方法、装置、设备及介质
Kazemi et al. Estimation of optimum thresholds for binary classification using genetic algorithm: An application to solve a credit scoring problem
Abdool et al. Islamic finance in Canada powered by big data: A case study
US11397783B1 (en) Ranking similar users based on values and personal journeys
US20230196453A1 (en) Deduplication of accounts using account data collision detected by machine learning models
Xiangjian Research on Computer Intelligent Risk Prediction Model and Identification Algorithm with Machine Learning
MUN et al. A customer credit Prediction Researched to Improve Credit Stability based on Artificial Intelligence
YESHAMBEL A LOAN DEFAULT PREDICTION MODEL FOR ACSI: A DATA MINING APPROACH
Smirnov et al. A Deep Learning Approach to Credit Scoring Using Credit History Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210629

RJ01 Rejection of invention patent application after publication