CN114387088A - 一种基于知识图谱的贷款风险识别方法及装置 - Google Patents

一种基于知识图谱的贷款风险识别方法及装置 Download PDF

Info

Publication number
CN114387088A
CN114387088A CN202210044242.5A CN202210044242A CN114387088A CN 114387088 A CN114387088 A CN 114387088A CN 202210044242 A CN202210044242 A CN 202210044242A CN 114387088 A CN114387088 A CN 114387088A
Authority
CN
China
Prior art keywords
data
entity
risk
training
vector corresponding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210044242.5A
Other languages
English (en)
Inventor
陈尚志
朱祖恩
陈浩欣
魏晓聪
邱馥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202210044242.5A priority Critical patent/CN114387088A/zh
Publication of CN114387088A publication Critical patent/CN114387088A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提供一种基于知识图谱的贷款风险识别方法及装置,涉及金融信息服务技术领域,所述方法包括:从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;根据各个第一三元组数据,获得每个第一三元组数据对应的向量;根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果。所述装置用于执行上述方法。本发明实施例提供的基于知识图谱的贷款风险识别方法及装置,提高了贷款风险识别的效率。

Description

一种基于知识图谱的贷款风险识别方法及装置
技术领域
本发明涉及金融信息服务技术领域,具体涉及一种基于知识图谱的贷款风险识别方法及装置。
背景技术
随着中国国内市场日益活跃以及经济的飞速发展,企业以及个人对贷款的需求逐渐扩大,为了降低贷款逾期的风险,贷款预警的工作在贷前、贷中、贷后都有着十分重要的意义。
传统的贷款预警策略是通过领域内专家根据先验知识和规范条例来制定一些规则来判断当前贷款人是否面临贷款资金使用不规范或无法偿还的风险。随着贷款数据量的日益庞大,这种方式需要消耗大量的人力和时间成本,同时,贷款资金的流向也变得更广和更深,专家难以快速挖掘出在贷款资金流向过程中产生的隐含关联关系,因此,难以判断当前贷款是否存在较大风险,贷款的预警变得越来越困难。
发明内容
针对现有技术中的问题,本发明实施例提供一种基于知识图谱的贷款风险识别方法及装置,能够至少部分地解决现有技术中存在的问题。
一方面,本发明提出一种基于知识图谱的贷款风险识别方法,包括:
从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;其中,所述目标客户为风险客户,所述贷款客户知识图谱是预先建立的;
根据各个第一三元组数据,获得每个第一三元组数据对应的向量;
根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果;其中,所述风险预测模型是基于三元组风险训练数据以及对应的标签训练获得的。
另一方面,本发明提供一种基于知识图谱的贷款风险识别装置,包括:
第一获取模块,用于从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;其中,所述目标客户为风险客户,所述贷款客户知识图谱是预先建立的;
第一获得模块,用于根据各个第一三元组数据,获得每个第一三元组数据对应的向量;
预测模块,用于根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果;其中,所述风险预测模型是基于三元组风险训练数据以及对应的标签训练获得的。
再一方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述基于知识图谱的贷款风险识别方法的步骤。
又一方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施例所述基于知识图谱的贷款风险识别方法的步骤。
还一方面,本发明提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述基于知识图谱的贷款风险识别方法的步骤。
本发明实施例提供的基于知识图谱的贷款风险识别方法及装置,能够从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据,根据各个第一三元组数据,获得每个第一三元组数据对应的向量,根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果,通过知识图谱捕捉已有风险客户的贷款资金活动情况,在已有风险客户的基础上能够对相关客户进行贷款风险识别,通过风险预测模型对尾实体对应的客户进行贷款分析预测,提高了贷款风险识别的效率和准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明第一实施例提供的基于知识图谱的贷款风险识别方法的流程示意图。
图2是本发明第二实施例提供的基于知识图谱的贷款风险识别方法的流程示意图。
图3是本发明第三实施例提供的基于知识图谱的贷款风险识别方法的流程示意图。
图4是本发明第四实施例提供的基于知识图谱的贷款风险识别方法的流程示意图。
图5是本发明第五实施例提供的基于知识图谱的贷款风险识别方法的流程示意图。
图6是本发明第六实施例提供的基于知识图谱的贷款风险识别方法的流程示意图。
图7是本发明第七实施例提供的基于知识图谱的贷款风险识别方法的流程示意图。
图8是本发明第八实施例提供的基于知识图谱的贷款风险识别方法的流程示意图。
图9是本发明第九实施例提供的基于知识图谱的贷款风险识别装置的结构示意图。
图10是本发明第十实施例提供的基于知识图谱的贷款风险识别装置的结构示意图。
图11是本发明第十一实施例提供的基于知识图谱的贷款风险识别装置的结构示意图。
图12是本发明第十二实施例提供的基于知识图谱的贷款风险识别装置的结构示意图。
图13是本发明第十三实施例提供的基于知识图谱的贷款风险识别装置的结构示意图。
图14是本发明第十四实施例提供的基于知识图谱的贷款风险识别装置的结构示意图。
图15是本发明第十五实施例提供的基于知识图谱的贷款风险识别装置的结构示意图。
图16是本发明第十六实施例提供的基于知识图谱的贷款风险识别装置的结构示意图。
图17是本发明第十七实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。为了便于理解本申请提供的技术方案,下面先对本申请技术方案的相关内容进行说明。本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
知识图谱是一个图结构的语义知识库,他以图的结构来组织数据、以三元组形式来构造知识并通过本体的概念来描述现实世界,知识图谱能够挖掘出数据之间的联系并且能够通过推理产生新的知识。在贷款业务场景中,贷款人的经济状况与贷款资金的流动都与贷款风险息息相关,通过知识图谱可以捕捉这之间深层次的联系,同时也可以在全局视角中清晰的刻画贷款人和贷款资金的活动情况。
下面以服务器作为执行主体为例,来说明本发明实施例提供的基于知识图谱的贷款风险识别方法的实现过程。可理解的是,本发明实施例提供的基于知识图谱的贷款风险识别方法的执行主体不限于服务器。
图1是本发明一实施例提供的基于知识图谱的贷款风险识别方法的流程示意图,如图1所示,本发明实施例提供的基于知识图谱的贷款风险识别方法,包括:
S101、从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;其中,所述目标客户为风险客户,所述贷款客户知识图谱是预先建立的;
具体地,服务器可以根据目标客户从贷款客户知识图谱中查找获得以所述目标客户作为头实体的各个第一三元组数据。其中,所述贷款客户知识图谱是预先建立的,包括多个三元组数据,每个三元组数据包括头实体、尾实体和连接所述头实体和尾实体的有向边,所述有向边从头实体指向尾实体,所述有向边表示头实体和尾实体之间存在一种关系。尾实体对应一个客户。所述目标客户为风险客户,在本发明实施例中,风险客户是存在贷款风险的客户。
例如,如果某个客户已经存在了贷款违约,那么该客户就可以作为风险客户;如果某个客户的净资产为负值,那么该客户可以作为风险客户。风险客户的具体确定方式根据实际需要进行设置,本发明实施例不做限定。
S102、根据各个第一三元组数据,获得每个第一三元组数据对应的向量;
具体地,所述服务器在获得各个第一三元组数据之后,对各个第一三元组数据进行处理,可以获得每个第一三元组数据对应的向量。每个第一三元组数据对应的向量的具体获得过程详见下文所述,此处不进行赘述。
S103、根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果;其中,所述风险预测模型是基于三元组风险训练数据以及对应的标签训练获得的。
具体地,所述服务器将所述第一三元组数据对应的向量输入到风险预测模型中,经过所述风险预测模型的处理,可以输出所述第一三元组数据中尾实体对应的客户的风险预测结果,所述风险预测结果为风险上升、风险下降或者风险不变。风险上升表明由于目标客户成为风险客户,与目标客户存在关系的尾实体对应的客户的贷款风险上升。风险不变表明,虽然目标客户成为风险客户,但对于风险客户存在关系的尾实体对应的客户,贷款风险不变。风险下降表明,虽然目标客户成为风险客户,但对于风险客户存在关系的尾实体对应的客户,贷款风险下降。其中,所述风险预测模型是基于三元组风险训练数据以及对应的标签训练获得的。
本发明实施例提供的基于知识图谱的贷款风险识别方法,能够从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据,根据各个第一三元组数据,获得每个第一三元组数据对应的向量,根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果,在已有风险客户的基础上能够对相关客户进行贷款风险识别,提高了贷款风险识别的效率。
图2是本发明第二实施例提供的基于知识图谱的贷款风险识别方法的流程示意图,如图2所示,在上述各实施例的基础上,进一步地,所述根据各个第一三元组数据,获得每个第一三元组数据对应的向量包括:
S201、根据每个第一三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得每个第一三元组数据的头实体对应的向量和尾实体对应的向量;其中,所述向量映射模型是基于实体的风险相关属性信息和对应的标签训练获得的;
具体地,所述服务器根据所述第一三元组数据包括的头实体可以从所述贷款客户知识图谱中获得头实体的风险相关属性信息,将所述第一三元组数据包括的头实体的风险相关属性信息输入到向量映射模型中,可以输出所述第一三元组数据包括的头实体对应的向量。所述服务器根据所述第一三元组数据包括的尾实体可以从所述贷款客户知识图谱中获得尾实体的风险相关属性信息,然后将所述第一三元组数据包括的尾实体的风险相关属性信息输入到向量映射模型中,可以输出所述第一三元组数据包括的尾实体对应的向量。对于每个第一三元组数据,所述服务器重复上述过程,可以获得每个第一三元组数据的头实体对应的向量和尾实体对应的向量。其中,所述向量映射模型是基于实体的风险相关属性信息和对应的标签训练获得的;风险相关属性信息包括但不限于贷款金额、高息贷款金额、不良信用记录、流水记录、公司类型、最近连续亏损标志、负债率达标标志、流水数据、企业异常业务次数、是否涉嫌风险企业、法人风险标志、纳税信用等级。头实体和尾实体关系包括但不限于投资关系、贷款关系、担保关系、合作关系、供应链关系、债权关系、子母公司关系等。
S202、根据每个第一三元组数据的头实体对应的向量和尾实体对应的向量、每个第一三元组数据包括的头实体和尾实体的关系以及关系向量映射模型,获得每个第一三元组数据的头实体和尾实体关系对应的向量;其中,所述关系向量映射模型是基于实体关系训练数据以及对应的标签训练获得的;
具体地,所述服务器根据所述第一三元组数据包括的头实体和尾实体可以从所述贷款客户知识图谱中获得头实体和尾实体关系,然后将所述第一三元组数据的头实体对应的向量和尾实体对应的向量,所述第一三元组数据包括的头实体和尾实体的关系输入到关系向量映射模型中,可以输出所述第一三元组数据的头实体和尾实体关系对应的向量。所述服务器重复上述过程,可以获得每个第一三元组数据的头实体和尾实体关系对应的向量。其中,所述关系向量映射模型是基于实体关系训练数据以及对应的标签训练获得的。
S203、根据每个第一三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量,获得每个第一三元组数据对应的向量;
具体地,所述服务器将根据所述第一三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量,可以获得所述第一三元组数据对应的向量。对于每个第一三元组数据,所述服务器重复上述处理过程,可以获得每个第一三元组数据对应的向量。
例如,所述服务器对述第一三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量进行相似度计算,获得所述第一三元组数据对应的向量。其中,本发明实施例中相似度计算可以采用知识表示学习算法中TransE的距离相似度计算公式||h+r=t||,h表示头实体对应的向量,r表示尾实体对应的向量,t表示头实体和尾实体关系对应的向量。
图3是本发明第三实施例提供的基于知识图谱的贷款风险识别方法的流程示意图,如图3所示,在上述各实施例的基础上,进一步地,基于实体的风险相关属性信息和对应的标签训练获得向量映射模型的步骤包括:
S301、从贷款客户知识图谱中获取第一预设数量个实体的风险相关属性信息,并获取所述第一预设数量个实体中每个实体的公司类型作为对应的标签;
具体地,所述服务器从贷款客户知识图谱中可以获取第一预设数量个实体的风险相关属性信息,并获取所述第一预设数量个实体中每个实体的公司类型作为每个实体的风险相关属性信息对应的标签。其中,所述第一预设数量根据实际需要进行设置,本发明实施例不做限定。所述公司类型是预设的,根据实际需要进行设置,本发明实施例不做限定。
例如,所述公司类型包括但不限于房地产开发商。
S302、根据第一初始模型、所述第一预设数量个实体的风险相关属性信息以及对应的标签,训练获得所述向量映射模型。
具体地,所述服务器根据所述第一预设数量个实体的风险相关属性信息以及对应的标签,对所述第一初始模型进行模型训练,可以训练获得所述向量映射模型,所述向量映射模型用于获得实体对应的向量。其中,所述第一初始模型可以采用深度神经网络模型,根据实际需要进行选择,本发明实施例不做限定。第一初始模型的具体训练过程为现有技术,此处不进行赘述。
图4是本发明第四实施例提供的基于知识图谱的贷款风险识别方法的流程示意图,如图4所示,在上述各实施例的基础上,进一步地,基于实体关系训练数据以及对应的标签训练获得关系向量映射模型的步骤包括:
S401、从贷款客户知识图谱中获取第四预设数量的关系训练三元组数据;
具体地,所述服务器从贷款客户知识图谱中可以获取第四预设数量的三元组数据,作为第四预设数量的关系训练三元组数据。其中,所述第四预设数量根据实际需要进行设置,本发明实施例不做限定。
S402、根据每个关系训练三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得每个关系训练三元组数据的头实体对应的向量和尾实体对应的向量;
具体地,所述服务器根据每个关系训练三元组数据包括的头实体可以从所述贷款客户知识图谱中获得头实体的风险相关属性信息,将每个关系训练三元组数据包括的头实体的风险相关属性信息输入到向量映射模型中,可以输出每个关系训练三元组数据包括的头实体对应的向量。所述服务器根据每个关系训练三元组数据包括的尾实体可以从所述贷款客户知识图谱中获得尾实体的风险相关属性信息,将每个关系训练三元组数据包括的尾实体的风险相关属性信息输入到向量映射模型中,可以输出每个关系训练三元组数据包括的尾实体对应的向量。
S403、获取每个关系训练三元组数据的头实体和尾实体关系以及对应的标签,并将各个关系训练三元组数据的头实体对应的向量、尾实体对应的向量、头实体和尾实体关系以及对应的标签作为实体关系训练数据;
具体地,头实体和尾实体关系可以通过one-后台编码方式进行编码,作为头实体和尾实体关系对应的标签。所述服务器可以获取每个关系训练三元组数据的头实体和尾实体关系以及对应的标签,然后将所述第四预设数量的关系训练三元组数据的头实体对应的向量、尾实体对应的向量、头实体和尾实体关系以及对应的标签作为实体关系训练数据。
S404、根据第二初始模型、所述第四预设数量的关系训练三元组数据的头实体对应的向量、尾实体对应的向量、头实体和尾实体关系以及对应的标签,训练获得所述关系向量映射模型。
具体地,所述服务器根据所述第四预设数量的关系训练三元组数据的头实体对应的向量、尾实体对应的向量、头实体和尾实体关系以及对应的标签,对所述第二初始模型进行模型训练,可以训练获得所述关系向量映射模型,所述关系向量映射模型用于获得头实体和尾实体关系对应的向量。其中,所述第二初始模型可以采用深度神经网络模型,根据实际需要进行选择,本发明实施例不做限定。第二初始模型的具体训练过程为现有技术,此处不进行赘述。
图5是本发明第五实施例提供的基于知识图谱的贷款风险识别方法的流程示意图,如图5所示,在上述各实施例的基础上,进一步地,基于三元组风险训练数据以及对应的标签训练获得风险预测模型的步骤包括:
S501、从贷款客户知识图谱中抽取第二预设数量的三元组数据作为三元组风险训练数据,并获取每个三元组数据中尾实体对应的风险等级作为每个三元组数据对应的标签;
具体地,所述服务器可以从贷款客户知识图谱中获取第二预设数量的三元组数据,作为三元组风险训练数据,并获取所述第二预设数量的三元组数据中每个三元组数据中尾实体对应的风险等级作为述第二预设数量的三元组数据中每个三元组数据对应的标签。其中,所述第二预设数量根据实际需要进行设置,本发明实施例不做限定。贷款客户知识图谱包括的每个三元组数据的尾实体的属性信息包括风险等级。所述风险等级根据实际需要进行设置,本发明实施例不做限定。
例如,所述风险等级包括正常、关注、次级、可疑、损失等。
S502、根据所述三元组风险训练数据包括的每个三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得所述三元组风险训练数据中每个三元组数据的头实体对应的向量和尾实体对应的向量;
具体地,对于所述三元组风险训练数据包括的每个三元组数据,所述服务器根据所述三元组数据包括的头实体可以从所述贷款客户知识图谱中获得头实体的风险相关属性信息,将所述三元组数据包括的头实体的风险相关属性信息输入到向量映射模型中,可以输入所述三元组数据包括的头实体对应的向量;所述服务器根据所述三元组数据包括的尾实体可以从所述贷款客户知识图谱中获得尾实体的风险相关属性信息,然后将所述三元组数据包括的尾实体的风险相关属性信息输入到向量映射模型中,可以输出所述三元组数据包括的尾实体对应的向量。所述服务器能够获得所述三元组风险训练数据中每个三元组数据的头实体对应的向量和尾实体对应的向量。
S503、根据所述三元组风险训练数据中每个三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量,获得所述三元组风险训练数据中每个三元组数据对应的向量;
具体地,对于所述三元组风险训练数据包括的每个三元组数据,所述服务器将所述三元组数据包括的头实体和尾实体的关系以向量的形式进行表示,获得所述三元组数据包括的头实体和尾实体关系对应的向量,然后根据所述三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量,可以获得所述三元组数据对应的向量。所述服务器可以获得所述三元组风险训练数据中每个三元组数据对应的向量。
S504、根据第二初始模型、所述三元组风险训练数据中每个三元组数据对应的向量以及对应的标签,训练获得所述风险预测模型。
具体地,所述服务器根据所述三元组风险训练数据中每个三元组数据对应的向量以及对应的标签,对第二初始模型进行训练,可以训练获得所述风险预测模型,所述风险预测模型用于对尾实体对应的客户进行风险识别。其中,所述第二初始模型可以采用ConvKB(A Novel Embedding Model for Knowledge Base Completion Based on ConvolutionalNeural Network)模型,根据实际需要进行选择,本发明实施例不做限定。第二初始模型的具体训练过程为现有技术,此处不进行赘述。
图6是本发明第六实施例提供的基于知识图谱的贷款风险识别方法的流程示意图,如图6所示,在上述各实施例的基础上,进一步地,预先建立所述贷款客户知识图谱的步骤包括:
S601、基于初始三元组数据构建初始贷款客户知识图谱;其中,所述初始三元组数据是通过贷款相关数据抽取获得的;
具体地,所述服务器可以基于初始三元组数据,建立初始贷款客户知识图谱。所述初始三元组数据包括头实体、尾实体以及头实体与尾实体之间的关系。在初始贷款客户知识图谱中,头实体和尾实体可以以点表示,头实体和尾实体之间关系以有向边表示,有向边的方向由头实体指向尾实体。其中,所述初始三元组数据是通过贷款相关数据抽取获得的。
例如,贷款账户基本信息、交易记录明细等银行业务数据会存放在关系数据库中,通过Protégé工具建立本体层,本体层包括多个实体,每个实体都是贷款客户,再通过GANA工具从银行业务数据中抽取出本体层中的任意两个实体以及这两个实体之间的关系,构成初始三元组,每个初始三元组包括一个头实体、一个尾实体以及头实体和尾实体之间的一种关系,所需提取的关系包括但不限于投资关系、贷款关系、担保关系、合作关系、供应链关系、债权关系、子母公司关系等。在所述初始贷款客户知识图谱中每个实体具有属性信息,每个实体可以拥有多个属性或关系,每个实体的属性信息可以根据设定的属性关键词从上述关系数据库中提取。
网络中还会存在贷款客户的企业经济活动信息、政策新闻等文字类的数据,对于这些来自于网络的半结构化和非结构化数据,可以通过实体命名识别技术和关系抽取技术将文字中的实体和关系抽取出来,构建成初始三元组。
S602、对所述初始贷款客户知识图谱进行共指消解,获得所述贷款客户知识图谱。
具体地,对于同一个贷款企业,可以存在简称、全称、别称等名称,在通过初始三元组数据构建初始贷款客户知识图谱的过程中,头实体或者尾实体对应的实体名虽然不同,但可能是同一个实体,所述服务器对所述初始贷款客户知识图谱进行共指消解,将识别出的同一个实体的不同名称统一为同一个名称,获得所述贷款客户知识图谱,在所述贷款客户知识图谱中相同实体的实体名称相同,以方便使用。
其中,共指消解可以使用自然语言处理中的语言模型进行语义相似度计算,计算不同的实体对应的实体名称的相似度,将相似度大于相似度阈值的实体的名称统一。
对于出现的不同实体使用同一个实体名称的情况,比如苹果可以代表水果,也可以代表手机,可以通过与实体唯一对应的实体标识进行区分。
其中,为了能够方便的应用贷款客户知识图谱,可以通过Neo4J对贷款客户知识图谱进行持久化和管理。Neo4J是基于JAVA语言的图数据库,可以实现知识图谱的持久化,并且可以使用Cypher语句对知识图谱进行操作和管理,同时Neo4J可以便捷地与JAVA进行交互。
图7是本发明第七实施例提供的基于知识图谱的贷款风险识别方法的流程示意图,如图7所示,在上述各实施例的基础上,进一步地,确定所述目标客户为风险客户的步骤包括:
S701、从贷款客户知识图谱中获取所述目标客户作为头实体并且具有资金流向关系的各个第二三元组数据;
具体地,所述服务器根据所述目标客户以及所有资金流向关系,从贷款客户知识图谱中查找获得所述目标客户作为头实体并且具有资金流向关系的各个第二三元组数据,每个第二三元组数据包括头实体、尾实体和资金流向关系,资金由头实体流向尾实体,头实体与目标客户对应。其中,资金流向关系包括但不限于投资关系、借贷关系、转账关系、商品买卖关系等,根据实际需要进行设置,本发明实施例不做限定。
S702、根据所述目标客户的各个第二三元组数据,获得所述目标客户的子图特征;
具体地,所述服务器根据所述目标客户的各个第二三元组数据,构建所述目标客户的子图特征,所述目标客户的子图特征是以所述目标客户对应头实体为起点,通过有向边连接各个尾实体的图形。
S703、根据所述目标客户的子图特征以及资金流向异常检测模型,获得所述目标客户的资金流向检测结果;其中,所述资金流向异常检测模型是基于资金流向异常检测训练数据以及对应的标签训练获得的;
具体地,所述将所述目标客户的子图特征输入到资金流向异常检测模型中,可以输出所述目标客户的资金流向检测结果,所述资金流向检测结果为资金流向异常或者资金流向正常。其中,所述资金流向异常检测模型是基于资金流向异常检测训练数据以及对应的标签训练获得的。
S704、若获知所述目标客户的资金流向检测结果为资金流向异常,则确定所述目标客户为风险客户。
具体地,所述服务器根据所述目标客户的资金流向检测结果,如果获知所述目标客户的资金流向检测结果为资金流向异常,那么可以将所述目标客户作为风险客户。会通过步骤S101至步骤S103识别所述目标客户对应的各个尾实体对应的客户的贷款风险是否发生变化。
图8是本发明第八实施例提供的基于知识图谱的贷款风险识别方法的流程示意图,如图8所示,在上述各实施例的基础上,进一步地,基于资金流向异常检测训练数据以及对应的标签训练获得所述资金流向异常检测模型的步骤包括:
S801、从贷款客户知识图谱中获取具有资金流向关系的各个三元组数据;
具体地,所述服务器根据所有资金流向关系,从贷款客户知识图谱中查找获得具有资金流向关系的三元组数据,从而获得具有资金流向关系的各个三元组数据。
S802、根据具有资金流向关系的各个三元组数据中的各个头实体构造第三预设数量的子图特征,作为所述资金流向异常检测训练数据,并获得所述第三预设数量的子图特征中每个子图特征对应的标签;
具体地,所述服务器从具有资金流向关系的各个三元组数据中,获取具有相同头实体的各个三元组数据,从中获得第三预设数量的相同头实体的各个三元组数据构造出第三预设数量的子图特征,每个子图特征以一个头实体为起点,以各条资金流向关系为有向边,连接各个尾实体。所述服务器可以获得所述第三预设数量的子图特征中每个子图特征对应的标签,上述标签为资金流向异常或者资金流向正常,上述标签可以人工进行标注,当以一个头实体为起点,以各条资金流向关系为有向边,连接各个尾实体的子图特征中有超过半数的尾实体产生了风险升高的情况,我们认为当前子图特征为异常子图特征,并判定当前子图特征对应标签为资金流向异常。否则,判定当前子图特征对应标签为资金流向正常。其中,所述第三预设数量根据实际需要进行设置,本发明实施例不做限定。
S803、根据第三初始模型、所述资金流向异常检测训练数据包括的各个子图特征以及对应的标签,训练获得所述资金流向异常检测模型。
具体地,所述服务器根据所述资金流向异常检测训练数据包括的各个子图特征以及对应的标签,对第三初始模型进行训练,可以训练获得所述资金流向异常检测模型,所述资金流向异常检测模型用于检测目标客户是否存在资金流向异常。其中,所述第三初始模型根据实际需要进行选择,比如采用图卷积神经网络模型,本发明实施例不做限定。第三初始模型的具体训练过程为现有技术,此处不进行赘述。
图9是本发明第九实施例提供的基于知识图谱的贷款风险识别装置的结构示意图,如图9所示,本发明实施例提供的基于知识图谱的贷款风险识别装置包括第一获取模块901、第一获得模块902和预测模块903,其中:
第一获取单元模块901用于从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;其中,所述目标客户为风险客户,所述贷款客户知识图谱是预先建立的;第一获得模块902用于根据各个第一三元组数据,获得每个第一三元组数据对应的向量;预测单元903用于根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果;其中,所述风险预测模型是基于三元组风险训练数据以及对应的标签训练获得的。
具体地,第一获取模块901可以根据目标客户从贷款客户知识图谱中查找获得以所述目标客户作为头实体的各个第一三元组数据。其中,所述贷款客户知识图谱是预先建立的,包括多个三元组数据,每个三元组数据包括头实体、尾实体和连接所述头实体和尾实体的有向边,所述有向边从头实体指向尾实体,所述有向边表示头实体和尾实体之间存在一种关系。尾实体对应一个客户。所述目标客户为风险客户,在本发明实施例中,风险客户是存在贷款风险的客户。
在获得各个第一三元组数据之后,第一获得模块902对各个第一三元组数据进行处理,可以获得每个第一三元组数据对应的向量。
预测模块903将所述第一三元组数据对应的向量输入到风险预测模型中,经过所述风险预测模型的处理,可以输出所述第一三元组数据中尾实体对应的客户的风险预测结果,所述风险预测结果为风险上升、风险下降或者风险不变。风险上升表明由于目标客户成为风险客户,与目标客户存在关系的尾实体对应的客户的贷款风险上升。风险不变表明,虽然目标客户成为风险客户,但对于风险客户存在关系的尾实体对应的客户,贷款风险不变。风险下降表明,虽然目标客户成为风险客户,但对于风险客户存在关系的尾实体对应的客户,贷款风险下降。其中,所述风险预测模型是基于三元组风险训练数据以及对应的标签训练获得的。
本发明实施例提供的基于知识图谱的贷款风险识别装置,能够从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据,根据各个第一三元组数据,获得每个第一三元组数据对应的向量,根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果,在已有风险客户的基础上能够对相关客户进行贷款风险识别,提高了贷款风险识别的效率。
图10是本发明第十实施例提供的基于知识图谱的贷款风险识别装置的结构示意图,如图10所示,在上述各实施例的基础上,进一步地,第一获得模块902包括:
第一获得单元9021用于根据每个第一三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得每个第一三元组数据的头实体对应的向量和尾实体对应的向量;其中,所述向量映射模型是基于实体的风险相关属性信息和对应的标签训练获得的;第二获得单元9022用于根据每个第一三元组数据的头实体对应的向量和尾实体对应的向量、每个第一三元组数据包括的头实体和尾实体的关系以及关系向量映射模型,获得每个第一三元组数据的头实体和尾实体关系对应的向量;其中,所述关系向量映射模型是基于实体关系训练数据以及对应的标签训练获得的;第三获得单元9023用于根据每个第一三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量,获得每个第一三元组数据对应的向量。
图11是本发明第十一实施例提供的基于知识图谱的贷款风险识别装置的结构示意图,如图11所示,在上述各实施例的基础上,进一步地,第一获得模块902还包括:
第一获取单元9024用于从贷款客户知识图谱中获取第一预设数量个实体的风险相关属性信息,并获取所述第一预设数量个实体中每个实体的公司类型作为对应的标签;第一训练单元9025用于根据第一初始模型、所述第一预设数量个实体的风险相关属性信息以及对应的标签,训练获得所述向量映射模型。
图12是本发明第十二实施例提供的基于知识图谱的贷款风险识别装置的结构示意图,如图12所示,在上述各实施例的基础上,进一步地,第一获得模块902还包括:
第二获取单元9026用于从贷款客户知识图谱中获取第四预设数量的关系训练三元组数据;第四获得单元9027用于根据每个关系训练三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得每个关系训练三元组数据的头实体对应的向量和尾实体对应的向量;第三获取单元9028用于获取每个关系训练三元组数据的头实体和尾实体关系以及对应的标签,并将各个关系训练三元组数据的头实体对应的向量、尾实体对应的向量、头实体和尾实体关系以及对应的标签作为实体关系训练数据;第二训练单元9029用于根据第二初始模型、所述第四预设数量的关系训练三元组数据的头实体对应的向量、尾实体对应的向量、头实体和尾实体关系以及对应的标签,训练获得所述关系向量映射模型。
图13是本发明第十三实施例提供的基于知识图谱的贷款风险识别装置的结构示意图,如图13所示,在上述各实施例的基础上,进一步地,本发明实施例提供的基于知识图谱的贷款风险识别装置还包括:
抽取模块904用于从贷款客户知识图谱中抽取第二预设数量的三元组数据作为三元组风险训练数据,并获取每个三元组数据中尾实体对应的风险等级作为每个三元组数据对应的标签;第二获得模块905用于根据所述三元组风险训练数据包括的每个三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得所述三元组风险训练数据中每个三元组数据的头实体对应的向量和尾实体对应的向量;第三获得模块906用于根据所述三元组风险训练数据中每个三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量,获得所述三元组风险训练数据中每个三元组数据对应的向量;第一训练模块907用于根据第二初始模型、所述三元组风险训练数据中每个三元组数据对应的向量以及对应的标签,训练获得所述风险预测模型。
图14是本发明第十四实施例提供的基于知识图谱的贷款风险识别装置的结构示意图,如图14所述,在上述各实施例的基础上,进一步地,本发明实施例提供的基于知识图谱的贷款风险识别装置还包括:
构建模块908用于基于初始三元组数据构建初始贷款客户知识图谱;其中,所述初始三元组数据是通过贷款相关数据抽取获得的;消解模块909用于对所述初始贷款客户知识图谱进行共指消解,获得所述贷款客户知识图谱。
图15是本发明第十五实施例提供的基于知识图谱的贷款风险识别装置的结构示意图,如图15所示,在上述各实施例的基础上,进一步地,本发明实施例提供的基于知识图谱的贷款风险识别装置还包括:
第二获取模块910用于从贷款客户知识图谱中获取所述目标客户作为头实体并且具有资金流向关系的各个第二三元组数据;第四获得模块911用于根据所述目标客户的各个第二三元组数据,获得所述目标客户的子图特征;异常检测模块912用于根据所述目标客户的子图特征以及资金流向异常检测模型,获得所述目标客户的资金流向检测结果;其中,所述资金流向异常检测模型是基于资金流向异常检测训练数据以及对应的标签训练获得的;确定模块913用于在获知所述目标客户的资金流向检测结果为资金流向异常之后,确定所述目标客户为风险客户。
图16是本发明第十六实施例提供的基于知识图谱的贷款风险识别装置的结构示意图,如图16所示,在上述各实施例的基础上,进一步地,本发明实施例提供的基于知识图谱的贷款风险识别装置还包括:
第三获取模块914用于从贷款客户知识图谱中获取具有资金流向关系的各个三元组数据;构造模块915用于根据具有资金流向关系的各个三元组数据中的各个头实体构造第三预设数量的子图特征,作为所述资金流向异常检测训练数据,并获得所述第三预设数量的子图特征中每个子图特征对应的标签;第二训练模块916用于根据第三初始模型、所述资金流向异常检测训练数据包括的各个子图特征以及对应的标签,训练获得所述资金流向异常检测模型。
本发明实施例提供的装置的实施例具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
图17是本发明第十七实施例提供的电子设备的实体结构示意图,如图17所示,该电子设备可以包括:处理器(processor)1701、通信接口(Communications Interface)1702、存储器(memory)1703和通信总线1704,其中,处理器1701,通信接口1702,存储器1703通过通信总线1704完成相互间的通信。处理器1701可以调用存储器1703中的逻辑指令,以执行如下方法:从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;其中,所述目标客户为风险客户,所述贷款客户知识图谱是预先建立的;根据各个第一三元组数据,获得每个第一三元组数据对应的向量;根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果;其中,所述风险预测模型是基于三元组风险训练数据以及对应的标签训练获得的。
此外,上述的存储器1503中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,当所述计算机程序被处理器执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;其中,所述目标客户为风险客户,所述贷款客户知识图谱是预先建立的;根据各个第一三元组数据,获得每个第一三元组数据对应的向量;根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果;其中,所述风险预测模型是基于三元组风险训练数据以及对应的标签训练获得的。
本实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行上述各方法实施例所提供的方法,例如包括:从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;其中,所述目标客户为风险客户,所述贷款客户知识图谱是预先建立的;根据各个第一三元组数据,获得每个第一三元组数据对应的向量;根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果;其中,所述风险预测模型是基于三元组风险训练数据以及对应的标签训练获得的。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在本说明书的描述中,参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (19)

1.一种基于知识图谱的贷款风险识别方法,其特征在于,包括:
从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;其中,所述目标客户为风险客户,所述贷款客户知识图谱是预先建立的;
根据各个第一三元组数据,获得每个第一三元组数据对应的向量;
根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果;其中,所述风险预测模型是基于三元组风险训练数据以及对应的标签训练获得的。
2.根据权利要求1所述的方法,其特征在于,所述根据各个第一三元组数据,获得每个第一三元组数据对应的向量包括:
根据每个第一三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得每个第一三元组数据的头实体对应的向量和尾实体对应的向量;其中,所述向量映射模型是基于实体的风险相关属性信息和对应的标签训练获得的;
根据每个第一三元组数据的头实体对应的向量和尾实体对应的向量、每个第一三元组数据包括的头实体和尾实体的关系以及关系向量映射模型,获得每个第一三元组数据的头实体和尾实体关系对应的向量;其中,所述关系向量映射模型是基于实体关系训练数据以及对应的标签训练获得的;
根据每个第一三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量,获得每个第一三元组数据对应的向量。
3.根据权利要求2所述的方法,其特征在于,基于实体的风险相关属性信息和对应的标签训练获得向量映射模型的步骤包括:
从贷款客户知识图谱中获取第一预设数量个实体的风险相关属性信息,并获取所述第一预设数量个实体中每个实体的公司类型作为对应的标签;
根据第一初始模型、所述第一预设数量个实体的风险相关属性信息以及对应的标签,训练获得所述向量映射模型。
4.根据权利要求2所述的方法,其特征在于,基于实体关系训练数据以及对应的标签训练获得关系向量映射模型的步骤包括:
从贷款客户知识图谱中获取第四预设数量的关系训练三元组数据;
根据每个关系训练三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得每个关系训练三元组数据的头实体对应的向量和尾实体对应的向量;
获取每个关系训练三元组数据的头实体和尾实体关系以及对应的标签,并将各个关系训练三元组数据的头实体对应的向量、尾实体对应的向量、头实体和尾实体关系以及对应的标签作为实体关系训练数据;
根据第二初始模型、所述第四预设数量的关系训练三元组数据的头实体对应的向量、尾实体对应的向量、头实体和尾实体关系以及对应的标签,训练获得所述关系向量映射模型。
5.根据权利要求1所述的方法,其特征在于,基于三元组风险训练数据以及对应的标签训练获得风险预测模型的步骤包括:
从贷款客户知识图谱中抽取第二预设数量的三元组数据作为三元组风险训练数据,并获取每个三元组数据中尾实体对应的风险等级作为每个三元组数据对应的标签;
根据所述三元组风险训练数据包括的每个三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得所述三元组风险训练数据中每个三元组数据的头实体对应的向量和尾实体对应的向量;
根据所述三元组风险训练数据中每个三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量,获得所述三元组风险训练数据中每个三元组数据对应的向量;
根据第二初始模型、所述三元组风险训练数据中每个三元组数据对应的向量以及对应的标签,训练获得所述风险预测模型。
6.根据权利要求1所述的方法,其特征在于,预先建立所述贷款客户知识图谱的步骤包括:
基于初始三元组数据构建初始贷款客户知识图谱;其中,所述初始三元组数据是通过贷款相关数据抽取获得的;
对所述初始贷款客户知识图谱进行共指消解,获得所述贷款客户知识图谱。
7.根据权利要求1至6任一项所述的方法,其特征在于,确定所述目标客户为风险客户的步骤包括:
从贷款客户知识图谱中获取所述目标客户作为头实体并且具有资金流向关系的各个第二三元组数据;
根据所述目标客户的各个第二三元组数据,获得所述目标客户的子图特征;
根据所述目标客户的子图特征以及资金流向异常检测模型,获得所述目标客户的资金流向检测结果;其中,所述资金流向异常检测模型是基于资金流向异常检测训练数据以及对应的标签训练获得的;
若获知所述目标客户的资金流向检测结果为资金流向异常,则确定所述目标客户为风险客户。
8.根据权利要求7所述的方法,其特征在于,基于资金流向异常检测训练数据以及对应的标签训练获得所述资金流向异常检测模型的步骤包括:
从贷款客户知识图谱中获取具有资金流向关系的各个三元组数据;
根据具有资金流向关系的各个三元组数据中的各个头实体构造第三预设数量的子图特征,作为所述资金流向异常检测训练数据,并获得所述第三预设数量的子图特征中每个子图特征对应的标签;
根据第三初始模型、所述资金流向异常检测训练数据包括的各个子图特征以及对应的标签,训练获得所述资金流向异常检测模型。
9.一种基于知识图谱的贷款风险识别装置,其特征在于,包括:
第一获取模块,用于从贷款客户知识图谱中获取目标客户作为头实体的各个第一三元组数据;其中,所述目标客户为风险客户,所述贷款客户知识图谱是预先建立的;
第一获得模块,用于根据各个第一三元组数据,获得每个第一三元组数据对应的向量;
预测模块,用于根据每个第一三元组数据对应的向量以及风险预测模型,获得每个第一三元组数据中尾实体对应的客户的风险预测结果;其中,所述风险预测模型是基于三元组风险训练数据以及对应的标签训练获得的。
10.根据权利要求9所述的装置,其特征在于,所述第一获得模块包括:
第一获得单元,用于根据每个第一三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得每个第一三元组数据的头实体对应的向量和尾实体对应的向量;其中,所述向量映射模型是基于实体的风险相关属性信息和对应的标签训练获得的;
第二获得单元,用于根据每个第一三元组数据的头实体对应的向量和尾实体对应的向量、每个第一三元组数据包括的头实体和尾实体的关系以及关系向量映射模型,获得每个第一三元组数据的头实体和尾实体关系对应的向量;其中,所述关系向量映射模型是基于实体关系训练数据以及对应的标签训练获得的;
第三获得单元,用于根据每个第一三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量,获得每个第一三元组数据对应的向量。
11.根据权利要求10所述的装置,其特征在于,所述获得模块还包括:
第一获取单元,用于从贷款客户知识图谱中获取第一预设数量个实体的风险相关属性信息,并获取所述第一预设数量个实体中每个实体的公司类型作为对应的标签;
第一训练单元,用于根据第一初始模型、所述第一预设数量个实体的风险相关属性信息以及对应的标签,训练获得所述向量映射模型。
12.根据权利要求10所述的装置,其特征在于,所述获得模块还包括:
第二获取单元,用于从贷款客户知识图谱中获取第四预设数量的关系训练三元组数据;
第四获得单元,用于根据每个关系训练三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得每个关系训练三元组数据的头实体对应的向量和尾实体对应的向量;
第三获取单元,用于获取每个关系训练三元组数据的头实体和尾实体关系以及对应的标签,并将各个关系训练三元组数据的头实体对应的向量、尾实体对应的向量、头实体和尾实体关系以及对应的标签作为实体关系训练数据;
第二训练单元,用于根据第二初始模型、所述第四预设数量的关系训练三元组数据的头实体对应的向量、尾实体对应的向量、头实体和尾实体关系以及对应的标签,训练获得所述关系向量映射模型。
13.根据权利要求9所述的装置,其特征在于,还包括:
抽取模块,用于从贷款客户知识图谱中抽取第二预设数量的三元组数据作为三元组风险训练数据,并获取每个三元组数据中尾实体对应的风险等级作为每个三元组数据对应的标签;
第二获得模块,用于根据所述三元组风险训练数据包括的每个三元组数据包括的头实体的风险相关属性信息和尾实体的风险相关属性信息以及向量映射模型,获得所述三元组风险训练数据中每个三元组数据的头实体对应的向量和尾实体对应的向量;
第三获得模块,用于根据所述三元组风险训练数据中每个三元组数据的头实体对应的向量和尾实体对应的向量以及头实体和尾实体关系对应的向量,获得所述三元组风险训练数据中每个三元组数据对应的向量;
第一训练模块,用于根据第二初始模型、所述三元组风险训练数据中每个三元组数据对应的向量以及对应的标签,训练获得所述风险预测模型。
14.根据权利要求9所述的装置,其特征在于,还包括:
构建模块,用于基于初始三元组数据构建初始贷款客户知识图谱;其中,所述初始三元组数据是通过贷款相关数据抽取获得的;
消解模块,用于对所述初始贷款客户知识图谱进行共指消解,获得所述贷款客户知识图谱。
15.根据权利要求9至14任一项所述的装置,其特征在于,还包括:
第二获取模块,用于从贷款客户知识图谱中获取所述目标客户作为头实体并且具有资金流向关系的各个第二三元组数据;
第四获得模块,用于根据所述目标客户的各个第二三元组数据,获得所述目标客户的子图特征;
异常检测模块,用于根据所述目标客户的子图特征以及资金流向异常检测模型,获得所述目标客户的资金流向检测结果;其中,所述资金流向异常检测模型是基于资金流向异常检测训练数据以及对应的标签训练获得的;
确定模块,用于在获知所述目标客户的资金流向检测结果为资金流向异常之后,确定所述目标客户为风险客户。
16.根据权利要求15所述的装置,其特征在于,还包括:
第三获取模块,用于从贷款客户知识图谱中获取具有资金流向关系的各个三元组数据;
构造模块,用于根据具有资金流向关系的各个三元组数据中的各个头实体构造第三预设数量的子图特征,作为所述资金流向异常检测训练数据,并获得所述第三预设数量的子图特征中每个子图特征对应的标签;
第二训练模块,用于根据第三初始模型、所述资金流向异常检测训练数据包括的各个子图特征以及对应的标签,训练获得所述资金流向异常检测模型。
17.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。
19.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。
CN202210044242.5A 2022-01-14 2022-01-14 一种基于知识图谱的贷款风险识别方法及装置 Pending CN114387088A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210044242.5A CN114387088A (zh) 2022-01-14 2022-01-14 一种基于知识图谱的贷款风险识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210044242.5A CN114387088A (zh) 2022-01-14 2022-01-14 一种基于知识图谱的贷款风险识别方法及装置

Publications (1)

Publication Number Publication Date
CN114387088A true CN114387088A (zh) 2022-04-22

Family

ID=81200936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210044242.5A Pending CN114387088A (zh) 2022-01-14 2022-01-14 一种基于知识图谱的贷款风险识别方法及装置

Country Status (1)

Country Link
CN (1) CN114387088A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115099680A (zh) * 2022-07-14 2022-09-23 平安科技(深圳)有限公司 风险管理方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115099680A (zh) * 2022-07-14 2022-09-23 平安科技(深圳)有限公司 风险管理方法、装置、设备及存储介质
CN115099680B (zh) * 2022-07-14 2024-02-02 平安科技(深圳)有限公司 风险管理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111784502B (zh) 异常交易账户群体识别方法及装置
EP3989131A1 (en) Method and system for realizing machine learning modeling process
CN111476662A (zh) 反洗钱识别方法及装置
WO2020038100A1 (zh) 一种特征关系推荐方法及装置、一种计算设备及存储介质
CN113836925B (zh) 预训练语言模型的训练方法、装置、电子设备及存储介质
CN111951052B (zh) 基于知识图谱的获取潜在客户方法及装置
CN113221570B (zh) 基于线上问诊信息的处理方法、装置、设备及存储介质
CN113742488A (zh) 基于多任务学习的嵌入式知识图谱补全方法和装置
CN112035676B (zh) 用户操作行为知识图谱构建方法及装置
CN116628228B (zh) 一种rpa流程推荐方法以及计算机可读存储介质
CN112328802A (zh) 数据处理方法、装置和服务器
WO2020019489A1 (zh) 员工离职原因的预测方法及相关装置
CN116307672A (zh) 一种故障诊断方法、装置、电子设备及介质
CN111199421B (zh) 一种基于社交关系的用户推荐方法、装置及电子设备
CN112016850A (zh) 业务评估方法以及装置
CN113904943B (zh) 账号检测方法、装置、电子设备和存储介质
CN114387088A (zh) 一种基于知识图谱的贷款风险识别方法及装置
CN112699245A (zh) 预算管理知识图谱的构建方法、装置及应用方法、装置
CN114445826A (zh) 视觉问答方法、装置、电子设备以及存储介质
CN116578925B (zh) 基于特征画像的行为预测方法、装置及存储介质
CN115115369A (zh) 数据处理方法、装置、设备及存储介质
CN116739408A (zh) 基于数据标签的电网调度安全监控方法、系统及电子设备
CN113724055B (zh) 一种商品属性挖掘方法及装置
CN111291196B (zh) 知识图谱的完善方法及装置、数据处理方法及装置
CN111753548B (zh) 信息获取方法及装置、计算机存储介质、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination