CN112015909B - 知识图谱的构建方法及装置、电子设备、存储介质 - Google Patents

知识图谱的构建方法及装置、电子设备、存储介质 Download PDF

Info

Publication number
CN112015909B
CN112015909B CN202010838760.5A CN202010838760A CN112015909B CN 112015909 B CN112015909 B CN 112015909B CN 202010838760 A CN202010838760 A CN 202010838760A CN 112015909 B CN112015909 B CN 112015909B
Authority
CN
China
Prior art keywords
service
business
relationship
knowledge graph
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010838760.5A
Other languages
English (en)
Other versions
CN112015909A (zh
Inventor
朱茂盛
王澍轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pross Technology Chongqing Co ltd
Original Assignee
Pross Technology Chongqing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pross Technology Chongqing Co ltd filed Critical Pross Technology Chongqing Co ltd
Priority to CN202010838760.5A priority Critical patent/CN112015909B/zh
Publication of CN112015909A publication Critical patent/CN112015909A/zh
Application granted granted Critical
Publication of CN112015909B publication Critical patent/CN112015909B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书提供一种知识图谱的构建方法及装置、电子设备、存储介质;该方法可以包括:获取针对业务链的原始数据库的知识提取结果,所述知识提取结果包括所述业务链的业务链成员、各个业务链成员之间在时间维度上的业务关系和所述业务关系的关系明细;将所述业务链成员作为实体、所述业务关系作为边以构建知识图谱,并将所述关系明细与相应的边建立关联;其中,在检测到针对所述知识图谱中任一边的触发操作的情况下,与该任一边相关联的关系明细被读取并进行展示。

Description

知识图谱的构建方法及装置、电子设备、存储介质
技术领域
本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及一种知识图谱的构建方法及装置、电子设备、存储介质。
背景技术
随着计算机以及互联网的发展,全球数据总量呈现指数级增长态势,大数据时代也随之到来,大数据是数量巨大、结构复杂、类型众多的数据结构的数据集合,其中的数据反映了客观世界的信息,所以通过对大数据的分析,能够从中获取到大量有用的信息。
知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。
发明内容
有鉴于此,本申请提供一种知识图谱的构建方法及装置、电子设备、存储介质。
为实现上述目的,本申请提供技术方案如下:
根据本申请实施例的第一方面,提出了一种知识图谱的构建方法,包括:
获取针对业务链的原始数据库的知识提取结果,所述知识提取结果包括所述业务链的业务链成员、各个业务链成员之间在时间维度上的业务关系和所述业务关系的关系明细;
将所述业务链成员作为实体、所述业务关系作为边以构建知识图谱,并将所述关系明细与相应的边建立关联;其中,在检测到针对所述知识图谱中任一边的触发操作的情况下,与该任一边相关联的关系明细被读取并进行展示。
可选的,所述业务关系的关系状态包括有效业务状态和失效业务状态;所述将所述业务链成员作为实体、所述业务关系作为边以构建知识图谱,包括:
将处于有效业务状态的第一业务链成员作为实体、所述第一业务链成员的业务关系作为边以构建第一知识图谱;以及,将处于失效业务状态的第二业务链成员作为实体、所述第二业务链成员的业务关系作为边以构建第二知识图谱。
可选的,还包括:
获取所述知识图谱中任一实体对应的目标业务链成员与其他业务链成员之间的目标业务关系,以及所述目标业务链成员的风险评分;
将所述目标业务关系和所述风险评分作为训练集,采用有监督学习算法对所述训练集进行训练得到风险评估模型,所述风险评估模型用于根据任一业务链成员与其他业务链成员之间的业务关系预测该任一业务链成员的风险评分。
可选的,还包括:
确定任一业务链成员与其他业务链成员之间的业务关系在所述知识图谱上呈现出的业务图形;
计算确定出的业务图形与标准业务图形之间的图形相似度,所述标准业务图形对应的业务关系符合预设风控条件;
根据所述图形相似度确定该任一业务链成员的风险评分。
根据本申请实施例的第二方面,提出了一种基于知识图谱的业务展示方法,包括:
展示如上述第一方面所示实施例中任一项所述的知识图谱;
在检测到针对所述知识图谱中任一边的触发操作的情况下,读取与该任一边相关联的业务链成员之间的关系明细;
展示读取到的关系明细。
根据本申请实施例的第三方面,提供一种知识图谱的构建装置,包括:
结果获取单元,获取针对业务链的原始数据库的知识提取结果,所述知识提取结果包括所述业务链的业务链成员、各个业务链成员之间在时间维度上的业务关系和所述业务关系的关系明细;
构建单元,将所述业务链成员作为实体、所述业务关系作为边以构建知识图谱,并将所述关系明细与相应的边建立关联;其中,在检测到针对所述知识图谱中任一边的触发操作的情况下,与该任一边相关联的关系明细被读取并进行展示。
可选的,所述业务关系的关系状态包括有效业务状态和失效业务状态;所述构建单元具体用于:
将处于有效业务状态的第一业务链成员作为实体、所述第一业务链成员的业务关系作为边以构建第一知识图谱;以及,将处于失效业务状态的第二业务链成员作为实体、所述第二业务链成员的业务关系作为边以构建第二知识图谱。
可选的,还包括:
关系获取单元,获取所述知识图谱中任一实体对应的目标业务链成员与其他业务链成员之间的目标业务关系,以及所述目标业务链成员的风险评分;
训练单元,将所述目标业务关系和所述风险评分作为训练集,采用有监督学习算法对所述训练集进行训练得到风险评估模型,所述风险评估模型用于根据任一业务链成员与其他业务链成员之间的业务关系预测该任一业务链成员的风险评分。
可选的,还包括:
确定单元,确定任一业务链成员与其他业务链成员之间的业务关系在所述知识图谱上呈现出的业务图形;
计算单元,计算确定出的业务图形与标准业务图形之间的图形相似度,所述标准业务图形对应的业务关系符合预设风控条件;
评估单元,根据所述图形相似度确定该任一业务链成员的风险评分。
根据本申请实施例的第四方面,提供一种基于知识图谱的业务展示装置,包括:
图谱展示单元,展示如上述第三方面所示实施例中任一项所述的知识图谱;
读取单元,在检测到针对所述知识图谱中任一边的触发操作的情况下,读取与该任一边相关联的业务链成员之间的关系明细;
关系展示单元,展示读取到的关系明细。
根据本申请实施例的第五方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如上述实施例中任一所述的方法。
根据本申请实施例的第六方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如上述实施例中任一所述方法的步骤。
由以上技术方案可见,本申请在将业务链成员作为实体、业务关系作为边来构建知识图谱时,进一步将业务关系的关系明细与相应的边建立关联,从而为知识图谱中的边赋予了触发展示明细的功能。具体而言,用户可通过查看知识图谱来了解业务链中各个业务链成员之间的业务关系(由知识图谱的边来体现),当需要具体了解某一边的关系明细时,用户可通过针对该边实施触发操作来进一步获取关系明细。那么,当用于展示知识图谱的设备在检测到该触发操作后,可获取相关联的关系明细进行展示,进而简化用户操作,提高用户的查看效率。
同时,基于从时间维度上来抽象得到业务关系,可协助用户快速查询当前关注的对象。并且,分别从业务的有效和失效状态来构建知识图谱,可帮助用户将当前业务和历史业务区别开,并可向用户提供历史业务的数据,协助用户根据历史数据来实施风控、回访等操作。
进一步的,基于构建得到的知识图谱可表征业务链成员的业务特征,可利用知识图谱来实施风险评估,从而及时发现业务链成员潜在的业务风险,进而降低损失。
附图说明
图1是一示例性实施例提供的一种知识图谱的构建方法的流程图。
图2是一示例性实施例提供的一种知识图谱的示意图。
图3是一示例性实施例提供的一种风险评估模型的示意图。
图4是一示例性实施例提供的另一种知识图谱的示意图。
图5是一示例性实施例提供的一种电子设备的结构示意图。
图6是一示例性实施例提供的一种知识图谱的构建装置的框图。
图7是一示例性实施例提供的另一种电子设备的结构示意图。
图8是一示例性实施例提供的一种基于知识图谱的业务展示装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参见图1,图1是一示例性实施例提供的一种知识图谱的构建方法的流程图。如图1所示,该方法可应用于任意可用于构建知识图谱的电子设备中,可以包括以下步骤:
步骤102,获取针对业务链的原始数据库的知识提取结果,所述知识提取结果包括所述业务链的业务链成员、各个业务链成员之间在时间维度上的业务关系和所述业务关系的关系明细。
在本实施例中,可由构建知识图谱的电子设备来执行对原始数据库进行知识提取的操作,也可由其他设备来执行该操作得到知识提取结果,进而由构建知识图谱的电子设备从中获取知识提取结果。其中,知识提取面向的是业务链的原始数据库,该业务链包含多个业务链成员,各个业务链成员之间存在一个或多个业务关系。而本说明书旨在提取各个业务链成员之间在时间维度上的业务关系。下面举例进行说明。
本说明书提供的实施例可从数据源头按照时间线索对业务链的原始数据进行抽取加工,从时间维度上抽象得到业务关系。具体而言,可将业务关系按照流水型、阶段型、稳定型来进行分类。
流水型关系为业务事件在发生时产生的关系。例如,供应链中的上下游均通过采购订单来进行关联,那么采购订单是一种流水型关系,只有在采购发生期间,采购参与方之间才存在买卖关系,而在采购完成后,双方的买卖关系即解除。
阶段型关系为需要保持一段时间的业务关系。例如,可定义有效期在3年以下的关系属于阶段型关系;当然,有效期可根据实际需求灵活设定,本说明书并不对此进行限制。比如,授信、担保等业务关系。
稳定型关系为有效期相比于阶段型更长的业务关系。例如,可定义有效期在3年以上的关系属于稳定型关系。比如,股权投资、工商任职等,该关系通常不会轻易变更,即变更的概率较小。
基于上述对业务关系的定义,业务链的原始数据库则是用于记录业务链成员之间在发生业务事件时生成的业务数据。那么,便可对原始数据库进行知识提取,得到业务链的业务链成员、各个业务链成员之间在时间维度上的业务关系和业务关系的关系明细等信息。
而对于知识提取的过程,可通过自动化或者半自动化(人工参与)的技术从原始数据库(包括结构化、半结构化、非结构化数据)中提取出可用的知识单元存入数据层,该知识单元包括实体、业务关系、关系明细等知识要素,从而以此为基础,形成一系列事实表达,为在模式层构建知识图谱奠定基础。
步骤104,将所述业务链成员作为实体、所述业务关系作为边以构建知识图谱,并将所述关系明细与相应的边建立关联;其中,在检测到针对所述知识图谱中任一边的触发操作的情况下,与该任一边相关联的关系明细被读取并进行展示。
在本实施例中,在三元组“实体——关系——实体”的基础上,进一步加入时间维度来对业务链成员之间的业务关系进行梳理,从而可从时间维度分析实体间关系的变化。基于知识图谱的边用于表示各个业务链成员之间在时间维度上的业务关系,可进一步将业务关系的关系明细与用于表示该业务关系的边建立关联。例如,可配置第一数据表用于记录各个业务关系,配置第二数据表用于记录各个业务关系的关系明细,然后通过外键将第一数据表中记录的业务关系与第二数据表记录的关系明细进行关联。通过将业务关系的关系明细与相应的边建立关联,可为知识图谱中的边赋予触发展示明细的功能,以供在展示知识图谱的情况下使用。
例如,在构建得到业务链的知识图谱后,可展示该知识图谱;其中,知识图谱的边可被触发以展示相应的关系明细。因此,在检测到针对知识图谱中任一边的触发操作的情况下,读取与该任一边相关联的业务链成员之间的关系明细,并展示读取到的关系明细以供用户查看。
具体而言,承接于上述举例,用户可通过查看知识图谱来了解业务链中各个业务链成员之间的业务关系(由知识图谱的边来体现),当需要具体了解某一边的关系明细时,用户可通过针对该边实施触发操作(比如鼠标的点击操作)来进一步获取关系明细。那么,当用于展示知识图谱的设备在检测到该触发操作后,可从第二数据表中读取相关联的关系明细进行展示,进而简化用户操作,提高用户的查看效率。
在本实施例中,还可引入实体间关系的时效性,根据时效性对实体间的关系进行区分,从而便于用户分别进行查看。其中,实体间的关系可包含现存关系和历史关系;现存关系为实体间当前存在的业务关系,历史关系为实体间在过去某一时间段内存在的业务关系,当前该业务关系已被解除。因此,可将业务关系的关系状态划分为有效业务状态和失效业务状态,进而针对这两类关系状态分别构建知识图谱。
具体而言,可将处于有效业务状态的第一业务链成员作为实体、所述第一业务链成员的业务关系作为边以构建第一知识图谱;以及,将处于失效业务状态的第二业务链成员作为实体、所述第二业务链成员的业务关系作为边以构建第二知识图谱。可见,第一知识图谱用于展示业务链成员之间当前所处的业务关系(即现存关系),第二知识图谱用于展示业务链成员之间过去曾经存在的业务关系(即历史关系)。那么,可在展示页面分别配置对应于现存关系和历史关系的页面组件,例如可以按钮的形式在页面展示,用户通过勾选来控制展示页面展示现存关系还是历史关系。
举例而言,在底层实现的过程中,流水型关系的数据通过2层结构(比如为数据层和模式层)来进行存储。数据层结构抽象出两个实体之间在时间维度上的业务关系。以商流为例,数据层结构用于记录每个实体之间的商流关系。模式层记录每一笔商流对应的时间、金额、内容等相关明细数据,通过一个外键与数据层记录的业务关系进行关联。
阶段型关系与此类似,不同的是,在记录业务关系的过程中,需要针对业务关系的关系状态打上相应的标签,比如生效标签(表明为有效业务状态)和失效标签(表明为失效业务状态),从而形成本说明书中知识图谱专用的数据表。那么,展示知识图谱的设备可根据标签,在展示层通过逻辑来判断业务关系是现存关系还是历史关系。
而对于稳定型关系,由于该类业务关系相比于流水型和阶段型更为稳定,主要应用于不经常发生变化的场景中,比如工商任职、股权投资等,因此可仅通过知识图谱的实体和边的形式展示;当然,也可按照上述对边赋予触发功能的方式,将边与关系明细进行关联,用户可通过触发边来查看稳定型关系的关系明细。
在本实施例中,数据设计可分为三部分,分别为图数据库设计、ES(Elasticsearch)索引设计和数仓图谱应用层设计。
1)图数据库设计
图数据库用于存储知识图谱中的节点(知识图谱中的实体)和关系,图数据库设计可分为节点设计和关系设计。其中,节点关键字段设计如表1所示:
字段 中文名称 备注
id 主体ID 用于和公司内部企业数据关联。
name 名称 企业名称
entid 企业节点id 用于和外部的企业数据关联
表1关系关键字段设计如表2所示:
表2
2)ES索引设计
ES作为快速索引搜索与数据详情的展示使用,包含两张关键表,分别用于记录节点明细数据和关系明细。具体如表3所示:
表3
3)数仓图谱应用层设计
知识图谱的节点(实体)、业务关系、业务事件等数据在数仓应用层进行汇总加工,再通过脚本导入ES。
为了便于理解,下面结合图2进行说明。请参见图2,图2是一示例性实施例提供的一种知识图谱的示意图。如图2所示,知识图谱的节点(实体)用于表示业务链成员,比如节点20、节点21和节点22等。知识图谱的边用于表示业务链成员之间的业务关系,比如边23用于表示节点20和节点22所代表的业务链成员之间的业务关系。需要说明的是,在构建知识图谱的过程中,涉及信息提取、知识表示、知识融合、知识推理四个过程,上述过程的具体实施细节可参考相关技术中的记载,在此不再赘述。
以流水型关系为例进行说明。流水型关系可应用在供应链三流中,包括商流、物流、资金流。在针对供应链构建出的知识图谱中,三流关系在图中汇总成三条边,用户点击任一边,可以弹出对应的明细。以某一商超为例,该商超向上游供应商采购商品,通过接入商超的ERP(Enterprise Resource Planning,企业资源计划)系统可获取商超的采购订单,对其进行知识提取可得到商流关系,每一笔采购订单即为一个商流明细。类似的,在商超的OMS(order management system,订单管理系统)中记录有商品的物流订单,通过接入OMS可获取商超的物流订单,对其进行知识提取可得到每一笔物流订单的物流明细。类似的,商超的银行流水作为资金流关系的来源,形成每一条资金流关系的明细,通过接入银行系统可获取商超的银行流水,对其进行知识提取可得到资金明细。可见,在构建的知识图谱中,可直观展示哪些实体间存在三流关系,哪些实体在供应链中存在上下游关系。同时,当用户想要进一步了解某一业务关系的关系明细时,通过点击相应的边即可触发设备读取关系明细以在页面进行展示。例如,关系明细可以明细表的形式进行展示,该明细表用于记录两个实体间发生的每一次业务关系,从而业务人员可从知识图谱查看业务链整体的业务关系,还可进一步查看任意两实体间的关系明细。
以阶段型关系为例进行说明。阶段型关系主要应用在授信、用信、担保等金融场景。可进一步把阶段型关系划分为现存关系和历史关系,并在展示页面分别配置对应于现存关系和历史关系的页面组件,例如可以按钮的形式在页面展示,用户通过勾选来控制展示页面展示现存关系还是历史关系。用信和担保的应用场景与此类似。相应的,上述列举的阶段型关系均可通过点击边来展开关系明细。仍以授信关系为例,结合图2进行说明。当检测到针对边23的触发操作时,可读取并展示实体22(代表作为业务链成员的企业)在实体20(代表提供授信的企业)的授信额度。假定业务人员勾选了历史关系,则读取并展示历史上实体22曾经获得的授信额度的明细。进一步的,由于授信和用信之间存在关联,每一笔用信必定关联到唯一一笔授信,所以每一笔授信还能通过再次点击来触发展示该笔授信下所有的用信明细。
举例而言,通过鼠标24点击边23代表的“父授信”之后,可展示如表4所示的父授信关系明细:
表4
其中,a为实体20代表的企业,b为实体22代表的企业。
进一步的,通过鼠标24点击父授信对象,可进一步展示如表5所示的子授信关系明细:
表5
由以上实施例可见,本申请在将业务链成员作为实体、业务关系作为边来构建知识图谱时,进一步将业务关系的关系明细与相应的边建立关联,从而为知识图谱中的边赋予了触发展示明细的功能。具体而言,用户可通过查看知识图谱来了解业务链中各个业务链成员之间的业务关系(由知识图谱的边来体现),当需要具体了解某一边的关系明细时,用户可通过针对该边实施触发操作来进一步获取关系明细。那么,当用于展示知识图谱的设备在检测到该触发操作后,可获取相关联的关系明细进行展示,进而简化用户操作,提高用户的查看效率。
同时,基于从时间维度上来抽象得到业务关系,可协助用户快速查询当前关注的对象。并且,分别从业务的有效和失效状态来构建知识图谱,可帮助用户将当前业务和历史业务区别开,并可向用户提供历史业务的数据,协助用户根据历史数据来实施风控、回访等操作。
进一步的,基于构建得到的知识图谱可表征业务链成员的业务特征,可利用知识图谱来实施风险评估,从而及时发现业务链成员潜在的业务风险,进而降低损失。下面进行详细说明。
在一实施例中,可通过机器学习模型来进行风险评估。具体的,可获取构建得到的知识图谱中任一实体对应的目标业务链成员与其他业务链成员之间的目标业务关系,以及目标业务链成员的风险评分(可由业务人员人工标注,也即样本标签),从而将目标业务关系和风险评分作为训练集,采用有监督学习算法对该训练集进行训练得到风险评估模型。其中,该风险评估模型用于根据任一业务链成员与其他业务链成员之间的业务关系预测该任一业务链成员的风险评分。
针对有监督学习的训练过程,输入的样本数据被称为“训练集”,训练集中的样本数据有一个明确的标识或结果(即样本标签),再利用有监督学习算法建立预测模型时,有监督学习算法建立一个学习过程,将预测结果与“训练集”的实际结果进行比较,不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。有监督学习的常见应用场景包括分类问题、回归问题等,常见算法包括逻辑回归、神经网络、决策树、支持向量机、贝叶斯分类器等等。
如图3所示,基于构建知识图谱得到的业务关系,可利用CNN(ConvolutionalNeural Networks,卷积神经网络)来进行特征提取。具体而言,CNN可包括卷积层、池化层和全连接层。其中,卷积层用于对输入的业务关系进行计算以提取出特征向量;池化层通常位于卷积层之后,一方面降低特征向量的维度以简化网络计算复杂度,另一方面通过池化来降低卷积层输出的特征向量,避免卷积神经网络出现过拟合;全连接层用于将网络学习到的特征向量映射到样本的标记空间中,比如将池化层输出的二维特征向量转化成一维向量。由于业务关系的数量不定,同时同一业务链成员与不同的其他业务链成员之间的业务关系在时序维度上存在关联,因而可将同一业务链成员与不同的其他业务链成员之间的多个业务关系同时作为输入以对神经网络进行训练。例如,利用CNN来提取同一业务链成员涉及的不同业务关系的特征向量,再将其输入至LSTM(Long Short-Term Memory,长短期记忆网络),以由LSTM来处理所有业务关系的特征向量,从而生成最终的分类向量来代表最终该业务链成员的预估风险评分。
在另一实施例中,还可充分利用知识图谱对复杂关系的直观展示,通过知识图谱的整体图形来进行风险评估。具体的,可确定任一业务链成员与其他业务链成员之间的业务关系在构建得到的知识图谱上呈现出的业务图形;然后,计算确定出的业务图形与标准业务图形(标准业务图形对应的业务关系符合预设风控条件)之间的图形相似度,从而根据该图形相似度确定该任一业务链成员的风险评分。
举例而言,图2示出的知识图谱所呈现的业务关系为业务人员通过风险评估判定为符合预设风控条件(比如,风险评分低于风险阈值)的业务关系。那么,可将该知识图谱的整体图形作为标准业务图形。由图2可见,知识图谱的整体图形包含一个或多个中心点,并从中心点向外发散。而对于风险较高的业务链成员,如图4所示,其涉及的业务关系通常呈现出的图形是在某个发散点处形成一个“蜘蛛网”的形状,即多个点之间两两相连。例如,该情况一般是同一个法人、股东、实际控制人,通过多个不同的实体来借钱,或者是通过两个实体间的关联交易来融资,而该类企业存在欺诈的可能性较高,即风险评分较高。
基于上述原理,预先设定一相似度阈值,计算图2示出的知识图谱的整体图形和图4示出的知识图谱的整体图形之间的图形相似度。当计算出的图形相似度低于该相似度阈值时,判定图4示出的知识图谱对应的业务关系不符合预设风控条件。或者,直接将计算出的图形相似度作为风险评分。
与上述方法实施例相对应,本说明书还提供了一种知识图谱的构建装置的实施例。
图5是一示例性实施例提供的一种电子设备的结构示意图。请参考图5,在硬件层面,该设备包括处理器502、内部总线504、网络接口506、内存508以及非易失性存储器510,当然还可能包括其他业务所需要的硬件。处理器502从非易失性存储器510中读取对应的计算机程序到内存708中然后运行,在逻辑层面上形成知识图谱的构建装置。当然,除了软件实现方式之外,本说明书一个或多个实施例并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
请参考图6,在软件实施方式中,该知识图谱的构建装置可以包括:
结果获取单元61,获取针对业务链的原始数据库的知识提取结果,所述知识提取结果包括所述业务链的业务链成员、各个业务链成员之间在时间维度上的业务关系和所述业务关系的关系明细;
构建单元62,将所述业务链成员作为实体、所述业务关系作为边以构建知识图谱,并将所述关系明细与相应的边建立关联;其中,在检测到针对所述知识图谱中任一边的触发操作的情况下,与该任一边相关联的关系明细被读取并进行展示。
可选的,所述业务关系的关系状态包括有效业务状态和失效业务状态;所述构建单元62具体用于:
将处于有效业务状态的第一业务链成员作为实体、所述第一业务链成员的业务关系作为边以构建第一知识图谱;以及,将处于失效业务状态的第二业务链成员作为实体、所述第二业务链成员的业务关系作为边以构建第二知识图谱。
可选的,还包括:
关系获取单元63,获取所述知识图谱中任一实体对应的目标业务链成员与其他业务链成员之间的目标业务关系,以及所述目标业务链成员的风险评分;
训练单元64,将所述目标业务关系和所述风险评分作为训练集,采用有监督学习算法对所述训练集进行训练得到风险评估模型,所述风险评估模型用于根据任一业务链成员与其他业务链成员之间的业务关系预测该任一业务链成员的风险评分。
可选的,还包括:
确定单元65,确定任一业务链成员与其他业务链成员之间的业务关系在所述知识图谱上呈现出的业务图形;
计算单元66,计算确定出的业务图形与标准业务图形之间的图形相似度,所述标准业务图形对应的业务关系符合预设风控条件;
评估单元67,根据所述图形相似度确定该任一业务链成员的风险评分。
图7是一示例性实施例提供的一种电子设备的结构示意图。请参考图7,在硬件层面,该设备包括处理器702、内部总线704、网络接口706、内存708以及非易失性存储器710,当然还可能包括其他业务所需要的硬件。处理器702从非易失性存储器710中读取对应的计算机程序到内存708中然后运行,在逻辑层面上形成基于知识图谱的业务展示装置。当然,除了软件实现方式之外,本说明书一个或多个实施例并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
请参考图8,在软件实施方式中,该基于知识图谱的业务展示装置可以包括:
图谱展示单元81,展示如上述实施例中任一项所述的知识图谱;
读取单元82,在检测到针对所述知识图谱中任一边的触发操作的情况下,读取与该任一边相关联的业务链成员之间的关系明细;
关系展示单元83,展示读取到的关系明细。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
在一个典型的配置中,计算机包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。

Claims (10)

1.一种知识图谱的构建方法,其特征在于,包括:
获取针对业务链的原始数据库的知识提取结果,所述知识提取结果包括所述业务链的业务链成员、各个业务链成员之间在时间维度上的业务关系和所述业务关系的关系明细;
将所述业务链成员作为实体、所述业务关系作为边以构建知识图谱,并将所述关系明细与相应的边建立关联;其中,在检测到针对所述知识图谱中任一边的触发操作的情况下,与该任一边相关联的关系明细被读取并进行展示;
确定任一业务链成员与其他业务链成员之间的业务关系在所述知识图谱上呈现出的业务图形;
计算确定出的业务图形与标准业务图形之间的图形相似度,所述标准业务图形对应的业务关系符合预设风控条件;
根据所述图形相似度确定该任一业务链成员的风险评分。
2.根据权利要求1所述的方法,其特征在于,所述业务关系的关系状态包括有效业务状态和失效业务状态;所述将所述业务链成员作为实体、所述业务关系作为边以构建知识图谱,包括:
将处于有效业务状态的第一业务链成员作为实体、所述第一业务链成员的业务关系作为边以构建第一知识图谱;以及,将处于失效业务状态的第二业务链成员作为实体、所述第二业务链成员的业务关系作为边以构建第二知识图谱。
3.根据权利要求1所述的方法,其特征在于,还包括:
获取所述知识图谱中任一实体对应的目标业务链成员与其他业务链成员之间的目标业务关系,以及所述目标业务链成员的风险评分;
将所述目标业务关系和所述风险评分作为训练集,采用有监督学习算法对所述训练集进行训练得到风险评估模型,所述风险评估模型用于根据任一业务链成员与其他业务链成员之间的业务关系预测该任一业务链成员的风险评分。
4.一种基于知识图谱的业务展示方法,其特征在于,包括:
展示如权利要求1-3中任一项所述的知识图谱;
在检测到针对所述知识图谱中任一边的触发操作的情况下,读取与该任一边相关联的业务链成员之间的关系明细;
展示读取到的关系明细。
5.一种知识图谱的构建装置,其特征在于,包括:
结果获取单元,获取针对业务链的原始数据库的知识提取结果,所述知识提取结果包括所述业务链的业务链成员、各个业务链成员之间在时间维度上的业务关系和所述业务关系的关系明细;
构建单元,将所述业务链成员作为实体、所述业务关系作为边以构建知识图谱,并将所述关系明细与相应的边建立关联;其中,在检测到针对所述知识图谱中任一边的触发操作的情况下,与该任一边相关联的关系明细被读取并进行展示;
确定单元,确定任一业务链成员与其他业务链成员之间的业务关系在所述知识图谱上呈现出的业务图形;
计算单元,计算确定出的业务图形与标准业务图形之间的图形相似度,所述标准业务图形对应的业务关系符合预设风控条件;
评估单元,根据所述图形相似度确定该任一业务链成员的风险评分。
6.根据权利要求5所述的装置,其特征在于,所述业务关系的关系状态包括有效业务状态和失效业务状态;所述构建单元具体用于:
将处于有效业务状态的第一业务链成员作为实体、所述第一业务链成员的业务关系作为边以构建第一知识图谱;以及,将处于失效业务状态的第二业务链成员作为实体、所述第二业务链成员的业务关系作为边以构建第二知识图谱。
7.根据权利要求5所述的装置,其特征在于,还包括:
关系获取单元,获取所述知识图谱中任一实体对应的目标业务链成员与其他业务链成员之间的目标业务关系,以及所述目标业务链成员的风险评分;
训练单元,将所述目标业务关系和所述风险评分作为训练集,采用有监督学习算法对所述训练集进行训练得到风险评估模型,所述风险评估模型用于根据任一业务链成员与其他业务链成员之间的业务关系预测该任一业务链成员的风险评分。
8.一种基于知识图谱的业务展示装置,其特征在于,包括:
图谱展示单元,展示如权利要求5-7中任一项所述的知识图谱;
读取单元,在检测到针对所述知识图谱中任一边的触发操作的情况下,读取与该任一边相关联的业务链成员之间的关系明细;
关系展示单元,展示读取到的关系明细。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求1-4中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1-4中任一项所述方法的步骤。
CN202010838760.5A 2020-08-19 2020-08-19 知识图谱的构建方法及装置、电子设备、存储介质 Active CN112015909B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010838760.5A CN112015909B (zh) 2020-08-19 2020-08-19 知识图谱的构建方法及装置、电子设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010838760.5A CN112015909B (zh) 2020-08-19 2020-08-19 知识图谱的构建方法及装置、电子设备、存储介质

Publications (2)

Publication Number Publication Date
CN112015909A CN112015909A (zh) 2020-12-01
CN112015909B true CN112015909B (zh) 2024-04-30

Family

ID=73505156

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010838760.5A Active CN112015909B (zh) 2020-08-19 2020-08-19 知识图谱的构建方法及装置、电子设备、存储介质

Country Status (1)

Country Link
CN (1) CN112015909B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598489B (zh) * 2020-12-14 2023-12-26 深圳市快付通金融网络科技服务有限公司 基于金融应用的风险监测方法及系统
CN113392229A (zh) * 2021-08-13 2021-09-14 四川新龟科技有限公司 供应链关系构建和预测方法、装置、设备、存储介质
CN113674085A (zh) * 2021-08-19 2021-11-19 支付宝(杭州)信息技术有限公司 一种账户的解限方法、装置及设备
CN117236521A (zh) * 2023-11-10 2023-12-15 中国联合网络通信集团有限公司 产业风险等级预测方法、装置、设备及存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355627A (zh) * 2015-07-16 2017-01-25 中国石油化工股份有限公司 一种用于生成知识图谱的方法及系统
CN108389614A (zh) * 2018-03-02 2018-08-10 西安交通大学 基于图像分割与卷积神经网络构建医学影像图谱的方法
CN108596439A (zh) * 2018-03-29 2018-09-28 北京中兴通网络科技股份有限公司 一种基于知识图谱的企业风险预测方法及系统
CN109523153A (zh) * 2018-11-12 2019-03-26 平安科技(深圳)有限公司 非法集资企业的获取方法、装置、计算机设备和存储介质
CN109657918A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 关联评估对象的风险预警方法、装置和计算机设备
CN109726298A (zh) * 2019-01-08 2019-05-07 上海市研发公共服务平台管理中心 适用于科技文献的知识图谱构建方法、系统、终端及介质
CN110362689A (zh) * 2019-06-21 2019-10-22 深圳壹账通智能科技有限公司 一种风险评估方法、装置、存储介质和服务器
CN110390465A (zh) * 2019-06-18 2019-10-29 深圳壹账通智能科技有限公司 业务数据的风控分析处理方法、装置和计算机设备
CN110489560A (zh) * 2019-06-19 2019-11-22 民生科技有限责任公司 基于知识图谱技术的小微企业画像生成方法及装置
CN110503236A (zh) * 2019-07-08 2019-11-26 中国平安人寿保险股份有限公司 基于知识图谱的风险预测方法、装置、设备以及存储介质
CN110750650A (zh) * 2019-09-30 2020-02-04 中盈优创资讯科技有限公司 企业知识图谱的构建方法及装置
CN111026816A (zh) * 2019-12-09 2020-04-17 重庆锐云科技有限公司 基于知识图谱的高净值客户群识别方法、装置及存储介质
CN111177400A (zh) * 2019-12-05 2020-05-19 国网能源研究院有限公司 基于知识图谱的设备、业务及数据的关联显示方法和装置
CN111209411A (zh) * 2020-01-03 2020-05-29 北京明略软件系统有限公司 一种文档分析的方法及装置
CN111476653A (zh) * 2019-12-24 2020-07-31 马上消费金融股份有限公司 一种风险信息识别、确定、模型训练方法及装置
CN111507543A (zh) * 2020-05-28 2020-08-07 支付宝(杭州)信息技术有限公司 用于预测实体间业务关系的模型训练方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180314756A1 (en) * 2017-04-26 2018-11-01 Linkedln Corporation Online social network member profile taxonomy

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355627A (zh) * 2015-07-16 2017-01-25 中国石油化工股份有限公司 一种用于生成知识图谱的方法及系统
CN108389614A (zh) * 2018-03-02 2018-08-10 西安交通大学 基于图像分割与卷积神经网络构建医学影像图谱的方法
CN108596439A (zh) * 2018-03-29 2018-09-28 北京中兴通网络科技股份有限公司 一种基于知识图谱的企业风险预测方法及系统
CN109523153A (zh) * 2018-11-12 2019-03-26 平安科技(深圳)有限公司 非法集资企业的获取方法、装置、计算机设备和存储介质
CN109657918A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 关联评估对象的风险预警方法、装置和计算机设备
CN109726298A (zh) * 2019-01-08 2019-05-07 上海市研发公共服务平台管理中心 适用于科技文献的知识图谱构建方法、系统、终端及介质
CN110390465A (zh) * 2019-06-18 2019-10-29 深圳壹账通智能科技有限公司 业务数据的风控分析处理方法、装置和计算机设备
CN110489560A (zh) * 2019-06-19 2019-11-22 民生科技有限责任公司 基于知识图谱技术的小微企业画像生成方法及装置
CN110362689A (zh) * 2019-06-21 2019-10-22 深圳壹账通智能科技有限公司 一种风险评估方法、装置、存储介质和服务器
CN110503236A (zh) * 2019-07-08 2019-11-26 中国平安人寿保险股份有限公司 基于知识图谱的风险预测方法、装置、设备以及存储介质
CN110750650A (zh) * 2019-09-30 2020-02-04 中盈优创资讯科技有限公司 企业知识图谱的构建方法及装置
CN111177400A (zh) * 2019-12-05 2020-05-19 国网能源研究院有限公司 基于知识图谱的设备、业务及数据的关联显示方法和装置
CN111026816A (zh) * 2019-12-09 2020-04-17 重庆锐云科技有限公司 基于知识图谱的高净值客户群识别方法、装置及存储介质
CN111476653A (zh) * 2019-12-24 2020-07-31 马上消费金融股份有限公司 一种风险信息识别、确定、模型训练方法及装置
CN111209411A (zh) * 2020-01-03 2020-05-29 北京明略软件系统有限公司 一种文档分析的方法及装置
CN111507543A (zh) * 2020-05-28 2020-08-07 支付宝(杭州)信息技术有限公司 用于预测实体间业务关系的模型训练方法及装置

Also Published As

Publication number Publication date
CN112015909A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
Huang et al. Deep learning in finance and banking: A literature review and classification
Lee et al. Machine learning for enterprises: Applications, algorithm selection, and challenges
CN112015909B (zh) 知识图谱的构建方法及装置、电子设备、存储介质
US20200192894A1 (en) System and method for using data incident based modeling and prediction
Soui et al. Bankruptcy prediction using stacked auto-encoders
Van Thiel et al. Artificial intelligence credit risk prediction: An empirical study of analytical artificial intelligence tools for credit risk prediction in a digital era
Sharaf et al. StockPred: a framework for stock Price prediction
Coenen et al. Machine learning methods for short-term probability of default: A comparison of classification, regression and ranking methods
CN112199510A (zh) 一种欺诈概率确定方法、装置、电子设备及存储介质
US11823026B2 (en) Artificial intelligence system employing graph convolutional networks for analyzing multi-entity-type multi-relational data
Gulsoy et al. A data mining application in credit scoring processes of small and medium enterprises commercial corporate customers
Meoli et al. Machine-learning forecasting of successful ICOs
Zhu et al. Explainable prediction of loan default based on machine learning models
US20240154975A1 (en) Systems and methods for accelerating a disposition of digital dispute events in a machine learning-based digital threat mitigation platform
Li et al. Artificial intelligence applications in finance: a survey
Jacob Non-performing Asset Analysis Using Machine Learning
Paul et al. Artificial intelligence in predictive analysis of insurance and banking
Boz et al. Reassessment and monitoring of loan applications with machine learning
JP2019160089A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Staňková Threshold moving approach with logit models for bankruptcy prediction
Singh Yadav et al. Unsupervised learning for financial statement fraud detection using manta ray foraging based convolutional neural network
Bouzidi et al. LSTM-based automated learning with smart data to improve marketing fraud detection and financial forecasting
Iwai et al. Bayesian Network Oriented Transfer Learning Method for Credit Scoring Model
Elrefai et al. Using artificial intelligence in enhancing banking services
Ghildiyal et al. Analyze of different algorithms of machine learning for loan approval

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant