CN112015916A - 知识图谱的补全方法、装置、服务器和计算机存储介质 - Google Patents

知识图谱的补全方法、装置、服务器和计算机存储介质 Download PDF

Info

Publication number
CN112015916A
CN112015916A CN202010904025.XA CN202010904025A CN112015916A CN 112015916 A CN112015916 A CN 112015916A CN 202010904025 A CN202010904025 A CN 202010904025A CN 112015916 A CN112015916 A CN 112015916A
Authority
CN
China
Prior art keywords
service
knowledge
missing
graph
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010904025.XA
Other languages
English (en)
Other versions
CN112015916B (zh
Inventor
申亚坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202010904025.XA priority Critical patent/CN112015916B/zh
Publication of CN112015916A publication Critical patent/CN112015916A/zh
Application granted granted Critical
Publication of CN112015916B publication Critical patent/CN112015916B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种知识图谱的补全方法、装置、服务器和计算机存储介质,该方法包括,通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务;缺失业务,指代,业务系统中存在对应的业务对象、且对应的业务知识未记录在知识图谱中的业务;从业务系统中获取缺失业务的关联信息;按预设的业务知识模板整合缺失业务的关联信息,得到缺失业务的业务知识;将缺失业务的业务知识补充至知识图谱。本方案通过比对知识图谱记录的业务知识和业务系统已发布的业务确定出缺失业务,然后利用业务系统中缺失业务的关联信息生成缺失业务的业务知识并补充至知识图谱,从而实现知识图谱的自动检测和补全。

Description

知识图谱的补全方法、装置、服务器和计算机存储介质
技术领域
本发明涉及知识图谱技术领域,特别涉及一种知识图谱的补全方法、装置、服务器和计算机存储介质。
背景技术
为了让业务员能够高效地办理业务,目前的银行一般均会构建一个用于存储各类业务知识的知识图谱,知识图谱包括多个相互连接的知识节点,每一个知识节点对应于银行的一项业务的业务知识。业务员要办理目标业务时,可以从知识图谱中检索出目标业务以及与目标业务相关的其他业务的业务知识,从而根据这些业务知识为客户办理目标业务以及相关的其他业务。
随着银行的业务系统的更新,业务系统中会新增各种各样的业务,目前,对于业务系统中新增的业务,一般是依赖于人工的在知识图谱中录入新增业务的业务知识,而无法自动的从业务系统中获得相关信息补充至知识图谱中,而人工输入的方式速度较慢,并且往往不能及时地发现业务系统中的新增业务,时效性也较差。
发明内容
基于上述现有技术的缺点,本申请提供一种知识图谱的补全方法、装置、服务器和计算机存储介质,以提供一种知识图谱的自动补全方案。
本申请第一方面提供一种知识图谱的补全方法,包括:
通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务;其中,所述缺失业务,指代,所述业务系统中存在对应的业务对象、且对应的业务知识未记录在所述知识图谱中的业务;
从所述业务系统中获取所述缺失业务的关联信息;
按预设的业务知识模板整合所述缺失业务的关联信息,得到所述缺失业务的业务知识;
将所述缺失业务的业务知识补充至所述知识图谱。
可选的,所述按预设的业务知识模板整合所述缺失业务的关联信息,得到所述缺失业务的业务知识之前,还包括:
若所述业务系统中未存储所述缺失业务的关联信息,在综合知识库中检索得到所述缺失业务的关联信息。
可选的,所述通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务,包括:
获取所述业务系统中的所有业务对象;
针对每一条所述业务对象,判断所述知识图谱中是否存储所述业务对象对应的业务知识;
针对每一条所述业务对象,若所述知识图谱中未存储所述业务对象对应的业务知识,确定所述业务对象对应的业务为缺失业务。
可选的,所述判断所述知识图谱中是否存储所述业务对象对应的业务知识,包括:
针对所述知识图谱所存储的每一项业务知识,检测所述业务知识的知识正文和所述业务对象的正文属性的相似度是否大于预设的相似阈值;
若所述知识图谱中至少一项业务知识满足对应的知识正文和所述业务对象的正文属性的相似度大于所述相似阈值的条件,则判断出所述知识图谱中存储所述业务对象对应的业务知识;
若所述知识图谱中每一项业务知识均不满足对应的知识正文和所述业务对象的正文属性的相似度大于所述相似阈值的条件,则判断出所述知识图谱中未存储所述业务对象对应的业务的业务知识。
本申请第二方面提供一种知识图谱的补全装置,包括:
比对单元,用于通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务;其中,所述缺失业务,指代,所述业务系统中存在对应的业务对象、且对应的业务知识未记录在所述知识图谱中的业务;
获取单元,用于从所述业务系统中获取所述缺失业务的关联信息;
整合单元,用于按预设的业务知识模板整合所述缺失业务的关联信息,得到所述缺失业务的业务知识;
补充单元,用于将所述缺失业务的业务知识补充至所述知识图谱。
可选的,所述获取单元还用于:
若所述业务系统中未存储所述缺失业务的关联信息,在综合知识库中检索得到所述缺失业务的关联信息。
可选的,所述比对单元通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务时,具体用于:
获取所述业务系统中的所有业务对象;
针对每一条所述业务对象,判断所述知识图谱中是否存储所述业务对象对应的业务知识;
针对每一条所述业务对象,若所述知识图谱中未存储所述业务对象对应的业务知识,确定所述业务对象对应的业务为缺失业务。
可选的,所述比对单元判断所述知识图谱中是否存储所述业务对象对应的业务知识时,具体用于:
针对所述知识图谱所存储的每一项业务知识,检测所述业务知识的知识正文和所述业务对象的正文属性的相似度是否大于预设的相似阈值;
若所述知识图谱中至少一项业务知识满足对应的知识正文和所述业务对象的正文属性的相似度大于所述相似阈值的条件,则判断出所述知识图谱中存储所述业务对象对应的业务知识;
若所述知识图谱中每一项业务知识均不满足对应的知识正文和所述业务对象的正文属性的相似度大于所述相似阈值的条件,则判断出所述知识图谱中未存储所述业务对象对应的业务的业务知识。
本申请第三方面提供一种服务器,包括存储器和处理器;
其中,所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序,具体用于实现本申请第一方面任意一项所提供的知识图谱的补全方法。
本申请第四方面提供一种计算机存储介质,用于存储计算机程序,所述计算机程序被执行时,具体用于实现本申请第一方面任意一项所提供的知识图谱的补全方法。
本申请提供一种知识图谱的补全方法、装置、服务器和计算机存储介质,该方法包括,通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务;缺失业务,指代,业务系统中存在对应的业务对象、且对应的业务知识未记录在知识图谱中的业务;从业务系统中获取缺失业务的关联信息;按预设的业务知识模板整合缺失业务的关联信息,得到缺失业务的业务知识;将缺失业务的业务知识补充至知识图谱。本方案通过比对知识图谱记录的业务知识和业务系统已发布的业务确定出缺失业务,然后利用业务系统中缺失业务的关联信息生成缺失业务的业务知识并补充至知识图谱,从而实现知识图谱的自动检测和补全。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种知识图谱的补全方法的流程图;
图2为本申请实施例提供的一种确定缺失业务的方法的流程图;
图3为本申请实施例提供的一种知识图谱的补全装置;
图4为本申请实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例提供一种知识图谱的补全方法,请参考图1,该方法可以包括以下步骤:
S101、通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务。
其中,缺失业务,指代,业务系统中存在对应的业务对象、且对应的业务知识未记录在知识图谱中的业务。
银行每次要开通一项新的业务时,会针对该业务开发相应的业务子程序,将业务子程序以业务对象的形式上传至业务系统中,业务员为客户办理业务时,调用对应的业务对象,根据程序的指示进行操作,即可为客户办理业务。银行开通的业务具体可以包括,理财产品,投资项目等。
因此,业务系统已发布的业务,也可以理解为,业务系统当前存储的业务对象。
一般的,业务系统中的每一个业务对象,对应于银行所开通的一项业务,同时,知识图谱中会有该业务对应的一个知识节点,这个知识节点用于存储对应业务的业务知识。一项业务的业务知识,具体可以由知识目录、知识标题、知识正文、关联知识、分行标签、客户类型标签以及管理属性等信息组成。
其中,知识目录用于表示该业务知识所属的目录,例如,若一项业务是银行的一种理财产品,那么该业务的业务知识就位于公共信息-金融产品目录下,知识正文则涵盖该业务知识的详细内容,例如对应的业务的概况,办理规范,办理流程等,分行标签表示该业务知识适用于哪些分行,客户类型则用于表示该业务知识适用于个人客户还是适用于企业客户。
S102、从业务系统中获取缺失业务的关联信息。
一项业务可以对应有多种关联信息,在执行步骤S102时,若发现业务系统中未存储有缺失业务的部分关联信息,可以在银行的综合知识库中检索这部分缺失业务的关联信息,然后在步骤S103中,将从业务系统获取的关联信息,和从综合知识库检索得到的关联信息一并整合为缺失业务的业务知识。
缺失业务的关联知识,可以是,业务系统中,缺失业务对应的业务对象的各种属性的属性值。
S103、按预设的业务知识模板整合缺失业务的关联信息,得到缺失业务的业务知识。
业务知识模板,可以用下述表1表示:
表1
标签 内容
知识目录
知识标题
分行标签
客户标签
知识正文
步骤S103,可以理解为,将步骤S102中获取到的缺失业务的关联信息,对应的填写至上述表1的内容栏,填写完成后,上述表1就成为缺失业务对应的业务知识。
S104、将缺失业务的业务知识补充至知识图谱。
具体的,将缺失业务的业务知识补充至知识图谱,可以包括,在知识图谱中新建一个用于存储缺失业务的业务知识的知识节点。
知识图谱可以认为是一个计算机程序,而知识节点则可以认为是知识图谱这一计算机程序所定义一种数据结构。
创建了知识节点后,就可以将缺失业务的业务知识存储至这个新增的知识节点中。
存储完成后,需要进一步确定知识图谱中原本存储的业务知识,和本次新增的缺失业务的业务知识之间的关系,具体来说,就是确定缺失业务的业务知识和知识图谱中原有的哪些业务知识相关,然后在缺失业务的业务知识对应的知识节点,和那些相关的业务知识的知识节点之间建立对应的连接关系,以便后续使用知识图谱时可以根据连接关系方便地找到相关的业务知识。
执行步骤S101时,首先可以分别统计知识图谱中知识节点的数量,以及业务系统当前存储的业务对象的数量,若知识节点的数量少于业务系统中业务对象的数量,则可以初步判断出知识图谱中缺失了某一项或者某几项业务的业务知识,也就是判断出有至少一项缺失业务。
其中,知识图谱中缺失部分业务的业务知识的原因,可以是,对知识图谱进行维护时,暂时删除了某些业务对应的知识节点,并且维护结束后未恢复这些知识节点,也可以是,银行新开通了一项业务,并在业务系统中发布了对应的业务对象,但是还未在知识图谱中更新新增的业务的知识节点。
在初步判断出存在缺失业务的情况下,可以通过执行下述如图2所示的方法确定出具体的缺失业务:
S201、获取业务系统中的所有业务对象。
S202、针对每一个业务对象,判断知识图谱中是否存储该业务对象对应的业务知识。
S203、针对每一条业务对象,若知识图谱中未存储业务对象对应的业务知识,确定业务对象对应的业务为缺失业务。
针对上述方法具体说明如下:
获取业务系统中当前存储的所有业务对象。
针对获取的每一个业务对象,判断知识图谱中是否存储有该业务对象对应的业务知识,换言之,就是遍历知识图谱中当前存在的每一个知识节点,直至找到一个知识节点,满足该知识节点存储的业务知识是这个业务对象对应的业务的业务知识为止。
针对任意一个业务对象,若知识图谱中存在至少一个知识节点,满足上述条件,则判断出这个业务对象对应的业务不是缺失业务。
反之,若业务系统中的某一个业务对象,知识图谱中的每一个知识节点均为存储有该业务对象对应的业务的业务知识,则判断出该业务对象对应的业务是缺失业务。
如前文所述,一个知识节点所存储的业务知识,具体包括知识目录、知识标题、知识正文、关联知识、分行标签、客户类型标签以及管理属性等信息,其中的每一种信息均对应于对应的业务的一种属性,因此,要确定一个知识节点中的业务知识是否为业务系统中某一业务对象对应的业务知识,可以针对该业务知识包含的每一种信息,计算该信息和业务对象对应的属性的属性值的相似度,最后将计算得到的每一种相似度按预设的权重计算得到一个加权平均值,将这个加权平均值确定为知识图谱中业务知识和业务系统中的业务对象的整体相似度。
若整体相似度大于预设的阈值,则判断出该业务知识是业务对象对应的业务知识,也就是说,若一个业务知识和一个业务对象的整体相似度大于阈值,则可以判断出这个业务知识和这个业务对象对应的银行的同一业务。
反之,若整体相似度小于或等于阈值,则判断出业务知识和业务对象对应的业务不同。
下面结合一个具体的例子进行说明:
针对业务系统中的一个业务对象X,和知识图谱中的某个知识节点所存储的一条业务知识Y,首先计算业务知识Y和业务对象X的目录相似度,也就是将业务知识Y的知识目录,和业务对象X在业务系统中所属的目录进行比对,得到目录相似度。
之后,分别将业务对象X适用的分行和客户类型,和业务知识Y的分行标签和客户标签进行比对,得到有业务知识Y和业务对象X之间的分行相似度和客户相似度。
另外,还可以将业务知识Y的知识正文,和业务系统中录入的业务对象X的办理过程,以及相关的文字介绍进行比对,得到业务知识Y和业务对象X之间的正文相似度。
最后,将上述目录相似度,分行相似度,客户相似度和正文相似度进行加权平均,得到的加权平均值就是业务对象X和业务知识Y之间的整体相似度,若业务对象X和业务对象Y之间的整体相似度小于或等于预设的阈值,则判断出业务对象X和业务知识Y对应的业务不相同,也就是判断出业务知识Y不是业务对象X对应的业务知识。
反之,若业务对象X和业务知识Y之间的整体相似度大于上述阈值,则判断出业务知识Y,是业务对象X所对应的业务知识。
步骤S102中缺失业务的关联信息的获取方法可以是:
在业务系统的数据库中,以缺失业务的业务名称作为关键字,检索得到数据库中所有与缺失业务的业务名称相关的信息,然后从检索得到的信息中根据业务知识模板分别提取出缺失业务对应的属性值。
如前文所述,缺失业务的关联信息既可以从业务系统中获取,也可以从知识库中获取。例如,可以分别从业务系统中获取缺失业务所属的业务大类,并且从知识库中获取缺失业务的业务场景,然后将业务大类和业务场景拼接得到缺失业务的业务知识的知识目录。
另外,对于缺失业务对应的业务知识的知识正文,可以分别在业务系统的数据库,和知识库中,根据信息之间的关联关系检索得到和缺失业务的业务名称相关的信息,然后从这些信息中删除无效信息,将剩余的有效信息作为缺失业务对应的业务知识的知识正文。
可选的,当从业务系统和知识库中均无法获得缺失业务完整的业务知识时,第一方面可以向办理过缺失业务的每一个业务员的工作终端发送提示信息,以提示业务员手动补充相关的信息。
第二方面,若最近一段时间内有客户办理过缺失业务,则可以读取最近一段时间内的所有办理缺失业务的业务办理记录,从这些业务办理记录中提取出缺失业务的业务知识。
可选的,在获得缺失业务的业务知识之后,执行步骤S104之前,可以将生成的缺失业务的业务知识发送至对应的审核终端,以触发审核终端的审核人员对业务知识的正确性进行审核,在审核通过后才将缺失业务的业务知识补充至知识图谱中。
可选的,在发送至审核终端进行人工审核之前,还可以对缺失业务的业务知识进行自动审核,具体包括识别缺失业务的业务知识中是否有错别字,以及进行语法检测,判断缺失业务的业务知识中是否有语法错误,若有则对出现语法错误的位置进行标注,以提示审核人员进行进一步的核对。另外,还可以对缺失业务的业务知识进行数据清洗,以删除其中的重复内容。
本申请实施例所提供的知识图谱的补全方法,可以通过比对业务系统中业务对象的属性,和知识图谱中各个业务知识的内容,自动的检测出知识图谱相对于业务系统的缺失业务,并从业务系统和知识库中获取缺失业务的关联信息,根据缺失业务的关联信息生成缺失业务的业务知识,最后将缺失业务的业务知识补充至知识图谱中,由此实现知识图谱的自动补全,显著地提高更新知识图谱的效率。
结合本申请实施例提供的知识图谱的补全方法,本申请实施例还提供一种知识图谱的补全装置,请参考图3,该补全装置可以包括以下单元:
比对单元301,用于通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务。
其中,缺失业务,指代,业务系统中存在对应的业务对象、且对应的业务知识未记录在知识图谱中的业务。
获取单元302,用于从业务系统中获取缺失业务的关联信息。
整合单元303,用于按预设的业务知识模板整合缺失业务的关联信息,得到缺失业务的业务知识。
补充单元304,用于将缺失业务的业务知识补充至知识图谱。
获取单元302还用于:
若业务系统中未存储缺失业务的关联信息,在综合知识库中检索得到缺失业务的关联信息。
比对单元301通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务时,具体用于:
获取业务系统中的所有业务对象;
针对每一条业务对象,判断知识图谱中是否存储业务对象对应的业务知识;
针对每一条业务对象,若知识图谱中未存储业务对象对应的业务知识,确定业务对象对应的业务为缺失业务。
比对单元301判断知识图谱中是否存储业务对象对应的业务知识时,具体用于:
针对知识图谱所存储的每一项业务知识,检测业务知识的知识正文和业务对象的正文属性的相似度是否大于预设的相似阈值;
若知识图谱中至少一项业务知识满足对应的知识正文和业务对象的正文属性的相似度大于相似阈值的条件,则判断出知识图谱中存储业务对象对应的业务知识;
若知识图谱中每一项业务知识均不满足对应的知识正文和业务对象的正文属性的相似度大于相似阈值的条件,则判断出知识图谱中未存储业务对象对应的业务的业务知识。
本实施例所提供的知识图谱的补全装置的具体工作原理,可以参考本申请任一实施例所提供的知识图谱的补全方法中的对应步骤,此处不再详述。
本申请提供一种知识图谱的补全装置,包括,比对单元301,用于通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务;缺失业务,指代,业务系统中存在对应的业务办理记录、且对应的业务知识未记录在知识图谱中的业务;获取单元302,用于从业务系统中获取缺失业务的关联信息;整合单元303,用于按预设的业务知识模板整合缺失业务的关联信息,得到缺失业务的业务知识;补充单元304,用于将缺失业务的业务知识补充至知识图谱。本方案通过比对知识图谱记录的业务知识和业务系统已发布的业务确定出缺失业务,然后利用业务系统中缺失业务的关联信息生成缺失业务的业务知识并补充至知识图谱,从而实现知识图谱的自动检测和补全。
本申请实施例还提供一种服务器,如图4所示,该服务器包括存储器401和处理器402,。
其中,存储器401用于存储计算机程序。
处理器402用于执行计算机程序,具体用于实现本申请任一实施例提供的知识图谱的补全方法。
本申请实施例还提供一种计算机存储介质,用于存储计算机程序,计算机程序被执行时,具体用于实现本申请任一实施例所提供的知识图谱的补全方法。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
需要注意,本发明中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种知识图谱的补全方法,其特征在于,包括:
通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务;其中,所述缺失业务,指代,所述业务系统中存在对应的业务对象、且对应的业务知识未记录在所述知识图谱中的业务;
从所述业务系统中获取所述缺失业务的关联信息;
按预设的业务知识模板整合所述缺失业务的关联信息,得到所述缺失业务的业务知识;
将所述缺失业务的业务知识补充至所述知识图谱。
2.根据权利要求1所述的补全方法,其特征在于,所述按预设的业务知识模板整合所述缺失业务的关联信息,得到所述缺失业务的业务知识之前,还包括:
若所述业务系统中未存储所述缺失业务的关联信息,在综合知识库中检索得到所述缺失业务的关联信息。
3.根据权利要求1所述的补全方法,其特征在于,所述通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务,包括:
获取所述业务系统中的所有业务对象;
针对每一条所述业务对象,判断所述知识图谱中是否存储所述业务对象对应的业务知识;
针对每一条所述业务对象,若所述知识图谱中未存储所述业务对象对应的业务知识,确定所述业务对象对应的业务为缺失业务。
4.根据权利要求3所述的补全方法,其特征在于,所述判断所述知识图谱中是否存储所述业务对象对应的业务知识,包括:
针对所述知识图谱所存储的每一项业务知识,检测所述业务知识的知识正文和所述业务对象的正文属性的相似度是否大于预设的相似阈值;
若所述知识图谱中至少一项业务知识满足对应的知识正文和所述业务对象的正文属性的相似度大于所述相似阈值的条件,则判断出所述知识图谱中存储所述业务对象对应的业务知识;
若所述知识图谱中每一项业务知识均不满足对应的知识正文和所述业务对象的正文属性的相似度大于所述相似阈值的条件,则判断出所述知识图谱中未存储所述业务对象对应的业务的业务知识。
5.一种知识图谱的补全装置,其特征在于,包括:
比对单元,用于通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务;其中,所述缺失业务,指代,所述业务系统中存在对应的业务对象、且对应的业务知识未记录在所述知识图谱中的业务;
获取单元,用于从所述业务系统中获取所述缺失业务的关联信息;
整合单元,用于按预设的业务知识模板整合所述缺失业务的关联信息,得到所述缺失业务的业务知识;
补充单元,用于将所述缺失业务的业务知识补充至所述知识图谱。
6.根据权利要求5所述的补全装置,其特征在于,所述获取单元还用于:
若所述业务系统中未存储所述缺失业务的关联信息,在综合知识库中检索得到所述缺失业务的关联信息。
7.根据权利要求5所述的补全装置,其特征在于,所述比对单元通过比对知识图谱当前记录的业务知识和业务系统已发布的业务,确定出缺失业务时,具体用于:
获取所述业务系统中的所有业务对象;
针对每一条所述业务对象,判断所述知识图谱中是否存储所述业务对象对应的业务知识;
针对每一条所述业务对象,若所述知识图谱中未存储所述业务对象对应的业务知识,确定所述业务对象对应的业务为缺失业务。
8.根据权利要求7所述的补全装置,其特征在于,所述比对单元判断所述知识图谱中是否存储所述业务对象对应的业务知识时,具体用于:
针对所述知识图谱所存储的每一项业务知识,检测所述业务知识的知识正文和所述业务对象的正文属性的相似度是否大于预设的相似阈值;
若所述知识图谱中至少一项业务知识满足对应的知识正文和所述业务对象的正文属性的相似度大于所述相似阈值的条件,则判断出所述知识图谱中存储所述业务对象对应的业务知识;
若所述知识图谱中每一项业务知识均不满足对应的知识正文和所述业务对象的正文属性的相似度大于所述相似阈值的条件,则判断出所述知识图谱中未存储所述业务对象对应的业务的业务知识。
9.一种服务器,其特征在于,包括存储器和处理器;
其中,所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序,具体用于实现如权利要求1至4任意一项所述的知识图谱的补全方法。
10.一种计算机存储介质,其特征在于,用于存储计算机程序,所述计算机程序被执行时,具体用于实现如权利要求1至4任意一项所述的知识图谱的补全方法。
CN202010904025.XA 2020-09-01 2020-09-01 知识图谱的补全方法、装置、服务器和计算机存储介质 Active CN112015916B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010904025.XA CN112015916B (zh) 2020-09-01 2020-09-01 知识图谱的补全方法、装置、服务器和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010904025.XA CN112015916B (zh) 2020-09-01 2020-09-01 知识图谱的补全方法、装置、服务器和计算机存储介质

Publications (2)

Publication Number Publication Date
CN112015916A true CN112015916A (zh) 2020-12-01
CN112015916B CN112015916B (zh) 2023-07-21

Family

ID=73516592

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010904025.XA Active CN112015916B (zh) 2020-09-01 2020-09-01 知识图谱的补全方法、装置、服务器和计算机存储介质

Country Status (1)

Country Link
CN (1) CN112015916B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077873A (zh) * 2021-05-06 2021-07-06 井颐医疗信息技术(杭州)有限公司 一种中医临床决策支持系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241290A (zh) * 2017-07-10 2019-01-18 华东师范大学 一种知识图谱补全方法、装置与存储介质
CN110659396A (zh) * 2019-08-14 2020-01-07 平安科技(深圳)有限公司 缺失属性信息补全方法、装置、计算机设备和存储介质
CN110928963A (zh) * 2019-11-28 2020-03-27 西安理工大学 针对运维业务数据表的列级权限知识图谱构建方法
CN111026874A (zh) * 2019-11-22 2020-04-17 海信集团有限公司 知识图谱的数据处理方法及服务器
CN111552811A (zh) * 2020-04-24 2020-08-18 深圳数联天下智能科技有限公司 知识图谱中信息补全的方法、装置、计算机设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241290A (zh) * 2017-07-10 2019-01-18 华东师范大学 一种知识图谱补全方法、装置与存储介质
CN110659396A (zh) * 2019-08-14 2020-01-07 平安科技(深圳)有限公司 缺失属性信息补全方法、装置、计算机设备和存储介质
CN111026874A (zh) * 2019-11-22 2020-04-17 海信集团有限公司 知识图谱的数据处理方法及服务器
CN110928963A (zh) * 2019-11-28 2020-03-27 西安理工大学 针对运维业务数据表的列级权限知识图谱构建方法
CN111552811A (zh) * 2020-04-24 2020-08-18 深圳数联天下智能科技有限公司 知识图谱中信息补全的方法、装置、计算机设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077873A (zh) * 2021-05-06 2021-07-06 井颐医疗信息技术(杭州)有限公司 一种中医临床决策支持系统及方法
CN113077873B (zh) * 2021-05-06 2022-11-22 井颐医疗信息技术(杭州)有限公司 一种中医临床决策支持系统及方法

Also Published As

Publication number Publication date
CN112015916B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
CN106126630B (zh) 一种业务对象的收藏、搜索方法和装置
CN111459985B (zh) 标识信息处理方法及装置
US7921330B2 (en) Data migration manager
US7324998B2 (en) Document search methods and systems
US7702609B2 (en) Adapting to inexact user input
US8965858B2 (en) Methods and systems for automated processing of fallout orders
CN104737187A (zh) 将进口数据和/或出口数据与公司标识符关联的系统及过程
CN111553137B (zh) 报告生成方法、装置、存储介质及计算机设备
CN110990403A (zh) 业务数据的存储方法、系统、计算机设备及存储介质
WO2007081666A2 (en) Relationship data management
CN112463800A (zh) 数据读取方法、装置、服务器及存储介质
CN112581252A (zh) 融合多维相似度与规则集合的地址模糊匹配方法及系统
CN111143370B (zh) 用于分析多个数据表之间关系的方法、设备和计算机可读存储介质
CN109636303B (zh) 一种半自动提取和结构化文档信息的存储方法及系统
CN111191153A (zh) 一种信息技术咨询服务展示装置
CN112015916B (zh) 知识图谱的补全方法、装置、服务器和计算机存储介质
CN113128218A (zh) 一种关于招标信息的关键字段提取方法及装置
CN114090634A (zh) 一种基于数据仓库的酒店数据管理方法及装置
US8515987B1 (en) Database information consolidation
CN104573098B (zh) 基于Spark系统的大规模对象识别方法
CN114416848A (zh) 基于数据仓库的数据血缘关系处理方法及装置
CN114860879A (zh) 数据关联方法、装置、设备及计算机存储介质
US20070226085A1 (en) System and method for automated mapping of data in a multi-valued data structure
KR20020043993A (ko) 패턴정보를 이용한 상품정보 추출 장치 및 방법
CN113792081A (zh) 一种自动化进行数据资产盘点的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant