CN118132656A - 知识图谱构建方法、装置、计算机设备和存储介质 - Google Patents
知识图谱构建方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN118132656A CN118132656A CN202410150886.1A CN202410150886A CN118132656A CN 118132656 A CN118132656 A CN 118132656A CN 202410150886 A CN202410150886 A CN 202410150886A CN 118132656 A CN118132656 A CN 118132656A
- Authority
- CN
- China
- Prior art keywords
- entities
- base
- target knowledge
- knowledge graph
- relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 37
- 238000011161 development Methods 0.000 claims abstract description 46
- 238000006243 chemical reaction Methods 0.000 claims abstract description 43
- 238000000034 method Methods 0.000 claims abstract description 43
- 238000004590 computer program Methods 0.000 claims description 37
- 238000012360 testing method Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 17
- 238000011056 performance test Methods 0.000 claims description 16
- 238000012216 screening Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Stored Programmes (AREA)
Abstract
本申请涉及一种知识图谱构建方法、装置、计算机设备和存储介质,涉及大数据技术领域。所述方法包括:获取开发应用的目标知识库,对所述目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系,所述实体为程序或者由程序处理的数据;对所述实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度;基于所述相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。采用本方法能够提升开发应用相关操作的便利性。
Description
技术领域
本申请涉及大数据技术领域,特别是涉及一种知识图谱构建方法、装置、计算机设备和存储介质。
背景技术
开发应用的开发过程会产生较多数据,但数据均离散分布于各个系统中,不便于后续查看开发应用的相关信息或者对开发应用进行测试时的数据调取。
传统技术中开发应用的数据零散,存在因数据未整合带来的开发应用相关操作不便利的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升开发应用相关操作便利性的知识图谱构建方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种知识图谱构建方法,包括:
获取开发应用的目标知识库,对所述目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系,所述实体为程序或者由程序处理的数据;
对所述实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度;
基于所述相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。
在其中一个实施例中,对所述目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系,包括:
对所述目标知识库进行实体抽取,得到多个实体;
针对每两个实体,在所述目标知识库中,基于所述每两个实体进行关系抽取或者属性抽取中的至少一项,得到所述每两个实体之间的程序运行关系。
在其中一个实施例中,所述目标知识库包括代码调用链路库、服务信息库、业务功能清单库、表统计信息库、测试案例库和性能测试脚本库中的至少两项;所述方法还包括:
在所述目标知识库为所述代码调用链路库的情况下,所述程序运行关系为调用;
在所述目标知识库为所述测试案例库的情况下,所述程序运行关系为挂接;
在所述目标知识库为所述服务信息库、所述业务功能清单库、所述表统计信息库或者所述性能测试脚本库中的任意一项的情况下,所述程序运行关系为从属的属性。
在其中一个实施例中,所述知识图谱中包含多个三元组,所述三元组是由每两个实体以及每两个实体之间的程序运行关系构成的;所述方法还包括:
在获得知识图谱后,对所述多个三元组进行置信度计算,去除置信度低于预设阈值的三元组,得到调整后的知识图谱。
在其中一个实施例中,所述方法还包括:
将所述调整后的知识图谱存储在指定数据库中;
在接收到搜索指令后,基于所述搜索指令和所述查阅引用关系,从所述指定数据库中筛选出相应的三元组并进行展示。
在其中一个实施例中,所述方法还包括:
在所述开发应用存在新增实体或者新增程序运行关系的情况下,对所述新增实体进行数据格式转换;
利用数据格式转换后的新增实体或者所述新增程序运行关系对知识图谱进行更新。
第二方面,本申请还提供了一种知识图谱构建装置,包括:
抽取模块,用于获取开发应用的目标知识库,对所述目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系,所述实体为程序或者由程序处理的数据;
格式转换模块,用于对所述实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度;
图谱获得模块,用于基于所述相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法的步骤。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任一方法的步骤。
上述知识图谱构建方法、装置、计算机设备和存储介质,通过获取开发应用的目标知识库,对目标知识库进行抽取,得到多个实体即程序或者由程序处理的数据、以及不同实体之间的程序运行关系,对实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度,基于相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。相比于传统技术中存在的因数据未整合带来的开发应用相关操作不便利问题而言,本申请针对开发应用的每一目标知识库,抽取实体和程序运行关系,首先建立每一目标知识库中的实体之间的关系,然后根据实体的相似度建立不同目标知识库之间的查阅引用关系,获得的知识图谱将不同目标知识库中的实体建立关系连接,对不同目标知识库中的数据整合,便于对开发应用进行相关操作。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中提供的知识图谱构建方法的流程示意图;
图2为一个实施例中对目标知识库进行抽取的流程示意图;
图3为一个实施例中搜索应用的流程示意图;
图4为一个实施例中对知识图谱进行更新的流程示意图;
图5为本申请实施例中提供的一种知识图谱构建装置的结构框图;
图6为本申请实施例中提供的一种计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本实施例中,提供的一种知识图谱构建方法,本实施例以该方法应用于计算机设备进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括计算机设备和服务器的系统,并通过计算机设备和服务器的交互实现。
图1为本申请实施例中提供的知识图谱构建方法的流程示意图,该方法应用于计算机设备中,在一个实施例中,如图1所示,包括以下步骤:
S101,获取开发应用的目标知识库,对目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系,实体为程序或者由程序处理的数据。
其中,开发应用为商业银行内开发的相关应用。目标知识库为开发开发应用的过程中某一类数据存储的数据库。目标知识库中的数据类型为结构化数据。
S102,对实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度。
在一些实施例中,对实体进行数据格式转换包括对语法进行调整或者对数据进行调整。示例性地,对语法进行调整的一种方式为将语法统一以JAVA类名_方法名的方式来进行表示;对数据进行调整的一种方式为全部移除头/尾部空格,并统一大小写。
S103,基于相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。
其中,查阅引用关系为相似度较大的不同实体之间建立起的关系。确定来自不同目标知识库的不同实体之间的查阅引用关系,即可以根据某一目标知识库中的实体链接到另一目标知识库中的实体,从而建立起每两个目标知识库之间的联系。
本实施例提供的知识图谱构建方法,通过获取开发应用的目标知识库,对目标知识库进行抽取,得到多个实体即程序或者由程序处理的数据、以及不同实体之间的程序运行关系,对实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度,基于相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。相比于传统技术中存在的因数据未整合带来的开发应用相关操作不便利问题而言,本实施例针对开发应用的每一目标知识库,抽取实体和程序运行关系,首先建立每一目标知识库中的实体之间的关系,然后根据实体的相似度建立不同目标知识库之间的查阅引用关系,获得的知识图谱将不同目标知识库中的实体建立关系连接,对不同目标知识库中的数据整合,便于对开发应用进行相关操作。
在一个实施例中,对目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系。具体的,对目标知识库进行抽取的流程示意图,如图2所示,包括以下内容:
S201,对目标知识库进行实体抽取,得到多个实体。
其中,实体抽取又称命名实体识别(Named Entities Recognition,NER),主要任务是识别命名实体的文本范围。实体抽取可采用序列标注、指针标注或者矩阵标注,具体不作限定。
S202,针对每两个实体,在目标知识库中,基于每两个实体进行关系抽取或者属性抽取中的至少一项,得到每两个实体之间的程序运行关系。
其中,关系抽取为若有两个存在着关系的实体,可将两个实体分别作为主体和客体,在目标知识库的结构化数据中找出主体与客体之间存在的关系。属性抽取为从目标知识库中抽取出实体的属性以及属性值。
在本实施例中,首先对目标知识库进行实体抽取,确定出实体后再进行关系抽取或者属性抽取,能够更加快速准确地得到实体之间的程序运行关系。
在一个实施例中,目标知识库包括代码调用链路库、服务信息库、业务功能清单库、表统计信息库、测试案例库和性能测试脚本库中的至少两项;该知识图谱构建方法还包括:
在目标知识库为代码调用链路库的情况下,程序运行关系为调用;
在目标知识库为测试案例库的情况下,程序运行关系为挂接;
在目标知识库为服务信息库、业务功能清单库、表统计信息库或者性能测试脚本库中的任意一项的情况下,程序运行关系为从属的属性。
具体的,针对每一目标知识库设定的程序运行关系如下表1所示。
表1:
在本实施例中,明确设定针对各目标知识库中的实体抽取类型以及程序运行关系类型,能够提高知识图谱的构建效率。
在一个实施例中,知识图谱中包含多个三元组,三元组是由每两个实体以及每两个实体之间的程序运行关系构成的;该知识图谱构建方法还包括:
在获得知识图谱后,对多个三元组进行置信度计算,去除置信度低于预设阈值的三元组,得到调整后的知识图谱。
具体的,三元组的表现形式为“实体-程序运行关系-实体”。
在本实施例中,去除置信度低于预设阈值的三元组,得到的调整后的知识图谱的数据有效性更高。
在一个实施例中,该知识图谱构建方法还包括对知识图谱进行搜索应用。具体的,搜索应用的流程示意图,如图3所示,包括以下内容:
S301,将调整后的知识图谱存储在指定数据库中。
其中,指定数据库可以为高性能图数据库Neo4j。
S302,在接收到搜索指令后,基于搜索指令和查阅引用关系,从指定数据库中筛选出相应的三元组并进行展示。
示例性地,测试人员需对开发应用进行测试,则通过在搜索栏输入程序名作为搜索指令,基于该搜索指令可得到与该程序名相关的三元组。
在本实施例中,解决了传统技术中测试开发应用需依赖开发人员和测试人员对开发应用的熟悉程序和工作经验导致的不便利问题,能够通过知识图谱快速得到想要的相关数据,提升了开发应用相关操作的便利性。
在一个实施例中,该知识图谱构建方法还包括对知识图谱进行更新。具体的,对知识图谱进行更新的流程示意图,如图4所示,包括以下内容:
S401,在开发应用存在新增实体或者新增程序运行关系的情况下,对新增实体进行数据格式转换。
应当理解的是,对新增实体进行数据格式转换的方式与步骤S102中的对实体进行数据格式转换的方式应保持一致。
S402,利用数据格式转换后的新增实体或者新增程序运行关系对知识图谱进行更新。
在本实施例中,基于新增实体和新增程序运行关系对知识图谱进行更新,能够避免数据遗漏,使得知识图谱实用性更强。
在这里,以一具体实施例的方式对本申请提供的知识图谱构建方法进行说明。以目标知识库包括代码调用链路库、服务信息库、业务功能清单库、表统计信息库、测试案例库和性能测试脚本库为例,该知识图谱构建方法的具体实施流程为:
首先,设定在目标知识库为代码调用链路库的情况下,三元组为“类方法名-调用-类方法名”或者“类方法名-调用-表名”;在目标知识库为服务信息库的情况下,三元组为“服务-从属的属性-接口方法名”;在目标知识库为业务功能清单库的情况下,三元组为“功能-从属的属性-入口程序名”;在目标知识库为表统计信息库的情况下,三元组为“表-从属的属性-行数据量”;在目标知识库为测试案例库的情况下,三元组为“测试案例-挂接-服务名”;在目标知识库为性能测试脚本库的情况下,三元组为“脚本-从属的属性-接口方法名”。
获取开发应用的目标知识库,按照设定对目标知识库进行实体抽取、关系抽取和属性抽取,得到三元组“实体-程序运行关系-实体”,对实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度,基于相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱,对多个三元组进行置信度计算,去除置信度低于预设阈值的三元组,得到调整后的知识图谱,将调整后的知识图谱存储在指定数据库中,在接收到搜索指令后,基于搜索指令和查阅引用关系,从指定数据库中筛选出相应的三元组并进行展示。并且在开发应用存在新增实体或者新增程序运行关系的情况下,对新增实体进行数据格式转换,利用数据格式转换后的新增实体或者新增程序运行关系对知识图谱进行更新。
本实施例提供的知识图谱构建方法,能够提供简便的可视化的数据检索能力,以便于让测试人员在开展开发应用评估工作或者其他人员对开发应用进行相关操作时快速获取与开发应用相关数据,能够提升工作效率,提升了开发应用相关操作便利性。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的知识图谱构建方法的知识图谱构建装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个知识图谱构建装置实施例中的具体限定可以参见上文中对于知识图谱构建方法的限定,在此不再赘述。
参见图5,图5为本申请实施例中提供的一种知识图谱构建装置的结构框图,该装置500包括:抽取模块501、格式转换模块502和图谱获得模块503,其中:
抽取模块501,用于获取开发应用的目标知识库,对目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系,实体为程序或者由程序处理的数据;
格式转换模块502,用于对实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度;
图谱获得模块503,用于基于相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。
本实施例提供的知识图谱构建装置,通过抽取模块获取开发应用的目标知识库,对目标知识库进行抽取,得到多个实体即程序或者由程序处理的数据、以及不同实体之间的程序运行关系,通过格式转换模块对实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度,通过图谱获得模块,基于相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。相比于传统技术中存在的因数据未整合带来的开发应用相关操作不便利问题而言,本实施例针对开发应用的每一目标知识库,抽取实体和程序运行关系,首先建立每一目标知识库中的实体之间的关系,然后根据实体的相似度建立不同目标知识库之间的查阅引用关系,获得的知识图谱将不同目标知识库中的实体建立关系连接,对不同目标知识库中的数据整合,便于对开发应用进行相关操作。
可选的,抽取模块501包括:
实体抽取单元,用于对目标知识库进行实体抽取,得到多个实体;
关系确定单元,用于针对每两个实体,在目标知识库中,基于每两个实体进行关系抽取或者属性抽取中的至少一项,得到每两个实体之间的程序运行关系。
可选的,目标知识库包括代码调用链路库、服务信息库、业务功能清单库、表统计信息库、测试案例库和性能测试脚本库中的至少两项;该装置500还包括:
第一关系预设模块,用于在目标知识库为代码调用链路库的情况下,程序运行关系为调用;
第二关系预设模块,用于在目标知识库为测试案例库的情况下,程序运行关系为挂接;
第三关系预设模块,用于在目标知识库为服务信息库、业务功能清单库、表统计信息库或者性能测试脚本库中的任意一项的情况下,程序运行关系为从属的属性。
可选的,知识图谱中包含多个三元组,三元组是由每两个实体以及每两个实体之间的程序运行关系构成的;该装置500还包括:
图谱调整模块,用于在获得知识图谱后,对多个三元组进行置信度计算,去除置信度低于预设阈值的三元组,得到调整后的知识图谱。
可选的,该装置500还包括:
存储模块,用于将调整后的知识图谱存储在指定数据库中;
筛选模块,用于在接收到搜索指令后,基于搜索指令和查阅引用关系,从指定数据库中筛选出相应的三元组并进行展示。
可选的,该装置500还包括:
新增模块,用于在开发应用存在新增实体或者新增程序运行关系的情况下,对新增实体进行数据格式转换;
图谱更新模块,用于利用数据格式转换后的新增实体或者新增程序运行关系对知识图谱进行更新。
上述知识图谱构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种知识图谱构建方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述实施例提供的知识图谱构建方法的步骤:
获取开发应用的目标知识库,对目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系,实体为程序或者由程序处理的数据;
对实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度;
基于相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对目标知识库进行实体抽取,得到多个实体;
针对每两个实体,在目标知识库中,基于每两个实体进行关系抽取或者属性抽取中的至少一项,得到每两个实体之间的程序运行关系。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
目标知识库包括代码调用链路库、服务信息库、业务功能清单库、表统计信息库、测试案例库和性能测试脚本库中的至少两项;
在目标知识库为代码调用链路库的情况下,程序运行关系为调用;
在目标知识库为测试案例库的情况下,程序运行关系为挂接;
在目标知识库为服务信息库、业务功能清单库、表统计信息库或者性能测试脚本库中的任意一项的情况下,程序运行关系为从属的属性。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
知识图谱中包含多个三元组,三元组是由每两个实体以及每两个实体之间的程序运行关系构成的;
在获得知识图谱后,对多个三元组进行置信度计算,去除置信度低于预设阈值的三元组,得到调整后的知识图谱。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将调整后的知识图谱存储在指定数据库中;
在接收到搜索指令后,基于搜索指令和查阅引用关系,从指定数据库中筛选出相应的三元组并进行展示。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
在开发应用存在新增实体或者新增程序运行关系的情况下,对新增实体进行数据格式转换;
利用数据格式转换后的新增实体或者新增程序运行关系对知识图谱进行更新。
上述实施例的实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例提供的知识图谱构建方法的步骤:
获取开发应用的目标知识库,对目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系,实体为程序或者由程序处理的数据;
对实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度;
基于相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对目标知识库进行实体抽取,得到多个实体;
针对每两个实体,在目标知识库中,基于每两个实体进行关系抽取或者属性抽取中的至少一项,得到每两个实体之间的程序运行关系。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
目标知识库包括代码调用链路库、服务信息库、业务功能清单库、表统计信息库、测试案例库和性能测试脚本库中的至少两项;
在目标知识库为代码调用链路库的情况下,程序运行关系为调用;
在目标知识库为测试案例库的情况下,程序运行关系为挂接;
在目标知识库为服务信息库、业务功能清单库、表统计信息库或者性能测试脚本库中的任意一项的情况下,程序运行关系为从属的属性。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
知识图谱中包含多个三元组,三元组是由每两个实体以及每两个实体之间的程序运行关系构成的;
在获得知识图谱后,对多个三元组进行置信度计算,去除置信度低于预设阈值的三元组,得到调整后的知识图谱。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将调整后的知识图谱存储在指定数据库中;
在接收到搜索指令后,基于搜索指令和查阅引用关系,从指定数据库中筛选出相应的三元组并进行展示。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
在开发应用存在新增实体或者新增程序运行关系的情况下,对新增实体进行数据格式转换;
利用数据格式转换后的新增实体或者新增程序运行关系对知识图谱进行更新。
上述实施例的实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述实施例提供的知识图谱构建方法的步骤:
获取开发应用的目标知识库,对目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系,实体为程序或者由程序处理的数据;
对实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度;
基于相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对目标知识库进行实体抽取,得到多个实体;
针对每两个实体,在目标知识库中,基于每两个实体进行关系抽取或者属性抽取中的至少一项,得到每两个实体之间的程序运行关系。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
目标知识库包括代码调用链路库、服务信息库、业务功能清单库、表统计信息库、测试案例库和性能测试脚本库中的至少两项;
在目标知识库为代码调用链路库的情况下,程序运行关系为调用;
在目标知识库为测试案例库的情况下,程序运行关系为挂接;
在目标知识库为服务信息库、业务功能清单库、表统计信息库或者性能测试脚本库中的任意一项的情况下,程序运行关系为从属的属性。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
知识图谱中包含多个三元组,三元组是由每两个实体以及每两个实体之间的程序运行关系构成的;
在获得知识图谱后,对多个三元组进行置信度计算,去除置信度低于预设阈值的三元组,得到调整后的知识图谱。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将调整后的知识图谱存储在指定数据库中;
在接收到搜索指令后,基于搜索指令和查阅引用关系,从指定数据库中筛选出相应的三元组并进行展示。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
在开发应用存在新增实体或者新增程序运行关系的情况下,对新增实体进行数据格式转换;
利用数据格式转换后的新增实体或者新增程序运行关系对知识图谱进行更新。
上述实施例的实现原理和技术效果与上述方法实施例类似,在此不再赘述。
需要说明的是,本申请所涉及的数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种知识图谱构建方法,其特征在于,所述方法包括:
获取开发应用的目标知识库,对所述目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系,所述实体为程序或者由程序处理的数据;
对所述实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度;
基于所述相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。
2.根据权利要求1所述的方法,其特征在于,对所述目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系,包括:
对所述目标知识库进行实体抽取,得到多个实体;
针对每两个实体,在所述目标知识库中,基于所述每两个实体进行关系抽取或者属性抽取中的至少一项,得到所述每两个实体之间的程序运行关系。
3.根据权利要求1所述的方法,其特征在于,所述目标知识库包括代码调用链路库、服务信息库、业务功能清单库、表统计信息库、测试案例库和性能测试脚本库中的至少两项;所述方法还包括:
在所述目标知识库为所述代码调用链路库的情况下,所述程序运行关系为调用;
在所述目标知识库为所述测试案例库的情况下,所述程序运行关系为挂接;
在所述目标知识库为所述服务信息库、所述业务功能清单库、所述表统计信息库或者所述性能测试脚本库中的任意一项的情况下,所述程序运行关系为从属的属性。
4.根据权利要求1所述的方法,其特征在于,所述知识图谱中包含多个三元组,所述三元组是由每两个实体以及每两个实体之间的程序运行关系构成的;所述方法还包括:
在获得知识图谱后,对所述多个三元组进行置信度计算,去除置信度低于预设阈值的三元组,得到调整后的知识图谱。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
将所述调整后的知识图谱存储在指定数据库中;
在接收到搜索指令后,基于所述搜索指令和所述查阅引用关系,从所述指定数据库中筛选出相应的三元组并进行展示。
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述方法还包括:
在所述开发应用存在新增实体或者新增程序运行关系的情况下,对所述新增实体进行数据格式转换;
利用数据格式转换后的新增实体或者所述新增程序运行关系对知识图谱进行更新。
7.一种知识图谱构建装置,其特征在于,所述装置包括:
抽取模块,用于获取开发应用的目标知识库,对所述目标知识库进行抽取,得到多个实体、以及不同实体之间的程序运行关系,所述实体为程序或者由程序处理的数据;
格式转换模块,用于对所述实体进行数据格式转换,计算来自于不同目标知识库的数据格式转换后的实体之间的相似度;
图谱获得模块,用于基于所述相似度,确定来自不同目标知识库的不同实体之间的查阅引用关系,获得知识图谱。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410150886.1A CN118132656A (zh) | 2024-02-02 | 2024-02-02 | 知识图谱构建方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410150886.1A CN118132656A (zh) | 2024-02-02 | 2024-02-02 | 知识图谱构建方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118132656A true CN118132656A (zh) | 2024-06-04 |
Family
ID=91230987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410150886.1A Pending CN118132656A (zh) | 2024-02-02 | 2024-02-02 | 知识图谱构建方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118132656A (zh) |
-
2024
- 2024-02-02 CN CN202410150886.1A patent/CN118132656A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112433712B (zh) | 报表展示方法、装置、计算机设备和存储介质 | |
CN111046237A (zh) | 用户行为数据处理方法、装置、电子设备及可读介质 | |
CN117390011A (zh) | 报表数据处理方法、装置、计算机设备和存储介质 | |
CN116911867A (zh) | 问题处理方法、装置、计算机设备和存储介质 | |
CN116303657A (zh) | 群体画像生成方法、装置、计算机设备和存储介质 | |
CN118132656A (zh) | 知识图谱构建方法、装置、计算机设备和存储介质 | |
CN114547066A (zh) | 核电业务数据的标准化方法、装置和计算机设备 | |
CN117435589A (zh) | 数据转存方法、装置、计算机设备、存储介质 | |
CN116881116A (zh) | 接口测试方法、装置、计算机设备、存储介质和程序产品 | |
CN117370281A (zh) | 数据维护方法、装置、计算机设备和存储介质 | |
CN117453957A (zh) | 资源处理方法、装置、计算机设备和存储介质 | |
CN116775955A (zh) | 数据标签固化方法、装置、计算机设备和存储介质 | |
CN117612192A (zh) | 电子图纸信息识别方法、系统、电子设备、存储介质 | |
CN117435478A (zh) | 程序逻辑功能检测方法、装置、计算机设备和存储介质 | |
CN117667999A (zh) | 数据推送方法、装置、计算机设备及计算机可读存储介质 | |
CN117648336A (zh) | 数据查询方法、装置、计算机设备和存储介质 | |
CN115994250A (zh) | 一种用户行为可视化方法、系统、计算机设备及介质 | |
CN116644096A (zh) | 文件导出方法、装置、计算机设备和存储介质 | |
CN117216425A (zh) | 金融业务页面展示方法、装置、计算机设备和存储介质 | |
CN117370695A (zh) | 页面显示方法、装置、设备、介质和产品 | |
CN115935933A (zh) | 一种清单分析方法、装置、计算机设备和存储介质 | |
CN117130606A (zh) | 前端页面配置方法、装置、计算机设备和存储介质 | |
CN117909550A (zh) | 查询方法、装置、计算机设备和存储介质 | |
CN118155383A (zh) | 预警处理方法、装置、计算机设备和存储介质 | |
CN118860517A (zh) | 业务流配置方法、装置、设备、存储介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |