CN112445918A - 一种知识图谱生成方法、装置、电子设备及存储介质 - Google Patents

一种知识图谱生成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112445918A
CN112445918A CN202011364342.3A CN202011364342A CN112445918A CN 112445918 A CN112445918 A CN 112445918A CN 202011364342 A CN202011364342 A CN 202011364342A CN 112445918 A CN112445918 A CN 112445918A
Authority
CN
China
Prior art keywords
entity
relationship
schema
attribute information
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011364342.3A
Other languages
English (en)
Inventor
胡健超
王龙
彭思哲
史超
余利峰
陈魏欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN202011364342.3A priority Critical patent/CN112445918A/zh
Publication of CN112445918A publication Critical patent/CN112445918A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供的一种知识图谱生成方法、装置、电子设备及存储介质,应用于信息技术领域,通过获取目标运维日志;根据预设抽取规则对目标运维日志进行实体抽取,得到实体和实体间的关系;按照实体间的关系对实体进行组合,得到schema;通过抽取模板对目标运维日志进行实体的属性信息的抽取,得到实体的属性信息,其中,抽取模板为根据schema生成的模板;将实体的属性信息添加到schema中,得到目标知识图谱。可以通过抽取模板对目标运维日志进行实体的属性信息的抽取,提高目标知识图谱的生成效率。

Description

一种知识图谱生成方法、装置、电子设备及存储介质
技术领域
本发明涉及信息技术领域,特别是涉及一种知识图谱生成方法、装置、电子设备及存储介质。
背景技术
运维日志为运行人员在对设备或系统进行运行维护过程中,记录的日志文件。通过运维日志得到的知识图谱,可以便于运维人员在设备或系统出现故障时,根据知识图谱进行故障的快速定位和故障原因的快速分析。
然而,在根据运维日志进行知识图谱创建过程中,由于设备或系统中所涉及的问题主体和问题主体间的关系往往较为复杂,因此,在创建知识图谱往往需要消耗人工成本,效率较低。
发明内容
本发明实施例的目的在于提供一种知识图谱生成方法、装置、电子设备及存储介质,以实现提高知识图谱创建效率。具体技术方案如下:
在本申请实施的第一方面,提供了一种知识图谱生成方法,上述方法包括:
获取目标运维日志;
根据预设抽取规则对目标运维日志进行实体抽取,得到实体和实体间的关系;
按照实体间的关系对实体进行组合,得到图谱纲要schema;
通过抽取模板对目标运维日志进行实体的属性信息的抽取,得到实体的属性信息,其中,抽取模板为根据schema生成的模板;
将实体的属性信息添加到schema中,得到目标知识图谱。
可选的,实体包括问题主体、原因定位、解决方案,实体间的关系包括问题主体间的关系、问题主体与原因定位间的关系、原因定位与原因定位间的关系、原因定位与解决方案间的关系;
按照实体间的关系对实体进行组合,得到schema,包括:
按照问题主体间的关系、问题主体与原因定位间的关系、原因定位与原因定位间的关系、原因定位与解决方案间的关系,对问题主体、原因定位、解决方案进行组合,得到schema。
可选的,根据预设抽取规则对目标运维日志进行实体抽取,得到实体和实体间的关系,包括:
通过抽取模板对目标运维日志进行实体的原始问答对和初步筛选信息的抽取,得到实体对应的原始问答对和初步筛选信息。
可选的,将实体的属性信息添加到schema中,得到目标知识图谱,包括:
根据问题主体、原因定位、解决方案之间的关系,将实体的属性信息转化为三元组结构数据;
将三元组结构数据添加到schema中,得到目标知识图谱。
可选的,实体的属性信息包括问题现象和对应的解决方案,方法还包括:
获取当前的问题现象;
根据目标知识图谱查找当前的问题现象对应的解决方案。
在本申请实施的第二方面,提供了一种知识图谱生成装置,上述装置包括:
日志获取模块,用于获取目标运维日志;
实体抽取模块,用于根据预设抽取规则对目标运维日志进行实体抽取,得到实体和实体间的关系;
实体归类模块,用于按照实体间的关系对实体进行组合,得到schema;
属性信息抽取模块,用于通过抽取模板对目标运维日志进行实体的属性信息的抽取,得到实体的属性信息,其中,抽取模板为根据schema生成的模板;
图谱生成模块,用于将实体的属性信息添加到schema中,得到目标知识图谱。
可选的,实体包括问题主体、原因定位、解决方案,实体间的关系包括问题主体间的关系、问题主体与原因定位间的关系、原因定位与原因定位间的关系、原因定位与解决方案间的关系;
实体归类模块,具体用于按照问题主体间的关系、问题主体与原因定位间的关系、原因定位与原因定位间的关系、原因定位与解决方案间的关系,对问题主体、原因定位、解决方案进行组合,得到schema。
可选的,属性信息抽取模块,具体用于通过抽取模板对目标运维日志进行实体的原始问答对和初步筛选信息的抽取,得到实体对应的原始问答对和初步筛选信息。
可选的,图谱生成模块,包括:
结构数据转化子模块,用于根据问题主体、原因定位、解决方案之间的关系,将实体的属性信息转化为三元组结构数据;
结构数据添加子模块,用于将三元组结构数据添加到schema中,得到目标知识图谱。
可选的,实体的属性信息包括问题现象和对应的解决方案,装置还包括:
问题获取模块,用于获取当前的问题现象;
解决方案查找模块,用于根据目标知识图谱查找当前的问题现象对应的解决方案。
在本申请实施的又一方面,一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口、存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的计算机程序时,实现上述任一知识图谱生成方法。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一知识图谱生成方法。
在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一知识图谱生成方法。
本发明实施例有益效果:
本发明实施例提供的一种知识图谱生成方法、装置、电子设备及存储介质,通过获取目标运维日志;根据预设抽取规则对目标运维日志进行实体抽取,得到实体和实体间的关系;按照实体间的关系对实体进行组合,得到schema;通过抽取模板对目标运维日志进行实体的属性信息的抽取,得到实体的属性信息,其中,抽取模板为根据schema生成的模板;将实体的属性信息添加到schema中,得到目标知识图谱。可以根据运维日志中实体和实体间的关系生成schema,并通过将抽取模板抽取到的实体的属性信息添加到schema中,得到目标知识图谱,从而不但可以根据目标运维日志生成对应的目标知识图谱,还可以通过抽取模板对目标运维日志进行实体的属性信息的抽取,提高目标知识图谱的生成效率。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本申请实施例提供的知识图谱生成方法的一种流程示意图;
图2为本申请实施例提供的一种原因定位的实例图;
图3为本申请实施例提供的一种解决方案的实例图;
图4为本申请实施例提供的一种schema的实例图;
图5为本申请实施例提供的事理推理的故障导致关系的实例图;
图6a为本申请实施例提供的抽取模板的第一种原始问答对的实例图;
图6b为本申请实施例提供的抽取模板的第一种初步筛选的实例图;
图6c为本申请实施例提供的抽取模板的第一种问题定位的实例图;
图7a为本申请实施例提供的抽取模板的第二种原始问答对的实例图;
图7b为本申请实施例提供的抽取模板的第二种初步筛选的实例图;
图7c为本申请实施例提供的抽取模板的第二种问题定位的实例图;
图8a为本申请实施例提供的抽取模板的第三种原始问答对的实例图;
图8b为本申请实施例提供的抽取模板的第三种初步筛选的实例图;
图8c为本申请实施例提供的抽取模板的第三种问题定位的实例图;
图9本申请实施例提供的目标知识图谱的实例图;
图10本申请实施例提供的属性信息添加到schema中的流程图;
图11为本申请实施例提供的知识图谱生成方法的另一种流程示意图;
图12为本申请实施例提供的知识图谱生成装置的一种结构示意图;
图13为本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先,进行本申请实施例中可能用到的术语的解释:
知识图谱:一种揭示实体之间关系的语义网络。是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,通过将数据粒度从document(文件)级别降到data(数据)级别,聚合大量知识,从而实现知识的快速响应和推理。通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。
图形数据库:一种NoSQL(Not Only SQL,非关系型数据库)数据库,它应用图形理论存储实体之间的关系信息。例如,社会网络中人与人之间的关系。关系型数据库用于存储“关系型”数据的效果并不好,其查询复杂、缓慢、超出预期,而图形数据库的独特设计恰恰弥补了这个缺陷。
三元组(h,r,t):在知识图谱中是指一组点到点的关系。如:(张三,国籍,中国)。
为了提高图像识别的准确度,本申请实施例提供了一种知识图谱生成方法。
本申请的一个实施例中,上述方法包括:
获取目标运维日志;
根据预设抽取规则对目标运维日志进行实体抽取,得到实体和实体间的关系;
按照实体间的关系对实体进行组合,得到schema(图谱纲要);
通过抽取模板对目标运维日志进行实体的属性信息的抽取,得到实体的属性信息,其中,抽取模板为根据schema生成的模板;
将实体的属性信息添加到schema中,得到目标知识图谱。
应用本申请实施例提供的知识图谱生成方法,可以根据运维日志中实体和实体间的关系生成schema,并通过将抽取模板抽取到的实体的属性信息添加到schema中,得到目标知识图谱,从而不但可以根据目标运维日志生成对应的目标知识图谱,还可以通过抽取模板对目标运维日志进行实体的属性信息的抽取,提高目标知识图谱的生成效率。
下面通过具体实施例对本申请实施例提供的知识图谱生成方法方法进行详细说明。
参见图1,图1为本申请实施例提供的知识图谱生成方法的一种流程示意图,包括:
步骤S11,获取目标运维日志。
其中,运维日志可以是运行人员在对设备或系统等维护过程中,根据设备或系统的历史状态信息和历史故障信息等,进行记录或统计得到的运维日志。例如,记录历史故障的故障现象、故障原因和解决方案等。
在本申请实施例中,上述知识图谱生成方法可以通过智能终端来执行,具体的该智能终端可以电脑、服务器等。
步骤S12,根据预设抽取规则对目标运维日志进行实体抽取,得到实体和实体间的关系。
可选的,实体包括问题主体、原因定位、解决方案,实体间的关系包括问题主体间的关系、问题主体与原因定位间的关系、原因定位与原因定位间的关系、原因定位与解决方案间的关系。
问题主体可以包括:主体名称、主体层级、主体类型这3个属性。例如,Spark(计算引擎)的executor(执行器)内存溢出,主体名称是executor,主体层级是spark/executor,主体类型是部件。其中,针对主体类型,由于executor是spark的一部分,因此主体类型是部件,如果主体是spark本身,则主体类型是组件。
原因定位是指问题经过分析排查后得到的问题定位,包括:问题名称、问题主体层级、问题主体类型、故障描述、故障主体、故障主体类型、故障异常描述等属性,参见图2,图2为本申请实施例提供的一种原因定位的实例图。
解决方案是指问题根据定位后得到的具体的解决方案,包括具体方案、方案类型、方案所属主体、方案关键词等属性,参见图3,图3为本申请实施例提供的一种解决方案的实例图。
可选的,步骤S12根据预设抽取规则对目标运维日志进行实体抽取,得到实体和实体间的关系,包括:通过抽取模板对目标运维日志进行实体的原始问答对和初步筛选信息的抽取,得到实体对应的原始问答对和初步筛选信息。
步骤S13,按照实体间的关系对实体进行组合,得到schema。
可选的,步骤S13按照实体间的关系对实体进行组合,得到schema,包括:按照问题主体间的关系、问题主体与原因定位间的关系、原因定位与原因定位间的关系、原因定位与解决方案间的关系,对问题主体、原因定位、解决方案进行组合,得到schema,参见图4,图4为本申请实施例提供的一种schema的实例图。
根据抽取出来的实体,将各个实体联系起来就是关系。具体关系包括:主体关系、存在故障、故障所属、导致关系、解决办法,各具体关系都包括关系名称、关系类型这两个属性。
主体关系指的是问题主体与问题主体之间的关系。如HBase-依赖-Hadoop。
存在故障指的是问题主体和原因定位之间的关系。如HBase-存在故障-HBase写入超时。
故障所属指的是问题主体和原因定位之间的关系。如Spark内存溢出-故障归属-Spark。
导致关系指的是原因定位和原因定位之间的关系。如UDE(UDE协议)索引不可用-导致-UDE查询超时。
解决办法指的是原因定位和解决方案之间的关系。如Spark资源不足-解决方法-增加spark内存。
按照实体间的关系对实体进行组合,得到schema(图谱纲要),通过schema可以表示预设抽取规则,并通过schema可以体现实体、关系以及他们的属性,参见图5,图5为本申请实施例提供的事理推理的故障导致关系的实例图。
步骤S14,通过抽取模板对目标运维日志进行实体的属性信息的抽取,得到实体的属性信息。
其中,抽取模板为根据schema生成的模板,抽取模板中可以包括schema中的项目,如问题主体、原因定位、解决方案,还可以包括其他相关信息,如原始问答对和初步筛选信息等。其中,抽取模板可以为Excel(电子表格软件)的方式,参见附图,图6a为本申请实施例提供的抽取模板的第一种原始问答对的实例图,图6b为本申请实施例提供的抽取模板的第一种初步筛选的实例图,图6c为本申请实施例提供的抽取模板的第一种问题定位的实例图,其中,图6a、图6b、图6c中,对应序号,每一行相对应,例如,图6a中问题标题:节点网络过高,对应图6b中解决办法:排查进程资源使用情况,并对应图6c中问题现象:网络带宽使用率过高。图7a为本申请实施例提供的抽取模板的第二种原始问答对的实例图,图7b为本申请实施例提供的抽取模板的第二种初步筛选的实例图,图7c为本申请实施例提供的抽取模板的第二种问题定位的实例图,其中,图7a、图7b、图7c中每一行相对应,其对应关系与图6a、图6b、图6c相同。图8a为本申请实施例提供的抽取模板的第三种原始问答对的实例图,图8b为本申请实施例提供的抽取模板的第三种初步筛选的实例图,图8c为本申请实施例提供的抽取模板的第三种问题定位的实例图,其中,图8a、图8b、图8c中每一行相对应,其对应关系与图6a、图6b、图6c相同。
步骤S15,将实体的属性信息添加到schema中,得到目标知识图谱。
其中,将实体的属性信息添加到schema中,得到目标知识图谱,可以将上述步骤S14中获取的问题主体、原因定位、解决方案以及其他相关信息等,添加到schema中,得到目标知识图谱。参见图9,图9为本申请实施例提供的目标知识图谱的实例图,图中,圆形所表示的为主体,矩形为原因定位(问题现象),椭圆形为解决方案。
应用本申请实施例提供的知识图谱生成方法,可以根据运维日志中实体和实体间的关系生成schema,并通过将抽取模板抽取到的实体的属性信息添加到schema中,得到目标知识图谱,从而不但可以根据目标运维日志生成对应的目标知识图谱,还可以通过抽取模板对目标运维日志进行实体的属性信息的抽取,提高目标知识图谱的生成效率。
参见图10,图10为本申请实施例提供的将实体的属性信息添加到schema中的流程图,步骤S15将实体的属性信息添加到schema中,得到目标知识图谱,包括:
步骤S151,根据问题主体、原因定位、解决方案之间的关系,将实体的属性信息转化为三元组结构数据。
其中,三元组在知识图谱中是指一组点到点的关系。根据问题主体、原因定位、解决方案之间的关系,将实体的属性信息转化为三元组结构数据,例如,网络异常导致consumer消费数据失败,解决方案为修复网络,可以将网络异常、consumer消费数据失败和修复网络建立关联关系,同时网络异常还会导致kafka服务异常,因此网络异常还可以与kafka服务异常建立关联关系。其中,consumer是kafka的一个部件。
步骤S152,将三元组结构数据添加到schema中,得到目标知识图谱。
数据已经根据模板收集成结构化的信息。根据实体、原因定位、解决方案的各自关系,转换为各种三元组结构,将这些三元组导入到图数据库中。
应用本申请实施例提供的方法,将将实体的属性信息添加到schema中,得到目标知识图谱,通过将实体的属性信息转化为三元组结构数据可以实现多种问题的关联,得到目标知识图谱
参见图11,图11为本申请实施例提供的知识图谱生成方法的另一种流程示意图,实体的属性信息包括问题现象和对应的解决方案,上述方法还包括:
步骤S16,获取当前的问题现象。
其中,获取当前的问题现象,可以是设备或系统在运行过程中,出现异常情况时,获取当前的异常现象,例如内存溢出,硬盘使用率过高等。
步骤S17,根据目标知识图谱查找当前的问题现象对应的解决方案。
根据目标知识图谱查找当前的问题现象对应的解决方案,可以根据上述解决方案对当前的问题进行快速处理,从而实现通过该图谱对上层应用问题快速排查,有效提高问题排查效率。
参见图12,图12为本申请实施例提供的知识图谱生成装置的一种结构示意图,包括:
日志获取模块1201,用于获取目标运维日志;
实体抽取模块1202,用于根据预设抽取规则对目标运维日志进行实体抽取,得到实体和实体间的关系;
实体归类模块1203,用于按照实体间的关系对实体进行组合,得到schema;
属性信息抽取模块1204,用于通过抽取模板对目标运维日志进行实体的属性信息的抽取,得到实体的属性信息,其中,抽取模板为根据schema生成的模板;
图谱生成模块1205,用于将实体的属性信息添加到schema中,得到目标知识图谱。
可选的,实体包括问题主体、原因定位、解决方案,实体间的关系包括问题主体间的关系、问题主体与原因定位间的关系、原因定位与原因定位间的关系、原因定位与解决方案间的关系;
实体归类模块1203,具体用于按照问题主体间的关系、问题主体与原因定位间的关系、原因定位与原因定位间的关系、原因定位与解决方案间的关系,对问题主体、原因定位、解决方案进行组合,得到schema。
可选的,属性信息抽取模块1204,具体用于通过抽取模板对目标运维日志进行实体的原始问答对和初步筛选信息的抽取,得到实体对应的原始问答对和初步筛选信息。
可选的,图谱生成模块1205,包括:
结构数据转化子模块,用于根据问题主体、原因定位、解决方案之间的关系,将实体的属性信息转化为三元组结构数据;
结构数据添加子模块,用于将三元组结构数据添加到schema中,得到目标知识图谱。
可选的,实体的属性信息包括问题现象和对应的解决方案,上述装置还包括:
问题获取模块,用于获取当前的问题现象;
解决方案查找模块,用于根据目标知识图谱查找当前的问题现象对应的解决方案。
应用本申请实施例提供的知识图谱生成装置,可以根据运维日志中实体和实体间的关系生成schema,并通过将抽取模板抽取到的实体的属性信息添加到schema中,得到目标知识图谱,从而不但可以根据目标运维日志生成对应的目标知识图谱,还可以通过抽取模板对目标运维日志进行实体的属性信息的抽取,提高目标知识图谱的生成效率。
本发明实施例还提供了一种电子设备,如图13所示,包括处理器1301、通信接口1302、存储器1303和通信总线1304,其中,处理器1301,通信接口1302,存储器1303通过通信总线1304完成相互间的通信,
存储器1303,用于存放计算机程序;
处理器1301,用于执行存储器1303上所存放的程序时,实现如下步骤:
获取目标运维日志;
根据预设抽取规则对目标运维日志进行实体抽取,得到实体和实体间的关系;
按照实体间的关系对实体进行组合,得到schema;
通过抽取模板对目标运维日志进行实体的属性信息的抽取,得到实体的属性信息,其中,抽取模板为根据schema生成的模板;
将实体的属性信息添加到schema中,得到目标知识图谱。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一知识图谱生成方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一知识图谱生成方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种知识图谱生成方法,其特征在于,所述方法包括:
获取目标运维日志;
根据预设抽取规则对所述目标运维日志进行实体抽取,得到实体和所述实体间的关系;
按照所述实体间的关系对所述实体进行组合,得到图谱纲要schema;
通过抽取模板对所述目标运维日志进行所述实体的属性信息的抽取,得到所述实体的属性信息,其中,所述抽取模板为根据所述schema生成的模板;
将所述实体的属性信息添加到所述schema中,得到目标知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述实体包括问题主体、原因定位、解决方案,所述实体间的关系包括所述问题主体间的关系、所述问题主体与所述原因定位间的关系、所述原因定位与所述原因定位间的关系、所述原因定位与所述解决方案间的关系;
所述按照所述实体间的关系对所述实体进行组合,得到schema,包括:
按照所述问题主体间的关系、所述问题主体与所述原因定位间的关系、所述原因定位与所述原因定位间的关系、所述原因定位与所述解决方案间的关系,对所述问题主体、所述原因定位、所述解决方案进行组合,得到schema。
3.根据权利要求1所述的方法,其特征在于,所述根据预设抽取规则对所述目标运维日志进行实体抽取,得到实体和所述实体间的关系,包括:
通过抽取模板对所述目标运维日志进行所述实体的原始问答对和初步筛选信息的抽取,得到所述实体对应的原始问答对和初步筛选信息。
4.根据权利要求2所述的方法,其特征在于,所述将所述实体的属性信息添加到所述schema中,得到目标知识图谱,包括:
根据所述问题主体、所述原因定位、所述解决方案之间的关系,将所述实体的属性信息转化为三元组结构数据;
将所述三元组结构数据添加到所述schema中,得到所述目标知识图谱。
5.根据权利要求1所述的方法,其特征在于,所述实体的属性信息包括问题现象和对应的解决方案,所述方法还包括:
获取当前的问题现象;
根据所述目标知识图谱查找所述当前的问题现象对应的解决方案。
6.一种知识图谱生成装置,其特征在于,所述装置包括:
日志获取模块,用于获取目标运维日志;
实体抽取模块,用于根据预设抽取规则对所述目标运维日志进行实体抽取,得到实体和所述实体间的关系;
实体归类模块,用于按照所述实体间的关系对所述实体进行组合,得到schema;
属性信息抽取模块,用于通过抽取模板对所述目标运维日志进行所述实体的属性信息的抽取,得到所述实体的属性信息,其中,所述抽取模板为根据所述schema生成的模板;
图谱生成模块,用于将所述实体的属性信息添加到所述schema中,得到目标知识图谱。
7.根据权利要求6所述的装置,其特征在于,所述实体包括问题主体、原因定位、解决方案,所述实体间的关系包括所述问题主体间的关系、所述问题主体与所述原因定位间的关系、所述原因定位与所述原因定位间的关系、所述原因定位与所述解决方案间的关系;
所述实体归类模块,具体用于按照所述问题主体间的关系、所述问题主体与所述原因定位间的关系、所述原因定位与所述原因定位间的关系、所述原因定位与所述解决方案间的关系,对所述问题主体、所述原因定位、所述解决方案进行组合,得到schema。
8.根据权利要求6所述的装置,其特征在于,
所述属性信息抽取模块,具体用于通过抽取模板对所述目标运维日志进行所述实体的原始问答对和初步筛选信息的抽取,得到所述实体对应的原始问答对和初步筛选信息。
9.根据权利要求7所述的装置,其特征在于,所述图谱生成模块,包括:
结构数据转化子模块,用于根据所述问题主体、所述原因定位、所述解决方案之间的关系,将所述实体的属性信息转化为三元组结构数据;
结构数据添加子模块,用于将所述三元组结构数据添加到所述schema中,得到所述目标知识图谱。
10.根据权利要求6所述的装置,其特征在于,所述实体的属性信息包括问题现象和对应的解决方案,所述装置还包括:
问题获取模块,用于获取当前的问题现象;
解决方案查找模块,用于根据所述目标知识图谱查找所述当前的问题现象对应的解决方案。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法步骤。
CN202011364342.3A 2020-11-27 2020-11-27 一种知识图谱生成方法、装置、电子设备及存储介质 Pending CN112445918A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011364342.3A CN112445918A (zh) 2020-11-27 2020-11-27 一种知识图谱生成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011364342.3A CN112445918A (zh) 2020-11-27 2020-11-27 一种知识图谱生成方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112445918A true CN112445918A (zh) 2021-03-05

Family

ID=74738742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011364342.3A Pending CN112445918A (zh) 2020-11-27 2020-11-27 一种知识图谱生成方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112445918A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114117077A (zh) * 2021-12-02 2022-03-01 睿云奇智(重庆)科技有限公司 运维知识图谱构建及运维的方法、装置及计算机设备、存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368468A (zh) * 2017-06-06 2017-11-21 广东广业开元科技有限公司 一种运维知识图谱的生成方法及系统
CN109800671A (zh) * 2018-12-28 2019-05-24 北京市遥感信息研究所 面向目标解译的多源遥感信息知识图谱构建方法和系统
CN110008288A (zh) * 2019-02-19 2019-07-12 武汉烽火技术服务有限公司 用于网络故障分析的知识图谱库的构建方法及其应用
CN110825882A (zh) * 2019-10-09 2020-02-21 西安交通大学 一种基于知识图谱的信息系统管理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368468A (zh) * 2017-06-06 2017-11-21 广东广业开元科技有限公司 一种运维知识图谱的生成方法及系统
CN109800671A (zh) * 2018-12-28 2019-05-24 北京市遥感信息研究所 面向目标解译的多源遥感信息知识图谱构建方法和系统
CN110008288A (zh) * 2019-02-19 2019-07-12 武汉烽火技术服务有限公司 用于网络故障分析的知识图谱库的构建方法及其应用
CN110825882A (zh) * 2019-10-09 2020-02-21 西安交通大学 一种基于知识图谱的信息系统管理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114117077A (zh) * 2021-12-02 2022-03-01 睿云奇智(重庆)科技有限公司 运维知识图谱构建及运维的方法、装置及计算机设备、存储介质

Similar Documents

Publication Publication Date Title
CN110472068B (zh) 基于异构分布式知识图谱的大数据处理方法、设备及介质
CN109388637B (zh) 数据仓库信息处理方法、装置、系统、介质
CN112445875B (zh) 数据关联及检验方法、装置、电子设备及存储介质
CN110347561B (zh) 监控告警方法及终端设备
TWI643076B (zh) 金融非結構化文本分析系統及其方法
US20210240784A1 (en) Method, apparatus and storage medium for searching blockchain data
CN112434024B (zh) 面向关系型数据库的数据字典生成方法、装置、设备及介质
CN109753596B (zh) 用于大规模网络数据采集的信源管理与配置方法和系统
DE102012221251A1 (de) Semantisches und kontextbezogenes Durchsuchen von Wissensspeichern
CN111400288A (zh) 数据质量检查方法及系统
WO2020024898A1 (zh) 用于搜索区块链数据的方法、装置及存储介质
CN110765750B (zh) 报表数据录入方法及终端设备
CN111813951A (zh) 一种基于技术图谱的关键点识别方法
CN114356940A (zh) 电网数据治理平台及方法
CN114840519A (zh) 一种数据打标签的方法、设备及存储介质
CN115118574A (zh) 一种数据处理方法、装置及存储介质
CN107748748A (zh) 水利水电技术标准全文检索系统
CN113297139B (zh) 元数据查询方法、系统及电子设备
CN112445918A (zh) 一种知识图谱生成方法、装置、电子设备及存储介质
CN111984797A (zh) 客户身份识别装置及方法
CN116074183B (zh) 一种基于规则引擎的c3超时分析方法、装置及设备
CN108629012B (zh) 取证数据解析准确性的智能校验方法和系统
CN114356885A (zh) 一种科技服务项目智能匹配方法、存储介质及设备
KR20220071173A (ko) 가상 서버들로부터 대용량 로그 파일들을 프로세싱하는 컴퓨터 시스템 및 방법
CN112487260A (zh) 仪器项目申报评审专家匹配方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination