CN112685434A - 一种基于知识图谱的运维问答方法 - Google Patents
一种基于知识图谱的运维问答方法 Download PDFInfo
- Publication number
- CN112685434A CN112685434A CN202011517454.8A CN202011517454A CN112685434A CN 112685434 A CN112685434 A CN 112685434A CN 202011517454 A CN202011517454 A CN 202011517454A CN 112685434 A CN112685434 A CN 112685434A
- Authority
- CN
- China
- Prior art keywords
- maintenance
- question
- attribute
- relation
- knowledge graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了运维技术领域的一种基于知识图谱的运维问答方法,包括如下步骤:步骤S10、基于神经网络创建一分词模型、一关系类别模型以及一问题类别模型;步骤S20、获取大量的语料,利用所述语料训练分词模型、关系类别模型以及问题类别模型;步骤S30、获取运维历史数据,分别利用所述分词模型、关系类别模型以及问题类别模型提取运维历史数据里的词语、词性、关系表述以及属性表述,利用所述词语、词性、关系表述以及属性表述创建知识图谱;步骤S40、利用所述知识图谱进行运维问答。本发明的优点在于:极大的提升了运维效率。
Description
技术领域
本发明涉及运维技术领域,特别指一种基于知识图谱的运维问答方法。
背景技术
运维是数字世界基础设施级别的技术,随着支撑数字世界的软硬件系统越来越庞大、越来越复杂,运维对智能化的要求越来越高。因此,AIOps(智能运维)正在逐渐的走进人的视野,运维问答系统是AIOps的重要分支,辅助运维人员了解IT业务系统的日志、运维监控,实时状态查看等。
然而,传统的运维问答系统只能基于关键字映射一对应的答案,无法进行全面的展示,运维人员经常得不到满意的答案,需要再深入分析、研究,使得运维的效率低下。因此,如何提供一种基于知识图谱的运维问答方法,实现提升运维效率,成为一个亟待解决的问题。
发明内容
本发明要解决的技术问题,在于提供一种基于知识图谱的运维问答方法,实现提升运维效率。
本发明是这样实现的:一种基于知识图谱的运维问答方法,包括如下步骤:
步骤S10、基于神经网络创建一分词模型、一关系类别模型以及一问题类别模型;
步骤S20、获取大量的语料,利用所述语料训练分词模型、关系类别模型以及问题类别模型;
步骤S30、获取运维历史数据,分别利用所述分词模型、关系类别模型以及问题类别模型提取运维历史数据里的词语、词性、关系表述以及属性表述,利用所述词语、词性、关系表述以及属性表述创建知识图谱;
步骤S40、利用所述知识图谱进行运维问答。
进一步地,所述步骤S20具体包括:
步骤S21、获取大量的语料,人工对所述语料进行词语、词性、关系表述以及属性表述的标注,进而生成分词训练集、关系训练集以及问题训练集;
步骤S22、分别按预设的比例将所述分词训练集、关系训练集以及问题训练集划分为训练集和验证集;
步骤S23、利用各所述训练集分别对分词模型、关系类别模型以及问题类别模型进行训练;
步骤S24、利用各所述验证集分别对分词模型、关系类别模型以及问题类别模型进行验证。
进一步地,所述步骤S30具体包括:
步骤S31、获取运维历史数据,利用所述分词模型提取运维历史数据中的词语和词性,利用所述关系类别模型提取运维历史数据中的关系表述,利用所述问题类别模型提取运维历史数据中的属性表述;
步骤S32、将各所述词语和词性抽取为实体、将各所述关系表述抽取为关系、将各所述属性表述抽取为属性,设定各所述属性对应的属性值;
步骤S33、利用各所述实体、关系、属性以及属性值创建包含实体-关系-实体、实体-属性-属性值,关系-属性-属性值结构的知识图谱。
进一步地,所述步骤S40具体包括:
步骤S41、预设若干个问句模板以及答句模板,设定各所述问句模板和答句模板的关联关系;
步骤S42、获取用户输入的运维问句,对所述运维问句进行预处理后,利用所述分词模型提取词语和词性,并抽取为实体;
步骤S43、利用所述实体查询知识图谱,获取所述实体关联的关系、属性以及属性值,基于所述实体、关系、属性以及属性值生成结构化查询语句;
步骤S44、利用所述结构化查询语句查询问句模板,进而匹配答句模板,生成所述运维问句对应的运维答句。
进一步地,所述步骤S42中,所述对所述运维问句进行预处理具体为:
对所述运维问句进行去除冗余词串以及末尾标点符号的预处理。
进一步地,所述步骤S43具体为:
判断所述实体的个数是否为1个,若是,则直接查询所述知识图谱,获取所述实体关联的关系、属性以及属性值,基于所述实体、关系、属性以及属性值生成结构化查询语句;
若否,则基于最短路径查询所述知识图谱,获取所述实体关联的关系、属性以及属性值,基于所述实体、关系、属性以及属性值生成结构化查询语句。
进一步地,所述步骤S44具体为:
利用所述结构化查询语句查询问句模板,判断是否存在对应的所述问句模板,若是,则利用所述问句模板匹配答句模板,生成所述运维问句对应的运维答句;
若否,则利用VSM算法计算所述结构化查询语句与各问句模板的相似度,选取相似度最高的所述问句模板匹配答句模板,生成所述运维问句对应的运维答句。
进一步地,还包括:
步骤S50、对所述运维问答的日志进行存储。
本发明的优点在于:
通过训练分词模型、关系类别模型以及问题类别模型分别用于提取运维历史数据里的词语、词性、关系表述以及属性表述,再基于词语、词性、关系表述以及属性表述创建知识图谱,最终利用知识图谱进行运维问答,相对于传统上只基于关键字映射对应的答案,能够更为全面的查找关联的数据,能够快速、准确对运维问句进行识别,进而极大的提升了运维效率。
附图说明
下面参照附图结合实施例对本发明作进一步的说明。
图1是本发明一种基于知识图谱的运维问答方法的流程图。
具体实施方式
本申请实施例中的技术方案,总体思路如下:通过训练分词模型、关系类别模型以及问题类别模型分别用于提取运维历史数据里的词语、词性、关系表述以及属性表述,再基于词语、词性、关系表述以及属性表述创建知识图谱,最终利用知识图谱进行运维问答,以提升运维效率。
请参照图1所示,本发明一种基于知识图谱的运维问答方法的较佳实施例,包括如下步骤:
步骤S10、基于神经网络创建一分词模型、一关系类别模型以及一问题类别模型;
步骤S20、获取大量的语料,利用所述语料训练分词模型、关系类别模型以及问题类别模型;
步骤S30、获取运维历史数据,分别利用所述分词模型、关系类别模型以及问题类别模型提取运维历史数据里的词语、词性、关系表述以及属性表述,利用所述词语、词性、关系表述以及属性表述创建知识图谱;知识图谱实际是一种语义网络,关系丰富、相互关联,其节点代表实体(entity),连线代表关系,因此,采用知识图谱可以生成准确而简洁的答案;
步骤S40、利用所述知识图谱进行运维问答。
所述步骤S20具体包括:
步骤S21、获取大量的语料,人工对所述语料进行词语、词性、关系表述以及属性表述的标注,进而生成分词训练集、关系训练集以及问题训练集;
步骤S22、分别按预设的比例将所述分词训练集、关系训练集以及问题训练集划分为训练集和验证集;
步骤S23、利用各所述训练集分别对分词模型、关系类别模型以及问题类别模型进行训练;训练的过程可采用支持向量机;
步骤S24、利用各所述验证集分别对分词模型、关系类别模型以及问题类别模型进行验证。
所述步骤S30具体包括:
步骤S31、获取运维历史数据,利用所述分词模型提取运维历史数据中的词语和词性,利用所述关系类别模型提取运维历史数据中的关系表述,利用所述问题类别模型提取运维历史数据中的属性表述;即利用所述分词模型提取运维历史数据中使用频率最高的词语;
步骤S32、将各所述词语和词性抽取为实体、将各所述关系表述抽取为关系、将各所述属性表述抽取为属性,设定各所述属性对应的属性值;
步骤S33、利用各所述实体、关系、属性以及属性值创建包含实体-关系-实体、实体-属性-属性值,关系-属性-属性值结构的知识图谱。
所述步骤S40具体包括:
步骤S41、预设若干个问句模板以及答句模板,设定各所述问句模板和答句模板的关联关系;
步骤S42、获取用户输入的运维问句,对所述运维问句进行预处理后,利用所述分词模型提取词语和词性,并抽取为实体;
步骤S43、利用所述实体查询知识图谱,获取所述实体关联的关系、属性以及属性值,基于所述实体、关系、属性以及属性值生成结构化查询语句;
步骤S44、利用所述结构化查询语句查询问句模板,进而匹配答句模板,生成所述运维问句对应的运维答句。即实现以自然语言的方式对运维的知识进行查询和问答,极大的提高了运维效率。
所述步骤S42中,所述对所述运维问句进行预处理具体为:
对所述运维问句进行去除冗余词串以及末尾标点符号的预处理。
所述步骤S43具体为:
判断所述实体的个数是否为1个,若是,则直接查询所述知识图谱,获取所述实体关联的关系、属性以及属性值,基于所述实体、关系、属性以及属性值生成结构化查询语句;
若否,则基于最短路径查询所述知识图谱,获取所述实体关联的关系、属性以及属性值,基于所述实体、关系、属性以及属性值生成结构化查询语句。基于最短路径查询所述知识图谱,即查找关系最近的节点,最终能够生成更符合实际需求的运维答句。
所述步骤S44具体为:
利用所述结构化查询语句查询问句模板,判断是否存在对应的所述问句模板,若是,则利用所述问句模板匹配答句模板,生成所述运维问句对应的运维答句;
若否,则利用VSM算法计算所述结构化查询语句与各问句模板的相似度,选取相似度最高的所述问句模板匹配答句模板,生成所述运维问句对应的运维答句。相似度的计算公式为:结构化查询语句与问句模板共同包含的字数/结构化查询语句与问句模板不重复的字数。VSM算法具有计算速度快、匹配精确的优点,进一步提高运维效率。
还包括:
步骤S50、对所述运维问答的日志进行存储,即对所述运维问句、运维答句、过程数据以及用户ID进行存储,便于后期查询相关问题时直接利用,该用户ID再次进行检索时,结合前两次的检索结果,进一步提高运维效率以及质量。
所述运维问句以及运维答句举例如下:
1、机器上10.1.3.105部署了哪些应用?
10.1.3.105部署了pmp、运维监控平台。
2、运维监控平台都运行在那些主机上?
运维监控平台运行在10.1.3.105、10.1.3.106.
3、pmp运行在哪?
10.1.3.105主机上。
4、这个210.31.252.208主机上的维护责任人是谁?
张三
5、单实体查询
10.1.3.105
运行在应用。
综上所述,本发明的优点在于:
通过训练分词模型、关系类别模型以及问题类别模型分别用于提取运维历史数据里的词语、词性、关系表述以及属性表述,再基于词语、词性、关系表述以及属性表述创建知识图谱,最终利用知识图谱进行运维问答,相对于传统上只基于关键字映射对应的答案,能够更为全面的查找关联的数据,能够快速、准确对运维问句进行识别,进而极大的提升了运维效率。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
Claims (8)
1.一种基于知识图谱的运维问答方法,其特征在于:包括如下步骤:
步骤S10、基于神经网络创建一分词模型、一关系类别模型以及一问题类别模型;
步骤S20、获取大量的语料,利用所述语料训练分词模型、关系类别模型以及问题类别模型;
步骤S30、获取运维历史数据,分别利用所述分词模型、关系类别模型以及问题类别模型提取运维历史数据里的词语、词性、关系表述以及属性表述,利用所述词语、词性、关系表述以及属性表述创建知识图谱;
步骤S40、利用所述知识图谱进行运维问答。
2.如权利要求1所述的一种基于知识图谱的运维问答方法,其特征在于:所述步骤S20具体包括:
步骤S21、获取大量的语料,人工对所述语料进行词语、词性、关系表述以及属性表述的标注,进而生成分词训练集、关系训练集以及问题训练集;
步骤S22、分别按预设的比例将所述分词训练集、关系训练集以及问题训练集划分为训练集和验证集;
步骤S23、利用各所述训练集分别对分词模型、关系类别模型以及问题类别模型进行训练;
步骤S24、利用各所述验证集分别对分词模型、关系类别模型以及问题类别模型进行验证。
3.如权利要求1所述的一种基于知识图谱的运维问答方法,其特征在于:所述步骤S30具体包括:
步骤S31、获取运维历史数据,利用所述分词模型提取运维历史数据中的词语和词性,利用所述关系类别模型提取运维历史数据中的关系表述,利用所述问题类别模型提取运维历史数据中的属性表述;
步骤S32、将各所述词语和词性抽取为实体、将各所述关系表述抽取为关系、将各所述属性表述抽取为属性,设定各所述属性对应的属性值;
步骤S33、利用各所述实体、关系、属性以及属性值创建包含实体-关系-实体、实体-属性-属性值,关系-属性-属性值结构的知识图谱。
4.如权利要求1所述的一种基于知识图谱的运维问答方法,其特征在于:所述步骤S40具体包括:
步骤S41、预设若干个问句模板以及答句模板,设定各所述问句模板和答句模板的关联关系;
步骤S42、获取用户输入的运维问句,对所述运维问句进行预处理后,利用所述分词模型提取词语和词性,并抽取为实体;
步骤S43、利用所述实体查询知识图谱,获取所述实体关联的关系、属性以及属性值,基于所述实体、关系、属性以及属性值生成结构化查询语句;
步骤S44、利用所述结构化查询语句查询问句模板,进而匹配答句模板,生成所述运维问句对应的运维答句。
5.如权利要求4所述的一种基于知识图谱的运维问答方法,其特征在于:所述步骤S42中,所述对所述运维问句进行预处理具体为:
对所述运维问句进行去除冗余词串以及末尾标点符号的预处理。
6.如权利要求4所述的一种基于知识图谱的运维问答方法,其特征在于:所述步骤S43具体为:
判断所述实体的个数是否为1个,若是,则直接查询所述知识图谱,获取所述实体关联的关系、属性以及属性值,基于所述实体、关系、属性以及属性值生成结构化查询语句;
若否,则基于最短路径查询所述知识图谱,获取所述实体关联的关系、属性以及属性值,基于所述实体、关系、属性以及属性值生成结构化查询语句。
7.如权利要求4所述的一种基于知识图谱的运维问答方法,其特征在于:所述步骤S44具体为:
利用所述结构化查询语句查询问句模板,判断是否存在对应的所述问句模板,若是,则利用所述问句模板匹配答句模板,生成所述运维问句对应的运维答句;
若否,则利用VSM算法计算所述结构化查询语句与各问句模板的相似度,选取相似度最高的所述问句模板匹配答句模板,生成所述运维问句对应的运维答句。
8.如权利要求1所述的一种基于知识图谱的运维问答方法,其特征在于:还包括:
步骤S50、对所述运维问答的日志进行存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011517454.8A CN112685434A (zh) | 2020-12-21 | 2020-12-21 | 一种基于知识图谱的运维问答方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011517454.8A CN112685434A (zh) | 2020-12-21 | 2020-12-21 | 一种基于知识图谱的运维问答方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112685434A true CN112685434A (zh) | 2021-04-20 |
Family
ID=75449780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011517454.8A Pending CN112685434A (zh) | 2020-12-21 | 2020-12-21 | 一种基于知识图谱的运维问答方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112685434A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562311A (zh) * | 2023-07-07 | 2023-08-08 | 中铁四局集团有限公司 | 基于自然语言机器翻译的运维方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460136A (zh) * | 2018-03-08 | 2018-08-28 | 国网福建省电力有限公司 | 电力运维信息知识图谱构建方法 |
CN108804521A (zh) * | 2018-04-27 | 2018-11-13 | 南京柯基数据科技有限公司 | 一种基于知识图谱的问答方法及农业百科问答系统 |
US20190018839A1 (en) * | 2017-07-14 | 2019-01-17 | Guangzhou Shenma Mobile Information Technology Co., Ltd. | Knowledge map-based question-answer method, device, and storage medium |
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
CN110727779A (zh) * | 2019-10-16 | 2020-01-24 | 信雅达系统工程股份有限公司 | 基于多模型融合的问答方法及系统 |
-
2020
- 2020-12-21 CN CN202011517454.8A patent/CN112685434A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190018839A1 (en) * | 2017-07-14 | 2019-01-17 | Guangzhou Shenma Mobile Information Technology Co., Ltd. | Knowledge map-based question-answer method, device, and storage medium |
CN108460136A (zh) * | 2018-03-08 | 2018-08-28 | 国网福建省电力有限公司 | 电力运维信息知识图谱构建方法 |
CN108804521A (zh) * | 2018-04-27 | 2018-11-13 | 南京柯基数据科技有限公司 | 一种基于知识图谱的问答方法及农业百科问答系统 |
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
CN110727779A (zh) * | 2019-10-16 | 2020-01-24 | 信雅达系统工程股份有限公司 | 基于多模型融合的问答方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562311A (zh) * | 2023-07-07 | 2023-08-08 | 中铁四局集团有限公司 | 基于自然语言机器翻译的运维方法及系统 |
CN116562311B (zh) * | 2023-07-07 | 2023-12-01 | 中铁四局集团有限公司 | 基于自然语言机器翻译的运维方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804521B (zh) | 一种基于知识图谱的问答方法及农业百科问答系统 | |
CN109146610B (zh) | 一种智能保险推荐方法、装置及智能保险机器人设备 | |
WO2020206957A1 (zh) | 一种应用于智能客服机器人的意图识别方法及装置 | |
CN107451126B (zh) | 一种近义词筛选方法及系统 | |
US10521464B2 (en) | Method and system for extracting, verifying and cataloging technical information from unstructured documents | |
CN102262634B (zh) | 一种自动问答方法及系统 | |
US20180210883A1 (en) | System for converting natural language questions into sql-semantic queries based on a dimensional model | |
CN107644062B (zh) | 一种基于知识图谱的知识内容权重分析系统及方法 | |
CN111708869B (zh) | 人机对话的处理方法及装置 | |
CN110717018A (zh) | 一种基于知识图谱的工业设备故障维修问答系统 | |
WO2020010834A1 (zh) | 一种faq问答库泛化方法、装置及设备 | |
WO2020233386A1 (zh) | 基于aiml的智能问答方法、装置、计算机设备及存储介质 | |
CN116991869A (zh) | 一种基于nlp语言模型自动生成数据库查询语句的方法 | |
CN112115232A (zh) | 一种数据纠错方法、装置及服务器 | |
CN115470338B (zh) | 一种基于多路召回的多场景智能问答方法和系统 | |
CN112445894A (zh) | 基于人工智能的商务智能系统及其分析方法 | |
CN110413882B (zh) | 信息推送方法、装置及设备 | |
EP4187400A1 (en) | Method for converting natural language query to sql and device thereof | |
JPWO2019150583A1 (ja) | 質問群抽出方法、質問群抽出装置および質問群抽出プログラム | |
CN111159381A (zh) | 数据搜索方法及装置 | |
CN112685434A (zh) | 一种基于知识图谱的运维问答方法 | |
CN117251455A (zh) | 一种基于大模型的智能报表生成方法及其系统 | |
CN112800765A (zh) | 一种工单的自动生成方法 | |
CN115982322A (zh) | 一种水利行业设计领域知识图谱的检索方法及检索系统 | |
US20220156611A1 (en) | Method and apparatus for entering information, electronic device, computer readable storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |