CN117272170A - 一种基于知识图谱的it运维故障根因分析方法 - Google Patents

一种基于知识图谱的it运维故障根因分析方法 Download PDF

Info

Publication number
CN117272170A
CN117272170A CN202311213296.0A CN202311213296A CN117272170A CN 117272170 A CN117272170 A CN 117272170A CN 202311213296 A CN202311213296 A CN 202311213296A CN 117272170 A CN117272170 A CN 117272170A
Authority
CN
China
Prior art keywords
fault
maintenance
entity
probability
root cause
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311213296.0A
Other languages
English (en)
Other versions
CN117272170B (zh
Inventor
何运东
张玉莲
叶凌云
徐青
于琼炜
陈婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongwang Intelligent Technology Shanghai Co ltd
Original Assignee
Dongwang Intelligent Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongwang Intelligent Technology Shanghai Co ltd filed Critical Dongwang Intelligent Technology Shanghai Co ltd
Priority to CN202311213296.0A priority Critical patent/CN117272170B/zh
Publication of CN117272170A publication Critical patent/CN117272170A/zh
Application granted granted Critical
Publication of CN117272170B publication Critical patent/CN117272170B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明涉及一种基于知识图谱的IT运维故障根因分析方法,属于故障根因分析技术领域。本发明通过BiLSTM‑BERT‑CRF模型对IT多域数据进行知识抽取、实体对齐和知识融合得到IT运维故障知识图谱,根据预构建的实体关系识别模型处理故障事件信息得到运维故障子图,根据运维故障子图通过关联IT运维故障知识图谱得到故障关联子图数据,通过贝叶斯网络故障模型对关联子图数据进行处理得到运维故障等级和运维故障根因,通过TFIDF‑COS算法处理运维故障根因得到故障处理措施。本发明实现了IT运维故障的根因定位、IT运维故障等级分析和故障处理措施推荐,提高了IT运维故障诊断效率、IT运维故障处理效率和维修人员的工作效率。

Description

一种基于知识图谱的IT运维故障根因分析方法
技术领域
本发明属于故障根因分析技术领域,具体涉及一种基于知识图谱的IT运维故障根因分析方法。
背景技术
随着IT系统不断发展,信息化、数字化和网络化的进程越来越快,IT系统的服务范围涵盖了人类社会生产和日常生活,其中包括公共服务、网络金融、商务交易、工业生产等各行各业。因为IT系统规模的不断扩大导致IT系统运行环境也日趋复杂,尽管目前的各类监控工具帮助IT系统运行状态大幅度的提升,但是当发生网络故障或系统故障时,面对海量的网络监控数据和庞大的系统,IT运维缺乏对IT故障的辅助判断和解决方案推荐,IT系统无法快速获得足够信息进行故障定位和等级分析。
发明内容
为解决现有技术中存在的上述问题,本发明提供了一种基于知识图谱的IT运维故障分析方法,通过BiLSTM-BERT-CRF模型对IT多域数据进行知识抽取、实体对齐和知识融合得到IT运维故障知识图谱,根据预构建的实体关系识别模型处理故障事件信息得到运维故障子图,根据运维故障子图通过关联IT运维故障知识图谱得到故障关联子图数据,通过贝叶斯网络故障模型对关联子图数据进行处理得到运维故障等级和运维故障根因,通过TFIDF-COS算法处理运维故障根因输出故障处理措施。本发明实现了IT运维故障的根因定位、IT运维故障等级分析和故障处理措施推荐,提高了IT运维故障诊断效率、IT运维故障处理效率和维修人员的工作效率。
本发明的目的可以通过以下技术方案实现:
一种基于知识图谱的IT运维故障根因分析方法,包括如下步骤:
S1:获取IT多域数据;
S2:通过BiLSTM-BERT-CRF模型对所述IT多域数据进行知识抽取得到IT运维故障实体和IT运维故障实体关系,所述IT运维故障实体包括故障现象、故障部位、故障原因和故障解决方案;
S3:根据所述IT运维故障实体和所述IT运维故障实体关系通过Protégé本体构建工具得到实体三元组,根据所述实体三元组通过知识融合得到IT运维故障知识图谱,所述IT运维故障知识图谱包括运维故障实体节点和有向边;
S4:获取故障事件信息;
S5:根据预构建的实体关系识别模型,得到所述故障事件信息中的故障实体和故障实体关系,根据所述故障实体和所述故障实体关系通过关联所述IT运维故障知识图谱得到运维故障子图;
S6:根据所述运维故障子图通过关联IT运维故障知识图谱得到故障关联子图数据,通过贝叶斯网络故障模型对所述关联子图数据进行处理得到故障诊断结果,所述故障诊断结果包括运维故障等级和运维故障根因,所述故障关联子图数据包括故障关联实体、故障有向边总数和故障实体频数;
S7:通过TFIDF-COS算法处理所述运维故障根因得到处理结果,根据所述处理结果输出故障处理措施。
优选地,所述步骤S2具体包括以下步骤:
S201:通过BiLSTM神经网络分词模型对所述IT多域数据进行分词处理得到IT运维故障实体语料库,根据预定义的实体类型对所述IT运维故障实体语料库进行语料标注得到标注信息,并将所述标注信息转化为BIOES格式得到IT运维故障训练数据;
S202:通过BERT模型处理所述IT运维故障训练数据得到运维故障词向量,通过双向神经网络BiLSTM模型处理所述运维故障词向量得到深层语义信息,根据所述深层语义信息通过CRF模型处理得到最大概率标注序列,根据所述最大概率标注序列输出所述IT运维故障实体;
S203:根据所述运维故障词向量进行特征提取得到特征向量,通过卷积神经网络对所述特征向量进行卷积操作得到卷积结果,将所述卷积结果通过最大池化得到最大特征值,通过卷积神经网络输出所述IT运维故障实体关系。
优选地,所述步骤S3具体包括以下步骤:
S301:通过对所述实体三元组进行信息提取得到待对齐故障实体,根据所述待对齐故障实体通过知识表示平移模型处理得到故障实体关系表示;
S302:根据所述待对齐故障实体和所述故障实体关系表示通过聚类处理得到故障实体对齐结果,根据所述故障实体对齐结果通过知识融合得到IT运维故障知识图谱。
优选地,所述步骤S301具体包括以下步骤:
通过所述知识表示平移模型处理所述待对齐故障实体得到待对齐故障实体三元组,根据所述待对齐故障实体三元组计算所述待对齐故障实体三元组的合理得分,计算公式为:其中,oi和op为所述待对齐故障实体,w为所述待对齐故障实体关系,q表示与所述待对齐故障实体关系权重因子,(oi,w,op)为所述待对齐故障实体三元组,f(oi,w,op)为所述合理得分;
通过间隔排序损失函数计算所述合理得分得到所述故障实体关系表示,计算公式为:其中,f(oi,w,op)为所述合理得分,(oi,w,op)为所述待对齐故障实体三元组,T为所述待对齐故障实体三元组的集合,β为间隔超参数,Ri为所述故障实体关系表示。
优选地,所述步骤S6具体包括以下步骤:
S601:根据所述故障关联实体通过关联所述IT运维故障知识图谱得到所述IT运维故障实体,根据所述IT运维故障实体对应的所述故障现象、所述故障部位、所述故障原因和所述故障解决方案构建所述贝叶斯网络故障模型;
S602:获取所述运维故障实体节点的父节点信息,通过计算得到所述有向边的条件概率和故障根因概率,通过所述贝叶斯网络故障模型处理所述条件概率和所述故障根因概率得到所述运维故障根因,所述父节点信息包括父节点、父子节点连接概率和父节点概率;
S603:通过IT运维故障严重性等级识别所述运维故障信息得到运维故障等级。
优选地,所述步骤S602具体包括以下步骤:
计算所述有向边的条件概率,计算公式为:其中,M为所述运维故障节点,Fa(M)为所述父节点,K(M,Fa(M))为所述父子节点连接概率,KA为所述故障关联有向边总数,KM为所述故障关联实体频数,K(Fa(M))为所述父节点概率,P(M|Fa(M))为所述条件概率;
根据贝叶斯定理获取故障现象节点概率和故障原因节点概率,计算所述故障根因概率,计算公式为:其中,P(X)为所述故障现象节点概率,P(Y)为所述故障原因节点概率,Ω(Y,V)和Ω(V,X)为所述有向边的加权概率因子,P(Y|X)为所述故障根因概率。
优选地,所述步骤S603具体包括以下步骤:
将所述故障事件信息通过word2vec处理得到向量集合,通过BiLSTM模型处理所述向量集合得到故障特征向量,通过softmax函数计算所述故障特征向量得到故障等级标签概率,计算公式为:其中,α为所述故障特征向量,x为特征权重,T为故障等级标签数,p为所述故障等级标签概率;
判断所述故障等级标签概率是否大于预设阈值,是,则输出故障等级标签对应的所述运维故障等级,否,则返回等级识别失败信息。
优选地,所述步骤S7具体包括以下步骤:
通过向量空间模型处理所述运维故障根因得到根因特征向量,根据所述根因特征向量通过余弦相似度函数计算故障根因相似度,计算公式为:其中wki和wkj为TFIDF因子,ai和aj为所述根因特征向量,sim(ai,aj)为所述故障根因相似度;
当所述故障根因相似度大于0.9时,根据所述运维故障根因输出所述故障处理措施。
本发明的有益效果为:
1.本发明通过BiLSTM-BERT-CRF模型对IT多域数据进行知识抽取、实体对齐和知识融合得到IT运维故障知识图谱,IT运维故障知识图谱用于IT运维故障分析,提高了IT运维故障诊断效率和IT运维故障处理效率;
2.本发明通过预构建的实体关系识别模型处理故障事件信息得到运维故障子图,根据运维故障子图通过关联IT运维故障知识图谱得到故障关联子图数据,通过贝叶斯网络故障模型对关联子图数据进行诊断得到运维故障等级和运维故障根因,通过TFIDF-COS算法处理运维故障根因输出故障处理措施,提高了维修人员的工作效率,实现了IT运维故障的根因定位、IT运维故障等级分析和故障处理措施推荐。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明的IT运维故障根因分析方法的流程示意图。
具体实施方式
为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、特征及其功效,详细说明如下。
请参阅图1,一种基于知识图谱的IT运维故障根因分析方法,包括如下步骤:
S1:获取IT多域数据;
S2:通过BiLSTM-BERT-CRF模型对所述IT多域数据进行知识抽取得到IT运维故障实体和IT运维故障实体关系,所述IT运维故障实体包括故障现象、故障部位、故障原因和故障解决方案;
S3:根据所述IT运维故障实体和所述IT运维故障实体关系通过Protégé本体构建工具得到实体三元组,根据所述实体三元组通过知识融合得到IT运维故障知识图谱,所述IT运维故障知识图谱包括运维故障实体节点和有向边;
S4:获取故障事件信息;
S5:根据预构建的实体关系识别模型,得到所述故障事件信息中的故障实体和故障实体关系,根据所述故障实体和所述故障实体关系通过关联所述IT运维故障知识图谱得到运维故障子图;
S6:根据所述运维故障子图通过关联IT运维故障知识图谱得到故障关联子图数据,通过贝叶斯网络故障模型对所述关联子图数据进行处理得到故障诊断结果,所述故障诊断结果包括运维故障等级和运维故障根因,所述故障关联子图数据包括故障关联实体、故障有向边总数和故障实体频数;
S7:通过TFIDF-COS算法处理所述运维故障根因得到处理结果,根据所述处理结果输出故障处理措施。
步骤S1:IT多域数据包括IT运维设备故障数据、设备维修手册、IT设备维修知识、分析报告和专家结论;
通过获取IT多域知识,对IT多域知识进行挖掘得到故障告警信息、故障指标异常、故障现象、故障日志和故障之间的依赖关系,实现扩大IT运维故障知识图谱知识覆盖面积。
步骤S2:通过BiLSTM神经网络分词模型对所述IT多域数据进行分词处理得到IT运维故障实体语料库,根据预定义的实体类型对所述IT运维故障实体语料库进行语料标注得到标注信息,并将所述标注信息转化为BIOES格式得到IT运维故障训练数据;
通过BERT模型处理所述IT运维故障训练数据得到运维故障词向量,通过双向神经网络BiLSTM模型处理所述运维故障词向量得到深层语义信息,根据所述深层语义信息通过CRF模型处理得到最大概率标注序列,根据所述最大概率标注序列输出所述IT运维故障实体;
根据所述运维故障词向量进行特征提取得到特征向量,通过卷积神经网络对所述特征向量进行卷积操作得到卷积结果,将所述卷积结果通过最大池化得到最大特征值,通过卷积神经网络输出所述IT运维故障实体关系。
步骤S3:通过所述知识表示平移模型处理所述待对齐故障实体得到待对齐故障实体三元组,根据所述待对齐故障实体三元组计算所述待对齐故障实体三元组的合理得分,计算公式为:
通过间隔排序损失函数计算所述合理得分得到所述故障实体关系表示,计算公式为:
根据所述待对齐故障实体和所述故障实体关系表示通过聚类处理得到故障实体对齐结果,根据所述故障实体对齐结果通过知识融合得到IT运维故障知识图谱。
通过对IT领域知识进行知识抽取、实体对齐和知识融合建立IT运维故障知识图谱,实现更准确地识别IT运维故障,并为维修人员提供针对性的解决方案和相关知识。
步骤S4和步骤S5涉及处理故障事件信息,获取故障事件信息,根据预构建的实体关系识别模型,得到所述故障事件信息中的故障实体和故障实体关系,根据所述故障实体和所述故障实体关系通过关联所述IT运维故障知识图谱得到运维故障子图;
步骤S6:根据所述故障关联实体通过关联所述IT运维故障知识图谱得到所述IT运维故障实体,根据所述IT运维故障实体对应的所述故障现象、所述故障部位、所述故障原因和所述故障解决方案构建所述贝叶斯网络故障模型;
获取所述运维故障实体节点的父节点信息,通过计算得到所述有向边的条件概率和故障根因概率,通过所述贝叶斯网络故障模型处理所述条件概率和所述故障根因概率得到所述运维故障根因,所述父节点信息包括父节点、父子节点连接概率和父节点概率,计算所述有向边的条件概率,计算公式为:
根据贝叶斯定理获取故障现象节点概率和故障原因节点概率,计算所述故障根因概率,计算公式为:
将所述故障事件信息通过word2vec处理得到向量集合,通过BiLSTM模型处理所述向量集合得到故障特征向量,通过softmax函数计算所述故障特征向量得到故障等级标签概率,计算公式为:
判断所述故障等级标签概率是否大于预设阈值,是,则输出故障等级标签对应的所述运维故障等级,否,则返回等级识别失败信息。需要说明的是,当等级识别失败信息时,需对故障事件信息进行人工干预。
通过对故障事件进行等级分析得到运维故障等级,根据运维故障等级进行运维故障优先级排序,提高了IT运维故障的处理效率。
步骤S7:通过向量空间模型处理所述运维故障根因得到根因特征向量,根据所述根因特征向量通过余弦相似度函数计算故障根因相似度,计算公式为:当所述故障根因相似度大于0.9时,根据所述运维故障根因输出所述故障处理措施。
通过分析运维故障根因输出故障处理措施,提升了维修人员的工作效率,减少因工作经验不足造成的损失。
本发明的工作原理及使用流程:
通过BiLSTM-BERT-CRF模型对IT多域数据进行知识抽取、实体对齐和知识融合得到IT运维故障知识图谱,根据预构建的实体关系识别模型处理故障事件信息得到运维故障子图,根据运维故障子图通过关联IT运维故障知识图谱得到故障关联子图数据,通过贝叶斯网络故障模型对关联子图数据进行处理得到运维故障等级和运维故障根因,通过TFIDF-COS算法处理运维故障根因输出故障处理措施。
本发明实施例中的方法中上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭示如上,然而并非用以限定本发明,任何本领域技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (8)

1.一种基于知识图谱的IT运维故障根因分析方法,其特征在于,包括如下步骤:
S1:获取IT多域数据;
S2:通过BiLSTM-BERT-CRF模型对所述IT多域数据进行知识抽取得到IT运维故障实体和IT运维故障实体关系,所述IT运维故障实体包括故障现象、故障部位、故障原因和故障解决方案;
S3:根据所述IT运维故障实体和所述IT运维故障实体关系通过Protégé本体构建工具得到实体三元组,根据所述实体三元组通过知识融合得到IT运维故障知识图谱,所述IT运维故障知识图谱包括运维故障实体节点和有向边;
S4:获取故障事件信息;
S5:根据预构建的实体关系识别模型,得到所述故障事件信息中的故障实体和故障实体关系,根据所述故障实体和所述故障实体关系通过关联所述IT运维故障知识图谱得到运维故障子图;
S6:根据所述运维故障子图通过关联IT运维故障知识图谱得到故障关联子图数据,通过贝叶斯网络故障模型对所述关联子图数据进行处理得到故障诊断结果,所述故障诊断结果包括运维故障等级和运维故障根因,所述故障关联子图数据包括故障关联实体、故障有向边总数和故障实体频数;
S7:通过TFIDF-COS算法处理所述运维故障根因得到处理结果,根据所述处理结果输出故障处理措施。
2.根据权利要求1所述的基于知识图谱的IT运维故障根因分析方法,其特征在于,所述步骤S2具体包括以下步骤:
S201:通过BiLSTM神经网络分词模型对所述IT多域数据进行分词处理得到IT运维故障实体语料库,根据预定义的实体类型对所述IT运维故障实体语料库进行语料标注得到标注信息,并将所述标注信息转化为BIOES格式得到IT运维故障训练数据;
S202:通过BERT模型处理所述IT运维故障训练数据得到运维故障词向量,通过双向神经网络BiLSTM模型处理所述运维故障词向量得到深层语义信息,根据所述深层语义信息通过CRF模型处理得到最大概率标注序列,根据所述最大概率标注序列输出所述IT运维故障实体;
S203:根据所述运维故障词向量进行特征提取得到特征向量,通过卷积神经网络对所述特征向量进行卷积操作得到卷积结果,将所述卷积结果通过最大池化得到最大特征值,通过卷积神经网络输出所述IT运维故障实体关系。
3.根据权利要求1所述的基于知识图谱的IT运维故障根因分析方法,其特征在于,所述步骤S3具体包括以下步骤:
S301:通过对所述实体三元组进行信息提取得到待对齐故障实体,根据所述待对齐故障实体通过知识表示平移模型处理得到故障实体关系表示;
S302:根据所述待对齐故障实体和所述故障实体关系表示通过聚类处理得到故障实体对齐结果,根据所述故障实体对齐结果通过知识融合得到IT运维故障知识图谱。
4.根据权利要求3所述的基于知识图谱的IT运维故障根因分析方法,其特征在于,所述步骤S301具体包括以下步骤:
通过所述知识表示平移模型处理所述待对齐故障实体得到待对齐故障实体三元组,根据所述待对齐故障实体三元组计算所述待对齐故障实体三元组的合理得分,计算公式为:其中,oi和op为所述待对齐故障实体,w为所述待对齐故障实体关系,q表示与所述待对齐故障实体关系权重因子,(oi,w,op)为所述待对齐故障实体三元组,f(oi,w,op)为所述合理得分;
通过间隔排序损失函数计算所述合理得分得到所述故障实体关系表示,计算公式为:其中,f(oi,w,op)为所述合理得分,(oi,w,op)为所述待对齐故障实体三元组,T为所述待对齐故障实体三元组的集合,β为间隔超参数,Ri为所述故障实体关系表示。
5.根据权利要求1所述的基于知识图谱的IT运维故障根因分析方法,其特征在于,所述步骤S6具体包括以下步骤:
S601:根据所述故障关联实体通过关联所述IT运维故障知识图谱得到所述IT运维故障实体,根据所述IT运维故障实体对应的所述故障现象、所述故障部位、所述故障原因和所述故障解决方案构建所述贝叶斯网络故障模型;
S602:获取所述运维故障实体节点的父节点信息,通过计算得到所述有向边的条件概率和故障根因概率,通过所述贝叶斯网络故障模型处理所述条件概率和所述故障根因概率得到所述运维故障根因,所述父节点信息包括父节点、父子节点连接概率和父节点概率;
S603:通过IT运维故障严重性等级识别所述运维故障信息得到运维故障等级。
6.根据权利要求5所述的基于知识图谱的IT运维故障根因分析方法,其特征在于,所述步骤S602具体包括以下步骤:
计算所述有向边的条件概率,计算公式为:其中,M为所述运维故障节点,Fa(M)为所述父节点,K(M,Fa(M))为所述父子节点连接概率,KA为所述故障关联有向边总数,KM为所述故障关联实体频数,K(Fa(M))为所述父节点概率,P(M|Fa(M))为所述条件概率;
根据贝叶斯定理获取故障现象节点概率和故障原因节点概率,计算所述故障根因概率,计算公式为:其中,P(X)为所述故障现象节点概率,P(Y)为所述故障原因节点概率,Ω(Y,V)和Ω(V,X)为所述有向边的加权概率因子,P(Y|X)为所述故障根因概率。
7.根据权利要求5所述的基于知识图谱的IT运维故障根因分析方法,其特征在于,所述步骤S603具体包括以下步骤:
将所述故障事件信息通过word2vec处理得到向量集合,通过BiLSTM模型处理所述向量集合得到故障特征向量,通过softmax函数计算所述故障特征向量得到故障等级标签概率,计算公式为:其中,α为所述故障特征向量,x为特征权重,T为故障等级标签数,p为所述故障等级标签概率;
判断所述故障等级标签概率是否大于预设阈值,是,则输出故障等级标签对应的所述运维故障等级,否,则返回等级识别失败信息。
8.根据权利要求1所述的基于知识图谱的IT运维故障根因分析方法,其特征在于,所述步骤S7具体包括以下步骤:
通过向量空间模型处理所述运维故障根因得到根因特征向量,根据所述根因特征向量通过余弦相似度函数计算故障根因相似度,计算公式为:其中wki和wkj为TFIDF因子,ai和aj为所述根因特征向量,sim(ai,aj)为所述故障根因相似度;
当所述故障根因相似度大于0.9时,根据所述运维故障根因输出所述故障处理措施。
CN202311213296.0A 2023-09-20 2023-09-20 一种基于知识图谱的it运维故障根因分析方法 Active CN117272170B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311213296.0A CN117272170B (zh) 2023-09-20 2023-09-20 一种基于知识图谱的it运维故障根因分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311213296.0A CN117272170B (zh) 2023-09-20 2023-09-20 一种基于知识图谱的it运维故障根因分析方法

Publications (2)

Publication Number Publication Date
CN117272170A true CN117272170A (zh) 2023-12-22
CN117272170B CN117272170B (zh) 2024-03-08

Family

ID=89209897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311213296.0A Active CN117272170B (zh) 2023-09-20 2023-09-20 一种基于知识图谱的it运维故障根因分析方法

Country Status (1)

Country Link
CN (1) CN117272170B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021212682A1 (zh) * 2020-04-21 2021-10-28 平安国际智慧城市科技股份有限公司 知识抽取方法、装置、电子设备及存储介质
CN114186073A (zh) * 2021-12-13 2022-03-15 安徽继远软件有限公司 基于子图匹配和分布式查询的运维故障诊断分析方法
CN114756686A (zh) * 2022-03-30 2022-07-15 同济大学 一种基于知识图谱的知识推理和故障诊断方法
CN115511119A (zh) * 2022-09-19 2022-12-23 常州英集动力科技有限公司 基于知识图谱和贝叶斯的供热系统智能诊断方法及系统
CN116541510A (zh) * 2023-05-09 2023-08-04 西安电子科技大学 一种基于知识图谱的故障案例推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021212682A1 (zh) * 2020-04-21 2021-10-28 平安国际智慧城市科技股份有限公司 知识抽取方法、装置、电子设备及存储介质
CN114186073A (zh) * 2021-12-13 2022-03-15 安徽继远软件有限公司 基于子图匹配和分布式查询的运维故障诊断分析方法
CN114756686A (zh) * 2022-03-30 2022-07-15 同济大学 一种基于知识图谱的知识推理和故障诊断方法
CN115511119A (zh) * 2022-09-19 2022-12-23 常州英集动力科技有限公司 基于知识图谱和贝叶斯的供热系统智能诊断方法及系统
CN116541510A (zh) * 2023-05-09 2023-08-04 西安电子科技大学 一种基于知识图谱的故障案例推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭日红;董忠文;谢国锋;: "基于贝叶斯网络的机械设备故障诊断方法研究", 机械设计与制造工程, no. 10, 15 October 2016 (2016-10-15), pages 91 - 95 *

Also Published As

Publication number Publication date
CN117272170B (zh) 2024-03-08

Similar Documents

Publication Publication Date Title
CN111694879B (zh) 一种多元时间序列异常模式预测方法及数据采集监控装置
CN110941716A (zh) 一种基于深度学习的信息安全知识图谱的自动构建方法
CN111343161B (zh) 异常信息处理节点分析方法、装置、介质及电子设备
CN112016602B (zh) 电网故障原因与状态量的关联分析方法,设备和存储介质
CN111612038B (zh) 异常用户检测方法及装置、存储介质、电子设备
CN109992484B (zh) 一种网络告警相关性分析方法、装置和介质
CN112433874A (zh) 一种故障定位方法、系统、电子设备及存储介质
CN112348662B (zh) 基于用户职业预测的风险评估方法、装置和电子设备
CN114092230A (zh) 一种数据处理方法、装置、电子设备及计算机可读介质
CN117455235A (zh) 风险处理方法、处理装置、电子设备和存储介质
CN116611813B (zh) 一种基于知识图谱的智能运维管理方法及系统
CN117272170B (zh) 一种基于知识图谱的it运维故障根因分析方法
CN111209955A (zh) 基于深度神经网络和随机森林的飞机电源系统故障识别方法
CN116739408A (zh) 基于数据标签的电网调度安全监控方法、系统及电子设备
CN114329454A (zh) 一种基于应用软件大数据的威胁分析方法及系统
CN114117248A (zh) 数据处理方法、装置及电子设备
CN113076217A (zh) 基于国产平台的磁盘故障预测方法
CN118468207B (zh) 基于大数据的企业异常行为监测系统及方法
CN117332377B (zh) 一种基于深度学习的离散时间序列事件挖掘方法及系统
CN118691096B (zh) 一种基于知识图谱的电力施工安全管控方法及装置
CN117311777A (zh) 自动化运维平台及方法
CN118859868A (zh) 面向多参量耦合的工业设备运行状态评估系统
CN118917396A (zh) 一种面向故障风险感知的知识图谱构建方法及系统及存储介质及处理器
CN118037181A (zh) 一种基于六氟化硫钢瓶流转管理系统及方法
CN118520026A (zh) 数据和领域知识驱动的工业过程多变量时间序列预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant