CN114756686A - 一种基于知识图谱的知识推理和故障诊断方法 - Google Patents

一种基于知识图谱的知识推理和故障诊断方法 Download PDF

Info

Publication number
CN114756686A
CN114756686A CN202210328887.1A CN202210328887A CN114756686A CN 114756686 A CN114756686 A CN 114756686A CN 202210328887 A CN202210328887 A CN 202210328887A CN 114756686 A CN114756686 A CN 114756686A
Authority
CN
China
Prior art keywords
fault
case
knowledge
attribute
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210328887.1A
Other languages
English (en)
Inventor
阎曼婷
王坚
韩慧慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202210328887.1A priority Critical patent/CN114756686A/zh
Publication of CN114756686A publication Critical patent/CN114756686A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/048Fuzzy inferencing

Abstract

本发明涉及一种基于知识图谱的知识推理和故障诊断方法,包括获取故障记录信息和数据知识,去除冗余和重复信息,进行数据清洗,获取关系路径以及实体关系三元组,构建案例资源知识图谱;将关系路径信息嵌入卷积编码器中,获取路径特征向量,然后输入BiLSTM网络中,得到关系路径表示向量,再输入ATT模型中,经过多步推理补全关系路径;提取故障属性特征信息;计算各属性的权重值,并通过神经网络计算当前案例与历史案例的总体相似度,完成CBRDA‑KG决策模型的构建;获取实际故障案例信息,并载入CBRDA‑KG决策模型中,得出故障诊断结果。与现有技术相比,本发明有效降低了检测成本和检测时间,准确率及完整性也大大增强,也可以提高诊断效率和结果的准确性。

Description

一种基于知识图谱的知识推理和故障诊断方法
技术领域
本发明涉及知识图谱处理技术领域,尤其是涉及一种基于知识图谱的知识推理和故障诊断方法。
背景技术
知识图谱自提出以来,已经被广泛用于知识萃取、业务查询等领域。知识图谱可以将复杂的领域知识通过数据挖掘、信息处理等方式显示出来,解释领域知识的发展规律,为学科研究提供有价值的信息。考虑知识图谱这一实际特点和发展情况,在复杂环境下的工业生产领域,如何利用生产过程数据进行知识图谱构建、推理与决策,是未来工业大数据环境下的重要研究问题。通过对已有的生产知识进行抽取,构建知识图谱,之后利用知识图谱进行后续的知识推理、智能决策与优化可以实现知识的有效融合,帮助企业解决复杂制造环境下决策与优化面临的挑战,推动企业实现综合决策与智能生产模式的转变。
当前的装设备故障诊断方法较多,但大多应用机器学习算法进行参数预测和故障分类等,结合知识图谱进行故障诊断可以在保证推荐结果准确率的同时发挥技术人员的专业能力,使诊断结果兼具主观性和客观性。Pancho等人提出了一种利用推理图可视化表示模糊推理过程的Fingrams方法。它通过由多个节点和链接组成的推理图,在推理层次上描述了模糊规则之间的交互作用。然而,Fingrams方法不能在复杂模糊干扰系统中建模复杂的模糊规则库,这在某些情况下需要一个良好的推理过程和训练数据中有限的规则。Lan等人提出了一种利用知识图谱进行复杂模糊推理决策的方法,在训练阶段根据规则集的语言标签及其关系,将规则库表示为模糊知识图,通过生成一个相邻的模糊知识图谱矩阵(FKG)进行推理。当给出测试数据集中的一个记录时,它将被模糊化和标记。记录中的每个组件都由FKG使用近似推理中的推理机制进行检查。然后通过最大最小算子推导出新记录的标签。这种机制不仅有助于加速检查的速度,而且还可以使用规则库没有推断出的新记录进行推断。
虽然之前也有相关的故障诊断和推理方法,但仍然存在一些问题。首先,单纯的知识推理方法应用性不强,而故障诊断方法的展示性也欠佳,此外在进行诊断时忽略了结合现代人工智能技术和技术人员的专业知识,这就导致最终的推荐结果准确率不高。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于知识图谱的知识推理和故障诊断方法,以对工业生产过程中的故障案例进行实时、快速、准确的诊断及更新。
本发明的目的可以通过以下技术方案来实现:
一种基于知识图谱的知识推理和故障诊断方法,包括:获取实际故障案例信息,并载入预先构建并训练好的CBRDA-KG决策模型中,得出故障诊断结果;
所述CBRDA-KG决策模型的数据处理过程包括以下步骤:
S1:获取故障记录信息和数据知识,标注故障信息的实体以及实体间的关系;
S2:对获取的数据进行数据清洗后,获取实体间所有关系路径以及实体关系三元组,构建案例资源知识图谱;
S3:将获取的关系路径信息嵌入卷积编码器中,获取路径特征向量,将该路径特征向量输入BiLSTM网络中,得到关系路径表示向量,将该关系路径表示向量输入ATT模型中,经过多步推理得到隐藏三元组路径推理结果,补全所述案例资源知识图谱;
S4:提取所述案例资源知识图谱中故障的属性特征信息;
S5:计算所述属性特征信息中各个属性的权重值,并通过神经网络计算当前数据对应的案例与预设的历史案例的总体相似度,完成CBRDA-KG决策模型的构建。
进一步地,步骤S3中,所述ATT模型的表达式为:
s(pi,r)=tanh(piWs)r
Figure BDA0003572463400000021
Figure BDA0003572463400000031
P(r|es,et)=f(WP(c+r))
式中,s(pi,r)为语义相关度得分,pi为第i个隐藏层的输出值,Ws为权值矩阵,r为概率得分,αi为路径i的独立权重,n为词数,
Figure BDA0003572463400000034
为softmax函数,c为加权计算后得到的候选关系状态向量,P(r|es,et)为头尾实体的概率得分,es为头实体,et为尾实体,WP(c+r)为概率权重,f为激活函数;
所述ATT模型经过加权运算之后集合路径基本信息,在丢弃与候选关系相关度较低的路径的同时保留相关性强的路径;
所述ATT模型的损失函数为:
Figure BDA0003572463400000032
式中,L(θ)为为ATT模型的损失函数,N为实验次数,
Figure BDA0003572463400000033
为目标函数,λ为正则化率,θ为正则化参数;
所述ATT模型采用Adam优化器进行训练,当训练误差最低时,分别为正例三元组和负例三元组赋予较高和较低的值,调整参数后采用L2范数正则化的方式防止出现过拟合,得出隐藏三元组路径推理结果。
进一步地,步骤S4具体包括以下步骤:
S41:采用分词法对所述案例资源知识图谱中的文本进行分词;
S42:采用Word2vec方法对分词后的文本进行故障属性特征提取,根据类别建立故障信息表。
进一步地,步骤S41具体包括以下步骤:
S411:采用jieba分词法对案例资源知识图谱中的故障部位和故障现象进行分词,将不同类型的特征进行分类,并进行分词筛选;
S412:对分词后的数据,以数据表的形式创建案例库。
进一步地,步骤S42具体包括以下步骤:
S421:针对故障案例信息中故障部位和故障现象故障要素,进行故障特征提取,并存入故障特征表;
S422:构建故障特征词库和停用词库;
S423:使用Wordvec算法在对分词后的数据去除停用词后抽取出可表示案例的关键词。
进一步地,步骤S5具体包括以下步骤:
S51:依据模糊偏好关系确定属性的主观权重;
S52:根据案例资源知识图谱确定属性的客观权重;
S53:根据所述主观权重和客观权重计算属性的综合权重;
S54:根据综合权重,通过神经网络计算当前数据对应的案例与预设的历史案例的总体相似度;
S55:完成CBRDA-KG决策模型的构建。
进一步地,步骤S51具体包括以下步骤:
S511:建立模糊偏好关系矩阵Y=(yij)n×n,其中,yij表示属性Ci相比于属性Cj的重要程度,yij满足:
1)yij≥0;
2)yij+yji=1,
Figure BDA0003572463400000041
3)yii=0.5,
Figure BDA0003572463400000042
4)yij+yji+yki=1.5,
Figure BDA0003572463400000043
5)
Figure BDA0003572463400000044
式中,i和j均为属性C的下标,n为属性的总数;
S512:根据模糊偏好关系矩阵确定属性的主观权重的优化模型,优化模型的表达式为:
Figure BDA0003572463400000045
Figure BDA0003572463400000046
式中,ω′j为主观权重;
S513:求解所述优化模型,求解过程的计算表达式为:
Figure BDA0003572463400000047
Figure BDA0003572463400000048
式中,λ为拉格朗日系数。
进一步地,步骤S52具体包括:
按照案例资源知识图谱中的相似度计算结果确定各属性的权重值,分别计算案例库中全部属性与对应属性的相似度,对相似度计算结果取均值,之后再对全部属性进行归一化处理,进而得出各个属性对应的客观权重值,所述客观权重值的计算表达式为:
Figure BDA0003572463400000051
式中,ω″j为属性j的客观权重值,sij为属性i与属性j之间的相似度。
进一步地,步骤S54具体包括:
S541:将X=[x1,x2,…,xn]T作为输入样本,载入RBF神经网络中,采用Y=[y1,y2,…,yn]T作为输出,RBF神经网络的隐层采用径向对称的高斯函数;
Figure BDA0003572463400000052
其中ri(x)表示第i个层节点的输出,ci表示第i个隐层节点的中心值,σ表示第i个隐层节点的方差,l为隐层节点数;
S542:所述RBF神经网络的输出为:
Figure BDA0003572463400000053
式中,ω为输出层权值;
S543:选取l个中心做聚类,对于高斯核函数的径向基,有:
Figure BDA0003572463400000054
Figure BDA0003572463400000055
其中cmax为中心点之间的最大距离;
通过所述RBF神经网络,计算总体相似度。
进一步地,当故障诊断结果中,检索到相似度值为1的源特征时,直接从源特征对应的故障数据库获取该案例的故障原因及解决方案,当前案例不保存;
当故障诊断结果中,检索到的相似度值小于1时,则将相似源案例的解决方案作为当前案例的建议解,并根据实际情况进行解方案的修正,将修正后的方案作为最终解决方案,并将该案例作为新案例保存到案例库,实现案例库的更新。
与现有技术相比,本发明具有以下优点:
本发明提出了一种新的结合知识推理和决策算法的故障诊断方法,通过构建故障案例知识库提高信息管理效率。其次,以机器学习算法(CNN、BiLSTM)作为主要工具,结合Neo4j构建知识推理模型。之后利用故障案例信息库和RBF技术进行相似度分析。另外,综合分析案例属性信息,综合主观和客观权重确定相似度,推理出最匹配案例。此模型不仅准确率高速度快,而且还具有良好的应用前景和实际意义。
附图说明
图1为本发明实施例中提供的一种基于知识图谱的知识推理和故障诊断方法的流程示意图;
图2为本发明实施例中提供的一种知识推理模型结构图;
图3为本发明实施例中提供的一种故障案例决策模型结构图;
图4为本发明实施例中提供的一种CBRDA-KG模型流程图;
图5为本发明实施例中提供的一种实验案例展示结果图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
实施例1
本实施例提供一种基于知识图谱的知识推理和故障诊断方法,包括:获取实际故障案例信息,并载入预先构建并训练好的CBRDA-KG决策模型中,得出故障诊断结果;
CBRDA-KG决策模型的数据处理过程包括以下步骤:
S1:获取故障记录信息和数据知识,标注故障信息的实体以及实体间的关系;
S2:对获取的数据进行数据清洗后,获取实体间所有关系路径以及实体关系三元组,构建案例资源知识图谱;
S3:将获取的关系路径信息嵌入卷积编码器中,获取路径特征向量,将该路径特征向量输入BiLSTM网络中,得到关系路径表示向量,将该关系路径表示向量输入ATT模型中,经过多步推理得到隐藏三元组路径推理结果,补全案例资源知识图谱;
S4:提取案例资源知识图谱中故障的属性特征信息;
S5:计算属性特征信息中各个属性的权重值,并通过神经网络计算当前数据对应的案例与预设的历史案例的总体相似度,完成CBRDA-KG决策模型的构建。
下面对各步骤进行具体描述:
1、步骤S1具体包括以下内容:
对获得的文本记录进行词性标注,确定有关故障信息的实体以及实体间的关系。
2、步骤S2具体包括以下内容:
根据获取到的实体关系三元组(h,r,t),删除重复和不合理的信息,整理余下的实体和关系路径,同时保证路径信息获取的完整性,利用选择出的实体和关系利用Neo4j软件构建领域知识图谱。
3、如图2所示,步骤S3具体包括以下内容:
S31、将头尾实体以及对应关系进行向量表示,并将其作为卷积编码器的输入,激活函数选择PReLU函数。得到卷积核中提取到的第i个特征向量ui=[ui1,ui2,…,uir],其中
uir=f(ωr[ei-1,ri,ei]+b) (1)
其中f为PReLU函数,b表示偏置。
S32、将卷积编码层的输出特征向量作为BiLSTM的输入向量,表示BiLSTM网络的一个时间步。LSTM网络的前向和后向输出分别为
Figure BDA0003572463400000071
Figure BDA0003572463400000072
即分别为从左到右和从右到左,通过双向传递可以得到两组状态序列
Figure BDA0003572463400000073
Figure BDA0003572463400000074
路径向量为
Figure BDA0003572463400000075
隐藏单元状态数为k/2并取整。由此可以得出编码路径向量表示集合P=[p1,p2,…,pn],P∈Rk*n
S33、令BiLSTM的输出作为ATT的输入进行路径集成表示,计算每条路径的语义相关度得分,由此实现为每条路径分配独立权重,ATT模型公式如下:
s(pi,r)=tanh(piWs)r (2)
Figure BDA0003572463400000081
Figure BDA0003572463400000082
P(r|es,et)=f(WP(c+r)) (5)
式中,s(pi,r)为,pi为,Ws为,r为,αi为路径i的独立权重,n为,
Figure BDA0003572463400000083
为,c为加权计算后得到的候选关系状态向量,P(r|es,et)为头尾实体的概率得分,es为,et为,WP(c+r)为,f为激活函数;
ATT模型经过加权运算之后集合路径基本信息,在丢弃与候选关系相关度较低的路径的同时保留相关性强的路径;
ATT模型的损失函数为:
Figure BDA0003572463400000084
式中,L(θ)为为ATT模型的损失函数,N为,
Figure BDA0003572463400000085
为,λ为,θ为;
式(2)表示路径语义相关度得分,式(3)表示每条路径的独立权重,式(4)表示经加权计算后得到的候选关系状态向量,式(5)表示头尾实体的概率得分,激活函数选用sigmoid。经过加权运算之后可以集合路径基本信息,在丢弃与候选关系相关度较低的路径的同时保留相关性强的路径。推理模型采用Adam优化器进行训练,损失函数可表示为式(6),当训练误差最低时,分别为正例三元组和负例三元组赋予较高和较低的值,调整参数后采用L2范数正则化的方式防止出现过拟合,得出隐藏三元组路径推理结果,由此实现知识图谱隐含关系的推理和图谱的补全。
4、如图3所示,步骤S4具体包括以下内容:
S41、用jieba分词法对文本进行分词。
S42、使用Word2vec方法进行故障属性特征提取,根据类别建立故障信息表。
步骤S41具体内容如下:
S411、利用jieba分词法对案例的故障部位和故障现象进行分词,将不同类型的特征进行分类。从分词结果中去除停用词库中无价值的词。
S412、案例库以数据表的形式创建,以故障特征为例,将故障特征编号、故障特征名称和案例编号逐条列出存储于表中,依次建立故障现象存储表和解决方案表。
步骤S42具体内容如下:
S421、对故障特征的提取主要针对故障案例信息中故障部位和故障现象故障要素,特征提取完成后存入故障特征表。
S422、构建故障特征词库和停用词库。特征词库用来存放装备的一些专有名称、专用动作词汇等;停用词库主要存储一些连接词、修饰词等无价值的词。
S423、使用Wordvec算法在去除停用词后抽取出可表示案例的关键词。
5、如图4所示,步骤S5具体包括以下步骤:
S51:依据模糊偏好关系确定属性的主观权重;
S52:根据案例资源知识图谱确定属性的客观权重;
S53:根据主观权重和客观权重计算属性的综合权重;
S54:根据综合权重,通过神经网络计算当前数据对应的案例与预设的历史案例的总体相似度;
S55:完成CBRDA-KG决策模型的构建。
步骤S51具体包括以下步骤:
S511:建立模糊偏好关系矩阵Y=(yij)n×n,其中,yij表示属性Ci相比于属性Cj的重要程度,yij满足:
1)yij≥0;
2)yij+yji=1,
Figure BDA0003572463400000091
3)yii=0.5,
Figure BDA0003572463400000092
4)yij+yji+yki=1.5,
Figure BDA0003572463400000093
5)
Figure BDA0003572463400000094
式中,i和j均为属性C的下标,n为属性的总数;
yij表示属性Ci相比于属性Cj的重要程度,可由相关领域专家给出。
Figure BDA0003572463400000095
S512:根据模糊偏好关系矩阵确定属性的主观权重的优化模型,优化模型的表达式为:
Figure BDA0003572463400000096
Figure BDA0003572463400000101
式中,ω′j为主观权重;
S513:求解优化模型,求解过程的计算表达式为:
Figure BDA0003572463400000102
Figure BDA0003572463400000103
式中,λ为拉格朗日系数。
步骤S52具体包括:
S521:按照案例库中的相似度计算结果确定各属性的权重值,分别计算案例库中全部属性与对应属性的相似度,对结果取均值,之后再对全部属性进行归一化处理,进而得出各个属性对应的客观权重值。
S522:记各属性的相似度为sij,综合计算所有的第i个属性的相似度为
Figure BDA0003572463400000104
m表示案例库中的样本总数,n表示属性总数。之后依照属性相似度进行归一化处理,得出每个属性的客观权重值ω″j
Figure BDA0003572463400000105
步骤S53具体内容如下:
在分别确定属性的主观权重和客观权重之后,对二者进行加权处理,考虑到主观和客观的重要性后,令二者系数分别为0.5,当然也可根据实际情况进行非等同情况的赋值,为此,综合权重为:
Figure BDA0003572463400000108
步骤S54具体包括:
S541:将X=[x1,x2,…,xn]T作为输入样本,载入RBF神经网络中,采用Y=[y1,y2,…,yn]T作为输出,RBF神经网络的隐层采用径向对称的高斯函数;
Figure BDA0003572463400000106
其中ri(x)表示第i个层节点的输出,ci表示第i个隐层节点的中心值,σ表示第i个隐层节点的方差,l为隐层节点数;
S542:RBF神经网络的输出为:
Figure BDA0003572463400000107
式中,ω为输出层权值;
S543:选取l个中心做聚类,对于高斯核函数的径向基,有:
Figure BDA0003572463400000111
Figure BDA0003572463400000112
其中cmax为中心点之间的最大距离;
通过RBF神经网络,计算总体相似度。
6、使用过程:
经权重计算后,得出案例的综合相似度。当检索到相似度值为1的源特征时,直接从故障数据库获取该案例的故障原因及解决方案,目标案例不保存。当检索到的相似度小于1时,则将相似源案例的解决方案作为目标案例的建议解,并根据实际情况进行解方案的修正,将修正后的方案作为最终解决方案,并将该案例作为新案例保存到案例库,实现案例库的更新。
具体地,本实施例方案的具体过程包括以下步骤:
S1、获取故障记录和数据知识,并对采集到的故障记录信息进行整理。
S2、经数据清洗后获取实体间所有关系路径以及实体关系三元组,构建案例资源知识图谱。
S3、基于CNN-BiLSTM-ATT模型,构建知识推理模型,得到隐藏关系路径表示。
S4、基于jieba分词和Word2vec-RBF提取资源库中属性特征信息。
S5、综合计算属性的权重值,,应用RBF神经网络进行训练,得出当前案例与历史案例总体相似度,完成CBRDA-KG方法模型的构建。
S6、将实际故障案例信息输入构建的CBRDA-KG决策模型,得出故障诊断结果,实现案例库的构建及更新。
本实施例中,故障信息数据集来自宝武智维设备故障诊断日志,故障信息表共183个,故障要素6个,特征数为24。
首先对长段落中文文本故障知识进行识别,剔除与故障诊断信息无关的字句。如图1所示,具体为:
S1、对余下的字句进行特征抽取,挑选出需要故障要素、故障说明、案例编号、故障特征、特征编号、故障现象、解决方案及编号,将其作为实体,确定实体之间的关系。并对采集到的故障记录信息进行整理。
S2、经数据整理后提取出实体间所有关系路径以及实体关系三元组,构建故障案例资源库。
S3、基于CNN-BiLSTM-ATT模型,构建知识推理模型。
S31、将头尾实体以及对应关系进行向量表示,并将其作为卷积编码器的输入,输出特征向量。
S32、将输出特征向量作为BiLSTM的输入,通过双向传递得出状态序列,输出编码路径向量表示集合并将其作为ATT的输入,进行路径集成表示。
S33、计算每条路径的语义相关度得分,由此实现为每条路径分配独立权重。
S34、输出经推理后补全的三元组,并进行知识图谱的补全和更新。
S4、基于jieba分词和Word2vec-RBF提取资源库中属性特征信息,应用RBF神经网络进行训练。
S41、利用jieba分词法对案例的故障部位和故障现象进行分词。再从分词结果中去除停用词库中无价值的词
S42、使用Word2vec提取出案例信息的关键属性特征词。
S5、综合计算属性的权重值,得出当前案例与历史案例总体相似度,构建CBRDA-KG方法模型。
S51、依据主观客观相结合的计算提取出的属性特征词权重。
S52、将其输入RBF神经网络进行训练,计算总体相似度。
S6、得出最终的故障诊断结果,实现案例库的构建及更新。
如图5所示,本实施例根据故障属性进行历史案例的相似度计算,与案例1完成匹配,得到了对应的故障现象和故障原因。
本实施例提出的结合决策优化和基于知识图谱推理算法的决策算法可以在充分考虑案例属性相似性的情况下,高效发挥知识图谱的推理功能,使决策推荐结果更为准确,同时,综合考虑属性的权重值也会保证推荐结果的准确性。同时,结合卷积神经网络、BiLSTM网络、注意力机制和RBF神经网络实现综合决策,可以更为精确地确定路径,针对历史案例构建案例库也可以为后续信息的循环利用和丰富打下良好基础。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种基于知识图谱的知识推理和故障诊断方法,其特征在于,包括:获取实际故障案例信息,并载入预先构建并训练好的CBRDA-KG决策模型中,得出故障诊断结果;
所述CBRDA-KG决策模型的数据处理过程包括以下步骤:
S1:获取故障记录信息和数据知识,标注故障信息的实体以及实体间的关系;
S2:对获取的数据进行数据清洗后,获取实体间所有关系路径以及实体关系三元组,构建案例资源知识图谱;
S3:将获取的关系路径信息嵌入卷积编码器中,获取路径特征向量,将该路径特征向量输入BiLSTM网络中,得到关系路径表示向量,将该关系路径表示向量输入ATT模型中,经过多步推理得到隐藏三元组路径推理结果,补全所述案例资源知识图谱;
S4:提取所述案例资源知识图谱中故障的属性特征信息;
S5:计算所述属性特征信息中各个属性的权重值,并通过神经网络计算当前数据对应的案例与预设的历史案例的总体相似度,完成CBRDA-KG决策模型的构建。
2.根据权利要求1所述的一种基于知识图谱的知识推理和故障诊断方法,其特征在于,步骤S3中,所述ATT模型的表达式为:
s(pi,r)=tanh(piWs)r
Figure FDA0003572463390000011
Figure FDA0003572463390000012
P(r|es,et)=f(WP(c+r))
式中,s(pi,r)为语义相关度得分,pi为第i个隐藏层的输出值,Ws为权值矩阵,r为概率得分,αi为路径i的独立权重,n为词数,
Figure FDA0003572463390000013
为softmax函数,c为加权计算后得到的候选关系状态向量,P(r|es,et)为头尾实体的概率得分,es为头实体,et为尾实体,WP(c+r)为概率权重,f为激活函数;
所述ATT模型经过加权运算之后集合路径基本信息,在丢弃与候选关系相关度较低的路径的同时保留相关性强的路径;
所述ATT模型的损失函数为:
Figure FDA0003572463390000021
式中,L(θ)为为ATT模型的损失函数,N为实验次数,
Figure FDA0003572463390000022
为目标函数,λ为正则化率,θ为正则化参数;
所述ATT模型采用Adam优化器进行训练,当训练误差最低时,分别为正例三元组和负例三元组赋予较高和较低的值,调整参数后采用L2范数正则化的方式防止出现过拟合,得出隐藏三元组路径推理结果。
3.根据权利要求1所述的一种基于知识图谱的知识推理和故障诊断方法,其特征在于,步骤S4具体包括以下步骤:
S41:采用分词法对所述案例资源知识图谱中的文本进行分词;
S42:采用Word2vec方法对分词后的文本进行故障属性特征提取,根据类别建立故障信息表。
4.根据权利要求3所述的一种基于知识图谱的知识推理和故障诊断方法,其特征在于,步骤S41具体包括以下步骤:
S411:采用jieba分词法对案例资源知识图谱中的故障部位和故障现象进行分词,将不同类型的特征进行分类,并进行分词筛选;
S412:对分词后的数据,以数据表的形式创建案例库。
5.根据权利要求4所述的一种基于知识图谱的知识推理和故障诊断方法,其特征在于,步骤S42具体包括以下步骤:
S421:针对故障案例信息中故障部位和故障现象故障要素,进行故障特征提取,并存入故障特征表;
S422:构建故障特征词库和停用词库;
S423:使用Wordvec算法在对分词后的数据去除停用词后抽取出可表示案例的关键词。
6.根据权利要求1所述的一种基于知识图谱的知识推理和故障诊断方法,其特征在于,步骤S5具体包括以下步骤:
S51:依据模糊偏好关系确定属性的主观权重;
S52:根据案例资源知识图谱确定属性的客观权重;
S53:根据所述主观权重和客观权重计算属性的综合权重;
S54:根据综合权重,通过神经网络计算当前数据对应的案例与预设的历史案例的总体相似度;
S55:完成CBRDA-KG决策模型的构建。
7.根据权利要求6所述的一种基于知识图谱的知识推理和故障诊断方法,其特征在于,步骤S51具体包括以下步骤:
S511:建立模糊偏好关系矩阵Y=(yij)n×n,其中,yij表示属性Ci相比于属性Cj的重要程度,yij满足:
1)yij≥0;
2)
Figure FDA0003572463390000031
3)
Figure FDA0003572463390000032
4)
Figure FDA0003572463390000033
5)
Figure FDA0003572463390000034
式中,i和j均为属性C的下标,n为属性的总数;
S512:根据模糊偏好关系矩阵确定属性的主观权重的优化模型,优化模型的表达式为:
Figure FDA0003572463390000035
Figure FDA0003572463390000036
式中,ω′j为主观权重;
S513:求解所述优化模型,求解过程的计算表达式为:
Figure FDA0003572463390000037
Figure FDA0003572463390000038
式中,λ为拉格朗日系数。
8.根据权利要求6所述的一种基于知识图谱的知识推理和故障诊断方法,其特征在于,步骤S52具体包括:
按照案例资源知识图谱中的相似度计算结果确定各属性的权重值,分别计算案例库中全部属性与对应属性的相似度,对相似度计算结果取均值,之后再对全部属性进行归一化处理,进而得出各个属性对应的客观权重值,所述客观权重值的计算表达式为:
Figure FDA0003572463390000041
式中,ω″j为属性j的客观权重值,sij为属性i与属性j之间的相似度。
9.根据权利要求6所述的一种基于知识图谱的知识推理和故障诊断方法,其特征在于,步骤S54具体包括:
S541:将X=[x1,x2,…,xn]T作为输入样本,载入RBF神经网络中,采用Y=[y1,y2,…,yn]T作为输出,RBF神经网络的隐层采用径向对称的高斯函数;
Figure FDA0003572463390000042
其中ri(x)表示第i个层节点的输出,ci表示第i个隐层节点的中心值,σ表示第i个隐层节点的方差,l为隐层节点数;
S542:所述RBF神经网络的输出为:
Figure FDA0003572463390000043
式中,ω为输出层权值,h为隐藏层数量,m为j层节点总数;
S543:选取l个中心做聚类,对于高斯核函数的径向基,有:
Figure FDA0003572463390000044
Figure FDA0003572463390000045
其中cmax为中心点之间的最大距离;
通过所述RBF神经网络,计算总体相似度。
10.根据权利要求1所述的一种基于知识图谱的知识推理和故障诊断方法,其特征在于,当故障诊断结果中,检索到相似度值为1的源特征时,直接从源特征对应的故障数据库获取该案例的故障原因及解决方案,当前案例不保存;
当故障诊断结果中,检索到的相似度值小于1时,则将相似源案例的解决方案作为当前案例的建议解,并根据实际情况进行解方案的修正,将修正后的方案作为最终解决方案,并将该案例作为新案例保存到案例库,实现案例库的更新。
CN202210328887.1A 2022-03-30 2022-03-30 一种基于知识图谱的知识推理和故障诊断方法 Pending CN114756686A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210328887.1A CN114756686A (zh) 2022-03-30 2022-03-30 一种基于知识图谱的知识推理和故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210328887.1A CN114756686A (zh) 2022-03-30 2022-03-30 一种基于知识图谱的知识推理和故障诊断方法

Publications (1)

Publication Number Publication Date
CN114756686A true CN114756686A (zh) 2022-07-15

Family

ID=82328900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210328887.1A Pending CN114756686A (zh) 2022-03-30 2022-03-30 一种基于知识图谱的知识推理和故障诊断方法

Country Status (1)

Country Link
CN (1) CN114756686A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115858324A (zh) * 2023-02-02 2023-03-28 北京神州光大科技有限公司 基于ai的it设备故障处理方法、装置、设备和介质
CN116226541A (zh) * 2023-05-11 2023-06-06 湖南工商大学 一种基于知识图谱的网络热点信息推荐方法、系统及设备
CN116304109A (zh) * 2023-03-30 2023-06-23 上海云思智慧信息技术有限公司 基于会议知识图谱的检索方法、系统、介质及电子设备
CN116611593A (zh) * 2023-07-21 2023-08-18 蘑菇物联技术(深圳)有限公司 用于预测空压机的故障的方法、设备和介质
CN117272170A (zh) * 2023-09-20 2023-12-22 东旺智能科技(上海)有限公司 一种基于知识图谱的it运维故障根因分析方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115858324A (zh) * 2023-02-02 2023-03-28 北京神州光大科技有限公司 基于ai的it设备故障处理方法、装置、设备和介质
CN115858324B (zh) * 2023-02-02 2023-05-12 北京神州光大科技有限公司 基于ai的it设备故障处理方法、装置、设备和介质
CN116304109A (zh) * 2023-03-30 2023-06-23 上海云思智慧信息技术有限公司 基于会议知识图谱的检索方法、系统、介质及电子设备
CN116226541A (zh) * 2023-05-11 2023-06-06 湖南工商大学 一种基于知识图谱的网络热点信息推荐方法、系统及设备
CN116611593A (zh) * 2023-07-21 2023-08-18 蘑菇物联技术(深圳)有限公司 用于预测空压机的故障的方法、设备和介质
CN117272170A (zh) * 2023-09-20 2023-12-22 东旺智能科技(上海)有限公司 一种基于知识图谱的it运维故障根因分析方法
CN117272170B (zh) * 2023-09-20 2024-03-08 东旺智能科技(上海)有限公司 一种基于知识图谱的it运维故障根因分析方法

Similar Documents

Publication Publication Date Title
CN114756686A (zh) 一种基于知识图谱的知识推理和故障诊断方法
Singh et al. A review of studies on machine learning techniques
CN110929847A (zh) 一种基于深度卷积神经网络的换流变压器故障诊断方法
Islam et al. InceptB: a CNN based classification approach for recognizing traditional bengali games
CN114417913B (zh) 基于pc-tcn和迁移学习的轴承寿命预测方法
CN113673482B (zh) 基于动态标签分配的细胞抗核抗体荧光识别方法及系统
CN116541510A (zh) 一种基于知识图谱的故障案例推荐方法
CN110569761B (zh) 一种基于对抗学习的手绘草图检索遥感图像的方法
CN114580638A (zh) 基于文本图增强的知识图谱表示学习方法及系统
CN115658673A (zh) 一种基于大数据建模的电力数据质量离群检测方法
CN114881173A (zh) 基于自注意力机制的简历分类方法和装置
CN111709225A (zh) 一种事件因果关系判别方法、装置和计算机可读存储介质
CN113779988A (zh) 一种通信领域过程类知识事件抽取方法
Tiruneh et al. Feature selection for construction organizational competencies impacting performance
CN116452241B (zh) 一种基于多模态融合神经网络的用户流失概率计算方法
CN111079840B (zh) 基于卷积神经网络和概念格的图像语义完备标注方法
CN117094835A (zh) 面向社交媒体内容的多目标群体分类方法
CN116226404A (zh) 一种针对肠-脑轴的知识图谱构建方法及知识图谱系统
Ashtaiwi Artificial intelligence is transforming the world development indicators
CN114022698A (zh) 一种基于二叉树结构的多标签行为识别方法及装置
CN114328474A (zh) 一种基于关系交互的块分解的智能搜索补全方法
CN114254199A (zh) 基于二分图投影和node2vec的课程推荐方法
CN113921145A (zh) 一种面向动态医疗数据的因果特征提取方法
Kau et al. An overview and comparison of machine learning techniques
Sivapurnima et al. Adaptive Deep Learning Model for Software Bug Detection and Classification.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination