CN114580263A - 基于知识图谱的信息系统故障预测方法及相关设备 - Google Patents
基于知识图谱的信息系统故障预测方法及相关设备 Download PDFInfo
- Publication number
- CN114580263A CN114580263A CN202111476994.0A CN202111476994A CN114580263A CN 114580263 A CN114580263 A CN 114580263A CN 202111476994 A CN202111476994 A CN 202111476994A CN 114580263 A CN114580263 A CN 114580263A
- Authority
- CN
- China
- Prior art keywords
- data
- fault
- information data
- fault prediction
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本申请提供一种基于知识图谱的信息系统故障预测方法及相关设备,所述方法包括:获取信息系统的信息数据;对所述信息数据进行预处理;基于经过所述预处理的所述信息数据构建故障预测知识图谱;从所述故障预测知识图谱中提取全部节点和边;将全部所述节点和所述边输入至经过预训练的故障预测模型中,通过所述故障预测模型输出所述信息数据对应的故障预测结果。本申请基于故障预测结果实现了故障的提前预测,从而有效降低信信息系统的故障发生频次,进而解决因故障所导致的信息系统效率降低、资源消耗过多的问题。
Description
技术领域
本申请涉及技术领域,尤其涉及一种基于知识图谱的信息系统故障预测方法及相关设备。
背景技术
随着网络信息化的迅速发展,信息技术已经深入到人民生活的多个环节。随着信息系统的愈发完善,信息系统在运行过程中会产生大量的信息日志数据,包括数据库状态、网络设备状态、操作系统状态等系统的运行日志以及端口、综合网管-主机等性能与告警相关日志。由于信息系统的日志资源过于庞大,当信息系统发生故障时,进行故障定位、诊断和恢复所需的工作量较大,会导致信息系统效率降低,资源消耗过多等问题。
发明内容
有鉴于此,本申请的目的在于提出一种基于知识图谱的信息系统故障预测方法及相关设备。
基于上述目的,本申请提供了一种基于知识图谱的信息系统故障预测方法,包括:
获取信息系统的信息数据;
对所述信息数据进行预处理;
基于经过所述预处理的所述信息数据构建故障预测知识图谱;
从所述故障预测知识图谱中提取全部节点和边;
将全部所述节点和所述边输入至经过预训练的故障预测模型中,通过所述故障预测模型输出所述信息数据对应的故障预测结果。
进一步的,所述信息数据包括性能数据和告警数据。
进一步的,所述对所述信息数据进行预处理,包括:
对所述信息数据进行数据清理,去除不完整数据和冗余数据;
对所述信息数据中的半结构化数据进行提取和补充,以转化为结构化数据;
对所述信息数据进行归一化处理。
进一步的,所述基于经过所述预处理的所述信息数据构建故障预测知识图谱,包括:
基于预设的信息系统设备手册和相关知识库确定所述信息数据中的每一个实体与预设的故障类型的关联性,基于所述关联性从所述实体中选取部分实体作为所述故障预测知识图谱的节点,并确定相邻所述节点之间的关系,基于全部所述节点和所述关系构建所述故障预测知识图谱。
进一步的,所述故障预测模型包括单层的全连接神经网络和图神经网络GNN。
进一步的,所述将全部所述节点和所述边输入至经过预训练的故障预测模型中,通过所述故障预测模型输出所述信息数据对应的故障预测结果,包括:
基于全部所述节点和所述边通过所述全连接神经网络分别输出所述节点对应的节点词向量和所述边对应的边词向量;
基于全部所述节点词向量和所述边词向量通过所述图神经网络GNN,输出所述信息数据对应的所述故障预测结果。
进一步的,所述故障预测模型的预训练过程,包括:
构建数据集和预训练模型;
将所述数据集划分为训练集和验证集;
将所述训练集输入所述预训练模型,通过计算确定损失函数;
通过对所述损失函数进行最小化计算,以对所述预训练模型进行迭代训练;
在每一次所述迭代训练后,将所述验证集输入所述预训练模型,基于所述预训练模型的输出结果确定所述预训练模型的预测准确率;
响应于确定在连续的预设迭代次数中,所述损失函数的数值未发生变化,且所述预测准确率呈现上升趋势或保持不变,则停止对所述预训练模型的迭代训练。
基于同一发明构思,本申请还提供了一种基于知识图谱的信息系统故障预测装置,包括:
获取模块,被配置为获取信息系统的信息数据;
预处理模块,被配置为对所述信息数据进行预处理;
知识图谱构建模块,被配置为基于经过所述预处理的所述信息数据构建故障预测知识图谱;
提取模块,被配置为从所述故障预测知识图谱中提取全部节点和边;
故障预测模块,被配置为将全部所述节点和所述边输入至经过预训练的故障预测模型中,通过所述故障预测模型输出所述信息数据对应的故障预测结果。
基于同一发明构思,本申请还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如上所述的方法。
基于同一发明构思,本申请还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行如上所述的方法。
从上面所述可以看出,本申请提供的基于知识图谱的信息系统故障预测方法及相关设备,通过构建故障预测知识图谱对所述信息数据进行可解释的描述,将信息数据与故障类型进行关联,再通过故障预测模型对故障预测知识图谱中的节点和边进行计算处理,以输出故障预测结果。基于故障预测结果实现了故障的提前预测,从而有效降低信息系统的故障发生频次,进而解决因故障所导致的信息系统效率降低、资源消耗过多的问题。
附图说明
为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的基于知识图谱的信息系统故障预测方法的流程示意图;
图2为本申请实施例的故障预测模型的预训练的流程示意图;
图3为本申请实施例的基于知识图谱的信息系统故障预测装置的结构示意图;
图4为本申请实施例的电子设备硬件结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。
需要说明的是,除非另外定义,本申请实施例使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
如背景技术所述,传统信息系统故障预测以基于历史数据的方法和基于物理模型的方法为主,对于故障预测的精度无法达到令人满意的程度。其中,基于历史数据的故障预测方法主要通过对各项系统参数属性进行分析,通过观察以往发生故障时直接反应系统状态数据参数的数值,制定出相应系统的故障预测规则。基于物理模型的故障预测方法涉及的主要预测模型包括:基于自回归滑动平均模型ARMA(Autoregressive moving averagemodel)的故障预测模型、基于贝叶斯的故障预测模型以及基于马尔科夫的故障预测方法等。
传统的故障预测方法难以对众多复杂数据建立关系,部分数据间的关系难以用数学模型表示,传统故障预测方法对数据关联性的建立仍存在不足。由于信息日志数据的详细分析所需的任务量巨大,通过现有技术处理数据较为困难,因而建立的数据关系不够明显。故障预测技术缺乏对海量的异构的性能数据的分析手段以及缺乏对告警信息的分析,无法通过告警数据以及性能数据间的关系生成智能化的故障预测机制。
此外,由于信息系统数据之间的关联程度差别较大且数据质量不一致,传统故障预测方法对于此问题的解决不尽人意,所以基于神经网络的故障预测算法被提出。神经网络是机器学习的一种子类,常用的神经网络有前馈神经网络FNN(Feedforward NeuralNetworks)、卷积神经网络CNN(Convolutional Neural Networks)和循环神经网络RNN(Recurrent Neural Networks)等。以神经网络为代表的人工智能技术具有强特征学习能力的特点,其对于大量且复杂的数据处理可以达到精准分析处理的程度,使得故障预测模型更加完善。
但是,普通神经网络对于无规则输入的信息数据处理能力较差,对于知识图谱的处理速度随着信息日志数据的增加而减慢,推理速度降低。通过普通神经网络处理后的数据生成的故障预测规则精度较低,当系统结构变得复杂时,现有系统故障预测的模型无法对数据进行有效地处理,故障预测准确性以及可靠性降低。
图神经网络是将图结构与神经网络相结合的一种神经网络变体。现实世界中,数据不只有图像、音频、文字等欧几里得数据的表现形式,图结构也是很重要的数据表现形式,二维的图片和一维的文本只是图结构的特例。相比于传统神经网络只能处理欧几里得数据,图神经网络可以更好地处理图结构输入,可以对图结构中无顺序的数据进行建模。
目前,现有技术中存在采用深度学习的方法进行故障预测,但是没有将知识图谱与深度学习相结合。同时,对于系统日志数据的分析处理,目前仅仅针对信息系统的性能数据进行故障预测的研究,没有结合信息系统的告警数据进行联合分析。因而,现有的故障预测技术并没有从多个维度处理关联数据。
本申请考虑到知识图谱为异构图的特性,可以有效地对信息系统日志中的多种类、多层级数据之间的关联性进行建模。再利用图神经网络GNN(Graph Neural Network)对图结构数据的高效表示性,生成一种对于信息系统故障预测的有效规则,通过得到的故障预测规则进行故障事件预测,实现信息系统中高精度、高可靠故障预测的目标。
以下结合附图来详细说明本申请的实施例。
本申请提供了一种基于知识图谱的信息系统故障预测方法,参考图1,包括以下几个步骤:
步骤S101、获取信息系统的信息数据。信息系统的数据是多元化、异构化的。需要对信息系统的数据库、网络设备、操作系统、端口和网络流量等信息日志数据进行采集。本实施例中获取的信息数据为一段时间内的所述信息系统产生的数据,通过一段时间内的数据变化分析完成对信息系统故障的预测。
步骤S102、对所述信息数据进行预处理。采集到的信息系统的数据包括多种类型,针对不同类型的数据分别需要不同的数据处理方式。同时,对所述信息数据进行预处理过滤掉一些对故障产生无影响的信息数据,减少后续数据分析时的工作量,无影响的信息数据包括一些在正常阈值范围内的数据及信息系统日志数据。
步骤S103、基于经过所述预处理的所述信息数据构建故障预测知识图谱。通过找出所述信息数据中每个数据与故障类型之间的联系,将不同的信息数据与故障类型进行关联,构建故障预测知识图谱。通过故障预测知识图谱可以直观体现出信息数据的变化对故障发生产生的影响,从而为信息系统的故障预测规则和故障预测结果提供支撑基础。
步骤S104、从所述故障预测知识图谱中提取全部节点和边。将上述步骤中得到的故障预测知识图谱中的节点和边进行提取,提取故障预测是指图谱中实体对应的节点信息、实体与实体之间关系对应的边信息。
步骤S105、将全部所述节点和所述边输入至经过预训练的故障预测模型中,通过所述故障预测模型输出所述信息数据对应的故障预测结果。本实施例中的故障预测结果为故障发生的概率,通过输入所述节点和所述边进行计算,得到对应于每个预设的故障类型的得分,得分超过预设阈值时,判定信息系统发生该故障。其中,本实施例中预设阈值设置为0.5,在实际应用中预设阈值的具体数值可根据实际情况进行调整。通过故障预测结果可以对未来一段时间内所述信息系统可能发生的故障进行预测,有效提高对信息系统的故障预测的准确度和可靠度。
在一些实施例中,所述信息数据包括性能数据和告警数据。目前,现有的故障预测技术没有结合信息系统的告警数据进行故障预测,因此不能实现从多个维度处理关联数据。信息系统发出告警数据并不等同于发生故障,当信息系统发生告警时不一定发生故障,因此需要结合性能数据和告警数据对可能发生的故障类型进行分析,才能够有效提高故障预测的准确率。本实施例中对于性能数据需要采集故障发生时刻或非故障发生时刻前2小时左右的连续数据,采集的时长约为15分钟,以保证数据的可靠性与准确性。对于告警数据,则需要对发生故障时的告警数据和非故障时的告警数据进行标注区分,保证告警数据与故障类型的明确关联关系。同时,为了保证故障月模型能够有有效的进行学习训练,针对故障发生时的性能数据和告警数据,需要采集千级别的数据量,针对故障未发生时的性能数据和告警数据,需要采集万级别的数据量。
在一些实施例中,所述对所述信息数据进行预处理,包括:
对所述信息数据进行数据清理,去除不完整数据和冗余数据;
对所述信息数据中的半结构化数据进行提取和补充,以转化为结构化数据;
对所述信息数据进行归一化处理。
具体的,信息数据数量通常较为庞大,信息数据的质量也参差不齐。首选需要剔除不完整的数据和冗余的数据,再将数据分为结构化数据和半结构化数据。对于结构化的数据进行知识表示和质量评估,从中挑选出合适的实体以进一步构建故障预测知识图谱。对于半结构化的数据,对其进行数据包装和知识抽取,将半结构化数据转化为结构化数据再进行实体的提取。最后,对信息数据进行归一化处理,有利于统一故障预测标准。
在一些实施例中,所述基于经过所述预处理的所述信息数据构建故障预测知识图谱,包括:
基于预设的信息系统设备手册和相关知识库确定所述信息数据中的每一个实体与预设的故障类型的关联性,基于所述关联性从所述实体中选取部分实体作为所述故障预测知识图谱的节点,并确定相邻所述节点之间的关系,基于全部所述节点和所述关系构建所述故障预测知识图谱。
具体的,故障预测知识图谱中的节点表示实体,边表示关系。由于信息系统的数据类型繁多,对于知识图谱的节点选择较为关键。所以在信息系统中根据对应的设备手册及专家经验知识库结合的方式索引性能数据与告警数据与故障关联性较强的数据作为实体,从而建立实体与实体间的关系。其中,节点信息,边的类型以及实体具备的属性都需要根据信息系统的信息数据进行定义。根据实体-关系-实体的逻辑建立故障预测知识图谱,每个实体都具备相应的属性。故障预测知识图谱需根据信息数据进行建立,系统故障的发生必定会通过信息数据的变化而表现出来,当一个节点及其关联节点的数据发生变化时可以通过故障预测知识图谱进行直观体现,本实施例中构建的故障预测知识图谱分为性能数据知识图谱和告警数据知识图谱。
在一些实施例中,所述故障预测模型包括单层的全连接神经网络和图神经网络GNN。在所述图神经网络之前设置一层全连接神经网络,当对故障预测模型进行预训练时,同时优化全连接神经网络和图神经网络中的各个参数。
在一些实施例中,所述将全部所述节点和所述边输入至经过预训练的故障预测模型中,通过所述故障预测模型输出所述信息数据对应的故障预测结果,包括:
基于全部所述节点和所述边通过所述全连接神经网络分别输出所述节点对应的节点词向量和所述边对应的边词向量;
基于全部所述节点词向量和所述边词向量通过所述图神经网络GNN,输出所述信息数据对应的所述故障预测结果。
具体的,选取所述全连接神经网络作为词嵌入模型,通过全连接神经网络对输入的所述节点和所述边进行编码以得到所述节点词向量和所述边词向量。所述全连接神经网络会随着所述故障预测模型的预训练自动调整所述节点词向量和所述边词向量的输出,将文本及数值型数据转换为高维空间中利于神经网络处理的向量数据格式。将所述节点词向量和所述边词向量输入至所述图神经网络中,以得到所述信息数据对应的所述故障预测结果。
在一些实施例中,所述故障预测模型的预训练过程,包括以下步骤:
步骤S201、构建数据集和预训练模型;
步骤S202、将所述数据集划分为训练集和验证集;
步骤S203、将所述训练集输入所述预训练模型,通过计算确定损失函数;
步骤S204、通过对所述损失函数进行最小化计算,以对所述预训练模型进行迭代训练;
步骤S205、在每一次所述迭代训练后,将所述验证集输入所述预训练模型,基于所述预训练模型的输出结果确定所述预训练模型的预测准确率;
步骤S206、响应于确定在连续的预设迭代次数中,所述损失函数的数值未发生变化,且所述预测准确率呈现上升趋势或保持不变,则停止对所述预训练模型的迭代训练。
具体的,所述数据集来源于信息系统产生的大量信息数据,对信息数据进行预处理后构建故障预测知识图谱,提取所述故障预测知识图谱中的全部节点和边以构成所述数据集,所述数据集中的元素所对应的故障类型是已知的。参考图2所示的故障预测模型的预训练过程,将所述数据集划分为训练集和验证集,所述训练集占所述数据集的比例为70%,所述验证集占所述数据集的比例为30%。通过训练集对所述预训练模型进行迭代训练,迭代训练的目标是对损失函数进行最小化计算,其中,损失函数的表达式具体为
其中,N为训练集中的样本数据总量,1≤i≤N,yi表示样本i的标签,y=1时表示发生故障,y=0时表示未发生故障,pi表示预训练模型输出的故障的概率。本实施例中通过随机梯度下降的优化方法优化损失函数,再通过梯度方向传播更新预训练模型的参数,不断迭代完成对预训练模型的训练过程。
在每一次所述迭代训练完成后,通过测试集对所述预训练模型的准确率进行测试。结合损失函数的数值和预测准确率对预训练模型的训练程度进行判定,判断预训练模型的训练结果是否满足截止条件。本实施例中的截止条件设置为在连续的预设迭代次数中,所述损失函数的数值未发生变化,同时所述预测准确率呈现上升趋势或保持不变。其中,所述预设迭代次数设置为7次。在具体的迭代训练过程中,预设迭代次数的设置可以根据实际情况进行调整,并不局限于本实施例中设置的次数。当对预训练模型的迭代训练满足截止条件时,则停止对所述预训练模型的训练,得到具有良好预测能力的故障预测模型。
需要说明的是,本申请实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本申请的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种基于知识图谱的信息系统故障预测装置。
参考图3,所述基于知识图谱的信息系统故障预测装置,包括:
获取模块301,被配置为获取信息系统的信息数据;
预处理模块302,被配置为对所述信息数据进行预处理;
知识图谱构建模块303,被配置为基于经过所述预处理的所述信息数据构建故障预测知识图谱;
提取模块304,被配置为从所述故障预测知识图谱中提取全部节点和边;
故障预测模块305,被配置为将全部所述节点和所述边输入至经过预训练的故障预测模型中,通过所述故障预测模型输出所述信息数据对应的故障预测结果。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述任一实施例中相应的基于知识图谱的信息系统故障预测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的基于知识图谱的信息系统故障预测方法。
图4示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的基于知识图谱的信息系统故障预测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的基于知识图谱的信息系统故障预测方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的基于知识图谱的信息系统故障预测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本申请实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本申请实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本申请实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本申请的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本申请实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本申请的具体实施例对本申请进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本申请实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本申请实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于知识图谱的信息系统故障预测方法,其特征在于,包括:
获取信息系统的信息数据;
对所述信息数据进行预处理;
基于经过所述预处理的所述信息数据构建故障预测知识图谱;
从所述故障预测知识图谱中提取全部节点和边;
将全部所述节点和所述边输入至经过预训练的故障预测模型中,通过所述故障预测模型输出所述信息数据对应的故障预测结果。
2.根据权利要求1所述的故障预测方法,其特征在于,所述信息数据包括性能数据和告警数据。
3.根据权利要求1所述的故障预测方法,其特征在于,所述对所述信息数据进行预处理,包括:
对所述信息数据进行数据清理,去除不完整数据和冗余数据;
对所述信息数据中的半结构化数据进行提取和补充,以转化为结构化数据;
对所述信息数据进行归一化处理。
4.根据权利要求1所述的故障预测方法,其特征在于,所述基于经过所述预处理的所述信息数据构建故障预测知识图谱,包括:
基于预设的信息系统设备手册和相关知识库确定所述信息数据中的每一个实体与预设的故障类型的关联性,基于所述关联性从所述实体中选取部分实体作为所述故障预测知识图谱的节点,并确定相邻所述节点之间的关系,基于全部所述节点和所述关系构建所述故障预测知识图谱。
5.根据权利要求1所述的故障预测方法,其特征在于,所述故障预测模型包括单层的全连接神经网络和图神经网络GNN。
6.根据权利要求5所述的故障预测方法,其特征在于,所述将全部所述节点和所述边输入至经过预训练的故障预测模型中,通过所述故障预测模型输出所述信息数据对应的故障预测结果,包括:
基于全部所述节点和所述边通过所述全连接神经网络分别输出所述节点对应的节点词向量和所述边对应的边词向量;
基于全部所述节点词向量和所述边词向量通过所述图神经网络GNN,输出所述信息数据对应的所述故障预测结果。
7.根据权利要求1所述的故障预测方法,其特征在于,所述故障预测模型的预训练过程,包括:
构建数据集和预训练模型;
将所述数据集划分为训练集和验证集;
将所述训练集输入所述预训练模型,通过计算确定损失函数;
通过对所述损失函数进行最小化计算,以对所述预训练模型进行迭代训练;
在每一次所述迭代训练后,将所述验证集输入所述预训练模型,基于所述预训练模型的输出结果确定所述预训练模型的预测准确率;
响应于确定在连续的预设迭代次数中,所述损失函数的数值未发生变化,且所述预测准确率呈现上升趋势或保持不变,则停止对所述预训练模型的迭代训练。
8.一种基于知识图谱的信息系统故障预测装置,其特征在于,包括:
获取模块,被配置为获取信息系统的信息数据;
预处理模块,被配置为对所述信息数据进行预处理;
知识图谱构建模块,被配置为基于经过所述预处理的所述信息数据构建故障预测知识图谱;
提取模块,被配置为从所述故障预测知识图谱中提取全部节点和边;
故障预测模块,被配置为将全部所述节点和所述边输入至经过预训练的故障预测模型中,通过所述故障预测模型输出所述信息数据对应的故障预测结果。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。
10.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令用于使计算机执行权利要求1至7任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111476994.0A CN114580263A (zh) | 2021-12-02 | 2021-12-02 | 基于知识图谱的信息系统故障预测方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111476994.0A CN114580263A (zh) | 2021-12-02 | 2021-12-02 | 基于知识图谱的信息系统故障预测方法及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114580263A true CN114580263A (zh) | 2022-06-03 |
Family
ID=81769778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111476994.0A Pending CN114580263A (zh) | 2021-12-02 | 2021-12-02 | 基于知识图谱的信息系统故障预测方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114580263A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115396929A (zh) * | 2022-08-15 | 2022-11-25 | 中国联合网络通信集团有限公司 | 性能数据的预测方法、装置及存储介质 |
CN116150341A (zh) * | 2023-04-23 | 2023-05-23 | 之江实验室 | 理赔事件检测方法、计算机设备和存储介质 |
CN116611523A (zh) * | 2023-07-18 | 2023-08-18 | 山东师范大学 | 涡轮风扇发动机的可解释故障预测方法及系统 |
CN116774569A (zh) * | 2023-07-25 | 2023-09-19 | 博纯材料股份有限公司 | 基于人工智能的氧氩分离设备运行系统更新方法及系统 |
CN117192373A (zh) * | 2023-08-08 | 2023-12-08 | 浙江凌骁能源科技有限公司 | 动力电池故障分析方法、装置、计算机设备和存储介质 |
-
2021
- 2021-12-02 CN CN202111476994.0A patent/CN114580263A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115396929A (zh) * | 2022-08-15 | 2022-11-25 | 中国联合网络通信集团有限公司 | 性能数据的预测方法、装置及存储介质 |
CN116150341A (zh) * | 2023-04-23 | 2023-05-23 | 之江实验室 | 理赔事件检测方法、计算机设备和存储介质 |
CN116611523A (zh) * | 2023-07-18 | 2023-08-18 | 山东师范大学 | 涡轮风扇发动机的可解释故障预测方法及系统 |
CN116611523B (zh) * | 2023-07-18 | 2023-09-26 | 山东师范大学 | 涡轮风扇发动机的可解释故障预测方法及系统 |
CN116774569A (zh) * | 2023-07-25 | 2023-09-19 | 博纯材料股份有限公司 | 基于人工智能的氧氩分离设备运行系统更新方法及系统 |
CN116774569B (zh) * | 2023-07-25 | 2024-04-05 | 博纯材料股份有限公司 | 基于人工智能的氧氩分离设备运行系统更新方法及系统 |
CN117192373A (zh) * | 2023-08-08 | 2023-12-08 | 浙江凌骁能源科技有限公司 | 动力电池故障分析方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114580263A (zh) | 基于知识图谱的信息系统故障预测方法及相关设备 | |
US20180268296A1 (en) | Machine learning-based network model building method and apparatus | |
KR20220113881A (ko) | 사전 훈련 모델의 생성 방법, 장치, 전자 기기 및 저장 매체 | |
CN112187554B (zh) | 一种基于蒙特卡洛树搜索的运维系统故障定位方法和系统 | |
CN111062431A (zh) | 图像聚类方法、图像聚类装置、电子设备及存储介质 | |
CN113986674A (zh) | 时序数据的异常检测方法、装置和电子设备 | |
CN113887615A (zh) | 图像处理方法、装置、设备和介质 | |
CN110705622A (zh) | 一种决策方法、系统以及电子设备 | |
CN115204318B (zh) | 事件自动层级分类方法及电子设备 | |
CN116304341A (zh) | 基于用户网络大数据的欺诈判别方法及系统 | |
WO2023173552A1 (zh) | 目标检测模型的建立方法、应用方法、设备、装置及介质 | |
CN111368864A (zh) | 识别方法、可用性评估方法及装置、电子设备、存储介质 | |
CN115186738A (zh) | 模型训练方法、装置和存储介质 | |
CN115062779A (zh) | 基于动态知识图谱的事件预测方法及装置 | |
CN114880457A (zh) | 工艺推荐模型的训练、工艺推荐方法及电子设备 | |
KR20220163362A (ko) | 불확실성 간격을 갖는 성능 예측의 생성 | |
Jagannathan | Building cyber physical systems in the context of Smart Cities | |
CN117215728B (zh) | 一种基于代理模型的仿真模拟方法、装置及电子设备 | |
CN117058498B (zh) | 分割图评估模型的训练方法、分割图的评估方法及装置 | |
US20240005160A1 (en) | Methods and systems for optimizing a peak memory usage of an artificial neural network graph | |
WO2018232754A1 (en) | JOINT OBJECT DETECTION BASED ON COLLABORATIVE INFORMATION | |
CN117911662A (zh) | 基于深度霍夫投票的数字孪生场景语义分割方法及系统 | |
CN115953772A (zh) | 车牌图像分类方法、装置、电子设备及存储介质 | |
CN117349768A (zh) | 服装生产线异常检测模型的训练方法、异常检测方法 | |
CN111582152A (zh) | 一种识别图像中复杂事件的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |