CN111679953A - 基于人工智能的故障节点识别方法、装置、设备和介质 - Google Patents

基于人工智能的故障节点识别方法、装置、设备和介质 Download PDF

Info

Publication number
CN111679953A
CN111679953A CN202010517479.1A CN202010517479A CN111679953A CN 111679953 A CN111679953 A CN 111679953A CN 202010517479 A CN202010517479 A CN 202010517479A CN 111679953 A CN111679953 A CN 111679953A
Authority
CN
China
Prior art keywords
node
alarm
data
nodes
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010517479.1A
Other languages
English (en)
Other versions
CN111679953B (zh
Inventor
陈桢博
郑立颖
徐亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010517479.1A priority Critical patent/CN111679953B/zh
Priority to PCT/CN2020/098772 priority patent/WO2021114613A1/zh
Publication of CN111679953A publication Critical patent/CN111679953A/zh
Application granted granted Critical
Publication of CN111679953B publication Critical patent/CN111679953B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请涉及一种人工智能领域,特别是涉及一种基于人工智能的故障节点识别方法、装置、设备和介质。所述方法包括:获取故障系统对应的图数据,图数据包括故障系统中多个节点之间的调用关系;获取故障系统中各节点的节点数据;根据各节点的节点数据确定各报警节点,并根据各报警节点以及调用关系,得到故障系统中各报警节点为故障节点的初始检测结果;根据多个节点之间的调用关系,对各报警节点进行分组,得到各报警节点组合;根据各报警节点组合以及各报警节点的初始检测结果,确定各报警节点组合中的故障节点。采用本方法能够提高数据处理的智能化水平。同时,本申请还涉及区块链技术,其中,图数据以及所述节点数据等均可以存储与区块链中。

Description

基于人工智能的故障节点识别方法、装置、设备和介质
技术领域
本申请涉及人工智能领域,特别是涉及一种基于人工智能的故障节点识别方法、装置、设备和介质。
背景技术
在运维系统中,某节点所产生的故障可能引发多个节点的报警,而每一时刻可能存在多个故障节点所引发的大量关联报警。
在传统方式中,通常通过运维人员为每一起故障找到引发故障问题的故障节点,以便于及时对故障节点进行修复。
但是,运维人员人工进行关联报警的多个故障节点的查找,需从大量原始数据开始分析的,分析过程不够智能化。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高智能化水平的基于人工智能的故障节点识别方法、装置、设备和介质。
一种基于人工智能的故障节点识别方法,所述方法包括:
获取故障系统对应的图数据,图数据包括故障系统中多个节点以及多个节点之间的调用关系;
获取故障系统中各节点的节点数据;
根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果;
根据多个节点之间的调用关系,对各报警节点进行分组,得到各报警节点组合;
根据各报警节点组合以及各报警节点的初始检测结果,确定各报警节点组合中的故障节点。
在其中一个实施例中,根据各节点的节点数据确定故障系统中的各报警节点,包括:
对各节点数据进行特征数据的提取,得到各节点对应的节点特征;
确定各节点的节点标准特征,其中,节点标准特征为基于节点在非报警状态下的节点数据中提取的特征;
对各节点的节点标准特征以及节点特征进行匹配,得到故障系统中的各报警节点。
在其中一个实施例中,根据多个节点之间的调用关系,对各报警节点进行分组,得到报警节点组合,包括:
根据故障系统中多个节点之间的调用关系,确定任意两个报警节点之间的节点距离;
以任一报警节点为起始报警节点,确定与起始报警节点的节点距离小于或等于节点阈值距离的关联报警节点;
将关联报警节点作为起始报警节点,并继续确定与关联报警节点的节点距离小于或等于节点阈值距离的关联报警节点;
将起始报警节点以及对应的关联报警节点划分为同一报警节点组合。
在其中一个实施例中,获取故障系统中各节点的节点数据,包括:
获取报警系统采集的故障系统的报警原始数据;
对报警原始数据进行节点报警数据的提取,得到各节点的节点报警数据,节点报警数据包括各节点的报警类型、报警频次以及报警级别中至少一项;
获取各节点的节点基础数据,节点基础数据包括节点类型以及节点层级中至少一种;
根据各节点报警数据以及节点基础数据生成各节点的节点数据。
在其中一个实施例中,根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果为通过预先训练的图卷积神经网络模型确定的,图卷积神经网络模型的训练方式包括:
获取训练样本数据,训练样本数据包括训练图数据以及各节点的节点训练数据;
对训练图数据中各节点进行标注,得到标注有各节点为报警节点、非报警节点、故障节点以及非故障节点的训练图数据;
将标注后的训练图数据以及训练样本数据输入构建的初始图卷积神经网络模型,通过初始图卷积神经网络模型对训练样本数据进行特征提取,得到特征数据;
对特征数据进行回归预测,得到各节点为故障节点和非故障节点的预测结果;
基于预测结果以及标注后的训练图数据,确定初始图卷积神经网络模型的损失值,并通过损失值更新初始图卷积神经网络模型的模型参数;
对初始图卷积神经网络模型进行迭代处理,得到训练后的图卷积神经网络模型。
在其中一个实施例中,上述方法还包括:
将图数据以及节点数据中的至少一个上传至区块链,并存储至区块链的节点中。
一种基于人工智能的故障节点识别装置,所述装置包括:
图数据获取模块,用于获取故障系统对应的图数据,图数据包括故障系统中多个节点以及多个节点之间的调用关系;
节点数据获取模块,用于获取故障系统中各节点的节点数据;
报警节点及初始检测结果生成模块,用于根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果;
报警节点组合确定模块,用于根据多个节点之间的调用关系,对各报警节点进行分组,得到各报警节点组合;
故障节点确定模块,用于根据各报警节点组合以及各报警节点的初始检测结果,确定各报警节点组合中的故障节点。
在其中一个实施例中,报警节点及初始检测结果生成模块,包括:
提取子模块,用于对各节点数据进行特征数据的提取,得到各节点对应的节点特征;
节点标准特征确定子模块,用于确定各节点的节点标准特征,其中,节点标准特征为基于节点在非报警状态下的节点数据提取的特征;
匹配子模块,用于对各节点的节点标准特征以及节点特征进行匹配,得到故障系统中的各报警节点。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
上述基于人工智能的故障节点识别方法、装置、设备和介质,通过获取故障系统对应的图数据,图数据包括故障系统中多个节点以及多个节点之间的调用关系,然后获取故障系统中各节点的节点数据,根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果,进一步根据多个节点之间的调用关系,对各报警节点进行分组,得到各报警节点组合,根据各报警节点组合以及各报警节点的初始检测结果,确定各报警节点组合中的故障节点。从而,可以根据包含有节点调用关系的图数据以及各节点的节点数据,进行报警节点组合的确定,以确定对应于各故障问题的各报警节点组合,然后根据报警节点的初始检测结果,从各报警节点组合中确定故障节点,相比于人工进行故障节点的查询以及筛选,可以使得故障节点的识别判定更加智能化,提升数据处理的智能化水平。
附图说明
图1为一个实施例中基于人工智能的故障节点识别方法的应用场景图;
图2为一个实施例中基于人工智能的故障节点识别方法的流程示意图;
图3为一个实施例中图数据的示意图;
图4为一个实施例中获取节点数据步骤的流程示意图;
图5为一个实施例中基于人工智能的故障节点识别装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的基于人工智能的故障节点识别方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。具体地,服务器104获取故障系统对应的图数据,其中,图数据包括故障系统中多个节点以及多个节点之间的调用关系,然后服务器104获取故障系统中各节点的节点数据,进而根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果。进一步,服务器104根据多个节点之间的调用关系,对各报警节点进行分组,得到各报警节点组合,然后根据各报警节点组合以及各报警节点的初始检测结果,确定各报警节点组合中的故障节点。然后,服务器104将故障节点输出给终端102,以通过终端102显示并指示用户。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于人工智能的故障节点识别方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S202,获取故障系统对应的图数据,图数据包括故障系统中多个节点以及多个节点之间的调用关系。
其中,故障系统是指存在报警现象或者报警警示的系统。
图数据是指包含有故障系统中多个节点以及节点之间调用关系的数据。在本实施例中,图数据可以通过邻接矩阵表示,即一个n*n的矩阵。其中,n表示节点的数量。在邻接矩阵中,两个节点存在调用关系,则对应的矩阵元素为1,不存在调用关系,矩阵元素为0。
节点是指系统数据处理过程的中的各个处理节点,如主机节点、网络节点等。节点与节点之间存在相互的调用关系。
在本实施例中,各个服务系统在出现系统故障时,可以生成报警信息并发送给报警系统,以对故障进行警示。服务器可以定期对报警系统接收到的报警信息进行处理,并根据报警信息中的报警编号或者系统编号等,确定对应的故障系统,然后从故障系统中获取对应的包含有节点之间调用关系的图数据,并进行后续的处理。
步骤S204,获取故障系统中各节点的节点数据。
其中,节点数据是指故障系统中各个节点对应的数据。节点数据可以包括节点报警数据以及节点基础数据。节点报警数据可以包括但不限于报警类型、报警频次以及报警级别等数据。节点基础数据可以包括节点的类型,如主机或者是网络等类型,以及节点层次信息,如节点在调用关系的层级等。
在本实施例中,服务器可以在获取图数据后,对应获取各节点的节点数据。
步骤206,根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果。
其中,报警节点是指当系统中存在故障问题时,对该故障问题进行报警的节点。故障节点是指引发故障问题的节点。在本实施例中,报警节点并非一定是故障节点,报警节点可以是与故障节点存在调用关系的关联节点。
在本实施例中,服务器可以根据各节点的节点数据,确定各节点是否为报警节点,例如,根据节点数据中的节点报警数据,则可以确定节点是否为报警节点。
进一步,服务器根据节点之间的调用关系,确定报警节点中各节点为故障节点的初始检测结果。
在本实施例中,初始检测结果可以是一个概率值,即服务器可以根据各报警节点与其他节点之间的调用关系,确定报警节点为故障节点的概率值。例如,如某个报警节点与其他多个节点存在调用关系,且其他多个节点均为非报警节点,则该报警节点为故障节点的概率较大。
步骤208,根据多个节点之间的调用关系,对各报警节点进行分组,得到各报警节点组合。
其中,报警节点组合是指对同一故障问题进行报警的节点的组合。例如,故障问题a,节点A、节点B、节点C均进行了报警,则节点A、节点B、节点C可以划分为一个报警节点组合。
在本实施例中,服务器可以根据图数据中节点与节点之间调用关系,对报警节点进行分组,得到对应各故障问题的报警节点组合。
步骤210,根据各报警节点组合以及各报警节点的初始检测结果,确定各报警节点组合中的故障节点。
在本实施例中,服务器在确定报警节点组合以及各报警节点的初始检测结果后,可以根据报警节点组合中多个报警节点的初始检测结果,如,各报警节点为故障节点的概率值,确定引发故障的故障节点。
具体地,服务器可以对各报警节点的概率值进行排序,如降序排序,并根据排序结果确定报警节点组合中故障节点。或者,服务器也可以直接根据概率值,确定概率值最大的报警节点为故障节点。
上述基于人工智能的故障节点识别方法中,通过获取故障系统对应的图数据,图数据包括故障系统中多个节点以及多个节点之间的调用关系,然后获取故障系统中各节点的节点数据,根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果,进一步根据多个节点之间的调用关系,对各报警节点进行分组,得到各报警节点组合,根据各报警节点组合以及各报警节点的初始检测结果,确定各报警节点组合中的故障节点。从而,可以根据包含有节点调用关系的图数据以及各节点的节点数据,进行报警节点组合的确定,以确定对应于各故障问题的各报警节点组合,然后根据报警节点的初始检测结果,从各报警节点组合中确定故障节点,相比于人工进行故障节点的查询以及筛选,可以使得故障节点的识别判定更加智能化,提升数据处理的智能化水平。
在其中一个实施例中,根据各节点的节点数据确定故障系统中的各报警节点,可以包括:对各节点数据进行特征数据的提取,得到各节点对应的节点特征;确定各节点的节点标准特征,其中,节点标准特征为基于节点在非报警状态下的节点数据提取的特征;对各节点的节点标准特征以及节点特征进行匹配,得到故障系统中的各报警节点。
其中,节点特征是指与各节点对应的特征,节点特征可以与节点一一对应,节点不同,其对应的节点特征不同,如对应主机的节点特征,对应网络的节点特征等。
节点标准特征是指基于节点在非报警状态下的节点数据提取的特征,可以包括节点在正常运行情况下或者是允许误差范围运行情况下的节点数据中提取的特征。
在本实施例中,服务器可以从节点数据中,提取出对应的节点特征,例如,对于主机,主机报警类型、主机报警频率、主机报警级别等特征数据,然后对应节点的节点标准特征进行匹配,以确定各节点是否为报警节点。例如,节点标准特征中,报警频率为一小时2次(理解为正常误差范围内的报警),而从节点数据中提取的节点特征为5分钟1次,则通过匹配,可以确定该节点为报警节点。
或者,服务器也可以在对多个节点特征进行匹配后,并进行加权求和,然后根据加权求和结果以及预设阈值,确定节点是否为报警节点,例如,预设阈值为0.5,当加权求和后结果大于0.5,则确定节点为报警节点,若小于或等于0.5则确定为非报警节点。
上述实施例中,通过对节点数据进行特征数据的提取并与节点标准特征进行匹配,进而确定报警节点,从而,可以根据各节点的实时节点数据确定各节点是否为报警节点,可以提升报警节点确定的准确性,进而可以使得故障节点的识别判定更加准确。
在其中一个实施例中,根据多个节点之间的调用关系,对各报警节点进行分组,得到报警节点组合,可以包括:根据故障系统中多个节点之间的调用关系,确定任意两个报警节点之间的节点距离;以任一报警节点为起始报警节点,确定与起始报警节点的节点距离小于或等于节点阈值距离的关联报警节点;将关联报警节点作为起始报警节点,并继续确定与关联报警节点的节点距离小于或等于节点阈值距离的关联报警节点;将起始报警节点以及对应的关联报警节点划分为同一报警节点组合。
其中,节点距离是指报警节点与报警节点之间的距离,根据报警节点与报警节点之间非报警节点的数量的不同,节点距离不同。
具体地,参考图3,节点A与节点B、节点A与节点E分别存在调用关系,节点B和节点C存在调用关系,节点C和节点D存在调用关系,节点A、节点C以及节点E均为报警节点,节点B和为节点D正常节点。则服务器可以根据则可以根据节点之间的调用关系,确定节点A和节点C之间的节点距离为2(中间隔了非报警节点B),节点A和节点E之间的节点距离为1。
在本实施例中,服务器可以设置节点阈值距离为1,及设定对报警节点进行分组的节点阈值为1。然后,服务器以任一报警节点为起始报警节点,如以节点A为起始报警节点,然后查找节点距离小于或等于1的关联报警节点,即可以找到节点A的关联报警节点为节点E。然后,服务器可以起始报警节点以及确定的关联报警节点得到报警节点组合为节点A和节点E。
在本实施例中,报警节点组合也可以表示为报警节点簇,继续参照前例,报警节点组合节点A和节点E可以表示为报警节点簇为【A,E】。
继续参考图3,当服务器设置节点阈值距离为2时,服务器继续以节点A为起始报警节点,然后查找节点距离小于或等于2的关联报警节点,则服务器可以查找到节点E和节点C均为节点A的关联报警节点。然后服务器可以得到报警节点组合为节点A、节点C和节点E,或者也可以表示为报警节点簇【A,C,E】。
或者,继续参考图3,节点A、节点B、节点C、节点D以及节点E均为报警节点,且服务器设置节点阈值距离为1。服务器继续以节点A为起始报警节点,根据节点阈值距离,可以先确定关联报警节点为节点B和节点E。然后,服务器以节点B为起始报警节点,并确定关联报警节点为节点C。以此类推,服务器可以进一步确定节点C的关联报警节点为节点D,从而得到报警节点组合为节点A、节点B、节点C、节点D和节点E,或者也可以表示为报警节点簇【A,B,C,D,E】。
上述实施例中,根据报警节点之间的节点距离以及节点阈值距离,确定起始报警节点对应的关联报警节点,并生成报警节点组合,从而,可以根据节点距离准确确定关联报警节点,提升关联报警节点确定的准确性。
在其中一个实施例中,参考图4,获取故障系统中各节点的节点数据,可以包括:
步骤S402,获取报警系统采集的故障系统的报警原始数据;
其中,报警原始数据是指从报警系统中直接获取的数据,如报警系统中的报警记录数据等。
步骤S404,对报警原始数据进行节点报警数据的提取,得到各节点的节点报警数据,节点报警数据可以包括各节点的报警类型、报警频次以及报警级别中至少一项。
如前文所述,节点报警数据可以包括但不限于报警类型、报警频次以及报警级别等数据。在本实施例中,服务器在获取到对应的报警原始数据后,可以对报警原始数据进行提取,以从获取的报警原始数据中提取出节点报警数据。
具体地,服务器可以是根据预先设定的提取模板从报警原始数据中提取出节点报警数据。在本实施例中,不同类型的节点,其提取模板可以不同,提取得到的节点报警数据可以不同。
可选地,服务器在从报警原始数据中提取出各节点对应的数据后,还可以对提取的数据进行分析处理,以得到对应各节点的节点报警数据。例如,从报警记录中获取到主机的报警数据后,通过对主机的报警次数进行统计分析,以得到主机的报警频次。
步骤S406,获取各节点的节点基础数据,节点基础数据可以包括节点类型以及节点层级中至少一种。
在本实施例中,服务器可以从故障系统的数据库中直接获取各节点的节点基础数据。
步骤S408,根据各节点报警数据以及节点基础数据生成各节点的节点数据。
在本实施例中,服务器在获取到节点报警数据以及节点基础数据后,可以对同一节点的数据进行组合,以得到对应各节点的节点数据。
上述实施例中,通过从报警原始数据中获取节点报警数据,以及获取节点基础数据,然后生成节点数据,从而使得节点数据包含了节点多方面的特征,使得后续进行报警节点的判定更加准确,进而可以提升故障节点识别判定的准确性。
在其中一个实施例中,根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果为通过预先训练的图卷积神经网络模型确定的,图卷积神经网络模型的训练方式可以包括:获取训练样本数据,训练样本数据包括训练图数据以及各节点的节点训练数据;对训练图数据中各节点进行标注,得到标注有各节点为报警节点、非报警节点、故障节点以及非故障节点的训练图数据;将标注后的训练图数据以及训练样本数据输入构建的初始图卷积神经网络模型,通过初始图卷积神经网络模型对训练样本数据进行特征提取,得到特征数据;对特征数据进行回归预测,得到各节点为故障节点和非故障节点的预测结果;基于预测结果以及标注后的训练图数据,确定初始图卷积神经网络模型的损失值,并通过损失值更新初始图卷积神经网络模型的模型参数;对初始图卷积神经网络模型进行迭代处理,得到训练后的图卷积神经网络模型。
具体地,服务器可以各不同系统的图数据以及历史节点数据作为训练样本数据。然后服务器根据各节点的节点训练数据,通过标注工具对训练图数据中的每一个节点进行标注,例如,可以通过LabelImg分别标注报警节点、非报警节点、故障节点以及非故障节点等。
进一步,服务器可以对训练图数据进行归一化处理,得到归一化后的训练图数据。
然后服务器将归一化后的训练图数据以及节点训练数据输入构建的初始图卷积神经网络模型,通过初始图卷积神经网络模型进行节点特征的提取,并基于提取的节点特征确定报警节点以及非报警节点。
在本实施例中,服务器可以对各节点的节点训练数据进行量化处理,如将告警类型、告警级别等进行量化处理,以得到量化处理后的节点训练数据。
进一步,服务器根据确定的报警节点、非报警节点、各节点的节点训练数据以及训练图数据中节点之间的调用关系,进行节点预测,得到各节点为故障节点的预测结果。
在本实施例中,图神经网络模型可以通过计算公式对各节点为故障节点的概率值进行预测,具体计算公式如下:
h=softMax(adj×Re LU(adj×x×ω(1))×ω(2))
其中,h为节点为故障节点的概率值,为n*2的矩阵,n为节点数量;adj为归一化后的训练图数据,可以是一个n*n的邻接矩阵;x为节点训练数据,可以是指量化后的节点训练数据,如n*F的矩阵,其中,F为数据数量,每个节点有F个数据。
进一步,服务器可以根据预测结果以及标注的结果,通过损失函数计算初始图卷积神经网络模型的损失值。例如,通过交叉熵损失函数计算模型的损失值,或者也可以是L1损失函数和/或L2损失函数等,对此不作限制。
然后,服务器可以根据预先设置的学习率以及计算的损失值,对初始图卷积神经网络模型进行迭代处理,并对模型的参数不断更新,以得到训练后的图卷积神经网络模型。
上述实施例中,通过训练后图卷积神经网络模型确定故障系统中的各报警节点,以及得到故障系统中各报警节点为故障节点的初始检测结果,从而,可以提升报警节点以及初始检测结果识别判定的准确性,进而提升故障节点确定的准确性。
在其中一个实施例中,图数据以及节点数据中至少一个上传至区块链,并存储至区块链的节点中。
其中,区块链是指分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Block chain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。
具体地,区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在本实施例中,服务器可以将图数据以及节点数据中的一个或者多个数据上传并存储于区块链的节点中,以保证数据的私密性和安全性。
上述实施例中,通过将图数据以及节点数据中至少一个上传至区块链并存储于区块链的节点中,从而可以保障存储至区块链节点中数据的私密性,可以提升数据的安全性。
应该理解的是,虽然图2和图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种基于人工智能的故障节点识别装置,包括:图数据获取模块100、节点数据获取模块200、报警节点及初始检测结果生成模块300、报警节点组合确定模块400和故障节点确定模块500,其中:
图数据获取模块100,用于获取故障系统对应的图数据,图数据包括故障系统中多个节点以及多个节点之间的调用关系。
节点数据获取模块200,用于获取故障系统中各节点的节点数据。
报警节点及初始检测结果生成模块300,用于根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果。
报警节点组合确定模块400,用于根据多个节点之间的调用关系,对各报警节点进行分组,得到各报警节点组合。
故障节点确定模块500,用于根据各报警节点组合以及各报警节点的初始检测结果,确定各报警节点组合中的故障节点。
在其中一个实施例中,报警节点及初始检测结果生成模块300可以包括:
提取子模块,用于对各节点数据进行特征数据的提取,得到各节点对应的节点特征。
节点标准特征确定子模块,用于确定各节点的节点标准特征,其中,节点标准特征为基于节点在非报警状态下的节点数据提取的特征。
匹配子模块,用于对各节点的节点标准特征以及节点特征进行匹配,得到故障系统中的各报警节点。
在其中一个实施例中,报警节点组合确定模块400可以包括:
节点距离确定子模块,用于根据故障系统中多个节点之间的调用关系,确定任意两个报警节点之间的节点距离。
关联故障节点确定子模块,用于以任一报警节点为起始报警节点,确定与起始报警节点的节点距离小于或等于节点阈值距离的关联报警节点。
循环子模块,用于将关联报警节点作为起始报警节点,并继续确定与关联报警节点的节点距离小于或等于节点阈值距离的关联报警节点。
报警节点组合确定子模块,用于将起始报警节点以及对应的关联报警节点划分为同一报警节点组合。
在其中一个实施例中,节点数据获取模块200可以包括:
报警原始数据获取子模块,用于获取报警系统采集的故障系统的报警原始数据。
节点报警数据生成子模块,用于对报警原始数据进行节点报警数据的提取,得到各节点的节点报警数据,节点报警数据包括各节点的报警类型、报警频次以及报警级别中至少一项。
节点基础数据获取子模块,用于获取各节点的节点基础数据,节点基础数据包括节点类型以及节点层级中至少一种。
节点数据生成子模块,用于根据各节点报警数据以及节点基础数据生成各节点的节点数据。
在其中一个实施例中,报警节点及初始检测结果生成模块300根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果可以为通过预先训练的图卷积神经网络模型确定的。
在本实施例中,上述装置还可以包括:模型训练模块,用于训练图卷积神经网络模型。
在本实施例中,模型训练模块可以包括:
训练样本数据获取子模块,用于获取训练样本数据,训练样本数据包括训练图数据以及各节点的节点训练数据。
标注子模块,用于对训练图数据中各节点进行标注,得到标注有各节点为报警节点、非报警节点、故障节点以及非故障节点的训练图数据。
特征提取子模块,用于将标注后的训练图数据以及训练样本数据输入构建的初始图卷积神经网络模型,通过初始图卷积神经网络模型对训练样本数据进行特征提取,得到特征数据。
回归预测子模块,用于对特征数据进行回归预测,得到各节点为故障节点和非故障节点的预测结果。
损失计算子模块,用于基于预测结果以及标注后的训练图数据,确定初始图卷积神经网络模型的损失值,并通过损失值更新初始图卷积神经网络模型的模型参数。
迭代处理子模块,用于对初始图卷积神经网络模型进行迭代处理,得到训练后的图卷积神经网络模型。
在其中一个实施例中,上述装置还可以包括:
上传存储模块,用于将图数据以及节点数据中的至少一个上传至区块链,并存储至区块链的节点中。
关于基于人工智能的故障节点识别装置的具体限定可以参见上文中对于基于人工智能的故障节点识别方法的限定,在此不再赘述。上述基于人工智能的故障节点识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储图数据、节点数据等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的故障节点识别方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取故障系统对应的图数据,图数据包括故障系统中多个节点以及多个节点之间的调用关系;获取故障系统中各节点的节点数据;根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果;根据多个节点之间的调用关系,对各报警节点进行分组,得到各报警节点组合;根据各报警节点组合以及各报警节点的初始检测结果,确定各报警节点组合中的故障节点。
在其中一个实施例中,处理器执行计算机程序时实现根据各节点的节点数据确定故障系统中的各报警节点,可以包括:对各节点数据进行特征数据的提取,得到各节点对应的节点特征;确定各节点的节点标准特征,其中,节点标准特征为基于节点在非报警状态下的节点数据提取的特征;对各节点的节点标准特征以及节点特征进行匹配,得到故障系统中的各报警节点。
在其中一个实施例中,处理器执行计算机程序时实现根据多个节点之间的调用关系,对各报警节点进行分组,得到报警节点组合,可以包括:根据故障系统中多个节点之间的调用关系,确定任意两个报警节点之间的节点距离;以任一报警节点为起始报警节点,确定与起始报警节点的节点距离小于或等于节点阈值距离的关联报警节点;将关联报警节点作为起始报警节点,并继续确定与关联报警节点的节点距离小于或等于节点阈值距离的关联报警节点;将起始报警节点以及对应的关联报警节点划分为同一报警节点组合。
在其中一个实施例中,处理器执行计算机程序时实现获取故障系统中各节点的节点数据,可以包括:获取报警系统采集的故障系统的报警原始数据;对报警原始数据进行节点报警数据的提取,得到各节点的节点报警数据,节点报警数据包括各节点的报警类型、报警频次以及报警级别中至少一项;获取各节点的节点基础数据,节点基础数据包括节点类型以及节点层级中至少一种;根据各节点报警数据以及节点基础数据生成各节点的节点数据。
在其中一个实施例中,处理器执行计算机程序时实现根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果为通过预先训练的图卷积神经网络模型确定的,图卷积神经网络模型的训练方式可以包括:获取训练样本数据,训练样本数据包括训练图数据以及各节点的节点训练数据;对训练图数据中各节点进行标注,得到标注有各节点为报警节点、非报警节点、故障节点以及非故障节点的训练图数据;将标注后的训练图数据以及训练样本数据输入构建的初始图卷积神经网络模型,通过初始图卷积神经网络模型对训练样本数据进行特征提取,得到特征数据;对特征数据进行回归预测,得到各节点为故障节点和非故障节点的预测结果;基于预测结果以及标注后的训练图数据,确定初始图卷积神经网络模型的损失值,并通过损失值更新初始图卷积神经网络模型的模型参数;对初始图卷积神经网络模型进行迭代处理,得到训练后的图卷积神经网络模型。
在其中一个实施例中,处理器执行计算机程序时还实现如下步骤:将图数据以及节点数据中的至少一个上传至区块链,并存储至区块链的节点中。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取故障系统对应的图数据,图数据包括故障系统中多个节点以及多个节点之间的调用关系;获取故障系统中各节点的节点数据;根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果;根据多个节点之间的调用关系,对各报警节点进行分组,得到各报警节点组合;根据各报警节点组合以及各报警节点的初始检测结果,确定各报警节点组合中的故障节点。
在其中一个实施例中,计算机程序被处理器执行时实现根据各节点的节点数据确定故障系统中的各报警节点,可以包括:对各节点数据进行特征数据的提取,得到各节点对应的节点特征;确定各节点的节点标准特征,其中,节点标准特征为基于节点在非报警状态下的节点数据提取的特征;对各节点的节点标准特征以及节点特征进行匹配,得到故障系统中的各报警节点。
在其中一个实施例中,计算机程序被处理器执行时实现根据多个节点之间的调用关系,对各报警节点进行分组,得到报警节点组合,可以包括:根据故障系统中多个节点之间的调用关系,确定任意两个报警节点之间的节点距离;以任一报警节点为起始报警节点,确定与起始报警节点的节点距离小于或等于节点阈值距离的关联报警节点;将关联报警节点作为起始报警节点,并继续确定与关联报警节点的节点距离小于或等于节点阈值距离的关联报警节点;将起始报警节点以及对应的关联报警节点划分为同一报警节点组合。
在其中一个实施例中,计算机程序被处理器执行时实现获取故障系统中各节点的节点数据,可以包括:获取报警系统采集的故障系统的报警原始数据;对报警原始数据进行节点报警数据的提取,得到各节点的节点报警数据,节点报警数据包括各节点的报警类型、报警频次以及报警级别中至少一项;获取各节点的节点基础数据,节点基础数据包括节点类型以及节点层级中至少一种;根据各节点报警数据以及节点基础数据生成各节点的节点数据。
在其中一个实施例中,计算机程序被处理器执行时实现根据各节点的节点数据确定故障系统中的各报警节点,并根据各报警节点以及多个节点之间的调用关系,得到故障系统中各报警节点为故障节点的初始检测结果为通过预先训练的图卷积神经网络模型确定的,图卷积神经网络模型的训练方式可以包括:获取训练样本数据,训练样本数据包括训练图数据以及各节点的节点训练数据;对训练图数据中各节点进行标注,得到标注有各节点为报警节点、非报警节点、故障节点以及非故障节点的训练图数据;将标注后的训练图数据以及训练样本数据输入构建的初始图卷积神经网络模型,通过初始图卷积神经网络模型对训练样本数据进行特征提取,得到特征数据;对特征数据进行回归预测,得到各节点为故障节点和非故障节点的预测结果;基于预测结果以及标注后的训练图数据,确定初始图卷积神经网络模型的损失值,并通过损失值更新初始图卷积神经网络模型的模型参数;对初始图卷积神经网络模型进行迭代处理,得到训练后的图卷积神经网络模型。
在其中一个实施例中,计算机程序被处理器执行时还实现如下步骤:将图数据以及节点数据中的至少一个上传至区块链,并存储至区块链的节点中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于人工智能的故障节点识别方法,其特征在于,所述方法包括:
获取故障系统对应的图数据,所述图数据包括故障系统中多个节点以及多个节点之间的调用关系;
获取所述故障系统中各节点的节点数据;
根据各所述节点的节点数据确定所述故障系统中的各报警节点,并根据各所述报警节点以及所述多个节点之间的调用关系,得到所述故障系统中各报警节点为故障节点的初始检测结果;
根据所述多个节点之间的调用关系,对各所述报警节点进行分组,得到各报警节点组合;
根据各所述报警节点组合以及各报警节点的初始检测结果,确定各所述报警节点组合中的故障节点。
2.根据权利要求1所述的方法,其特征在于,所述根据各所述节点的节点数据确定所述故障系统中的各报警节点,包括:
对各所述节点数据进行特征数据的提取,得到各所述节点对应的节点特征;
确定各所述节点的节点标准特征,其中,所述节点标准特征为基于节点在非报警状态下的节点数据提取的特征;
对各所述节点的节点标准特征以及节点特征进行匹配,得到所述故障系统中的各报警节点。
3.根据权利要求1所述的方法,其特征在于,所述根据所述多个节点之间的调用关系,对各所述报警节点进行分组,得到报警节点组合,包括:
根据所述故障系统中多个节点之间的调用关系,确定任意两个报警节点之间的节点距离;
以任一报警节点为起始报警节点,确定与所述起始报警节点的节点距离小于或等于节点阈值距离的关联报警节点;
将所述关联报警节点作为起始报警节点,并继续确定与所述关联报警节点的节点距离小于或等于节点阈值距离的关联报警节点;
将所述起始报警节点以及对应的关联报警节点划分为同一报警节点组合。
4.根据权利要求1所述的方法,其特征在于,所述获取所述故障系统中各节点的节点数据,包括:
获取报警系统采集的所述故障系统的报警原始数据;
对所述报警原始数据进行节点报警数据的提取,得到各节点的节点报警数据,所述节点报警数据包括各节点的报警类型、报警频次以及报警级别中至少一项;
获取各节点的节点基础数据,所述节点基础数据包括节点类型以及节点层级中至少一种;
根据各所述节点报警数据以及所述节点基础数据生成各节点的节点数据。
5.根据权利要求1所述的方法,其特征在于,所述根据各所述节点的节点数据确定所述故障系统中的各报警节点,并根据各所述报警节点以及所述多个节点之间的调用关系,得到所述故障系统中各报警节点为故障节点的初始检测结果为通过预先训练的图卷积神经网络模型确定的,所述图卷积神经网络模型的训练方式包括:
获取训练样本数据,所述训练样本数据包括训练图数据以及各节点的节点训练数据;
对所述训练图数据中各节点进行标注,得到标注有各节点为报警节点、非报警节点、故障节点以及非故障节点的训练图数据;
将标注后的所述训练图数据以及所述训练样本数据输入构建的初始图卷积神经网络模型,通过所述初始图卷积神经网络模型对所述训练样本数据进行特征提取,得到特征数据;
对所述特征数据进行回归预测,得到各所述节点为故障节点和非故障节点的预测结果;
基于所述预测结果以及所述标注后的训练图数据,确定所述初始图卷积神经网络模型的损失值,并通过所述损失值更新所述初始图卷积神经网络模型的模型参数;
对所述初始图卷积神经网络模型进行迭代处理,得到训练后的图卷积神经网络模型。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
将所述图数据以及所述节点数据中的至少一个上传至区块链,并存储至区块链的节点中。
7.一种基于人工智能的故障节点识别装置,其特征在于,所述装置包括:
图数据获取模块,用于获取故障系统对应的图数据,所述图数据包括故障系统中多个节点以及多个节点之间的调用关系;
节点数据获取模块,用于获取所述故障系统中各节点的节点数据;
报警节点及初始检测结果生成模块,用于根据各所述节点的节点数据确定所述故障系统中的各报警节点,并根据各所述报警节点以及所述多个节点之间的调用关系,得到所述故障系统中各报警节点为故障节点的初始检测结果;
报警节点组合确定模块,用于根据所述多个节点之间的调用关系,对各所述报警节点进行分组,得到各报警节点组合;
故障节点确定模块,用于根据各所述报警节点组合以及各报警节点的初始检测结果,确定各所述报警节点组合中的故障节点。
8.根据权利要求7所述的装置,其特征在于,所述报警节点及初始检测结果生成模块,包括:
提取子模块,用于对各所述节点数据进行特征数据的提取,得到各所述节点对应的节点特征;
节点标准特征确定子模块,用于确定各所述节点的节点标准特征,其中,所述节点标准特征为基于节点在非报警状态下的节点数据提取的特征;
匹配子模块,用于对各所述节点的节点标准特征以及节点特征进行匹配,得到所述故障系统中的各报警节点。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202010517479.1A 2020-06-09 2020-06-09 基于人工智能的故障节点识别方法、装置、设备和介质 Active CN111679953B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010517479.1A CN111679953B (zh) 2020-06-09 2020-06-09 基于人工智能的故障节点识别方法、装置、设备和介质
PCT/CN2020/098772 WO2021114613A1 (zh) 2020-06-09 2020-06-29 基于人工智能的故障节点识别方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010517479.1A CN111679953B (zh) 2020-06-09 2020-06-09 基于人工智能的故障节点识别方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN111679953A true CN111679953A (zh) 2020-09-18
CN111679953B CN111679953B (zh) 2022-04-12

Family

ID=72454134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010517479.1A Active CN111679953B (zh) 2020-06-09 2020-06-09 基于人工智能的故障节点识别方法、装置、设备和介质

Country Status (2)

Country Link
CN (1) CN111679953B (zh)
WO (1) WO2021114613A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434193A (zh) * 2020-10-27 2021-03-02 北京空间飞行器总体设计部 一种引导式系统故障快速排查方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114968947B (zh) * 2022-03-01 2023-05-09 华为技术有限公司 一种故障文件保存方法及相关装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030191608A1 (en) * 2001-04-30 2003-10-09 Anderson Mark Stephen Data processing and observation system
CN104579717A (zh) * 2013-10-09 2015-04-29 中国移动通信集团江苏有限公司 Dcn的故障定位方法及装置
CN108322351A (zh) * 2018-03-05 2018-07-24 北京奇艺世纪科技有限公司 生成拓扑图的方法和装置、故障确定方法和装置
CN108845912A (zh) * 2018-06-11 2018-11-20 掌阅科技股份有限公司 服务接口调用故障的报警方法及计算设备
CN109756376A (zh) * 2019-01-11 2019-05-14 中电福富信息科技有限公司 基于图数据模型的告警关联分析方法
CN110134539A (zh) * 2019-05-14 2019-08-16 极智(上海)企业管理咨询有限公司 一种分布式系统故障根源的诊断方法
CN111193605A (zh) * 2019-08-28 2020-05-22 腾讯科技(深圳)有限公司 一种故障定位方法、装置及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9699205B2 (en) * 2015-08-31 2017-07-04 Splunk Inc. Network security system
CN107222339B (zh) * 2017-05-27 2020-06-05 全球能源互联网研究院有限公司 基于图数据库的电力信息通信系统的故障分析方法及装置
CN109740025A (zh) * 2019-01-11 2019-05-10 中电福富信息科技有限公司 基于图数据模型的故障影响分析方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030191608A1 (en) * 2001-04-30 2003-10-09 Anderson Mark Stephen Data processing and observation system
CN104579717A (zh) * 2013-10-09 2015-04-29 中国移动通信集团江苏有限公司 Dcn的故障定位方法及装置
CN108322351A (zh) * 2018-03-05 2018-07-24 北京奇艺世纪科技有限公司 生成拓扑图的方法和装置、故障确定方法和装置
CN108845912A (zh) * 2018-06-11 2018-11-20 掌阅科技股份有限公司 服务接口调用故障的报警方法及计算设备
CN109756376A (zh) * 2019-01-11 2019-05-14 中电福富信息科技有限公司 基于图数据模型的告警关联分析方法
CN110134539A (zh) * 2019-05-14 2019-08-16 极智(上海)企业管理咨询有限公司 一种分布式系统故障根源的诊断方法
CN111193605A (zh) * 2019-08-28 2020-05-22 腾讯科技(深圳)有限公司 一种故障定位方法、装置及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434193A (zh) * 2020-10-27 2021-03-02 北京空间飞行器总体设计部 一种引导式系统故障快速排查方法及装置
CN112434193B (zh) * 2020-10-27 2023-09-29 北京空间飞行器总体设计部 一种引导式系统故障快速排查方法及装置

Also Published As

Publication number Publication date
WO2021114613A1 (zh) 2021-06-17
CN111679953B (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN111210024B (zh) 模型训练方法、装置、计算机设备和存储介质
CN111897673B (zh) 运维故障根因识别方法、装置、计算机设备和存储介质
CN109032829B (zh) 数据异常检测方法、装置、计算机设备及存储介质
CN111767707B (zh) 雷同病例检测方法、装置、设备及存储介质
CN111338836A (zh) 处理故障数据的方法、装置、计算机设备和存储介质
CN111679953B (zh) 基于人工智能的故障节点识别方法、装置、设备和介质
CN112329865B (zh) 基于自编码器的数据异常识别方法、装置和计算机设备
CN113705685B (zh) 疾病特征识别模型训练、疾病特征识别方法、装置及设备
CN112016318A (zh) 基于解释模型的分诊信息推荐方法、装置、设备及介质
CN110580488B (zh) 基于字典学习的多工况工业监测方法、装置、设备及介质
CN112231224A (zh) 基于人工智能的业务系统测试方法、装置、设备和介质
CN111897695A (zh) 获取kpi异常数据样本的方法、装置和计算机设备
CN110912908A (zh) 网络协议异常检测方法、装置、计算机设备和存储介质
CN111767192B (zh) 基于人工智能的业务数据检测方法、装置、设备和介质
CN111209929A (zh) 访问数据处理方法、装置、计算机设备及存储介质
CN113110961B (zh) 设备异常检测方法、装置、计算机设备及可读存储介质
CN110166422B (zh) 域名行为识别方法、装置、可读存储介质和计算机设备
CN110597977B (zh) 数据处理方法、装置、计算机设备和存储介质
CN112035775A (zh) 基于随机森林模型的用户识别方法、装置和计算机设备
CN111898035A (zh) 基于物联网的数据处理策略配置方法、装置和计算机设备
CN110716101B (zh) 电力线路故障定位方法、装置、计算机和存储介质
CN113282876B (zh) 异常检测中一维时间序列数据生成方法、装置和设备
CN111949530B (zh) 测试结果的预测方法、装置、计算机设备及存储介质
CN110781366A (zh) 网页数据处理方法、装置、计算机设备和存储介质
CN113269246B (zh) 基于事务逻辑的设备状态检测方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40031944

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant