CN114745256A - 一种服务器报警溯源方法、装置及存储介质 - Google Patents

一种服务器报警溯源方法、装置及存储介质 Download PDF

Info

Publication number
CN114745256A
CN114745256A CN202210192848.3A CN202210192848A CN114745256A CN 114745256 A CN114745256 A CN 114745256A CN 202210192848 A CN202210192848 A CN 202210192848A CN 114745256 A CN114745256 A CN 114745256A
Authority
CN
China
Prior art keywords
alarm
server
alarm information
propagation
server alarm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210192848.3A
Other languages
English (en)
Other versions
CN114745256B (zh
Inventor
赵子岩
高德荃
董耀众
来风刚
罗旺
娄超
吴钰芃
白东霞
席丁鼎
俞弦
马超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Information and Telecommunication Co Ltd
Nari Information and Communication Technology Co
State Grid Electric Power Research Institute
Information and Telecommunication Branch of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Information and Telecommunication Co Ltd
Nari Information and Communication Technology Co
State Grid Electric Power Research Institute
Information and Telecommunication Branch of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Information and Telecommunication Co Ltd, Nari Information and Communication Technology Co, State Grid Electric Power Research Institute, Information and Telecommunication Branch of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Information and Telecommunication Co Ltd
Priority to CN202210192848.3A priority Critical patent/CN114745256B/zh
Publication of CN114745256A publication Critical patent/CN114745256A/zh
Application granted granted Critical
Publication of CN114745256B publication Critical patent/CN114745256B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种服务器报警溯源方法、装置及存储介质,所述方法包括:采集服务器报警信息;根据服务器报警信息及预构建的服务器报警传播知识图谱,依据因果关联性检索获取所有可能的报警传播路径;通过所述服务器报警传播知识图谱检索所有可能的报警传播路径中两两报警传播路径的交集路径;计算所有交集路径发生可能性;根据交集路径发生可能性计算结果分析获取所述服务器报警信息的报警传播路径。本发明能够实现服务器报警信息溯源、快速定位根本故障原因。

Description

一种服务器报警溯源方法、装置及存储介质
技术领域
本发明涉及一种服务器报警溯源方法、装置及存储介质,属于云数据处理技术领域。
背景技术
云数据中心运维层次复杂,包含主机设备层、信息平台层、服务调用层,运维场景与业务强相关;且云数据中心网络关系也十分复杂,应用调用关系较多。随着主机设备层、信息平台层、服务调用层中各自报警保护机制中设置的报警逻辑,出现大量的报警信息冗余、报警阈值设置不合理、大量关联报警信息无法分析根源的报警泛滥问题。当某次业务出现故障报警时,会由于业务关联,造成大量相关的报警信息同时并发,导致报警信息溯源困难、无法快速定位到根本故障原因。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种服务器报警溯源方法、装置及存储介质,能够实现服务器报警信息溯源、快速定位根本故障原因。
为达到上述目的,本发明是采用下述技术方案实现的:
第一方面,本发明提供了一种服务器报警溯源方法,包括:
采集服务器报警信息;
根据服务器报警信息及预构建的服务器报警传播知识图谱,依据因果关联性检索获取所有可能的报警传播路径;
通过所述服务器报警传播知识图谱检索所有可能的报警传播路径中两两报警传播路径的交集路径;
计算所有交集路径发生可能性;
根据交集路径发生可能性计算结果分析获取所述服务器报警信息的报警传播路径。
结合第一方面,进一步的,根据服务器业务领域知识和历史报警记录,通过人工或数据挖掘的方法构建所述服务器报警传播知识图谱;
所述服务器报警传播知识图谱中至少包含服务器报警信息、服务器报警信息实体、以及服务器报警信息与服务器报警信息实体间可能存在的因果关系。
结合第一方面,进一步的,采集服务器报警信息后,对服务器报警信息进行过滤,以获取相应的服务器报警信息实体集合;
基于服务器报警信息实体集合中的服务器报警信息实体、以及服务器报警传播知识图谱中存储的因果关系获取所有可能的报警传播路径。
结合第一方面,进一步的,所述交集路径发生可能性通过公式(1)计算获取:
P(lcd)=P(lc)+P(ld) (1)
式中:lcd表示可能的报警传播路径lc与可能的报警传播路径ld的交集路径;P(lcd)表示交集路径lcd发生可能性;P(lc)表示可能的报警传播路径lc发生可能性;P(ld)表示可能的报警传播路径ld发生可能性。
结合第一方面,进一步的,可能的报警传播路径发生可能性通过公式(2)计算获取:
Figure BDA0003524969140000021
其中,
Figure BDA0003524969140000031
P(li)为可能的报警传播路径li发生可能性,
Figure BDA0003524969140000032
为传播链最终的报警证据,
Figure BDA0003524969140000033
为报警传播路径li上的N个相连报警信息实体,
Figure BDA0003524969140000034
为与
Figure BDA0003524969140000035
最近的直接相关报警信息实体,
Figure BDA0003524969140000036
为报警传播路径最远的报警信息实体;
Figure BDA0003524969140000037
为报警证据
Figure BDA0003524969140000038
与直接相关报警信息实体
Figure BDA0003524969140000039
之间的条件概率;
Figure BDA00035249691400000310
Figure BDA00035249691400000311
Figure BDA00035249691400000312
之间的条件概率,以此类推;Aalarm为服务器报警信息集合;
Figure BDA00035249691400000313
为报警信息实体
Figure BDA00035249691400000314
的先验概率;
Figure BDA00035249691400000315
为报警信息实体
Figure BDA00035249691400000316
的先验概率;
Figure BDA00035249691400000317
为报警信息实体
Figure BDA00035249691400000318
Figure BDA00035249691400000319
的因果关系强度;
Figure BDA00035249691400000320
为可能的报警传播路径li中的第j个报警信息实体;
Figure BDA00035249691400000321
为可能的报警传播路径li中的第j-1个报警信息实体;
Figure BDA00035249691400000322
为第i条可能的报警传播路径最终对应的报警证据。
结合第一方面,进一步的,根据交集路径发生可能性计算结果,分析获取所述服务器报警信息的报警传播路径的方法包括:
比较交集路径发生可能性计算结果,选取最大的M个可能性计算结果所对应的交集路径作为所述服务器报警信息的报警传播路径;
其中,M为自定义的大于等于1的正整数。
第二方面,本发明提供一种服务器报警溯源装置,包括:
采集模块:用于采集服务器报警信息;
第一获取模块:用于根据服务器报警信息及预构建的服务器报警传播知识图谱,依据因果关联性检索获取所有可能的报警传播路径;
第二获取模块:用于通过所述服务器报警传播知识图谱检索所有可能的报警传播路径中两两报警传播路径的交集路径;
计算模块:用于计算所有交集路径发生可能性;
第三获取模块:用于根据交集路径发生可能性计算结果分析获取所述服务器报警信息的报警传播路径。
结合第二方面,进一步的,所述装置还包括:
构建模块:用于根据服务器业务领域知识和历史报警记录,通过人工或数据挖掘的方法构建所述服务器报警传播知识图谱;
所述服务器报警传播知识图谱中至少包含服务器报警信息、服务器报警信息实体、以及服务器报警信息与服务器报警信息实体间可能存在的因果关系。
结合第二方面,进一步的,所述装置还包括
过滤模块:用于对服务器报警信息进行过滤,以获取相应的服务器报警信息实体集合;
所述第一获取模块基于服务器报警信息实体集合中的服务器报警信息实体、以及服务器报警传播知识图谱中存储的因果关系获取所有可能的报警传播路径。
第三方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面任一项所述方法的步骤。
与现有技术相比,本发明所达到的有益效果:
本发明提供的服务器报警溯源方法、装置及存储介质,根据服务器报警信息通过对服务器报警知识图谱进行检索,实现最终的报警溯源,可以压缩海量关联报警信息,极大地降低了服务器运维中大量关联报警信息的处理工作,从而快速定位根本故障原因,为服务器故障的排除提供了决策依据。
附图说明
图1是本发明实施例提供的一种服务器报警溯源方法的流程图。
具体实施方式
下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
实施例一:
参见图1,是本发明实施例提供的一种服务器报警溯源方法,包括如下步骤:
步骤一:采集服务器报警信息;
步骤二:根据服务器报警信息及预构建的服务器报警传播知识图谱,依据因果关联性检索获取所有可能的报警传播路径;
步骤三:通过所述服务器报警传播知识图谱检索所有可能的报警传播路径中两两报警传播路径的交集路径;
步骤四:计算所有交集路径发生可能性;
步骤五:根据交集路径发生可能性计算结果分析获取所述服务器报警信息的报警传播路径。
本发明实施例中所述服务器报警传播知识图谱是根据服务器业务领域知识和历史报警记录,通过人工或数据挖掘的方法构建获取的。所述服务器报警传播知识图谱中至少包含服务器报警信息、服务器报警信息实体、以及服务器报警信息与服务器报警信息实体间可能存在的因果关系。基于该服务器报警传播知识图谱中存储的因果关系,即可搜索所有可能的报警传播路径。
作为本发明的一种实施例,采集服务器报警信息后,对服务器报警信息进行过滤,以获取相应的服务器报警信息实体集合;
基于服务器报警信息实体集合中的服务器报警信息实体、以及服务器报警传播知识图谱中存储的因果关系获取所有可能的报警传播路径。
以Neo4j图数据库的Cypher语句为例,查询所有最终导致a1发生的报警事件ai:
Match(e:alarm{name:a1})<-[r:cause*..]-[a:alarm]return e,r,a
其中a1即标识当前检测到报警的报警信息实体a1。alarm表示e实体的类型为报警信息,cause表示关系r的类型为原因类,cause*..则表示多层原因查询。
所述交集路径发生可能性通过公式(1)计算获取:
P(lcd)=P(lc)+P(ld) (1)
式中:lcd表示可能的报警传播路径lc与可能的报警传播路径ld的交集路径;P(lcd)表示交集路径lcd发生可能性;P(lc)表示可能的报警传播路径lc发生可能性;P(ld)表示可能的报警传播路径ld发生可能性。
可能的报警传播路径发生可能性通过公式(2)计算获取:
Figure BDA0003524969140000061
其中,
Figure BDA0003524969140000062
P(li)为可能的报警传播路径li发生可能性,
Figure BDA0003524969140000063
为传播链最终的报警证据,
Figure BDA0003524969140000064
为报警传播路径li上的N个相连报警信息实体,
Figure BDA0003524969140000065
为与
Figure BDA0003524969140000066
最近的直接相关报警信息实体,
Figure BDA0003524969140000067
为报警传播路径最远的报警信息实体;
Figure BDA0003524969140000068
为报警证据
Figure BDA0003524969140000069
与直接相关报警信息实体
Figure BDA00035249691400000610
之间的条件概率;
Figure BDA00035249691400000611
Figure BDA00035249691400000612
Figure BDA00035249691400000613
之间的条件概率,以此类推;Aalarm为服务器报警信息集合;
Figure BDA00035249691400000614
为报警信息实体
Figure BDA00035249691400000615
的先验概率;
Figure BDA00035249691400000616
为报警信息实体
Figure BDA00035249691400000617
的先验概率;
Figure BDA00035249691400000618
为报警信息实体
Figure BDA00035249691400000619
Figure BDA00035249691400000620
的因果关系强度;
Figure BDA0003524969140000071
为可能的报警传播路径li中的第j个报警信息实体;
Figure BDA0003524969140000072
为可能的报警传播路径li中的第j-1个报警信息实体;
Figure BDA0003524969140000073
为第i条可能的报警传播路径最终对应的报警证据。
作为本发明的一种实施例,根据交集路径发生可能性计算结果,分析获取所述服务器报警信息的报警传播路径的方法包括:
比较交集路径发生可能性计算结果,选取最大的M个可能性计算结果所对应的交集路径作为所述服务器报警信息的报警传播路径;
其中,M为自定义的大于等于1的正整数。如通过报警传播路径可能计算后,选择的M条报警路径为[l1,l2...li,...lM],第i条报警传播路径为
Figure BDA0003524969140000074
则最终的报警溯源结果L=l1∩l2∩...li∩,...∩lM。当没有交集时,即
Figure BDA0003524969140000075
则减小M的值,重新计算。
下面结合具体示例对本发明实施例提供的交集路径发生可能性计算方法做进一步说明,具体如下:
一般的,服务器多层业务报警日志为B={b1,b2,...bi...},bi∈{0,1},通过筛选后,可以得到其中已经出现的报警信息为
Figure BDA0003524969140000076
例如:当前发生的报警信息为A={a3,a4,a6}。
然后,通过知识图谱检索,查询相关的报警传播路径为:
l1=a1→a2→a3→a4
l2=a1→a2→a5→a6
报警传播知识图谱中各报警事件的先验概率和之间的因果强度分别为:
P(a1)=0.01,P(a2)=0.005,P(a3)=0.004,P(a4)=0.01,P(a5)=0.002,P(a6)=0.003,P(a2|a1)=0.3,P(a3|a2)=0.2,P(a4|a3)=0.4,P(a5|a2)=0.3,P(a6|a5)=0.4;
各报警传播路径的发生可能性计算为:
Figure BDA0003524969140000081
Figure BDA0003524969140000082
通过报警传播知识图谱检索,得到传播路径的交集路径l12={a1,a2},报警传播路径l12的发生可能性为:
P(l12)=P(l1)+P(l2)=0.15+0.12=0.27
所以当前报警信息A={a3,a4,a6}条件下,报警溯源结果为l12={a1,a2},发生可能性为0.27。
实施例二:
本发明实施例提供一种服务器报警溯源装置,可以用于实施实施例一所述的方法,该装置可以由软件和/或硬件的方式实现,该装置可以集成在终端中,例如:任一具备通信功能的智能手机,平板电脑或计算机设备。本发明实施例提供的一种服务器报警溯源装置,具体包括:
采集模块:用于采集服务器报警信息;
第一获取模块:用于根据服务器报警信息及预构建的服务器报警传播知识图谱,依据因果关联性检索获取所有可能的报警传播路径;
第二获取模块:用于通过所述服务器报警传播知识图谱检索所有可能的报警传播路径中两两报警传播路径的交集路径;
计算模块:用于计算所有交集路径发生可能性;
第三获取模块:用于根据交集路径发生可能性计算结果分析获取所述服务器报警信息的报警传播路径。
结合第二方面,进一步的,所述装置还包括:
构建模块:用于根据服务器业务领域知识和历史报警记录,通过人工或数据挖掘的方法构建所述服务器报警传播知识图谱;
所述服务器报警传播知识图谱中至少包含服务器报警信息、服务器报警信息实体、以及服务器报警信息与服务器报警信息实体间可能存在的因果关系。
作为本发明的一种实施例,所述装置还包括
过滤模块:用于对服务器报警信息进行过滤,以获取相应的服务器报警信息实体集合;
所述第一获取模块基于服务器报警信息实体集合中的服务器报警信息实体、以及服务器报警传播知识图谱中存储的因果关系获取所有可能的报警传播路径。
本发明实施例提供服务器报警溯源装置与实施例一提供的服务器报警溯源方法基于相同的技术构思,能够产生如实施例一所述的有益效果,在本实施例中未详尽描述的内容可以参见实施例一。
实施例三:
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现实施例一所述方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (10)

1.一种服务器报警溯源方法,其特征在于,包括:
采集服务器报警信息;
根据服务器报警信息及预构建的服务器报警传播知识图谱,依据因果关联性检索获取所有可能的报警传播路径;
通过所述服务器报警传播知识图谱检索所有可能的报警传播路径中两两报警传播路径的交集路径;
计算所有交集路径发生可能性;
根据交集路径发生可能性计算结果分析获取所述服务器报警信息的报警传播路径。
2.根据权利要求1所述的服务器报警溯源方法,其特征在于,根据服务器业务领域知识和历史报警记录,通过人工或数据挖掘的方法构建所述服务器报警传播知识图谱;
所述服务器报警传播知识图谱中至少包含服务器报警信息、服务器报警信息实体、以及服务器报警信息与服务器报警信息实体间可能存在的因果关系。
3.根据权利要求2所述的服务器报警溯源方法,其特征在于,采集服务器报警信息后,对服务器报警信息进行过滤,以获取相应的服务器报警信息实体集合;
基于服务器报警信息实体集合中的服务器报警信息实体、以及服务器报警传播知识图谱中存储的因果关系获取所有可能的报警传播路径。
4.根据权利要求1所述的服务器报警溯源方法,其特征在于,所述交集路径发生可能性通过公式(1)计算获取:
P(lcd)=P(lc)+P(ld) (1)
式中:lcd表示可能的报警传播路径lc与可能的报警传播路径ld的交集路径;P(lcd)表示交集路径lcd发生可能性;P(lc)表示可能的报警传播路径lc发生可能性;P(ld)表示可能的报警传播路径ld发生可能性。
5.根据权利要求4所述的服务器报警溯源方法,其特征在于,可能的报警传播路径发生可能性通过公式(2)计算获取:
Figure FDA0003524969130000021
其中,
Figure FDA0003524969130000022
P(li)为可能的报警传播路径li发生可能性,
Figure FDA0003524969130000023
为传播链最终的报警证据,
Figure FDA0003524969130000024
Figure FDA0003524969130000025
为报警传播路径li上的N个相连报警信息实体,
Figure FDA0003524969130000026
为与
Figure FDA0003524969130000027
最近的直接相关报警信息实体,
Figure FDA0003524969130000028
为报警传播路径最远的报警信息实体;
Figure FDA0003524969130000029
为报警证据
Figure FDA00035249691300000210
与直接相关报警信息实体
Figure FDA00035249691300000211
之间的条件概率;
Figure FDA00035249691300000212
Figure FDA00035249691300000213
Figure FDA00035249691300000214
之间的条件概率,以此类推;Aalarm为服务器报警信息集合;
Figure FDA00035249691300000215
为报警信息实体
Figure FDA00035249691300000216
的先验概率;
Figure FDA00035249691300000217
为报警信息实体
Figure FDA00035249691300000218
的先验概率;
Figure FDA00035249691300000219
为报警信息实体
Figure FDA00035249691300000220
Figure FDA00035249691300000221
的因果关系强度;
Figure FDA00035249691300000222
为可能的报警传播路径li中的第j个报警信息实体;
Figure FDA00035249691300000223
为可能的报警传播路径li中的第j-1个报警信息实体;
Figure FDA00035249691300000224
为第i条可能的报警传播路径最终对应的报警证据。
6.根据权利要求1所述的服务器报警溯源方法,其特征在于,根据交集路径发生可能性计算结果,分析获取所述服务器报警信息的报警传播路径的方法包括:
比较交集路径发生可能性计算结果,选取最大的M个可能性计算结果所对应的交集路径作为所述服务器报警信息的报警传播路径;
其中,M为自定义的大于等于1的正整数。
7.一种服务器报警溯源装置,其特征在于,包括:
采集模块:用于采集服务器报警信息;
第一获取模块:用于根据服务器报警信息及预构建的服务器报警传播知识图谱,依据因果关联性检索获取所有可能的报警传播路径;
第二获取模块:用于通过所述服务器报警传播知识图谱检索所有可能的报警传播路径中两两报警传播路径的交集路径;
计算模块:用于计算所有交集路径发生可能性;
第三获取模块:用于根据交集路径发生可能性计算结果分析获取所述服务器报警信息的报警传播路径。
8.根据权利要求7所述的服务器报警溯源装置,其特征在于,还包括:
构建模块:用于根据服务器业务领域知识和历史报警记录,通过人工或数据挖掘的方法构建所述服务器报警传播知识图谱;
所述服务器报警传播知识图谱中至少包含服务器报警信息、服务器报警信息实体、以及服务器报警信息与服务器报警信息实体间可能存在的因果关系。
9.根据权利要求7所述的服务器报警溯源装置,其特征在于,还包括
过滤模块:用于对服务器报警信息进行过滤,以获取相应的服务器报警信息实体集合;
所述第一获取模块基于服务器报警信息实体集合中的服务器报警信息实体、以及服务器报警传播知识图谱中存储的因果关系获取所有可能的报警传播路径。
10.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1~6任一项所述方法的步骤。
CN202210192848.3A 2022-02-28 2022-02-28 一种服务器报警溯源方法、装置及存储介质 Active CN114745256B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210192848.3A CN114745256B (zh) 2022-02-28 2022-02-28 一种服务器报警溯源方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210192848.3A CN114745256B (zh) 2022-02-28 2022-02-28 一种服务器报警溯源方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN114745256A true CN114745256A (zh) 2022-07-12
CN114745256B CN114745256B (zh) 2024-05-24

Family

ID=82275600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210192848.3A Active CN114745256B (zh) 2022-02-28 2022-02-28 一种服务器报警溯源方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN114745256B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796254A (zh) * 2019-10-30 2020-02-14 南京工业大学 一种知识图谱推理方法、装置、计算机设备及存储介质
CN111722058A (zh) * 2020-06-17 2020-09-29 国网甘肃省电力公司信息通信公司 基于知识图谱的电力信息系统故障检测方法、装置及介质
CN113377567A (zh) * 2021-06-28 2021-09-10 东南大学 一种基于知识图谱技术的分布式系统故障根因溯源方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796254A (zh) * 2019-10-30 2020-02-14 南京工业大学 一种知识图谱推理方法、装置、计算机设备及存储介质
CN111722058A (zh) * 2020-06-17 2020-09-29 国网甘肃省电力公司信息通信公司 基于知识图谱的电力信息系统故障检测方法、装置及介质
CN113377567A (zh) * 2021-06-28 2021-09-10 东南大学 一种基于知识图谱技术的分布式系统故障根因溯源方法

Also Published As

Publication number Publication date
CN114745256B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
CN110839016B (zh) 异常流量监测方法、装置、设备及存储介质
CN112148772A (zh) 告警根因识别方法、装置、设备和存储介质
CN111158977A (zh) 一种异常事件根因定位方法及装置
CN111817891A (zh) 网络故障处理方法、装置、存储介质及电子设备
CN112152830A (zh) 一种智能的故障根因分析方法及系统
CN115809183A (zh) 基于知识图谱的信创终端故障发现及处置的方法
EP3418910A1 (en) Big data-based method and device for calculating relationship between development objects
CN103761173A (zh) 一种基于日志的计算机系统故障诊断方法及装置
CN106656536A (zh) 一种用于处理服务调用信息的方法与设备
CN112559237B (zh) 运维系统排障方法、装置、服务器和存储介质
CN112181758A (zh) 一种基于网络拓扑及实时告警的故障根因定位方法
CN114598539B (zh) 根因定位方法、装置、存储介质及电子设备
CN111859047A (zh) 一种故障解决方法及装置
CN112306820B (zh) 一种日志运维根因分析方法、装置、电子设备及存储介质
CN113505048A (zh) 基于应用系统画像的统一监控平台及实现方法
CN111581056B (zh) 基于人工智能的软件工程数据库维护与预警系统
CN106878038A (zh) 一种通信网络中故障定位方法及装置
CN114416573A (zh) 一种应用程序的缺陷分析方法、装置、设备及介质
CN112817827B (zh) 运维方法、装置、服务器、设备、系统及介质
CN116668264A (zh) 一种告警聚类的根因分析方法、装置、设备及存储介质
CN117009180A (zh) 日志、异常警报信息处理方法及装置
CN114745256A (zh) 一种服务器报警溯源方法、装置及存储介质
CN114629776B (zh) 基于图模型的故障分析方法及装置
CN117135038A (zh) 网络故障监测方法、装置及电子设备
CN113407428B (zh) 人工智能系统的可靠性评估方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant