CN111865699A - 故障识别方法、装置、计算设备和介质 - Google Patents

故障识别方法、装置、计算设备和介质 Download PDF

Info

Publication number
CN111865699A
CN111865699A CN202010764747.XA CN202010764747A CN111865699A CN 111865699 A CN111865699 A CN 111865699A CN 202010764747 A CN202010764747 A CN 202010764747A CN 111865699 A CN111865699 A CN 111865699A
Authority
CN
China
Prior art keywords
data
category
equipment
fault
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010764747.XA
Other languages
English (en)
Inventor
魏真
张浩文
周菲菲
夏刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010764747.XA priority Critical patent/CN111865699A/zh
Publication of CN111865699A publication Critical patent/CN111865699A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开提供了一种故障识别方法,用于信息安全领域,该方法包括:获取网络设备的设备数据,所述设备数据包括多个类别的数据;针对每个所述类别,处理所述类别的设备数据,得到与所述类别相对应的类别故障数据;处理所述设备数据和所述类别故障数据中的至少一个,得到所述网络设备的综合故障情况;以及基于所述类别故障数据和所述综合故障情况,确定所述网络设备是否存在安全风险。本公开还提供了一种故障识别装置、一种计算设备以及一种介质。

Description

故障识别方法、装置、计算设备和介质
技术领域
本公开涉及计算机技术、信息安全领域领域,特别是涉及一种故障识别方法、一种故障识别装置、一种计算设备以及一种计算机可读存储介质。
背景技术
网络设备的定期健康检查和发生故障后的问题原因分析对于IT运维非常重要。目前由于网络设备的设备基础信息、设备性能数据、设备告警日志等存在于诸多系统中,在对网络设备进行故障分析时从多个系统中搜集整理有效的数据会耗费大量人力和时间,对运维人员的技术水平有较高要求,并且难以保证故障分析结果的准确性。
发明内容
有鉴于此,本公开提供了一种优化的故障识别方法、故障识别装置、计算设备和计算机可读存储介质。
本公开的一个方面提供了一种故障识别方法,包括:获取网络设备的设备数据,所述设备数据包括多个类别的数据,针对每个所述类别,处理所述类别的设备数据,得到与所述类别相对应的类别故障数据,处理所述设备数据和所述类别故障数据中的至少一个,得到所述网络设备的综合故障情况,基于所述类别故障数据和所述综合故障情况,确定所述网络设备是否存在安全风险。
根据本公开实施例,上述多个类别的数据包括设备性能数据、设备告警数据、设备配置数据中的至少两个。
根据本公开实施例,上述针对每个所述类别,处理所述类别的设备数据包括,针对所述设备性能数据:处理所述设备性能数据,得到性能曲线,所述性能曲线表征性能指标随时间的变化关系。
根据本公开实施例,上述针对每个所述类别,处理所述类别的设备数据包括,针对所述设备告警数据:处理所述设备告警数据,得到所述网络设备的告警原因。
根据本公开实施例,上述针对每个所述类别,处理所述类别的设备数据包括,针对所述设备配置数据:对比当前配置数据和历史配置数据,得到网络设备的配置变更内容,确定由所述配置变更内容引起的设备故障信息。
根据本公开实施例,上述处理所述设备数据和所述类别故障数据中的至少一个,得到所述网络设备的综合故障情况包括:利用评分模型处理所述设备数据和所述类别故障数据,得到所述网络设备的评分,基于所述评分,确定所述网络设备的综合故障情况。
根据本公开实施例,在包括多个网络设备的情况下,所述获取网络设备的设备数据包括:采集原始数据,所述原始数据包括多个网络设备的设备数据,所述设备数据中包括网络设备的标识,基于所述网络设备的标识,对所述原始数据进行分类处理,得到每个网络设备的设备数据。
根据本公开实施例,上述设备数据还包括设备维护人员信息;所述方法还包括:根据所述维护人员信息,将所述类别故障数据和所述综合故障情况推送给维护人员。
本公开的另一个方面提供了一种故障识别装置,包括:获取模块、第一处理模块、第二处理模块以及确定模块。其中,获取模块,获取网络设备的设备数据,所述设备数据包括多个类别的数据。第一处理模块,针对每个所述类别,处理所述类别的设备数据,得到与所述类别相对应的类别故障数据。第二处理模块,处理所述设备数据和所述类别故障数据中的至少一个,得到所述网络设备的综合故障情况。确定模块,基于所述类别故障数据和所述综合故障情况,确定所述网络设备是否存在安全风险。
根据本公开实施例,上述多个类别的数据包括设备性能数据、设备告警数据、设备配置数据中的至少两个。
根据本公开实施例,上述针对每个所述类别,处理所述类别的设备数据包括,针对所述设备性能数据:处理所述设备性能数据,得到性能曲线,所述性能曲线表征性能指标随时间的变化关系。
根据本公开实施例,上述针对每个所述类别,处理所述类别的设备数据包括,针对所述设备告警数据:处理所述设备告警数据,得到所述网络设备的告警原因。
根据本公开实施例,上述针对每个所述类别,处理所述类别的设备数据包括,针对所述设备配置数据:对比当前配置数据和历史配置数据,得到网络设备的配置变更内容,确定由所述配置变更内容引起的设备故障信息。
根据本公开实施例,上述处理所述设备数据和所述类别故障数据中的至少一个,得到所述网络设备的综合故障情况包括:利用评分模型处理所述设备数据和所述类别故障数据,得到所述网络设备的评分,基于所述评分,确定所述网络设备的综合故障情况。
根据本公开实施例,在包括多个网络设备的情况下,所述获取网络设备的设备数据包括:采集原始数据,所述原始数据包括多个网络设备的设备数据,所述设备数据中包括网络设备的标识,基于所述网络设备的标识,对所述原始数据进行分类处理,得到每个网络设备的设备数据。
根据本公开实施例,上述设备数据还包括设备维护人员信息。所述装置还包括:推送模块,根据所述维护人员信息,将所述类别故障数据和所述综合故障情况推送给维护人员。
本公开的另一方面提供了一种计算设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的方法。
本公开的另一方面提供了一种非易失性可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开的实施例,利用如上所述的故障识别方法,可以至少部分地解决相关技术中在对网络设备进行故障分析时从多个系统中搜集整理有效的数据会耗费大量人力和时间,对运维人员的技术水平有较高要求,并且难以保证分析结果的准确性的技术问题。因此可以实现提高网络设备的故障识别准确性,便于在网络设备发生故障后快速定位问题,及时采取补救措施,降低生产运行风险的技术效果。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了根据本公开实施例的故障识别方法和故障识别装置的应用场景;
图2示意性示出了根据本公开实施例的故障识别方法的流程图;
图3示意性示出了根据本公开另一实施例的故障识别方法的流程图;
图4示意性示出了根据本公开另一实施例的故障识别方法的流程图;
图5示意性示出了根据本公开实施例的故障识别装置的框图;以及
图6示意性示出了根据本公开实施例的用于实现故障识别的计算机系统的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程控制装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。
因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。在本公开的上下文中,计算机可读存储介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。计算机可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
本公开的实施例提供了一种故障识别方法,包括:获取网络设备的设备数据,设备数据包括多个类别的数据。然后,针对每个类别,处理类别的设备数据,得到与类别相对应的类别故障数据,处理设备数据和类别故障数据中的至少一个,得到网络设备的综合故障情况。接下来,基于类别故障数据和综合故障情况,确定网络设备是否存在安全风险。
需要说明的是,本公开实施例的故障识别方法和故障识别装置可用于信息安全领域,也可用于除信息安全领域之外的任意领域,本公开实施例对故障识别方法和故障识别装置的应用领域不做限定。
图1示意性示出了根据本公开实施例的故障识别方法和故障识别装置的应用场景。需要注意的是,图1所示仅为可以应用本公开实施例的应用场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的应用场景100可以包括网络设备101、102、103,网络104和服务器105。网络104用以在网络设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用网络设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。网络设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
网络设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用网络设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给网络设备。
需要说明的是,本公开实施例所提供的故障识别方法一般可以由服务器105执行。相应地,本公开实施例所提供的故障识别装置一般可以设置于服务器105中。本公开实施例所提供的故障识别方法也可以由不同于服务器105且能够与网络设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的故障识别装置也可以设置于不同于服务器105且能够与网络设备101、102、103和/或服务器105通信的服务器或服务器集群中。
例如,服务器105可以获取网络设备101、102、103的设备数据,设备数据包括多个类别的数据。然后,针对每个类别,处理类别的设备数据,得到与类别相对应的类别故障数据,处理设备数据和类别故障数据中的至少一个,得到网络设备101、102、103的综合故障情况。接下来,基于类别故障数据和综合故障情况,确定网络设备101、102、103是否存在安全风险。
应该理解,图1中的网络设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的网络设备、网络和服务器。
下面结合图1的应用场景,参考图2~图4来描述根据本公开示例性实施方式的故障识别方法。需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。
图2示意性示出了根据本公开实施例的故障识别方法的流程图。
如图2所示,本公开实施例的故障识别方法例如可以包括操作S210~操作S240。
在操作S210,获取网络设备的设备数据,设备数据包括多个类别的数据。
根据本公开实施例,多个类别的数据可以包括设备性能数据、设备告警数据、设备配置数据等等。针对每个网络设备,例如可以采集每个网络设备的设备性能数据、设备告警数据、设备配置数据。
在操作S220,针对每个类别,处理类别的设备数据,得到与类别相对应的类别故障数据。
针对一个网络设备来说,分别处理该网络设备的每个类别的设备数据,得到与每个类别对应的类别故障数据。例如,处理设备性能数据以确定设备性能是否正常。处理设备告警数据以确定设备告警的原因,以便基于该告警原因对网络设备进行故障分析。处理设备配置数据,以便确定对网络设备进行配置过程中是否出现配置错误。
在操作S230,处理设备数据和类别故障数据中的至少一个,得到网络设备的综合故障情况。
在一种实施例中,可以基于每类别对应的类别故障数据来确定网络设备的综合故障情况。其中,每个类别对应的类别故障数据例如对网络设备的综合故障情况的影响程度不同。在一种示例中,例如网络设备的设备性能数据表征网络设备的设备性能不正常时,该网络设备的综合故障情况的严重程度为第一程度,当网络设备的设备告警数据表征设备出现告警时,该网络设备的综合故障情况的严重程度为第二程度,在一种情况下,第二程度例如大于第一程度。
在另一实施例中,可以基于设备数据以及每类别对应的类别故障数据来确定网络设备的综合故障情况。例如,由于设备数据中包括诸多信息,在处理设备数据得到每类别对应的类别故障数据时,存在遗漏部分设备数据或者部分设备数据在该类别故障数据中没有体现。为了保证所确定的网络设备的综合故障情况较为准确,可以基于设备数据和类别故障数据来确定综合故障情况,以提高所确定的综合故障情况的准确性。
接下来,在操作S240,基于类别故障数据和综合故障情况,确定网络设备是否存在安全风险。
例如,可以基于设备性能数据来确定网络设备的性能情况,基于设备告警数据来确定网络设备的告警情况,基于设备配置数据来确定网络设备的配置情况。然后,可以基于网络设备的性能情况、告警情况、配置情况以及综合故障情况来综合分析网络设备是否存在安全风险。
本公开实施例通过对网络设备的多种类别的设备数据进行分析得到网络设备的多个类别对应的类别故障数据以及综合故障情况,并基于类别故障数据和综合故障情况来综合分析网络设备是否存在安全风险,从而提高了网络设备的故障识别准确性,便于在网络设备发生故障后快速定位问题,及时采取补救措施,降低生产运行风险。
根据本公开实施例,当本公开实施例包括多个网络设备的情况下,操作S210中关于获取网络设备的设备数据可以包括:采集原始数据,原始数据包括多个网络设备的设备数据,设备数据中包括网络设备的标识,基于网络设备的标识,对原始数据进行分类处理,得到每个网络设备的设备数据。
其中,关于采集原始数据,可以通过不同的方式进行定期采集。原始数据例如包括设备的基本信息、设备性能数据、设备告警数据、设备配置数据等等。
例如,可以调用系统接口来采集多个网络设备的设备基本信息,设备基本信息可以包括设备名称、设备厂商型号、功能节点、维护人信息、所属区域等等。
关于获取多个设备的设备性能数据,可以通过SNMP协议及设备接口定期获取设备性能数据。设备性能数据可以包括设备CPU利用率、内存利用率、端口流量、端口错报数、防火墙连接数等数据。
关于获取多个设备的设备告警数据,可以实时接收网络设备发送的告警信息,告警信息可以包括设备故障日志、信息类日志、操作日志等。
关于获取多个设备的设备配置数据,定期获取网络设备的配置信息,配置信息可以包括全局配置、端口配置、路由信息等。
在采集到多个网络设备的原始数据之后,可以将采集到的原始数据存入数据库相对应的原始信息表,以供后续分类处理。
由于采集的原始数据包括多个网络设备的原始数据。为了对每个网络设备进行故障分析,需要对原始数据进行分类处理,以便将属于不同网络设备的数据进行区分。
首先,读取原始信息表中的原始数据,对于不完整数据进行丢弃,保留有效数据。然后,基于网络设备的设备标识,对原始数据进行分类,得到每个设备标识对应的设备基本信息、设备性能数据、设备告警数据、设备配置数据等等。其中,设备标识例如可以是设备的IP地址。
然后,将分类得到的每个网络设备的设备数据转换为可供分析的结构化数据,并将结构化数据存储在数据库中,便于后续进行对结构化数据进行处理。
其中,基于网络设备的设备标识,对原始数据进行分类还可以包括对采集到的原始数据进行聚类处理得到多个类簇,每个类簇中的数据例如包括相同的设备标识,即,每个类簇中的数据为一个网络设备的设备数据。
图3示意性示出了根据本公开另一实施例的故障识别方法的流程图。
如图3所示,本公开实施例的故障识别方法例如可以包括操作S210~操作S240。操作S210~操作S240与图2中描述的操作相同或类似。其中,操作S220可以包括操作S221~S223,操作S230包括操作S231~操作S232。
在操作S221,处理设备性能数据,得到性能曲线,性能曲线表征性能指标随时间的变化关系。
在本公开实施例中,性能指标可以包括CPU利用率、内存利用率等等。通过处理每个网络设备的设备性能数据,可以得到每个网络设备的性能曲线。性能曲线可以表征网络设备的性能故障情况。例如,当性能曲线表示CPU利用率在某一时间段内的变化程度较大,则可以表征网络设备的性能可能存在异常情况。
例如,将设备性能数据输入性能数据分析模型中进行处理,性能数据分析模型的输出可以是性能曲线。
在操作S222,处理设备告警数据,得到网络设备的告警原因。
在本公开实施例中,网络设备的告警原因可以包括由于某一端口出现故障导致告警、CPU利用率过高导致报警等等。
例如,将设备告警数据输入告警数据分析模型中进行处理,告警数据分析模型对设备告警数据中的网络设备的系统日志、连通性探测告警信息等进行分析,得到分析结果。
在操作S223,对比当前配置数据和历史配置数据,得到网络设备的配置变更内容,确定由配置变更内容引起的设备故障信息。
在本公开实施例中,网络设备的设备配置数据可以包括网络设备的全局配置信息、端口配置信息、路由配置信息等等。通过将网络设备的当前配置数据和历史配置数据进行对比,可以得到当前的配置变更内容,并确定由配置变更内容引起的设备故障信息。
例如,将当前配置数据和历史配置数据输入配置比对模型中进行处理,配置比对模型的输出可以是配置比对报告,该配置比对报告包括当前的配置变更内容。
根据本公开实施例,操作S230中关于处理设备数据和类别故障数据中的至少一个,得到网络设备的综合故障情况可以包括操作S231~操作S232。
在操作S231,利用评分模型处理设备数据和类别故障数据,得到网络设备的评分。
在操作S232,基于评分,确定网络设备的综合故障情况。
其中,评分模型的输入例如为每个网络设备的设备数据和类别故障数据,评分模型的输出例如为每个网络设备的评分。在一种示例中,评分可以是具体的分值,例如可以是80分、90分等等。其中,可以通过评分确定网络设备的综合故障情况。例如,评分越高可以表示网络设备的故障概率越小,网络设备的健康程度越高。
可见,本公开实施例通过对网络设备的多种类别的设备数据进行分析得到网络设备的多个类别对应的类别故障数据,以便基于类别故障数据来分析网络设备是否存在安全风险,从而提高了网络设备的故障识别准确性,便于在网络设备发生故障后快速定位问题,以及时采取补救措施来降低网络设备的安全风险。
图4示意性示出了根据本公开另一实施例的故障识别方法的流程图。
如图4所示,本公开实施例的故障识别方法例如可以包括操作S210~操作S240以及操作S410。其中,操作S210~操作S240与图2中描述的操作相同或类似,在此不再赘述。
根据本公开实施例,设备数据还包括设备维护人员信息。即,每个网络设备的设备数据包括设备基本信息,设备基本信息中可以包括设备维护人员信息。
在操作S410,根据维护人员信息,将类别故障数据和综合故障情况推送给维护人员。通过将类别故障数据和综合故障情况推送给具有权限的维护人员,便于根据维护人员及时采取相关措施来处理故障情况。
本公开实施例的类别故障数据和综合故障可以以图像或图表的形式来展示。
例如,通过评分可以确定高风险设备,例如评分较低的网络设备为高风险设备,本公开实施例可以主动提示维护人员对高风险设备进行健康检查。
例如,对于与设备性能数据相关的性能曲线,可以以性能容量分析图来表示,性能容量分析图可以显示一段时间内设备各项性能指标曲线以及均值、峰值、谷值等数据,帮助维护人员了解当前网络设备性能状态,以便对带宽扩容、硬件升级等提供数据支撑。
另外,维护人员可以查看网络设备近期重要告警,对频繁发生的告警及时处理,避免发生安全隐患。维护人员还可以根据网络设备的设备基本信息快速定位设备所属区域,以缩短故障处理时间,进行快速应急。本公开实施例还可以基于配置比对分析结果来实时提示配置变化情况。对于路由变化等高风险配置问题及时预警,降低安全风险。
通过本公开实施例的技术方案,可以有效降低维护人员日常设备巡检中的工作量,提高工作效率,由人工经验逐步向自动化数据分析转变,减少由于人为判断失误及经验不足导致的安全隐患。本公开实施例实现了在网络设备发生故障后快速定位问题,省去现场收集设备数据的工作,有效缩短应急时间,以在第一时间恢复业务。
根据本公开实施例,通过对网络设备的多维度设备数据进行采集和画像建模,得出网络设备的各项指标的分析结果及整体健康度(评分),维护人员可根据网络设备画像及分析结果对网络设备进行深度健康检查或故障分析,有效降低生产运行风险,减轻维护人员工作量,提高网络专业整体可用性。
可见,本公开实施例通过网络设备画像技术得出网络设备各项指标分析结果及整体健康度(评分),实现了数据采集、数据分类处理、数据建模计算、实时显示分析结果的全流程自动化效果,提高了网络设备的安全风险分析效率。
图5示意性示出了根据本公开实施例的故障识别装置的框图。
如图5所示,故障识别装置500例如可以包括获取模块510、第一处理模块520、第二处理模块530以及确定模块540。
获取模块510可以用于获取网络设备的设备数据,设备数据包括多个类别的数据。根据本公开实施例,获取模块510例如可以执行上文参考图2描述的操作S210,在此不再赘述。
第一处理模块520可以用于针对每个类别,处理类别的设备数据,得到与类别相对应的类别故障数据。根据本公开实施例,第一处理模块520例如可以执行上文参考图2描述的操作S220,在此不再赘述。
第二处理模块530可以用于处理设备数据和类别故障数据中的至少一个,得到网络设备的综合故障情况。根据本公开实施例,第二处理模块530例如可以执行上文参考图2描述的操作S230,在此不再赘述。
确定模块540可以用于基于类别故障数据和综合故障情况,确定网络设备是否存在安全风险。根据本公开实施例,确定模块540例如可以执行上文参考图2描述的操作S240,在此不再赘述。
可见,本公开实施例通过对网络设备的多种类别的设备数据进行分析得到网络设备的多个类别对应的类别故障数据以及综合故障情况,并基于类别故障数据和综合故障情况来综合分析网络设备是否存在安全风险,从而提高了网络设备的故障识别准确性,便于在网络设备发生故障后快速定位问题,以便及时采取补救措施来降低生产运行风险。
根据本公开实施例,多个类别的数据包括设备性能数据、设备告警数据、设备配置数据中的至少两个。
根据本公开实施例,上述针对每个类别,处理类别的设备数据包括,针对设备性能数据:处理设备性能数据,得到性能曲线,性能曲线表征性能指标随时间的变化关系。
根据本公开实施例,针对每个类别,处理类别的设备数据包括,针对设备告警数据:处理设备告警数据,得到网络设备的告警原因。
根据本公开实施例,针对每个类别,处理类别的设备数据包括,针对设备配置数据:对比当前配置数据和历史配置数据,得到网络设备的配置变更内容,确定由配置变更内容引起的设备故障信息。
根据本公开实施例,处理设备数据和类别故障数据中的至少一个,得到网络设备的综合故障情况包括:利用评分模型处理设备数据和类别故障数据,得到网络设备的评分,基于评分,确定网络设备的综合故障情况。
根据本公开实施例,在包括多个网络设备的情况下,获取网络设备的设备数据包括:采集原始数据,原始数据包括多个网络设备的设备数据,设备数据中包括网络设备的标识,基于网络设备的标识,对原始数据进行分类处理,得到每个网络设备的设备数据。
根据本公开实施例,设备数据还包括设备维护人员信息。装置500还可以包括:推送模块,根据维护人员信息,将类别故障数据和综合故障情况推送给维护人员。
本公开还提供了一种计算设备,该计算设备可以包括:一个或多个处理器和存储装置。该存储装置可以用于存储一个或多个程序。其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器可以执行上文提及的方法。
本公开的另一方面提供了一种非易失性可读存储介质,该非易失性可读存储介质存储有计算机可执行指令,该指令在被执行时可以用于实现上文提及的方法。
本公开的另一方面提供了一种计算机程序,该计算机程序包括计算机可执行指令,该指令在被执行时可以用于实现上文提及的方法。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,获取模块510、第一处理模块520、第二处理模块530以及确定模块540中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,获取模块510、第一处理模块520、第二处理模块530以及确定模块540中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块510、第一处理模块520、第二处理模块530以及确定模块540中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图6示意性示出了根据本公开实施例的用于实现故障识别的计算机系统的方框图。图6示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括处理器601、计算机可读存储介质602。该系统600可以执行根据本公开实施例的方法。
具体地,处理器601例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质602,例如可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
计算机可读存储介质602可以包括计算机程序603,该计算机程序603可以包括代码/计算机可执行指令,其在由处理器601执行时使得处理器601执行根据本公开实施例的方法或其任何变形。
计算机程序603可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序603中的代码可以包括一个或多个程序模块,例如包括603A、模块603B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器601执行时,使得处理器601可以执行根据本公开实施例的方法或其任何变形。
根据本公开的实施例,获取模块510、第一处理模块520、第二处理模块530以及确定模块540中的至少一个可以实现为参考图6描述的计算机程序模块,其在被处理器601执行时,可以实现上面描述的相应操作。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现上述方法。
根据本公开的实施例,计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、射频信号等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

Claims (11)

1.一种故障识别方法,包括:
获取网络设备的设备数据,所述设备数据包括多个类别的数据;
针对每个所述类别,处理所述类别的设备数据,得到与所述类别相对应的类别故障数据;
处理所述设备数据和所述类别故障数据中的至少一个,得到所述网络设备的综合故障情况;以及
基于所述类别故障数据和所述综合故障情况,确定所述网络设备是否存在安全风险。
2.根据权利要求1所述的方法,其中,所述多个类别的数据包括设备性能数据、设备告警数据、设备配置数据中的至少两个。
3.根据权利要求2所述的方法,其中,所述针对每个所述类别,处理所述类别的设备数据包括,针对所述设备性能数据:
处理所述设备性能数据,得到性能曲线,所述性能曲线表征性能指标随时间的变化关系。
4.根据权利要求2所述的方法,其中,所述针对每个所述类别,处理所述类别的设备数据包括,针对所述设备告警数据:
处理所述设备告警数据,得到所述网络设备的告警原因。
5.根据权利要求2所述的方法,其中,所述针对每个所述类别,处理所述类别的设备数据包括,针对所述设备配置数据:
对比当前配置数据和历史配置数据,得到网络设备的配置变更内容;
确定由所述配置变更内容引起的设备故障信息。
6.根据权利要求2至5中任意一项所述的方法,其中,所述处理所述设备数据和所述类别故障数据中的至少一个,得到所述网络设备的综合故障情况包括:
利用评分模型处理所述设备数据和所述类别故障数据,得到所述网络设备的评分;以及
基于所述评分,确定所述网络设备的综合故障情况。
7.根据权利要求1所述的方法,其中,在包括多个网络设备的情况下,所述获取网络设备的设备数据包括:
采集原始数据,所述原始数据包括多个网络设备的设备数据,所述设备数据中包括网络设备的标识;以及
基于所述网络设备的标识,对所述原始数据进行分类处理,得到每个网络设备的设备数据。
8.根据权利要求7所述的方法,其中,所述设备数据还包括设备维护人员信息;所述方法还包括:
根据所述维护人员信息,将所述类别故障数据和所述综合故障情况推送给维护人员。
9.一种故障识别装置,包括:
获取模块,获取网络设备的设备数据,所述设备数据包括多个类别的数据;
第一处理模块,针对每个所述类别,处理所述类别的设备数据,得到与所述类别相对应的类别故障数据;
第二处理模块,处理所述设备数据和所述类别故障数据中的至少一个,得到所述网络设备的综合故障情况;以及
确定模块,基于所述类别故障数据和所述综合故障情况,确定所述网络设备是否存在安全风险。
10.一种计算设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1至8中任一项所述的方法。
11.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1至8中任一项所述的方法。
CN202010764747.XA 2020-07-31 2020-07-31 故障识别方法、装置、计算设备和介质 Pending CN111865699A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010764747.XA CN111865699A (zh) 2020-07-31 2020-07-31 故障识别方法、装置、计算设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010764747.XA CN111865699A (zh) 2020-07-31 2020-07-31 故障识别方法、装置、计算设备和介质

Publications (1)

Publication Number Publication Date
CN111865699A true CN111865699A (zh) 2020-10-30

Family

ID=72954375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010764747.XA Pending CN111865699A (zh) 2020-07-31 2020-07-31 故障识别方法、装置、计算设备和介质

Country Status (1)

Country Link
CN (1) CN111865699A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115002171A (zh) * 2022-08-08 2022-09-02 安徽新宇环保科技股份有限公司 一种污水处理设施的智能运营监管系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018028573A1 (zh) * 2016-08-12 2018-02-15 中兴通讯股份有限公司 故障处理方法、装置及控制器
CN109787817A (zh) * 2018-12-28 2019-05-21 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) 网络故障诊断方法、装置和计算机可读存储介质
CN109992486A (zh) * 2019-04-02 2019-07-09 北京睿至大数据有限公司 一种基于时序和热力图的it故障展示方法
CN110377445A (zh) * 2019-06-28 2019-10-25 苏州浪潮智能科技有限公司 故障预测方法和装置
CN110851342A (zh) * 2019-11-08 2020-02-28 中国工商银行股份有限公司 故障预测方法、装置、计算设备以及计算机可读存储介质
CN110995481A (zh) * 2019-11-25 2020-04-10 深圳前海达闼云端智能科技有限公司 配置方法、服务器及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018028573A1 (zh) * 2016-08-12 2018-02-15 中兴通讯股份有限公司 故障处理方法、装置及控制器
CN109787817A (zh) * 2018-12-28 2019-05-21 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) 网络故障诊断方法、装置和计算机可读存储介质
CN109992486A (zh) * 2019-04-02 2019-07-09 北京睿至大数据有限公司 一种基于时序和热力图的it故障展示方法
CN110377445A (zh) * 2019-06-28 2019-10-25 苏州浪潮智能科技有限公司 故障预测方法和装置
CN110851342A (zh) * 2019-11-08 2020-02-28 中国工商银行股份有限公司 故障预测方法、装置、计算设备以及计算机可读存储介质
CN110995481A (zh) * 2019-11-25 2020-04-10 深圳前海达闼云端智能科技有限公司 配置方法、服务器及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115002171A (zh) * 2022-08-08 2022-09-02 安徽新宇环保科技股份有限公司 一种污水处理设施的智能运营监管系统
CN115002171B (zh) * 2022-08-08 2022-10-28 安徽新宇环保科技股份有限公司 一种污水处理设施的智能运营监管系统

Similar Documents

Publication Publication Date Title
CN110851342A (zh) 故障预测方法、装置、计算设备以及计算机可读存储介质
CN105631026B (zh) 一种安全数据分析系统
US10284444B2 (en) Visual representation of end user response time in a multi-tiered network application
US20210306235A1 (en) Automating 5G slices using real-time analytics
CN107332765B (zh) 用于维修路由器故障的方法和装置
CN109039787B (zh) 日志处理方法、装置及大数据集群
US11126494B2 (en) Automated, adaptive, and auto-remediating system for production environment
CN111611100B (zh) 交易故障检测方法、装置、计算设备以及介质
CN112559831A (zh) 链路监控方法、装置、计算机设备及介质
CN111209153B (zh) 异常检测处理方法、装置及电子设备
CN110851471A (zh) 分布式日志数据处理方法、装置以及系统
CN117608825A (zh) 基于多云管理平台的资源管理方法和相关设备
CN113032237B (zh) 数据处理方法及装置、电子设备和计算机可读存储介质
CN113282920B (zh) 日志异常检测方法、装置、计算机设备和存储介质
WO2022042126A1 (en) Fault localization for cloud-native applications
CN111865699A (zh) 故障识别方法、装置、计算设备和介质
CN112579402A (zh) 一种应用系统故障定位的方法和装置
CN107612755A (zh) 一种云资源的管理方法及其装置
WO2023200597A1 (en) Automated positive train control event data extraction and analysis engine for performing root cause analysis of unstructured data
CN111597095A (zh) 监控方法、监控装置、电子设备、以及介质
US11861509B2 (en) Automated positive train control event data extraction and analysis engine for performing root cause analysis of unstructured data
CN115484150B (zh) 告警信息的处理方法、系统、设备及存储介质
CN116882724B (zh) 一种业务流程优化方案的生成方法、装置、设备及介质
CN117040918A (zh) 一种网络安全管理平台
CN116136818A (zh) 用于消息队列的健康巡检方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201030

RJ01 Rejection of invention patent application after publication