CN114168435A - 一种告警处理推荐方法、装置、设备及可读存储介质 - Google Patents

一种告警处理推荐方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN114168435A
CN114168435A CN202111280065.2A CN202111280065A CN114168435A CN 114168435 A CN114168435 A CN 114168435A CN 202111280065 A CN202111280065 A CN 202111280065A CN 114168435 A CN114168435 A CN 114168435A
Authority
CN
China
Prior art keywords
processing
alarm
historical
recommendation
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111280065.2A
Other languages
English (en)
Inventor
杨虎
耿志成
牟洪洋
郭锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Data Technology Co Ltd
Original Assignee
Jinan Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Data Technology Co Ltd filed Critical Jinan Inspur Data Technology Co Ltd
Priority to CN202111280065.2A priority Critical patent/CN114168435A/zh
Publication of CN114168435A publication Critical patent/CN114168435A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请公开了一种告警处理推荐方法、装置、设备及可读存储介质,方法包括:接收服务器的告警信息,根据告警信息确定当前告警类型;从预先确定的告警处理库中获取与当前告警类型对应且推荐因子最高的处理方案,并输出处理方案;告警处理库的确定过程包括:根据服务器历史告警信息确定历史告警类型及处理前的级别;获取各历史告警类型的各处理方案,获取各历史告警类型在采用对应的各处理方案处理后的级别;根据各历史告警类型及其处理前、后的级别确定各历史告警类型的各处理方案的推荐因子。本申请公开的技术方案,基于服务器历史告警信息及处理情况给客户推荐合适的处理方案,从而便于客户据此对服务器进行有效处理,以提高服务器运行的稳定性。

Description

一种告警处理推荐方法、装置、设备及可读存储介质
技术领域
本申请涉及服务器技术领域,更具体地说,涉及一种告警处理推荐方法、装置、设备及可读存储介质。
背景技术
随着大数据时代的到来,对服务的存储需求越来越大,尤其是受疫情的影响,手机成为与外界沟通的主要工具,这些途径的后面都是大量的物理设备的支持,尤其是各个机房中的服务器,因此,服务器的正常运行变得越来越重要。
服务器在运行过程中会出现各种各样的问题,BMC(Baseboard ManagementController,基板管理控制器)收集服务器的告警信息,并上传给客户。客户在收到告警之后,如果没有专业的运维人员,很难根据服务器的告警信息去处理这些告警,而这则会导致服务器后续可能会出现无法正常运行等问题,从而给客户带来损失。
综上所述,如何便于客户对服务器的告警进行处理,是目前本领域技术人员亟待解决的技术问题。
发明内容
有鉴于此,本申请的目的是提供一种告警处理推荐方法、装置、设备及可读存储介质,用于便于客户对服务器的告警进行处理。
为了实现上述目的,本申请提供如下技术方案:
一种告警处理推荐方法,包括:
接收服务器的告警信息,根据所述告警信息确定当前告警类型;
从预先确定的告警处理库中获取与所述当前告警类型对应且推荐因子最高的处理方案,并输出所述处理方案;
预先确定所述告警处理库的过程包括:
获取服务器历史告警信息,根据所述服务器历史告警信息确定历史告警类型及处理前的级别;
获取各历史告警类型的各处理方案,并获取各历史告警类型在分别采用对应的各处理方案进行处理后的级别;
根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子,以得到所述告警处理库。
优选的,还包括:
获取外界对各历史告警类型的各处理方案的反馈信息;
相应地,根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子,包括:
根据各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定各历史告警类型的各处理方案的推荐因子。
优选的,根据各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定各历史告警类型的各处理方案的推荐因子,包括:
根据同一机型的服务器对应的各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定同一机型的服务器对应的各历史告警类型的各处理方案的推荐因子;
根据多个机型的服务器对应的同一历史告警类型的同一处理方案的推荐因子,计算各历史告警类型的各处理方案的推荐因子。
优选的,根据同一机型的服务器对应的各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定同一机型的服务器对应的各历史告警类型的各处理方案的推荐因子,包括:
根据同一机型的服务器对应的历史告警类型处理前的级别、在采用对应的当前处理方案进行每次处理后的级别及预先设置的处理奖赏规则,确定同一机型的服务器对应的历史告警类型在采用所述当前处理方案进行每次处理时的奖赏值;
根据同一机型的服务器对应的历史告警类型对应的权重、在采用所述当前处理方案进行每次处理后的级别对应的权重、在采用所述当前处理方案进行每次处理时的奖赏值及每次处理时的反馈信息对应的权重,对应计算同一机型的服务器对应的历史告警类型在采用所述当前处理方案进行各次处理时对应的推荐因子;
根据同一机型的服务器对应的历史告警类型在采用所述当前处理方案进行各次处理时对应的推荐因子,计算同一机型的服务器对应的历史告警类别对应的所述当前处理方案的推荐因子。
优选的,在根据所述告警信息确定当前告警类型之后,还包括:
接收当前告警类型选择命令,根据所述当前告警类型选择命令从当前告警类型中选取目标告警类型;
相应地,从预先确定的告警处理库中获取与所述当前告警类型对应且推荐因子最高的处理方案,包括:
从所述告警处理库中获取与所述目标告警类型对应且推荐因子最高的处理方案。
优选的,接收服务器的告警信息,包括:
通过SSH链接、RESTFULL接口、RedFish接口中的至少一种方式接收服务器的告警信息。
一种告警处理推荐装置,包括:
接收模块,用于接收服务器的告警信息,根据所述告警信息确定当前告警类型;
第一获取模块,用于从预先确定的告警处理库中获取与所述当前告警类型对应且推荐因子最高的处理方案,并输出所述处理方案;
所述告警处理推荐装置还包括用于预先确定所述告警处理库的确定模块,所述确定模块包括:
第一获取单元,用于获取服务器历史告警信息,根据所述服务器历史告警信息确定历史告警类型及处理前的级别;
第二获取单元,用于获取各历史告警类型的各处理方案,并获取各历史告警类型在分别采用对应的各处理方案进行处理后的级别;
确定单元,用于根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子,以得到所述告警处理库。
优选的,还包括:
第二获取模块,用于获取外界对各历史告警类型的各处理方案的反馈信息;
相应地,所述确定单元包括:
第一确定子单元,用于根据各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定各历史告警类型的各处理方案的推荐因子。
一种告警处理推荐设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述任一项所述的告警处理推荐方法的步骤。
一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的告警处理推荐方法的步骤。
本申请提供了一种告警处理推荐方法、装置、设备及可读存储介质,其中,该方法包括:接收服务器的告警信息,根据告警信息确定当前告警类型;从预先确定的告警处理库中获取与当前告警类型对应且推荐因子最高的处理方案,并输出处理方案;预先确定告警处理库的过程可以包括:获取服务器历史告警信息,根据服务器历史告警信息确定历史告警类型及处理前的级别;获取各历史告警类型的各处理方案,并获取各历史告警类型在分别采用对应的各处理方案进行处理后的级别;根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子,以得到告警处理库。
本申请公开的上述技术方案,预先根据服务器历史告警信息确定历史告警类型及历史告警类型在处理前的级别,并获取各历史告警类型在分别采用获取到的各处理方案进行处理后的级别,然后,根据各历史告警类型及其处理前、后的级别对应确定各历史告警类型的各处理方案的推荐因子,以实现基于历史告警信息得到告警处理库。在接收到服务器的告警信息之后,可以先确定当前告警类型,然后从预先确定的告警处理库中获取与当前告警类型对应且推荐因子最高的处理方案,并输出所获取到的处理方案,以实现基于服务器历史告警信息及其处理情况而给客户推荐最为合适的处理方案,从而便于客户可以根据输出的处理方案来对服务器的当前告警进行有效的处理,以提高服务器运行的可靠性和稳定性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种告警处理推荐方法的流程图;
图2为本申请实施例提供的一种告警处理推荐装置的结构示意图;
图3为本申请实施例提供的一种告警处理推荐设备的结构示意图。
具体实施方式
随着大数据时代的到来,服务器的正常运行变得越来越重要,但是,在服务器运行的过程中,会有各种各样的问题,BMC收集服务器的告警信息,并上传给客户。客户在收到告警之后,如果没有专业的运维人员,很难根据服务器的告警信息去处理这些告警,而这则会导致服务器后续可能会出现无法正常运行等问题,从而给客户带来损失。
为此,本申请提供一种告警处理推荐方法、装置、设备及可读存储介质,用于便于客户对服务器的告警进行处理。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1,其示出了本申请实施例提供的一种告警处理推荐方法的流程图,本申请实施例提供的一种告警处理推荐方法,包括:
S11:获取服务器历史告警信息,根据服务器历史告警信息确定历史告警类型及处理前的级别。
在本申请中,在进行告警处理推荐之前,可以利用BMC采集服务器历史告警信息,并利用BMC告警装置将BMC收到的服务器历史告警信息上报到中央处理装置,以使得中央处理装置可以获取到服务器历史告警信息。当然,中央处理装置也可以主动通过BMC告警装置收集服务器历史告警信息。需要说明的是,服务器历史告警信息具体即为服务器在历史时间所对应的告警信息。另外,中央处理装置在获取服务器历史告警信息之前,还可以添加相应服务器的信息(具体包括服务器的机型等)、BMC的用户名及密码,以便于基于这些信息来进行服务器历史告警信息的获取。
中央处理装置在获取服务器历史告警信息之后,可以根据服务器历史告警信息确定历史告警类型及历史告警类型在处理前的级别,其中,历史告警类型具体可以分为CPU(Central Processing Unit,中央处理器)告警、内存告警、PCIE(peripheral componentinterconnect express,一种高速串行计算机扩展总线标准)告警、其他告警这四大类,当然,也可以根据实际需要而将其划分为更多类型或其他类型,本申请对此不做限定,历史告警类型的级别具体可以分为通知、警告、错误这三大级别,且这三个级别的严重程度依次增加,当然,也可以根据实际需要而将其划分为更多级别,本申请对此不做任何限定。
在确定历史告警类型及处理前的级别之后,可以将历史告警类型及处理前的级别发送至外界(本申请以运维人员为例进行说明,当然,也可以为其他可进行告警处理的人员或装置),以便于外界根据历史告警类型及处理前的级别对历史告警类型进行处理。
S12:获取各历史告警类型的各处理方案,并获取各历史告警类型在分别采用对应的各处理方案进行处理后的级别。
在步骤S11的基础上,中央处理装置可以对外界对历史告警类型的处理进行记录,以获取各历史告警类型对应的处理方案,其中,考虑到每个历史告警类型可以存在多种处理方式,因此,每种处理方式即记录为一个处理方案,则对于每个历史告警类型而言,则可以获取其对应的各处理方案。
在获取各历史告警类型的各处理方案的同时或之后,可以获取各历史告警类型在分别采用对应的处理方案进行处理后的级别,例如:对于CPU告警,其有处理方案a1、处理方案a2、处理方案a3这三个处理方案,则可以获取CPU告警在分别采用处理方案a1、处理方案a2、处理方案a3进行处理后的级别,以便于基于历史告警类型在处理前的级别、在采用对应的处理方案进行处理后的级别进行对应处理方案的推荐因子的确定。其中,若历史告警类型在采用对应的处理方案进行处理后的级别低于历史告警类型在处理前的级别,则表明该处理方案比较有利于历史告警类型的处理,反之,则不利于历史告警类型的处理。
S13:根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子,以得到告警处理库。
在步骤S12的基础上,对于每个历史告警类型而言,则可以根据历史告警类型、历史告警类型在采用处理方案进行处理前的级别、历史告警类型在分别采用对应的各处理方案进行处理后的级别,对应确定历史告警类型的各处理方案的推荐因子。具体地,对于第x(x=1,2,…,历史告警类型总个数)个历史告警类型而言,则可以根据第x个历史告警类型(主要是告警类型)、第x个历史告警类型在采用处理方案进行处理前的级别、第x个历史告警类型在采用第m(m=1,2,…,第x个历史告警类型对应的处理方案的总个数)个处理方案进行处理后的级别,对应确定第x个历史告警类型的第m个处理方案的推荐因子,从而确定各历史告警类型的各处理方案的推荐因子。例如:对于CPU告警,则可以根据CPU告警(主要是根据告警类型)、在采用处理方案进行处理前的级别、采用处理方案a1进行处理后的级别,确定CPU告警对应的处理方案a1的推荐因子,对于CPU告警的处理方案a2的推荐因子、处理方案a3的推荐因子的确定方式与处理方案a1的推荐因子的确定方式类似,且其他历史告警类型对应的各处理方案的推荐因子的确定方式与此类似,在此不再赘述。
通过上述方式即可得到包含有历史告警类型、历史告警类型对应的各处理方案、历史告警类型对应的各处理方案的推荐因子的告警处理库,即实现基于历史告警信息得到告警处理库。需要说明的是,上述步骤S11-步骤S13是告警处理库的预先确定过程,该过程无需每次进行告警处理推荐之前均执行一次,也即一旦预先确定好告警处理库,则后续每次在进行告警处理推荐时可以直接借助预先确定好的告警处理库进行实现即可,以提高告警处理推荐的便利性和效率。当然,也可以根据后续对服务器的告警处理来对预先确定的告警处理库进行更新等操作,以便于提高告警处理推荐的准确性。
S14:接收服务器的告警信息,根据告警信息确定当前告警类型。
在服务器的当前运行中,BMC可以对服务器进行监控,并在监测到服务器出现告警信息时及时将告警信息通过BMC告警装置发送至中央处理装置,其中,BMC可以定时或实时对服务器进行监控,以便于及时发现告警信息。当然,中央处理装置也可以主动通过BMC告警装置收集服务器的告警信息,本申请对此不做任何限定。
中央处理装置在接收服务器的告警信息之后,则可以根据服务器的告警信息确定当前告警类型,并可以对当前告警类型进行显示,以便于客户可以及时获取服务器的当前告警类型。
S15:从预先确定的告警处理库中获取与当前告警类型对应且推荐因子最高的处理方案,并输出处理方案。
中央处理装置在根据服务器的告警信息确定当前告警类型之后,可以从经过步骤S11-步骤S13预先确定的告警处理库中获取与当前告警类型对应且推荐因子最高的处理方案,并可以输出处理方案,具体地,可以通过邮件、短信、APP、中央处理装置的显示屏进行显示中的至少一种方式来输出处理方案,以便于服务器的客户可以及时获知针对服务器的当前告警类型的处理方案,从而便于客户可以根据中央处理装置所输出的处理方案进行告警处理,以使得服务器可以保持正常运行,进而保证服务器运行的稳定性和可靠性,并提高客户的体验度。
通过本申请可以实现基于服务器历史告警信息及对历史告警信息的处理而针对服务器的当前告警类型给客户推荐最为合适的处理方案,从而避免因客户不知道如何进行告警处理而使得服务器出现故障、无法正常运行等情况,进而避免给客户带来损失。
本申请公开的上述技术方案,预先根据服务器历史告警信息确定历史告警类型及历史告警类型在处理前的级别,并获取各历史告警类型在分别采用获取到的各处理方案进行处理后的级别,然后,根据各历史告警类型及其处理前、后的级别对应确定各历史告警类型的各处理方案的推荐因子,以实现基于历史告警信息得到告警处理库。在接收到服务器的告警信息之后,可以先确定当前告警类型,然后从预先确定的告警处理库中获取与当前告警类型对应且推荐因子最高的处理方案,并输出所获取到的处理方案,以实现基于服务器历史告警信息及其处理情况而给客户推荐最为合适的处理方案,从而便于客户可以根据输出的处理方案来对服务器的当前告警进行有效的处理,以提高服务器运行的可靠性和稳定性。
本申请实施例提供的一种告警处理推荐方法,还可以包括:
获取外界对各历史告警类型的各处理方案的反馈信息;
相应地,根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子,可以包括:
根据各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定各历史告警类型的各处理方案的推荐因子。
在本申请中,考虑到外界对处理方案的处理也会对告警处理产生影响,因此,在预先确定告警处理库的过程中,还可以获取外界对各历史告警类型的各处理方案的反馈信息,这里提及的反馈信息具体可以包含操作等级,其中,操作等级具体可以分为第一等级、第二等级、第三等级这三个等级(这三个等级依次增高),且这个等级具体可以根据外界自身等级进行确定,当然,外界也可以根据自身对于处理方案的操作熟练度而选择反馈自身操作等级。
相应地,在根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子时,则可以将外界对处理方案的反馈信息考虑在内,因此,对于每个历史告警类型而言,中央处理装置则可以根据历史告警类型、历史告警类型在采用处理方案处理前的级别、历史告警类型在分别采用对应的各处理方案处理后的级别、历史告警类型对应的各处理方案的反馈信息来对应确定历史告警类型对应的各处理方案的推荐因子,以提高推荐因子确定的全面性、准确性。
本申请实施例提供的一种告警处理推荐方法,根据各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定各历史告警类型的各处理方案的推荐因子,可以包括:
根据同一机型的服务器对应的各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定同一机型的服务器对应的各历史告警类型的各处理方案的推荐因子;
根据多个机型的服务器对应的同一历史告警类型的同一处理方案的推荐因子,计算各历史告警类型的各处理方案的推荐因子。
在本申请中,在根据各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定各历史告警类型的各处理方案的推荐因子时,具体可以将服务器机型这个影响因子考虑在内,以防止在进行告警处理时陷入局部最优解,即通过根据各机型服务器对同一告警类型同一处理方案的反馈而计算告警类型的处理方案的推荐因子,以使得推荐因子更加可靠。
具体地,首先,对于同一机型的服务器对应的第x个历史告警类型而言,可以根据该历史告警类型、同一机型服务器中该历史告警类型在采用处理方案处理前的级别、同一机型服务器中该历史告警类型在采用第m个处理方案进行处理后的级别、外界对同一机型服务器中该历史告警类型对应的第m个处理方案的反馈信息,确定同一机型服务器中第x个历史告警类型对应的第m个处理方案的推荐因子,从而确定同一机型的服务器对应的各历史告警类型的各处理方案的推荐因子。
然后,则可以根据多个机型的服务器对应的同一历史告警类型的同一处理方案的推荐因子来对应计算每个历史告警类型对应的各处理方案的推荐因子,具体地,可以利用
Figure BDA0003328944060000101
对应计算第x个历史告警类型的第m个处理方案的推荐因子,其中,n为服务器机型的个数,
Figure BDA0003328944060000102
为第i个机型的服务器对应的第x个历史告警类型的第m个处理方案的推荐因子,
Figure BDA0003328944060000103
为n个机型的服务器对应的第x个历史告警类型的第m个处理方案的推荐因子,x及n为正整数,从而计算各历史告警类型的各处理方案的推荐因子。
通过在计算处理方案的推荐因子时将不同机型的服务器均考虑在内可以便于增加广度,以避免陷入局部最优解,从而提高处理方案推荐的准确性。
本申请实施例提供的一种告警处理推荐方法,根据同一机型的服务器对应的各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定同一机型的服务器对应的各历史告警类型的各处理方案的推荐因子,可以包括:
根据同一机型的服务器对应的历史告警类型处理前的级别、在采用对应的当前处理方案进行每次处理后的级别及预先设置的处理奖赏规则,确定同一机型的服务器对应的历史告警类型在采用当前处理方案进行每次处理时的奖赏值;
根据同一机型的服务器对应的历史告警类型对应的权重、在采用当前处理方案进行每次处理后的级别对应的权重、在采用当前处理方案进行每次处理时的奖赏值及每次处理时的反馈信息对应的权重,对应计算同一机型的服务器对应的历史告警类型在采用当前处理方案进行各次处理时对应的推荐因子;
根据同一机型的服务器对应的历史告警类型在采用当前处理方案进行各次处理时对应的推荐因子,计算同一机型的服务器对应的历史告警类别对应的当前处理方案的推荐因子。
在本申请中,在根据同一机型的服务器对应的各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定同一机型的服务器对应的各历史告警类型的各处理方案的推荐因子时,首先,可以根据同一机型的服务器对应的第x个历史告警类型处理前的级别X、在采用对应的当前处理方案A进行第y次处理后的级别Py及预先设置的处理奖赏规则,确定同一机型的服务器对应的第x个历史告警类型在采用对应的当前处理方案A进行第y次处理后的奖赏值Ry,其中,y=1,2,…,当前处理方案A的总处理次数,且第x个历史告警类型对应的各处理方案均分别作为当前处理A进行奖赏值的确定及后续的推荐因子的计算。
预先设置的处理奖赏规则具体可以为:如果第x个历史告警类型在采用当前处理方案A进行第y次处理后,其级别Py比处理前的级别X低,也即如果第x个历史告警类型在进行处理后的级别发生降低,则奖赏值Ry从第一区间中取第一固定值,其中,第一区间中最小值为大于0的值,比如可以为(2,5),当然,也可以根据需要而调整为其他区间;如果第x个历史告警类型在采用当前处理方案A进行第y次处理后,其级别Py比处理前的级别X高,也即如果第x个历史告警类型在进行处理后的级别升高,则奖赏值Ry从第二区间中取第二固定值,其中,第二区间中最大值为小于0的值,比如可以为(-20,-10),当然,也可以根据需要而调整为其他区间。需要说明的是,为了便于计算,每次处理后所取的第一固定值和第二固定值均可以是固定的,另外,上述提及的取第一固定值和第二固定值指的是历史告警类型的级别在相邻两个级别(例如从第一级别到第二级别、第二级别到第一级别等)之间发生变化时的情况,如果历史告警类型在处理后发生跨级别(例如从第一级别到第三级别)变化,则其奖赏值Ry为多个相邻级别对应的奖赏值的总和,而且如果历史告警类型在采用当前理方案A进行第y次处理后得到完全解决,则可以直接将当前理方案A进行第y次处理的奖赏值设置为第三固定值,其中,第三固定值大于第一固定值,比如可以为50,当然,也可以根据需要而对其进行调整。
在上述基础上,则可以根据同一机型的服务器对应的第x个历史告警类型的权重arx、在采用当前理方案A进行第y次处理后的级别Py对应的权重ery、在采用当前理方案A进行第y次处理后的奖赏值Ry及第y次处理时的反馈信息对应的权重pry,利用vy=Ry*arx*ery*pry计算同一机型的服务器对应的第x个历史告警类型在采用当前理方案A进行第y次处理时的推荐因子vy(其中,这里提及的推荐因子vy指的是当前处理方案A仅进行第y次这一次处理时的推荐因子,也即指的是当前处理方案A进行各单次处理时的推荐因子)。其中,各历史告警类型的权重arx、各级别对应的权重er、反馈信息对应的权重pry具体可以根据经验或者对服务器的影响进行确定,比如对于CPU故障(ac)、内存故障(am)、PCIE故障(ap)、其他故障(ao),则其相应的权重分别为arc、arm、arp、aro,通知、警告、错误这三大级别的权重分别为e1r、e2r、e3r,反馈信息中的第一等级、第二等级、第三等级这三个等级的权重分别为p1r、p2r、p3r
在计算同一机型的服务器对应的第x个历史告警类型在采用当前理方案A进行第y次处理后的推荐因子vy之后,可以利用
Figure BDA0003328944060000121
计算同一机型的服务器对应的历史告警类别对应的当前处理方案的推荐因子
Figure BDA0003328944060000122
其中,也即推荐因子
Figure BDA0003328944060000123
指的是第x个历史告警类型在采用当前理方案A进行y次处理后的推荐因子,其中,
Figure BDA0003328944060000124
指的是第x个历史告警类型在采用当前理方案A进行y-1次处理后的推荐因子,且
Figure BDA0003328944060000125
为0。
通过上述过程可以实现利用强化学习算法、多次迭代的方式而计算当前处理方案的推荐因子,以提高推荐因子计算的准确性,从而便于准确地为客户推荐合适的告警处理方案。
本申请实施例提供的一种告警处理推荐方法,在根据告警信息确定当前告警类型之后,还可以包括:
接收当前告警类型选择命令,根据当前告警类型选择命令从当前告警类型中选取目标告警类型;
相应地,从预先确定的告警处理库中获取与当前告警类型对应且推荐因子最高的处理方案,可以包括:
从告警处理库中获取与目标告警类型对应且推荐因子最高的处理方案。
在本申请中,在根据告警信息确定当前告警类型之后,客户可以根据需要而从中选择要进行处理的告警类型,此时,客户则可以向中央处理装置发送当前告警类型选择命令。中央处理装置在接收到当前告警类型选择命令之后,可以根据当前告警类型选择命令从当前告警类型中选取目标告警类型(即客户从中选择出的要进行处理的告警类型),然后,中央处理装置可以从告警处理库中获取与目标告警类型对应且推荐因子最高的处理方案,以便于客户根据处理方案对目标告警类型进行处理,从而降低目标告警类型对服务器正常运行的影响,并提高客户体验度。
本申请实施例提供的一种告警处理推荐方法,接收服务器的告警信息,可以包括:
通过SSH链接、RESTFULL接口、RedFish接口中的至少一种方式接收服务器的告警信息。
在本申请中,中央处理装置具体可以通过SSH(Secure Shell,安全外壳协议)链接、RESTFULL(REST为Representational State Transfer,表现层状态转移,加full(为形容词后缀))接口、RedFish(由分布式管理任务组(DMTF)发布的开放式行业标准规范,旨在对平台硬件进行现代化和安全的管理,是一种管理标准,在超媒体RESTful接口中使用数据模型表示)接口中的至少一种方式接收服务器的告警信息,以提高服务器的告警信息接收的便利性。当然,也可以采用其他方式进行服务器告警信息的接收,本申请对此不做任何限定。
本申请实施例还提供了一种告警处理推荐装置,参见图2,其示出了本申请实施例提供的一种告警处理推荐装置的结构示意图,可以包括:
接收模块21,用于接收服务器的告警信息,根据告警信息确定当前告警类型;
第一获取模块22,用于从预先确定的告警处理库中获取与当前告警类型对应且推荐因子最高的处理方案,并输出处理方案;
告警处理推荐装置还可以包括用于预先确定告警处理库的确定模块23,确定模块23可以包括:
第一获取单元,用于获取服务器历史告警信息,根据服务器历史告警信息确定历史告警类型及处理前的级别;
第二获取单元,用于获取各历史告警类型的各处理方案,并获取各历史告警类型在分别采用对应的各处理方案进行处理后的级别;
确定单元,用于根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子,以得到告警处理库。
本申请实施例提供的一种告警处理推荐装置,还可以包括:
第二获取模块,用于获取外界对各历史告警类型的各处理方案的反馈信息;
相应地,确定单元可以包括:
第一确定子单元,用于根据各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定各历史告警类型的各处理方案的推荐因子。
本申请实施例提供的一种告警处理推荐装置,第一确定子单元可以包括:
第二确定子单元,用于根据同一机型的服务器对应的各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定同一机型的服务器对应的各历史告警类型的各处理方案的推荐因子;
第一计算子单元,用于根据多个机型的服务器对应的同一历史告警类型的同一处理方案的推荐因子,计算各历史告警类型的各处理方案的推荐因子。
本申请实施例提供的一种告警处理推荐装置,第二确定子单元可以包括:
第三确定子单元,用于根据同一机型的服务器对应的历史告警类型处理前的级别、在采用对应的当前处理方案进行每次处理后的级别及预先设置的处理奖赏规则,确定同一机型的服务器对应的历史告警类型在采用当前处理方案进行每次处理时的奖赏值;
第二计算子单元,用于根据同一机型的服务器对应的历史告警类型对应的权重、在采用当前处理方案进行每次处理后的级别对应的权重、在采用当前处理方案进行每次处理时的奖赏值及每次处理时的反馈信息对应的权重,对应计算同一机型的服务器对应的历史告警类型在采用当前处理方案进行各次处理时对应的推荐因子;
第三计算子单元,用于根据同一机型的服务器对应的历史告警类型在采用当前处理方案进行各次处理时对应的推荐因子,计算同一机型的服务器对应的历史告警类别对应的当前处理方案的推荐因子。
本申请实施例提供的一种告警处理推荐装置,还可以包括:
选取模块,用于在根据告警信息确定当前告警类型之后,接收当前告警类型选择命令,根据当前告警类型选择命令从当前告警类型中选取目标告警类型;
相应地,第一获取模块22可以包括:
第三获取单元,用于从告警处理库中获取与目标告警类型对应且推荐因子最高的处理方案。
本申请实施例提供的一种告警处理推荐装置,接收模块21可以包括:
接收单元,用于通过SSH链接、RESTFULL接口、RedFish接口中的至少一种方式接收服务器的告警信息。
本申请实施例还提供了一种告警处理推荐设备,参见图3,其示出了本申请实施例提供的一种告警处理推荐设备的结构示意图,可以包括:
存储器31,用于存储计算机程序;
处理器32,用于执行存储器31存储的计算机程序时可实现如下步骤:
接收服务器的告警信息,根据告警信息确定当前告警类型;从预先确定的告警处理库中获取与当前告警类型对应且推荐因子最高的处理方案,并输出处理方案;预先确定告警处理库的过程可以包括:获取服务器历史告警信息,根据服务器历史告警信息确定历史告警类型及处理前的级别;获取各历史告警类型的各处理方案,并获取各历史告警类型在分别采用对应的各处理方案进行处理后的级别;根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子,以得到告警处理库。
本申请实施例还提供了一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序被处理器执行时可实现如下步骤:
接收服务器的告警信息,根据告警信息确定当前告警类型;从预先确定的告警处理库中获取与当前告警类型对应且推荐因子最高的处理方案,并输出处理方案;预先确定告警处理库的过程可以包括:获取服务器历史告警信息,根据服务器历史告警信息确定历史告警类型及处理前的级别;获取各历史告警类型的各处理方案,并获取各历史告警类型在分别采用对应的各处理方案进行处理后的级别;根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子,以得到告警处理库。
该可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请提供的一种告警处理推荐装置、设备及可读存储介质中相关部分的说明可以参见本申请实施例提供的一种告警处理推荐方法中对应部分的详细说明,在此不再赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明,以免过多赘述。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种告警处理推荐方法,其特征在于,包括:
接收服务器的告警信息,根据所述告警信息确定当前告警类型;
从预先确定的告警处理库中获取与所述当前告警类型对应且推荐因子最高的处理方案,并输出所述处理方案;
预先确定所述告警处理库的过程包括:
获取服务器历史告警信息,根据所述服务器历史告警信息确定历史告警类型及处理前的级别;
获取各历史告警类型的各处理方案,并获取各历史告警类型在分别采用对应的各处理方案进行处理后的级别;
根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子,以得到所述告警处理库。
2.根据权利要求1所述的告警处理推荐方法,其特征在于,还包括:
获取外界对各历史告警类型的各处理方案的反馈信息;
相应地,根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子,包括:
根据各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定各历史告警类型的各处理方案的推荐因子。
3.根据权利要求2所述的告警处理推荐方法,其特征在于,根据各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定各历史告警类型的各处理方案的推荐因子,包括:
根据同一机型的服务器对应的各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定同一机型的服务器对应的各历史告警类型的各处理方案的推荐因子;
根据多个机型的服务器对应的同一历史告警类型的同一处理方案的推荐因子,计算各历史告警类型的各处理方案的推荐因子。
4.根据权利要求3所述的告警处理推荐方法,其特征在于,根据同一机型的服务器对应的各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定同一机型的服务器对应的各历史告警类型的各处理方案的推荐因子,包括:
根据同一机型的服务器对应的历史告警类型处理前的级别、在采用对应的当前处理方案进行每次处理后的级别及预先设置的处理奖赏规则,确定同一机型的服务器对应的历史告警类型在采用所述当前处理方案进行每次处理时的奖赏值;
根据同一机型的服务器对应的历史告警类型对应的权重、在采用所述当前处理方案进行每次处理后的级别对应的权重、在采用所述当前处理方案进行每次处理时的奖赏值及每次处理时的反馈信息对应的权重,对应计算同一机型的服务器对应的历史告警类型在采用所述当前处理方案进行各次处理时对应的推荐因子;
根据同一机型的服务器对应的历史告警类型在采用所述当前处理方案进行各次处理时对应的推荐因子,计算同一机型的服务器对应的历史告警类别对应的所述当前处理方案的推荐因子。
5.根据权利要求1所述的告警处理推荐方法,其特征在于,在根据所述告警信息确定当前告警类型之后,还包括:
接收当前告警类型选择命令,根据所述当前告警类型选择命令从当前告警类型中选取目标告警类型;
相应地,从预先确定的告警处理库中获取与所述当前告警类型对应且推荐因子最高的处理方案,包括:
从所述告警处理库中获取与所述目标告警类型对应且推荐因子最高的处理方案。
6.根据权利要求1所述的告警处理推荐方法,其特征在于,接收服务器的告警信息,包括:
通过SSH链接、RESTFULL接口、RedFish接口中的至少一种方式接收服务器的告警信息。
7.一种告警处理推荐装置,其特征在于,包括:
接收模块,用于接收服务器的告警信息,根据所述告警信息确定当前告警类型;
第一获取模块,用于从预先确定的告警处理库中获取与所述当前告警类型对应且推荐因子最高的处理方案,并输出所述处理方案;
所述告警处理推荐装置还包括用于预先确定所述告警处理库的确定模块,所述确定模块包括:
第一获取单元,用于获取服务器历史告警信息,根据所述服务器历史告警信息确定历史告警类型及处理前的级别;
第二获取单元,用于获取各历史告警类型的各处理方案,并获取各历史告警类型在分别采用对应的各处理方案进行处理后的级别;
确定单元,用于根据各历史告警类型及其处理前、后的级别,对应确定各历史告警类型的各处理方案的推荐因子,以得到所述告警处理库。
8.根据权利要求7所述的告警处理推荐装置,其特征在于,还包括:
第二获取模块,用于获取外界对各历史告警类型的各处理方案的反馈信息;
相应地,所述确定单元包括:
第一确定子单元,用于根据各历史告警类型及其处理前、后的级别、对应的各处理方案的反馈信息,对应确定各历史告警类型的各处理方案的推荐因子。
9.一种告警处理推荐设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述的告警处理推荐方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的告警处理推荐方法的步骤。
CN202111280065.2A 2021-10-29 2021-10-29 一种告警处理推荐方法、装置、设备及可读存储介质 Pending CN114168435A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111280065.2A CN114168435A (zh) 2021-10-29 2021-10-29 一种告警处理推荐方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111280065.2A CN114168435A (zh) 2021-10-29 2021-10-29 一种告警处理推荐方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN114168435A true CN114168435A (zh) 2022-03-11

Family

ID=80477626

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111280065.2A Pending CN114168435A (zh) 2021-10-29 2021-10-29 一种告警处理推荐方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN114168435A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116132263A (zh) * 2023-02-24 2023-05-16 北京优特捷信息技术有限公司 告警解决方案推荐方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116132263A (zh) * 2023-02-24 2023-05-16 北京优特捷信息技术有限公司 告警解决方案推荐方法、装置、电子设备及存储介质
CN116132263B (zh) * 2023-02-24 2023-09-19 北京优特捷信息技术有限公司 告警解决方案推荐方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US8010840B2 (en) Generation of problem tickets for a computer system
US7409316B1 (en) Method for performance monitoring and modeling
US7953691B2 (en) Performance evaluating apparatus, performance evaluating method, and program
US9384114B2 (en) Group server performance correction via actions to server subset
CN109189640A (zh) 服务器的监控方法、装置、计算机设备及存储介质
JP5704234B2 (ja) メッセージ判定装置およびメッセージ判定プログラム
EP0402403A1 (en) METHODS AND APPARATUS FOR CORRECTING ERRORS.
US10437695B2 (en) Fault information providing server and fault information providing method for users of in-vehicle terminals
US9639885B2 (en) Recovery of e-commerce orders
US10275330B2 (en) Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus
CN111897697A (zh) 服务器硬件故障修复方法和装置
CN114168435A (zh) 一种告警处理推荐方法、装置、设备及可读存储介质
US10176033B1 (en) Large-scale event detector
US8275865B2 (en) Methods, systems and computer program products for selecting among alert conditions for resource management systems
JP2009151456A (ja) 監視システム、ネットワーク監視装置及びサービス実行環境監視方法
CN113612624B (zh) 一种节点之间心跳处理方法及装置
JP2020021432A (ja) 制御方法、制御装置および制御プログラム
CN114285844A (zh) 服务器接口智能熔断的方法、装置、电子设备及存储介质
CN113110970A (zh) 服务器工作模式下各部件的监测方法、装置、设备及介质
JP2007068090A (ja) ネットワーク装置監視システムおよび監視方法、ならびにそのプログラム
CN113051135A (zh) 一种应用线程池的监控方法及线程池监控装置
JP4437416B2 (ja) ネットワーク保守システム
CN109756392B (zh) 任务处理方法、装置、设备及计算机可读存储介质
TWI738277B (zh) 監控告警方法及其伺服端
EP4250667A1 (en) Consensus-based node retirement process in a mesh

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination