WO2020124721A1

WO2020124721A1 - 一种宕机通知方法及装置

Info

Publication number: WO2020124721A1
Application number: PCT/CN2019/071879
Authority: WO
Inventors: 孙云云
Original assignee: 网宿科技股份有限公司
Priority date: 2018-12-18
Filing date: 2019-01-16
Publication date: 2020-06-25
Also published as: CN109639490B; US20210021460A1; EP3896904A4; CN109639490A; EP3896904A1

Abstract

本发明公开了一种宕机通知方法，属于计算机技术领域，所述方法包括：当监控到目标服务器宕机时，确定所述目标服务器所在的目标机房；基于所述目标机房历次通知的统计参数，调整所述目标机房对应的所有通知方式的优先级，其中，所述统计参数至少包括通知时间和重启成功率；按照所述优先级最高的通知方式，向所述目标机房发送对所述目标服务器的重启消息。采用本发明可以节约系统资源，有效提高自动通知系统的服务质量。

Description

一种宕机通知方法及装置

技术领域

本发明涉及计算机技术领域，特别涉及一种宕机通知方法及装置。

背景技术

随着互联网业务的迅猛发展，越来越多的厂商选择在全国各地部署机房，如CDN(Content Delivery Network，内容分发网络)服务商、云计算厂商等。这些厂商通常采用自动通知系统，在各机房的服务器宕机后，通知机房的技术人员对宕机服务器进行重启。

上述自动通知系统的管理服务器，可以监控各机房的服务器的运行状态。当监控到某机房的某服务器宕机时，上述管理服务器可以基于宕机服务器的定位信息，如宕机服务器的IP地址、宕机服务器所在机房的机房编号等信息，获取预先记录的该宕机服务器所在机房的所有通知方式，如邮件方式、电话方式、即时通讯软件方式等。然后，上述管理服务器可以在上述所有通知方式中，确定出预先设定的优先级最高的通知方式。之后，管理服务器可以按照该优先级最高的通知方式，将记录有宕机服务器定位信息的重启消息传递给宕机服务器所在机房的技术人员，以使机房的技术人员可以基于宕机服务器的定位信息，找到宕机服务器，并对宕机服务器进行重启。另外，在按照优先级最高的通知方式发出重启消息后，如果监控到在预设时长内宕机服务器仍未重启成功，则管理服务器将会按照优先级较低的通知方式再次发出重启消息，直至监控到宕机服务器重启成功。

在实现本发明的过程中，发明人发现现有技术至少存在以下问题：

上述预先设定的优先级最高的通知方式可能通知效果较差，导致机房的技术人员不能及时发现到重启消息，需要通过其它通知方式重复发送重启消息，不仅占用了较多的系统资源，还导致宕机服务器不能及时重启，故而上述自动通知系统的服务质量较差。

发明内容

为了解决现有技术的问题，本发明实施例提供了一种宕机通知方法及装置，所述技术方案如下：

第一方面，提供了一种宕机通知方法，所述方法包括：

当监控到目标服务器宕机时，确定所述目标服务器所在的目标机房；

基于所述目标机房历次通知的统计参数，调整所述目标机房对应的所有通知方式的优先级，其中，所述统计参数至少包括通知时间和重启成功率；

按照所述优先级最高的通知方式，向所述目标机房发送对所述目标服务器的重启消息。

进一步的，所述基于所述目标机房历次通知的统计参数，调整所述目标机房对应的所有通知方式的优先级，包括：

基于所述通知时间和所述重启成功率各自的预设权重比值，计算所述目标机房对应的所有所述通知方式的权重值；

根据所有所述通知方式的所述权重值，调整所有所述通知方式的优先级。

进一步的，所述根据所有所述通知方式的所述权重值，调整所有所述通知方式的优先级，包括：

当所有所述通知方式的所述权重值均不相同时，将最小的所述权重值对应的所述通知方式调整为所述优先级最高的所述通知方式；

或者，当至少两个所述通知方式的所述权重值相同且最小时，在至少两个所述通知方式中将最高的所述重启成功率对应的所述通知方式，调整为所述优先级最高的所述通知方式；

或者，当至少两个所述通知方式的所述权重值相同且最小，且所述重启成功率均相同时，在至少两个所述通知方式中将最短的所述通知时间对应的所述通知方式，调整为所述优先级最高的所述通知方式。

进一步的，所述当监控到目标服务器宕机时，确定所述目标服务器所在的目标机房之后，还包括：

判断所述目标服务器是否为所述目标机房中第一个发生宕机的服务器；

如果是，则获取所述目标机房的默认通知方式，按照所述默认通知方式向所述目标机房发送对所述目标服务器的重启消息；

如果否，则基于所述目标机房历次通知的统计参数，调整所述目标机房对应的所有所述通知方式的优先级。

如果所述目标服务器在预设时长内的宕机次数超过预设次数，则将所述目标服务器标记为故障服务器，生成记录有所述故障服务器定位信息的反馈消息，并将所述反馈消息发送至所述目标机房。

进一步的，所述当监控到目标服务器宕机时之后，还包括：

如果宕机的服务器数量超过预设数值，则在所有宕机的服务器中计算各个预设设备属性的占比，并判断是否存在所述占比大于额定占比的目标设备属性；

如果是，则生成记录有所述目标设备属性及其所述占比的反馈消息，并将所述反馈消息发送至管理人员。

进一步的，所述方法还包括：

每隔预设周期，获取当前预设周期内宕机的服务器的宕机变化值，并判断所述宕机变化值是否大于预设变化值，其中，所述宕机变化值包括在所述当前预设周期内宕机的服务器的数值和重启成功的服务器的数值；

如果是，则计算在所述当前预设周期内所有宕机的服务器的各个预设设备属性的占比，并生成记录有所述当前预设周期、各个所述预设设备属性及各个所述预设设备属性的占比的反馈消息，并将所述反馈消息发送至管理人员；

如果否，则获取上一预设周期内所有宕机的服务器的各个预设设备属性的占比，并生成记录有所述当前预设周期、各个所述预设设备属性及各个所述预设设备属性的占比的反馈消息，并将所述反馈消息发送至管理人员。

第二方面，提供了一种宕机通知装置，所述装置包括：

数据记录模块，用于当监控到目标服务器宕机时，确定所述目标服务器所在的目标机房；

数据处理模块，用于基于所述目标机房历次通知的统计参数，调整所述目标机房对应的所有通知方式的优先级；

自动通知模块，用于按照所述优先级最高的通知方式，向所述目标机房发送对所述目标服务器的重启消息。

进一步的，所述数据处理模块，具体用于：

进一步的，所述数据处理模块，具体还用于：

进一步的，所述数据处理模块，还用于：

如果是，则获取所述目标机房的默认通知方式；

所述自动通知模块，还用于：

按照所述默认通知方式向所述目标机房发送对所述目标服务器的重启消息。

进一步的，所述数据处理模块，还用于：

如果所述目标服务器在预设时长内的宕机次数超过预设次数，则将所述目标服务器标记为故障服务器，生成记录有所述故障服务器定位信息的反馈消息；

所述自动通知模块，还用于：

将所述反馈消息发送至所述目标机房。

进一步的，所述数据处理模块，还用于：

进一步的，所述数据记录模块，还用于：

每隔预设周期，获取当前预设周期内宕机的服务器的宕机变化值；

所述数据处理模块，还用于：

判断所述宕机变化值是否大于预设变化值，其中，所述宕机变化值包括在所述当前预设周期内宕机的服务器的数值和重启成功的服务器的数值；

第三方面，提供了一种管理服务器，所述管理服务器包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的宕机通知方法。

第四方面，提供了一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如第一方面所述的宕机通知方法。

在本实施例中，当监控到目标服务器宕机时，确定目标服务器所在的目标机房；基于目标机房历次通知的统计参数，调整目标机房对应的所有通知方式的优先级，其中，统计参数至少包括通知时间和重启成功率；按照优先级最高的通知方式，向目标机房发送对目标服务器的重启消息。这样，可以根据服务器所在机房的历次通知的统计参数，灵活的调整机房对应的所有通知方式的优先级，然后可以按照调整后的优先级最高的通知方式向机房发送对服务器的重启消息，进而可以每次都通过最适合当前情况的通知方式，即对应的通知时间较短且重启成功率较高的通知方式，向机房发送对宕机服务器的重启消息，从而可以很大程度上一次通知成功，而无需通过其它通知方式重复发送重启消息，不仅可以节约系统资源，还可以使得宕机服务器及时重启，有效提高自动通知系统的服务质量。另外，通过将所有机房中宕机的服务器的设备属性、宕机时间及频次通知给管理人员，可以便于管理人员对服务器的宕机原因及宕机趋势进行分析，使得管理人员可以针对性地对服务器进行维护及相应的上架约束，从而可以从根本上降低服务器的宕机频次，提高各服务器的服务质量。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例提供的一种宕机通知方法的流程图；

图2是本发明实施例提供的一种宕机通知装置的结构示意图；

图3是本发明实施例提供的一种宕机通知装置的结构示意图；

图4是本发明实施例提供的一种管理服务器的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

本发明实施例提供了一种宕机通知方法，该方法的执行主体可以是任意厂商的管理服务器，管理服务器可以是任意一台服务器，也可以是由多台服务器组成的服务器集群。该管理服务器可以对机房的服务器的运行状态进行监控，并可以在监控到某机房的某服务器宕机后，通过该机房优先级最高的通知方式，向该机房发送对宕机服务器进行重启的重启消息。上述管理服务器可以包括处理器、存储器、收发器，处理器可以用于进行下述流程中对于宕机通知方法的处理，存储器可以用于存储下述处理过程中需要的数据以及产生的数据，收发器可以用于接收和发送下述处理过程中的相关数据。可以理解，上述管理服务器的监控功能也可以由其他服务器来实现。本实施例以具备监控功能的管理服务器进行说明，其他情况与之类似，不再一一赘述。

下面将结合具体实施方式，对图1所示的一种宕机通知方法的处理流程进行详细的说明，内容可以如下：

步骤101：当监控到目标服务器宕机时，确定目标服务器所在的目标机房。

在实施中，厂商的管理人员可以预先统计各机房服务器的定位信息以及各机房的通知方式，定位信息可以是机房编号、机柜号、IP地址等，通知方式可以是邮件方式、电话方式、即时通讯软件方式等。之后，厂商的管理人员可以将统计的上述信息存储在专门的存储设备或上述管理服务器中，并可以对上述信息进行更新或修改。这样，当管理服务器监控到有服务器(可称为目标服务器)发生宕机时，可以基于上述存储设备或者本地获取的各机房服务器的定位信息，确定出目标服务器所在的机房(可称为目标机房)。

步骤102：基于目标机房历次通知的统计参数，调整目标机房对应的所有通知方式的优先级。

在实施中，管理服务器可以预先对目标机房的历次通知的统计参数进行统计，其中，统计参数至少可以包括通知时间和重启成功率，通知时间可以是历次按照某通知方式发送重启消息到目标服务器重启成功的时间的平均时间。重启成功率可以是通过某通知方式发送重启消息而使得对应的宕机服务器重启成功的通知次数，占该通知方式通知总次数的比例。这样，管理服务器在确定目标服务器所在的目标机房后，可以基于目标机房的历次通知的统计参数，对目标机房对应的所有通知方式的优先级进行实时调整，得到各个通知方式当前的优先级。

可选的，上述步骤102的处理可以如下：基于通知时间和重启成功率各自的预设权重比值，计算目标机房对应的所有通知方式的权重值；根据所有通知方式的权重值，调整所有通知方式的优先级。

在实施中，可以对通知时间和重启成功率的预设权重比值进行设置，如设置通知时间的预设权重比值为40％，重启成功率的预设权重比值为60％。这样，管理服务器可以基于通知时间和重启成功率各自的预设权重比值，计算目标机房对应的各通知方式的权重值，进而可以根据各通知方式的权重值，调整各通知方式的优先级。具体的，上述目标机房对应的各通知方式的通知时间的计算公式可以为：

其中，T ₁表示通知方式1的通知时间；a表示按照通知方式1发送重启消息后目标服务器成功重启的次数；t _a表示第a次按照通知方式1发送重启消息到目标服务器重启成功的时间。

上述目标机房对应的各通知方式的重启成功率的计算公式可以为：

其中，X ₁表示表示通知方式1的重启成功率；n ₁表示按照通知方式1发送重启消息的次数。

基于上述目标机房对应的各通知方式的通知时间及重启成功率，可以计算出各通知方式的权重值，权重值的计算公式可以为：

Y ₁＝T ₁×40％+(1-X ₁)×60％

其中，Y ₁表示通知方式1的权重值。

这样，管理服务器在计算出目标机房对应的各通知方式的权重值之后，可以根据各权重值的大小，调整各通知方式的优先级。

可选的，上述根据所有通知方式的权重值，调整所有通知方式的优先级的处理可以如下：当所有通知方式的权重值均不相同时，将最小的权重值对应的通知方式调整为优先级最高的通知方式；或者，当至少两个通知方式的权重值相同且最小时，在至少两个通知方式中将最高的重启成功率对应的通知方式，调整为优先级最高的通知方式；或者，当至少两个通知方式的权重值相同且最小，且重启成功率均相同时，在至少两个通知方式中将最短的通知时间对应的通知方式，调整为优先级最高的通知方式。

在实施中，管理服务器在得到目标机房对应的所有通知方式的权重值后，可以根据各个通知方式的权重值及不同统计参数的数值，调整目标机房对应的所有通知方式的优先级。以目标机房对应有三种通知方式为例，三种通知方式对应的通知时间、重启成功率、权重值可以分别为T ₁、X ₁、Y ₁，T ₂、X ₂、Y ₂、T ₃、X ₃、Y ₃。假设Y ₁<Y ₂<Y ₃，管理服务器可以将Y ₁对应的通知方式调整为优先级最高的通知方式。假设Y ₁＝Y ₂<Y ₃，管理服务器可以比较X ₁与X ₂的大小，假设X ₁>X ₂，管理服务器可以将X ₁对应的通知方式调整为优先级最高的通知方式。假设Y ₁＝Y ₂<Y ₃，且X ₁＝X ₂，管理服务器可以比较T ₁、T ₂的大小，假设T ₁<T ₂，管理服务器可以将T ₁对应的通知方式调整为优先级最高的通知方式。

步骤103，按照优先级最高的通知方式，向目标机房发送对目标服务器的重启消息。

在实施中，管理服务器在调整完目标机房对应的通知方式的优先级之后，可以按照实时调整的优先级最高的通知方式向目标机房的对外通讯设备，如机房的技术人员所使用的电话、计算机、智能手机等，将携带有目标服务器定位信息的重启消息通知到目标机房。之后，机房的技术人员可以基于目标服务器的定位信息找到该目标服务器，对目标服务器进行重启。这样，管理服务器可以每次都通过最适合当前情况的通知方式，即基于目标机房历次通知的统计参数而调整的优先级最高的通知方式，发送对目标服务器的重启消息，从而可以很大程度上一次通知成功，而无需通过其它通知方式重复发送重启消息，不仅可以节约系统资源，还可以使得宕机服务器及时重启，有效提高自动通知系统的服务质量。

可选的，在上述步骤103之后，还可以进行如下处理：获取并显示目标服务器的定位信息及目标服务器的重启进度。

在实施中，管理服务器在向机房发送重启消息后，可以显示目标服务器的重启进度。以目标服务器的IP地址为1.1.1.1为例，假设管理服务器已向目标服务器所在的目标机房发送重启消息，但目前未收到回执消息，则管理服务器显示的重启进度可以是“宕机服务器IP：1.1.1.1，当前进度：重启消息已发送，待返回回执消息”。

可选的，在当监控到目标服务器宕机时，确定目标服务器所在的目标机房后，还可以进行如下处理：判断目标服务器是否为目标机房中第一个发生宕机的服务器；如果是，则获取目标机房的默认通知方式，按照默认通知方式向目标机房发送对目标服务器的重启消息；如果否，则基于目标机房历次通知的统计参数，调整目标机房对应的所有通知方式的优先级。

在实施中，管理服务器可以基于管理人员的设置要求，预先将多个通知方式中的某个通知方式标记为默认通知方式，将多个通知方式中其余的通知方式标记为候选通知方式。这样，管理服务器在监控到目标服务器宕机时，可以对目标服务器是否为目标机房中第一个发生宕机的服务器进行判断。如果目标服务器为目标机房中第一个发生宕机的服务器，则管理服务器可以按照目标机房的默认通知方式，向目标机房发送对目标服务器的重启消息。如果目标服务器不是目标机房中第一个发生宕机的服务器，则管理服务器可以根据目标机房历次通知的统计参数，调整目标机房对应的所有通知方式的优先级。

可选的，在监控到目标服务器宕机时，确定目标服务器所在的目标机房后，还可以进行如下处理：如果目标服务器在预设时长内的宕机次数超过预设次数，则将目标服务器标记为故障服务器，生成记录有故障服务器定位信息的反馈消息，并将反馈消息发送至目标机房。

在实施中，可以对频繁宕机的服务器进行故障标记，以提醒该服务器所在机房的技术人员，对标记的服务器进行重点排查，分析宕机原因。具体的，管理服务器可以对服务器在预设时长内允许发生宕机的最高频次(可称为预设次数)进行设置，如设置为15天内最多宕机3次或5次。这样，当监控到目标服务器宕机时，管理服务器可以对目标服务器的历次宕机信息进行获取，并判断目标服务器在预设时长内的宕机次数是否超过预设次数。如果目标服务器在预设时长内的宕机次数超过预设次数，则管理服务器可以将目标服务器标记为故障服务器，并生成记录有故障服务器定位信息的反馈消息，然后可以将该反馈消息发送至目标机房，如可以通过邮件方式、即时通讯软件方式等，通知相应的技术人员对目标服务器进行重点排查。

可选的，当监控到目标服务器宕机后，还可以进行如下处理：如果宕机的服务器数量超过预设数值，则在所有宕机的服务器中计算各个预设设备属性的占比，并判断是否存在占比大于额定占比的目标设备属性；如果是，则生成记录有目标设备属性及其占比的反馈消息，并将反馈消息发送至管理人员。

在实施中，考虑到服务器的大面积宕机可能会影响到厂商提供的网络服务质量，管理服务器可以对同一时刻允许发生宕机的服务器的总数量(可称为预设数值)，及宕机的服务器的各设备属性的最高占比(可称为额定占比)进行设置。当管理服务器监控到某时刻宕机的服务器的数量超过预设值时，管理服务器可以获取所有宕机服务器的设备属性(可称为预设设备属性)，其中预设设备属性可以包括所有服务器的硬件属性及软件属性等。以预设数值为90台，当前时刻宕机的服务器数量为100台为例，假设各预设设备属性对应的服务器数量分别为CPU型号1为15台、CPU型号2为20台、软件1为50台、软件2为15台，此时管理服务器依次可以计算出上述各预设设备属性的占比分别为15％、20％、50％、15％。假设上述各预设设备属性的额定占比分别为30％、25％、40％、20％，管理服务器可以判断出大于额定占比的占比对应的预设设备属性(可称为目标设备属性)为软件1。之后，管理服务器可以生成包括上述目标设备属性及其对应的占比的通知消息，如“您好，XX年XX月XX时XX分，宕机服务器数量为100台，其中软件1占比50％已超过额定占比，请及时处理，谢谢！”，并将上述通知消息发送至厂商的管理人员，如可以通过邮件方式、即时通讯软件方式等。这样，厂商的管理人员可以基于反馈消息内容找到对应的软件1并进行相应的处理。需要说明的是，上述各个预设设备属性的额定占比可以根据具体的宕机情况进行设定和调整，本实施例对此不做限定。

可选的，上述在所有宕机的服务器中计算各个预设设备属性的占比，并判断是否存在占比大于额定占比的目标设备属性的具体处理可以如下：依次计算预设设备属性的占比，判断是否存在占比大于对应的预设设备属性的额定占比；如果是，则确定预设设备属性为目标设备属性；否则，计算下一预设设备属性的占比。

在实施中，管理服务器可以依次计算每个预设设备属性的占比，并判断该预设设备属性是否是目标设备属性。具体的，仍以上述设备属性为CPU型号1、CPU型号2、软件1、软件2为例，管理服务器可以先计算CPU型号1的占比，并判断该占比是否大于额定占比，如果该占比大于该预设设备属性对应的额定占比，管理服务器可以将该占比对应的预设设备属性确定为目标设备属性，并存储该目标设备属性及其占比。如果该占比小于该预设设备属性对应的额定占比，管理服务器可以确定该预设设备属性不是目标设备属性，跳过当前预设设备属性计算下一个预设设备属性CPU型号2的占比，并重复上述过程，直至判断完所有上述所有预设设备属性是否是目标设备属性。

可选的，本实施例还提供了一种通知方法，具体处理可以如下：每隔预设周期，获取当前预设周期内宕机的服务器的宕机变化值，并判断宕机变化值是否大于预设变化值，其中，宕机变化值包括在当前预设周期内宕机的服务器的数值和重启成功的服务器的数值；如果是，则计算在当前预设周期内所有宕机的服务器的各个预设设备属性的占比，并生成记录有当前预设周期、各个预设设备属性及各个预设设备属性的占比的反馈消息，并将反馈消息发送至管理人员；如果否，则获取上一预设周期内所有宕机的服务器的各个预设设备属性的占比，并生成记录有当前预设周期、各个预设设备属性及各个预设设备属性的占比的反馈消息，并将反馈消息发送至管理人员。

在实施中，为避免服务器发生大面积宕机，管理服务器可以每隔预设周期，获取当前预设周期内新增的发生宕机的服务器的数量，及重启成功的服务器的数量之和(可称为宕机变化值)，并对该宕机变化值设置上限(可称为预设变化值)。具体的，以预设周期为24小时，预设变化值为50台为例，考虑到每天凌晨使用网络服务的用户较少，管理服务器可以设置在每天凌晨24:00获取过去24小时内的宕机变化值。假设宕机的服务器的新增数量为30台，重启成功的服务器的数量为40台，管理服务器可以计算出在过去24小时内宕机变化值为70台，大于预设变化值50台。然后，管理服务器可以计算在过去24小时内宕机的服务器的设备属性的占比，确定出目标设备属性，并生成包括上述预设周期、各个预设设备属性及各个预设设备属性对应的占比的反馈消息，发送至厂商的管理人员。

值得一提的是，管理服务器可以每隔固定的时间段，如可以每隔3小时或者4小时，获取过去24小时内的宕机变化值。具体的，管理服务器可以计算在各时间段内宕机的服务器的预设设备属性的占比，确定出目标设备属性，并生成包括上述预设周期、各个预设设备属性、各个预设设备属性对应的占比的反馈消息，发送至厂商的管理人员，如可以通过邮件方式、即时通讯软件方式等发送反馈消息，反馈消息的内容可以是文字或者图表形式。之后，管理人员可以根据反馈消息的内容找到对应的服务器，并进行检修及上架约束，以保证厂商的提供的网络服务质量。这样，可以从根本上降低服务器的宕机频次，提高各服务器的服务质量。

本发明实施例提供的技术方案带来的有益效果是：

基于相同的技术构思，本发明实施例还提供了一种宕机通知装置，如图2所示，所述装置包括：

数据记录模块201，用于当监控到目标服务器宕机时，确定所述目标服务器所在的目标机房；

数据处理模块202，用于基于所述目标机房历次通知的统计参数，调整所述目标机房对应的所有通知方式的优先级；

自动通知模块203，用于按照所述优先级最高的通知方式，向所述目标机房发送对所述目标服务器的重启消息。

进一步的，所述数据处理模块202，具体用于：

进一步的，所述数据处理模块202，具体还用于：

进一步的，所述数据处理模块202，还用于：

如果是，则获取所述目标机房的默认通知方式；

所述自动通知模块203，还用于：

进一步的，所述数据处理模块202，还用于：

所述自动通知模块203，还用于：

将所述反馈消息发送至所述目标机房。

进一步的，所述数据处理模块202，还用于：

进一步的，所述数据记录模块201，还用于：

所述数据处理模块202，还用于：

进一步的，如图3所示，所述装置还包括数据显示模块204，用于：

获取并显示目标服务器的定位信息及目标服务器的重启进度。

图4是本发明实施例提供的管理服务器的结构示意图。该管理服务器400可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器422(例如，一个或一个以上处理器)和存储器432，一个或一个以上存储应用程序442或数据444的存储介质430(例如一个或一个以上海量存储设备)。其中，存储器432和存储介质430可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对调度设备中的一系列指令操作。更进一步地，中央处理器422可以设置为与存储介质430通信，在管理服务器400上执行存储介质430中的一系列指令操作。

管理服务器400还可以包括一个或一个以上电源426，一个或一个以上有线或无线网络接口450，一个或一个以上输入输出接口458，和/或，一个或一个以上操作系统431，例如Windows Server TM，Mac OS XTM，Unix TM，Linux TM，FreeBSD TM等等。

管理服务器400可以包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行上述宕机通知的指令。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种宕机通知方法，其特征在于，所述方法包括：

当监控到目标服务器宕机时，确定所述目标服务器所在的目标机房；

基于所述目标机房历次通知的统计参数，调整所述目标机房对应的所有通知方式的优先级，其中，所述统计参数至少包括通知时间和重启成功率；

按照所述优先级最高的通知方式，向所述目标机房发送对所述目标服务器的重启消息。
根据权利要求1所述的方法，其特征在于，所述基于所述目标机房历次通知的统计参数，调整所述目标机房对应的所有通知方式的优先级，包括：

基于所述通知时间和所述重启成功率各自的预设权重比值，计算所述目标机房对应的所有所述通知方式的权重值；

根据所有所述通知方式的所述权重值，调整所有所述通知方式的优先级。
根据权利要求2所述的方法，其特征在于，所述根据所有所述通知方式的所述权重值，调整所有所述通知方式的优先级，包括：

当所有所述通知方式的所述权重值均不相同时，将最小的所述权重值对应的所述通知方式调整为所述优先级最高的所述通知方式；

或者，当至少两个所述通知方式的所述权重值相同且最小时，在至少两个所述通知方式中将最高的所述重启成功率对应的所述通知方式，调整为所述优先级最高的所述通知方式；

或者，当至少两个所述通知方式的所述权重值相同且最小，且所述重启成功率均相同时，在至少两个所述通知方式中将最短的所述通知时间对应的所述通知方式，调整为所述优先级最高的所述通知方式。
根据权利要求1所述的方法，其特征在于，所述当监控到目标服务器宕机时，确定所述目标服务器所在的目标机房之后，还包括：

判断所述目标服务器是否为所述目标机房中第一个发生宕机的服务器；

如果是，则获取所述目标机房的默认通知方式，按照所述默认通知方式向所述目标机房发送对所述目标服务器的重启消息；

如果否，则基于所述目标机房历次通知的统计参数，调整所述目标机房对应的所有所述通知方式的优先级。
根据权利要求1所述的方法，其特征在于，所述当监控到目标服务器宕机时，确定所述目标服务器所在的目标机房之后，还包括：

如果所述目标服务器在预设时长内的宕机次数超过预设次数，则将所述目标服务器标记为故障服务器，生成记录有所述故障服务器定位信息的反馈消息，并将所述反馈消息发送至所述目标机房。
根据权利要求1所述的方法，其特征在于，所述当监控到目标服务器宕机时之后，还包括：

如果宕机的服务器数量超过预设数值，则在所有宕机的服务器中计算各个预设设备属性的占比，并判断是否存在所述占比大于额定占比的目标设备属性；

如果是，则生成记录有所述目标设备属性及其所述占比的反馈消息，并将所述反馈消息发送至管理人员。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

每隔预设周期，获取当前预设周期内宕机的服务器的宕机变化值，并判断所述宕机变化值是否大于预设变化值，其中，所述宕机变化值包括在所述当前预设周期内宕机的服务器的数值和重启成功的服务器的数值；

如果是，则计算在所述当前预设周期内所有宕机的服务器的各个预设设备属性的占比，并生成记录有所述当前预设周期、各个所述预设设备属性及各个所述预设设备属性的占比的反馈消息，并将所述反馈消息发送至管理人员；

如果否，则获取上一预设周期内所有宕机的服务器的各个预设设备属性的占比，并生成记录有所述当前预设周期、各个所述预设设备属性及各个所述预设设备属性的占比的反馈消息，并将所述反馈消息发送至管理人员。
一种宕机通知装置，其特征在于，所述装置包括：

数据记录模块，用于当监控到目标服务器宕机时，确定所述目标服务器所在的目标机房；

数据处理模块，用于基于所述目标机房历次通知的统计参数，调整所述目标机房对应的所有通知方式的优先级；

自动通知模块，用于按照所述优先级最高的通知方式，向所述目标机房发送对所述目标服务器的重启消息。
根据权利要求8所述的装置，其特征在于，所述数据处理模块具体用于：

基于所述通知时间和所述重启成功率各自的预设权重比值，计算所述目标机房对应的所有所述通知方式的权重值；

根据所有所述通知方式的所述权重值，调整所有所述通知方式的优先级。
根据权利要求9所述的装置，其特征在于，所述数据处理模块具体还用于：

当所有所述通知方式的所述权重值均不相同时，将最小的所述权重值对应的所述通知方式调整为所述优先级最高的所述通知方式；

或者，当至少两个所述通知方式的所述权重值相同且最小时，在至少两个所述通知方式中将最高的所述重启成功率对应的所述通知方式，调整为所述优先级最高的所述通知方式；

或者，当至少两个所述通知方式的所述权重值相同且最小，且所述重启成功率均相同时，在至少两个所述通知方式中将最短的所述通知时间对应的所述通知方式，调整为所述优先级最高的所述通知方式。
根据权利要求8所述的装置，其特征在于，所述数据处理模块还用于：

判断所述目标服务器是否为所述目标机房中第一个发生宕机的服务器；

如果是，则获取所述目标机房的默认通知方式；

所述自动通知模块，还用于：

按照所述默认通知方式向所述目标机房发送对所述目标服务器的重启消息。
根据权利要求8所述的装置，其特征在于，所述数据处理模块还用于：

如果所述目标服务器在预设时长内的宕机次数超过预设次数，则将所述目标服务器标记为故障服务器，生成记录有所述故障服务器定位信息的反馈消息；

所述自动通知模块，还用于：

将所述反馈消息发送至所述目标机房。
根据权利要求8所述的装置，其特征在于，所述数据处理模块还用于：

如果宕机的服务器数量超过预设数值，则在所有宕机的服务器中计算各个预设设备属性的占比，并判断是否存在所述占比大于额定占比的目标设备属性；

如果是，则生成记录有所述目标设备属性及其所述占比的反馈消息，并将所述反馈消息发送至管理人员。
根据权利要求8所述的装置，其特征在于，所述数据记录模块还用于：

每隔预设周期，获取当前预设周期内宕机的服务器的宕机变化值；

所述数据处理模块还用于：

判断所述宕机变化值是否大于预设变化值，其中，所述宕机变化值包括在所述当前预设周期内宕机的服务器的数值和重启成功的服务器的数值；

如果是，则计算在所述当前预设周期内所有宕机的服务器的各个预设设备属性的占比，并生成记录有所述当前预设周期、各个所述预设设备属性及各个所述预设设备属性的占比的反馈消息，并将所述反馈消息发送至管理人员；

如果否，则获取上一预设周期内所有宕机的服务器的各个预设设备属性的占比，并生成记录有所述当前预设周期、各个所述预设设备属性及各个所述预设设备属性的占比的反馈消息，并将所述反馈消息发送至管理人员。
一种管理服务器，其特征在于，所述管理服务器包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的宕机通知方法。
一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一所述的宕机通知方法。