CN115065715A - 服务监控和自动重启方法、介质、设备及系统 - Google Patents
服务监控和自动重启方法、介质、设备及系统 Download PDFInfo
- Publication number
- CN115065715A CN115065715A CN202210512150.5A CN202210512150A CN115065715A CN 115065715 A CN115065715 A CN 115065715A CN 202210512150 A CN202210512150 A CN 202210512150A CN 115065715 A CN115065715 A CN 115065715A
- Authority
- CN
- China
- Prior art keywords
- monitoring node
- monitored server
- monitoring
- abnormal
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0659—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
- H04L41/0661—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明公开了一种服务监控和自动重启方法、介质、设备及系统,其中方法包括:获取被监控服务器的监控信息,并配置主监控节点和从属监控节点;主监控节点向被监控服务器发起http请求,并根据请求结果判断被监控服务器当前是否主观异常;如果是,则发送主观异常信息;配置服务器根据主观异常信息向从属监控节点发送验证指令;从属监控节点向被监控服务器发起http请求,并根据请求结果判断被监控服务器当前是否客观异常;如果是,则对被监控服务器进行重启;如果否,则消除主观异常信息,并将当前从属监控节点变更为主监控节点;能够对服务的运行状态进行自动监控,并在服务的运行状态异常时,进行相应处理,保证服务的有效运行,防止客户流失。
Description
技术领域
本发明涉及服务器管理技术领域,特别涉及一种服务监控和自动重启方法、一种计算机可读存储介质、一种计算机设备和一种服务监控和自动重启系统。
背景技术
WEB服务在IT公司内往往存在很多,这些WEB服务有些是提供给内部使用的,有些是有公网地址的,即言,其面向的是C端用户。然而,无论是内部使用的WEB服务或是面向C端用户的WEB服务,服务的状态监控都是至关重要的,尤其是面向C端用户的WEB服务。因为,如果WEB服务出现异常了,而企业并不知晓;则必然导致该WEB服务无法正常使用;如此,当WEB服务恢复时长过长时,将严重影响客户的体验,导致客户投诉增多以及客户流失。
相关技术中,大多没有对WEB服务进行自动的实时监控,而只是通过处理客户投诉来获取WEB服务的运行状态信息,并通过人工介入来恢复WEB服务;这种方式对于WEB服务的停用状态的发现不够及时,容易造成客户的流失。
发明内容
本发明旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本发明的一个目的在于提出一种服务监控和自动重启方法,能够对服务的运行状态进行自动监控,并在服务的运行状态异常时,进行相应处理,保证服务的有效运行,防止客户流失。
本发明的第二个目的在于提出一种计算机可读存储介质。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种服务监控和自动重启系统。
为达到上述目的,本发明第一方面实施例提出了一种服务监控和自动重启方法,包括以下步骤:获取被监控服务器的监控信息,并根据所述监控信息为所述被监控服务器配置主监控节点和从属监控节点;所述主监控节点向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否主观异常;如果是,则所述主监控节点向配置服务器发送主观异常信息;所述配置服务器根据所述主观异常信息向所述从属监控节点发送验证指令;所述从属监控节点根据所述验证指令向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否客观异常;如果是,则对所述被监控服务器进行重启;如果否,则消除所述主观异常信息,并将当前从属监控节点变更为主监控节点。
根据本发明实施例的服务监控和自动重启方法,首先,获取被监控服务器的监控信息,并根据所述监控信息为所述被监控服务器配置主监控节点和从属监控节点;接着,所述主监控节点向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否主观异常;然后,如果是,则所述主监控节点向配置服务器发送主观异常信息;接着,所述配置服务器根据所述主观异常信息向所述从属监控节点发送验证指令;然后,所述从属监控节点根据所述验证指令向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否客观异常;接着,如果是,则对所述被监控服务器进行重启;如果否,则消除所述主观异常信息,并将当前从属监控节点变更为主监控节点;从而实现对服务的运行状态进行自动监控,并在服务的运行状态异常时,进行相应处理,保证服务的有效运行,防止客户流失。
另外,根据本发明上述实施例提出的服务监控和自动重启方法还可以具有如下附加的技术特征:
可选地,所述监控信息包括被监控服务器的url地址、安全协议地址、通过所述安全协议地址连接到所述被监控服务器的秘钥、重启脚本和重启保护期。
可选地,根据所述监控信息为所述被监控服务器配置主监控节点和从属监控节点,包括:获取监控任务列表,其中,所述监控任务列表维护有每个监控节点作为主监控节点的任务数量和每个监控节点作为从属监控节点的任务数量;根据每个监控节点作为主监控节点的任务数量和每个监控节点作为从属监控节点的任务数量确定待配置主监控节点和待配置从属监控节点,并将所述待配置主监控节点和所述待配置从属监控节点根据所述监控信息配置给相应的被监控服务器。
可选地,所述主监控节点向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否主观异常,包括:所述主监控节点根据预设频率向所述被监控服务器发起http请求;判断所述被监控服务器返回的响应内容是否为异常;如果是,则所述主监控节点再次向所述被监控服务器发起第一预设次数的http请求;判断所述主监控节点再次发起的http请求所对应的响应内容中是否包含异常;如果是,则认为所述被监控服务器的当前状态为主观异常。
可选地,所述从属监控节点根据所述验证指令向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否客观异常,包括:所述从属监控节点向所述被监控服务器发起第二预设次数的http请求;判断所述被监控服务器返回的响应内容是否均为正常;如果是,则认为所述主监控节点当前状态异常;如果否,则认为所述被监控服务器的当前状态为客观异常。
可选地,对所述被监控服务器进行重启,包括:根据所述安全协议地址和所述通过所述安全协议地址连接到所述被监控服务器的秘钥配置相应的安全协议信息,并根据所述安全协议信息连接所述被监控服务器;在连接所述被监控服务器后,执行所述重启脚本,以对所述被监控服务器进行重启;启动计时器进行计时;判断所述计时器的计时结果是否达到重启保护期;如果是,则返回所述主监控节点向所述被监控服务器发起http请求的步骤,以对所述被监控服务器进行继续监控。
为达到上述目的,本发明第二方面实施例提出了一种计算机可读存储介质,其上存储有服务监控和自动重启程序,该服务监控和自动重启程序被处理器执行时实现如上述的服务监控和自动重启方法。
根据本发明实施例的计算机可读存储介质,通过存储服务监控和自动重启程序,以使得处理器在执行该服务监控和自动重启程序时,实现如上述的服务监控和自动重启方法,从而实现对服务的运行状态进行自动监控,并在服务的运行状态异常时,进行相应处理,保证服务的有效运行,防止客户流失。
为达到上述目的,本发明第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述的服务监控和自动重启方法。
根据本发明实施例的计算机设备,通过存储器对服务监控和自动重启程序进行存储,以使得处理器在执行该服务监控和自动重启程序时,实现如上述的服务监控和自动重启方法,从而实现对服务的运行状态进行自动监控,并在服务的运行状态异常时,进行相应处理,保证服务的有效运行,防止客户流失。
为达到上述目的,本发明第四方面实施例提出了一种服务监控和自动重启系统,包括:监控节点,所述监控节点可被配置为主监控节点或从属监控节点;配置服务器,所述配置服务器用于获取被监控服务器的监控信息,并根据所述监控信息为所述被监控服务器配置主监控节点和从属监控节点;所述主监控节点用于向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否主观异常,以及在判断结果为是时,向所述配置服务器发送主观异常信息;所述配置服务器还用于根据所述主观异常信息向所述从属监控节点发送验证指令;所述从属监控节点用于根据所述验证指令向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否客观异常;如果是,则对所述被监控服务器进行重启;如果否,则消除所述主观异常信息,并将当前从属监控节点变更为主监控节点。
根据本发明实施例的服务监控和自动重启系统,通过设置监控节点,监控节点可被配置为主监控节点或从属监控节点;配置服务器用于获取被监控服务器的监控信息,并根据所述监控信息为所述被监控服务器配置主监控节点和从属监控节点;主监控节点用于向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否主观异常,以及在判断结果为是时,向所述配置服务器发送主观异常信息;配置服务器还用于根据所述主观异常信息向所述从属监控节点发送验证指令;从属监控节点用于根据所述验证指令向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否客观异常;如果是,则对所述被监控服务器进行重启;如果否,则消除所述主观异常信息,并将当前从属监控节点变更为主监控节点;从而实现对服务的运行状态进行自动监控,并在服务的运行状态异常时,进行相应处理,保证服务的有效运行,防止客户流失。
另外,根据本发明上述实施例提出的服务监控和自动重启系统还可以具有如下附加的技术特征:
可选地,所述监控信息包括被监控服务器的url地址、安全协议地址、通过所述安全协议地址连接到所述被监控服务器的秘钥、重启脚本和重启保护期。
附图说明
图1为根据本发明实施例的服务监控和自动重启方法的流程示意图;
图2为根据本发明另一实施例的服务监控和自动重启方法的流程示意图;
图3为根据本发明实施例的服务监控和自动重启系统的方框示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
相关技术中,大多没有对WEB服务进行自动的实时监控,而只是通过处理客户投诉来获取WEB服务的运行状态信息,并通过人工介入来恢复WEB服务;这种方式对于WEB服务的停用状态的发现不够及时,容易造成客户的流失;根据本发明实施例的服务监控和自动重启方法,首先,获取被监控服务器的监控信息,并根据所述监控信息为所述被监控服务器配置主监控节点和从属监控节点;接着,所述主监控节点向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否主观异常;然后,如果是,则所述主监控节点向配置服务器发送主观异常信息;接着,所述配置服务器根据所述主观异常信息向所述从属监控节点发送验证指令;然后,所述从属监控节点根据所述验证指令向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否客观异常;接着,如果是,则对所述被监控服务器进行重启;如果否,则消除所述主观异常信息,并将当前从属监控节点变更为主监控节点;从而实现对服务的运行状态进行自动监控,并在服务的运行状态异常时,进行相应处理,保证服务的有效运行,防止客户流失。
为了更好的理解上述技术方案,下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
图1为根据本发明实施例的服务监控和自动重启方法的流程示意图,如图1所示,该服务监控和自动重启方法包括以下步骤:
S101,获取被监控服务器的监控信息,并根据监控信息为被监控服务器配置主监控节点和从属监控节点。
其中,监控信息的设置方式可以有多种。
作为一种示例,监控信息包括被监控服务器的url地址。
作为另一种示例,监控信息包括被监控服务器的url地址、安全协议地址、通过安全协议地址连接到被监控服务器的秘钥、重启脚本和重启保护期。
其中,根据监控信息为被监控服务器配置主监控节点和从属监控节点的方式可以有多种。
作为一种示例,根据监控信息为被监控服务器配置主监控节点和从属监控节点,包括:获取监控任务列表,其中,监控任务列表维护有每个监控节点作为主监控节点的任务数量和每个监控节点作为从属监控节点的任务数量;根据每个监控节点作为主监控节点的任务数量和每个监控节点作为从属监控节点的任务数量确定待配置主监控节点和待配置从属监控节点,并将待配置主监控节点和待配置从属监控节点根据监控信息配置给相应的被监控服务器。
即言,在本发明实施例提出的服务监控和自动重启方法中,监控节点可以被配置为主监控节点,也可以被从属监控节点,从属监控节点用于主监控节点发现异常时,对异常进行验证,平时并不启动。同时,为了提高利用率,一个监控节点可以同时作为多个服务器的主监控节点或从属监控节点(例如,监控节点在作为服务器A的主监控节点的同时,也可以是服务器B和C的从属监控节点;当然,一个监控节点不能同时作为同一服务器的主监控节点和从属监控节点);因此,在配置之前对监控任务列表进行调用,以根据调用结果进行被监控服务器的主监控节点和从属监控节点的配置;如此,可以有效提高监控节点资源的利用率,避免某一监控节点任务过于繁重或者过于空闲;其中,根据每个监控节点作为主监控节点的任务数量和每个监控节点作为从属监控节点的任务数量确定待配置主监控节点和待配置从属监控节点的方式可以有多种;例如,可以直接根据两个任务数量的和值对每个监控节点进行排序,并根据排序结果进行最终结果的确定;或者,分别设置作为主监控节点的任务数量的权重和作为从属监控节点的任务数量的权重;接着,根据两者的权重计算每个监控节点所对应的任务权重值,并根据任务权重值对所有监控节点进行排序;然后,根据排序结果进行最终主监控节点和从属监控节点的选定。
S102,主监控节点向被监控服务器发起http请求,并根据请求结果判断被监控服务器当前是否主观异常。
在一些实施例中,主监控节点向被监控服务器发起http请求,并根据请求结果判断被监控服务器当前是否主观异常,包括:主监控节点根据预设频率向被监控服务器发起http请求;判断被监控服务器返回的响应内容是否为异常;如果是,则主监控节点再次向被监控服务器发起第一预设次数的http请求;判断主监控节点再次发起的http请求所对应的响应内容中是否包含异常;如果是,则认为被监控服务器的当前状态为主观异常。
作为一种示例,主监控节点在监控过程中,每隔1s便向被监控服务器的url地址发起http请求;如果该请求所对应的响应内容为“ok”;则表示被监控服务器当前状态正常,继续进行下一轮的http请求;如果该请求所对应的响应内容不是“ok”,则说明被监控服务器当前可能处于异常的情况(可以理解,在出现一次响应内容不是“ok”,并不能完全确定被监控服务器就是异常,也有可能仅仅是该服务器负载过高而未正确响应,或者,请求时发生了网络抖动;因此,当出现一次响应内容不是“ok”时,表示被监控服务器可能处于异常情况);此时,主监控节点再次向被监控服务器发起第一预设次数(例如:3次,具体次数可以根据实际需求进行确定)的http请求;如果第一预设次数的http请求所对应的响应内容均为正常,则表示被监控服务器没有问题,它只是发生了上述的小概率时间,则主监控节点返回按预设间隔发起http请求的步骤;如果第一预设次数的http请求所对应的响应内容中包含异常,则认为被监控服务器的当前状态为主观异常;可以理解,当一台监控节点对被监控服务器的监控为异常时,并不能完全确定该被监控服务器就是处于异常情况;因为,这种情况有可能是由主监控节点本身问题所导致的;因此,我们称单一一台主监控节点监控得到的被监控服务器异常结果为主观异常。
S103,如果是,则主监控节点向配置服务器发送主观异常信息。
S104,配置服务器根据主观异常信息向从属监控节点发送验证指令。
S105,从属监控节点根据验证指令向被监控服务器发起http请求,并根据请求结果判断被监控服务器当前是否客观异常。
S106,如果是,则对被监控服务器进行重启。
S107,如果否,则消除主观异常信息,并将当前从属监控节点变更为主监控节点。
在一些实施例中,从属监控节点根据验证指令向被监控服务器发起http请求,并根据请求结果判断被监控服务器当前是否客观异常,包括:从属监控节点根据第二预设频率向被监控服务器发起http请求;判断被监控服务器返回的响应内容是否均为正常;如果是,则认为主监控节点当前状态异常;如果否,则认为被监控服务器的当前状态为客观异常。
作为一种示例,当主监控节点判断被监控服务器为主观异常时,向配置服务器发送主观异常信息;而配置服务器根据主观异常信息向从属监控节点发送验证指令,以便从属监控节点根据验证指令对被监控服务器的当前状态进行验证,判断被监控服务器当前是否异常;具体地,从属监控节点根据验证指令按照预设频率向被监控服务器发起第二预设次数(例如:3次,具体次数可以根据实际需要进行确定)的http请求;如果第二预设次数的http请求所对应的响应内容均是正常,那么,说明被监控服务器当前状态是正常的,存在异常的是主监控节点;此时,配置服务器会消除主观异常信息,并将当前从属监控节点替换为主监控节点;同时,将这一变更信息和异常监控信息发送给相关人员,以便相关人员对主监控节点的异常进行排查。而如果第二预设次数的http请求所对应的响应内容中存在异常,则认为被监控服务器的当前状态为客观异常;即言,当不止一台监控节点监控到被监控服务器异常时,我们认为被监控服务器当前状态确实为异常,即客观异常;此时,需要对被监控服务器进行重启,以在第一时间对服务进行恢复,降低服务器异常对应用户使用的影响。
其中,对被监控服务器进行重启的方式可以有多种。
在一些实施例中,对被监控服务器进行重启,包括:根据安全协议地址和通过安全协议地址连接到被监控服务器的秘钥配置相应的安全协议信息,并根据安全协议信息连接被监控服务器;在连接被监控服务器后,执行重启脚本,以对被监控服务器进行重启;启动计时器进行计时;判断计时器的计时结果是否达到重启保护期;如果是,则返回主监控节点向被监控服务器发起http请求的步骤,以对被监控服务器进行继续监控。
可以理解,如果不设置重启保护期,则被监控服务器重启的过程中,将不断地出现监控失败的情况;如此,在系统对监控过程日志进行记录时,将会出现繁多的无效监控失败记录,浪费相关人员对于失败日志的查询时间。
在本发明的一个具体实施例中,如图2所示,本发明实施例提出的服务监控和自动重启方法具体包括以下步骤:
S201,获取被监控服务器的监控信息。
S202,获取当前监控任务列表。
S203,根据当前监控任务列表为监控信息对应的被监控服务器配置主监控节点和从属监控节点。
S204,更新监控任务列表。
S205,主监控节点根据预设频率向被监控服务器发起http请求。
S206,判断被监控服务器返回的响应内容是否为异常;如果是,则执行步骤S207;如果否,则返回步骤S205。
S207,主监控节点再次向被监控服务器发起第一预设次数的http请求。
S208,判断主监控节点再次发起的http请求所对应的响应内容中是否包含异常;如果是,则执行步骤S209;如果否,则返回步骤S205。
S209,主监控节点向配置服务器发送主观异常信息。
S210,配置服务器根据主观异常信息向从属监控节点发送验证指令。
S211,从属监控节点向被监控服务器发起第二预设次数的http请求。
S212,判断被监控服务器返回的响应内容是否均为正常;如果是,则执行步骤S213;如果否,则执行步骤S214。
S213,认为主监控节点当前状态异常,并消除主观异常信息,以及将当前从属监控节点变更为主监控节点,返回步骤S205。
S214,根据安全协议地址和通过安全协议地址连接到被监控服务器的秘钥配置相应的安全协议信息,并根据安全协议信息连接被监控服务器。
S215,执行重启脚本,以对被监控服务器进行重启。
S216,启动计时器进行计时。
S217,判断计时器的计时结果是否达到重启保护期;如果是,则返回步骤S205。
综上所述,根据本发明实施例的服务监控和自动重启方法,首先,获取被监控服务器的监控信息,并根据所述监控信息为所述被监控服务器配置主监控节点和从属监控节点;接着,所述主监控节点向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否主观异常;然后,如果是,则所述主监控节点向配置服务器发送主观异常信息;接着,所述配置服务器根据所述主观异常信息向所述从属监控节点发送验证指令;然后,所述从属监控节点根据所述验证指令向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否客观异常;接着,如果是,则对所述被监控服务器进行重启;如果否,则消除所述主观异常信息,并将当前从属监控节点变更为主监控节点;从而实现对服务的运行状态进行自动监控,并在服务的运行状态异常时,进行相应处理,保证服务的有效运行,防止客户流失。
为了实现上述实施例,本发明第二方面实施例提出了一种计算机可读存储介质,其上存储有服务监控和自动重启程序,该服务监控和自动重启程序被处理器执行时实现如上述的服务监控和自动重启方法。
根据本发明实施例的计算机可读存储介质,通过存储服务监控和自动重启程序,以使得处理器在执行该服务监控和自动重启程序时,实现如上述的服务监控和自动重启方法,从而实现对服务的运行状态进行自动监控,并在服务的运行状态异常时,进行相应处理,保证服务的有效运行,防止客户流失。
为了实现上述实施例,本发明第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述的服务监控和自动重启方法。
根据本发明实施例的计算机设备,通过存储器对服务监控和自动重启程序进行存储,以使得处理器在执行该服务监控和自动重启程序时,实现如上述的服务监控和自动重启方法,从而实现对服务的运行状态进行自动监控,并在服务的运行状态异常时,进行相应处理,保证服务的有效运行,防止客户流失。
为了实现上述实施例,本发明第四方面实施例提出了一种服务监控和自动重启系统,如图3所示,该服务监控和自动重启系统包括:监控节点10和配置服务器20。
其中,监控节点10可被配置为主监控节点或从属监控节点;
配置服务器20用于获取被监控服务器的监控信息,并根据监控信息为被监控服务器配置主监控节点和从属监控节点;
主监控节点用于向被监控服务器发起http请求,并根据请求结果判断被监控服务器当前是否主观异常,以及在判断结果为是时,向配置服务器发送主观异常信息;
配置服务器20还用于根据主观异常信息向从属监控节点发送验证指令;
从属监控节点用于根据验证指令向被监控服务器发起http请求,并根据请求结果判断被监控服务器当前是否客观异常;
如果是,则对被监控服务器进行重启;
如果否,则消除主观异常信息,并将当前从属监控节点变更为主监控节点。
在一些实施例中,监控信息包括被监控服务器的url地址、安全协议地址、通过所述安全协议地址连接到所述被监控服务器的秘钥、重启脚本和重启保护期。
需要说明的是,上述关于图1中服务监控和自动重启方法的描述同样适用于该服务监控和自动重启系统,在此不做赘述。
综上所述,根据本发明实施例的服务监控和自动重启系统,通过设置监控节点,监控节点可被配置为主监控节点或从属监控节点;配置服务器用于获取被监控服务器的监控信息,并根据所述监控信息为所述被监控服务器配置主监控节点和从属监控节点;主监控节点用于向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否主观异常,以及在判断结果为是时,向所述配置服务器发送主观异常信息;配置服务器还用于根据所述主观异常信息向所述从属监控节点发送验证指令;从属监控节点用于根据所述验证指令向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否客观异常;如果是,则对所述被监控服务器进行重启;如果否,则消除所述主观异常信息,并将当前从属监控节点变更为主监控节点;从而实现对服务的运行状态进行自动监控,并在服务的运行状态异常时,进行相应处理,保证服务的有效运行,防止客户流失。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不应理解为必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种服务监控和自动重启方法,其特征在于,包括以下步骤:
获取被监控服务器的监控信息,并根据所述监控信息为所述被监控服务器配置主监控节点和从属监控节点;
所述主监控节点向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否主观异常;
如果是,则所述主监控节点向配置服务器发送主观异常信息;
所述配置服务器根据所述主观异常信息向所述从属监控节点发送验证指令;
所述从属监控节点根据所述验证指令向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否客观异常;
如果是,则对所述被监控服务器进行重启;
如果否,则消除所述主观异常信息,并将当前从属监控节点变更为主监控节点。
2.如权利要求1所述的服务监控和自动重启方法,其特征在于,所述监控信息包括被监控服务器的url地址、安全协议地址、通过所述安全协议地址连接到所述被监控服务器的秘钥、重启脚本和重启保护期。
3.如权利要求1所述的服务监控和自动重启方法,其特征在于,根据所述监控信息为所述被监控服务器配置主监控节点和从属监控节点,包括:
获取监控任务列表,其中,所述监控任务列表维护有每个监控节点作为主监控节点的任务数量和每个监控节点作为从属监控节点的任务数量;
根据每个监控节点作为主监控节点的任务数量和每个监控节点作为从属监控节点的任务数量确定待配置主监控节点和待配置从属监控节点,并将所述待配置主监控节点和所述待配置从属监控节点根据所述监控信息配置给相应的被监控服务器。
4.如权利要求1所述的服务监控和自动重启方法,其特征在于,所述主监控节点向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否主观异常,包括:
所述主监控节点根据预设频率向所述被监控服务器发起http请求;
判断所述被监控服务器返回的响应内容是否为异常;
如果是,则所述主监控节点再次向所述被监控服务器发起第一预设次数的http请求;
判断所述主监控节点再次发起的http请求所对应的响应内容中是否包含异常;
如果是,则认为所述被监控服务器的当前状态为主观异常。
5.如权利要求1所述的服务监控和自动重启方法,其特征在于,所述从属监控节点根据所述验证指令向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否客观异常,包括:
所述从属监控节点向所述被监控服务器发起第二预设次数的http请求;
判断所述被监控服务器返回的响应内容是否均为正常;
如果是,则认为所述主监控节点当前状态异常;
如果否,则认为所述被监控服务器的当前状态为客观异常。
6.如权利要求2所述的服务监控和自动重启方法,其特征在于,对所述被监控服务器进行重启,包括:
根据所述安全协议地址和所述通过所述安全协议地址连接到所述被监控服务器的秘钥配置相应的安全协议信息,并根据所述安全协议信息连接所述被监控服务器;
在连接所述被监控服务器后,执行所述重启脚本,以对所述被监控服务器进行重启;
启动计时器进行计时;
判断所述计时器的计时结果是否达到重启保护期;
如果是,则返回所述主监控节点向所述被监控服务器发起http请求的步骤,以对所述被监控服务器进行继续监控。
7.一种计算机可读存储介质,其特征在于,其上存储有服务监控和自动重启程序,该服务监控和自动重启程序被处理器执行时实现如权利要求1-6中任一项所述的服务监控和自动重启方法。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时,实现如权利要求1-6中任一项所述的服务监控和自动重启方法。
9.一种服务监控和自动重启系统,其特征在于,包括:
监控节点,所述监控节点可被配置为主监控节点或从属监控节点;
配置服务器,所述配置服务器用于获取被监控服务器的监控信息,并根据所述监控信息为所述被监控服务器配置主监控节点和从属监控节点;
所述主监控节点用于向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否主观异常,以及在判断结果为是时,向所述配置服务器发送主观异常信息;
所述配置服务器还用于根据所述主观异常信息向所述从属监控节点发送验证指令;
所述从属监控节点用于根据所述验证指令向所述被监控服务器发起http请求,并根据请求结果判断所述被监控服务器当前是否客观异常;
如果是,则对所述被监控服务器进行重启;
如果否,则消除所述主观异常信息,并将当前从属监控节点变更为主监控节点。
10.如权利要求9所述的服务监控和自动重启系统,其特征在于,所述监控信息包括被监控服务器的url地址、安全协议地址、通过所述安全协议地址连接到所述被监控服务器的秘钥、重启脚本和重启保护期。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210512150.5A CN115065715A (zh) | 2022-05-11 | 2022-05-11 | 服务监控和自动重启方法、介质、设备及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210512150.5A CN115065715A (zh) | 2022-05-11 | 2022-05-11 | 服务监控和自动重启方法、介质、设备及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115065715A true CN115065715A (zh) | 2022-09-16 |
Family
ID=83198949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210512150.5A Pending CN115065715A (zh) | 2022-05-11 | 2022-05-11 | 服务监控和自动重启方法、介质、设备及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115065715A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102347976A (zh) * | 2011-07-25 | 2012-02-08 | 北京安天电子设备有限公司 | 分布式网络服务器监控方法及系统 |
US20120109919A1 (en) * | 2009-07-02 | 2012-05-03 | Nhn Business Platform Corporation | High availability database management system and database management method using same |
CN102624570A (zh) * | 2012-04-27 | 2012-08-01 | 杭州东信北邮信息技术有限公司 | 实现对web服务器可用性进行检测的监控系统和方法 |
JP2013161251A (ja) * | 2012-02-03 | 2013-08-19 | Fujitsu Ltd | コンピュータ障害監視プログラム、方法、及び装置 |
CN105306288A (zh) * | 2014-06-27 | 2016-02-03 | 中兴通讯股份有限公司 | WebSocket服务器监控方法及装置 |
CN106357430A (zh) * | 2016-08-29 | 2017-01-25 | 桂林浩新科技服务有限公司 | 一种云计算集群服务状态监控方法和系统 |
CN106603329A (zh) * | 2016-12-02 | 2017-04-26 | 曙光信息产业(北京)有限公司 | 一种服务器集群的监控方法和系统 |
CN110096414A (zh) * | 2019-05-08 | 2019-08-06 | 苏州浪潮智能科技有限公司 | 一种服务器监控方法、装置、设备及介质 |
CN110784374A (zh) * | 2019-10-25 | 2020-02-11 | 上海中通吉网络技术有限公司 | 业务系统运行状态的监控方法、装置、设备和系统 |
CN111565135A (zh) * | 2020-04-30 | 2020-08-21 | 吉林省鑫泽网络技术有限公司 | 监控服务器运行的方法、监控服务器和存储介质 |
-
2022
- 2022-05-11 CN CN202210512150.5A patent/CN115065715A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120109919A1 (en) * | 2009-07-02 | 2012-05-03 | Nhn Business Platform Corporation | High availability database management system and database management method using same |
CN102347976A (zh) * | 2011-07-25 | 2012-02-08 | 北京安天电子设备有限公司 | 分布式网络服务器监控方法及系统 |
JP2013161251A (ja) * | 2012-02-03 | 2013-08-19 | Fujitsu Ltd | コンピュータ障害監視プログラム、方法、及び装置 |
CN102624570A (zh) * | 2012-04-27 | 2012-08-01 | 杭州东信北邮信息技术有限公司 | 实现对web服务器可用性进行检测的监控系统和方法 |
CN105306288A (zh) * | 2014-06-27 | 2016-02-03 | 中兴通讯股份有限公司 | WebSocket服务器监控方法及装置 |
CN106357430A (zh) * | 2016-08-29 | 2017-01-25 | 桂林浩新科技服务有限公司 | 一种云计算集群服务状态监控方法和系统 |
CN106603329A (zh) * | 2016-12-02 | 2017-04-26 | 曙光信息产业(北京)有限公司 | 一种服务器集群的监控方法和系统 |
CN110096414A (zh) * | 2019-05-08 | 2019-08-06 | 苏州浪潮智能科技有限公司 | 一种服务器监控方法、装置、设备及介质 |
CN110784374A (zh) * | 2019-10-25 | 2020-02-11 | 上海中通吉网络技术有限公司 | 业务系统运行状态的监控方法、装置、设备和系统 |
CN111565135A (zh) * | 2020-04-30 | 2020-08-21 | 吉林省鑫泽网络技术有限公司 | 监控服务器运行的方法、监控服务器和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107947960B (zh) | 配置信息的推送方法及系统、配置信息的接收方法及系统 | |
JP4039195B2 (ja) | ネットワークシステム | |
CN107872402B (zh) | 全局流量调度的方法、装置及电子设备 | |
CN108183950B (zh) | 一种网络设备建立连接的方法及装置 | |
CN106302565B (zh) | 业务服务器的调度方法及系统 | |
CN109787827B (zh) | 一种cdn网络监控的方法及装置 | |
CN110830283B (zh) | 故障检测方法、装置、设备和系统 | |
CN107729205B (zh) | 用于业务系统的故障处理方法和装置 | |
WO2021184587A1 (zh) | 基于Prometheus的私有云监控方法、装置、计算机设备及存储介质 | |
US20110221592A1 (en) | Computer Monitoring and Reporting Infrastructure | |
CN108055157B (zh) | 一种服务节点的获取方法及装置 | |
CN106452836B (zh) | 主节点设置方法及装置 | |
CN105589712A (zh) | Bmc模块更新方法以及装置 | |
CN112948128A (zh) | Target端的选择方法、系统及计算机可读介质 | |
CN113347037B (zh) | 一种数据中心访问方法及装置 | |
CN110096305B (zh) | 灰度发布方法、装置、设备及存储介质 | |
CN112039718A (zh) | 升级状态检测方法、服务端、设备及存储介质 | |
CN111342986B (zh) | 分布式节点管理方法及装置、分布式系统、存储介质 | |
JP2004145536A (ja) | 管理システム | |
CN111556125B (zh) | 一种访问请求分配方法、负载均衡设备及电子设备 | |
CN110708177A (zh) | 分布式系统中的异常处理方法、系统和装置 | |
CN112416594A (zh) | 一种微服务分配方法、电子设备和计算机存储介质 | |
CN113765690A (zh) | 集群切换方法、系统、装置、终端、服务器及存储介质 | |
CN115065715A (zh) | 服务监控和自动重启方法、介质、设备及系统 | |
JP6269199B2 (ja) | 管理サーバおよび障害復旧方法、並びにコンピュータ・プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |