CN106982148B - 一种服务器宕机的监测方法、装置及系统 - Google Patents

一种服务器宕机的监测方法、装置及系统 Download PDF

Info

Publication number
CN106982148B
CN106982148B CN201610035192.9A CN201610035192A CN106982148B CN 106982148 B CN106982148 B CN 106982148B CN 201610035192 A CN201610035192 A CN 201610035192A CN 106982148 B CN106982148 B CN 106982148B
Authority
CN
China
Prior art keywords
ssh connection
monitored server
connection request
server
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610035192.9A
Other languages
English (en)
Other versions
CN106982148A (zh
Inventor
郑屹峰
张秋旻
张卷
蒋熠
周鹏
陈珊莎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Zhejiang Co Ltd
Original Assignee
China Mobile Group Zhejiang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Zhejiang Co Ltd filed Critical China Mobile Group Zhejiang Co Ltd
Priority to CN201610035192.9A priority Critical patent/CN106982148B/zh
Publication of CN106982148A publication Critical patent/CN106982148A/zh
Application granted granted Critical
Publication of CN106982148B publication Critical patent/CN106982148B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供了一种服务器宕机的监测方法、装置及系统,涉及通信领域,解决现有技术中宕机监测方案在监测操作系统全面性、监测准确性和监测方式安全性等方面存在不足的问题,该方法包括:向被监控服务器发起安全壳SSH连接请求;根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机。本发明的方案基于SSH协议实现了对服务器宕机的有效监测,可监测范围广,监测准确性、及时性、安全性高,解决了现有宕机监测方案在监测操作系统全面性、监测准确性和监测方式安全性等方面的不足。

Description

一种服务器宕机的监测方法、装置及系统
技术领域
本发明涉及通信领域,特别涉及一种服务器宕机的监测方法、装置及系统。
背景技术
服务器宕机是指服务器出现意外故障导致无法登陆、无法执行命令、无法提供服务。服务器宕机的原因有很多种,如硬件故障、系统资源不足、系统漏洞BUG等都可能导致服务器宕机。服务器宕机对业务影响极大,如何监测一台服务器是否还在正常运行,并在服务器宕机时第一时间通知一线运维人员进行维护,以最大化减少对业务的影响,是运维工作的一个难点。
现有监测宕机的主要方法包括:PING(Packet Internet Groper,因特网包探索器)监测、日志监测等。
PING监测是最常用的宕机监测方法,PING命令通过发送“因特网消息控制协议(ICMP,Internet Control Message Protocol)”回响请求消息来验证与另一台TCP(Transmission Control Protocol传输控制协议)/IP(Internet Protocol,网络之间互连的协议)主机的IP级连接状态,根据PING命令返回信息判断对端主机网络连通性和可达性。
日志监测是通过采集系统日志以及应用程序日志分析系统是否正常运行的监测方法,比较常见的有日志监测方法包括系统日志syslog监测和窗口windows事件日志监测。
但现有宕机监测方案存在如下缺点:
PING监测基于网络层测试网络连通性,因此在设备宕机而网络依然可达的情况下,无法通过PING发现服务器宕机;PING监测基于安全性考虑设置了ICMP数据包过滤,这部分主机的PING监测无效。
不同类型系统的日志格式不一致,可读性不高,日志采集、存储、分析成本高;在设备宕机或夯机时,系统已无法写入日志,日志监测失效。
对现有宕机监测方案需要解决的技术问题总结如下:
1)、监测操作系统全面性:现有宕机监测方案不能同时支持UNIX平台以及WINDOWS平台;
2)、监测准确性:PING监测是根据网络可达性判断主机是否正常运行,准确性不高,比如主机宕机但网络依然可达的情况下,PING监测无法发现宕机;
3)、监测方式安全性:PING监测基于ICMP协议,是一种面向无连接的协议,容易被用于攻击网络上的路由器和主机。比如向主机发起“Ping of Death”(死亡之Ping)攻击,发送ICMP数据包的大小超过64KB上限,或者向目标主机长时间、连续、大量地发送ICMP数据包形成“ICMP风暴”,都会占用目标主机大量CPU(Central Processing Unit,中央处理器)资源,甚至导致系统宕机。
发明内容
本发明要解决的技术问题是提供一种服务器宕机的监测方法、装置及系统,解决现有技术中宕机监测方案在监测操作系统全面性、监测准确性和监测方式安全性等方面存在不足的问题。
为解决上述技术问题,本发明的实施例提供一种服务器宕机的监测方法,包括:
向被监控服务器发起安全壳SSH连接请求;
根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机。
其中,所述根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机,包括:
根据所述被监控服务器发送的对SSH连接请求的回显信息,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机。
其中,所述根据所述被监控服务器发送的对SSH连接请求的回显信息,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机,包括:
检测是否接收到所述被监控服务器发送的对SSH连接请求的回显信息,并在接收到所述被监控服务器发送的对SSH连接请求的回显信息时,检测接收到的回显信息是否为正常认证服务请求消息;
根据检测结果,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机。
其中,所述向被监控服务器发起安全壳SSH连接请求,包括:
每隔第一预设时间段向所述被监控服务器发起一次SSH连接请求。
所述根据检测结果,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机,包括:
若发起一次SSH连接请求后,接收到所述被监控服务器发送的对SSH连接请求的回显信息,且接收到的回显信息是所述正常认证服务请求消息,则确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机;
若发起一次SSH连接请求后,没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息不是所述正常认证服务请求消息,则每隔第二预设时间段向所述被监控服务器发起一次SSH连接请求,共发起N次,N为大于或等于1的整数,且所述第二预设时间段小于所述第一预设时间段;
若发起N次SSH连接请求后都没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息都不是所述正常认证服务请求消息,则确定SSH连接没有成功建立,并进一步确定所述被监控服务器发生了宕机,否则,确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机。
其中,所述监测方法还包括:
确定所述被监控服务器发生宕机后,对所述被监控服务器发生宕机的消息进行告警上报。
为解决上述技术问题,本发明的实施例还提供一种服务器宕机的监测装置,包括:
发起模块,用于向被监控服务器发起安全壳SSH连接请求;
确定模块,用于根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机。
其中,所述确定模块包括:
确定单元,用于根据所述被监控服务器发送的对SSH连接请求的回显信息,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机。
其中,所述确定单元包括:
检测单元,用于检测是否接收到所述被监控服务器发送的对SSH连接请求的回显信息,并在接收到所述被监控服务器发送的对SSH连接请求的回显信息时,检测接收到的回显信息是否为正常认证服务请求消息;
第一确定子单元,用于根据检测结果,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机。
其中,所述发起模块包括:
第一发起单元,用于每隔第一预设时间段向所述被监控服务器发起一次SSH连接请求。
所述第一确定子单元包括:
第二确定子单元,用于若发起一次SSH连接请求后,接收到所述被监控服务器发送的对SSH连接请求的回显信息,且接收到的回显信息是所述正常认证服务请求消息,则确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机;
第二发起单元,用于若发起一次SSH连接请求后,没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息不是所述正常认证服务请求消息,则每隔第二预设时间段向所述被监控服务器发起一次SSH连接请求,共发起N次,N为大于或等于1的整数,且所述第二预设时间段小于所述第一预设时间段;
第三确定子单元,用于若发起N次SSH连接请求后都没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息都不是所述正常认证服务请求消息,则确定SSH连接没有成功建立,并进一步确定所述被监控服务器发生了宕机,否则,确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机。
其中,所述监测装置还包括:
上报模块,用于确定所述被监控服务器发生宕机后,对所述被监控服务器发生宕机的消息进行告警上报。
为解决上述技术问题,本发明的实施例还提供一种服务器宕机的监测系统,包括一台宕机拨测控制器和至少一台宕机拨测服务器,所述宕机拨测控制器用于:
控制所述宕机拨测服务器向被监控服务器发起安全壳SSH连接请求,并根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机。
本发明的上述技术方案的有益效果如下:
本发明实施例的服务器宕机的监测方法,首先向被监控服务器发起安全壳SSH连接请求;然后根据SSH连接是否成功建立,确定被监控服务器是否发生宕机。从而基于SSH协议实现了对服务器宕机的有效监测。由于UNIX系统和WINDOWS系统都支持SSH协议,因此本发明的监测方法适用操作系统范围广;且基于应用层SSH服务正常与否的宕机监测,比基于网络层的网络可达性的宕机监测更加准确有效。相比于日志监测,本发明的监测方法不需要对系统日志进行分析判断,只需要判断SSH连接是否成功,宕机监测实现更加简单高效。相比于PING监测,本发明的监测方法受网络策略影响小,安全性高。本发明的监测方法解决了现有技术中宕机监测方案在监测操作系统全面性、监测准确性和监测方式安全性等方面存在不足的问题。
附图说明
图1为本发明服务器宕机的监测方法流程图;
图2为现有SSH协议框架的示意图;
图3为本发明服务器宕机的监测方法一具体实施例的流程图;
图4为本发明服务器宕机的监测装置的结构示意图;
图5为本发明服务器宕机的监测系统的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
下面对SSH协议做简单介绍。SSH(Secure Shell,安全壳)是建立在应用层和传输层基础上的安全协议,专为远程登录会话和其他网络服务提供安全性的协议。而应用层是开放系统的最高层,是直接为应用进程提供服务的。
如图2所示,SSH协议框架包括传输层协议、用户认证协议和连接协议。其中传输层协议The Transport Layer Protocol提供服务器认证、数据机密性、信息完整性等的支持;用户认证协议The User Authentication Protocol则为服务器提供客户端的身份鉴别;连接协议The Connection Protocol将加密的信息隧道复用成若干个逻辑通道,提供给更高层的应用协议使用。
SSH连接建立要经历如下五个阶段:
1)版本号协商阶段:SSH目前包括SSH1和SSH2两个版本,双方通过版本协商确定使用的版本。
2)密钥和算法协商阶段:SSH支持多种加密算法,双方根据本端和对端支持的算法,协商出最终使用的算法。
3)认证阶段:SSH客户端向服务器端发起认证请求,服务器端对客户端进行认证。
4)会话请求阶段:认证通过后,客户端向服务器端发送会话请求。
5)交互会话阶段:会话请求通过后,服务器端和客户端进行信息的交互。
本发明实施例的服务器宕机的监测方法,基于SSH协议实现对服务器宕机的有效监测,具有可监测范围广,监测准确性、及时性、安全性高的优点。
如图1所示,本发明实施例的服务器宕机的监测方法,包括:
步骤101,向被监控服务器发起安全壳SSH连接请求;
步骤102,根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机。
本发明实施例的服务器宕机的监测方法,首先向被监控服务器发起安全壳SSH连接请求;然后根据SSH连接是否成功建立,确定被监控服务器是否发生宕机。从而基于SSH协议实现了对服务器宕机的有效监测。由于UNIX系统和WINDOWS系统都支持SSH协议,因此本发明的监测方法适用操作系统范围广;且基于应用层SSH服务正常与否的宕机监测,比基于网络层的网络可达性的宕机监测更加准确有效。相比于日志监测,本发明的监测方法不需要对系统日志进行分析判断,只需要判断SSH连接是否成功,宕机监测实现更加简单高效。相比于PING监测,本发明的监测方法受网络策略影响小,安全性高。本发明的监测方法解决了现有技术中宕机监测方案在监测操作系统全面性、监测准确性和监测方式安全性等方面存在不足的问题。
优选的,上述步骤102的步骤可以包括:
步骤1021,根据所述被监控服务器发送的对SSH连接请求的回显信息,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机。
这里,服务器发送的对SSH连接请求的回显信息一般包括9种,如下表1所示,其中2种属于正常认证服务请求消息,表示SSH可正常连接,另外7种不属于正常认证服务请求消息,表示SSH不能正常连接。
此时,通过被监控服务器发送的对SSH连接请求的回显信息,可准确判断SSH连接是否成功建立,进而判断被监控服务器是否发生宕机。
Figure BDA0000909699260000071
Figure BDA0000909699260000081
表1
进一步的,上述步骤1021的步骤可以包括:
步骤10211,检测是否接收到所述被监控服务器发送的对SSH连接请求的回显信息,并在接收到所述被监控服务器发送的对SSH连接请求的回显信息时,检测接收到的回显信息是否为正常认证服务请求消息。
这里,在服务器发生宕机时,有可能接收不到服务器发送的对SSH连接请求的回显信息或者接收到不属于正常认证服务请求消息的回显信息,只有在服务器正常运作时,才会收到服务器发送的属于正常认证服务请求消息的回显信息。
步骤10212,根据检测结果,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机。
此时,通过检测是否接收到被监控服务器发送的对SSH连接请求的回显信息,并在接收到回显信息时,检测该回显信息是否为正常认证服务请求消息,可准确、快速地判断SSH连接是否成功建立,进而进一步确定被监控服务器发生宕机的情况。
优选的,上述步骤101的步骤可以包括:
步骤1011,每隔第一预设时间段向所述被监控服务器发起一次SSH连接请求。
这里,每隔第一预设时间段向被监控服务器发起一次SSH连接请求,可实现对被监控服务器的实时拨测监控,以在服务器出现宕机时及时通知工作人员进行维修。
上述步骤10212的步骤可以包括:
步骤102121,若发起一次SSH连接请求后,接收到所述被监控服务器发送的对SSH连接请求的回显信息,且接收到的回显信息是所述正常认证服务请求消息,则确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机。
这里,如果发起一次SSH连接请求后,接收到的回显信息属于正常认证服务请求消息,则可以确定SSH连接成功,被监控服务器没有发生宕机。
步骤102122,若发起一次SSH连接请求后,没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息不是所述正常认证服务请求消息,则每隔第二预设时间段向所述被监控服务器发起一次SSH连接请求,共发起N次,N为大于或等于1的整数,且所述第二预设时间段小于所述第一预设时间段。
这里,如果发起一次SSH连接请求后,没有接收到回显信息或者接收到的回显信息不属于正常认证服务请求消息,则有可能是服务器发生了宕机,也有可能是其他干扰因素导致SSH连接请求没有顺利发送到服务器。因此,为了提高宕机监测的准确性,需要间隔第二预设时间段向被监控服务器继续发起多次SSH连接请求,并根据连接结果最终确定服务器是否发生宕机。
其中,第一预设时间段和第二预设时间段可根据需求进行设定,如第一预设时间段可设定为300秒,第二预设时间段可设定为60秒。
当然,间隔第二预设时间段向被监控服务器发起的N次连接请求也可根据需求进行设定,如可设定N=2。
步骤102123,若发起N次SSH连接请求后都没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息都不是所述正常认证服务请求消息,则确定SSH连接没有成功建立,并进一步确定所述被监控服务器发生了宕机,否则,确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机。
这里,在发起的N次SSH连接请求都没有接收到被监控服务器发送的回显信息或者接收到的回显信息都不是正常认证服务请求消息时,可以确定SSH连接没有成功,并可以最终确定被监控服务器发生了宕机,排除了由于其他原因导致的SSH连接没有成功的可能。
此时,通过每隔第一预设时间段向被监控服务器发起一次SSH连接请求,实现了对被监控服务器的实时拨测监控,可在服务器出现宕机时及时通知工作人员进行维修;通过每隔第二预设时间段向被监控服务器发起一次SSH连接请求,并根据多次的拨测结果确定被监控服务器是否发生宕机,提高了监测的准确性和有效性。
优选的,所述监测方法还可以包括:
步骤103,确定所述被监控服务器发生宕机后,对所述被监控服务器发生宕机的消息进行告警上报。
这里,可将对被监控服务器的拨测结果同步到日志数据库,并通过日志数据库进行告警上报。
此时,在被监控服务器发生宕机后进行告警上报,能及时通知工作人员进行维修,以避免对系统工作的影响,保证用户体验。
下面对本发明的一具体实现实施例举例说明如下:
如图3所示,本发明实施例的服务器宕机的监测方法,包括:
步骤301,拨测服务器每隔T1秒(如300秒)向被监控服务器发起一次SSH连接请求。
步骤302,拨测服务器检测是否接收到被监控服务器发送的对SSH连接请求的正常认证服务请求消息,如果未接收到正常认证服务请求消息,则执行步骤303,否则执行步骤305。
这里,未接收到正常认证服务请求消息包括两种情况,一种是未接收到被监控服务器发送的对SSH连接请求的回显信息,一种是接收到的回显信息不属于正常认证服务请求消息。
步骤303,拨测服务器每隔T2秒(如60秒)向被监控服务器发起一次SSH连接请求,共发起N次(如2次),如果在第n次(1≤n≤N,且n为整数)SSH连接请求中接收到正常认证服务请求消息,则执行步骤305,如果N次都未接收到正常认证服务请求消息,则执行步骤304。
步骤304,拨测服务器与被监控服务器SSH连接失败,被监控服务器发生了宕机。
步骤305,拨测服务器与被监控服务器SSH连接成功,被监控服务器运行正常,没有发生宕机。
综上,本发明实施例的服务器宕机的监测方法,基于SSH协议实现了对服务器宕机的有效监测,当主机设备宕机或夯机时,会在第一时间显示异常,并通知一线运维人员。基于SSH协议的宕机监测方法可有效避免同类监测所存在的及时性、准确性等问题,如日志监测不会及时写入日志,影响及时性;PING监测仅针对网络层,而在设备宕机网络依然可达的情况下,PING回显结果并不受影响,从而导致无法检测到主机设备宕机。
本发明实施例的服务器宕机的监测方法,可适用于UNIX系统和WINDOWS系统,适用操作系统范围广;且基于应用层SSH服务正常与否的宕机监测,比基于网络层的网络可达性的宕机监测更加准确有效;相比于日志监测,不需要对系统日志进行分析判断,只需要判断SSH连接是否成功,宕机监测实现更加简单高效;相比于PING监测,受网络策略影响小,安全性高。解决了现有技术中宕机监测方案在监测操作系统全面性、监测准确性和监测方式安全性等方面存在不足的问题。
如图4所示,本发明的实施例还提供一种服务器宕机的监测装置,包括:
发起模块,用于向被监控服务器发起安全壳SSH连接请求;
确定模块,用于根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机。
本发明实施例的服务器宕机的监测装置,基于SSH协议实现了对服务器宕机的有效监测。由于UNIX系统和WINDOWS系统都支持SSH协议,因此本发明的监测方法适用操作系统范围广;且基于应用层SSH服务正常与否的宕机监测,比基于网络层的网络可达性的宕机监测更加准确有效。相比于日志监测,本发明的监测方法不需要对系统日志进行分析判断,只需要判断SSH连接是否成功,宕机监测实现更加简单高效。相比于PING监测,本发明的监测方法受网络策略影响小,安全性高。本发明的监测方法解决了现有技术中宕机监测方案在监测操作系统全面性、监测准确性和监测方式安全性等方面存在不足的问题。
优选的,所述确定模块可以包括:
确定单元,用于根据所述被监控服务器发送的对SSH连接请求的回显信息,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机。
优选的,所述确定单元可以包括:
检测单元,用于检测是否接收到所述被监控服务器发送的对SSH连接请求的回显信息,并在接收到所述被监控服务器发送的对SSH连接请求的回显信息时,检测接收到的回显信息是否为正常认证服务请求消息;
第一确定子单元,用于根据检测结果,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机。
优选的,所述发起模块可以包括:
第一发起单元,用于每隔第一预设时间段向所述被监控服务器发起一次SSH连接请求。
所述第一确定子单元包括:
第二确定子单元,用于若发起一次SSH连接请求后,接收到所述被监控服务器发送的对SSH连接请求的回显信息,且接收到的回显信息是所述正常认证服务请求消息,则确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机;
第二发起单元,用于若发起一次SSH连接请求后,没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息不是所述正常认证服务请求消息,则每隔第二预设时间段向所述被监控服务器发起一次SSH连接请求,共发起N次,N为大于或等于1的整数,且所述第二预设时间段小于所述第一预设时间段;
第三确定子单元,用于若发起N次SSH连接请求后都没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息都不是所述正常认证服务请求消息,则确定SSH连接没有成功建立,并进一步确定所述被监控服务器发生了宕机,否则,确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机。
优选的,所述监测装置还可以包括:
上报模块,用于确定所述被监控服务器发生宕机后,对所述被监控服务器发生宕机的消息进行告警上报。
本发明实施例的服务器宕机的监测装置,基于SSH协议实现了对服务器宕机的有效监测,当主机设备宕机或夯机时,会在第一时间显示异常,并通知一线运维人员。基于SSH协议的宕机监测方法可有效避免同类监测所存在的及时性、准确性等问题,如日志监测不会及时写入日志,影响及时性;PING监测仅针对网络层,而在设备宕机网络依然可达的情况下,PING回显结果并不受影响,从而导致无法检测到主机设备宕机。
本发明实施例的服务器宕机的监测装置,可适用于UNIX系统和WINDOWS系统,适用操作系统范围广;且基于应用层SSH服务正常与否的宕机监测,比基于网络层的网络可达性的宕机监测更加准确有效;相比于日志监测,不需要对系统日志进行分析判断,只需要判断SSH连接是否成功,宕机监测实现更加简单高效;相比于PING监测,受网络策略影响小,安全性高。解决了现有技术中宕机监测方案在监测操作系统全面性、监测准确性和监测方式安全性等方面存在不足的问题。
如图5所示,本发明的实施例还提供一种服务器宕机的监测系统,包括一台宕机拨测控制器和至少一台宕机拨测服务器,所述宕机拨测控制器用于:
控制所述宕机拨测服务器向被监控服务器发起安全壳SSH连接请求,并根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机。
这里,宕机拨测服务器上部署宕机拨测程序,周期性发起SSH连接请求;宕机拨测控制器用于配置和删除拨测设备、分配拨测服务器(如DCN网拨测服务器分配给DCN网设备,私网拨测服务器分配给私网设备)、处理拨测结果,并将拨测结果同步到日志数据库。
需要说明的是,该服务器宕机的监测装置及系统是与上述服务器宕机的监测方法相对应的装置及系统,其中上述方法实施例中所有实现方式均适用于该装置及系统的实施例中,也能达到同样的技术效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种服务器宕机的监测方法,其特征在于,包括:
向被监控服务器发起安全壳SSH连接请求;
根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机;
所述根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机,包括:
根据所述被监控服务器发送的对SSH连接请求的回显信息,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机;
所述根据所述被监控服务器发送的对SSH连接请求的回显信息,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机,包括:
检测是否接收到所述被监控服务器发送的对SSH连接请求的回显信息,并在接收到所述被监控服务器发送的对SSH连接请求的回显信息时,检测接收到的回显信息是否为正常认证服务请求消息;
根据检测结果,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机;
所述向被监控服务器发起安全壳SSH连接请求,包括:
每隔第一预设时间段向所述被监控服务器发起一次SSH连接请求;
所述根据检测结果,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机,包括:
若发起一次SSH连接请求后,接收到所述被监控服务器发送的对SSH连接请求的回显信息,且接收到的回显信息是所述正常认证服务请求消息,则确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机;
若发起一次SSH连接请求后,没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息不是所述正常认证服务请求消息,则每隔第二预设时间段向所述被监控服务器发起一次SSH连接请求,共发起N次,N为大于或等于1的整数,且所述第二预设时间段小于所述第一预设时间段;
若发起N次SSH连接请求后都没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息都不是所述正常认证服务请求消息,则确定SSH连接没有成功建立,并进一步确定所述被监控服务器发生了宕机,否则,确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机。
2.根据权利要求1所述的监测方法,其特征在于,所述监测方法还包括:
确定所述被监控服务器发生宕机后,对所述被监控服务器发生宕机的消息进行告警上报。
3.一种服务器宕机的监测装置,其特征在于,包括:
发起模块,用于向被监控服务器发起安全壳SSH连接请求;
确定模块,用于根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机;
所述确定模块包括:
确定单元,用于根据所述被监控服务器发送的对SSH连接请求的回显信息,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机;
所述确定单元包括:
检测单元,用于检测是否接收到所述被监控服务器发送的对SSH连接请求的回显信息,并在接收到所述被监控服务器发送的对SSH连接请求的回显信息时,检测接收到的回显信息是否为正常认证服务请求消息;
第一确定子单元,用于根据检测结果,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机;
所述发起模块包括:
第一发起单元,用于每隔第一预设时间段向所述被监控服务器发起一次SSH连接请求;
所述第一确定子单元包括:
第二确定子单元,用于若发起一次SSH连接请求后,接收到所述被监控服务器发送的对SSH连接请求的回显信息,且接收到的回显信息是所述正常认证服务请求消息,则确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机;
第二发起单元,用于若发起一次SSH连接请求后,没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息不是所述正常认证服务请求消息,则每隔第二预设时间段向所述被监控服务器发起一次SSH连接请求,共发起N次,N为大于或等于1的整数,且所述第二预设时间段小于所述第一预设时间段;
第三确定子单元,用于若发起N次SSH连接请求后都没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息都不是所述正常认证服务请求消息,则确定SSH连接没有成功建立,并进一步确定所述被监控服务器发生了宕机,否则,确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机。
4.根据权利要求3所述的监测装置,其特征在于,所述监测装置还包括:
上报模块,用于确定所述被监控服务器发生宕机后,对所述被监控服务器发生宕机的消息进行告警上报。
5.一种服务器宕机的监测系统,其特征在于,包括一台宕机拨测控制器和至少一台宕机拨测服务器,所述宕机拨测控制器用于:
控制所述宕机拨测服务器向被监控服务器发起安全壳SSH连接请求,并根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机;
所述根据SSH连接是否成功建立,确定所述被监控服务器是否发生宕机,包括:
根据所述被监控服务器发送的对SSH连接请求的回显信息,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机;
所述根据所述被监控服务器发送的对SSH连接请求的回显信息,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机,包括:
检测是否接收到所述被监控服务器发送的对SSH连接请求的回显信息,并在接收到所述被监控服务器发送的对SSH连接请求的回显信息时,检测接收到的回显信息是否为正常认证服务请求消息;
根据检测结果,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机;
所述向被监控服务器发起安全壳SSH连接请求,包括:
每隔第一预设时间段向所述被监控服务器发起一次SSH连接请求;
所述根据检测结果,确定SSH连接是否成功建立,并进一步确定所述被监控服务器是否发生宕机,包括:
若发起一次SSH连接请求后,接收到所述被监控服务器发送的对SSH连接请求的回显信息,且接收到的回显信息是所述正常认证服务请求消息,则确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机;
若发起一次SSH连接请求后,没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息不是所述正常认证服务请求消息,则每隔第二预设时间段向所述被监控服务器发起一次SSH连接请求,共发起N次,N为大于或等于1的整数,且所述第二预设时间段小于所述第一预设时间段;
若发起N次SSH连接请求后都没有接收到所述被监控服务器发送的对SSH连接请求的回显信息或者接收到的回显信息都不是所述正常认证服务请求消息,则确定SSH连接没有成功建立,并进一步确定所述被监控服务器发生了宕机,否则,确定SSH连接成功建立,并进一步确定所述被监控服务器没有发生宕机。
CN201610035192.9A 2016-01-19 2016-01-19 一种服务器宕机的监测方法、装置及系统 Active CN106982148B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610035192.9A CN106982148B (zh) 2016-01-19 2016-01-19 一种服务器宕机的监测方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610035192.9A CN106982148B (zh) 2016-01-19 2016-01-19 一种服务器宕机的监测方法、装置及系统

Publications (2)

Publication Number Publication Date
CN106982148A CN106982148A (zh) 2017-07-25
CN106982148B true CN106982148B (zh) 2020-02-18

Family

ID=59340064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610035192.9A Active CN106982148B (zh) 2016-01-19 2016-01-19 一种服务器宕机的监测方法、装置及系统

Country Status (1)

Country Link
CN (1) CN106982148B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038037B (zh) * 2017-11-08 2021-12-10 南京普宏信息技术有限公司 一种电脑主机安全的监测方法、监测装置及服务器
CN113377600B (zh) * 2020-03-10 2023-06-30 顺丰科技有限公司 一种主机监控方法、装置、服务器及存储介质
CN118409908A (zh) * 2023-01-29 2024-07-30 北京有竹居网络技术有限公司 协处理器、主处理器、宕机检测方法和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102684927A (zh) * 2012-05-31 2012-09-19 迈普通信技术股份有限公司 一种巡检网络设备的方法和装置
CN103001811A (zh) * 2012-12-31 2013-03-27 北京启明星辰信息技术股份有限公司 故障定位方法和装置
CN103425645A (zh) * 2012-05-14 2013-12-04 阿里巴巴集团控股有限公司 数据库集群单点故障的监控系统及方法
CN103701627A (zh) * 2012-09-27 2014-04-02 北京搜狐新媒体信息技术有限公司 一种云计算平台故障检测方法、装置及解决方法、装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425645A (zh) * 2012-05-14 2013-12-04 阿里巴巴集团控股有限公司 数据库集群单点故障的监控系统及方法
CN102684927A (zh) * 2012-05-31 2012-09-19 迈普通信技术股份有限公司 一种巡检网络设备的方法和装置
CN103701627A (zh) * 2012-09-27 2014-04-02 北京搜狐新媒体信息技术有限公司 一种云计算平台故障检测方法、装置及解决方法、装置
CN103001811A (zh) * 2012-12-31 2013-03-27 北京启明星辰信息技术股份有限公司 故障定位方法和装置

Also Published As

Publication number Publication date
CN106982148A (zh) 2017-07-25

Similar Documents

Publication Publication Date Title
US9419871B2 (en) Method and system for remotely monitoring device status and internet connectivity on a computer network
US7167912B1 (en) Method and apparatus for detecting failures in network components
CN106982148B (zh) 一种服务器宕机的监测方法、装置及系统
US20130185428A1 (en) System and Method for Network Path Validation
CN112804220B (zh) 一种防火墙测试方法、装置、电子设备及存储介质
WO2016082543A1 (zh) 一种设备检测方法及检测设备
CN106911510B (zh) 网络准入系统的可用性监测系统及方法
CN109271217A (zh) 云环境下的网络流量检测方法及系统
JP7220231B2 (ja) ネットワーク診断
CN110611596B (zh) 一种局域网故障定位系统
CN112003747A (zh) 云虚拟网关的故障定位方法
US9053311B2 (en) Secure network system request support via a ping request
CN106713038B (zh) 一种远程传输线路质量检测方法及系统
CN112615848B (zh) 漏洞修复状态检测方法及系统
CN113965355A (zh) 一种基于soc的非法ip省内网络封堵方法及装置
CN109818973B (zh) 一种基于串接方式的协议模糊测试方法
CN116319028A (zh) 一种反弹shell攻击拦截方法和装置
Rinaldi et al. Softwarization of SCADA: lightweight statistical SDN-agents for anomaly detection
US9083586B2 (en) Verifying availability and reachability through a network device
Ghaleb et al. A framework architecture for agentless cloud endpoint security monitoring
CN114422200A (zh) 一种域名拦截方法、装置及电子设备
CN110943893B (zh) 服务器间连通性的验证方法及装置
CN106506261A (zh) 智能在线监测前端局域网网络流量的方法
CN113704051A (zh) 一种服务器故障检测系统及实现方法
CN112787846A (zh) 一种设备发现方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant