CN103634166A - 一种设备存活检测方法及装置 - Google Patents

一种设备存活检测方法及装置 Download PDF

Info

Publication number
CN103634166A
CN103634166A CN201310656710.5A CN201310656710A CN103634166A CN 103634166 A CN103634166 A CN 103634166A CN 201310656710 A CN201310656710 A CN 201310656710A CN 103634166 A CN103634166 A CN 103634166A
Authority
CN
China
Prior art keywords
equipment
server
faulty
detect
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310656710.5A
Other languages
English (en)
Other versions
CN103634166B (zh
Inventor
曾文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qizhi Business Consulting Co ltd
Beijing Qihoo Technology Co Ltd
360 Digital Security Technology Group Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201310656710.5A priority Critical patent/CN103634166B/zh
Publication of CN103634166A publication Critical patent/CN103634166A/zh
Application granted granted Critical
Publication of CN103634166B publication Critical patent/CN103634166B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种设备存活检测方法,包括:通过至少两个检测服务器周期性的检测所述设备的存活状态,所述至少两个检测服务器分别位于不同的互联网服务提供商(ISP)的网络中,且所述检测服务器存储有需要进行存活检测的设备集;分别从所述至少两个检测服务器中的第一检测服务器获取第一待定故障设备集和从所述至少两个检测服务器中的第二检测服务器获取第二待定故障设备集,所述待定故障设备集为所述检测服务器检测到的设备集中故障设备的集合;取所述第一待定故障设备集和所述第二待定故障设备集的交集,获得故障设备集;确定所述故障设备集中的设备不再存活。本发明的上述方案提高了设备存活检测的准确率。

Description

一种设备存活检测方法及装置
技术领域
本发明属于计算机网络技术领域,尤其涉及一种设备存活检测方法及装置。
背景技术
现有技术中的链路保活(Keepalive)技术指的是设备通过定期发送请求报文,并且接收回应报文,来确认邻接的设备是否存活的一种方法。大量使用Keepalive机制来保活的一个主要原因是物理链路的不可靠性,在非点到点网络环境中,中间结点出现故障,终端并不能及时感知链路承载业务的故障。ping是用来检查网络是否通畅或者网络连接速度的命令。它所利用的原理是:网络上的设备都有唯一确定的IP地址,给目标IP地址发送一个数据包,对方就要返回一个同样大小的数据包,根据返回的数据包可以确定目标设备是否存活。
现有的一些组网方式中,各网点都是采用DDN线路接入网络,运行PPP或FR协议,这些协议本身具备keepalive功能,可以检测出链路是否正常工作。但是,随着多业务传输平台(MSTP,multi-sevicetransport platform)业务的发展,逐渐采用了以太网接入的方式,但是以太网交换机上没有运行链路层协议,无法像广域网接口一样通过链路层协议来检测链路是否正常工作。
目前常用的办法是通过本地产生特殊的ping报文来检测链路,这样做的好处是可以透明穿过多个中间网络直接检测出两点之间的状态,不需要对端检测节点启动特殊的业务,能够满足不同厂家的兼容性要求。例如对于一个公司,为了管理为其提供服务器的交换设备的存活状态,在其机房设置一台服务器,用于周期性的发送ping命令检测其所有交换机设备的运营情况,若在接收不到某个或某些交换机设备返回的数据包时,确定其为故障设备,并通知相应的服务提供商对故障设备进行维修等故障恢复操作。
然而现有的这种方式存在的最大缺陷在于,当用于产生ping命令的检测服务器本身的网络连接发生故障时,其在向目标交换机设备发出ping命令后,由于检测服务器与目标交换机设备之间的网络不通,其同样接收不到目标交换机设备返回的数据包。
现有技术采用的这种方式存在的另一缺陷在于产生误报。比如公司监控的某一交换机设备本身以确定为故障设备,且相应的服务提供商正在对其进行故障检查和修复的时候,检测服务器同样接收不到该交换机设备返回的数据包,这种情况下,检测服务器会不断的产生故障报警,造成资源浪费。
发明内容
本发明为解决现有技术中设备存活监控中产生误报的问题,提出了一种设备存活检测方法及装置。
根据本发明一方面,其提供了一种设备存活检测方法,包括:
通过至少两个检测服务器周期性的检测所述设备的存活状态,所述至少两个检测服务器分别位于不同的互联网服务提供商(ISP)的网络中,且所述检测服务器存储有需要进行存活检测的设备集;
分别从所述至少两个检测服务器中的第一检测服务器获取第一待定故障设备集和从所述至少两个检测服务器中的第二检测服务器获取第二待定故障设备集,所述待定故障设备集为所述检测服务器检测到的设备集中故障设备的集合;
取所述第一待定故障设备集和所述第二待定故障设备集的交集,获得故障设备集;
确定所述故障设备集中的设备不再存活。
可选地,在确定所述故障设备集中的设备不再存活之前,还包括:若存在第三检测服务器,则通过所述第三检测服务器验证故障设备集中的设备是否存活,从故障设备集中除去经验证仍然存活的设备,所述第三检测服务器位于与所述第一检测服务器和第二检测服务器不同的互联网服务提供商(ISP)的网络中。
可选地,其还包括从所述需要进行存活检测的设备集中除去黑名单中的设备,所述黑名单是预先配置的不需要进行存活检测的设备,其中包括暂时下线的设备和已上线但未提供服务的设备。
可选地,还包括:针对不再存活的设备进行报警。
可选地,所述针对不再存活的设备进行报警包括:通过邮件、短信和/或特定应用的方式进行报警。
可选地,所述至少两个检测服务器检测所述设备的存活状态的周期可配置。
根据本发明另一方面,其提供了一种设备存活检测装置,包括:
检测模块,其通过至少两个检测服务器周期性的检测所述设备的存活状态,所述至少两个检测服务器分别位于不同的互联网服务提供商(ISP)的网络中,且所述检测服务器存储有需要进行存活检测的设备集;
获取模块,其分别从所述至少两个检测服务器中的第一检测服务器获取第一待定故障设备集和从所述至少两个检测服务器中的第二检测服务器获取第二待定故障设备集,所述待定故障设备集为所述检测服务器检测到的设备集中故障设备的集合;
交集模块,其取所述第一待定故障设备集和所述第二待定故障设备集的交集,获得故障设备集;
确定模块,确定所述故障设备集中的设备不再存活。
可选地,其还包括:
验证模块,若存在第三检测服务器,其通过所述第三检测服务器验证故障设备集中的设备是否存活,从故障设备集中除去经验证仍然存活的设备,所述第三检测服务器位于与所述第一检测服务器和第二检测服务器不同的互联网服务提供商(ISP)的网络中。
可选地,还包括:
黑名单模块,其从所述需要进行存活检测的设备集中除去黑名单中的设备,所述黑名单是预先配置的不需要进行存活检测的设备,其中包括暂时下线的设备和已上线但未提供服务的设备。
可选地,还包括:
报警模块,其针对不再存活的设备进行报警。
可选地,所述报警模块通过邮件、短信和/或特定应用的方式进行报警。
可选地,所述至少两个检测服务器检测所述设备的存活状态的周期可配置。
可见,本发明提供的上述设备存活的检测方法及装置通过设置至少两个处于不同互联网服务提供商的网络检测服务器对所监控的设备周期性地进行存活检测,并获得这至少两个检测服务器分别检测得到的故障设备集,通过取两个故障设备集的交集,以确保其中一个检测服务器自身网络故障引起的误报。此外,本发明还从所述交集中除去黑名单中的设备,其中所述黑名单中的设备是预先配置的不需要进行存活检测的设备,其中包括暂时下线的设备和已上线但未提供服务的设备。因此,通过本发明提出的这种方式极大地提高了故障报警的准确率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
图1是本发明提供的一种设备存活检测方法流程图;
图2是本发明提供的一种设备存活检测装置结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
图1是本发明提供的一种设备存活检测方法的流程图。如图1所示,该方法包括:
步骤101:通过至少两个检测服务器周期性的检测所述设备的存活状态,所述至少两个检测服务器分别位于不同的互联网服务提供商(ISP)的网络中,且所述检测服务器存储有需要进行存活检测的设备集;
步骤102:分别从所述至少两个检测服务器中的第一检测服务器获取第一待定故障设备集和从所述至少两个检测服务器中的第二检测服务器获取第二待定故障设备集,所述待定故障设备集为所述检测服务器检测到的设备集中故障设备的集合;
步骤103:取所述第一待定故障设备集和所述第二待定故障设备集的交集,获得故障设备集;
步骤104:确定所述故障设备集中的设备不再存活。
下面详细说明本发明提出的上述设备存活检测方法的各个步骤。需要说明的是,本发明提出的上述方法适合各种网络设备的存活检测,如服务器、交换机和路由器等,而下面重点以为公司提供网络服务器的交换机为例加以说明,但不限于此。
步骤101:通过至少两个检测服务器周期性的检测所述设备的存活状态,所述至少两个检测服务器分别位于不同的互联网服务提供商(ISP)的网络中,且所述检测服务器存储有需要进行存活检测的设备集。
所述检测服务器是通过网络与被检测设备相连的设备,其只要是能够通过网络向被检测设备发送存活探测消息并接收从所述被检测设备返回的存活消息的网络设备即可。可选地,所述存活探测消息可以通过ping命令发送。检测服务器向被检测设备的IP地址发送ping数据包后,如果被检测设备接收到所述ping命令,会相应的返回一个相同大小的ping数据包,通过检查所返回的ping数据包,检测服务器就能得知被检测设备的存活状况。
本发明采用至少两个检测服务器探测被检测设备的存活状况,并且要求这至少两个检测服务器分别位于不同的互联网服务提供商(ISP)的网络中。这样做的目的是,当其中一个检测服务器所处的网络故障时,其它检测服务器检测到的故障设备是正确的。而由于至少两个检测服务器所处网络不同,至少两个检测服务器的网络都发生故障的概率极小,因此误报概率也极小。
所述至少两个检测服务器周期性地向所述被检测设备发送探测消息。所述周期可以根据需要进行配置。例如,对于为公司提供网络服务的交换机设备,可以设置其周期为1分钟一次等。
另外,所述检测服务器可以是安装在公司机房的一台服务器设备。比如,一个公司在不同地区或同一地区设置有不同的机房,则可以选用不同机房中的一台网络设备作为所述检测服务器,向被检测设备发送探测消息。
检测服务器在检测前,首先要获取需要进行存活检测的设备集,主要包括需要进行存活检测的设备的IP地址以及设备信息等,并将其存储在所述设备集中。所述需要进行存活检测的设备集为人员配置,或是通过接入外部网络的接入服务器获取的。所述接入服务器包括连接至外网如以太网的路由器、交换机、服务器等,其根据与其交互的各个交换机设备、路由器设备或服务器设备获取其IP地址及设备信息,还通过这些交换机设备、路由器设备和/或服务器设备获取下一跳设备的IP地址及设备信息,并将这些IP地址以及设备信息存储为设备集的形式,交由检测服务器。
检测过程中,检测服务器周期性地向所述设备的IP地址发送探测消息,如ping数据包,并等待所述设备返回的ping数据包。检测服务器通常会设置超时定时器,如果在定时器超时后还未收到相应的ping数据包,则认为该设备故障,将其信息写入待定故障设备集中。所述待定故障设备集用于存储检测服务器初步确定的故障设备IP地址以及对应的设备信息等。
步骤102:分别从所述至少两个检测服务器中的第一检测服务器获取第一待定故障设备集和从所述至少两个检测服务器中的第二检测服务器获取第二待定故障设备集,所述待定故障设备集为所述检测服务器检测到的设备集中故障设备的集合。
每个检测服务器存储周期性检测得到的待定故障设备集,本发明周期性获取存储在每个检测服务器中的待定故障设备集。可选地,每个检测服务器在一个周期检测完毕之后,也可以主动将其获得的待定故障设备集发送过来。
步骤103:取所述第一待定故障设备集和所述第二待定故障设备集的交集,获得故障设备集。
由于利用一台检测服务器检测被检测设备的存活状态,有可能造成误报。比如当这台检测服务器接入外网的链接出现故障时,其发送至被检测设备的探测消息均没有到达被检测设备,相应地,被检测设备也无法给其返回应答消息。而这种情况下,这台检测服务器在定时器超时后,将无法收到应答消息的被检测设备认定为故障设备,而将其IP地址和设备信息存储在待定故障设备集。
因此,本发明通过设置两台以上的检测服务器对同一被检测设备集进行存活状态检测,假如其中一个或多个检测服务器故障时,其它检测服务器依然能检测到正确的故障信息。本发明获取所设置的两台以上检测服务器进行设备存活状态检测而获得的待定故障设备集以后,取其交集作为设备故障集。
例如,设置了两台检测服务器A和B对{设备1,设备2,……,设备n}进行存活状态检测,假设其检测得到的待定故障设备集分别为:
A:{设备}
B:{设备1}
这种情况下,故障设备集为{设备1},显然设备1为故障设备。
假设检测到的待定故障设备集分别为:
A:{设备1,设备2,……,设备n};
B:{设备1};
这种情况下,故障设备集为{设备1},显然设备1为故障设备,而其他设备{设备2,……,设备n}为检测服务器A的误报信息。
可见,通过本发明的上述方法能够更加准确的定位故障设备,降低了误报率。
步骤104:确定所述故障设备集中的设备不再存活。如上所述,当获得至少两个检测服务器的待定故障设备集的交集后,将其作为故障设备集,并确定该故障设备集中的故障设备不再存活。
可选地,本发明还可以在存在第三检测服务器时,通过所述第三检测服务器验证所述故障设备集中的设备是否存活,且该第三检测服务器与上述两个检测服务器均位于不同的互联网服务提供商(ISP)的网络中。通过第三检测服务器的进一步验证,在不可靠的网络环境中可以进一步提高故障检测的准确率。
例如,在不可靠的网络环境中,需要进行存活检测的设备集为{设备1,设备2,……,设备n},而目前故障设备为一个分支上的设备集。假设第一检测服务器A和第二检测服务器B通过其它网络设备同时物理连接至一个包含设备集{设备1,设备2,设备3}的分支,且假如位于同一地理区域的第一检测服务器A和第二检测服务器B到该分支的光纤中断,那么第一检测服务器A和第二检测服务器B所检测到的待定故障设备集分别为:
A:{设备1,设备2,设备3};
B:{设备1,设备2,设备3};
取其交集,则故障设备集为{设备1,设备2,设备3}。而此时就会发生误报,因为设备集{设备1,设备2,设备3}中的三个设备并未发生故障,而是第一检测服务器A和第二检测服务器B连接至其的网线断了。
因此,如果存在一第三检测服务器,且该第三检测服务器与所述第一、第二检测服务器不在同一互联网服务提供商,如果使用第三检测服务器对所述故障设备集{设备1,设备2,设备3}中的设备进行验证,就能发现这三个设备并未发生故障。因此,可以从所述故障设备集中去除这三个设备,以免发生误报。
可选地,本发明还预先配置黑名单,所述黑名单中包括不需要进行存活检测的设备,如暂时下线的设备和已上线但未提供服务的设备。在确定所述故障设备集中的设备为不存活状态前,将其与所述黑名单进行比对,如果所述故障设备集中的一个或多个设备存在于所述黑名单中,则将该一个或多个设备从故障设备集中去除。在实际应用中,有一些设备可能因为故障或例行检修而暂时处于离线状态,但是检测服务器在不知情的情况下依然会认定为其故障设备,将其保存在故障设备集中;还有一些设备刚上线不久但未提供服务,这时检测服务器也可能将其作为故障设备存储在故障设备集中。
因此,有必要设置黑名单,将这种暂时下线和已上线但未提供服务的设备设置不需要进行存活检测的设备,同时从故障报警集中去除而不进行故障报警。
本发明在最终确定了不再存活的故障设备集后,针对所述故障设备集中的设备进行报警。所述报警方式包括多种,如邮件、短信和/或特定应用的方式。所述报警的接收方可以为对负责维修所述故障设备的人员或服务提供商。
优选地,上述位于不同的互联网服务提供商(ISP)的网络中第一、二、三检测服务器分别位于不同的地理区域,可以更好的排除地区网络故障造成的误报。
本发明提出的上述方案适用于任何网络设备的存活状态的检测,其通过设置至少两个处于不同互联网服务提供商的网络检测服务器对所监控的设备周期性地进行存活检测,并获得这至少两个检测服务器分别检测得到的故障设备集,通过取两个故障设备集的交集,以确保其中一个检测服务器自身网络故障引起的误报。此外,本发明还从所述交集中除去黑名单中的设备,其中所述黑名单中的设备是预先配置的不需要进行存活检测的设备,其中包括暂时下线的设备和已上线但未提供服务的设备。因此,通过本发明提出的这种方式极大地提高了故障报警的准确率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
图2示出了本发明提出的一种设备存活检测装置结构图。如图2所示,该装置包括:
检测模块201,其通过至少两个检测服务器周期性的检测所述设备的存活状态,所述至少两个检测服务器分别位于不同的互联网服务提供商(ISP)的网络中,且所述检测服务器存储有需要进行存活检测的设备集;
获取模块202,其分别从所述至少两个检测服务器中的第一检测服务器获取第一待定故障设备集和从所述至少两个检测服务器中的第二检测服务器获取第二待定故障设备集,所述待定故障设备集为所述检测服务器检测到的设备集中故障设备的集合;
交集模块203,其取所述第一待定故障设备集和所述第二待定故障设备集的交集,获得故障设备集;
确定模块204,确定所述故障设备集中的设备不再存活。
所述检测服务器是通过网络与被检测设备相连的设备,其只要是能够通过网络向被检测设备发送存活探测消息并接收从所述被检测设备返回的存活消息的网络设备即可。可选地,所述存活探测消息可以通过ping命令发送。检测服务器向被检测设备的IP地址发送ping数据包后,如果被检测设备接收到所述ping命令,会相应的返回一个相同大小的ping数据包,通过检查所返回的ping数据包,检测服务器就能得知被检测设备的存活状况。
检测模块通过至少两个检测服务器探测被检测设备的存活状况,并且要求这至少两个检测服务器分别位于不同的互联网服务提供商(ISP)的网络中。这样做的目的是,当其中一个检测服务器所处的网络故障时,其它检测服务器检测到的故障设备是正确的。而由于至少两个检测服务器所处网络不同,至少两个检测服务器的网络都发生故障的概率极小,因此误报概率也极小。
所述至少两个检测服务器周期性地向所述被检测设备发送探测消息。所述周期可以根据需要进行配置。例如,对于为公司提供网络服务的交换机设备,可以设置其周期为1分钟一次等。
检测服务器在检测前,首先要获取需要进行存活检测的设备集,主要包括需要进行存活检测的设备的IP地址以及设备信息等,并将其存储在所述设备集中。所述需要进行存活检测的设备集为人员配置,或是通过接入外部网络的接入服务器获取的。所述接入服务器包括连接至外网如以太网的路由器、交换机、服务器等,其根据与其交互的各个交换机设备、路由器设备或服务器设备获取其IP地址及设备信息,还通过这些交换机设备、路由器设备和/或服务器设备获取下一跳设备的IP地址及设备信息,并将这些IP地址以及设备信息存储为设备集的形式,交由检测服务器。
检测过程中,检测服务器周期性地向所述设备的IP地址发送探测消息,如ping数据包,并等待所述设备返回的ping数据包。检测服务器通常会设置超时定时器,如果在定时器超时后还未收到相应的ping数据包,则认为该设备故障,将其信息写入待定故障设备集中。所述待定故障设备集用于存储检测服务器初步确定的故障设备IP地址以及对应的设备信息等。
每个检测服务器存储周期性检测得到的待定故障设备集,且检测模块周期性获取存储在每个检测服务器中的待定故障设备集。可选地,每个检测服务器在一个周期检测完毕之后,也可以主动将其获得的待定故障设备集发送过给检测模块。
由于利用一台检测服务器检测被检测设备的存活状态,有可能造成误报。比如当这台检测服务器接入外网的链接出现故障时,其发送至被检测设备的探测消息均没有到达被检测设备,相应地,被检测设备也无法给其返回应答消息。而这种情况下,这台检测服务器在定时器超时后,将无法收到应答消息的被检测设备认定为故障设备,而将其IP地址和设备信息存储在待定故障设备集。
因此,本发明通过设置两台以上的检测服务器对同一被检测设备集进行存活状态检测,假如其中一个或多个检测服务器故障时,其它检测服务器依然能检测到正确的故障信息。本发明的获取模块获取所设置的两台以上检测服务器进行设备存活状态检测而获得的待定故障设备集以后,由交集取其交集作为设备故障集,并由确定模块确定设备故障集中的设备不再存活。
可选地,本发明提出的上述设备存活检测张志还包括验证模块,用于在存在第三检测服务器时,通过所述第三检测服务器验证所述故障设备集中的设备是否存活,且该第三检测服务器与上述两个检测服务器均位于不同的互联网服务提供商(ISP)的网络中。通过第三检测服务器的进一步验证,可以进一步提高故障检测的准确率。
可选地,本发明提出的上述设备存活装置还包括黑名单模块,其从所述需要进行存活检测的设备集中除去黑名单中的设备,所述黑名单是预先配置的不需要进行存活检测的设备,其中包括暂时下线的设备和已上线但未提供服务的设备。所述黑名单模块在所述确定模块确定所述故障设备集中的设备为不存活状态前,将其与所述黑名单进行比对,如果所述故障设备集中的一个或多个设备存在于所述黑名单中,则将该一个或多个设备从故障设备集中去除。在实际应用中,有一些设备可能因为故障或例行检修而暂时处于离线状态,但是检测服务器在不知情的情况下依然会认定为其故障设备,将其保存在故障设备集中;还有一些设备刚上线不久但未提供服务,这时检测服务器也可能将其作为故障设备存储在故障设备集中。
因此,有必要设置黑名单,将这种暂时下线和已上线但未提供服务的设备设置不需要进行存活检测的设备,同时从故障报警集中去除而不进行故障报警。
所述确定模块最终确定了不再存活的故障设备集后,由报警模块针对所述故障设备集中的设备进行报警。所述报警方式包括多种,如邮件、短信和/或特定应用的方式。所述报警的接收方可以为对负责维修所述故障设备的人员或服务提供商。
由于所述装置实施例基本相应于前述图1所示的方法实施例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此就不赘述了。
A1、一种设备存活检测方法,包括:
通过至少两个检测服务器周期性的检测所述设备的存活状态,所述至少两个检测服务器分别位于不同的互联网服务提供商(ISP)的网络中,且所述检测服务器存储有需要进行存活检测的设备集;
分别从所述至少两个检测服务器中的第一检测服务器获取第一待定故障设备集和从所述至少两个检测服务器中的第二检测服务器获取第二待定故障设备集,所述待定故障设备集为所述检测服务器检测到的设备集中故障设备的集合;
取所述第一待定故障设备集和所述第二待定故障设备集的交集,获得故障设备集;
确定所述故障设备集中的设备不再存活。
A2、如权利要求1所述的设备存活检测方法,其中,在确定所述故障设备集中的设备不再存活之前,还包括:若存在第三检测服务器,则通过所述第三检测服务器验证故障设备集中的设备是否存活,从故障设备集中除去经验证仍然存活的设备,所述第三检测服务器位于与所述第一检测服务器和第二检测服务器不同的互联网服务提供商(ISP)的网络中。
A3、如权利要求1所述的设备存活检测方法,还包括:从所述需要进行存活检测的设备集中除去黑名单中的设备,所述黑名单是预先配置的不需要进行存活检测的设备,其中包括暂时下线的设备和已上线但未提供服务的设备。
A4、如权利要求1所述的设备存活检测方法,还包括:针对不再存活的设备进行报警。
A5、如权利要求4所述的交换设备的监控方法,其中,所述针对不再存活的设备进行报警包括:通过邮件、短信和/或特定应用的方式进行报警。
A6、如权利要求1-4任一项所述的设备存活检测方法,其中,所述至少两个检测服务器检测所述设备的存活状态的周期可配置。
B7、一种设备存活检测装置,包括:
检测模块,其通过至少两个检测服务器周期性的检测所述设备的存活状态,所述至少两个检测服务器分别位于不同的互联网服务提供商(ISP)的网络中,且所述检测服务器存储有需要进行存活检测的设备集;
获取模块,其分别从所述至少两个检测服务器中的第一检测服务器获取第一待定故障设备集和从所述至少两个检测服务器中的第二检测服务器获取第二待定故障设备集,所述待定故障设备集为所述检测服务器检测到的设备集中故障设备的集合;
交集模块,其取所述第一待定故障设备集和所述第二待定故障设备集的交集,获得故障设备集;
确定模块,确定所述故障设备集中的设备不再存活。
B8、如权利要求7所述的设备存活检测装置,其还包括:
验证模块,若存在第三检测服务器,其通过所述第三检测服务器验证故障设备集中的设备是否存活,从故障设备集中除去经验证仍然存活的设备,所述第三检测服务器位于与所述第一检测服务器和第二检测服务器不同的互联网服务提供商(ISP)的网络中。
B9、如权利要求7所述的设备存活检测装置,还包括:
黑名单模块,其从所述需要进行存活检测的设备集中除去黑名单中的设备,所述黑名单是预先配置的不需要进行存活检测的设备,其中包括暂时下线的设备和已上线但未提供服务的设备。
B10、如权利要求7所述的设备存活检测装置,还包括:
报警模块,其针对不再存活的设备进行报警。
B11、如权利要求10所述的交换设备的监控装置,其中,所述报警模块通过邮件、短信和/或特定应用的方式进行报警。
B12、如权利要求7-11任一项所述的设备存活检测装置,其中,所述至少两个检测服务器检测所述设备的存活状态的周期可配置。
本发明提出的上述方案可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本发明提出的上述方案还司可以用于手机客户端等,尤其在目前使用手机客户端上网等用户越来越多,而手机客户端上的操作系统及安全卫士还不健全的情况下,尤其适合执行本发明提出的上述方法和装置。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种设备存活检测方法,包括:
通过至少两个检测服务器周期性的检测所述设备的存活状态,所述至少两个检测服务器分别位于不同的互联网服务提供商(ISP)的网络中,且所述检测服务器存储有需要进行存活检测的设备集;
分别从所述至少两个检测服务器中的第一检测服务器获取第一待定故障设备集和从所述至少两个检测服务器中的第二检测服务器获取第二待定故障设备集,所述待定故障设备集为所述检测服务器检测到的设备集中故障设备的集合;
取所述第一待定故障设备集和所述第二待定故障设备集的交集,获得故障设备集;
确定所述故障设备集中的设备不再存活。
2.如权利要求1所述的设备存活检测方法,其中,在确定所述故障设备集中的设备不再存活之前,还包括:若存在第三检测服务器,则通过所述第三检测服务器验证故障设备集中的设备是否存活,从故障设备集中除去经验证仍然存活的设备,所述第三检测服务器位于与所述第一检测服务器和第二检测服务器不同的互联网服务提供商(ISP)的网络中。
3.如权利要求1所述的设备存活检测方法,还包括:从所述需要进行存活检测的设备集中除去黑名单中的设备,所述黑名单是预先配置的不需要进行存活检测的设备,其中包括暂时下线的设备和已上线但未提供服务的设备。
4.如权利要求1所述的设备存活检测方法,还包括:针对不再存活的设备进行报警。
5.如权利要求4所述的交换设备的监控方法,其中,所述针对不再存活的设备进行报警包括:通过邮件、短信和/或特定应用的方式进行报警。
6.如权利要求1-4任一项所述的设备存活检测方法,其中,所述至少两个检测服务器检测所述设备的存活状态的周期可配置。
7.一种设备存活检测装置,包括:
检测模块,其通过至少两个检测服务器周期性的检测所述设备的存活状态,所述至少两个检测服务器分别位于不同的互联网服务提供商(ISP)的网络中,且所述检测服务器存储有需要进行存活检测的设备集;
获取模块,其分别从所述至少两个检测服务器中的第一检测服务器获取第一待定故障设备集和从所述至少两个检测服务器中的第二检测服务器获取第二待定故障设备集,所述待定故障设备集为所述检测服务器检测到的设备集中故障设备的集合;
交集模块,其取所述第一待定故障设备集和所述第二待定故障设备集的交集,获得故障设备集;
确定模块,确定所述故障设备集中的设备不再存活。
8.如权利要求7所述的设备存活检测装置,其还包括:
验证模块,若存在第三检测服务器,其通过所述第三检测服务器验证故障设备集中的设备是否存活,从故障设备集中除去经验证仍然存活的设备,所述第三检测服务器位于与所述第一检测服务器和第二检测服务器不同的互联网服务提供商(ISP)的网络中。
9.如权利要求7所述的设备存活检测装置,还包括:
黑名单模块,其从所述需要进行存活检测的设备集中除去黑名单中的设备,所述黑名单是预先配置的不需要进行存活检测的设备,其中包括暂时下线的设备和已上线但未提供服务的设备。
10.如权利要求7所述的设备存活检测装置,还包括:
报警模块,其针对不再存活的设备进行报警。
CN201310656710.5A 2013-12-06 2013-12-06 一种设备存活检测方法及装置 Active CN103634166B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310656710.5A CN103634166B (zh) 2013-12-06 2013-12-06 一种设备存活检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310656710.5A CN103634166B (zh) 2013-12-06 2013-12-06 一种设备存活检测方法及装置

Publications (2)

Publication Number Publication Date
CN103634166A true CN103634166A (zh) 2014-03-12
CN103634166B CN103634166B (zh) 2017-05-03

Family

ID=50214818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310656710.5A Active CN103634166B (zh) 2013-12-06 2013-12-06 一种设备存活检测方法及装置

Country Status (1)

Country Link
CN (1) CN103634166B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105721233A (zh) * 2014-12-03 2016-06-29 北京奇虎科技有限公司 网站存活检测方法、装置和系统
CN109204189A (zh) * 2018-09-07 2019-01-15 百度在线网络技术(北京)有限公司 自动驾驶系统、故障报警方法及装置
CN109367501A (zh) * 2018-09-07 2019-02-22 百度在线网络技术(北京)有限公司 自动驾驶系统、车辆控制方法及装置
CN109995618A (zh) * 2019-04-12 2019-07-09 深圳前海微众银行股份有限公司 网络存活监控方法、装置、设备与计算机可读存储介质
CN110113178A (zh) * 2018-11-09 2019-08-09 深圳互联先锋科技有限公司 一种网络设备监控主备装置、方法及系统
CN114529269A (zh) * 2022-04-24 2022-05-24 云账户技术(天津)有限公司 无效经营范围的处理方法、装置、电子设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102111310B (zh) * 2010-12-31 2013-11-27 网宿科技股份有限公司 Cdn设备状态监控方法
CN102394794A (zh) * 2011-11-04 2012-03-28 中国人民解放军国防科学技术大学 防范边界网关协议路由劫持的协同监测方法
CN102496028B (zh) * 2011-11-14 2013-03-20 华中科技大学 一种复杂装备的事后维修故障分析方法
CN102520697B (zh) * 2011-12-16 2014-05-07 西安建筑科技大学 一种远程协同诊断的现场信息预处理方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105721233A (zh) * 2014-12-03 2016-06-29 北京奇虎科技有限公司 网站存活检测方法、装置和系统
CN105721233B (zh) * 2014-12-03 2020-10-27 北京奇虎科技有限公司 网站存活检测方法、装置和系统
CN109204189B (zh) * 2018-09-07 2023-10-03 阿波罗智能技术(北京)有限公司 自动驾驶系统、故障报警方法及装置
CN109204189A (zh) * 2018-09-07 2019-01-15 百度在线网络技术(北京)有限公司 自动驾驶系统、故障报警方法及装置
CN109367501A (zh) * 2018-09-07 2019-02-22 百度在线网络技术(北京)有限公司 自动驾驶系统、车辆控制方法及装置
US11124199B2 (en) 2018-09-07 2021-09-21 Baidu Online Network Technology (Beijing) Co., Ltd Automatic driving system, fault alarm method and device
US11308739B2 (en) 2018-09-07 2022-04-19 Apollo Intelligent Driving Technology (Beijing) Co., Ltd. Automatic driving system, vehicle control method and device
CN109367501B (zh) * 2018-09-07 2023-12-26 阿波罗智能技术(北京)有限公司 自动驾驶系统、车辆控制方法及装置
CN110113178A (zh) * 2018-11-09 2019-08-09 深圳互联先锋科技有限公司 一种网络设备监控主备装置、方法及系统
CN109995618A (zh) * 2019-04-12 2019-07-09 深圳前海微众银行股份有限公司 网络存活监控方法、装置、设备与计算机可读存储介质
CN109995618B (zh) * 2019-04-12 2023-03-21 深圳前海微众银行股份有限公司 网络存活监控方法、装置、设备与计算机可读存储介质
CN114529269B (zh) * 2022-04-24 2022-07-22 云账户技术(天津)有限公司 无效经营范围的处理方法、装置、电子设备及存储介质
CN114529269A (zh) * 2022-04-24 2022-05-24 云账户技术(天津)有限公司 无效经营范围的处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN103634166B (zh) 2017-05-03

Similar Documents

Publication Publication Date Title
CN103607399B (zh) 基于暗网的专用ip网络安全监测系统及方法
CN103634166A (zh) 一种设备存活检测方法及装置
CN102308522B (zh) 一种定位网络故障的方法、设备及系统
CN104219091A (zh) 一种网络运行故障检测系统及其方法
CN101626368A (zh) 一种防止网页被篡改的设备、方法和系统
WO2020098025A1 (zh) 一种静态路由的部署方法、设备及系统
CN106506242A (zh) 一种网络异常行为和流量监测的精确定位方法与系统
CN107947998A (zh) 一种基于应用系统的实时监测系统
CN111698127A (zh) 一种网络内设备的状态监控系统、方法和装置
CN104065508A (zh) 应用服务健康检查方法、装置和系统
CN105099762B (zh) 一种系统运维功能的自检方法及自检系统
CN102801825B (zh) 终端多ip地址有效性检测方法
CN102143011B (zh) 一种实现网络保护的装置及方法
CN105306303B (zh) 基于终端网络设备的故障实时监听系统及终端网络设备
CN101820368A (zh) 以太网链路故障检测方法及装置
CN103716377B (zh) 一种实现ups远程监控的方法及智能卡
CN115885502A (zh) 对中间网络节点进行诊断
CN108259442B (zh) 一种慢协议报文处理方法及相关装置
KR20200007912A (ko) 데이터 트래픽을 모니터링하기 위한 방법, 장치 및 시스템
CN111010362B (zh) 一种异常主机的监控方法及装置
CN109040137A (zh) 用于检测中间人攻击的方法、装置以及电子设备
CN103297480A (zh) 一种应用服务自动检测系统和方法
CN110521233B (zh) 标识中断的方法、接入点、远程配置的方法、系统和介质
CN106230658A (zh) 一种监控网络设备的方法和装置
KR101556781B1 (ko) 네트웍 장비 예측 장애 및 수명 정보 서비스 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee after: Beijing Qizhi Business Consulting Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Qizhi software (Beijing) Co.,Ltd.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20220324

Address after: 100016 1773, 15 / F, 17 / F, building 3, No.10, Jiuxianqiao Road, Chaoyang District, Beijing

Patentee after: Sanliu0 Digital Security Technology Group Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Beijing Qizhi Business Consulting Co.,Ltd.

TR01 Transfer of patent right