CN102136921A - 一种快速检测计算机宕机的方法及含有该方法的计算机系统 - Google Patents

一种快速检测计算机宕机的方法及含有该方法的计算机系统 Download PDF

Info

Publication number
CN102136921A
CN102136921A CN201010000985XA CN201010000985A CN102136921A CN 102136921 A CN102136921 A CN 102136921A CN 201010000985X A CN201010000985X A CN 201010000985XA CN 201010000985 A CN201010000985 A CN 201010000985A CN 102136921 A CN102136921 A CN 102136921A
Authority
CN
China
Prior art keywords
machine
computer
computer system
unit
tested end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201010000985XA
Other languages
English (en)
Inventor
董明
田道远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Engineering Design and Research Institute of General Armament Department
Original Assignee
Engineering Design and Research Institute of General Armament Department
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Engineering Design and Research Institute of General Armament Department filed Critical Engineering Design and Research Institute of General Armament Department
Priority to CN201010000985XA priority Critical patent/CN102136921A/zh
Publication of CN102136921A publication Critical patent/CN102136921A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种快速检测计算机宕机的方法以及对应的计算机系统,包括指令单元、判断单元、休眠单元、自检单元和执行单元,通过合理使用计算机网络中的ARP指令,并进一步设计其他功能单元域,可迅速判断计算机是否已经宕机,使检测是否宕机的时间缩短到1秒钟,从而可实现立即启用备机,保障网络服务。

Description

一种快速检测计算机宕机的方法及含有该方法的计算机系统
技术领域:
本专利涉及计算机热备环境中计算机的检测技术,具体涉及一种可以相互检测热备服务器是否宕机的计算机系统。
技术背景
当前,计算机网络系统被普遍使用,为保障网络系统的正常运行,需要设定多机热备系统,当其中一台主机宕机时,可以快速启动备机工作。多机热备中如何判断集群中服务器的工作状态,成为集群热备中备机启动资源的一个依据,而最快发现计算机宕机是快速恢复业务的一种保障。通常在计算机热备系统中判断多机环境中某台计算机是否正常的方法,是将多台主机之间建立Socket联结方式,通过判断Socket连结是否正常来确定多机中是否有计算机宕机。而判断Socket是否正常工作,通常需要一段时间的等侍。在一段时间内Socket没有响应则认为对机宕机。这时备用服务器启动相关资源,接替主机工作。这样宕机切换的时间主要是由Socket是否在一定时间内无响应来决定的。这样传统的集群热备系统在对机是否宕机的判断上往往需要很长的时间,一般要在30分钟。
专利内容:
本专利的目的在于提供一种用于计算机系统中的可以相互快速检测宕机的方法,以及装有该方法的计算机系统。
附图说明:
图1为本专利方法功能单元域组成图;
图2为本专利计算机系统的组成图;
图3为本专利计算机系统中单机功能结构示意图;
图4为本专利计算机系统检测过程示意图。
具体实施方式:
本专利为一种能相互检测热备服务器是否宕机的方法以及相应的计算机系统。
该方法功能分单元,参见图1以及图4所示,包括指令单元1、判断单元2、自检单元3、休眠单元4以及执行单元5,其中:指令单元1发出APR指令,请求对端返回对应的物理地址;判断单元2判断是否从对端成功返回物理地址,如接收到返回信息,则发送信号给休眠单元4,休眠单元休眠800毫秒,如判断单元2没有收到返回信号,则指示自检单元3工作,检查本机是否在网络当中;自检结果正确,则可判断对端宕机,此时,发送信号给执行单元5启动快速资源。
包含该方法的计算机系统,参见图2所示,包括至少两台网络计算机,在每台计算机检测网络,内嵌上述方法,该计算机系统,可以是服务器集群,也可以是计算机工作组,还可以是服务器与终端计算机的集群,总之,包含在计算机网络之中的所有具有明确IP对应物理地址的设备,均包含于该计算机系统之中。
本专利具有快速检测宕机功能的计算机系统,其中每一计算机的功能结构还可以参见图3所示,包括CPU6,指令装置1、判断装置2、自检装置3、休眠装置4以及执行装置5,结合图4所示,指令装置1从CPU1接收指令,向被检端发出APR指令,请求被检端返回对应的物理地址;判断装置2判断是否从被检端成功返回物理地址;休眠装置4接收判断装置3的休眠信号,指示指令装置1停止发出指令一段时间;执行装置5接收判断装置的警示信号,提示被检端宕机。为保证检测信息的准确无误,可加设自检装置3,接收判断装置3的自检信号,检查本机是否在网络当中,并将自检合格信号传达给执行装置5,提示被检端宕机。
使用上述计算机系统,则可通过网卡ARP协议快速检测出对机是否在工作状态。具体工作过程可以为:
1.根据创建心跳,使本机获得对端主机的网卡信息。
2.定时依次向对端的网卡发送ARP请求(一般为1秒左右),如果所有网卡的ARP请求均失败,则认为对端主机宕机。否则认为对端主机正常。
3.如果确定对端主机宕机,则进一步判断本地主机是否在网络中,如在,则启动本机的快速资源。
本专利使用中有如下特点:对端主机与本地主机建立心跳连接的所有网卡如果同时禁用或者出现故障(不响应ARP),则本地主机会认为对端主机已经宕机。
心跳建立过程中将需要检测对方计算机的网卡IP及MAC地址并记录下来。
利用记录的对机检测地址及IP,本机间隔发送ARP请求向对机,间隔发送时间应大于500ms。对方宕机时,本机能立即探测到(理论上可在1秒以内)。
当发送ARP请求到对机后,由于网卡驱动会响应ARP请求,所以实现中只须实现ARP请求,而不需要实现ARP响应,实现比较简单。对系统资源的消耗比较少。
由于没有防火墙会阻挡ARP协议,所以本方法不受防火墙限制。
本专利计算机系统中使用快速检测方法,通过ARP可以在……秒钟内判断对机是否宕机,较以往检测技术有明显提高。

Claims (9)

1.一种快速检测计算机宕机的方法,其特征在于,该方法包括:
指令单元:向被检端发出APR指令,请求被检端返回对应的物理地址;
判断单元:判断是否从被检端成功返回物理地址;
休眠单元:接收判断单元的休眠信号,指示指令单元停止发出指令一段时间;
执行单元:接收判断单元的警示信号,提示被检端宕机。
2.根据权利要求1所述快速检测宕机的方法,其特征在于,还包括自检单元,接收判断单元的自检信号,检查本机是否在网络当中,并将自检合格信号传达给执行单元,提示被检端宕机。
3.一种具有快速检测宕机功能的计算机系统,包含两台以上的网络单元,每一网络单元均包括:CPU、网络接口、存储器,其特征在于,每一网络单元上装设有权利要求1或2所述方法,该方法连接……(说明与计算机的连接),与所述CPU协同操作完成检测宕机功能。
4.根据权利要求3所述计算机系统,其特征在于,为服务器集群。
5.根据权利要求3所述计算机系统,其特征在于,为计算机工作组。
6.根据权利要求3所述计算机系统,其特征在于,为服务器与终端计算机的集群。
7.根据权利要求3所述计算机系统,其特征在于,为多机热备系统。
8.一种具有快速检测宕机功能的计算机系统,包含两台以上的计算机,每一计算机均包括CPU、网络接口、存储器,其特征在于,每一计算机还包括指令装置、判断装置、休眠装置以及执行装置,所述指令装置从……接收指令,向被检端发出APR指令,请求被检端返回对应的物理地址;所述判断装置判断是否从被检端成功返回物理地址;所述休眠装置接收判断装置的休眠信号,指示指令装置停止发出指令一段时间;所述执行装置接收判断装置的警示信号,提示被检端宕机。
9.根据权利要求8所述具有快速检测宕机功能的计算机系统,其特征在于,还包括自检装置,接收判断装置的自检信号,检查本机是否在网络当中,并将自检合格信号传达给执行装置,提示被检端宕机。
CN201010000985XA 2010-01-22 2010-01-22 一种快速检测计算机宕机的方法及含有该方法的计算机系统 Pending CN102136921A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010000985XA CN102136921A (zh) 2010-01-22 2010-01-22 一种快速检测计算机宕机的方法及含有该方法的计算机系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010000985XA CN102136921A (zh) 2010-01-22 2010-01-22 一种快速检测计算机宕机的方法及含有该方法的计算机系统

Publications (1)

Publication Number Publication Date
CN102136921A true CN102136921A (zh) 2011-07-27

Family

ID=44296582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010000985XA Pending CN102136921A (zh) 2010-01-22 2010-01-22 一种快速检测计算机宕机的方法及含有该方法的计算机系统

Country Status (1)

Country Link
CN (1) CN102136921A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105933135A (zh) * 2015-11-16 2016-09-07 中国银联股份有限公司 一种确定执行调度任务的方法及执行调度任务的第一主机
CN110532132A (zh) * 2019-03-22 2019-12-03 合肥工大高科信息科技股份有限公司 热备服务器安全控制方法、介质及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983360A (en) * 1996-06-27 1999-11-09 Hitachi, Ltd. Information processing system with communication system and hot stand-by change-over function therefor
EP1041776A1 (en) * 1999-03-30 2000-10-04 International Business Machines Corporation Multiple ARP functionality for an IP data transmission system
CN1567737A (zh) * 2003-07-01 2005-01-19 深圳市中兴通讯股份有限公司 一种宽带接入服务器热备份的方法
CN101127770A (zh) * 2004-07-31 2008-02-20 华为技术有限公司 在地址解析协议代理上实现备份的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983360A (en) * 1996-06-27 1999-11-09 Hitachi, Ltd. Information processing system with communication system and hot stand-by change-over function therefor
EP1041776A1 (en) * 1999-03-30 2000-10-04 International Business Machines Corporation Multiple ARP functionality for an IP data transmission system
CN1567737A (zh) * 2003-07-01 2005-01-19 深圳市中兴通讯股份有限公司 一种宽带接入服务器热备份的方法
CN101127770A (zh) * 2004-07-31 2008-02-20 华为技术有限公司 在地址解析协议代理上实现备份的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105933135A (zh) * 2015-11-16 2016-09-07 中国银联股份有限公司 一种确定执行调度任务的方法及执行调度任务的第一主机
CN110532132A (zh) * 2019-03-22 2019-12-03 合肥工大高科信息科技股份有限公司 热备服务器安全控制方法、介质及设备
CN110532132B (zh) * 2019-03-22 2022-04-12 合肥工大高科信息科技股份有限公司 热备服务器安全控制方法、介质及设备

Similar Documents

Publication Publication Date Title
US9251632B2 (en) Vehicle diagnostic system
JP2007507034A5 (zh)
US10318392B2 (en) Management system for virtual machine failure detection and recovery
CN107729190B (zh) 一种io路径故障转移处理方法和系统
CN106559288B (zh) 一种基于icmp报文的快速故障检测方法
CN112511663A (zh) 基于安卓系统的ip冲突检测方法、装置及存储介质
CN103916226A (zh) 基于嵌入式设备冗余备份的方法
CN109194744A (zh) 一种数据传输方法、装置、存储介质及监测设备
CN106155826B (zh) 用于在总线结构中检测及处理错误的方法和系统
CN104734904A (zh) 旁路设备的自动测试方法及系统
US8737419B2 (en) Network concentrator and method of controlling the same
CN103647710A (zh) 一种路径配置方法及装置
CN102521086B (zh) 基于锁步同步的双模冗余系统及其实现方法
CN108954702B (zh) 一种空调的控制方法、装置、空调和存储介质
CN102136921A (zh) 一种快速检测计算机宕机的方法及含有该方法的计算机系统
CN103731315A (zh) 一种服务器故障检测方法
CN112866061A (zh) 一种板载网口的ncsi测试方法、装置、设备及介质
CN106030544B (zh) 计算机设备内存的检测方法和计算机设备
CN103179162A (zh) 一种输出日志的方法及系统
WO2018018853A1 (zh) 外设总线的控制装置及方法
CN103197981B (zh) 存储空间预警方法和系统
WO2013179637A1 (en) Error handling method and in-vehicle device
US20180129624A1 (en) Method and apparatus for handling outstanding interconnect transactions
CN109347743A (zh) 一种专线通信方法、计算机可读存储介质和终端设备
CN107315660A (zh) 一种虚拟化系统的双机热备份方法、装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110727