CN106649065B - 一种计算机系统与应用于该系统的故障计算机替换方法 - Google Patents

一种计算机系统与应用于该系统的故障计算机替换方法 Download PDF

Info

Publication number
CN106649065B
CN106649065B CN201611127490.7A CN201611127490A CN106649065B CN 106649065 B CN106649065 B CN 106649065B CN 201611127490 A CN201611127490 A CN 201611127490A CN 106649065 B CN106649065 B CN 106649065B
Authority
CN
China
Prior art keywords
computer
client
operating system
computer operating
running environment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611127490.7A
Other languages
English (en)
Other versions
CN106649065A (zh
Inventor
魏群
樊秋红
刘婷婷
章昊
李爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China University of Science and Technology
Original Assignee
North China University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China University of Science and Technology filed Critical North China University of Science and Technology
Priority to CN201611127490.7A priority Critical patent/CN106649065B/zh
Publication of CN106649065A publication Critical patent/CN106649065A/zh
Application granted granted Critical
Publication of CN106649065B publication Critical patent/CN106649065B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/85Active fault masking without idle spares

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了电子信息技术领域的一种计算机系统,包括:局域网服务器、基于局域网服务器的局域网和客户端,所述局域网服务器和客户端组成为该计算机系统的硬件;局域网服务器:局域网服务器作为局域网内信号交流的载体,客户端之间通过局域网服务器进行数据交流;客户端:客户端作为计算机系统的硬件载体,为计算机系统正常运行提供运行环境,客户端的软件包括:计算机操作系统,该计算机系统,以局域网服务器作为传输纽带,并且以递推的方式进行替代客户端的选取,便于对优秀客户端的选取,替代客户端的功能较好。

Description

一种计算机系统与应用于该系统的故障计算机替换方法
技术领域
本发明涉及电子信息技术领域,具体为一种计算机系统与应用于该系统的故障计算机替换方法。
背景技术
近来市场上已经有了高密度计算机系统,其中单个机架上包括几十至几百个计算机节点,这样的计算机系统通常包括被称为预备节点的预备计算机,一般而言,预备计算机并不常使用,仅在常用计算机发生故障时作为替代计算机使用,在该集群系统中,当计算机在操作期间发生故障时,由计算机执行的服务由操作系统转移到另一个提到计算机中使用,现有的计算机系统对于故障计算机替换的技术不够完善,为此,我们提出了一种计算机系统与应用于该系统的故障计算机替换方法。
发明内容
本发明的目的在于提供一种计算机系统与应用于该系统的故障计算机替换方法,以解决上述背景技术中提出的现有的计算机系统对于故障计算机替换的技术不够完善的问题。
为实现上述目的,该计算机系统的故障计算机替换方法的步骤具体如下:
S1:运行环境检测系统对客户端的计算机操作系统的运行环境进行检测,检测CPU使用效率和计算机操作系统的出现故障的频率和次数,并以此作为计算机操作系统运行环境的检测评定基础,若评定的结果计算机操作系统的运行环境无法正常进行,则该客户端通过信息交流系统发出请求信息并将请求信息和计算机操作系统运行环境的情况输出至局域网服务器;
S2:局域网服务器根据各个客户端的计算机操作系统运行环境进行排次,并将客户端的计算机操作系统运行环境较好的作为优先替换对象,局域网服务器向计算机操作系统运行环境较好的客户端发出信息请求;
S3:步骤S2中计算机操作系统运行环境较好的客户端通过信息交流系统收到请求信息后并将请求信息与自身的运行环境做对比,若计算机操作系统运行环境较好的客户端满足替换请求,则两个客户端之间通过数据转移系统进行数据传输;
S4:若计算机操作系统运行环境较好的客户端不满足替换请求,则计算机操作系统运行环境较好的客户端通过信息反馈系统将拒绝信息返回至局域网服务器;
S5:局域网服务器根据客户端的计算机操作系统运行环境排次进行选取第二个替代客户端,并重复步骤S3和S4,直至完成数据转移。
优选的,基于一种计算机系统的故障计算机替换方法的计算机系统,包括:局域网服务器、基于局域网服务器的局域网和客户端,所述局域网服务器和客户端组成为该计算机系统的硬件;
局域网服务器:局域网服务器作为局域网内信号交流的载体,客户端之间通过局域网服务器进行数据交流;
客户端:客户端作为计算机系统的硬件载体,为计算机系统正常运行提供运行环境,客户端的软件包括:计算机操作系统,基于计算机系统的运行环境检测系统、信息交流系统、信息反馈系统和数据转移系统,计算机操作系统满足计算机客户端的正常使用的最基本运行要求,运行环境检测系统建立于计算机操作系统之上,对计算机操作系统的的运行环境和使用效率进行检测,信息交流系统建立于计算机操作系统之上,信息交流系统用于客户端之间信息交流的使用工具,信息反馈系统建立于计算机操作系统之上,作为客户端之间信息请求反馈用,数据转移系统作为客户端之间信息转移的工具。
优选的,所述客户端上设置有数据接口,且数据接口为I/O数据端口,所述客户端通过数据接口与局域网服务器进行数据交流。
优选的,所述客户端满足局域网服务协议和互联网服务协议。
优选的,所述运行环境检测系统包括CPU反应速度检测单元和操作系统稳定性检测单元,所述CPU反应速度检测单元对CPU的反应速度进行检测作为CPU评定的基础,所述操作系统稳定性检测单元对于操作系统的使用效率和崩溃情况进行检测,作为评定操作系统适配情况的评定基础。
与现有技术相比,本发明的有益效果是:该计算机系统,以局域网服务器作为传输纽带,并且以递推的方式进行替代客户端的选取,便于对优秀客户端的选取,替代客户端的功能较好。
附图说明
图1为本发明系统原理图;
图2为本发明客户端系统原理图;
图3为本发明替换方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,本发明提供一种计算机系统的故障计算机替换方法,该计算机系统的故障计算机替换方法的步骤具体如下:
S1:运行环境检测系统对客户端的计算机操作系统的运行环境进行检测,检测CPU使用效率和计算机操作系统的出现故障的频率和次数,并以此作为计算机操作系统运行环境的检测评定基础,若评定的结果计算机操作系统的运行环境无法正常进行,则该客户端通过信息交流系统发出请求信息并将请求信息和计算机操作系统运行环境的情况输出至局域网服务器;
S2:局域网服务器根据各个客户端的计算机操作系统运行环境进行排次,并将客户端的计算机操作系统运行环境较好的作为优先替换对象,局域网服务器向计算机操作系统运行环境较好的客户端发出信息请求;
S3:步骤S2中计算机操作系统运行环境较好的客户端通过信息交流系统收到请求信息后并将请求信息与自身的运行环境做对比,若计算机操作系统运行环境较好的客户端满足替换请求,则两个客户端之间通过数据转移系统进行数据传输;
S4:若计算机操作系统运行环境较好的客户端不满足替换请求,则计算机操作系统运行环境较好的客户端通过信息反馈系统将拒绝信息返回至局域网服务器;
S5:局域网服务器根据客户端的计算机操作系统运行环境排次进行选取第二个替代客户端,并重复步骤S3和S4,直至完成数据转移。
基于一种计算机系统的故障计算机替换方法的计算机系统,包括:局域网服务器、基于局域网服务器的局域网和客户端,所述局域网服务器和客户端组成为该计算机系统的硬件;
局域网服务器:局域网服务器作为局域网内信号交流的载体,客户端之间通过局域网服务器进行数据交流;
客户端:客户端作为计算机系统的硬件载体,为计算机系统正常运行提供运行环境,客户端的软件包括:计算机操作系统,基于计算机系统的运行环境检测系统、信息交流系统、信息反馈系统和数据转移系统,计算机操作系统满足计算机客户端的正常使用的最基本运行要求,运行环境检测系统建立于计算机操作系统之上,对计算机操作系统的的运行环境和使用效率进行检测,信息交流系统建立于计算机操作系统之上,信息交流系统用于客户端之间信息交流的使用工具,信息反馈系统建立于计算机操作系统之上,作为客户端之间信息请求反馈用,数据转移系统作为客户端之间信息转移的工具。
其中,所述客户端上设置有数据接口,且数据接口为I/O数据端口,所述客户端通过数据接口与局域网服务器进行数据交流,所述客户端满足局域网服务协议和互联网服务协议,所述运行环境检测系统包括CPU反应速度检测单元和操作系统稳定性检测单元,所述CPU反应速度检测单元对CPU的反应速度进行检测作为CPU评定的基础,所述操作系统稳定性检测单元对于操作系统的使用效率和崩溃情况进行检测,作为评定操作系统适配情况的评定基础。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (1)

1.一种计算机系统的故障计算机替换方法,其特征在于:该计算机系统的故障计算机替换方法的步骤具体如下:
S1:运行环境检测系统对客户端的计算机操作系统的运行环境进行检测,检测CPU使用效率和计算机操作系统的出现故障的频率和次数,并以此作为计算机操作系统运行环境的检测评定基础,若评定的结果计算机操作系统的运行环境无法正常进行,则该客户端通过信息交流系统发出请求信息并将请求信息和计算机操作系统运行环境的情况输出至局域网服务器;
S2:局域网服务器根据各个客户端的计算机操作系统运行环境进行排次,并将客户端的计算机操作系统运行环境较好的作为优先替换对象,局域网服务器向计算机操作系统运行环境较好的客户端发出信息请求;
S3:步骤S2中计算机操作系统运行环境较好的客户端通过信息交流系统收到请求信息后并将请求信息与自身的运行环境做对比,若计算机操作系统运行环境较好的客户端满足替换请求,则两个客户端之间通过数据转移系统进行数据传输;
S4:若计算机操作系统运行环境较好的客户端不满足替换请求,则计算机操作系统运行环境较好的客户端通过信息反馈系统将拒绝信息返回至局域网服务器;
S5:局域网服务器根据客户端的计算机操作系统运行环境排次进行选取第二个替代客户端,并重复步骤S3和S4,直至完成数据转移。
CN201611127490.7A 2016-12-09 2016-12-09 一种计算机系统与应用于该系统的故障计算机替换方法 Active CN106649065B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611127490.7A CN106649065B (zh) 2016-12-09 2016-12-09 一种计算机系统与应用于该系统的故障计算机替换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611127490.7A CN106649065B (zh) 2016-12-09 2016-12-09 一种计算机系统与应用于该系统的故障计算机替换方法

Publications (2)

Publication Number Publication Date
CN106649065A CN106649065A (zh) 2017-05-10
CN106649065B true CN106649065B (zh) 2019-07-23

Family

ID=58824865

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611127490.7A Active CN106649065B (zh) 2016-12-09 2016-12-09 一种计算机系统与应用于该系统的故障计算机替换方法

Country Status (1)

Country Link
CN (1) CN106649065B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101656624A (zh) * 2008-08-18 2010-02-24 中兴通讯股份有限公司 一种多节点应用级容灾系统及容灾方法
CN103200257A (zh) * 2013-03-28 2013-07-10 中标软件有限公司 一种高可用集群系统中的节点及其资源切换方法
CN103699489A (zh) * 2014-01-03 2014-04-02 中国人民解放军装甲兵工程学院 一种基于知识库的软件远程故障诊断与修复方法
CN105978749A (zh) * 2016-04-27 2016-09-28 浪潮(北京)电子信息产业有限公司 一种局域网内计算机硬件信息的监测方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7174390B2 (en) * 2001-04-20 2007-02-06 Egenera, Inc. Address resolution protocol system and method in a virtual network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101656624A (zh) * 2008-08-18 2010-02-24 中兴通讯股份有限公司 一种多节点应用级容灾系统及容灾方法
CN103200257A (zh) * 2013-03-28 2013-07-10 中标软件有限公司 一种高可用集群系统中的节点及其资源切换方法
CN103699489A (zh) * 2014-01-03 2014-04-02 中国人民解放军装甲兵工程学院 一种基于知识库的软件远程故障诊断与修复方法
CN105978749A (zh) * 2016-04-27 2016-09-28 浪潮(北京)电子信息产业有限公司 一种局域网内计算机硬件信息的监测方法及系统

Also Published As

Publication number Publication date
CN106649065A (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
US7225356B2 (en) System for managing operational failure occurrences in processing devices
US8892936B2 (en) Cluster wide consistent detection of interconnect failures
US10462027B2 (en) Cloud network stability
US7987392B2 (en) Differentiating connectivity issues from server failures
US8266474B2 (en) Fast cluster failure detection
US9152441B2 (en) Systems and methods involving virtual machine host isolation over a network via a federated downstream cluster
US10826812B2 (en) Multiple quorum witness
CN113191901B (zh) 一种交易业务处理方法、装置、设备和存储介质
CN109194753B (zh) 一种服务网格中事件处理的方法
CN105556499A (zh) 智能自动缩放
CN102437935B (zh) Web应用监控方法及设备
US11099827B2 (en) Networking-device-based hyper-coverged infrastructure edge controller system
CN104660663B (zh) 服务器群集的操作方法
CN104579765A (zh) 一种集群系统的容灾方法和装置
US20090092054A1 (en) Method for providing notifications of a failing node to other nodes within a computer network
CN106911519A (zh) 一种数据采集监控方法及装置
CN102668453A (zh) 资源的容错和可缩放的负载分布
CN113055203B (zh) Sdn控制平面的异常恢复方法及装置
CN106649065B (zh) 一种计算机系统与应用于该系统的故障计算机替换方法
US20090132716A1 (en) Fault-tolerant distributed services methods and systems
CN104794026A (zh) 一种集群实例多数据源绑定的故障转移方法
JP5826381B2 (ja) スイッチ、送信方法、プログラム、記録媒体
CN100429629C (zh) 一种构造大规模高可用机群操作系统的方法
JP7474168B2 (ja) 監視システムおよび障害監視方法
CN113010337B (zh) 故障检测方法、总控节点、工作节点及分布式系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant