CN106357427A - 一种故障计算机的处理方法及处理系统 - Google Patents

一种故障计算机的处理方法及处理系统 Download PDF

Info

Publication number
CN106357427A
CN106357427A CN201610741305.7A CN201610741305A CN106357427A CN 106357427 A CN106357427 A CN 106357427A CN 201610741305 A CN201610741305 A CN 201610741305A CN 106357427 A CN106357427 A CN 106357427A
Authority
CN
China
Prior art keywords
computer
machine
computers
idle
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610741305.7A
Other languages
English (en)
Inventor
温九江
袁松平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi Xiaocao Information Industry Co Ltd
Original Assignee
Guangxi Xiaocao Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Xiaocao Information Industry Co Ltd filed Critical Guangxi Xiaocao Information Industry Co Ltd
Priority to CN201610741305.7A priority Critical patent/CN106357427A/zh
Publication of CN106357427A publication Critical patent/CN106357427A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Abstract

本发明公开了一种故障计算机的处理方法及处理系统,所述的方法包括:S1,从私有云环境中的所有计算机中配置一台作为主机,其它的作为从机;S2,根据计算机的性能,对私有云环境中的所有计算机进行分组;S3,监测私有云环境中所有计算机的运行状态;S4,当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。私有云环境中有很多台计算机,当其中有计算机宕机时,将该宕机计算机上的计算数据迁移到该私有云环境中的空闲计算机上,使得整个私有云环境下的数据计算运行不会受到影响,在查找空闲计算机时,分组进行查找,使得查找过程有条不紊。

Description

一种故障计算机的处理方法及处理系统
技术领域
本发明涉及计算机领域,具体涉及一种故障计算机的处理方法及处理系统。
背景技术
当私有云中某台计算机宕机(即死机)之后,需要将宕机计算机上运行的计算数据迁移到其他正常运行的计算机上,即进行故障计算机的切换。目前采用的故障计算机切换方案为:在私有云环境中所有正常运行的计算机中随机选择一台空闲的计算机,将宕机计算机上的应用程序迁移到该随机选择的空闲计算机上。
发明内容
本发明提供了一种故障计算机的处理方法及处理系统,能够克服现有技术的缺陷。
本发明解决上述技术问题的技术方案如下:提供了一种故障计算机的处理方法,包括:
S1,从私有云环境中的所有计算机中配置一台作为主机,其它的作为从机;
S2,根据计算机的性能,对私有云环境中的所有计算机进行分组;
S3,监测私有云环境中所有计算机的运行状态;
S4,当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。
为了解决本发明的技术问题,还提供了一种故障计算机的处理系统,包括:
配置模块,用于从私有云环境中的所有计算机中配置一台作为主机,其它的作为从机;
分组模块,用于根据计算机的性能,对私有云环境中的所有计算机进行分组;
运行状态监测模块,用于监测私有云环境中所有计算机的运行状态;
数据迁移模块,用于当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。
本发明的有益效果为:私有云环境中有很多台计算机,当其中有计算机宕机时,将该宕机计算机上的计算数据迁移到该私有云环境中的空闲计算机上,使得整个私有云环境下的数据计算运行不会受到影响,在查找空闲计算机时,分组进行查找,使得查找过程有条不紊。
附图说明
图1为实施例1的一种故障计算机的处理方法流程图;
图2为实施例2的一种故障计算机的处理系统框图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
实施例1、一种故障计算机的处理方法。
参见图1,本实施例提供的一种故障计算机的处理方法包括:
S1,从私有云环境中的所有计算机中配置一台作为主机,其它的作为从机;
S2,根据计算机的性能,对私有云环境中的所有计算机进行分组;
S3,监测私有云环境中所有计算机的运行状态;
S4,当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。
下面对上述步骤进行具体说明。
很多台计算机组成私有云环境,从整个私有云环境中配置一台作为主机,用来起管理作用,其它的为从机。根据各计算机的性能,将所有的计算机分成若干组,同一组中的计算机的性能差距要比不同组计算机之间的性能差距要小,即同一组中的计算机的性能相差较小,将私有云环境中的所有计算机按照计算性能进行分组,方便对每一台计算机的数据的分配,将分块后的相同大小的数据块尽量分配给同一组的计算机。
分配完成后,主机用来监测私有云环境中的每一台计算机的运行状态,当计算机出现宕机时,触发宕机报警提示。此时,上述步骤S4分为以下几种处理方式:第一种,当主机监测到宕机计算机所在组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,当监测到宕机计算机所在组的多台计算机空闲时,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。将宕机计算机上的计算数据迁移到性能比较好的计算机上,使得整个计算数据的过程更快完成。
第二种,当监测到宕机计算机所属组外的其它组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于同一组,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
第三种,当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于多个组,则从所述多个组中找到最大计算性能的组,并从该组中找到性能最佳的计算机,将宕机计算机上的计算数据迁移到该计算机。
实施例2、一种故障计算机的处理系统。
参见图2,本实施例提供的故障计算机的处理系统包括一个主机1和多个从机2,主机1为私有云环境中的一台,其它的为从机2,所述主机1包括分组模块11、运行状态监测模块12、数据迁移模块13和报警触发模块14。
其中,分组模块11,用于根据计算机的性能,对私有云环境中的所有计算机进行分组;
运行状态监测模块12,用于监测私有云环境中所有计算机的运行状态;
数据迁移模块13,用于当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。
报警触发模块14,用于当监测到宕机计算机时,触发宕机报警提示。
所述数据迁移模块13具体用于:
当监测到宕机计算机所在组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所在组的多台计算机空闲时,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
所述数据迁移模块13还具体用于:
当监测到宕机计算机所属组外的其它组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于同一组,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
所述数据迁移模块13还具体用于:
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于多个组,则从所述多个组中找到最大计算性能的组,并从该组中找到性能最佳的计算机,将宕机计算机上的计算数据迁移到该计算机。
本发明公开的一种故障计算机的处理方法及处理系统,私有云环境中有很多台计算机,当其中有计算机宕机时,将该宕机计算机上的计算数据迁移到该私有云环境中的空闲计算机上,使得整个私有云环境下的数据计算运行不会受到影响,在查找空闲计算机时,分组进行查找,使得查找过程有条不紊。
在本说明书的描述中,参考术语“实施例一”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体方法、装置或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、方法、装置或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种故障计算机的处理方法,其特征在于,包括以下步骤:
S1,从私有云环境中的所有计算机中配置一台作为主机,其它的作为从机;
S2,根据计算机的性能,对私有云环境中的所有计算机进行分组;
S3,监测私有云环境中所有计算机的运行状态;
S4,当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。
2.如权利要求1所述的一种故障计算机的处理方法,其特征在于,所述步骤S4具体包括:
当监测到宕机计算机所在组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所在组的多台计算机空闲时,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
3.如权利要求1所述的一种故障计算机的处理方法,其特征在于,所述步骤S4具体包括:
当监测到宕机计算机所属组外的其它组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于同一组,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
4.如权利要求3所述的一种故障计算机的处理方法,其特征在于,所述步骤S4具体包括:
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于多个组,则从所述多个组中找到最大计算性能的组,并从该组中找到性能最佳的计算机,将宕机计算机上的计算数据迁移到该计算机。
5.如权利要求1-4任一项所述的一种故障计算机的处理方法,其特征在于,当监测到宕机计算机时,触发宕机报警提示。
6.一种故障计算机的处理系统,其特征在于,包括:
配置模块,用于从私有云环境中的所有计算机中配置一台作为主机,其它的作为从机;
分组模块,用于根据计算机的性能,对私有云环境中的所有计算机进行分组;
运行状态监测模块,用于监测私有云环境中所有计算机的运行状态;
数据迁移模块,用于当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。
7.如权利要求6所述的一种故障计算机的处理系统,其特征在于,所述数据迁移模块具体用于:
当监测到宕机计算机所在组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所在组的多台计算机空闲时,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
8.如权利要求6所述的一种故障计算机的处理系统,其特征在于,所述数据迁移模块具体用于:
当监测到宕机计算机所属组外的其它组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于同一组,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
9.如权利要求8所述的一种故障计算机的处理系统,其特征在于,所述数据迁移模块具体用于:
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于多个组,则从所述多个组中找到最大计算性能的组,并从该组中找到性能最佳的计算机,将宕机计算机上的计算数据迁移到该计算机。
10.如权利要求6-9任一项所述的一种故障计算机的处理系统,其特征在于,还包括:
报警触发模块,用于当监测到宕机计算机时,触发宕机报警提示。
CN201610741305.7A 2016-08-26 2016-08-26 一种故障计算机的处理方法及处理系统 Pending CN106357427A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610741305.7A CN106357427A (zh) 2016-08-26 2016-08-26 一种故障计算机的处理方法及处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610741305.7A CN106357427A (zh) 2016-08-26 2016-08-26 一种故障计算机的处理方法及处理系统

Publications (1)

Publication Number Publication Date
CN106357427A true CN106357427A (zh) 2017-01-25

Family

ID=57855264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610741305.7A Pending CN106357427A (zh) 2016-08-26 2016-08-26 一种故障计算机的处理方法及处理系统

Country Status (1)

Country Link
CN (1) CN106357427A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345519A (zh) * 2018-01-31 2018-07-31 河南职业技术学院 计算机硬盘故障的处理方法及装置
CN109766209A (zh) * 2019-01-10 2019-05-17 广州科技贸易职业学院 一种提高云计算环境稳定性的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101072133A (zh) * 2007-05-23 2007-11-14 华中科技大学 一种基于对等网络的高性能计算系统
CN105208078A (zh) * 2015-08-13 2015-12-30 飞狐信息技术(天津)有限公司 一种文件存储系统及方法
CN105487946A (zh) * 2015-11-30 2016-04-13 北京四达时代软件技术股份有限公司 一种故障计算机自动切换方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101072133A (zh) * 2007-05-23 2007-11-14 华中科技大学 一种基于对等网络的高性能计算系统
CN105208078A (zh) * 2015-08-13 2015-12-30 飞狐信息技术(天津)有限公司 一种文件存储系统及方法
CN105487946A (zh) * 2015-11-30 2016-04-13 北京四达时代软件技术股份有限公司 一种故障计算机自动切换方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345519A (zh) * 2018-01-31 2018-07-31 河南职业技术学院 计算机硬盘故障的处理方法及装置
CN109766209A (zh) * 2019-01-10 2019-05-17 广州科技贸易职业学院 一种提高云计算环境稳定性的方法

Similar Documents

Publication Publication Date Title
KR101554113B1 (ko) 장치 집합체에서 리소스 활용의 최적화
EP3014446B1 (en) Asynchronous message passing for large graph clustering
TWI669620B (zh) Database switching method, server, storage medium, electronic device and product
CN103812949B (zh) 一种面向实时云平台的任务调度与资源分配方法及系统
CN107220123A (zh) 一种解决Spark数据倾斜方法及系统
US9641431B1 (en) System and methods for utilization-based balancing of traffic to an information retrieval system
CN105071994B (zh) 一种海量数据监控系统
CN105162632A (zh) 一种服务器集群故障自动处理系统
CN103297543A (zh) 一种基于计算机集群作业调度的方法
CN104123183B (zh) 集群作业调度方法和装置
CN106936620B (zh) 一种告警事件的处理方法和处理装置
CN103433926A (zh) 一种多机器人协调控制装置及其方法
CN105897507A (zh) 节点设备的状态检测方法和装置
CN102158364A (zh) 一种基于时间片调度的设备轮询方法和装置
CN105007294A (zh) 输变电设备状态监测大数据快速接收和分发系统
CN103441878B (zh) Vcf网络中pe设备的归属处理方法及设备
CN103746838A (zh) 一种无中心节点计算机网络的任务调度方法
CN106357427A (zh) 一种故障计算机的处理方法及处理系统
CN105243125A (zh) PrestoDB集群的运行方法、装置、集群及查询数据方法和装置
CN104281636A (zh) 海量报表数据并发分布式处理方法
CN105487946B (zh) 一种故障计算机自动切换方法及装置
CN106156049A (zh) 一种数据读取的方法和系统
CN103095739A (zh) 机柜服务器系统及其节点通信方法
CN104468810A (zh) 一种基于龙芯平台的高性能计算资源监控实现方法
CN105227353A (zh) 一种mysql集群实现方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170125

RJ01 Rejection of invention patent application after publication