CN106357427A - 一种故障计算机的处理方法及处理系统 - Google Patents
一种故障计算机的处理方法及处理系统 Download PDFInfo
- Publication number
- CN106357427A CN106357427A CN201610741305.7A CN201610741305A CN106357427A CN 106357427 A CN106357427 A CN 106357427A CN 201610741305 A CN201610741305 A CN 201610741305A CN 106357427 A CN106357427 A CN 106357427A
- Authority
- CN
- China
- Prior art keywords
- computer
- machine
- computers
- idle
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0668—Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
Abstract
本发明公开了一种故障计算机的处理方法及处理系统,所述的方法包括:S1,从私有云环境中的所有计算机中配置一台作为主机,其它的作为从机;S2,根据计算机的性能,对私有云环境中的所有计算机进行分组;S3,监测私有云环境中所有计算机的运行状态;S4,当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。私有云环境中有很多台计算机,当其中有计算机宕机时,将该宕机计算机上的计算数据迁移到该私有云环境中的空闲计算机上,使得整个私有云环境下的数据计算运行不会受到影响,在查找空闲计算机时,分组进行查找,使得查找过程有条不紊。
Description
技术领域
本发明涉及计算机领域,具体涉及一种故障计算机的处理方法及处理系统。
背景技术
当私有云中某台计算机宕机(即死机)之后,需要将宕机计算机上运行的计算数据迁移到其他正常运行的计算机上,即进行故障计算机的切换。目前采用的故障计算机切换方案为:在私有云环境中所有正常运行的计算机中随机选择一台空闲的计算机,将宕机计算机上的应用程序迁移到该随机选择的空闲计算机上。
发明内容
本发明提供了一种故障计算机的处理方法及处理系统,能够克服现有技术的缺陷。
本发明解决上述技术问题的技术方案如下:提供了一种故障计算机的处理方法,包括:
S1,从私有云环境中的所有计算机中配置一台作为主机,其它的作为从机;
S2,根据计算机的性能,对私有云环境中的所有计算机进行分组;
S3,监测私有云环境中所有计算机的运行状态;
S4,当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。
为了解决本发明的技术问题,还提供了一种故障计算机的处理系统,包括:
配置模块,用于从私有云环境中的所有计算机中配置一台作为主机,其它的作为从机;
分组模块,用于根据计算机的性能,对私有云环境中的所有计算机进行分组;
运行状态监测模块,用于监测私有云环境中所有计算机的运行状态;
数据迁移模块,用于当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。
本发明的有益效果为:私有云环境中有很多台计算机,当其中有计算机宕机时,将该宕机计算机上的计算数据迁移到该私有云环境中的空闲计算机上,使得整个私有云环境下的数据计算运行不会受到影响,在查找空闲计算机时,分组进行查找,使得查找过程有条不紊。
附图说明
图1为实施例1的一种故障计算机的处理方法流程图;
图2为实施例2的一种故障计算机的处理系统框图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
实施例1、一种故障计算机的处理方法。
参见图1,本实施例提供的一种故障计算机的处理方法包括:
S1,从私有云环境中的所有计算机中配置一台作为主机,其它的作为从机;
S2,根据计算机的性能,对私有云环境中的所有计算机进行分组;
S3,监测私有云环境中所有计算机的运行状态;
S4,当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。
下面对上述步骤进行具体说明。
很多台计算机组成私有云环境,从整个私有云环境中配置一台作为主机,用来起管理作用,其它的为从机。根据各计算机的性能,将所有的计算机分成若干组,同一组中的计算机的性能差距要比不同组计算机之间的性能差距要小,即同一组中的计算机的性能相差较小,将私有云环境中的所有计算机按照计算性能进行分组,方便对每一台计算机的数据的分配,将分块后的相同大小的数据块尽量分配给同一组的计算机。
分配完成后,主机用来监测私有云环境中的每一台计算机的运行状态,当计算机出现宕机时,触发宕机报警提示。此时,上述步骤S4分为以下几种处理方式:第一种,当主机监测到宕机计算机所在组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,当监测到宕机计算机所在组的多台计算机空闲时,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。将宕机计算机上的计算数据迁移到性能比较好的计算机上,使得整个计算数据的过程更快完成。
第二种,当监测到宕机计算机所属组外的其它组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于同一组,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
第三种,当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于多个组,则从所述多个组中找到最大计算性能的组,并从该组中找到性能最佳的计算机,将宕机计算机上的计算数据迁移到该计算机。
实施例2、一种故障计算机的处理系统。
参见图2,本实施例提供的故障计算机的处理系统包括一个主机1和多个从机2,主机1为私有云环境中的一台,其它的为从机2,所述主机1包括分组模块11、运行状态监测模块12、数据迁移模块13和报警触发模块14。
其中,分组模块11,用于根据计算机的性能,对私有云环境中的所有计算机进行分组;
运行状态监测模块12,用于监测私有云环境中所有计算机的运行状态;
数据迁移模块13,用于当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。
报警触发模块14,用于当监测到宕机计算机时,触发宕机报警提示。
所述数据迁移模块13具体用于:
当监测到宕机计算机所在组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所在组的多台计算机空闲时,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
所述数据迁移模块13还具体用于:
当监测到宕机计算机所属组外的其它组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于同一组,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
所述数据迁移模块13还具体用于:
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于多个组,则从所述多个组中找到最大计算性能的组,并从该组中找到性能最佳的计算机,将宕机计算机上的计算数据迁移到该计算机。
本发明公开的一种故障计算机的处理方法及处理系统,私有云环境中有很多台计算机,当其中有计算机宕机时,将该宕机计算机上的计算数据迁移到该私有云环境中的空闲计算机上,使得整个私有云环境下的数据计算运行不会受到影响,在查找空闲计算机时,分组进行查找,使得查找过程有条不紊。
在本说明书的描述中,参考术语“实施例一”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体方法、装置或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、方法、装置或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种故障计算机的处理方法,其特征在于,包括以下步骤:
S1,从私有云环境中的所有计算机中配置一台作为主机,其它的作为从机;
S2,根据计算机的性能,对私有云环境中的所有计算机进行分组;
S3,监测私有云环境中所有计算机的运行状态;
S4,当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。
2.如权利要求1所述的一种故障计算机的处理方法,其特征在于,所述步骤S4具体包括:
当监测到宕机计算机所在组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所在组的多台计算机空闲时,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
3.如权利要求1所述的一种故障计算机的处理方法,其特征在于,所述步骤S4具体包括:
当监测到宕机计算机所属组外的其它组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于同一组,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
4.如权利要求3所述的一种故障计算机的处理方法,其特征在于,所述步骤S4具体包括:
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于多个组,则从所述多个组中找到最大计算性能的组,并从该组中找到性能最佳的计算机,将宕机计算机上的计算数据迁移到该计算机。
5.如权利要求1-4任一项所述的一种故障计算机的处理方法,其特征在于,当监测到宕机计算机时,触发宕机报警提示。
6.一种故障计算机的处理系统,其特征在于,包括:
配置模块,用于从私有云环境中的所有计算机中配置一台作为主机,其它的作为从机;
分组模块,用于根据计算机的性能,对私有云环境中的所有计算机进行分组;
运行状态监测模块,用于监测私有云环境中所有计算机的运行状态;
数据迁移模块,用于当监测到计算机宕机时,对私有云中所有的计算机按照分组进行查找,查找到空闲计算机,将宕机计算机上的计算数据迁移到该空闲计算机。
7.如权利要求6所述的一种故障计算机的处理系统,其特征在于,所述数据迁移模块具体用于:
当监测到宕机计算机所在组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所在组的多台计算机空闲时,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
8.如权利要求6所述的一种故障计算机的处理系统,其特征在于,所述数据迁移模块具体用于:
当监测到宕机计算机所属组外的其它组的一台计算机空闲时,将宕机计算机上的计算数据迁移到该空闲计算机;或者,
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于同一组,将宕机计算机上的计算数据迁移到所述多台计算机中空闲空间最大的计算机上。
9.如权利要求8所述的一种故障计算机的处理系统,其特征在于,所述数据迁移模块具体用于:
当监测到宕机计算机所属组外的其它组的多台计算机空闲时,该多台计算机属于多个组,则从所述多个组中找到最大计算性能的组,并从该组中找到性能最佳的计算机,将宕机计算机上的计算数据迁移到该计算机。
10.如权利要求6-9任一项所述的一种故障计算机的处理系统,其特征在于,还包括:
报警触发模块,用于当监测到宕机计算机时,触发宕机报警提示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610741305.7A CN106357427A (zh) | 2016-08-26 | 2016-08-26 | 一种故障计算机的处理方法及处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610741305.7A CN106357427A (zh) | 2016-08-26 | 2016-08-26 | 一种故障计算机的处理方法及处理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106357427A true CN106357427A (zh) | 2017-01-25 |
Family
ID=57855264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610741305.7A Pending CN106357427A (zh) | 2016-08-26 | 2016-08-26 | 一种故障计算机的处理方法及处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106357427A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108345519A (zh) * | 2018-01-31 | 2018-07-31 | 河南职业技术学院 | 计算机硬盘故障的处理方法及装置 |
CN109766209A (zh) * | 2019-01-10 | 2019-05-17 | 广州科技贸易职业学院 | 一种提高云计算环境稳定性的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101072133A (zh) * | 2007-05-23 | 2007-11-14 | 华中科技大学 | 一种基于对等网络的高性能计算系统 |
CN105208078A (zh) * | 2015-08-13 | 2015-12-30 | 飞狐信息技术(天津)有限公司 | 一种文件存储系统及方法 |
CN105487946A (zh) * | 2015-11-30 | 2016-04-13 | 北京四达时代软件技术股份有限公司 | 一种故障计算机自动切换方法及装置 |
-
2016
- 2016-08-26 CN CN201610741305.7A patent/CN106357427A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101072133A (zh) * | 2007-05-23 | 2007-11-14 | 华中科技大学 | 一种基于对等网络的高性能计算系统 |
CN105208078A (zh) * | 2015-08-13 | 2015-12-30 | 飞狐信息技术(天津)有限公司 | 一种文件存储系统及方法 |
CN105487946A (zh) * | 2015-11-30 | 2016-04-13 | 北京四达时代软件技术股份有限公司 | 一种故障计算机自动切换方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108345519A (zh) * | 2018-01-31 | 2018-07-31 | 河南职业技术学院 | 计算机硬盘故障的处理方法及装置 |
CN109766209A (zh) * | 2019-01-10 | 2019-05-17 | 广州科技贸易职业学院 | 一种提高云计算环境稳定性的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101554113B1 (ko) | 장치 집합체에서 리소스 활용의 최적화 | |
EP3014446B1 (en) | Asynchronous message passing for large graph clustering | |
TWI669620B (zh) | Database switching method, server, storage medium, electronic device and product | |
CN103812949B (zh) | 一种面向实时云平台的任务调度与资源分配方法及系统 | |
CN107220123A (zh) | 一种解决Spark数据倾斜方法及系统 | |
US9641431B1 (en) | System and methods for utilization-based balancing of traffic to an information retrieval system | |
CN105071994B (zh) | 一种海量数据监控系统 | |
CN105162632A (zh) | 一种服务器集群故障自动处理系统 | |
CN103297543A (zh) | 一种基于计算机集群作业调度的方法 | |
CN104123183B (zh) | 集群作业调度方法和装置 | |
CN106936620B (zh) | 一种告警事件的处理方法和处理装置 | |
CN103433926A (zh) | 一种多机器人协调控制装置及其方法 | |
CN105897507A (zh) | 节点设备的状态检测方法和装置 | |
CN102158364A (zh) | 一种基于时间片调度的设备轮询方法和装置 | |
CN105007294A (zh) | 输变电设备状态监测大数据快速接收和分发系统 | |
CN103441878B (zh) | Vcf网络中pe设备的归属处理方法及设备 | |
CN103746838A (zh) | 一种无中心节点计算机网络的任务调度方法 | |
CN106357427A (zh) | 一种故障计算机的处理方法及处理系统 | |
CN105243125A (zh) | PrestoDB集群的运行方法、装置、集群及查询数据方法和装置 | |
CN104281636A (zh) | 海量报表数据并发分布式处理方法 | |
CN105487946B (zh) | 一种故障计算机自动切换方法及装置 | |
CN106156049A (zh) | 一种数据读取的方法和系统 | |
CN103095739A (zh) | 机柜服务器系统及其节点通信方法 | |
CN104468810A (zh) | 一种基于龙芯平台的高性能计算资源监控实现方法 | |
CN105227353A (zh) | 一种mysql集群实现方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170125 |
|
RJ01 | Rejection of invention patent application after publication |