CN105335256A - 在整机柜服务器中切换备份磁盘的方法、装置和系统 - Google Patents

在整机柜服务器中切换备份磁盘的方法、装置和系统 Download PDF

Info

Publication number
CN105335256A
CN105335256A CN201410400902.4A CN201410400902A CN105335256A CN 105335256 A CN105335256 A CN 105335256A CN 201410400902 A CN201410400902 A CN 201410400902A CN 105335256 A CN105335256 A CN 105335256A
Authority
CN
China
Prior art keywords
disk
server node
backup
whole machine
machine cabinet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410400902.4A
Other languages
English (en)
Other versions
CN105335256B (zh
Inventor
赖培源
樊勇兵
刘艺
陈天
陈楠
秦润锋
丁圣勇
黄志兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201410400902.4A priority Critical patent/CN105335256B/zh
Publication of CN105335256A publication Critical patent/CN105335256A/zh
Application granted granted Critical
Publication of CN105335256B publication Critical patent/CN105335256B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种在整机柜服务器中切换备份磁盘的方法、装置和系统。其中在切换备份磁盘的方法中,当发现整机柜服务器中服务器节点的磁盘出现故障时,判断服务器节点是否需要热备份;若判断服务器节点需要热备份,则为服务器节点选择相应的备份磁盘;开启服务器节点与备份磁盘之间的通信链路,以便服务器节点利用备份磁盘进行数据的复制备份。从而可有效提高整机柜内服务器节点的磁盘故障恢复效率,扩展管理功能。

Description

在整机柜服务器中切换备份磁盘的方法、装置和系统
技术领域
本发明涉及计算机领域,特别涉及一种在整机柜服务器中切换备份磁盘的方法、装置和系统。
背景技术
随着网络技术的不断发展,互联网和局域网在人们的工作和生活中得到了广泛的应用,服务器系统作为整个网络运行的基石,发挥着举足轻重的作用,而作为一种新兴的服务器技术,整机柜服务器系统已经成为计算机服务器系统领域的研究热点。
整机柜服务器系统是一种新兴的计算节点技术。整机柜服务器系统是一种包含机柜,并由多个子系统构成的统一的模块化服务器管理系统,所述子系统包括机柜子系统、散热子系统、网络子系统、供电子系统、节点子系统以及管理子系统等。整机柜服务器系统通过统一供电、统一散热、统一调控的方式,对服务器实现集中管理,大大降低了服务器的管理成本。
整机柜服务器的出现,是计算机服务器领域的一个重要里程碑,它标志着计算机服务器集中管理模式的起步。目前的整机柜服务器集中管理已在服务器单元或其外部构件上实现,像机柜集中存放服务器单元、统一供电、统一散热等。
目前,整机柜服务器系统的管理系统主要是对硬件层面的管理,包括对各个节点的运行状态、温度等信息的采集,以及基于监控信息对硬件系统的控制,如风扇的转速等,暂不支持集中数据备份功能,在进行节点的部署时,需逐一对每台服务器节点配置备份硬盘,造成资源浪费且管理效率不高。在芯片技术快速发展的今天,管理模块的处理能力已远远超出了监控层面的任务量。
随着业务应用的需求不断增长,尤其是在集群系统中,服务器节点的数据冗余备份需求非常广泛,且可靠性要求也随着增大。而同时随着硬盘技术的发展与成熟,节点硬盘的故障率也呈下降趋势,这种动态的环境要求服务器系统能够使用性价比更高的环境,且要求冗余资源能更加灵活、快速、动态的按需分配。因此,服务器架构还需要进行进一步的整合,实现整机柜服务器系统的磁盘冗余备份是十分必要的。
发明内容
本发明实施例提供一种在整机柜服务器中切换备份磁盘的方法、装置和系统,可有效提高整机柜内服务器节点的磁盘故障恢复效率,扩展管理功能。
根据本发明的一个方面,提供一种在整机柜服务器中切换备份磁盘的方法,包括:
当发现整机柜服务器中服务器节点的磁盘出现故障时,判断所述服务器节点是否需要热备份;
若判断所述服务器节点需要热备份,则在本地的备份磁盘集中为所述服务器节点选择相应的备份磁盘;
开启所述服务器节点与所述备份磁盘之间的通信链路,以便所述服务器节点利用所述备份磁盘进行数据的复制备份。
在一个实施例中,开启所述服务器节点与所述备份磁盘之间的通信链路的步骤包括:
通过背板网络开启所述服务器节点的磁盘簇JBOD与所述备份磁盘之间的通信链路。
在一个实施例中,为所述服务器节点选择相应的备份磁盘的步骤包括:
查询整机柜服务器当前使用磁盘的参数;
确定当前使用磁盘的最小参数;
在磁盘冗余阵列中选择与所述最小参数相匹配的冗余磁盘,作为所述服务器节点的备份磁盘。
在一个实施例中,所述参数包括磁盘的转速和容量、磁盘接口速率。
在一个实施例中,当接收到所述服务器节点发送的故障磁盘恢复通知后,切断所述服务器节点与所述备份磁盘之间的通信链路;其中所述服务器节点在故障磁盘恢复工作状态后,与恢复工作状态的磁盘进行数据同步,然后发送所述故障磁盘恢复通知。
在一个实施例中,切断所述服务器节点与所述备份磁盘之间的通信链路的步骤包括:
通过背板网络切断所述服务器节点的JBOD与所述备份磁盘之间的通信链路。
在一个实施例中,当发现整机柜服务器中服务器节点的磁盘出现故障时,判断所述服务器节点是否需要热备份的步骤包括:
对整机柜服务器中的服务器节点进行轮询;
若发现整机柜服务器中服务器节点的磁盘出现故障,则判断所述服务器节点是否需要热备份。
在一个实施例中,当发现整机柜服务器中服务器节点的磁盘出现故障时,判断所述服务器节点是否需要热备份的步骤包括:
当接收到整机柜服务器中的服务器节点上报的磁盘故障通知时,判断所述服务器节点是否需要热备份,其中整机柜服务器中的服务器节点在磁盘出现故障时上报所述磁盘故障通知。
根据本发明的另一方面,提供一种在整机柜服务器中切换备份磁盘的管理控制装置,包括监控单元、备份磁盘选择单元、磁盘连接单元和备份磁盘集,备份磁盘集中包括至少一个备份磁盘,其中:
监控单元,用于在发现整机柜服务器中服务器节点的磁盘出现故障时,判断所述服务器节点是否需要热备份;
备份磁盘选择单元,用于根据监控单元的判断结果,若判断所述服务器节点需要热备份,则从备份磁盘集中为所述服务器节点选择相应的备份磁盘;
磁盘连接单元,用于开启所述服务器节点与所述备份磁盘之间的通信链路,以便所述服务器节点利用所述备份磁盘进行数据的复制备份。
在一个实施例中,磁盘连接单元具体通过背板网络开启所述服务器节点的磁盘簇JBOD与所述备份磁盘之间的通信链路。
在一个实施例中,备份磁盘选择单元具体查询整机柜服务器当前使用磁盘的参数,确定当前使用磁盘的最小参数,在磁盘冗余阵列中选择与所述最小参数相匹配的冗余磁盘,作为所述服务器节点的备份磁盘。
在一个实施例中,所述参数包括磁盘的转速和容量、磁盘接口速率。
在一个实施例中,管理控制装置还包括资源回收单元,其中:
资源回收单元,用于当监控单元接收到所述服务器节点发送的故障磁盘恢复通知后,切断所述服务器节点与所述备份磁盘之间的通信链路;其中所述服务器节点在故障磁盘恢复工作状态后,与恢复工作状态的磁盘进行数据同步,然后发送所述故障磁盘恢复通知。
在一个实施例中,资源回收单元具体通过背板网络切断所述服务器节点的JBOD与所述备份磁盘之间的通信链路。
在一个实施例中,监控单元具体对整机柜服务器中的服务器节点进行轮询,若发现整机柜服务器中服务器节点的磁盘出现故障,则判断所述服务器节点是否需要热备份。
在一个实施例中,监控单元具体在接收到整机柜服务器中的服务器节点上报的磁盘故障通知时,判断所述服务器节点是否需要热备份,其中整机柜服务器中的服务器节点在磁盘出现故障时上报所述磁盘故障通知。
根据本发明的另一方面,提供一种在整机柜服务器中切换备份磁盘的整机柜服务器,包括管理控制装置和服务器节点,其中:
管理控制装置,为上述任一实施例涉及的管理控制装置;
服务器节点,用于在与备份磁盘之间的通信链路开启后,进行数据的复制备份。
在一个实施例中,服务器节点具有磁盘簇JBOD;
服务器节点具体在JBOD通过背板网络与备份磁盘之间的通信链路开启后,进行数据的复制备份。
在一个实施例中,服务器节点还用于在故障磁盘恢复工作状态后,与恢复工作状态的磁盘进行数据同步,然后向管理控制装置发送故障磁盘恢复通知。
在一个实施例中,服务器节点还用于在与恢复工作状态的磁盘进行数据同步后,将备份磁盘格式化,然后执行向管理控制装置发送故障磁盘恢复通知的操作。
本发明通过在检测到整机柜服务器中的服务器节点出现磁盘故障时,及时给服务器节点分配备份磁盘以完成数据的复制备份,从而可有效提高整机柜内服务器节点的磁盘故障恢复效率,扩展管理功能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明切换备份磁盘的方法一个实施例的示意图。
图2为本发明管理控制装置一个实施例的示意图。
图3为本发明管理控制装置另一实施例的示意图。
图4为本发明切换备份磁盘的系统一个实施例的示意图。
图5为本发明备份磁盘切换的流程示意图。
图6为实施本发明的配置架构一个实施例的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1为本发明在整机柜服务器中切换备份磁盘的方法一个实施例的示意图。优选的,本实施例的方法步骤可由管理控制装置执行。
步骤101,当发现整机柜服务器中服务器节点的磁盘出现故障时,判断所述服务器节点是否需要热备份。
例如,可通过服务器节点主动上报或者轮询的方式进行监控。
优选的,可对整机柜服务器中的服务器节点进行轮询。若发现整机柜服务器中服务器节点的磁盘出现故障,则判断所述服务器节点是否需要热备份。
优选的,当接收到整机柜服务器中的服务器节点上报的磁盘故障通知时,判断所述服务器节点是否需要热备份,其中整机柜服务器中的服务器节点在磁盘出现故障时上报所述磁盘故障通知。
步骤102,若判断所述服务器节点需要热备份,则在本地的备份磁盘集中为所述服务器节点选择相应的备份磁盘。
这里,可参考“木桶原则”来选择备份磁盘的参数,其中参数可以是转速和容量、磁盘接口速率,但不限于此。木桶原则是指一个水桶无论有多高,它盛水的高度取决于其中最低的那块木板。例如,对于整机柜服务器来说,若采用的硬盘容量不同,则各硬盘只能发挥出其容量最低硬盘的效果,而多余的硬盘存储空间就会受到影响而发挥不出来。
为此,通过查询整机柜服务器当前使用磁盘的参数,确定当前使用磁盘的最小参数,在磁盘冗余阵列中选择与所述最小参数相匹配的冗余磁盘,作为所述服务器节点的备份磁盘。
通过上述处理,可在避免机柜存储资源浪费的情况下,确保系统性能不因备份磁盘切换而下降。
步骤103,开启所述服务器节点与所述备份磁盘之间的通信链路,以便所述服务器节点利用所述备份磁盘进行数据的复制备份。
优选的,可通过背板网络开启所述服务器节点的磁盘簇JBOD与所述备份磁盘之间的通信链路。
基于本发明上述实施例提供的用于切换备份磁盘的方法,通过在检测到整机柜服务器中的服务器节点出现磁盘故障时,及时给服务器节点分配备份磁盘以完成数据的复制备份,从而可有效提高整机柜内服务器节点的磁盘故障恢复效率,扩展管理功能。
在一个实施例中,当接收到所述服务器节点发送的故障磁盘恢复通知后,切断所述服务器节点与所述备份磁盘之间的通信链路;其中所述服务器节点在故障磁盘恢复工作状态后,与恢复工作状态的磁盘进行数据同步,然后发送所述故障磁盘恢复通知。
优选的,可通过背板网络切断所述服务器节点的JBOD与所述备份磁盘之间的通信链路。
即,在故障磁盘更换后,完成数据的写入和机柜存储资源的释放。
图2为本发明管理控制装置一个实施例的示意图。如图2所示,管理控制装置可包括监控单元201、备份磁盘选择单元202、磁盘连接单元203和备份磁盘集204,其中备份磁盘集204中包括至少一个备份磁盘。其中:
监控单元201,用于在发现整机柜服务器中服务器节点的磁盘出现故障时,判断所述服务器节点是否需要热备份。
在一个实施例中,监控单元201可对整机柜服务器中的服务器节点进行轮询,若发现整机柜服务器中服务器节点的磁盘出现故障,则进一步判断所述服务器节点是否需要热备份。
在另一实施例中,监控单元201可在接收到整机柜服务器中的服务器节点上报的磁盘故障通知时,判断所述服务器节点是否需要热备份,其中整机柜服务器中的服务器节点在磁盘出现故障时上报所述磁盘故障通知。
备份磁盘选择单元202,用于根据监控单元201的判断结果,若判断所述服务器节点需要热备份,则从备份磁盘集中为所述服务器节点选择相应的备份磁盘。
优选的,备份磁盘选择单元202具体查询整机柜服务器当前使用磁盘的参数,确定当前使用磁盘的最小参数,在磁盘冗余阵列中选择与所述最小参数相匹配的冗余磁盘,作为所述服务器节点的备份磁盘。其中,所述参数可包括但不局限于磁盘的转速和容量、磁盘接口速率。
磁盘连接单元203,用于开启所述服务器节点与所述备份磁盘之间的通信链路,以便所述服务器节点利用所述备份磁盘进行数据的复制备份。
优选的,磁盘连接单元203可通过背板网络开启所述服务器节点的JBOD与所述备份磁盘之间的通信链路。
优选的,磁盘连接单元203可以为SAS交换机。
基于本发明上述实施例提供的用于切换备份磁盘的管控控制装置,通过在检测到整机柜服务器中的服务器节点出现磁盘故障时,及时给服务器节点分配备份磁盘以完成数据的复制备份,从而可有效提高整机柜内服务器节点的磁盘故障恢复效率,扩展管理功能。
图3为本发明管理控制装置另一实施例的示意图。与图2所示实施例相比,在图3所示实施例中,管控控制装置还包括资源回收单元301。其中:
资源回收单元301,用于当监控单元201接收到所述服务器节点发送的故障磁盘恢复通知后,切断所述服务器节点与所述备份磁盘之间的通信链路。
优选的,资源回收单元301可通过背板网络切断所述服务器节点的JBOD与所述备份磁盘之间的通信链路。
其中所述服务器节点在故障磁盘恢复工作状态后,与恢复工作状态的磁盘进行数据同步,然后发送所述故障磁盘恢复通知。
图4为本发明用于切换备份磁盘的系统一个实施例的示意图。如图4所示,系统包括管理控制装置401和服务器节点402,其中:
管理控制装置401为图2或图3中任一实施例涉及的管理控制装置。
服务器节点402用于在与备份磁盘之间的通信链路开启后,进行数据的复制备份。
优选的,服务器节点可具有磁盘簇JBOD。服务器节点可在JBOD通过背板网络与备份磁盘之间的通信链路开启后,进行数据的复制备份。
基于本发明上述实施例提供的用于切换备份磁盘的系统,通过在检测到整机柜服务器中的服务器节点出现磁盘故障时,及时给服务器节点分配备份磁盘以完成数据的复制备份,从而可有效提高整机柜内服务器节点的磁盘故障恢复效率,扩展管理功能。
该系统进行的备份磁盘切换流程如图5所示。
步骤501,管理控制装置检测整机柜服务器中服务器节点的磁盘是否出现故障。
步骤502,当发现整机柜服务器中服务器节点的磁盘出现故障时,
管理控制装置判断所述服务器节点是否需要热备份。
步骤503,若判断所述服务器节点需要热备份,则管理控制装置为所述服务器节点选择相应的备份磁盘。
步骤504,管理控制装置通过背板网络开启所述服务器节点的JBOD与所述备份磁盘之间的通信链路。
步骤505,服务器节点利用所述备份磁盘进行数据的复制备份。
步骤506,当故障磁盘恢复后,服务器节点与恢复工作状态的磁盘进行数据同步。
步骤507,服务器节点将备份磁盘格式化。
步骤508,服务器节点向管理控制装置发送故障磁盘恢复通知。
步骤509,管理控制装置通过背板网络切断服务器节点的JBOD与备份磁盘之间的通信链路,以便回收存储资源。
下面通过具体示例对本发明进行说明,相应的配置架构如图6所示。
首先,管理员可以根据机柜的磁盘数量、容量及转速等参数选择备份磁盘的数量和规格。例如整机柜中有40台服务器,每个服务器节点中有8个硬盘,其中前10个节点(标注为A1~A10)的硬盘配置为8个硬盘作一个冗余阵列,后30个节点(标注为B1~B30)则将每台服务器节点的硬盘分为两组,每4个硬盘作为一个阵列。假设前10台的硬盘转速为10000转/每分钟,容量为1TB;后30台的硬盘转速为7200转/每分钟,容量为3TB。参考“木桶原则”及系统可靠性等级要求,假设可靠性要求一般,在总磁盘数320个硬盘的环境下,可设置6个备份磁盘,且其中2个为转速10000的3TB磁盘(标注为x1,x2),4个为7200(标注为y1~y4)的3TB磁盘。这样的情况下所有备份磁盘均可以作为数量最多的7200转/每分钟硬盘的备份盘。
所有服务器的硬盘连接器,例如JBOD(JustaBunchOfDisks,磁盘簇),以及这些备份磁盘都通过机柜的背板网络连接到整机柜管理控制装置上的磁盘连接器,例如为SAS交换机,或者是一个连接若干个SAS硬盘接口的矩阵电路,能按需控制JBOD和备份磁盘的链路状态。
在服务器组建磁盘阵列时,通常需要指定一个或若干个备份硬盘,此时,服务器节点可向整机柜管理控制装置发出备份磁盘请求,当管理控制装置收到服务器指定备份磁盘时,为该服务器指定一个或多个备份磁盘,但指定的磁盘并不立即分配给服务器使用,而是当服务器硬盘发生故障时,才进行实际读写权限的分配。例如可为A5节点指定x1和x2作为备份盘,为节点B8指定x1和y1作为备份盘。
当节点A5的硬盘发生故障时,节点A5首先通知整机柜管理控制装置,有一个转速为10000转/每分钟,容量为1TB的硬盘故障,需要备份盘。
整机柜管理控制装置在收到资源请求信息后,查找目前可用的备份磁盘,选择满足要求的x1作为备份盘,并通知磁盘连接模块开通服务器A5的JBOD与x1的链路,A5节点在检测到新硬件连接后,将硬盘x1作为其本地资源进行管理,启动数据的备份。
当管理员更换A5原先的故障硬盘后,A5检测到硬盘状态的变化后,启动新硬盘和备份盘的数据同步,在同步后进行阵列关系的切换,然后对备份盘进行格式化。最后通知整机柜管理控制装置回收备份硬盘。
整机柜在收到回收资源信息后,通知磁盘连接模块断开服务器A5的JBOD与x1的逻辑链路,并将x1标注为可用资源。
通过实施本发明,在整机柜服务器中,通过在管理控制装置中设置备份磁盘集,在服务器节点的磁盘出现故障时,在备份磁盘集中选择相应的备份磁盘,通过SAS交换机和背板网络与该服务器节点的JBOD连接,从而为服务器节点提供磁盘冗余服务,当该服务器节点的磁盘修复后,SAS交换机断开备份磁盘与服务器节点的JBOD之间的连接,从而可提供存储资源的使用效率。由于服务器节点的磁盘不总是出现故障的,因此备份磁盘集中的备份磁盘数量可少于服务器节点数,从而可减小系统的配置成本。
通过实施本发明,可在检测到整机柜服务器中的服务器节点出现磁盘故障时,及时给服务器节点分配备份磁盘以完成数据的复制备份。在硬盘更换后,完成数据的写入和机柜存储资源的释放。由此可以提高整机柜内服务器节点的硬盘故障恢复效率,扩展管理功能。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims (20)

1.一种在整机柜服务器中切换备份磁盘的方法,其特征在于,包括:
当发现整机柜服务器中服务器节点的磁盘出现故障时,判断所述服务器节点是否需要热备份;
若判断所述服务器节点需要热备份,则在本地的备份磁盘集中为所述服务器节点选择相应的备份磁盘;
开启所述服务器节点与所述备份磁盘之间的通信链路,以便所述服务器节点利用所述备份磁盘进行数据的复制备份。
2.根据权利要求1所述的方法,其特征在于,开启所述服务器节点与所述备份磁盘之间的通信链路的步骤包括:
通过背板网络开启所述服务器节点的磁盘簇JBOD与所述备份磁盘之间的通信链路。
3.根据权利要求1所述的方法,其特征在于,还包括:
为所述服务器节点选择相应的备份磁盘的步骤包括:
查询整机柜服务器当前使用磁盘的参数;
确定当前使用磁盘的最小参数;
在磁盘冗余阵列中选择与所述最小参数相匹配的冗余磁盘,作为所述服务器节点的备份磁盘。
4.根据权利要求3所述的方法,其特征在于,还包括:
所述参数包括磁盘的转速和容量、磁盘接口速率。
5.根据权利要求1-4中任一项所述的方法,其特征在于,还包括:
当接收到所述服务器节点发送的故障磁盘恢复通知后,切断所述服务器节点与所述备份磁盘之间的通信链路;其中所述服务器节点在故障磁盘恢复工作状态后,与恢复工作状态的磁盘进行数据同步,然后发送所述故障磁盘恢复通知。
6.根据权利要求5所述的方法,其特征在于,切断所述服务器节点与所述备份磁盘之间的通信链路的步骤包括:
通过背板网络切断所述服务器节点的JBOD与所述备份磁盘之间的通信链路。
7.根据权利要求1-4中任一项所述的方法,其特征在于,
当发现整机柜服务器中服务器节点的磁盘出现故障时,判断所述服务器节点是否需要热备份的步骤包括:
对整机柜服务器中的服务器节点进行轮询;
若发现整机柜服务器中服务器节点的磁盘出现故障,则判断所述服务器节点是否需要热备份。
8.根据权利要求1-4中任一项所述的方法,其特征在于,
当发现整机柜服务器中服务器节点的磁盘出现故障时,判断所述服务器节点是否需要热备份的步骤包括:
当接收到整机柜服务器中的服务器节点上报的磁盘故障通知时,判断所述服务器节点是否需要热备份,其中整机柜服务器中的服务器节点在磁盘出现故障时上报所述磁盘故障通知。
9.一种在整机柜服务器中切换备份磁盘的管理控制装置,其特征在于,包括监控单元、备份磁盘选择单元、磁盘连接单元和备份磁盘集,备份磁盘集中包括至少一个备份磁盘,其中:
监控单元,用于在发现整机柜服务器中服务器节点的磁盘出现故障时,判断所述服务器节点是否需要热备份;
备份磁盘选择单元,用于根据监控单元的判断结果,若判断所述服务器节点需要热备份,则从备份磁盘集中为所述服务器节点选择相应的备份磁盘;
磁盘连接单元,用于开启所述服务器节点与所述备份磁盘之间的通信链路,以便所述服务器节点利用所述备份磁盘进行数据的复制备份。
10.根据权利要求9所述的管理控制装置,其特征在于,
磁盘连接单元具体通过背板网络开启所述服务器节点的磁盘簇JBOD与所述备份磁盘之间的通信链路。
11.根据权利要求9所述的管理控制装置,其特征在于,
备份磁盘选择单元具体查询整机柜服务器当前使用磁盘的参数,确定当前使用磁盘的最小参数,在磁盘冗余阵列中选择与所述最小参数相匹配的冗余磁盘,作为所述服务器节点的备份磁盘。
12.根据权利要求11所述的管理控制装置,其特征在于,
所述参数包括磁盘的转速和容量、磁盘接口速率。
13.根据权利要求9-12中任一项所述的管理控制装置,其特征在于,还包括资源回收单元,其中:
资源回收单元,用于当监控单元接收到所述服务器节点发送的故障磁盘恢复通知后,切断所述服务器节点与所述备份磁盘之间的通信链路;其中所述服务器节点在故障磁盘恢复工作状态后,与恢复工作状态的磁盘进行数据同步,然后发送所述故障磁盘恢复通知。
14.根据权利要求13所述的管理控制装置,其特征在于,
资源回收单元具体通过背板网络切断所述服务器节点的JBOD与所述备份磁盘之间的通信链路。
15.根据权利要求9-12中任一项所述的管理控制装置,其特征在于,
监控单元具体对整机柜服务器中的服务器节点进行轮询,若发现整机柜服务器中服务器节点的磁盘出现故障,则判断所述服务器节点是否需要热备份。
16.根据权利要求9-12中任一项所述的管理控制装置,其特征在于,
监控单元具体在接收到整机柜服务器中的服务器节点上报的磁盘故障通知时,判断所述服务器节点是否需要热备份,其中整机柜服务器中的服务器节点在磁盘出现故障时上报所述磁盘故障通知。
17.一种在整机柜服务器中切换备份磁盘的整机柜服务器,其特征在于,包括管理控制装置和服务器节点,其中:
管理控制装置,为权利要求9-16中任一项涉及的管理控制装置;
服务器节点,用于在与备份磁盘之间的通信链路开启后,进行数据的复制备份。
18.根据权利要求17所述的整机柜服务器,其特征在于,
服务器节点具有磁盘簇JBOD;
服务器节点具体在JBOD通过背板网络与备份磁盘之间的通信链路开启后,进行数据的复制备份。
19.根据权利要求17所述的整机柜服务器,其特征在于,
服务器节点还用于在故障磁盘恢复工作状态后,与恢复工作状态的磁盘进行数据同步,然后向管理控制装置发送故障磁盘恢复通知。
20.根据权利要求19所述的整机柜服务器,其特征在于,
服务器节点还用于在与恢复工作状态的磁盘进行数据同步后,将备份磁盘格式化,然后执行向管理控制装置发送故障磁盘恢复通知的操作。
CN201410400902.4A 2014-08-15 2014-08-15 在整机柜服务器中切换备份磁盘的方法、装置和系统 Active CN105335256B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410400902.4A CN105335256B (zh) 2014-08-15 2014-08-15 在整机柜服务器中切换备份磁盘的方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410400902.4A CN105335256B (zh) 2014-08-15 2014-08-15 在整机柜服务器中切换备份磁盘的方法、装置和系统

Publications (2)

Publication Number Publication Date
CN105335256A true CN105335256A (zh) 2016-02-17
CN105335256B CN105335256B (zh) 2019-01-15

Family

ID=55285811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410400902.4A Active CN105335256B (zh) 2014-08-15 2014-08-15 在整机柜服务器中切换备份磁盘的方法、装置和系统

Country Status (1)

Country Link
CN (1) CN105335256B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326038A (zh) * 2016-08-22 2017-01-11 浪潮(北京)电子信息产业有限公司 一种热备空间的选择方法及系统
CN107526651A (zh) * 2016-06-21 2017-12-29 深圳中电长城信息安全系统有限公司 一种磁盘阵列备份的方法和系统
CN107577580A (zh) * 2017-09-18 2018-01-12 郑州云海信息技术有限公司 一种机箱管理系统及方法
CN108052421A (zh) * 2017-12-13 2018-05-18 郑州云海信息技术有限公司 一种基于存储多重冗余架构的整机系统
CN108153622A (zh) * 2016-12-06 2018-06-12 华为技术有限公司 一种故障处理的方法、装置和设备
CN110399098A (zh) * 2019-06-25 2019-11-01 联想(北京)有限公司 一种数据处理方法及电子设备
CN110838337A (zh) * 2018-08-17 2020-02-25 纬颖科技服务股份有限公司 数据储存系统的控制方法、数据储存模块、电脑程序产品
CN113094224A (zh) * 2019-12-20 2021-07-09 中移全通系统集成有限公司 服务器资产管理方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1030868C (zh) * 1992-05-12 1996-01-31 国际商业机器公司 用于构成冗余磁盘存贮系统的适配器
US7644304B2 (en) * 2006-08-28 2010-01-05 Dell Products L.P. Using SAS address zoning to add/replace hot spares to RAID set
CN102012847A (zh) * 2010-12-06 2011-04-13 创新科存储技术有限公司 一种改进的磁盘阵列重建方法
CN103176919A (zh) * 2013-03-07 2013-06-26 洛阳伟信电子科技有限公司 计算机硬盘数据拯救简易设备及方法
CN103793292A (zh) * 2012-11-03 2014-05-14 上海欧朋软件有限公司 用于磁盘阵列的容灾恢复方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1030868C (zh) * 1992-05-12 1996-01-31 国际商业机器公司 用于构成冗余磁盘存贮系统的适配器
US7644304B2 (en) * 2006-08-28 2010-01-05 Dell Products L.P. Using SAS address zoning to add/replace hot spares to RAID set
CN102012847A (zh) * 2010-12-06 2011-04-13 创新科存储技术有限公司 一种改进的磁盘阵列重建方法
CN103793292A (zh) * 2012-11-03 2014-05-14 上海欧朋软件有限公司 用于磁盘阵列的容灾恢复方法
CN103176919A (zh) * 2013-03-07 2013-06-26 洛阳伟信电子科技有限公司 计算机硬盘数据拯救简易设备及方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107526651A (zh) * 2016-06-21 2017-12-29 深圳中电长城信息安全系统有限公司 一种磁盘阵列备份的方法和系统
CN106326038A (zh) * 2016-08-22 2017-01-11 浪潮(北京)电子信息产业有限公司 一种热备空间的选择方法及系统
CN108153622A (zh) * 2016-12-06 2018-06-12 华为技术有限公司 一种故障处理的方法、装置和设备
CN108153622B (zh) * 2016-12-06 2021-08-31 华为技术有限公司 一种故障处理的方法、装置和设备
CN107577580A (zh) * 2017-09-18 2018-01-12 郑州云海信息技术有限公司 一种机箱管理系统及方法
CN108052421A (zh) * 2017-12-13 2018-05-18 郑州云海信息技术有限公司 一种基于存储多重冗余架构的整机系统
CN110838337A (zh) * 2018-08-17 2020-02-25 纬颖科技服务股份有限公司 数据储存系统的控制方法、数据储存模块、电脑程序产品
CN110399098A (zh) * 2019-06-25 2019-11-01 联想(北京)有限公司 一种数据处理方法及电子设备
CN113094224A (zh) * 2019-12-20 2021-07-09 中移全通系统集成有限公司 服务器资产管理方法、装置、计算机设备和存储介质
CN113094224B (zh) * 2019-12-20 2022-07-29 中移全通系统集成有限公司 服务器资产管理方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN105335256B (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
CN105335256A (zh) 在整机柜服务器中切换备份磁盘的方法、装置和系统
US11106388B2 (en) Monitoring storage cluster elements
CN202798798U (zh) 基于云计算技术的高可用系统
JP6317856B2 (ja) クラスタ間冗長構成におけるスムーズな制御部交代
US9189349B2 (en) Distributed blade server system, management server and switching method
CN101022363B (zh) 网络存储设备的故障保护方法及装置
KR20110044858A (ko) 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지
CN105302661A (zh) 一种实现虚拟化管理平台高可用的系统和方法
CN101667181A (zh) 一种数据容灾的方法、装置及系统
CN102968360B (zh) 具有n+1冗余功能的存储系统及方法
CN105430327A (zh) 一种nvr集群备份方法及装置
CN103475695A (zh) 存储系统互联方法及装置
CN101593082A (zh) 一种管理存储设备电源电路的装置、方法和计算机
CN104424052A (zh) 一种自动冗余的分布式存储系统及方法
CN105790825A (zh) 一种分布式保护中控制器热备份的方法和装置
WO2006005251A1 (fr) Procede et systeme de realisation de la fonction de commutation dans un systeme de communication
CN102664757B (zh) 一种存储设备的级联方法及装置
CN102487332B (zh) 故障处理方法、装置和系统
CN110413435A (zh) 一种通信故障恢复方法、系统及相关组件
CN112073499A (zh) 一种多机型云物理服务器的动态服务方法
CN104699564A (zh) 一种采用Raid0磁盘组服务器的自动恢复方法及装置
CN101567804B (zh) 一种实现系统异常保护的方法、设备和系统
CN106534262A (zh) 一种网络信息系统故障的切换方法
CN103414588A (zh) 一种vtl备份方法及vtl节点
CN101799780A (zh) 配置信息文件处理方法、系统及服务器、虚拟磁带库设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant