CN104636082A - 磁盘阵列raid的控制方法及装置 - Google Patents

磁盘阵列raid的控制方法及装置 Download PDF

Info

Publication number
CN104636082A
CN104636082A CN201410842137.1A CN201410842137A CN104636082A CN 104636082 A CN104636082 A CN 104636082A CN 201410842137 A CN201410842137 A CN 201410842137A CN 104636082 A CN104636082 A CN 104636082A
Authority
CN
China
Prior art keywords
raid
broken down
standard grade
disk array
fault level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410842137.1A
Other languages
English (en)
Other versions
CN104636082B (zh
Inventor
李哲林
袁清波
杨浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dawning Information Industry Co Ltd
Original Assignee
Dawning Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Co Ltd filed Critical Dawning Information Industry Co Ltd
Priority to CN201410842137.1A priority Critical patent/CN104636082B/zh
Publication of CN104636082A publication Critical patent/CN104636082A/zh
Application granted granted Critical
Publication of CN104636082B publication Critical patent/CN104636082B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/062Securing storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0634Configuration or reconfiguration of storage systems by changing the state or mode of one or more devices

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种磁盘阵列RAID的控制方法,该控制方法包括:根据预定规则判断发生故障的磁盘阵列RAID的故障等级;当所述故障等级达到预定的强制上线的标准时,对所述发生故障的RAID进行强制上线,所述强制上线为使所述发生故障的RAID强制上线,进入工作状态。本发明通过对发生故障的RAID进行强制上线,实现了尽可能多,尽可能快的抢救数据,并大大增强了系统的时效性及稳定性。

Description

磁盘阵列RAID的控制方法及装置
技术领域
本发明涉及计算机存储领域,具体来说,涉及一种磁盘阵列RAID的控制方法和装置。
背景技术
随着电子政务、电子商务及全球信息化的发展,越来越多的国家职能部门、企事业单位及大型企业配备了服务器用于自身信息系统的建设。受服务器自身硬件技术的局限和技术人员的操作因素,服务器无法做到100%的无故障发生。存储着海量数据资料的服务器,特别是企业级的大型服务器一旦发生故障,将直接导致服务器内存储的海量数据丢失,造成国家职能部门、企事业单位及大型企业的严重数据灾难。面对服务器的日益普及,服务器数据安全面临着巨大的挑战,而此时服务器数据恢复作为服务器数据安全最后一道防线,就显得尤为重要。
目前,多数采用硬盘克隆技术来进行数据恢复。硬盘克隆(Disk cloning),亦作硬盘复制,是一种通过计算机软件或硬件的方式,把硬盘内容完整的复制(克隆)到另一台硬盘的过程。一般来说,若是通过软件方式来复制的话,都会把整颗硬盘的内容写进一个硬盘备份档里,以待下次恢复时,再从备份档里把内容恢复过来。
另外,硬盘克隆技术还可用于系统恢复的过程里,即,把原来的硬盘内容全数清除,然后再从“干净”的主图像档里,把电脑原先应有的内容恢复过来。如果系统出现问题,可以通过硬盘克隆技术恢复系统。但是,如果系统运行过程中,独立冗余磁盘阵列(Redundant Arrays of Independent Disks,简称RAID)的成员盘损坏导致RAID不工作,则会造成用户数据丢失,给用户带来损失。
发明内容
针对相关技术中的问题,本发明提出一种磁盘阵列RAID的控制方法和装置,能够尽可能多,尽可能快的抢救数据。
本发明的技术方案是这样实现的:
根据本发明的一个方面,提供了一种磁盘阵列RAID的控制方法,包括:
根据预定规则判断发生故障的磁盘阵列RAID的故障等级;
当所述故障等级达到预定的强制上线的标准时,对所述发生故障的RAID进行强制上线,所述强制上线为使所述发生故障的RAID强制上线,进入工作状态。
其中,在判断所述发生故障的磁盘阵列RAID的故障等级之前,包括:
断开所述发生故障的RAID的逻辑卷的会话以停止读写业务。
其中,根据预定规则判断所述发生故障的磁盘阵列RAID的故障等级,包括:
根据所述发生故障的RAID的有效磁盘数量确定所述故障等级。
其中,所述RAID的控制方法基于SBB标准实施。
其中,在对所述发生故障的RAID进行强制上线后,启动所有的存储池和逻辑卷。
根据本发明的另一方面,提供了一种磁盘阵列RAID的控制装置,包括:
判断模块,用于根据预定规则判断发生故障的磁盘阵列RAID的故障等级;
强制上线模块,用于当所述故障等级达到预定的强制上线的标准时,对所述发生故障的RAID进行强制上线,所述强制上线为使所述发生故障的RAID强制上线,进入工作状态。
其中,该控制装置还包括:关闭模块,用于在判断所述发生故障的磁盘阵列RAID的故障等级之前,断开所述发生故障的RAID的逻辑卷的会话以停止读写业务。
其中,所述判断模块进一步用于,根据所述发生故障的RAID的有效磁盘数量确定所述故障等级。
其中,所述RAID的控制装置基于SBB标准实施。
其中,所述控制装置还包括:启动模块,用于在对所述发生故障的RAID进行强制上线后,启动所有的存储池和逻辑卷。
本发明通过对发生故障的RAID进行强制上线,实现了尽可能多,尽可能快的抢救数据,从而提高了系统的数据恢复的时效性并大大提高了系统的稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的磁盘阵列RAID的控制方法的示意性流程图;
图2是根据本发明实施例的磁盘阵列RAID的控制方法的流程图;
图3至图4是根据本发明实施例的磁盘阵列RAID的控制方法的示意性流程图;
图5是根据本发明实施例的磁盘阵列RAID的控制装置的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
RAID出现异常的原因有很多,例如,突然断电、重构RAID、磁盘顺序混乱、误删除、误格式化、误分区、病毒损坏、硬盘出现坏道或损坏等情况都可能导致RAID信息的异常。
参见图1,在RAID出现异常的情况下,在使用本发明的RAID的控制方法及装置之前,网络管理员先行做一些常规的判断与处理,以排除其他可能的故障原因。
首先排查线路。例如,在关闭计算机的电源后,检查RAID电源线的连接,以及数据线是否与硬盘和RAID控制卡连接正常,之后再重新开机。如果故障仍未解决,则可能是硬盘的故障。
然后检查发生故障的RAID的故障等级。如果故障等级在容忍范围外的,则强制上线RAID并重组,从而尽可能多的获取数据,减少损失。如果故障等级在容忍范围内,则更换硬盘。
其中,强制上线RAID的控制方法将在以下进行详细说明。
参见图2,根据本发明的实施例提供了一种磁盘阵列RAID的控制方法。其中,RAID的控制方法是基于SBB(即Storage Bridge Bay的简称,中文名称为“存储桥接坞”)标准实施的。如图2所示,该控制方法包括:
步骤S201,根据预定规则判断发生故障的磁盘阵列RAID的故障等级。
步骤S203,当故障等级达到预定的强制上线的标准时,对发生故障的RAID进行强制上线,强制上线为使发生故障的RAID强制上线,进入工作状态。
综上,本发明实施例提供的磁盘阵列RAID的控制方法,针对不同故障等级的RAID进行强制上线。该控制方法操作简单,快速。还有效地恢复了RAID的工作状态,有利于尽快开始读写业务,实现了尽可能多,尽可能快地抢救数据,尽可能的挽回用户的损失。
参见图3及图4,根据本发明的实施例还提供了另一种磁盘阵列RAID的控制方法。同样的,RAID的控制方法是基于SBB标准实施的。SBB是由非盈利性协作组织SBB(Storage Bridge Bay,存储桥接坞)工作组,为提高存储接口标准化而提出的一种标准。SBB创建了通用标准以支持高能组件和高密度磁盘封装,使得基于SBB规范的模块具有更高的互通、互用性。该RAID控制方法包括如下步骤:
步骤S301,断开发生故障的RAID的逻辑卷的会话以停止读写业务。
步骤S303,根据预定规则判断发生故障的磁盘阵列RAID的故障等级。在本实施例中,具体的,根据发生故障的RAID的有效磁盘数量确定故障等级。
步骤S305,当故障等级达到预定的强制上线的标准时,对发生故障的RAID进行强制上线,强制上线为使发生故障的RAID强制上线,进入工作状态。
在本实施例中,针对离线(也就是不工作)的RAID进行强制上线,使其进入工作状态,实现强制上线的RAID和正常工作的RAID具有同样的功能。
强制上线的RAID的成员盘选择规则为:不是RAID认为的坏盘全部选中。脏盘由技术支持人员选择,可以全选也可以选单块。同时选择的脏盘必须满足不同级别RAID强制上线的最低要求,保证强制上线的成功。脏盘是RAID运行过程中被剔除出去,不会进行读写的磁盘。
步骤S307,在对发生故障的RAID进行强制上线后,启动所有的存储池和逻辑卷。从而尽可能多,尽可能快地将数据拷贝出来,然后更换新盘,继续进行业务。
综上,本发明实施例提供的磁盘阵列RAID的控制方法,针对不同故障等级的离线的RAID进行快速强制上线。用户在启用该控制方法时,只需将RAID的逻辑卷的会话断开。强制上线成功后,只需恢复RAID的逻辑卷的会话,就可以快速拷贝数据。因此,该控制方法操作简单,快速。还有效地恢复了RAID的工作状态,有利于尽快开始读写业务,实现了尽可能多,尽可能快地抢救数据,尽可能的挽回用户的损失。
参见图5,另外,本发明的实施例还提供了一种磁盘阵列RAID的控制装置,RAID的控制装置基于SBB标准实施。该控制装置包括:
判断模块51,用于根据预定规则判断发生故障的磁盘阵列RAID的故障等级。
强制上线模块52,用于当故障等级达到预定的强制上线的标准时,对发生故障的RAID进行强制上线,强制上线为使发生故障的RAID强制上线,进入工作状态。
综上,本发明实施例提供的磁盘阵列RAID的控制装置,针对不同故障等级的RAID进行强制上线。该控制装置的操作简单,快速。还有效地恢复了RAID的工作状态,有利于尽快开始读写业务,实现了尽可能多,尽可能快地抢救数据,尽可能的挽回用户的损失。
此外,本发明的上述装置还可以进一步包括:
关闭模块(未示出),用于在判断发生故障的磁盘阵列RAID的故障等级之前,断开发生故障的RAID的逻辑卷的会话以停止读写业务。
判断模块进一步用于,根据发生故障的RAID的有效磁盘数量确定故障等级。
其中,针对离线(也就是不工作)的RAID进行强制上线,使其进入工作状态,实现强制上线的RAID和正常工作的RAID具有同样的功能。
此外,强制上线的RAID的成员盘选择规则为:不是RAID认为的坏盘全部选中。脏盘由技术支持人员选择,可以全选也可以选单块。同时选择的脏盘必须满足不同级别RAID强制上线的最低要求,保证强制上线的成功。脏盘是RAID运行过程中被剔除出去,不会进行读写的磁盘。
进一步的,本发明的上述装置还可以包括:
启动模块(未示出),用于在对发生故障的RAID进行强制上线后,启动所有的存储池和逻辑卷。从而尽可能多,尽可能快地将数据拷贝出来,然后更换新盘,继续进行业务。
综上,本发明实施例提供的磁盘阵列RAID的控制装置,针对不同故障等级的离线的RAID进行快速强制上线。用户在启用该控制装置时,只需将RAID的逻辑卷的会话断开。强制上线成功后,只需恢复RAID的逻辑卷的会话,就可以快速拷贝数据。因此,本发明的技术方案操作简单,快速。有效地恢复了RAID的工作状态,有利于尽快开始读写业务,实现了尽可能多,尽可能快地抢救数据,尽可能的挽回用户的损失,大大增强了时效性及系统的稳定性。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种磁盘阵列RAID的控制方法,其特征在于,包括:
根据预定规则判断发生故障的磁盘阵列RAID的故障等级;
当所述故障等级达到预定的强制上线的标准时,对所述发生故障的RAID进行强制上线,所述强制上线为使所述发生故障的RAID强制上线,进入工作状态。
2.根据权利要求1所述的方法,其特征在于,在判断所述发生故障的磁盘阵列RAID的故障等级之前,包括:
断开所述发生故障的RAID的逻辑卷的会话以停止读写业务。
3.根据权利要求1所述的方法,其特征在于,根据预定规则判断所述发生故障的磁盘阵列RAID的故障等级,包括:
根据所述发生故障的RAID的有效磁盘数量确定所述故障等级。
4.根据权利要求1所述的方法,其特征在于,所述RAID的控制方法基于SBB标准实施。
5.根据权利要求1所述的方法,其特征在于,在对所述发生故障的RAID进行强制上线后,启动所有的存储池和逻辑卷。
6.一种磁盘阵列RAID的控制装置,其特征在于,包括:
判断模块,用于根据预定规则判断发生故障的磁盘阵列RAID的故障等级;
强制上线模块,用于当所述故障等级达到预定的强制上线的标准时,对所述发生故障的RAID进行强制上线,所述强制上线为使所述发生故障的RAID强制上线,进入工作状态。
7.根据权利要求6所述的装置,其特征在于,包括:
关闭模块,用于在判断所述发生故障的磁盘阵列RAID的故障等级之前,断开所述发生故障的RAID的逻辑卷的会话以停止读写业务。
8.根据权利要求6所述的装置,其特征在于,所述判断模块进一步用于,根据所述发生故障的RAID的有效磁盘数量确定所述故障等级。
9.根据权利要求6所述的装置,其特征在于,所述RAID的控制装置基于SBB标准实施。
10.根据权利要求6所述的装置,其特征在于,包括:
启动模块,用于在对所述发生故障的RAID进行强制上线后,启动所有的存储池和逻辑卷。
CN201410842137.1A 2014-12-30 2014-12-30 磁盘阵列raid的控制方法及装置 Active CN104636082B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410842137.1A CN104636082B (zh) 2014-12-30 2014-12-30 磁盘阵列raid的控制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410842137.1A CN104636082B (zh) 2014-12-30 2014-12-30 磁盘阵列raid的控制方法及装置

Publications (2)

Publication Number Publication Date
CN104636082A true CN104636082A (zh) 2015-05-20
CN104636082B CN104636082B (zh) 2019-02-22

Family

ID=53214893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410842137.1A Active CN104636082B (zh) 2014-12-30 2014-12-30 磁盘阵列raid的控制方法及装置

Country Status (1)

Country Link
CN (1) CN104636082B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407033A (zh) * 2016-09-30 2017-02-15 郑州云海信息技术有限公司 一种磁盘故障处理方法及装置
CN106844110A (zh) * 2017-02-09 2017-06-13 郑州云海信息技术有限公司 一种raid组中故障磁盘数据重建的方法
CN110989928A (zh) * 2019-11-20 2020-04-10 北京连山科技股份有限公司 Raid0中存储单元的管理方法及管理设备
CN112416454A (zh) * 2020-11-17 2021-02-26 浙江大华技术股份有限公司 控制磁盘启动的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101276302A (zh) * 2007-03-29 2008-10-01 中国科学院计算技术研究所 一种磁盘阵列系统中磁盘故障处理和数据重构方法
CN102012847A (zh) * 2010-12-06 2011-04-13 创新科存储技术有限公司 一种改进的磁盘阵列重建方法
CN102981778A (zh) * 2012-11-15 2013-03-20 浙江宇视科技有限公司 一种raid阵列重建方法及装置
US20140365817A1 (en) * 2013-06-10 2014-12-11 Nec Corporation Data preservation processing device, raid controller, data preservation processing system, data preservation processing method and recording medium therefor

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101276302A (zh) * 2007-03-29 2008-10-01 中国科学院计算技术研究所 一种磁盘阵列系统中磁盘故障处理和数据重构方法
CN102012847A (zh) * 2010-12-06 2011-04-13 创新科存储技术有限公司 一种改进的磁盘阵列重建方法
CN102981778A (zh) * 2012-11-15 2013-03-20 浙江宇视科技有限公司 一种raid阵列重建方法及装置
US20140365817A1 (en) * 2013-06-10 2014-12-11 Nec Corporation Data preservation processing device, raid controller, data preservation processing system, data preservation processing method and recording medium therefor

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407033A (zh) * 2016-09-30 2017-02-15 郑州云海信息技术有限公司 一种磁盘故障处理方法及装置
CN106844110A (zh) * 2017-02-09 2017-06-13 郑州云海信息技术有限公司 一种raid组中故障磁盘数据重建的方法
CN110989928A (zh) * 2019-11-20 2020-04-10 北京连山科技股份有限公司 Raid0中存储单元的管理方法及管理设备
CN112416454A (zh) * 2020-11-17 2021-02-26 浙江大华技术股份有限公司 控制磁盘启动的方法及装置

Also Published As

Publication number Publication date
CN104636082B (zh) 2019-02-22

Similar Documents

Publication Publication Date Title
CN103226502B (zh) 一种数据灾备控制系统及数据恢复方法
CN109871369B (zh) 数据库切换方法、系统、介质和装置
CN103034564B (zh) 数据容灾演练方法、数据容灾演练装置及系统
WO2016095372A1 (zh) 实现事务日志镜像备份的方法及装置
CN104636082A (zh) 磁盘阵列raid的控制方法及装置
CN105302667A (zh) 基于集群架构的高可靠性数据备份与恢复方法
CN106708646A (zh) 硬盘异常自动复位方法及其装置
CN103186348B (zh) 存储系统及其数据读写方法
CN107135097A (zh) 基于簿记建档的容灾系统及容灾方法
CN103678517B (zh) 修复硬盘逻辑错误的方法及控制器
CN103064759B (zh) 数据修复的方法及装置
CN104461791A (zh) 一种信息处理方法及处理装置
CN102457400B (zh) 一种防止磁盘镜像资源发生脑裂的方法
CN101763294A (zh) 根据时间段查看和备份系统操作日志的方法
CN111190770A (zh) 一种用于数据存储及数据灾备的cow快照技术
CN104133742A (zh) 一种数据保护的方法及装置
CN111240903A (zh) 数据恢复方法及相关设备
CN103049407B (zh) 数据存储方法、装置及系统
CN104750537A (zh) 一种执行测试用例的方法和装置
CN106933707B (zh) 基于raid技术的数据存储设备数据恢复方法及系统
CN105159846A (zh) 一种支持虚拟化磁盘双控切换的方法和存储系统
CN104407806A (zh) 独立磁盘冗余阵列组硬盘信息的修改方法和装置
CN105224416A (zh) 修复方法及相关电子装置
CN102520880B (zh) 一种系统raid管理模块设计方法
CN104020963A (zh) 一种防止误判硬盘读写错误的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant