CN107015877A - 一种带有物理坏道的raid磁盘的重新利用方法 - Google Patents

一种带有物理坏道的raid磁盘的重新利用方法 Download PDF

Info

Publication number
CN107015877A
CN107015877A CN201710150610.3A CN201710150610A CN107015877A CN 107015877 A CN107015877 A CN 107015877A CN 201710150610 A CN201710150610 A CN 201710150610A CN 107015877 A CN107015877 A CN 107015877A
Authority
CN
China
Prior art keywords
physical
bad track
hard disk
track
disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710150610.3A
Other languages
English (en)
Inventor
孙严
张军国
韩志彦
高莹
胡彬彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tangshan Iron and Steel Group Co Ltd
HBIS Co Ltd Tangshan Branch
Hebei Iron and Steel Co Ltd Tangshan Branch
Original Assignee
Tangshan Iron and Steel Group Co Ltd
HBIS Co Ltd Tangshan Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tangshan Iron and Steel Group Co Ltd, HBIS Co Ltd Tangshan Branch filed Critical Tangshan Iron and Steel Group Co Ltd
Priority to CN201710150610.3A priority Critical patent/CN107015877A/zh
Publication of CN107015877A publication Critical patent/CN107015877A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Abstract

一种带有物理坏道的RAID磁盘的重新利用方法,所述方法包括以下步骤:a.将Raid磁盘切换为各自单片模式,对各磁碟分别进行坏道检测,对物理坏道,记录其磁道号;b.确定可将物理坏道部分划除的硬盘分区模式;c.将确定的硬盘分区模式应用于故障物理硬盘,对物理坏道以外的部分进行物理分区;d.将故障物理硬盘的分区模式应用于硬盘组中的正常物理硬盘;e.将磁盘进行raid同步。本发明在对磁盘物理坏道所处的逻辑位置进行精确定位的基础上,通过合理制定分区策略将物理坏道部分划除,实现了坏道磁盘的重新利用。本方法简单实用、易于操作,可有效避免资源的浪费,降低设备的使用和维护成本。

Description

一种带有物理坏道的RAID磁盘的重新利用方法
技术领域
本发明涉及一种对出现物理坏道的服务器RAID高速磁盘进行重新利用的方法,属于信息存储技术领域。
背景技术
容错服务器是当今工业生产中重要的电气自动化设备,其故障按时间划分为永久性失效、间歇性故障和偶然性故障,其中间歇性故障和偶然性故障占现场失效的90%以上。从概念上来说,容错是指服务器对于错误的容纳能力,是服务器稳定性的一个追求目标。为此,有三种技术上的实现方法:服务器群集技术、双机冗余服务器方案和单机容错技术,冶金工业自动化上常用的是单机容错服务器。单机容错技术以Stratus公司的ftServer、hp公司的NonStop为代表。这种技术具有比双机冗余方案更高的容错能力。
以Stratus公司的ftServer的容错服务器为例,冗余容错硬件的部件在同一时刻都在执行同一指令。在一个部件出现故障的情况下,其余部件就像激活了的备份,继续正常工作,因此不会出现系统停顿及数据丢失,保证生产能够正常进行。
服务器用于存储数据的介质是磁盘,容错服务器采用RAID磁盘阵列技术,中文简称为独立冗余磁盘阵列,简单地说,RAID是把一种多块独立的硬盘(物理硬盘)按不同的方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据备份技术,在用户看来,组成的硬盘组就像是一个硬盘,用户可以对它进行分区,格式化等。总之,对磁盘阵列的操作与单个硬盘一模一样。不同的是,磁盘阵列采用高速存储磁盘(例如15K),其组成阵列的存储速度要比单个硬盘高很多,而且可以通过管理软件提供自动数据备份,因而在用户数据发生损坏时,可以利用备份信息使损坏数据得到恢复,从而保障了数据的安全性。
但是高速读写的服务器磁盘可能会出现坏道(物理硬盘由若一个或多个磁碟组成,每个磁碟由两面进行读写,分别对应两个磁头,所述磁盘坏道即物理硬盘中的某一磁碟上存在的坏道),磁盘坏道分为逻辑坏道和物理坏道两种,前者一般可以用系统或第三方软件修复,后者表示磁盘产生了物理损伤,是不可修复的。磁盘出现坏道会使打开、运行文件时出现停顿,如坏道出现在系统分区,会导致系统卡死、硬盘无法引导等情况。一般出现这种情况,服务器管理员只能更换新的磁盘,重新进行磁盘同步,而更换下来的磁盘无法重新利用。通过检测发现,故障磁盘往往只存在局部少量的物理坏道,而整个磁盘却无法继续使用,造成了资源的严重浪费。因此寻找一种重新利用带有物理坏道RAID磁盘的方法,对降低设备的使用和维护成本具有重要意义。
发明内容
本发明的目的在于针对现有技术之弊端,提供一种带有物理坏道的RAID磁盘的重新利用方法,以降低设备的维修成本。
本发明所述问题是以下述技术方案实现的:
一种带有物理坏道的RAID磁盘的重新利用方法,所述方法包括以下步骤:
a.磁盘坏道检测
将Raid磁盘切换为各自单片模式,对硬盘组中每个物理硬盘的各个磁碟分别进行坏道检测,尝试对检测出的坏道进行修复,对不能修复的物理坏道,记录其具体的磁道号;
b.根据物理坏道的磁道号,计算出其在对应物理硬盘映射的存储空间中的相对位置,然后确定可将物理坏道部分划除的硬盘分区模式;
c.将确定的硬盘分区模式应用于具有物理坏道的故障物理硬盘,即屏蔽物理坏道的磁道号,对故障物理硬盘的物理坏道以外的部分进行物理分区;
d.将具有物理坏道的故障物理硬盘的分区模式应用于硬盘组中的正常物理硬盘,对硬盘分区进行调整;
e.将屏蔽物理坏道后的故障物理硬盘和进行硬盘分区调整的正常物理硬盘进行raid同步。
上述带有物理坏道的RAID磁盘的重新利用方法,确定可将物理坏道部分划除的硬盘分区模式时,若物理坏道的磁道号出现在系统分区之后,则可继续执行后面的操作;若物理坏道的磁道号出现在系统分区中,则该磁盘只能用于数据存储,而不能用于系统磁盘。
本发明在对磁盘物理坏道所处的逻辑位置进行精确定位的基础上,通过合理制定分区策略将物理坏道部分划除,实现了坏道磁盘的重新利用。本方法简单实用、易于操作,可有效避免资源的浪费,降低设备的使用和维护成本。
附图说明
图1是本发明的一个实施例。
具体实施方式
下面结合附图对本发明作进一步说明。
RAID磁盘的结构:
硬盘组中的每个物理硬盘有数个磁碟,每磁碟两个面,每个面一个磁头。磁碟被划分为多个扇形区域即扇区。同一磁碟不同半径的同心圆为磁道。每个物理硬盘的存储容量=磁头数x磁碟每面磁道数x每道扇区数x每扇区字节数。
当某一物理硬盘中的某个磁碟出现物理坏道后,将无法对该磁碟的物理坏道所在扇区进行读写。
带有物理坏道的RAID磁盘的重新利用方法包括如下步骤:
第一步,磁盘坏道检测
在RDR中将Raid磁盘切换为各自单片模式,对硬盘组中每个物理硬盘的各个磁碟分别进行坏道检测。
通过windows自带的Scandisk程序进行扫描,其主要功能是解决磁盘逻辑坏道。通过第三方软件如FBdisk、DiskGenius等再次进行坏道检测,找到出现坏道的具体位置。尝试用软件自带的修复功能进行修复(主要是再次修复Scandisk未修复的逻辑坏道)。如有物理坏道,则修复后仍不奏效,但不能修复的坏道只剩物理坏道,并指示其磁道号。
第二步,根据物理坏道的磁道号,计算出其在对应物理硬盘映射的存储空间中的相对位置,分析计算物理坏道所处的位置,对于故障物理硬盘系统分区,数据分区等所能达到的划除或合并的最佳效果(通常一般是划除),确定可将物理坏道部分划除的硬盘分区模式。
磁盘坏道检测一般只给出坏道的磁道号,而不会给出具体的扇区号。
如果某物理硬盘的磁头数为a,即有a/2张磁碟, 磁碟的每个盘面有n个磁道,从0起对磁道进行编号,第一张磁碟第一面有n磁道,则第一张磁碟的第一盘面的磁道号范围为0~n-1,而第一张磁碟的第二盘面的磁道号范围为n~2n-1,…,第a/2张磁碟的第二盘面的磁道号范围为(a-1)n~an-1。即每一张磁碟的每个盘面的每一个磁道都对应唯一的编号。
设物理硬盘的最小磁道号为0,最大磁道号为d,每个磁道存储的字节数为b,若磁盘坏道检测得到的唯一坏道号为c(0≤c≤d),则0~c-1与c+1~d都是正常的磁道,对应的存储容量为划分为(0~(c-1)b)和((c+1) b~db)。新的硬盘分区模式只考虑这些存储容量即可。
第三步,将第二步确定的硬盘分区模式用于故障物理硬盘,将物理坏道的磁道号跳过(即屏蔽),即坏道不进行物理分区。力求完全覆盖坏道范围。
第四步,将第二步确定的硬盘分区模式用于另一个处于正常状态的物理硬盘,对硬盘分区进行调整。(此操作可在检修时进行,调整前应进行数据备份)
第五步,将屏蔽物理坏道后的故障物理硬盘重新和进行硬盘分区调整的正常物理硬盘进行raid同步。
其中第二步要根据坏道出现的具体情况给出相应的操作:如坏道磁道号出现在系统分区之后,则操作可执行;如正好出现在系统分区中,则只能将故障物理硬盘用于数据存储,而不能用于系统磁盘。例如某物理硬盘的系统分区(如C盘)大小为30g,而C盘已写入系统数据20g,如果检测到坏道对应的磁道号折合为磁盘容量处于0~20g范围内,则不能进行分段屏蔽。
图1是本发明的一个实施例,将处于同步的磁盘切换为各自单片模式,分别扫描磁盘坏道。如扫描其中的一块存在物理坏道,则记录坏道号,分析计算设置最优分区策略,将策略实施于坏道硬盘,另一正常硬盘参照最优分区策略进行相应分区调整,最后再次进行raid同步,恢复初始同步状态。

Claims (2)

1.一种带有物理坏道的RAID磁盘的重新利用方法,其特征是,所述方法包括以下步骤:
a.磁盘坏道检测
将Raid磁盘切换为各自单片模式,对硬盘组中每个物理硬盘的各个磁碟分别进行坏道检测,尝试对检测出的坏道进行修复,对不能修复的物理坏道,记录其具体的磁道号;
b.根据物理坏道的磁道号,计算出其在对应物理硬盘映射的存储空间中的相对位置,然后确定可将物理坏道部分划除的硬盘分区模式;
c.将确定的硬盘分区模式应用于具有物理坏道的故障物理硬盘,即屏蔽物理坏道的磁道号,对故障物理硬盘的物理坏道以外的部分进行物理分区;
d.将具有物理坏道的故障物理硬盘的分区模式应用于硬盘组中的正常物理硬盘,对硬盘分区进行调整;
e.将屏蔽物理坏道后的故障物理硬盘和进行硬盘分区调整的正常物理硬盘进行raid同步。
2.根据权利要求1所述的一种带有物理坏道的RAID磁盘的重新利用方法,其特征是,确定可将物理坏道部分划除的硬盘分区模式时,若物理坏道的磁道号出现在系统分区之后,则可继续执行后面的操作;若物理坏道的磁道号出现在系统分区中,则该磁盘只能用于数据存储,而不能用于系统磁盘。
CN201710150610.3A 2017-03-14 2017-03-14 一种带有物理坏道的raid磁盘的重新利用方法 Pending CN107015877A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710150610.3A CN107015877A (zh) 2017-03-14 2017-03-14 一种带有物理坏道的raid磁盘的重新利用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710150610.3A CN107015877A (zh) 2017-03-14 2017-03-14 一种带有物理坏道的raid磁盘的重新利用方法

Publications (1)

Publication Number Publication Date
CN107015877A true CN107015877A (zh) 2017-08-04

Family

ID=59440191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710150610.3A Pending CN107015877A (zh) 2017-03-14 2017-03-14 一种带有物理坏道的raid磁盘的重新利用方法

Country Status (1)

Country Link
CN (1) CN107015877A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536548A (zh) * 2018-04-10 2018-09-14 网宿科技股份有限公司 一种磁盘坏道的处理方法、装置及计算机存储介质
CN109308238A (zh) * 2018-12-03 2019-02-05 郑州云海信息技术有限公司 一种存储系统磁盘阵列坏盘调节的方法、装置及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822142A (en) * 1996-07-26 1998-10-13 Western Digital Corporation Method of mapping logical sectors to physical sectors in a disk drive sparing partition
CN103729276A (zh) * 2014-01-28 2014-04-16 深圳市迪菲特科技股份有限公司 一种扫描磁盘阵列的方法
CN103955437A (zh) * 2014-04-02 2014-07-30 江门市未来之星网络科技有限公司 外置式数据粉碎及存储设备再生设备以及方法
CN104407821A (zh) * 2014-12-12 2015-03-11 浪潮(北京)电子信息产业有限公司 一种实现raid重构的方法及装置
CN105354099A (zh) * 2015-09-30 2016-02-24 四川效率源信息安全技术股份有限公司 一种西数硬盘修复方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822142A (en) * 1996-07-26 1998-10-13 Western Digital Corporation Method of mapping logical sectors to physical sectors in a disk drive sparing partition
CN103729276A (zh) * 2014-01-28 2014-04-16 深圳市迪菲特科技股份有限公司 一种扫描磁盘阵列的方法
CN103955437A (zh) * 2014-04-02 2014-07-30 江门市未来之星网络科技有限公司 外置式数据粉碎及存储设备再生设备以及方法
CN104407821A (zh) * 2014-12-12 2015-03-11 浪潮(北京)电子信息产业有限公司 一种实现raid重构的方法及装置
CN105354099A (zh) * 2015-09-30 2016-02-24 四川效率源信息安全技术股份有限公司 一种西数硬盘修复方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄大庆: "硬盘物理坏道屏蔽两例", 《电脑知识与技术》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536548A (zh) * 2018-04-10 2018-09-14 网宿科技股份有限公司 一种磁盘坏道的处理方法、装置及计算机存储介质
CN108536548B (zh) * 2018-04-10 2020-12-29 网宿科技股份有限公司 一种磁盘坏道的处理方法、装置及计算机存储介质
US11073998B2 (en) 2018-04-10 2021-07-27 Wangsu Science & Technology Co., Ltd. Method, apparatus for processing disk bad sector,and computer storage medium
CN109308238A (zh) * 2018-12-03 2019-02-05 郑州云海信息技术有限公司 一种存储系统磁盘阵列坏盘调节的方法、装置及设备

Similar Documents

Publication Publication Date Title
US7640452B2 (en) Method for reconstructing data in case of two disk drives of RAID failure and system therefor
CN102708019B (zh) 一种硬盘数据恢复方法、装置及系统
EP0271335B1 (en) Optical information recording and reproducing system and optical disk
US9208817B1 (en) System and method for determination and reallocation of pending sectors caused by media fatigue
US9009526B2 (en) Rebuilding drive data
Elerath et al. Enhanced reliability modeling of raid storage systems
US6704153B1 (en) Method for analyzing magnetic media surface in a disk drive for indications of head impact
CN101916173B (zh) 一种基于raid的数据读写方法及其系统
CN104484251B (zh) 一种硬盘故障的处理方法及装置
CN103309775A (zh) 一种高可靠磁盘阵列的容错方法
CN103718162A (zh) 用于ssd中灵活的raid的方法和设备
CN102508733B (zh) 一种基于磁盘阵列的数据处理方法及磁盘阵列管理器
US9529674B2 (en) Storage device management of unrecoverable logical block addresses for RAID data regeneration
CN104407821B (zh) 一种实现raid重构的方法及装置
CN105354099A (zh) 一种西数硬盘修复方法
WO2020103512A1 (zh) 一种存储系统中的数据重构方法和装置
CN107015877A (zh) 一种带有物理坏道的raid磁盘的重新利用方法
CN109582497B (zh) 一种基于动态数据增量快速应急启动方法
CN107977285A (zh) 一种纠删码存储机制的数据修改方法、装置及介质
CN106528342A (zh) 一种具有云服务器备份的磁盘阵列容错装置
CN105653385A (zh) 一种车载录像方法
CN100492306C (zh) 独立磁盘冗余阵列毁损时的数据恢复方法及其系统
CN113190179B (zh) 提升机械硬盘使用寿命的方法、存储设备及系统
CN109582237B (zh) 一种基于机械硬盘的坏扇区映射方法
CN104572380A (zh) 一种检测磁盘的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170804