CN104657237A - 一种检测磁盘阵列的方法 - Google Patents

一种检测磁盘阵列的方法 Download PDF

Info

Publication number
CN104657237A
CN104657237A CN201510108155.1A CN201510108155A CN104657237A CN 104657237 A CN104657237 A CN 104657237A CN 201510108155 A CN201510108155 A CN 201510108155A CN 104657237 A CN104657237 A CN 104657237A
Authority
CN
China
Prior art keywords
data
disk
disk array
write
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510108155.1A
Other languages
English (en)
Inventor
张光华
闫永刚
蔡丰龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Group Co Ltd
Original Assignee
Inspur Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Group Co Ltd filed Critical Inspur Group Co Ltd
Priority to CN201510108155.1A priority Critical patent/CN104657237A/zh
Publication of CN104657237A publication Critical patent/CN104657237A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明特别涉及一种检测磁盘阵列的方法。该检测磁盘阵列的方法,在系统负载较低的情况下对磁盘阵列进行检测、利用冗余信息对数据进行恢复、及时产生告警信息,检测过程中保证磁盘读写业务正常进行和确保系统稳定性。该检测磁盘阵列的方法,在判定系统负载较低的情况下,通过周期性的读写指定的磁盘来检测数据丢失的情况,并通过RAID冗余信息进行数据恢复,这样在数据读写的检测过程中就减少了磁介质发生偏移的几率,并能对已经发生偏移的数据进行恢复;如果RAID冗余信息也无法恢复正确的数据,则产生告警信息,通知管理员及时处理,这样就可以有效解决长时间未经读写的磁盘容易出现数据丢失的问题,减少问题发生的几率,提高系统的可靠性。

Description

一种检测磁盘阵列的方法
技术领域
本发明涉及计算机系统及存储技术领域,特别涉及一种检测磁盘阵列的方法。
背景技术
磁盘模块是存储系统的基础模块,磁盘模块的可靠性和健壮程度,严重影响存储产品的整体性能和可靠性。
磁盘通过盘片表面的磁性粒子来记录数据。这些磁性粒子就好像无数任意排列的小磁铁,每个磁性粒子都有自己的磁场,它们的磁极分别表示了数据的0和1。在磁头的影响下有规则的进行排列,就可以用来记录数据。当某些磁盘或磁盘中的某些扇区在写入数据后,长时间没有读写,磁介质可能会发生偏移,从而导致数据丢失。如果这些磁盘或扇区发生问题并且未被及时发现,就会有数据永久性丢失的风险。
当前一般的磁盘都会在负载比较低的时候通过磁盘内部读写来解决磁介质偏移导致数据丢失的问题,但其实现不可控且不可恢复错误数据。
在不影响业务和磁盘阵列可靠性的前提下,如果能够尽可能早的发现和处理有问题的成员盘,就能大幅度降低因坏道等原因引起的双盘失效和数据丢失的概率。另外,为了避免磁介质偏移导致数据丢失这一现象,可以通过周期性的读写磁盘来及时发现问题,修复错误和恢复数据。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单有效的检测磁盘阵列的方法。
本发明是通过如下技术方案实现的:
一种检测磁盘阵列的方法,其特征在于:在判定系统负载较低的情况下,启动对指定磁盘阵列的检测,检测过程通过直接读取磁盘阵列数据来判断磁盘是否发生数据丢失的情况,利用冗余信息对数据进行恢复,及时产生告警信息,同时在检测过程中保证磁盘读写业务正常进行和确保系统稳定性。
当读取数据正常时,将读取的数据重新写入磁盘阵列;
当读取数据失败时,通过RAID接口利用冗余信息读取正确数据,通过RAID接口读取到正确数据后,再通过RAID接口将数据重新写入磁盘以恢复数据;若通过RAID冗余信息无法获得正确的数据,此时要及时产生告警信息,通知管理员及时处理。
磁盘检测过程中,为不影响正常的磁盘阵列读写请求,需要对同一区域同时有读写请求的情况进行检测判断,将有冲突的业务请求或巡检请求放入等待队列,待冲突消除唤醒等待队列继续处理,以保证正常的磁盘读写请求不受影响。
检测过程在系统负载较低的情况下进行,是指磁盘检测是系统的辅助功能,是为提高系统的可靠性而设立,不能过多的与上层的磁盘读写业务争抢资源。
检测过程中不影响正常的磁盘阵列读写业务,是指检测过程和读写磁盘阵列的业务难免会发生读写同一区域的情况,此时需要对有冲突的情况进行检测,使用等待队列保证磁盘读写业务正常进行。
初步检测到错误可利用冗余信息对数据进行恢复,是指检测过程中遇到读取数据异常的区域,可利用RAID冗余信息对该区域进行数据恢复,并将恢复的数据重新写入。
本发明的有益效果是:该检测磁盘阵列的方法,在判定系统负载较低的情况下,通过周期性的读写指定的磁盘来检测数据丢失的情况,并通过RAID冗余信息进行数据恢复,这样在数据读写的检测过程中就减少了磁介质发生偏移的几率,并能对已经发生偏移的数据进行恢复;如果RAID冗余信息也无法恢复正确的数据,则产生告警信息,通知管理员及时处理,这样就可以有效解决长时间未经读写的磁盘容易出现数据丢失的问题,减少问题发生的几率,提高系统的可靠性。
附图说明
附图1为本发明中检测磁盘阵列的方法示意图。
具体实施方式
下面结合附图对本发明进行详细说明。
该检测磁盘阵列的方法,在判定系统负载较低的情况下,启动对指定磁盘阵列的检测,检测过程通过直接读取磁盘阵列数据来判断磁盘是否发生数据丢失的情况,利用冗余信息对数据进行恢复,及时产生告警信息,同时在检测过程中保证磁盘读写业务正常进行和确保系统稳定性。
当读取数据正常时,将读取的数据重新写入磁盘阵列;
当读取数据失败时,通过RAID接口利用冗余信息读取正确数据,通过RAID接口读取到正确数据后,再通过RAID接口将数据重新写入磁盘以恢复数据;若通过RAID冗余信息无法获得正确的数据,此时要及时产生告警信息,通知管理员及时处理。
磁盘检测过程中,为不影响正常的磁盘阵列读写请求,需要对同一区域同时有读写请求的情况进行检测判断,将有冲突的业务请求或巡检请求放入等待队列,待冲突消除唤醒等待队列继续处理,以保证正常的磁盘读写请求不受影响。
检测过程在系统负载较低的情况下进行,是指磁盘检测是系统的辅助功能,是为提高系统的可靠性而设立,不能过多的与上层的磁盘读写业务争抢资源。
检测过程中不影响正常的磁盘阵列读写业务,是指检测过程和读写磁盘阵列的业务难免会发生读写同一区域的情况,此时需要对有冲突的情况进行检测,使用等待队列保证磁盘读写业务正常进行。
初步检测到错误可利用冗余信息对数据进行恢复,是指检测过程中遇到读取数据异常的区域,可利用RAID冗余信息对该区域进行数据恢复,并将恢复的数据重新写入。
该检测磁盘阵列的方法,在判定系统负载较低的情况下,通过周期性的读写指定的磁盘来检测数据丢失的情况,并通过RAID冗余信息进行数据恢复,这样在数据读写的检测过程中就减少了磁介质发生偏移的几率,并能对已经发生偏移的数据进行恢复;如果RAID冗余信息也无法恢复正确的数据,则产生告警信息,通知管理员及时处理,这样就可以有效解决长时间未经读写的磁盘容易出现数据丢失的问题,减少问题发生的几率,提高系统的可靠性。

Claims (3)

1.一种检测磁盘阵列的方法,其特征在于:在判定系统负载较低的情况下,启动对指定磁盘阵列的检测,检测过程通过直接读取磁盘阵列数据来判断磁盘是否发生数据丢失的情况,利用冗余信息对数据进行恢复,及时产生告警信息,同时在检测过程中保证磁盘读写业务正常进行和确保系统稳定性。
2.根据权利要求1所述的检测磁盘阵列的方法,其特征在于:
当读取数据正常时,将读取的数据重新写入磁盘阵列;
当读取数据失败时,通过RAID接口利用冗余信息读取正确数据,通过RAID接口读取到正确数据后,再通过RAID接口将数据重新写入磁盘以恢复数据;若通过RAID冗余信息无法获得正确的数据,此时要及时产生告警信息,通知管理员及时处理。
3.根据权利要求1所述的检测磁盘阵列的方法,其特征在于:磁盘检测过程中,为不影响正常的磁盘阵列读写请求,需要对同一区域同时有读写请求的情况进行检测判断,将有冲突的业务请求或巡检请求放入等待队列,待冲突消除唤醒等待队列继续处理,以保证正常的磁盘读写请求不受影响。
CN201510108155.1A 2015-03-12 2015-03-12 一种检测磁盘阵列的方法 Pending CN104657237A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510108155.1A CN104657237A (zh) 2015-03-12 2015-03-12 一种检测磁盘阵列的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510108155.1A CN104657237A (zh) 2015-03-12 2015-03-12 一种检测磁盘阵列的方法

Publications (1)

Publication Number Publication Date
CN104657237A true CN104657237A (zh) 2015-05-27

Family

ID=53248409

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510108155.1A Pending CN104657237A (zh) 2015-03-12 2015-03-12 一种检测磁盘阵列的方法

Country Status (1)

Country Link
CN (1) CN104657237A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107656830A (zh) * 2017-10-09 2018-02-02 郑州云海信息技术有限公司 一种全闪系统的健康巡检方法、系统及计算机设备
CN109976978A (zh) * 2019-04-03 2019-07-05 湖南科技学院 一种基于大数据的计算机性能控制系统
CN111459399A (zh) * 2019-01-22 2020-07-28 深圳市茁壮网络股份有限公司 一种数据写入方法、数据读取方法及装置
CN115904235A (zh) * 2022-11-11 2023-04-04 深圳市数存科技有限公司 一种数据生命周期管理方法及装置

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1551202A (zh) * 2003-05-06 2004-12-01 �Ҵ���˾ 自修复方法和存储系统
CN1684042A (zh) * 2004-04-13 2005-10-19 英业达股份有限公司 多种互斥条件下的多模式测试系统及其方法
US20060218343A1 (en) * 2005-03-25 2006-09-28 Naoki Higashijima Storage control device and storage device error control method
CN1866226A (zh) * 2005-05-17 2006-11-22 英业达股份有限公司 数据保护方法
CN101236482A (zh) * 2008-02-26 2008-08-06 杭州华三通信技术有限公司 降级状态下处理数据的方法及独立冗余磁盘阵列系统
CN101615203A (zh) * 2009-07-23 2009-12-30 中兴通讯股份有限公司 并发控制方法及装置
CN101764846A (zh) * 2009-12-18 2010-06-30 西南交通大学 一种远程集中式磁盘阵列运行监控系统及其实现方法
CN102508733A (zh) * 2011-09-22 2012-06-20 杭州华三通信技术有限公司 一种基于磁盘阵列的数据处理方法及磁盘阵列管理器
CN103064777A (zh) * 2012-12-24 2013-04-24 华为技术有限公司 磁盘阵列告警显示方法和装置
CN103246548A (zh) * 2012-02-02 2013-08-14 迈普通信技术股份有限公司 一种容错保序的事件调度方法及装置
CN103631831A (zh) * 2012-08-29 2014-03-12 阿里巴巴集团控股有限公司 一种数据备份方法及装置
CN103729276A (zh) * 2014-01-28 2014-04-16 深圳市迪菲特科技股份有限公司 一种扫描磁盘阵列的方法
CN103729253A (zh) * 2013-12-31 2014-04-16 深圳市科漫达智能管理科技有限公司 一种独占资源使用方法及装置
CN103942111A (zh) * 2014-03-31 2014-07-23 华为技术有限公司 数据修复方法及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1551202A (zh) * 2003-05-06 2004-12-01 �Ҵ���˾ 自修复方法和存储系统
CN1684042A (zh) * 2004-04-13 2005-10-19 英业达股份有限公司 多种互斥条件下的多模式测试系统及其方法
US20060218343A1 (en) * 2005-03-25 2006-09-28 Naoki Higashijima Storage control device and storage device error control method
CN1866226A (zh) * 2005-05-17 2006-11-22 英业达股份有限公司 数据保护方法
CN101236482A (zh) * 2008-02-26 2008-08-06 杭州华三通信技术有限公司 降级状态下处理数据的方法及独立冗余磁盘阵列系统
CN101615203A (zh) * 2009-07-23 2009-12-30 中兴通讯股份有限公司 并发控制方法及装置
CN101764846A (zh) * 2009-12-18 2010-06-30 西南交通大学 一种远程集中式磁盘阵列运行监控系统及其实现方法
CN102508733A (zh) * 2011-09-22 2012-06-20 杭州华三通信技术有限公司 一种基于磁盘阵列的数据处理方法及磁盘阵列管理器
CN103246548A (zh) * 2012-02-02 2013-08-14 迈普通信技术股份有限公司 一种容错保序的事件调度方法及装置
CN103631831A (zh) * 2012-08-29 2014-03-12 阿里巴巴集团控股有限公司 一种数据备份方法及装置
CN103064777A (zh) * 2012-12-24 2013-04-24 华为技术有限公司 磁盘阵列告警显示方法和装置
CN103729253A (zh) * 2013-12-31 2014-04-16 深圳市科漫达智能管理科技有限公司 一种独占资源使用方法及装置
CN103729276A (zh) * 2014-01-28 2014-04-16 深圳市迪菲特科技股份有限公司 一种扫描磁盘阵列的方法
CN103942111A (zh) * 2014-03-31 2014-07-23 华为技术有限公司 数据修复方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107656830A (zh) * 2017-10-09 2018-02-02 郑州云海信息技术有限公司 一种全闪系统的健康巡检方法、系统及计算机设备
CN111459399A (zh) * 2019-01-22 2020-07-28 深圳市茁壮网络股份有限公司 一种数据写入方法、数据读取方法及装置
CN109976978A (zh) * 2019-04-03 2019-07-05 湖南科技学院 一种基于大数据的计算机性能控制系统
CN115904235A (zh) * 2022-11-11 2023-04-04 深圳市数存科技有限公司 一种数据生命周期管理方法及装置
CN115904235B (zh) * 2022-11-11 2024-07-05 深圳市数存科技有限公司 一种数据生命周期管理方法及装置

Similar Documents

Publication Publication Date Title
CN103309775B (zh) 一种高可靠磁盘阵列的容错方法
CN104657237A (zh) 一种检测磁盘阵列的方法
KR101574844B1 (ko) Smr raid용의 대블록 무작위 쓰기 핫 스페어 ssd 구현
WO2019196199A1 (zh) 一种磁盘坏道的处理方法、装置及计算机存储介质
US20140208155A1 (en) Rebuilding drive data
CN107506266B (zh) 一种数据恢复方法及系统
US9529674B2 (en) Storage device management of unrecoverable logical block addresses for RAID data regeneration
US10643668B1 (en) Power loss data block marking
CN104166601B (zh) 一种存储数据的备份方法和装置
WO2020103512A1 (zh) 一种存储系统中的数据重构方法和装置
CN106708646A (zh) 硬盘异常自动复位方法及其装置
CN107179968B (zh) 信息存储装置、故障预测装置及故障预测方法
CN107229537A (zh) 一种数据库实时备份方法
CN104794018A (zh) 希捷硬盘固件故障问题导致不被识别的数据恢复方法
CN104391755A (zh) 嵌入式多媒体卡eMMC芯片异常的处理方法和装置
CN104461791A (zh) 一种信息处理方法及处理装置
CN108170375B (zh) 一种分布式存储系统中的超限保护方法和装置
CN100501686C (zh) 在差错处理程序执行期间处理差错的方法、处理器及系统
CN103678517A (zh) 修复硬盘逻辑错误的方法及控制器
US20120144245A1 (en) Computing device and method for detecting pci system errors in the computing device
CN105808161A (zh) 一种硬盘坏道数据的读取方法
CN104020963B (zh) 一种防止误判硬盘读写错误的方法和装置
CN102081580A (zh) 一种磁盘数据保护方法
CN115061641B (zh) 一种磁盘故障处理方法、装置、设备以及存储介质
CN110515756A (zh) 一种存储系统的故障预防方法、装置、设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150527