CN104657237A - 一种检测磁盘阵列的方法 - Google Patents
一种检测磁盘阵列的方法 Download PDFInfo
- Publication number
- CN104657237A CN104657237A CN201510108155.1A CN201510108155A CN104657237A CN 104657237 A CN104657237 A CN 104657237A CN 201510108155 A CN201510108155 A CN 201510108155A CN 104657237 A CN104657237 A CN 104657237A
- Authority
- CN
- China
- Prior art keywords
- data
- disk
- disk array
- write
- read
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000001514 detection method Methods 0.000 claims abstract description 16
- 238000011084 recovery Methods 0.000 abstract description 4
- 239000006249 magnetic particle Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明特别涉及一种检测磁盘阵列的方法。该检测磁盘阵列的方法,在系统负载较低的情况下对磁盘阵列进行检测、利用冗余信息对数据进行恢复、及时产生告警信息,检测过程中保证磁盘读写业务正常进行和确保系统稳定性。该检测磁盘阵列的方法,在判定系统负载较低的情况下,通过周期性的读写指定的磁盘来检测数据丢失的情况,并通过RAID冗余信息进行数据恢复,这样在数据读写的检测过程中就减少了磁介质发生偏移的几率,并能对已经发生偏移的数据进行恢复;如果RAID冗余信息也无法恢复正确的数据,则产生告警信息,通知管理员及时处理,这样就可以有效解决长时间未经读写的磁盘容易出现数据丢失的问题,减少问题发生的几率,提高系统的可靠性。
Description
技术领域
本发明涉及计算机系统及存储技术领域,特别涉及一种检测磁盘阵列的方法。
背景技术
磁盘模块是存储系统的基础模块,磁盘模块的可靠性和健壮程度,严重影响存储产品的整体性能和可靠性。
磁盘通过盘片表面的磁性粒子来记录数据。这些磁性粒子就好像无数任意排列的小磁铁,每个磁性粒子都有自己的磁场,它们的磁极分别表示了数据的0和1。在磁头的影响下有规则的进行排列,就可以用来记录数据。当某些磁盘或磁盘中的某些扇区在写入数据后,长时间没有读写,磁介质可能会发生偏移,从而导致数据丢失。如果这些磁盘或扇区发生问题并且未被及时发现,就会有数据永久性丢失的风险。
当前一般的磁盘都会在负载比较低的时候通过磁盘内部读写来解决磁介质偏移导致数据丢失的问题,但其实现不可控且不可恢复错误数据。
在不影响业务和磁盘阵列可靠性的前提下,如果能够尽可能早的发现和处理有问题的成员盘,就能大幅度降低因坏道等原因引起的双盘失效和数据丢失的概率。另外,为了避免磁介质偏移导致数据丢失这一现象,可以通过周期性的读写磁盘来及时发现问题,修复错误和恢复数据。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单有效的检测磁盘阵列的方法。
本发明是通过如下技术方案实现的:
一种检测磁盘阵列的方法,其特征在于:在判定系统负载较低的情况下,启动对指定磁盘阵列的检测,检测过程通过直接读取磁盘阵列数据来判断磁盘是否发生数据丢失的情况,利用冗余信息对数据进行恢复,及时产生告警信息,同时在检测过程中保证磁盘读写业务正常进行和确保系统稳定性。
当读取数据正常时,将读取的数据重新写入磁盘阵列;
当读取数据失败时,通过RAID接口利用冗余信息读取正确数据,通过RAID接口读取到正确数据后,再通过RAID接口将数据重新写入磁盘以恢复数据;若通过RAID冗余信息无法获得正确的数据,此时要及时产生告警信息,通知管理员及时处理。
磁盘检测过程中,为不影响正常的磁盘阵列读写请求,需要对同一区域同时有读写请求的情况进行检测判断,将有冲突的业务请求或巡检请求放入等待队列,待冲突消除唤醒等待队列继续处理,以保证正常的磁盘读写请求不受影响。
检测过程在系统负载较低的情况下进行,是指磁盘检测是系统的辅助功能,是为提高系统的可靠性而设立,不能过多的与上层的磁盘读写业务争抢资源。
检测过程中不影响正常的磁盘阵列读写业务,是指检测过程和读写磁盘阵列的业务难免会发生读写同一区域的情况,此时需要对有冲突的情况进行检测,使用等待队列保证磁盘读写业务正常进行。
初步检测到错误可利用冗余信息对数据进行恢复,是指检测过程中遇到读取数据异常的区域,可利用RAID冗余信息对该区域进行数据恢复,并将恢复的数据重新写入。
本发明的有益效果是:该检测磁盘阵列的方法,在判定系统负载较低的情况下,通过周期性的读写指定的磁盘来检测数据丢失的情况,并通过RAID冗余信息进行数据恢复,这样在数据读写的检测过程中就减少了磁介质发生偏移的几率,并能对已经发生偏移的数据进行恢复;如果RAID冗余信息也无法恢复正确的数据,则产生告警信息,通知管理员及时处理,这样就可以有效解决长时间未经读写的磁盘容易出现数据丢失的问题,减少问题发生的几率,提高系统的可靠性。
附图说明
附图1为本发明中检测磁盘阵列的方法示意图。
具体实施方式
下面结合附图对本发明进行详细说明。
该检测磁盘阵列的方法,在判定系统负载较低的情况下,启动对指定磁盘阵列的检测,检测过程通过直接读取磁盘阵列数据来判断磁盘是否发生数据丢失的情况,利用冗余信息对数据进行恢复,及时产生告警信息,同时在检测过程中保证磁盘读写业务正常进行和确保系统稳定性。
当读取数据正常时,将读取的数据重新写入磁盘阵列;
当读取数据失败时,通过RAID接口利用冗余信息读取正确数据,通过RAID接口读取到正确数据后,再通过RAID接口将数据重新写入磁盘以恢复数据;若通过RAID冗余信息无法获得正确的数据,此时要及时产生告警信息,通知管理员及时处理。
磁盘检测过程中,为不影响正常的磁盘阵列读写请求,需要对同一区域同时有读写请求的情况进行检测判断,将有冲突的业务请求或巡检请求放入等待队列,待冲突消除唤醒等待队列继续处理,以保证正常的磁盘读写请求不受影响。
检测过程在系统负载较低的情况下进行,是指磁盘检测是系统的辅助功能,是为提高系统的可靠性而设立,不能过多的与上层的磁盘读写业务争抢资源。
检测过程中不影响正常的磁盘阵列读写业务,是指检测过程和读写磁盘阵列的业务难免会发生读写同一区域的情况,此时需要对有冲突的情况进行检测,使用等待队列保证磁盘读写业务正常进行。
初步检测到错误可利用冗余信息对数据进行恢复,是指检测过程中遇到读取数据异常的区域,可利用RAID冗余信息对该区域进行数据恢复,并将恢复的数据重新写入。
该检测磁盘阵列的方法,在判定系统负载较低的情况下,通过周期性的读写指定的磁盘来检测数据丢失的情况,并通过RAID冗余信息进行数据恢复,这样在数据读写的检测过程中就减少了磁介质发生偏移的几率,并能对已经发生偏移的数据进行恢复;如果RAID冗余信息也无法恢复正确的数据,则产生告警信息,通知管理员及时处理,这样就可以有效解决长时间未经读写的磁盘容易出现数据丢失的问题,减少问题发生的几率,提高系统的可靠性。
Claims (3)
1.一种检测磁盘阵列的方法,其特征在于:在判定系统负载较低的情况下,启动对指定磁盘阵列的检测,检测过程通过直接读取磁盘阵列数据来判断磁盘是否发生数据丢失的情况,利用冗余信息对数据进行恢复,及时产生告警信息,同时在检测过程中保证磁盘读写业务正常进行和确保系统稳定性。
2.根据权利要求1所述的检测磁盘阵列的方法,其特征在于:
当读取数据正常时,将读取的数据重新写入磁盘阵列;
当读取数据失败时,通过RAID接口利用冗余信息读取正确数据,通过RAID接口读取到正确数据后,再通过RAID接口将数据重新写入磁盘以恢复数据;若通过RAID冗余信息无法获得正确的数据,此时要及时产生告警信息,通知管理员及时处理。
3.根据权利要求1所述的检测磁盘阵列的方法,其特征在于:磁盘检测过程中,为不影响正常的磁盘阵列读写请求,需要对同一区域同时有读写请求的情况进行检测判断,将有冲突的业务请求或巡检请求放入等待队列,待冲突消除唤醒等待队列继续处理,以保证正常的磁盘读写请求不受影响。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510108155.1A CN104657237A (zh) | 2015-03-12 | 2015-03-12 | 一种检测磁盘阵列的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510108155.1A CN104657237A (zh) | 2015-03-12 | 2015-03-12 | 一种检测磁盘阵列的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104657237A true CN104657237A (zh) | 2015-05-27 |
Family
ID=53248409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510108155.1A Pending CN104657237A (zh) | 2015-03-12 | 2015-03-12 | 一种检测磁盘阵列的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104657237A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107656830A (zh) * | 2017-10-09 | 2018-02-02 | 郑州云海信息技术有限公司 | 一种全闪系统的健康巡检方法、系统及计算机设备 |
CN109976978A (zh) * | 2019-04-03 | 2019-07-05 | 湖南科技学院 | 一种基于大数据的计算机性能控制系统 |
CN111459399A (zh) * | 2019-01-22 | 2020-07-28 | 深圳市茁壮网络股份有限公司 | 一种数据写入方法、数据读取方法及装置 |
CN115904235A (zh) * | 2022-11-11 | 2023-04-04 | 深圳市数存科技有限公司 | 一种数据生命周期管理方法及装置 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1551202A (zh) * | 2003-05-06 | 2004-12-01 | �Ҵ���˾ | 自修复方法和存储系统 |
CN1684042A (zh) * | 2004-04-13 | 2005-10-19 | 英业达股份有限公司 | 多种互斥条件下的多模式测试系统及其方法 |
US20060218343A1 (en) * | 2005-03-25 | 2006-09-28 | Naoki Higashijima | Storage control device and storage device error control method |
CN1866226A (zh) * | 2005-05-17 | 2006-11-22 | 英业达股份有限公司 | 数据保护方法 |
CN101236482A (zh) * | 2008-02-26 | 2008-08-06 | 杭州华三通信技术有限公司 | 降级状态下处理数据的方法及独立冗余磁盘阵列系统 |
CN101615203A (zh) * | 2009-07-23 | 2009-12-30 | 中兴通讯股份有限公司 | 并发控制方法及装置 |
CN101764846A (zh) * | 2009-12-18 | 2010-06-30 | 西南交通大学 | 一种远程集中式磁盘阵列运行监控系统及其实现方法 |
CN102508733A (zh) * | 2011-09-22 | 2012-06-20 | 杭州华三通信技术有限公司 | 一种基于磁盘阵列的数据处理方法及磁盘阵列管理器 |
CN103064777A (zh) * | 2012-12-24 | 2013-04-24 | 华为技术有限公司 | 磁盘阵列告警显示方法和装置 |
CN103246548A (zh) * | 2012-02-02 | 2013-08-14 | 迈普通信技术股份有限公司 | 一种容错保序的事件调度方法及装置 |
CN103631831A (zh) * | 2012-08-29 | 2014-03-12 | 阿里巴巴集团控股有限公司 | 一种数据备份方法及装置 |
CN103729276A (zh) * | 2014-01-28 | 2014-04-16 | 深圳市迪菲特科技股份有限公司 | 一种扫描磁盘阵列的方法 |
CN103729253A (zh) * | 2013-12-31 | 2014-04-16 | 深圳市科漫达智能管理科技有限公司 | 一种独占资源使用方法及装置 |
CN103942111A (zh) * | 2014-03-31 | 2014-07-23 | 华为技术有限公司 | 数据修复方法及装置 |
-
2015
- 2015-03-12 CN CN201510108155.1A patent/CN104657237A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1551202A (zh) * | 2003-05-06 | 2004-12-01 | �Ҵ���˾ | 自修复方法和存储系统 |
CN1684042A (zh) * | 2004-04-13 | 2005-10-19 | 英业达股份有限公司 | 多种互斥条件下的多模式测试系统及其方法 |
US20060218343A1 (en) * | 2005-03-25 | 2006-09-28 | Naoki Higashijima | Storage control device and storage device error control method |
CN1866226A (zh) * | 2005-05-17 | 2006-11-22 | 英业达股份有限公司 | 数据保护方法 |
CN101236482A (zh) * | 2008-02-26 | 2008-08-06 | 杭州华三通信技术有限公司 | 降级状态下处理数据的方法及独立冗余磁盘阵列系统 |
CN101615203A (zh) * | 2009-07-23 | 2009-12-30 | 中兴通讯股份有限公司 | 并发控制方法及装置 |
CN101764846A (zh) * | 2009-12-18 | 2010-06-30 | 西南交通大学 | 一种远程集中式磁盘阵列运行监控系统及其实现方法 |
CN102508733A (zh) * | 2011-09-22 | 2012-06-20 | 杭州华三通信技术有限公司 | 一种基于磁盘阵列的数据处理方法及磁盘阵列管理器 |
CN103246548A (zh) * | 2012-02-02 | 2013-08-14 | 迈普通信技术股份有限公司 | 一种容错保序的事件调度方法及装置 |
CN103631831A (zh) * | 2012-08-29 | 2014-03-12 | 阿里巴巴集团控股有限公司 | 一种数据备份方法及装置 |
CN103064777A (zh) * | 2012-12-24 | 2013-04-24 | 华为技术有限公司 | 磁盘阵列告警显示方法和装置 |
CN103729253A (zh) * | 2013-12-31 | 2014-04-16 | 深圳市科漫达智能管理科技有限公司 | 一种独占资源使用方法及装置 |
CN103729276A (zh) * | 2014-01-28 | 2014-04-16 | 深圳市迪菲特科技股份有限公司 | 一种扫描磁盘阵列的方法 |
CN103942111A (zh) * | 2014-03-31 | 2014-07-23 | 华为技术有限公司 | 数据修复方法及装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107656830A (zh) * | 2017-10-09 | 2018-02-02 | 郑州云海信息技术有限公司 | 一种全闪系统的健康巡检方法、系统及计算机设备 |
CN111459399A (zh) * | 2019-01-22 | 2020-07-28 | 深圳市茁壮网络股份有限公司 | 一种数据写入方法、数据读取方法及装置 |
CN109976978A (zh) * | 2019-04-03 | 2019-07-05 | 湖南科技学院 | 一种基于大数据的计算机性能控制系统 |
CN115904235A (zh) * | 2022-11-11 | 2023-04-04 | 深圳市数存科技有限公司 | 一种数据生命周期管理方法及装置 |
CN115904235B (zh) * | 2022-11-11 | 2024-07-05 | 深圳市数存科技有限公司 | 一种数据生命周期管理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103309775B (zh) | 一种高可靠磁盘阵列的容错方法 | |
CN104657237A (zh) | 一种检测磁盘阵列的方法 | |
KR101574844B1 (ko) | Smr raid용의 대블록 무작위 쓰기 핫 스페어 ssd 구현 | |
WO2019196199A1 (zh) | 一种磁盘坏道的处理方法、装置及计算机存储介质 | |
US20140208155A1 (en) | Rebuilding drive data | |
CN107506266B (zh) | 一种数据恢复方法及系统 | |
US9529674B2 (en) | Storage device management of unrecoverable logical block addresses for RAID data regeneration | |
US10643668B1 (en) | Power loss data block marking | |
CN104166601B (zh) | 一种存储数据的备份方法和装置 | |
WO2020103512A1 (zh) | 一种存储系统中的数据重构方法和装置 | |
CN106708646A (zh) | 硬盘异常自动复位方法及其装置 | |
CN107179968B (zh) | 信息存储装置、故障预测装置及故障预测方法 | |
CN107229537A (zh) | 一种数据库实时备份方法 | |
CN104794018A (zh) | 希捷硬盘固件故障问题导致不被识别的数据恢复方法 | |
CN104391755A (zh) | 嵌入式多媒体卡eMMC芯片异常的处理方法和装置 | |
CN104461791A (zh) | 一种信息处理方法及处理装置 | |
CN108170375B (zh) | 一种分布式存储系统中的超限保护方法和装置 | |
CN100501686C (zh) | 在差错处理程序执行期间处理差错的方法、处理器及系统 | |
CN103678517A (zh) | 修复硬盘逻辑错误的方法及控制器 | |
US20120144245A1 (en) | Computing device and method for detecting pci system errors in the computing device | |
CN105808161A (zh) | 一种硬盘坏道数据的读取方法 | |
CN104020963B (zh) | 一种防止误判硬盘读写错误的方法和装置 | |
CN102081580A (zh) | 一种磁盘数据保护方法 | |
CN115061641B (zh) | 一种磁盘故障处理方法、装置、设备以及存储介质 | |
CN110515756A (zh) | 一种存储系统的故障预防方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150527 |