CN102981870B - Linux系统中的磁盘离线处理方法 - Google Patents
Linux系统中的磁盘离线处理方法 Download PDFInfo
- Publication number
- CN102981870B CN102981870B CN201210437209.5A CN201210437209A CN102981870B CN 102981870 B CN102981870 B CN 102981870B CN 201210437209 A CN201210437209 A CN 201210437209A CN 102981870 B CN102981870 B CN 102981870B
- Authority
- CN
- China
- Prior art keywords
- disk
- linux system
- standard grade
- reached
- processed offline
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种Linux系统中的磁盘离线处理方法,包括:Linux系统感测到磁盘离线;如果在预定时间内磁盘没有重新上线,则从存储系统中删除磁盘。通过本发明所描述的方法,能够主动管理磁盘上线及离线事件,减少人工干预,管理员只需要根据提示,将磁盘插入或者拔出,其余的工作可以由系统主动完成。对于临时性故障,在宽限期内不做主动的处理,以避免数据的重建造成额外的IO压力。
Description
技术领域
本发明基本上涉及服务器领域,更具体地来说,涉及一种Linux系统中的磁盘离线处理方法。
背景技术
卡内基梅隆大学在旧金山的第五届USENIX Conference大会上指出,对大约10万块磁盘进行研究后的结论是:磁盘产品的实际失效几率是MTTF(平均无故障时间)指标的15倍之多。实际的每年失效概率一般都会超过1%,通常在2-4%左右。在某些极端情况下甚至高达13%以上,甚至24%。而MTTF在最坏的情况下,仅为0.88%。
根据国际数据公司(IDC)的数据统计,全球的数据产生量在2011达到了1.8ZB。预测今后十年,用于存储数据的全球服务器总量将增长十倍。到2015年,将有接近20%的信息被存储在云存储服务中。
根据对Linux系统中磁盘的使用情况进行分析,在系统长时间高I/O负载的情况下,磁盘会出现短暂的离线故障,在I/O负载降低后,又会自动上线。这与目前的X86总线结构与磁盘控制器有关,是无法避免的。
对于建立在普通磁盘之上的云存储系统,能够快速的在线处理故障磁盘与扩容存储容量,是实现系统可靠性与可扩展性的必要条件。
udev(动态设备管理模块)是Linux操作系统中的一个服务,可以发现操作系统中设备的的添加与删除时间。udev经过配置后,可以与其他应用程序一起,完成设备的初始化与卸载工作。
通常处理方式是人工全程干预,且对于临时性的磁盘离线故障,没有可靠地判断手段,一律视为永久性的磁盘故障,需要全部重建磁盘上的数据。
发明内容
为了克服上述缺陷,本发明提出了一种在Linux系统中的磁盘离线处理方法,解决了如何在Linux系统中更准确地处理磁盘离线事件的技术问题。
本发明公开了一种Linux系统中的磁盘离线处理方法,其特征在于,包括:步骤S1:所述Linux系统感测到磁盘离线;以及步骤S2:如果在预定时间内所述磁盘没有重新上线,则从存储系统中删除所述磁盘。
优选地,所述步骤S1包括:所述Linux系统中的动态设备管理模块(udev)感测到磁盘离线,生成磁盘离线信号,并且将所述磁盘离线信号发送至系统管理模块。
优选地,所述步骤S1还包括:所述系统管理模块响应于所述磁盘离线信号,将所述磁盘在预定时间内标识为临时离线状态。
优选地,所述步骤S2还包括:如果在预定时间内所述磁盘没有重新上线,则所述系统管理模块将所述磁盘标识为故障状态。
5.根据权利要求4所述的Linux系统中的磁盘离线处理方法,其特征在于,所述步骤S2还包括:如果在预定时间内所述磁盘没有重新上线,则在其他磁盘上使用冗余副本重建数据。
优选地,所述步骤S1还包括:将对所述磁盘的操作请求挂起,如果在预定时间内所述磁盘重新上线,则执行挂起的所述操作请求。
优选地,所述步骤S1还包括:将对所述磁盘的操作请求挂起,如果在预定时间内所述磁盘没有重新上线,则拒绝执行挂起的所述操作请求。
优选地,所述方法:如果在预定时间之后所述磁盘重新上线,则将所述磁盘作为新磁盘加入所述存储系统中。
优选地,其特征在于,所述操作请求包括写入操作请求和读取操作请求。
优选地,所述预定时间为1分钟至10分钟。
根据本发明所描述的Linux系统中的磁盘离线处理方法,能够更准确地处理磁盘离线事件,更好地保证了统的稳定运行。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是根据本发明的Linux系统中的磁盘离线处理方法的实施例的总体流程图;
图2是根据本发明的Linux系统中的磁盘离线处理方法的一个优选实施例的具体流程图;
图3是根据本发明的Linux系统中的磁盘离线处理方法的另一个优选实施例的具体流程图。
具体实施方式
下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1是根据本发明的Linux系统中的磁盘离线处理方法的实施例的总体流程图。在图1中:
步骤S100:在Linux系统中,感测到有磁盘离线。此时,现有技术中通常将该离线事件视为磁盘故障。然而,现实中很多情况并非是由于磁盘故障导致的磁盘离线,而只是磁盘的短暂的临时性离线现象。因此,要提供该磁盘离线事件一定的“宽限期”,具体步骤如步骤S102所述。
步骤S102:如果在预定时间内该磁盘没有重新上线,则从存储系统中删除该磁盘。也就是说,只有当该磁盘在预定时间没有重新上线,也就是说该硬盘并非“临时性”离线时,才从存储系统中将该硬盘删除。其中,该预定时间包括但不限于1分钟至10分钟。
本发明能够主动管理磁盘上线及离线事件,减少人工干预,管理员只需要根据提示,将磁盘插入或者拔出,其余的工作可以由系统主动完成。对于临时性故障,在宽限期内不做主动的处理,以避免数据的重建造成额外的IO压力。
图2是根据本发明的Linux系统中的磁盘离线处理方法的一个优选实施例的具体流程图。在图2中:
步骤S200:Linux系统中的动态设备管理模块(udev)感测到磁盘离线,生成磁盘离线信号,并且将磁盘离线信号发送至系统管理模块。
步骤S202:系统管理模块响应于所述磁盘离线信号,将磁盘在预定时间内标识为临时离线状态。
步骤S204:如果在预定时间内磁盘没有重新上线,则从存储系统中删除磁盘,系统管理模块将磁盘标识为故障状态并且在其他磁盘上使用冗余副本重建数据。
本发明能够主动管理磁盘上线及离线事件,减少人工干预,管理员只需要根据提示,将磁盘插入或者拔出,其余的工作可以由系统主动完成。对于临时性故障,在宽限期内不做主动的处理,以避免数据的重建造成额外的IO压力。
图3是根据本发明的Linux系统中的磁盘离线处理方法的另一个优选实施例的具体流程图。在图3所描述的优选实施例中,对磁盘生成操作请求(包括但不限于写入操作请求和读取操作请求),此时,本实施例要根据磁盘是否在预定时间重新上线来判断是否执行该请求。其中:
步骤S300:在Linux系统中,感测到有磁盘离线。
步骤S302:当对该磁盘有操作请求时,将对该磁盘的操作请求挂起。
此时,可能出现两种情况,即在预定时间内,该离线硬盘是否重新上线。如果该磁盘没有重新上线,则执行步骤S304;如果该磁盘重新上线,则执行步骤S306。在步骤S304中,拒绝执行挂起的操作请求,然后执行步骤S308,从存储系统中删除该磁盘。而在步骤S306中,执行该挂起的操作请求。
本实施例能够主动管理磁盘上线及离线事件,减少人工干预,管理员只需要根据提示,将磁盘插入或者拔出,其余的工作可以由系统主动完成。对于临时性故障,在宽限期内不做主动的处理,以避免数据的重建造成额外的IO压力。此外,本实施例可以对磁盘的操作请求进行灵活的执行。
以下将通过一个实例来描述上述方法:
在本实例中,在数据服务器上运行磁盘处理模块,通过侦听udev(动态设备管理模块)事件发现磁盘的热插拔事件,归类为存储系统中的磁盘的离线与上线动作。主动进行处理。本实例使用独立的管理模块、数据模块、磁盘处理模块共同完成磁盘的热插拔处理。
数据服务模块与磁盘处理模块均位于数据器,管理模块可以在本地,也可以异地。
其中,磁盘离线时处理顺序如下:
磁盘处理模块侦听设备事件,得到udev(动态设备管理模块)的磁盘离线通知后,通知管理模块。管理模块为磁盘设置一个宽限期(通常是几分钟)。宽限期内标注磁盘临时离线,不对磁盘上的数据做出处理。如果宽限期内,能够得到磁盘的上线事件,不对磁盘做出任何处理。磁盘上的数据依旧可用。在此过程中,数据处理模块对磁盘的写入或读取操作均被挂起。如果宽限期内未得到磁盘上线事件,管理模块标记磁盘损坏,通知磁盘处理模块,从存储系统中删除该磁盘,并通知数据服务模块,在其它磁盘上使用冗余副本重建数据,宽限期内挂起的操作请求返回失败。
其中,磁盘上线时处理顺序如下:
磁盘处理模块侦听设备事件,得到udev(动态设备管理模块)的磁盘离线通知后,通知管理模块处理磁盘。磁盘是宽限期内的离线磁盘,管理模块通知磁盘处理模块将磁盘加入系统,并通知数据服务模块,唤醒挂起的写入与读取请求。不在宽限期内,一律作为新磁盘上线处理。管理模块通知磁盘处理模块,在磁盘上创建文件系统并加入到系统中,完成后通知数据服务模块,磁盘可用。
本实例能够主动管理磁盘上线及离线事件,减少人工干预,管理员只需要根据提示,将磁盘插入或者拔出,其余的工作可以由系统主动完成。对于临时性故障,在宽限期内不做主动的处理,以避免数据的重建造成额外的IO压力。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种Linux系统中的磁盘离线处理方法,其特征在于,包括:
步骤S1:所述Linux系统感测到磁盘离线;以及
步骤S2:如果在预定时间内所述磁盘没有重新上线,则从存储系统中删除所述磁盘;
所述步骤S2还包括:如果在预定时间内所述磁盘没有重新上线,则在其他磁盘上使用冗余副本重建数据;
如果在预定时间之后所述磁盘重新上线,则将所述磁盘作为新磁盘加入所述存储系统中;
其中,所述步骤S1进一步包括:所述Linux系统中的动态设备管理模块udev感测到磁盘离线,生成磁盘离线信号,并且将所述磁盘离线信号发送至系统管理模块;以及,
所述步骤S1还包括:所述系统管理模块响应于所述磁盘离线信号,将所述磁盘在预定时间内标识为临时离线状态。
2.根据权利要求1所述的Linux系统中的磁盘离线处理方法,其特征在于,所述步骤S2还包括:如果在预定时间内所述磁盘没有重新上线,则所述系统管理模块将所述磁盘标识为故障状态。
3.根据权利要求1所述的Linux系统中的磁盘离线处理方法,其特征在于,所述步骤S1还包括:将对所述磁盘的操作请求挂起,如果在预定时间内所述磁盘重新上线,则执行挂起的所述操作请求。
4.根据权利要求3所述的Linux系统中的磁盘离线处理方法,其特征在于,所述步骤S1还包括:将对所述磁盘的操作请求挂起,如果在预定时间内所述磁盘没有重新上线,则拒绝执行挂起的所述操作请求。
5.根据权利要求4所述的Linux系统中的磁盘离线处理方法,其特征在于,所述操作请求包括写入操作请求和读取操作请求。
6.根据权利要求1所述的Linux系统中的磁盘离线处理方法,其特征在于,所述预定时间为1分钟至10分钟。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210437209.5A CN102981870B (zh) | 2012-11-05 | 2012-11-05 | Linux系统中的磁盘离线处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210437209.5A CN102981870B (zh) | 2012-11-05 | 2012-11-05 | Linux系统中的磁盘离线处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102981870A CN102981870A (zh) | 2013-03-20 |
CN102981870B true CN102981870B (zh) | 2016-08-31 |
Family
ID=47855932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210437209.5A Active CN102981870B (zh) | 2012-11-05 | 2012-11-05 | Linux系统中的磁盘离线处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102981870B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103297264B (zh) * | 2013-04-19 | 2017-04-12 | 无锡成电科大科技发展有限公司 | 一种云平台故障恢复方法和系统 |
CN103744708A (zh) * | 2014-01-23 | 2014-04-23 | 浪潮电子信息产业股份有限公司 | 一种实现linux操作系统下固定磁盘设备名的方法 |
CN108170375B (zh) * | 2017-12-21 | 2020-12-18 | 创新科技术有限公司 | 一种分布式存储系统中的超限保护方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101557320A (zh) * | 2009-05-25 | 2009-10-14 | 杭州华三通信技术有限公司 | 容灾的实现方法及其通信设备 |
CN101630237A (zh) * | 2009-08-25 | 2010-01-20 | 成都市华为赛门铁克科技有限公司 | 一种对raid进行控制的方法、装置和系统 |
-
2012
- 2012-11-05 CN CN201210437209.5A patent/CN102981870B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101557320A (zh) * | 2009-05-25 | 2009-10-14 | 杭州华三通信技术有限公司 | 容灾的实现方法及其通信设备 |
CN101630237A (zh) * | 2009-08-25 | 2010-01-20 | 成都市华为赛门铁克科技有限公司 | 一种对raid进行控制的方法、装置和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102981870A (zh) | 2013-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9372743B1 (en) | System and method for storage management | |
CN102301339B (zh) | 用于控制固态盘(ssd)设备的装置和方法 | |
CN103797469B (zh) | 一种计算机系统、高速外围组件互联端点设备的访问方法和装置 | |
US8732429B2 (en) | Preserving a deleted data volume | |
KR20170068373A (ko) | 메모리 데이터 보호 메커니즘을 갖는 전자 시스템 및 그것의 동작 방법 | |
CN102981870B (zh) | Linux系统中的磁盘离线处理方法 | |
CN102033793A (zh) | 快照方法和固态硬盘 | |
US20150149806A1 (en) | Hard Power Fail Architecture | |
US11803222B2 (en) | Systems and methods for managing reduced power failure energy requirements on a solid state drive | |
US20220334733A1 (en) | Data restoration method and related device | |
US8555118B2 (en) | System and method for processing network data of a server | |
US7844776B2 (en) | RAID capacity expansion handling method and system with concurrent data access capability | |
US10001826B2 (en) | Power management mechanism for data storage environment | |
CN105159846B (zh) | 一种支持虚拟化磁盘双控切换的方法和存储系统 | |
CN104020963B (zh) | 一种防止误判硬盘读写错误的方法和装置 | |
WO2016101225A1 (zh) | 一种数据备份的方法、装置及系统 | |
CN103297264A (zh) | 一种云平台故障恢复方法和系统 | |
US20150269237A1 (en) | Disaster Recovery of Converged Infrastructure Platforms | |
CN106909477A (zh) | 一种存储服务器io栈内存数据保护方法及装置 | |
CN106254806A (zh) | 一种录像数据保护方法和装置 | |
CN109426588B (zh) | 实现数据保护的方法及系统、数据分发处理模块 | |
CN105094712A (zh) | 一种数据处理方法及装置 | |
US20150089133A1 (en) | Data storage system and control method thereof | |
US10089202B1 (en) | Providing data high availability to a set of host computers via automatic failover | |
CN104572350B (zh) | 一种元数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220728 Address after: 100089 building 36, courtyard 8, Dongbeiwang West Road, Haidian District, Beijing Patentee after: Dawning Information Industry (Beijing) Co.,Ltd. Patentee after: DAWNING INFORMATION INDUSTRY Co.,Ltd. Address before: 100193 No. 36 Building, No. 8 Hospital, Wangxi Road, Haidian District, Beijing Patentee before: Dawning Information Industry (Beijing) Co.,Ltd. |
|
TR01 | Transfer of patent right |