CN102855289A - 一种集群文件系统动态修改存储单元failover的方法 - Google Patents
一种集群文件系统动态修改存储单元failover的方法 Download PDFInfo
- Publication number
- CN102855289A CN102855289A CN 201210281794 CN201210281794A CN102855289A CN 102855289 A CN102855289 A CN 102855289A CN 201210281794 CN201210281794 CN 201210281794 CN 201210281794 A CN201210281794 A CN 201210281794A CN 102855289 A CN102855289 A CN 102855289A
- Authority
- CN
- China
- Prior art keywords
- failover
- storage unit
- management module
- node
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 12
- 238000007726 management method Methods 0.000 claims abstract description 25
- 238000013500 data storage Methods 0.000 claims abstract description 14
- 210000004027 cell Anatomy 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 210000000352 storage cell Anatomy 0.000 claims description 3
- 239000000969 carrier Substances 0.000 abstract 1
- 238000012544 monitoring process Methods 0.000 abstract 1
- 230000002567 autonomic effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种集群文件系统动态修改存储单元failover的方法,系统包括:数据存储集群(1);存储单元管理模块(2);卷管理模块(3),其中:数据存储集群(1)提供数据存储单元,负责去掉元数据之后的数据存储;存储单元管理模块(2)提供多个存储单元LUN给数据存储集群(1),用来提供数据存储的载体;卷管理模块(3)作用是时时监控存储单元的failover域和节点状态,并能够动态修改存储单元的failover;该方法适用于分布式、并行文件系统中,能够实现存储单元(LUN)的failover动态改变,并且是在不中断业务的情况下执行,最大程度的保证了存储单元的可用性,提高了集群的数据安全性。
Description
技术领域
本发明涉及计算机技术领域, 具体地说是一种集群文件系统动态修改存储单元failover的方法。
背景技术
目前部分分布式文件系统为了实现存储单元(LUN)的高可用性,一般的做法是给存储单元(LUN)添加failover域,failover域是一种高可用机制,包含存储单元(LUN)的挂载节点信息,主要是ip地址和网络类型,这样当某个节点失效的时候,存储单元会自动迁移到failover域中指定的节点上去,从而保证数据高可用性。但是该方法的问题是,该方法不能动态实现给存储单元(LUN)添加failover域,具有一定的局限性。本发明就是针对该问题而提出的一种能够动态修改failover域的方法,能够有效的提高集群文件系统的高可用性。
发明内容
本发明的目的是提供一种集群文件系统动态修改存储单元failover的方法。该方法主要创新是卷管理模块(3)能够时时检测数据存储集群(1)中各个节点的状态,并且当某一个节点失效的时候,能够保证动态修改与该失效节点对应的存储单元(LUN)的failover,从而可以有效的提高集群的高可用性。
本发明的目的是按以下方式实现的,系统包括:数据存储集群(1);存储单元管理模块(2);卷管理模块(3),其中:
数据存储集群(1)提供数据存储单元,负责去掉元数据之后的数据存储;
存储单元管理模块(2)提供多个存储单元LUN给数据存储集群(1),用来提供数据存储的载体;
卷管理模块(3)作用是时时监控存储单元的failover域和节点状态,并能够动态修改存储单元的failover;
具体步骤如下:
1)在正常情况下,指定LUN0的failover为10.0.0.1和10.0.0.2两个ip地址;
2)当节点Node2出现故障后,卷管理模块(3)会启动,根据集群中各个节点的负载情况,自动检测集群中没有出现故障的节点作为LUN0的failover;
3)然后,卷管理模块(3)自动修改LUN0的failover值,并且是在不影响客户端业务的情况下进行;
4)修改后的LUN0的failover值变成了10.0.0.1和10.0.0.3,此时LUN0的failover域重新恢复完成,保证了存储单元的高可用性,从而提高了集群系统的稳定性。
卷管理模块(3)能够监控集群节点状态,当集群中节点出现故障时,能够动态修改该节点对应存储单元的failover值,保证存储单元能够切换到其他节点上,所有这些操作都是在不停掉服务的前提下实现的,保证客户端业务不中断。
本发明的有益效果是:通常适用于分布式、并行文件系统中,能够实现存储单元(LUN)的failover动态改变,并且是在不中断业务的情况下执行,最大程度的保证了存储单元的可用性,提高了集群的数据安全性。
附图说明
附图1为节点出现故障前存储单元的状态;
附图2为节点出现故障后存储单元的状态。
具体实施方式
参照说明书附图对本发明的作以下详细地说明。
如附图所示,系统包括:数据存储集群(1);存储单元管理模块(2);卷管理模块(3),其中:
数据存储集群(1)提供数据存储单元,负责去掉元数据之后的数据存储;
存储单元管理模块(2)提供多个存储单元LUN给数据存储集群(1),用来提供数据存储的载体;
卷管理模块(3)作用是时时监控存储单元的failover域和节点状态,并能够动态修改存储单元的failover。
实施例
1)在正常情况下,指定LUN0的failover为10.0.0.1和10.0.0.2两个ip地址;
2)当节点Node2出现故障后,卷管理模块(3)会启动,根据集群中各个节点的负载情况,自动检测集群中没有出现故障的节点作为LUN0的failover
3)然后,卷管理模块(3)自动修改LUN0的failover值,并且是在不影响客户端业务的情况下进行;
4)修改后的LUN0的failover值变成了10.0.0.1和10.0.0.3,此时LUN0的failover域重新恢复完成,保证了存储单元的高可用性,从而提高了集群系统的稳定性。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。
Claims (2)
1.一种集群文件系统动态修改存储单元failover的方法, 其特征在于系统包括:数据存储集群(1);存储单元管理模块(2);卷管理模块(3),其中:
数据存储集群(1)提供数据存储单元,负责去掉元数据之后的数据存储;
存储单元管理模块(2)提供多个存储单元LUN给数据存储集群(1),用来提供数据存储的载体;
卷管理模块(3)作用是时时监控存储单元的failover域和节点状态,并能够动态修改存储单元的failover;
具体步骤如下:
1)在正常情况下,指定LUN0的failover为10.0.0.1和10.0.0.2两个ip地址;
2)当节点Node2出现故障后,卷管理模块(3)会启动,根据集群中各个节点的负载情况,自动检测集群中没有出现故障的节点作为LUN0的failover;
3)然后,卷管理模块(3)自动修改LUN0的failover值,并且是在不影响客户端业务的情况下进行;
4)修改后的LUN0的failover值变成了10.0.0.1和10.0.0.3,此时LUN0的failover域重新恢复完成,保证了存储单元的高可用性,从而提高了集群系统的稳定性。
2.根据权利要求1所述的方法,其特征在于卷管理模块(3)能够监控集群节点状态,当集群中节点出现故障时,能够动态修改该节点对应存储单元的failover值,保证存储单元能够切换到其他节点上,所有这些操作都是在不停掉服务的前提下实现的,保证客户端业务不中断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201210281794 CN102855289A (zh) | 2012-08-09 | 2012-08-09 | 一种集群文件系统动态修改存储单元failover的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201210281794 CN102855289A (zh) | 2012-08-09 | 2012-08-09 | 一种集群文件系统动态修改存储单元failover的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102855289A true CN102855289A (zh) | 2013-01-02 |
Family
ID=47401877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201210281794 Pending CN102855289A (zh) | 2012-08-09 | 2012-08-09 | 一种集群文件系统动态修改存储单元failover的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102855289A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103647830A (zh) * | 2013-12-13 | 2014-03-19 | 浪潮电子信息产业股份有限公司 | 一种集群管理系统中多层次配置文件的动态管理方法 |
CN107453932A (zh) * | 2017-09-29 | 2017-12-08 | 郑州云海信息技术有限公司 | 一种分布式存储系统管理方法及其装置 |
-
2012
- 2012-08-09 CN CN 201210281794 patent/CN102855289A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103647830A (zh) * | 2013-12-13 | 2014-03-19 | 浪潮电子信息产业股份有限公司 | 一种集群管理系统中多层次配置文件的动态管理方法 |
CN103647830B (zh) * | 2013-12-13 | 2017-09-15 | 浪潮电子信息产业股份有限公司 | 一种集群管理系统中多层次配置文件的动态管理方法 |
CN107453932A (zh) * | 2017-09-29 | 2017-12-08 | 郑州云海信息技术有限公司 | 一种分布式存储系统管理方法及其装置 |
CN107453932B (zh) * | 2017-09-29 | 2020-12-01 | 苏州浪潮智能科技有限公司 | 一种分布式存储系统管理方法及其装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN202798798U (zh) | 基于云计算技术的高可用系统 | |
EP3142011B9 (en) | Anomaly recovery method for virtual machine in distributed environment | |
CN102346779B (zh) | 分布式文件系统和主控节点的备份方法 | |
US10177994B2 (en) | Fault tolerant federation of computing clusters | |
CN104320401A (zh) | 一种基于分布式文件系统的大数据存储访问系统及方法 | |
CN104158693A (zh) | 数据服务的容灾备份方法和系统 | |
CN105159798A (zh) | 一种虚拟机的双机热备方法、双机热备管理服务器和系统 | |
CN104486445A (zh) | 一种基于云平台的分布式可扩展资源监控系统及方法 | |
CN103475732A (zh) | 一种基于虚拟地址池的分布式文件系统数据卷部署方法 | |
CN105335251A (zh) | 一种故障恢复方法及系统 | |
CN105302661A (zh) | 一种实现虚拟化管理平台高可用的系统和方法 | |
US9152491B2 (en) | Job continuation management apparatus, job continuation management method and job continuation management program | |
WO2014114135A1 (en) | Disk fault tolerance method, device and system | |
CN102761528A (zh) | 数据管理系统及方法 | |
US10317985B2 (en) | Shutdown of computing devices | |
CN104317803A (zh) | 数据库集群的数据存取结构和方法 | |
CN104239548A (zh) | 数据库容灾系统和数据库容灾方法 | |
CN103746838A (zh) | 一种无中心节点计算机网络的任务调度方法 | |
CN104021200A (zh) | 一种数据库的数据同步方法和装置 | |
CN103560907A (zh) | 双机负载均衡设备的管理方法和装置 | |
CN105183591A (zh) | 一种高可用集群的实现方法及系统 | |
CN105335256A (zh) | 在整机柜服务器中切换备份磁盘的方法、装置和系统 | |
CN103678051A (zh) | 一种集群数据处理系统中的在线故障容错方法 | |
CN104182300B (zh) | 一种集群中虚拟机的备份方法及系统 | |
CN103902401A (zh) | 基于监控的虚拟机容错方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130102 |
|
WD01 | Invention patent application deemed withdrawn after publication |