CN102855289A - 一种集群文件系统动态修改存储单元failover的方法 - Google Patents

一种集群文件系统动态修改存储单元failover的方法 Download PDF

Info

Publication number
CN102855289A
CN102855289A CN 201210281794 CN201210281794A CN102855289A CN 102855289 A CN102855289 A CN 102855289A CN 201210281794 CN201210281794 CN 201210281794 CN 201210281794 A CN201210281794 A CN 201210281794A CN 102855289 A CN102855289 A CN 102855289A
Authority
CN
China
Prior art keywords
failover
storage unit
management module
node
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201210281794
Other languages
English (en)
Inventor
胡振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN 201210281794 priority Critical patent/CN102855289A/zh
Publication of CN102855289A publication Critical patent/CN102855289A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种集群文件系统动态修改存储单元failover的方法,系统包括:数据存储集群(1);存储单元管理模块(2);卷管理模块(3),其中:数据存储集群(1)提供数据存储单元,负责去掉元数据之后的数据存储;存储单元管理模块(2)提供多个存储单元LUN给数据存储集群(1),用来提供数据存储的载体;卷管理模块(3)作用是时时监控存储单元的failover域和节点状态,并能够动态修改存储单元的failover;该方法适用于分布式、并行文件系统中,能够实现存储单元(LUN)的failover动态改变,并且是在不中断业务的情况下执行,最大程度的保证了存储单元的可用性,提高了集群的数据安全性。

Description

一种集群文件系统动态修改存储单元failover的方法
技术领域
本发明涉及计算机技术领域, 具体地说是一种集群文件系统动态修改存储单元failover的方法。
背景技术
目前部分分布式文件系统为了实现存储单元(LUN)的高可用性,一般的做法是给存储单元(LUN)添加failover域,failover域是一种高可用机制,包含存储单元(LUN)的挂载节点信息,主要是ip地址和网络类型,这样当某个节点失效的时候,存储单元会自动迁移到failover域中指定的节点上去,从而保证数据高可用性。但是该方法的问题是,该方法不能动态实现给存储单元(LUN)添加failover域,具有一定的局限性。本发明就是针对该问题而提出的一种能够动态修改failover域的方法,能够有效的提高集群文件系统的高可用性。
发明内容
本发明的目的是提供一种集群文件系统动态修改存储单元failover的方法。该方法主要创新是卷管理模块(3)能够时时检测数据存储集群(1)中各个节点的状态,并且当某一个节点失效的时候,能够保证动态修改与该失效节点对应的存储单元(LUN)的failover,从而可以有效的提高集群的高可用性。
本发明的目的是按以下方式实现的,系统包括:数据存储集群(1);存储单元管理模块(2);卷管理模块(3),其中:
数据存储集群(1)提供数据存储单元,负责去掉元数据之后的数据存储;
存储单元管理模块(2)提供多个存储单元LUN给数据存储集群(1),用来提供数据存储的载体;
卷管理模块(3)作用是时时监控存储单元的failover域和节点状态,并能够动态修改存储单元的failover;
具体步骤如下:
1)在正常情况下,指定LUN0的failover为10.0.0.1和10.0.0.2两个ip地址;
2)当节点Node2出现故障后,卷管理模块(3)会启动,根据集群中各个节点的负载情况,自动检测集群中没有出现故障的节点作为LUN0的failover;
3)然后,卷管理模块(3)自动修改LUN0的failover值,并且是在不影响客户端业务的情况下进行;
4)修改后的LUN0的failover值变成了10.0.0.1和10.0.0.3,此时LUN0的failover域重新恢复完成,保证了存储单元的高可用性,从而提高了集群系统的稳定性。
卷管理模块(3)能够监控集群节点状态,当集群中节点出现故障时,能够动态修改该节点对应存储单元的failover值,保证存储单元能够切换到其他节点上,所有这些操作都是在不停掉服务的前提下实现的,保证客户端业务不中断。
本发明的有益效果是:通常适用于分布式、并行文件系统中,能够实现存储单元(LUN)的failover动态改变,并且是在不中断业务的情况下执行,最大程度的保证了存储单元的可用性,提高了集群的数据安全性。
附图说明
 附图1为节点出现故障前存储单元的状态;
附图2为节点出现故障后存储单元的状态。
具体实施方式
 参照说明书附图对本发明的作以下详细地说明。
如附图所示,系统包括:数据存储集群(1);存储单元管理模块(2);卷管理模块(3),其中:
数据存储集群(1)提供数据存储单元,负责去掉元数据之后的数据存储;
存储单元管理模块(2)提供多个存储单元LUN给数据存储集群(1),用来提供数据存储的载体;
卷管理模块(3)作用是时时监控存储单元的failover域和节点状态,并能够动态修改存储单元的failover。
实施例
1)在正常情况下,指定LUN0的failover为10.0.0.1和10.0.0.2两个ip地址;
2)当节点Node2出现故障后,卷管理模块(3)会启动,根据集群中各个节点的负载情况,自动检测集群中没有出现故障的节点作为LUN0的failover
3)然后,卷管理模块(3)自动修改LUN0的failover值,并且是在不影响客户端业务的情况下进行;
4)修改后的LUN0的failover值变成了10.0.0.1和10.0.0.3,此时LUN0的failover域重新恢复完成,保证了存储单元的高可用性,从而提高了集群系统的稳定性。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (2)

1.一种集群文件系统动态修改存储单元failover的方法, 其特征在于系统包括:数据存储集群(1);存储单元管理模块(2);卷管理模块(3),其中:
数据存储集群(1)提供数据存储单元,负责去掉元数据之后的数据存储;
存储单元管理模块(2)提供多个存储单元LUN给数据存储集群(1),用来提供数据存储的载体;
卷管理模块(3)作用是时时监控存储单元的failover域和节点状态,并能够动态修改存储单元的failover;
具体步骤如下:
1)在正常情况下,指定LUN0的failover为10.0.0.1和10.0.0.2两个ip地址;
2)当节点Node2出现故障后,卷管理模块(3)会启动,根据集群中各个节点的负载情况,自动检测集群中没有出现故障的节点作为LUN0的failover;
3)然后,卷管理模块(3)自动修改LUN0的failover值,并且是在不影响客户端业务的情况下进行;
4)修改后的LUN0的failover值变成了10.0.0.1和10.0.0.3,此时LUN0的failover域重新恢复完成,保证了存储单元的高可用性,从而提高了集群系统的稳定性。
2.根据权利要求1所述的方法,其特征在于卷管理模块(3)能够监控集群节点状态,当集群中节点出现故障时,能够动态修改该节点对应存储单元的failover值,保证存储单元能够切换到其他节点上,所有这些操作都是在不停掉服务的前提下实现的,保证客户端业务不中断。
CN 201210281794 2012-08-09 2012-08-09 一种集群文件系统动态修改存储单元failover的方法 Pending CN102855289A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201210281794 CN102855289A (zh) 2012-08-09 2012-08-09 一种集群文件系统动态修改存储单元failover的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201210281794 CN102855289A (zh) 2012-08-09 2012-08-09 一种集群文件系统动态修改存储单元failover的方法

Publications (1)

Publication Number Publication Date
CN102855289A true CN102855289A (zh) 2013-01-02

Family

ID=47401877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201210281794 Pending CN102855289A (zh) 2012-08-09 2012-08-09 一种集群文件系统动态修改存储单元failover的方法

Country Status (1)

Country Link
CN (1) CN102855289A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103647830A (zh) * 2013-12-13 2014-03-19 浪潮电子信息产业股份有限公司 一种集群管理系统中多层次配置文件的动态管理方法
CN107453932A (zh) * 2017-09-29 2017-12-08 郑州云海信息技术有限公司 一种分布式存储系统管理方法及其装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103647830A (zh) * 2013-12-13 2014-03-19 浪潮电子信息产业股份有限公司 一种集群管理系统中多层次配置文件的动态管理方法
CN103647830B (zh) * 2013-12-13 2017-09-15 浪潮电子信息产业股份有限公司 一种集群管理系统中多层次配置文件的动态管理方法
CN107453932A (zh) * 2017-09-29 2017-12-08 郑州云海信息技术有限公司 一种分布式存储系统管理方法及其装置
CN107453932B (zh) * 2017-09-29 2020-12-01 苏州浪潮智能科技有限公司 一种分布式存储系统管理方法及其装置

Similar Documents

Publication Publication Date Title
CN202798798U (zh) 基于云计算技术的高可用系统
EP3142011B9 (en) Anomaly recovery method for virtual machine in distributed environment
CN102346779B (zh) 分布式文件系统和主控节点的备份方法
US10177994B2 (en) Fault tolerant federation of computing clusters
CN104320401A (zh) 一种基于分布式文件系统的大数据存储访问系统及方法
CN104158693A (zh) 数据服务的容灾备份方法和系统
CN105159798A (zh) 一种虚拟机的双机热备方法、双机热备管理服务器和系统
CN104486445A (zh) 一种基于云平台的分布式可扩展资源监控系统及方法
CN103475732A (zh) 一种基于虚拟地址池的分布式文件系统数据卷部署方法
CN105335251A (zh) 一种故障恢复方法及系统
CN105302661A (zh) 一种实现虚拟化管理平台高可用的系统和方法
US9152491B2 (en) Job continuation management apparatus, job continuation management method and job continuation management program
WO2014114135A1 (en) Disk fault tolerance method, device and system
CN102761528A (zh) 数据管理系统及方法
US10317985B2 (en) Shutdown of computing devices
CN104317803A (zh) 数据库集群的数据存取结构和方法
CN104239548A (zh) 数据库容灾系统和数据库容灾方法
CN103746838A (zh) 一种无中心节点计算机网络的任务调度方法
CN104021200A (zh) 一种数据库的数据同步方法和装置
CN103560907A (zh) 双机负载均衡设备的管理方法和装置
CN105183591A (zh) 一种高可用集群的实现方法及系统
CN105335256A (zh) 在整机柜服务器中切换备份磁盘的方法、装置和系统
CN103678051A (zh) 一种集群数据处理系统中的在线故障容错方法
CN104182300B (zh) 一种集群中虚拟机的备份方法及系统
CN103902401A (zh) 基于监控的虚拟机容错方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130102

WD01 Invention patent application deemed withdrawn after publication