CN103384266A - 一种基于文件级实时同步的Parastor200管理节点高可用方法 - Google Patents

一种基于文件级实时同步的Parastor200管理节点高可用方法 Download PDF

Info

Publication number
CN103384266A
CN103384266A CN2013102251175A CN201310225117A CN103384266A CN 103384266 A CN103384266 A CN 103384266A CN 2013102251175 A CN2013102251175 A CN 2013102251175A CN 201310225117 A CN201310225117 A CN 201310225117A CN 103384266 A CN103384266 A CN 103384266A
Authority
CN
China
Prior art keywords
management node
node
file
management
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013102251175A
Other languages
English (en)
Other versions
CN103384266B (zh
Inventor
刘冠川
秦东明
杨亮
曹振南
王勇
何牧君
张新风
陈飞
刘超
龚超
明立波
王慧
吕永安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dawning Information Industry Beijing Co Ltd
Dawning Information Industry Co Ltd
Original Assignee
Dawning Information Industry Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Beijing Co Ltd filed Critical Dawning Information Industry Beijing Co Ltd
Priority to CN201310225117.5A priority Critical patent/CN103384266B/zh
Publication of CN103384266A publication Critical patent/CN103384266A/zh
Application granted granted Critical
Publication of CN103384266B publication Critical patent/CN103384266B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及一种基于文件级实时同步的Parastor200管理节点高可用方法,所述方法通过以下两个方面实现:(1)管理节点存储系统信息的同步;(2)管理节点故障切换。本发明通过实现Parastor200管理节点的高可用使Parastor200实现了完全意义上的全冗余设计,系统中任何部件的损坏不影响存储系统的使用。管理节点任何部件的损坏,都可以在数秒内将服务切换到备用节点上。这样既不影响正常使用,又有充足的时间去修复故障。

Description

一种基于文件级实时同步的Parastor200管理节点高可用方法
技术领域
本发明涉及一种基于文件级实时同步的Parastor200管理节点高可用方法。 
背景技术
ParaStor200并行存储系统采用了代表存储技术、网络通信技术以及数据管理技术发展方向的并行体系架构,是一款面向海量非结构化数据处理、拥有自主知识产权的高端存储系统。它可以提供TB/s级的高速带宽和EB级的海量存储空间,能够满足飞机汽车船舶设计、生物基因研究、材料科学研究、天气预报、地震监测、环境监测分析、能源勘探、电子商务、网络游戏、社交与视频分享网站建设、动漫渲染、视频编辑处理等领域中对于存储容量和I/O性能要求极高的应用,可广泛应用于政府、教育、科研、制造、企业、医疗、石油、广电、互联网等行业。 
MGR表示Parastor200的管理节点,提供统一的控制管理界面,管理员通过该节点管理整个存储系统。 
oPara表示Parastor200元数据节点,用于管理存储系统的所有索引数据和命名空间,对外提供单一的全局映像,支持多个节点以Active-Active集群模式工作。 
oStor表示Parastor200数据节点,用于提供数据存储空间,内嵌高性能数据存取引擎,并行处理所有客户端的数据访问请求,支持多个oStor以副本方式(1-3个副本)容错。 
Parastor200的管理节点,提供统一的控制管理界面,它保存着整个系统重要的拓扑结构及配置信息,管理员通过该节点管理整个存储系统。在整个存储系统中,管理节点的使用频度相对较低,只有当挂载客户端、查看存储系统状态、添加存储单元、删除存储单元等管理操作时才会用到管理节点。在小规模集群中通常管理较为简单,管理操作也比较少,此时管理节点的重要性相对较低,即使管理节点出现故障,我们也有充分的时间去修复管理节点,就算出现管理节点磁盘永久损坏也不至于出现灾难性后果,因为我们可以通过元数据节点、数据节点上的配置信息来重构管理节点上的重要信息。而丢失的只是一些历史数据和授权信息,不会对存储系统造成太大的影响。目前,针对这一问题的解决办法是通过管理界面定期备份管理节点配置信息,当管理节点出现故障时,可以使用备用节点安装管理节点图形界面程序,然后导入备份的信息来完成。 
现有方案有几个潜在的风险。首先,即便备份频率较高,但还是无法避免两次备份间系 统配置被更改的可能。特别是进行了增加或者减少存储单元、更改客户端授权信息等操作,恢复后的信息和真实信息不一样,将会影响系统的正常运行。其次,即便没有任何信息丢失,重构一台管理节点耗费的时间还是比较长的,对于那些规模较大,用户较多,需要经常进行管理操作的系统显然是无法接受的。 
发明内容
针对现有技术的不足,本发明提供一种基于文件级实时同步的Parastor200管理节点高可用方法;本发明通过实现Parastor200管理节点的高可用使Parastor200实现了完全意义上的全冗余设计,系统中任何部件的损坏不影响存储系统的使用。管理节点任何部件的损坏,都可以在数秒内将服务切换到备用节点上。这样既不影响正常使用,又有充足的时间去修复故障。 
本发明的目的是采用下述技术方案实现的: 
一种基于文件级实时同步的Parastor200管理节点高可用方法,其改进之处在于,所述方法通过以下两个方面实现: 
(1)管理节点存储系统信息的同步; 
(2)管理节点故障切换。 
其中,所述(1)中,所述管理节点存储系统信息同步是指当管理节点上的存储系统信息发生变更时,识别并激发增量拷贝到备用的管理节点上;实现在线管理节点和备用管理节点上存储系统信息的同步。 
其中,所述管理节点为Parastor200管理节点,所述Parastor200管理节点运行在Linux操作系统上;Linux内核包含文件系统事件机制Inotify,所述文件系统事件机制Inotify监控文件系统操作,实现实时触发同步;所述文件系统操作读取、写入和创建。 
其中,所述Parastor200管理节点存储系统信息包括配置文件和日志;所述配置文件为IO统计信息数据库;所述Parastor200管理节点存储系统采用对IO统计信息数据库和日志信息的进行定期分割,以及在定期分割的基础上实现增加备份式同步。 
其中,所述(2)中,采用心跳机制判断故障管理节点,即通过在线管理节点和备用管理节点间连接心跳线发送信息和应答对方的监测,并通过ping第三方节点方式判断故障管理节点并自动实现故障切换。 
其中,在进行故障切换时结合资源和服务的迁移实现;所述资源和服务包括: 
1)管理节点存储系统信息文件; 
2)管理节点管理IP; 
3)Parastor200管理服务以及Parastor200图形界面服务; 
4)数据同步服务。 
其中,所述1)中,管理节点存储系统信息文件资源通过同步备份到备用管理节点上。 
其中,所述2)中,所述管理节点管理IP为管理节点向元数据节点、数据节点发送管理命令所走的IP,所述管理节点管理IP在故障切换时从在线管理节点迁移到备用管理节点上。 
其中,所述3)中,所述Parastor200管理服务以及Parastor200图形界面服务在故障切换时,从在线管理节点切换到备用管理节点上。 
其中,所述4)中,切换后备用管理节点成为主管理节点(主管理节点即为在线管理节点),将备用管理节点的信息反过来备份到原来的主管理节点上。 
与现有技术比,本发明达到的有益效果是: 
本发明提供基于文件级实时同步的Parastor200管理节点高可用方法,使用inotify文件系统事件机制和rsync结合实现文件级的实时同步,实用文件级实时同步在Parastor200管理节点高可用中的应用。通过实现Parastor200管理节点的高可用使Parastor200实现了完全意义上的全冗余设计,系统中任何部件的损坏不影响存储系统的使用。管理节点任何部件的损坏,都可以在数秒内将服务切换到备用管理节点上。这样既不影响正常使用,又有充足的时间去修复故障。 
具体实施方式
下面对本发明的具体实施方式作进一步的详细说明。 
本发明是要实现Parastor200管理节点的高可用。通过分析现有技术存在的问题我们便知道,本发明是要解决以下两个问题:(1)管理节点存储系统信息的同步;(2)管理节点故障切换。 
解决管理节点信息同步,即当管理节点上的存储系统信息发生变更时,必须能够立刻识别到这个变更,并立即激发增量拷贝到备用管理节点上,实现在线管理节点和备用管理节点上存储系统信息的同步。Parastor200管理节点运行在Linux操作系统上。Linux内核有一种文件系统事件机制称为Inotify,它监控文件系统操作,比如读取、写入和创建。Inotify反应灵敏,用法非常简单,并且比cron(cron任务)任务的繁忙轮询高效得多。因此Inotify是我们实现实时触发同步的最好选择。 
Parastor200存储系统信息包括配置文件和日志,大部分文件都比较小,但随着时间的推移,配置文件的IO统计信息数据库和日志信息都在不断的增长。为了减小同步时间窗,达到几乎瞬间完成同步,一方面要对日志及数据库进行定期的主动分割,另一方面在分割的基础上实现增量备份式的同步。 
由于Parastor200存储系统配置信息一般情况下更改不多,我们通过监控文件系统事件提供了实时响应事件的机制,大大减少同步要扫描的文件数量。另外,通过增量备份大大减少了同步时需要通过网络传输的数据量。最后通过定期对文件主动分割可以使增量备份需要计算的校验值也大大减少。因此管理节点上的存储信息可以实时地同步到备份管理节点上。 
管理节点故障切换时,故障切换首先需要解决的问题就是如何判断故障,这里我们采用心跳机制,通过管理节点和备用管理节点间连接心跳线发送信息和应答对方的监测,并通过ping第三方节点等方式判断故障节点并自动实现故障切换。进行故障切换还需要解决一个重要的问题就是服务、资源的迁移。在本发明中资源和服务包括:1)管理节点存储系统信息文件,这些资源已通过同步备份到备用管理节点上。2)管理节点管理IP,这个IP不同于两个节点间同步文件所走的网络的IP。它是管理节点向元数据节点、数据管理节点发送管理命令所走的IP。这个IP需要在故障切换时从主管理节点迁移到备用管理节点上。3)Parastor200管理服务以及Parastor200图形界面服务,这两个服务也在故障切换时,从管理节点切换到备用节点上。4)数据同步服务,即切换后备用节点成为了主管理节点,它需要将它上面的信息反过来备份到原来的主管理节点上。 
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。 

Claims (10)

1.一种基于文件级实时同步的Parastor200管理节点高可用方法,其特征在于,所述方法通过以下两个方面实现:
(1)管理节点存储系统信息的同步:采用文件系统事件机制Inotify实现;
(2)管理节点故障切换。
2.如权利要求1所述的Parastor200管理节点高可用方法,其特征在于,所述(1)中,所述管理节点存储系统信息同步是指当管理节点上的存储系统信息发生变更时,识别并激发增量拷贝到备用的管理节点上;实现在线管理节点和备用管理节点上存储系统信息的同步。
3.如权利要求2所述的Parastor200管理节点高可用方法,其特征在于,所述管理节点为Parastor200管理节点,所述Parastor200管理节点运行在Linux操作系统上;Linux内核包含文件系统事件机制Inotify,所述文件系统事件机制Inotify监控文件系统操作,实现实时触发同步;所述文件系统操作读取、写入和创建。
4.如权利要求1所述的Parastor200管理节点高可用方法,其特征在于,所述Parastor200管理节点存储系统信息包括配置文件和日志;所述配置文件为IO统计信息数据库;所述Parastor200管理节点存储系统采用对IO统计信息数据库和日志信息的进行定期分割,以及在定期分割的基础上实现增加备份式同步。
5.如权利要求1所述的Parastor200管理节点高可用方法,其特征在于,所述(2)中,采用心跳机制判断故障管理节点,即通过在线管理节点和备用管理节点间连接心跳线发送信息和应答对方的监测,并通过ping第三方节点方式判断故障管理节点并自动实现故障切换。
6.如权利要求5所述的Parastor200管理节点高可用方法,其特征在于,在进行故障切换时结合资源和服务的迁移实现;所述资源和服务包括:
1)管理节点存储系统信息文件;
2)管理节点管理IP;
3)Parastor200管理服务以及Parastor200图形界面服务;
4)数据同步服务。
7.如权利要求6所述的Parastor200管理节点高可用方法,其特征在于,所述1)中,管理节点存储系统信息文件资源通过同步备份到备用管理节点上。
8.如权利要求6所述的Parastor200管理节点高可用方法,其特征在于,所述2)中,所述管理节点管理IP为管理节点向元数据节点、数据节点发送管理命令所走的IP,所述管理节点管理IP在故障切换时从在线管理节点迁移到备用管理节点上。
9.如权利要求6所述的Parastor200管理节点高可用方法,其特征在于,所述3)中,所述Parastor200管理服务以及Parastor200图形界面服务在故障切换时,从在线管理节点切换到备用管理节点上。
10.如权利要求6所述的Parastor200管理节点高可用方法,其特征在于,所述4)中,切换后备用管理节点成为主管理节点,将备用管理节点的信息反过来备份到原来的主管理节点上。
CN201310225117.5A 2013-06-07 2013-06-07 一种基于文件级实时同步的Parastor200管理节点高可用方法 Active CN103384266B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310225117.5A CN103384266B (zh) 2013-06-07 2013-06-07 一种基于文件级实时同步的Parastor200管理节点高可用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310225117.5A CN103384266B (zh) 2013-06-07 2013-06-07 一种基于文件级实时同步的Parastor200管理节点高可用方法

Publications (2)

Publication Number Publication Date
CN103384266A true CN103384266A (zh) 2013-11-06
CN103384266B CN103384266B (zh) 2016-12-28

Family

ID=49491957

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310225117.5A Active CN103384266B (zh) 2013-06-07 2013-06-07 一种基于文件级实时同步的Parastor200管理节点高可用方法

Country Status (1)

Country Link
CN (1) CN103384266B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617242A (zh) * 2013-11-26 2014-03-05 曙光信息产业股份有限公司 一种分布式文件系统拓扑展示方法
CN105069152A (zh) * 2015-08-25 2015-11-18 航天恒星科技有限公司 数据处理方法及装置
CN106569919A (zh) * 2016-11-07 2017-04-19 天脉聚源(北京)传媒科技有限公司 一种同步文件的方法及装置
CN107659663A (zh) * 2017-10-27 2018-02-02 北京锐安科技有限公司 一种数据同步的方法、装置、设备和存储介质
CN109344202A (zh) * 2018-10-31 2019-02-15 新华三大数据技术有限公司 一种数据同步方法及管理节点
CN111143027A (zh) * 2019-12-06 2020-05-12 北京浪潮数据技术有限公司 一种云平台管理方法、系统、设备及计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100488146C (zh) * 2006-09-14 2009-05-13 华为技术有限公司 在p2p网络中建立点对点连接的方法及在p2p网络中的节点
CN102521289B (zh) * 2011-11-29 2013-12-04 华为技术有限公司 一种文件同步方法、装置及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王志勇: "《曙光公司云计算发展战略研究》", 《基础科学辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617242A (zh) * 2013-11-26 2014-03-05 曙光信息产业股份有限公司 一种分布式文件系统拓扑展示方法
CN103617242B (zh) * 2013-11-26 2017-05-10 曙光信息产业股份有限公司 一种分布式文件系统拓扑展示方法
CN105069152A (zh) * 2015-08-25 2015-11-18 航天恒星科技有限公司 数据处理方法及装置
CN106569919A (zh) * 2016-11-07 2017-04-19 天脉聚源(北京)传媒科技有限公司 一种同步文件的方法及装置
CN107659663A (zh) * 2017-10-27 2018-02-02 北京锐安科技有限公司 一种数据同步的方法、装置、设备和存储介质
CN109344202A (zh) * 2018-10-31 2019-02-15 新华三大数据技术有限公司 一种数据同步方法及管理节点
CN111143027A (zh) * 2019-12-06 2020-05-12 北京浪潮数据技术有限公司 一种云平台管理方法、系统、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN103384266B (zh) 2016-12-28

Similar Documents

Publication Publication Date Title
US10896104B2 (en) Heartbeat monitoring of virtual machines for initiating failover operations in a data storage management system, using ping monitoring of target virtual machines
CN110209726B (zh) 分布式数据库集群系统、数据同步方法及存储介质
US10482104B2 (en) Zero-data loss recovery for active-active sites configurations
US9658928B2 (en) File-based cluster-to-cluster replication recovery
CN105389230B (zh) 一种结合快照技术的持续数据保护系统及方法
US10061658B2 (en) System and method of data intelligent storage
KR101547719B1 (ko) 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지
US11789638B2 (en) Continuing replication during storage system transportation
US10831741B2 (en) Log-shipping data replication with early log record fetching
CN103763155A (zh) 分布式云存储系统多服务心跳监测方法
CN103384266A (zh) 一种基于文件级实时同步的Parastor200管理节点高可用方法
CN107430606B (zh) 具有并行持久性的消息代理系统
CN106502823A (zh) 数据云备份方法和系统
CN103166785A (zh) 基于Hadoop的分布式日志分析系统
AU2009324800A1 (en) Method and system for managing replicated database data
CN102402471A (zh) 基于存储阵列快照功能的数据实时备份方法及系统
US9367409B2 (en) Method and system for handling failures by tracking status of switchover or switchback
CN102708158A (zh) 一种PostgreSQL云存储归档调度系统
CN109739435A (zh) 文件存储和更新方法及装置
CN103377100A (zh) 一种数据备份方法、网络节点及系统
US9367413B2 (en) Detecting data loss during site switchover
Martin et al. User-constraint and self-adaptive fault tolerance for event stream processing systems
CN103384267B (zh) 一种基于分布式块设备的Parastor200并行存储管理节点高可用方法
JP5154843B2 (ja) クラスタシステム、計算機、および障害回復方法
CN106445729A (zh) 一种基于备份虚拟化的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220803

Address after: 100193 No. 36 Building, No. 8 Hospital, Wangxi Road, Haidian District, Beijing

Patentee after: Dawning Information Industry (Beijing) Co.,Ltd.

Patentee after: DAWNING INFORMATION INDUSTRY Co.,Ltd.

Address before: 100193 No.36 Zhongguancun Software Park, No.8 Dongbeiwang West Road, Haidian District, Beijing

Patentee before: Dawning Information Industry (Beijing) Co.,Ltd.