CN103235748A - 元数据的管理方法和系统 - Google Patents

元数据的管理方法和系统 Download PDF

Info

Publication number
CN103235748A
CN103235748A CN2013101455508A CN201310145550A CN103235748A CN 103235748 A CN103235748 A CN 103235748A CN 2013101455508 A CN2013101455508 A CN 2013101455508A CN 201310145550 A CN201310145550 A CN 201310145550A CN 103235748 A CN103235748 A CN 103235748A
Authority
CN
China
Prior art keywords
server
master server
data
backup
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013101455508A
Other languages
English (en)
Inventor
李博
张玉龙
张东阳
苗艳超
刘新春
邵宗有
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dawning Information Industry Beijing Co Ltd
Original Assignee
Dawning Information Industry Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Beijing Co Ltd filed Critical Dawning Information Industry Beijing Co Ltd
Priority to CN2013101455508A priority Critical patent/CN103235748A/zh
Publication of CN103235748A publication Critical patent/CN103235748A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种元数据的管理方法和系统,其中,该方法包括:在原主服务器出现异常的情况下,根据存储数据量选择备份服务器作为当前主服务器并替代原主服务器提供服务;根据当前主服务器相比于其它每个备用服务器的差量数据,对每个备用服务器进行同步,其中,在同步期间,禁止将当前主服务器因提供服务而改变的数据发送给其它备份服务器。本发明通过选择当前主服务器且提供服务,并对当前主服务器与备份服务器进行数据同步,能够使当前主服务器进行正常的业务接管,从而有效地实现主备服务器之间的替换,并且在同步期间禁止发送提供服务而改变数据来防止乱序数据同步,从而保证了系统的稳定性和可靠性,提升了用户的体验感。

Description

元数据的管理方法和系统
技术领域
本发明涉及计算机领域,并且特别地,涉及一种元数据的管理方法和系统。
背景技术
分布式系统通常对元数据和数据采用分别存储的方法,而且对于分布式文件系统中的元数据,通常采用写双份或者写多份的管理方法来进行存储,通过这样的方法,可以产生两方面益处:1.当某个元数据服务器发生异常时,其它的元数据服务器能够及时地接管异常服务器上的业务,使分布式文件系统的终端用户不会感觉有异常情况,提升了用户体验感;2.元数据服务器互为主备,当主服务器上有新增业务时,会对备份元数据服务器进行数据同步,提高了系统的可靠性。但是,随着元数据服务器个数的增加,元数据的管理就变得越来越复杂,多个元数据服务器的一致性处理就会变得更加困难,如何维护多份元数据的可靠性并且实现元数据服务器的无损切换,是当前研究的热点和难点问题。
在存有多份元数据的分布式文件系统中,客户端对一个元数据进行写操作,这些新增加的写操作将会同步到备份元数据服务器上,然后备份元数据服务器会将收到的数据保存到其对应的元数据存储空间中,同时,给数据源发送确认信息。当主元数据服务器发生故障时,由于系统的复杂性和错误的多样性,多份备份元数据服务器上的元数据处于非常复杂的状态,这样,就导致对备份元数据服务器接管异常的元数据服务器的业务的很多处理上存在不确定性,使接管业务的程序变得非常复杂,并且难以处理业务的接管。
此外,当异常的主元数据服务器恢复正常后,存在一个将当前主服务器上的业务切换回恢复的主服务器的操作,当服务器个数越多时,这种切换就变得越复杂。
针对相关技术中接管异常元数据服务器业务的操作复杂,导致系统不稳定的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中接管异常元数据服务器业务的操作复杂,导致系统不稳定的问题,本发明提出一种元数据的管理方法和系统,能够使正常的元数据服务器顺利地接管异常元数据服务器上的业务,从而有效地实现主备服务器之间的替换,保证系统的稳定性和可靠性,提升用户的体验感。
本发明的技术方案是这样实现的:
根据本发明的一个方面,提供了一种元数据的管理方法。
根据本发明实施例的管理方法包括:
在原主服务器出现异常的情况下,根据存储数据量选择备份服务器作为当前主服务器并替代原主服务器提供服务;
根据当前主服务器相比于其它每个备用服务器的差量数据,对每个备用服务器进行同步,其中,在同步期间,禁止将当前主服务器因提供服务而改变的数据发送给其它备份服务器。
其中,在同步完成之后,根据本发明实施例的管理方法包括:
当前主服务器将因提供服务而改变的数据发送至其它备份服务器。
并且,在其它备份服务器从当前主服务器接收到因提供服务而改变的数据之后,给当前主服务器发送确认信息。
而且,根据本发明实施例的管理方法还包括:
在原主服务器恢复正常之后,确定当前主服务器与原主服务器之间的差量数据;
根据当前主服务器与原主服务器之间的差量数据对原主服务器进行同步,其中,在同步期间,禁止将当前主服务器因提供服务而改变的数据发送给原主服务器。
进一步地,在对原主服务器完成同步之后,将当前主服务器的业务切换至原主服务器,由原主服务器替代当前主服务器提供服务。
此外,根据本发明实施例的管理方法进一步包括:
在备份服务器出现异常的情况下,禁止提供服务的主服务器向出现异常的备份服务器发送数据;
清除该出现异常的备份服务器在异常期间产生的错误数据。
根据本发明的一个方面,提供了一种元数据的管理系统。
该管理系统包括:
选择模块,用于在原主服务器出现异常的情况下,根据存储数据量选择备份服务器作为当前主服务器并替代原主服务器提供服务;
同步模块,用于,根据当前主服务器相比于其它每个备用服务器的差量数据,对每个备用服务器进行同步,其中,在同步期间,禁止将当前主服务器因提供服务而改变的数据发送给其它备份服务器。
其中,该管理系统还包括:
发送模块,用于将当前主服务器将因提供服务而改变的数据发送至其它备份服务器。
并且,该管理系统还包括:
确认接收模块,用于在其它备份服务器从当前主服务器接收到因提供服务而改变的数据之后,给当前主服务器发送确认信息。
此外,该管理系统进一步包括:
禁止发送模块,用于在备份服务器出现异常的情况下,禁止提供服务的主服务器向出现异常的备份服务器发送数据;
清除模块,用于清除该出现异常的备份服务器在异常期间产生的错误数据。
本发明通过选择当前主服务器且提供服务,并对当前主服务器与备份服务器进行数据同步,能够使当前主服务器进行正常的业务接管,从而有效地实现主备服务器之间的替换,并且在同步期间禁止发送提供服务而改变数据来防止乱序数据同步,从而保证了系统的稳定性和可靠性,提升了用户的体验感。
附图说明
图1是根据本发明实施例的元数据的管理方法的流程图;
图2是根据本发明实施例的元数据的管理方法的各个状态的示意图;
图3是根据本发明实施例的元数据的管理系统的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其它实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种元数据的管理方法。
如图1所示,根据本发明实施例的管理方法包括:
步骤S101,在原主服务器出现异常的情况下,根据存储数据量选择备份服务器作为当前主服务器并替代原主服务器提供服务,该步骤处于文中所描述的NODEDOWN状态;
步骤S103,根据当前主服务器相比于其它每个备用服务器的差量数据,对每个备用服务器进行同步,其中,在同步期间,禁止将当前主服务器因提供服务而改变的数据发送给其它备份服务器,该步骤处于文中所描述的RCVR状态。
其中,当前主服务器可以由于提供修改、增加、删除等操作而改变数据。
其中,在同步完成之后,根据本发明实施例的管理方法可以包括:当前主服务器将因提供服务而改变的数据发送至其它备份服务器。并且,在其它备份服务器从当前主服务器接收到因提供服务而改变的数据之后,给当前主服务器发送确认信息,该步骤处于文中所说的NORMAL状态。
而且,根据本发明实施例的管理方法还可以包括:在原主服务器恢复正常之后,确定当前主服务器与原主服务器之间的差量数据;根据当前主服务器与原主服务器之间的差量数据对原主服务器进行同步,其中,在同步期间,禁止将当前主服务器因提供服务而改变的数据发送给原主服务器,该步骤处于文中所描述的RCVR状态。
进一步地,在对原主服务器完成同步之后,将当前主服务器的业务切换至原主服务器,由原主服务器替代当前主服务器提供服务,该步骤处于文中所描述的SWITCH状态。
此外,根据本发明实施例的管理方法可以进一步包括:在备份服务器出现异常的情况下,禁止提供服务的主服务器向出现异常的备份服务器发送数据;清除该出现异常的备份服务器在异常期间产生的错误数据,该步骤处于文中所描述的NODEDOWN状态。
如图2所示,可将分布式文件系统的元数据组(即多个元数据服务器)的工作状态分为以下六种:1、初始化状态(INIT);2、在线状态(ONLINE);3、恢复状态(RCVR);4、切换状态(SWITCH);5、正常工作状态(NORMAL)6、节点异常(NODEDOWN)。根据本发明实施例的管理方法可将元数据服务器的状态变化控制在在这几种状态中,通过这几种状态的管理,可以有效地处理多份元数据的管理问题。
当然,以上状态仅仅只是列举了本发明提供的元数据管理方法中的一个实施例,可以根据实际情况来增加、修改或者减少上述工作状态。
根据本发明实施例的管理方法,并且参照图2,管理元数据组状态变化可以包括:
初始化状态(INIT)21:当某元数据服务器上线后,系统处于INIT状态21,此时,系统不对外提供服务,需要等待组内的其它元数据服务器上线。
在线状态(ONLINE)22:当组内其它一些或所有元数据服务器都上线,或者在等待超时的情况下,系统状态为ONLINE状态22,此时,系统需要根据元数据服务器上记录的事务信息来进行选主,也就是选择元数据存储空间存储的信息量最多的节点作为主服务节点,其它节点都作为备份节点。
恢复状态(RCVR)23:选出主从关系后,系统可以对外提供业务了,时,系统的状态变为RCVR状态23,由主服务节点对外提供服务,此时,在主服务器上产生的数据只在本服务器上接收,而不向其它的备份元数据服务器发送;同时,主服务器还会启动向备份服务器进行主服务器与备份服务器之间的差量数据同步的操作,即,先将主服务器与其它备份服务器进行对比,得出对应于每个备份服务器的差量数据,然后把对比得到的各个差量数据发送到需要此数据的对应的各个备份节点。
正常工作状态(NORMAL)24:该同步操作完成之后,系统进入NORMAL状态,即,由主服务器对外提供服务,同时将提供服务而产生的新增数据向其它备份节点进行发送,其它备份服务器接收到数据以后,向主服务器发送确认信息进行应答,即进行正常的数据处理流程。
节点异常状态(NODEDOWN)25:在NORMAL状态时,若系统发生异常,就会进入NODEDOWN状态。在NODEDOWN状态可以分为两种情况:
情况一、若备份服务器发生异常情况,则主服务器会停止向该异常的备份服务器发送新增数据,同时清理对应备份服务器中的各种资源(异常数据,即网络异常时收到的重复数据等各种数据);
情况二、若主服务器发生异常情况,则系统首先会在备份元数据服务器中选择一个最合适的节点作为主服务器,在一个实施例中,最合适的备份节点可以指的是保存数据量最多的备份节点。同时,选择出的当前主服务器替代原异常主服务接管业务。
恢复状态(RCVR)23,在上述情况二中,在选出主从关系后,当前主服务器对外提供服务,重复上文中RCVR状态23的操作,即,在当前主服务器上产生的数据只在本服务器上接收,而不向其它的备份元数据服务器发送;同时,当前主服务器还会启动向备份服务器进行差量数据同步的操作,即,先将当前主服务器与其它备份服务器进行对比,得出对应于每个备份服务器的差量数据,然后由当前主服务器把对比得到的各个差量数据发送到需要此数据的对应的各个备份节点。
切换状态(SWITCH)26:当异常的原始主节点上线后,当前的主节点会立即向原始主节点发送差量数据,当差量数据发送完成后,进入SWITCH状态26,此时系统需要进行业务切换,即将服务切换到主元数据服务器上,进行状态机循环。
根据本发明的实施例提供了一种元数据的管理系统。
如图3所示,根据本发明实施例的管理系统可以包括:
选择模块31,用于在原主服务器出现异常的情况下,根据存储数据量选择备份服务器作为当前主服务器并替代原主服务器提供服务;
同步模块32,用于根据当前主服务器相比于其它每个备用服务器的差量数据,对每个备用服务器进行同步,其中,在同步期间,禁止将当前主服务器因提供服务而改变的数据发送给其它备份服务器。
其中,根据本发明实施例的管理系统还包括:发送模块(未示出),用于将当前主服务器将因提供服务而改变的数据发送至其它备份服务器。
并且,根据本发明实施例的管理系统还可以包括:确认接收模块(未示出),用于在其它备份服务器从当前主服务器接收到因提供服务而改变的数据之后,给当前主服务器发送确认信息。
此外,根据本发明实施例的管理系统可以进一步包括:禁止发送模块(未示出),用于在备份服务器出现异常的情况下,禁止提供服务的主服务器向出现异常的备份服务器发送数据;清除模块(未示出),用于清除该出现异常的备份服务器在异常期间产生的错误数据。
综上所述,借助于本发明的上述技术方案,本发明通过选择当前主服务器且提供服务,并对当前主服务器与备份服务器进行数据同步,能够使当前主服务器进行正常的业务接管,从而有效地实现主备服务器之间的替换,并且在同步期间禁止发送提供服务而改变数据来防止乱序数据同步,从而保证了系统的稳定性和可靠性。本发明提出元数据管理方法能够为分布式系统的元数据管理提供可靠并且快捷的方法,可以同时维护N(N>=1)个元数据服务器,当元数据组发生异常后,根据状态的变化,系统可以在稳定的状态中运行。当异常的元数据服务器恢复正常后,再进行状态变化,使系统在最快的时间内恢复为最初始的状态,提升了用户的体验感。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种元数据的管理方法,其特征在于,包括:
在原主服务器出现异常的情况下,根据存储数据量选择备份服务器作为当前主服务器并替代所述原主服务器提供服务;
根据所述当前主服务器相比于其它每个备用服务器的差量数据,对所述每个备用服务器进行同步,其中,在同步期间,禁止将所述当前主服务器因提供服务而改变的数据发送给其它备份服务器。
2.根据权利要求1所述的管理方法,其特征在于,在同步完成之后,包括:
所述当前主服务器将因提供服务而改变的所述数据发送至其它备份服务器。
3.根据权利要求2所述的管理方法,其特征在于,在其它备份服务器从所述当前主服务器接收到因提供服务而改变的数据之后,给所述当前主服务器发送确认信息。
4.根据权利要求1所述的管理方法,其特征在于,包括:
在所述原主服务器恢复正常之后,确定所述当前主服务器与所述原主服务器之间的差量数据;
根据所述当前主服务器与所述原主服务器之间的差量数据对所述原主服务器进行同步,其中,在同步期间,禁止将所述当前主服务器因提供服务而改变的数据发送给所述原主服务器。
5.根据权利要求4所述的管理方法,其特征在于,在对所述原主服务器完成同步之后,将所述当前主服务器的业务切换至所述原主服务器,由所述原主服务器替代所述当前主服务器提供服务。
6.根据权利要求1所述的管理方法,其特征在于,进一步包括:
在备份服务器出现异常的情况下,禁止提供服务的主服务器向出现异常的备份服务器发送数据;
清除该出现异常的备份服务器在异常期间产生的错误数据。
7.一种元数据的管理系统,其特征在于,包括:
选择模块,用于在原主服务器出现异常的情况下,根据存储数据量选择备份服务器作为当前主服务器并替代所述原主服务器提供服务;
同步模块,用于根据所述当前主服务器相比于其它每个备用服务器的差量数据,对所述每个备用服务器进行同步,其中,在同步期间,禁止将所述当前主服务器因提供服务而改变的数据发送给其它备份服务器。
8.根据权利要求7所述的管理系统,其特征在于,还包括:
发送模块,用于将所述当前主服务器将因提供服务而改变的所述数据发送至其它备份服务器。
9.根据权利要求8所述的管理系统,其特征在于,还包括:
确认接收模块,用于在其它备份服务器从所述当前主服务器接收到因提供服务而改变的数据之后,给所述当前主服务器发送确认信息。
10.根据权利要求7所述的管理系统,其特征在于,进一步包括:
禁止发送模块,用于在备份服务器出现异常的情况下,禁止提供服务的主服务器向出现异常的备份服务器发送数据;
清除模块,用于清除该出现异常的备份服务器在异常期间产生的错误数据。
CN2013101455508A 2013-04-24 2013-04-24 元数据的管理方法和系统 Pending CN103235748A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013101455508A CN103235748A (zh) 2013-04-24 2013-04-24 元数据的管理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013101455508A CN103235748A (zh) 2013-04-24 2013-04-24 元数据的管理方法和系统

Publications (1)

Publication Number Publication Date
CN103235748A true CN103235748A (zh) 2013-08-07

Family

ID=48883793

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013101455508A Pending CN103235748A (zh) 2013-04-24 2013-04-24 元数据的管理方法和系统

Country Status (1)

Country Link
CN (1) CN103235748A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036043A (zh) * 2014-07-01 2014-09-10 浪潮(北京)电子信息产业有限公司 一种mysql高可用的方法及管理节点
CN104735110A (zh) * 2013-12-23 2015-06-24 中国电信股份有限公司 元数据管理方法和系统
CN104993940A (zh) * 2015-05-11 2015-10-21 广东小天才科技有限公司 一种减少主备节点故障切换过程中数据丢失的方法和装置
CN106445684A (zh) * 2016-09-14 2017-02-22 郑州云海信息技术有限公司 一种服务部署方法及装置
CN107015999A (zh) * 2016-01-28 2017-08-04 阿里巴巴集团控股有限公司 一种基于分布式环境的信息发送方法及装置
CN107196799A (zh) * 2017-05-26 2017-09-22 河南职业技术学院 一种数据处理平台冗余服务器备份及切换运行控制方法
CN108259613A (zh) * 2018-01-24 2018-07-06 平安科技(深圳)有限公司 容灾数据的在线同步装置、方法及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059807A (zh) * 2007-01-26 2007-10-24 华中科技大学 一种提高元数据服务可靠性的方法及其系统
CN102447742A (zh) * 2011-11-24 2012-05-09 中兴通讯股份有限公司 一种动态数据主备同步的方法、系统及一种元数据服务器

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059807A (zh) * 2007-01-26 2007-10-24 华中科技大学 一种提高元数据服务可靠性的方法及其系统
CN102447742A (zh) * 2011-11-24 2012-05-09 中兴通讯股份有限公司 一种动态数据主备同步的方法、系统及一种元数据服务器

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104735110A (zh) * 2013-12-23 2015-06-24 中国电信股份有限公司 元数据管理方法和系统
CN104036043A (zh) * 2014-07-01 2014-09-10 浪潮(北京)电子信息产业有限公司 一种mysql高可用的方法及管理节点
CN104036043B (zh) * 2014-07-01 2017-05-03 浪潮(北京)电子信息产业有限公司 一种mysql高可用的方法及管理节点
CN104993940A (zh) * 2015-05-11 2015-10-21 广东小天才科技有限公司 一种减少主备节点故障切换过程中数据丢失的方法和装置
CN107015999A (zh) * 2016-01-28 2017-08-04 阿里巴巴集团控股有限公司 一种基于分布式环境的信息发送方法及装置
CN107015999B (zh) * 2016-01-28 2020-11-03 创新先进技术有限公司 一种基于分布式环境的信息发送方法及装置
CN106445684A (zh) * 2016-09-14 2017-02-22 郑州云海信息技术有限公司 一种服务部署方法及装置
CN107196799A (zh) * 2017-05-26 2017-09-22 河南职业技术学院 一种数据处理平台冗余服务器备份及切换运行控制方法
CN107196799B (zh) * 2017-05-26 2020-10-16 河南职业技术学院 一种数据处理平台冗余服务器备份及切换运行控制方法
CN108259613A (zh) * 2018-01-24 2018-07-06 平安科技(深圳)有限公司 容灾数据的在线同步装置、方法及计算机可读存储介质
CN108259613B (zh) * 2018-01-24 2019-12-24 平安科技(深圳)有限公司 容灾数据的在线同步装置、方法及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN103235748A (zh) 元数据的管理方法和系统
CN106331098B (zh) 一种服务器集群系统
CN102891849B (zh) 业务数据同步方法、恢复方法及装置和网络设备
CN110601903B (zh) 一种基于消息队列中间件的数据处理方法及装置
CN111427728B (zh) 状态管理方法、主备切换方法及电子设备
CN105407117B (zh) 分布式备份数据的方法、装置和系统
CN110581782B (zh) 一种容灾数据的处理方法、装置及系统
CN102591747A (zh) 数据备份方法及装置
CN105049336A (zh) 即时通信消息的处理方法、服务器、客户端及系统
CN105117382B (zh) 一种文档协同方法及装置
WO2016078529A1 (zh) 业务处理方法、装置及系统
CN102984357B (zh) 一种联系人信息管理方法及装置
CN105511987A (zh) 一种强一致性且高可用的分布式任务管理系统
CN103152390A (zh) 分布式存储系统的节点配置方法、装置、节点及系统
CN103346898A (zh) 热拔插板卡配置信息处理的方法和网络通信设备
CN103384211A (zh) 一种具有容错性的数据操作方法及分布式的数据存储系统
CN103905220A (zh) 数据同步处理方法及系统
CN102957546A (zh) 配置处理方法、装置及系统
CN106201772A (zh) 一种基于数据中心的操作系统备份、恢复方法及装置
CN104793981A (zh) 一种虚拟机集群的在线快照管理方法及装置
CN103544081A (zh) 双元数据服务器的管理方法和装置
CN103179153A (zh) 移动终端和基于云端服务器的移动终端数据备份方法
CN112087506B (zh) 一种集群节点管理方法、装置及计算机存储介质
CN105323271B (zh) 一种云计算系统以及云计算系统的处理方法和装置
CN107623705B (zh) 基于视频云存储系统的存储模式升级方法、装置和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20130807

RJ01 Rejection of invention patent application after publication