CN102523105B - 一种数据存储的故障恢复方法及其适用的数据分布架构 - Google Patents

一种数据存储的故障恢复方法及其适用的数据分布架构 Download PDF

Info

Publication number
CN102523105B
CN102523105B CN201110391197.2A CN201110391197A CN102523105B CN 102523105 B CN102523105 B CN 102523105B CN 201110391197 A CN201110391197 A CN 201110391197A CN 102523105 B CN102523105 B CN 102523105B
Authority
CN
China
Prior art keywords
metadata
data
meta data
data server
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110391197.2A
Other languages
English (en)
Other versions
CN102523105A (zh
Inventor
刘祥涛
岳强
季统凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN201110391197.2A priority Critical patent/CN102523105B/zh
Publication of CN102523105A publication Critical patent/CN102523105A/zh
Application granted granted Critical
Publication of CN102523105B publication Critical patent/CN102523105B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及云计算领域,尤其是一种面向云操作系统的故障恢复方法及其适用的数据分布架构。本发明用流水日志来记录元数据的更改,即每台元数据服务器都会记录在本机上元数据的更改内容,并以日志的方式进行持久存储,使得即使在本机出现软硬件故障时均可从流水日志得到恢复。本发明有效解决了云操作系统中数据的高可用性问题,可应用于云操作系统存储数据的恢复。

Description

一种数据存储的故障恢复方法及其适用的数据分布架构
技术领域
本发明涉及云计算领域,尤其是一种面向云操作系统的故障恢复方法及其适用的数据分布架构。
背景技术
云操作系统能对包括处理器、存储、网络在内的硬件资源进行统一管理。在当前的云操作系统应用部署中,数据存储主要有两种用途:(1)用户接口存储,即提供给用户所使用的存储;(2)系统所需存储,例如虚拟机镜像存储,当前,云操作系统的数据存储存在性能不高、扩展性不好、不稳定、安全性不够等问题。
发明内容
本发明解决的技术问题之一在于提供一种面向云操作系统的数据存储的故障恢复方法,提高数据的可用性。
本发明解决的技术问题之二在于提供一种数据分布架构,可以解决元数据服务的可用性、可扩展性。
本发明解决上述技术问题之一的技术方案是:
创建流水日志,在每台元数据服务器上记录其元数据的更改内容,并以日志的方式进行持久存储,并按如下步骤实施;
第1步,在元数据服务器中通过某种机制选举一台活动而且功能正常的元数据服务器作为故障恢复中心;
第2步,其他元数据服务器周期性地给中心点发送心跳消息,若在一段时间内,中心未收到某台元数据服务器的心跳消息,则中心判断该元数据服务器已经发生故障,该服务器将进行故障恢复;
第3步,恢复,读取流水日志,恢复元数据,并将部分元数据预读到高速缓存中进行缓存;重启元数据服务器进程;给中心和其他元数据服务器发送加入消息,重新加入元数据服务器集群。
本发明解决上述技术问题之二的技术方案是:
采用分布式存储架构将元数据和数据进行分离,使用专门的元数据服务器存储元数据和处理客户端对元数据的请求;
当客户端欲获取某文件数据时,将首先和元数据服务器通信,获取描述该文件数据的元数据,即获取数据在数据服务器集群的存储位置以及其他信息;然后客户端和数据服务器集群通信,获取其想要的数据。
所述的元数据服务系统架构采用了多台元数据服务器。
所述的元数据指描述文件信息或文件目录信息的数据;描述文件信息包括包括文件大小信息,文件目录信息包括存放位置信息。
元数据存储介质为固态硬盘、高速缓存。
本发明多元架构具有如下优点:(1)无单点故障,当部分元数据服务器失效时,其他元数据服务器会接管元数据服务,保证元数据服务的高可用性;(2)可扩展性好,存储规模需要不断扩展,可能扩展到PB甚至EB级存储量,当存储量扩充时,可相应增加元数据服务器数量,以适应元数据服务的速度要求。将元数据与数据进行分离的优点在于:(1)功能划分清楚,逻辑简单;让数据服务器专门存储数据和处理数据请求,而将存储和处理元数据的任务交给专门的服务器,各司其职,让处理逻辑变的简单清晰。(2)元数据服务占数据读写总量的30%到70%,而且元数据读写中绝大部分为小数据量随机读写,将占高比重的元数据服务与数据服务相分离,可以提高处理速度。
用固态硬盘和高速缓存的方式存储元数据虽然成本较传统SATA硬盘高,但是由于固态硬盘在读写数据时没有寻道时间和旋转时间,特别适合于进行频繁的小数据量的数据读写,而且,元数据的数据量不大,故在关键性能点采用适合应用场景的成本较高的固态硬盘是可取的。为进一步提高元数据读写速度,对热点较高的数据,采用高速缓存的方式进行缓存,从而进一步提高元数据服务的读取性能。
引入的故障恢复机制保证了元数据服务的高可用性。
附图说明
下面结合附图对本发明进一步说明:
图1是本发明元数据服务系统架构示意图;
图2是本发明故障恢复架构示意图;
图3是本发明故障恢复流程示意图。
具体实施方式
如图1所示,本发明引入了多元数据服务器架构,分布式存储架构将元数据和数据进行分离,使用专门的元数据服务器来存储元数据和处理客户端对元数据的请求。当客户端欲获取某文件数据时,将首先和元数据服务器通信,获取描述该文件数据的元数据,即获取数据在数据服务器集群的存储位置以及其他信息;然后客户端和数据服务器集群通信,获取其想要的数据。如图2所示,为进行快速故障恢复,本发明提出用流水日志来记录元数据的更改,即每台元数据服务器都会记录在本机上元数据的更改内容,并以日志的方式进行持久存储,使得即使在本机出现软硬件故障时均可从流水日志得到恢复。图3描述了故障恢复的流程,其具体步骤如下:
第1步,在元数据服务器中通过某种机制选举一台活动而且功能正常的元数据服务器作为故障恢复中心;
第2步,其他元数据服务器周期性地给中心点发送心跳消息,若在一段时间内,中心未收到某台元数据服务器的心跳消息,则中心判断该元数据服务器已经发生故障,该服务器将进行故障恢复;
第3步,恢复流程如下:读取流水日志,恢复元数据,并将部分元数据预读到高速缓存中进行缓存;重启元数据服务器进程;给中心和其他元数据服务器发送加入消息,重新加入元数据服务器集群。
元数据,指描述数据及其环境的数据;在本发明的数据存储背景下,特指描述文件信息或文件目录信息的数据,这些信息包括:文件大小、存放位置等。
多元数据服务器,是云操作系统数据存储元数据服务的核心,负责响应元数据服务请求,进行相应的元数据响应,返回文件的元数据信息。
本发明针对关键数据,采用固态硬盘加高速缓存的方式进行存储,以提高热点数据的输入输出速度。

Claims (6)

1.一种面向云操作系统的数据存储的故障恢复方法,其特征在于:创建流水日志,在每台元数据服务器上记录其元数据的更改内容,并以日志的方式进行持久存储,并按如下步骤实施;
第1步,在元数据服务器中通过某种机制选举一台活动而且功能正常的元数据服务器作为故障恢复中心;
第2步,其他元数据服务器周期性地给中心点发送心跳消息,若在一段时间内,中心未收到某台元数据服务器的心跳消息,则中心判断该元数据服务器已经发生故障,该服务器将进行故障恢复;
第3步,恢复,读取流水日志,恢复元数据,并将部分元数据预读到高速缓存中进行缓存;重启元数据服务器进程;给中心和其他元数据服务器发送加入消息,重新加入元数据服务器集群。
2.一种权利要求1所述的故障恢复方法适用的数据存储架构,其特征在于:采用分布式存储架构将元数据和数据进行分离,使用专门的元数据服务器存储元数据和处理客户端对元数据的请求;
当客户端欲获取某文件数据时,将首先和元数据服务器通信,获取描述该文件数据的元数据,即获取数据在数据服务器集群的存储位置以及其他信息;然后客户端和数据服务器集群通信,获取其想要的数据。
3.根据权利要求2所述的数据存储架构,其特征在于:所述的元数据服务系统架构采用多台元数据服务器。
4.根据权利要求2或3所述的数据存储架构,其特征在于:所述的元数据指描述文件信息或文件目录信息的数据;描述文件信息包括文件大小信息,文件目录信息包括存放位置信息。
5.根据权利要求2或3所述的数据存储架构,其特征在于:元数据存储介质为固态硬盘、高速缓存。
6.根据权利要求4所述的数据存储架构,其特征在于:元数据存储介质为固态硬盘、高速缓存。
CN201110391197.2A 2011-11-30 2011-11-30 一种数据存储的故障恢复方法及其适用的数据分布架构 Active CN102523105B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110391197.2A CN102523105B (zh) 2011-11-30 2011-11-30 一种数据存储的故障恢复方法及其适用的数据分布架构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110391197.2A CN102523105B (zh) 2011-11-30 2011-11-30 一种数据存储的故障恢复方法及其适用的数据分布架构

Publications (2)

Publication Number Publication Date
CN102523105A CN102523105A (zh) 2012-06-27
CN102523105B true CN102523105B (zh) 2014-03-26

Family

ID=46293905

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110391197.2A Active CN102523105B (zh) 2011-11-30 2011-11-30 一种数据存储的故障恢复方法及其适用的数据分布架构

Country Status (1)

Country Link
CN (1) CN102523105B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104144150A (zh) * 2013-05-10 2014-11-12 中国电信股份有限公司 利用元数据访问信息的方法、装置和系统
CN104735110B (zh) * 2013-12-23 2019-03-26 中国电信股份有限公司 元数据管理方法和系统
CN103761161B (zh) * 2013-12-31 2017-01-04 华为技术有限公司 恢复数据的方法、服务器及系统
CN107340971B (zh) * 2016-04-28 2019-05-07 优刻得科技股份有限公司 一种数据存储与恢复架构与方法
CN109117311A (zh) * 2018-08-22 2019-01-01 郑州云海信息技术有限公司 一种故障恢复方法及装置
WO2021189312A1 (en) * 2020-03-25 2021-09-30 Beijing Didi Infinity Technology And Development Co., Ltd. Meta server crash recovery in object storage system using enhanced meta structure

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059807A (zh) * 2007-01-26 2007-10-24 华中科技大学 一种提高元数据服务可靠性的方法及其系统
CN101471845A (zh) * 2007-12-27 2009-07-01 中国移动通信集团公司 数据块副本数量调整方法及元数据服务器节点
CN101577735A (zh) * 2009-06-24 2009-11-11 成都市华为赛门铁克科技有限公司 一种接管故障元数据服务器的方法、装置及系统
CN101706805A (zh) * 2009-10-30 2010-05-12 中国科学院计算技术研究所 对象存储方法及其系统
CN201726424U (zh) * 2009-08-18 2011-01-26 升东网络科技发展(上海)有限公司 分布式存储系统
CN101997884A (zh) * 2009-08-18 2011-03-30 升东网络科技发展(上海)有限公司 分布式存储系统和方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101453425B1 (ko) * 2008-12-18 2014-10-23 한국전자통신연구원 메타데이터 서버 및 메타데이터 관리 방법
US8489698B2 (en) * 2009-12-18 2013-07-16 Electronics And Telecommunications Research Institute Apparatus and method for accessing a metadata

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059807A (zh) * 2007-01-26 2007-10-24 华中科技大学 一种提高元数据服务可靠性的方法及其系统
CN101471845A (zh) * 2007-12-27 2009-07-01 中国移动通信集团公司 数据块副本数量调整方法及元数据服务器节点
CN101577735A (zh) * 2009-06-24 2009-11-11 成都市华为赛门铁克科技有限公司 一种接管故障元数据服务器的方法、装置及系统
CN201726424U (zh) * 2009-08-18 2011-01-26 升东网络科技发展(上海)有限公司 分布式存储系统
CN101997884A (zh) * 2009-08-18 2011-03-30 升东网络科技发展(上海)有限公司 分布式存储系统和方法
CN101706805A (zh) * 2009-10-30 2010-05-12 中国科学院计算技术研究所 对象存储方法及其系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
冯幼乐.分布式文件系统元数据管理技术研究与实现.《中国优秀硕士学位论文全文数据库》.2010,
分布式文件系统元数据管理技术研究与实现;冯幼乐;《中国优秀硕士学位论文全文数据库》;20100115;正文第1137页至第1187页 *

Also Published As

Publication number Publication date
CN102523105A (zh) 2012-06-27

Similar Documents

Publication Publication Date Title
US10489422B2 (en) Reducing data volume durability state for block-based storage
US9983825B2 (en) Efficient data volume replication for block-based storage
CN102523105B (zh) 一种数据存储的故障恢复方法及其适用的数据分布架构
CN103268318B (zh) 一种强一致性的分布式键值数据库系统及其读写方法
CN102523258A (zh) 一种面向云操作系统的数据存储架构及其负载均衡方法
US20190114223A1 (en) Accelerating erasure code replication in distributed systems
JP6225262B2 (ja) 分散データグリッドにおいてデータを同期させるためにパーティションレベルジャーナリングをサポートするためのシステムおよび方法
CN103516549B (zh) 一种基于共享对象存储的文件系统元数据日志机制
US8930501B2 (en) Distributed data storage system and method
CN102117248A (zh) 一种缓存系统和在缓存系统中缓存数据的方法
CN104317736B (zh) 一种分布式文件系统多级缓存实现方法
CN104361030A (zh) 一种具有任务分发功能的分布式缓存架构及缓存方法
CN107422989B (zh) 一种Server SAN系统多副本读取方法及存储系统
CN102982182A (zh) 一种数据存储规划方法及装置
US11416156B2 (en) Object tiering in a distributed storage system
CN103384266A (zh) 一种基于文件级实时同步的Parastor200管理节点高可用方法
WO2014190622A1 (zh) 一种离线消息的存储方法及服务器
CN103309763A (zh) 虚拟机的容错机制的保护方法和装置
CN103150268A (zh) 一种cdp中的块级数据捕获方法
CN112379825A (zh) 基于数据特征分池的分布式数据存储方法及装置
CN103544081A (zh) 双元数据服务器的管理方法和装置
EP4170499A1 (en) Data storage method, storage system, storage device, and storage medium
US9424147B2 (en) System and method for supporting memory allocation control with push-back in a distributed data grid
CN105871987A (zh) 数据写入的高可用系统及方法
JP5016696B2 (ja) 高可用性システム、サーバ、高可用性維持方法及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant