CN102368267A - 一种维护分布式系统中副本一致性的方法 - Google Patents
一种维护分布式系统中副本一致性的方法 Download PDFInfo
- Publication number
- CN102368267A CN102368267A CN201110326044XA CN201110326044A CN102368267A CN 102368267 A CN102368267 A CN 102368267A CN 201110326044X A CN201110326044X A CN 201110326044XA CN 201110326044 A CN201110326044 A CN 201110326044A CN 102368267 A CN102368267 A CN 102368267A
- Authority
- CN
- China
- Prior art keywords
- copy
- disk
- copies
- daily record
- internal memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Memory System Of A Hierarchy Structure (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明提供了一种维护分布式系统中副本一致性的方法,存储系统中的元数据服务器记录索引和副本的状态,客户端仅修改主副本,从副本由主副本进行同步,同步过程中,副本记录内存日志,并依据操作结果将日志写入磁盘或丢弃。本发明能够在副本最小可用的情况下,保证数据一致,能够处理网络失效、服务器失效、磁盘失效等引发数据不一致的故障,能够以最小的代价,快速恢复副本。
Description
技术领域
本发明涉及计算机存储领域,具体地说是在基于对象存储系统的维护副本一致性的方法。
背景技术
随着信息化的发展,信息资源爆炸式的增长,存储技术在各个方面出现了前所未有的发展。随着存储容量的持续增长和存储设备成本的不断增加,存储系统逐渐成为提高计算机性能的关键。
对象存储技术是充分利用对象存储设备(OSD)的功能和处理能力,对外提供对象接口。为了提高对象的可靠性、可用性和高效性,往往将对象存储成多个副本,存储在不同的OSD上,这样访问所需的对象时,只需访问其中一个副本,这种机制称为复制机制。
OSD通常使用廉价的普通磁盘作为存储设备,磁盘故障及OSD本身的故障发生的概率较大。存储系统的日渐大型化,硬件规模的逐渐扩大,错误出现的次数也随之增大。在复制机制中,易造成多个副本间数据的不一致性。因此需要一种保证数据一致性的手段,维护多副本策略的正确性。
发明内容
本发明的目的在于提供一种能够在出现副本故障后,准确的记录与恢复不一致副本的方法。
一种维护分布式系统中副本一致性的方法,
存储系统中的元数据服务器记录索引和副本的状态,客户端仅修改主副本,从副本由主副本进行同步,同步过程中,副本记录内存日志,并依据操作结果将日志写入磁盘或丢弃。
优选的,所述同步过程包括内存操作阶段和磁盘操作阶段。
优选的,所述内存操作阶段过程为:
主副本接收到客户端的数据修改请求后,修改本地缓存,并同步从副本缓存,各副本缓存一致后,主副本应答客户端,表示此请求已被处理完成;各副本节点记录操作日志到内存中,将错误副本上报至元数据服务器。
优选的,所述磁盘操作阶段过程为:
主副本根据前一阶段的日志,将缓存数据写入本地磁盘,并同步副本磁盘,主副本根据操作结果,将错误副本上报至元数据服务器,并通知从副本节点记录日志至磁盘或丢弃日志。
本发明能够在副本最小可用的情况下,保证数据一致,能够处理网络失效、服务器失效、磁盘失效等引发数据不一致的故障,能够以最小的代价,快速恢复副本。
附图说明
图1为本发明的同步过程
图2为本发明的副本同步过程
图3为本发明的内存操作阶段
图4为本发明的磁盘操作阶段
具体实施方式
存储系统中的元数据服务器(MOS)在记录索引之外,也记录副本的状态。客户端仅修改主副本,从副本由主副本进行同步(图2)。同步过程分为两步:内存操作阶段与磁盘操作阶段。同步过程中,副本记录内存日志,并依据操作结果将日志写入磁盘或丢弃。
1.内存操作阶段
主副本接收到客户端的数据修改请求后,修改本地缓存,并同步从副本缓存。各副本缓存一致后,主副本应答客户端,表示此请求已被处理完成。此过程仅操作内存数据,不操作磁盘中的数据,各副本节点记录操作日志到内存中,将错误副本上报至MOS(图3)。
2.磁盘操作阶段
主副本根据前一阶段的日志,将缓存数据写入本地磁盘,并同步副本磁盘。主副本根据操作结果,将错误副本上报至MOS,并通知从副本节点记录日志至磁盘或丢弃日志(图4)。
两个阶段的同步,分别保证了内存与磁盘的一致性。在确定的状态下,各副本的内存与磁盘数据状态也是确定的,且在正确的情况的是一致的。这样就为出错副本错误时的数据修复提供了基础。
数据修复时,查找MOS,可以准确的找到不一致副本。日志功能可以提供在不重建全部数据的情况下恢复副本。每个副本上均有日志,保证了仅需要一个正确副本,就可以进行副本恢复,提高系统的容错度。
Claims (4)
1.一种维护分布式系统中副本一致性的方法,其特征在于:
存储系统中的元数据服务器记录索引和副本的状态,客户端仅修改主副本,从副本由主副本进行同步,同步过程中,副本记录内存日志,并依据操作结果将日志写入磁盘或丢弃。
2.如权利要求1所述的方法,其特征在于:所述同步过程包括内存操作阶段和磁盘操作阶段。
3.如权利要求1所述的方法,其特征在于:所述内存操作阶段过程为:
主副本接收到客户端的数据修改请求后,修改本地缓存,并同步从副本缓存,各副本缓存一致后,主副本应答客户端,表示此请求已被处理完成;各副本节点记录操作日志到内存中,将错误副本上报至元数据服务器。
4.如权利要求1所述的方法,其特征在于:所述磁盘操作阶段过程为:
主副本根据前一阶段的日志,将缓存数据写入本地磁盘,并同步副本磁盘,主副本根据操作结果,将错误副本上报至元数据服务器,并通知从副本节点记录日志至磁盘或丢弃日志。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110326044XA CN102368267A (zh) | 2011-10-25 | 2011-10-25 | 一种维护分布式系统中副本一致性的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110326044XA CN102368267A (zh) | 2011-10-25 | 2011-10-25 | 一种维护分布式系统中副本一致性的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102368267A true CN102368267A (zh) | 2012-03-07 |
Family
ID=45760831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110326044XA Pending CN102368267A (zh) | 2011-10-25 | 2011-10-25 | 一种维护分布式系统中副本一致性的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102368267A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102970350A (zh) * | 2012-11-05 | 2013-03-13 | 曙光信息产业(北京)有限公司 | 在存储系统中维护副本一致性的方法 |
CN103049351A (zh) * | 2012-12-13 | 2013-04-17 | 曙光信息产业(北京)有限公司 | 多元数据服务器的日志处理方法和装置 |
CN103077187A (zh) * | 2012-12-20 | 2013-05-01 | 曙光信息产业(北京)有限公司 | 日志管理方法和日志管理系统 |
CN103428288A (zh) * | 2013-08-13 | 2013-12-04 | 浙江大学 | 基于分区状态表和协调节点的副本同步方法 |
CN103580906A (zh) * | 2012-08-09 | 2014-02-12 | 腾讯科技(深圳)有限公司 | 一种数据备份的方法、系统及服务器 |
CN103607448A (zh) * | 2013-11-18 | 2014-02-26 | 四川川大智胜软件股份有限公司 | 一种atc系统动态数据存储的方法 |
CN105589887A (zh) * | 2014-10-24 | 2016-05-18 | 中兴通讯股份有限公司 | 分布式文件系统的数据处理方法及分布式文件系统 |
CN106203167A (zh) * | 2016-07-08 | 2016-12-07 | 北京小米移动软件有限公司 | 应用权限管理方法及装置 |
CN106295550A (zh) * | 2016-08-08 | 2017-01-04 | 苏州佳世达电通有限公司 | 电器设备的操作识别方法及应用其的操作识别系统 |
CN106506704A (zh) * | 2016-12-29 | 2017-03-15 | 北京奇艺世纪科技有限公司 | 一种缓存更新方法及装置 |
CN106951443A (zh) * | 2017-02-15 | 2017-07-14 | 北京百度网讯科技有限公司 | 基于分布式系统的副本同步的方法、设备和系统 |
CN107153671A (zh) * | 2016-03-02 | 2017-09-12 | 阿里巴巴集团控股有限公司 | 一种在分布式系统中实现多文件副本读写的方法与设备 |
CN107239544A (zh) * | 2017-06-05 | 2017-10-10 | 山东浪潮云服务信息科技有限公司 | 一种分布式存储的实现方法及装置 |
CN107579865A (zh) * | 2017-10-18 | 2018-01-12 | 北京奇虎科技有限公司 | 分布式代码服务器的权限管理方法、装置及系统 |
CN108616598A (zh) * | 2018-05-10 | 2018-10-02 | 新华三技术有限公司成都分公司 | 数据同步方法、装置和分布式存储系统 |
CN108664356A (zh) * | 2018-05-03 | 2018-10-16 | 吉林亿联银行股份有限公司 | 一种数据库备份方法及装置、数据库系统 |
CN109117093A (zh) * | 2018-08-20 | 2019-01-01 | 赛凡信息科技(厦门)有限公司 | 保证分布式对象存储中的数据、流量、容量一致性的方案 |
CN110895545A (zh) * | 2018-08-22 | 2020-03-20 | 阿里巴巴集团控股有限公司 | 共享数据同步方法及装置 |
CN112819592A (zh) * | 2021-04-16 | 2021-05-18 | 深圳华锐金融技术股份有限公司 | 业务请求处理方法、系统、计算机设备和存储介质 |
US11620275B2 (en) | 2021-08-26 | 2023-04-04 | International Business Machines Corporation | Multi-text interconnection |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060129614A1 (en) * | 2004-12-14 | 2006-06-15 | Kim Hong Y | Crash recovery system and method for distributed file server using object based storage |
US7415488B1 (en) * | 2004-12-31 | 2008-08-19 | Symantec Operating Corporation | System and method for redundant storage consistency recovery |
CN101706805A (zh) * | 2009-10-30 | 2010-05-12 | 中国科学院计算技术研究所 | 对象存储方法及其系统 |
CN102023816A (zh) * | 2010-11-04 | 2011-04-20 | 天津曙光计算机产业有限公司 | 一种对象存储系统的对象存放策略和访问方法 |
CN102033786A (zh) * | 2010-11-04 | 2011-04-27 | 天津曙光计算机产业有限公司 | 一种对象存储系统中修复副本一致性的方法 |
CN102129435A (zh) * | 2010-01-13 | 2011-07-20 | 中国移动通信集团公司 | 数据存储业务控制方法及系统 |
-
2011
- 2011-10-25 CN CN201110326044XA patent/CN102368267A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060129614A1 (en) * | 2004-12-14 | 2006-06-15 | Kim Hong Y | Crash recovery system and method for distributed file server using object based storage |
US7415488B1 (en) * | 2004-12-31 | 2008-08-19 | Symantec Operating Corporation | System and method for redundant storage consistency recovery |
CN101706805A (zh) * | 2009-10-30 | 2010-05-12 | 中国科学院计算技术研究所 | 对象存储方法及其系统 |
CN102129435A (zh) * | 2010-01-13 | 2011-07-20 | 中国移动通信集团公司 | 数据存储业务控制方法及系统 |
CN102023816A (zh) * | 2010-11-04 | 2011-04-20 | 天津曙光计算机产业有限公司 | 一种对象存储系统的对象存放策略和访问方法 |
CN102033786A (zh) * | 2010-11-04 | 2011-04-27 | 天津曙光计算机产业有限公司 | 一种对象存储系统中修复副本一致性的方法 |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103580906A (zh) * | 2012-08-09 | 2014-02-12 | 腾讯科技(深圳)有限公司 | 一种数据备份的方法、系统及服务器 |
CN103580906B (zh) * | 2012-08-09 | 2018-02-27 | 腾讯科技(深圳)有限公司 | 一种数据备份的方法、系统及服务器 |
CN102970350A (zh) * | 2012-11-05 | 2013-03-13 | 曙光信息产业(北京)有限公司 | 在存储系统中维护副本一致性的方法 |
CN103049351A (zh) * | 2012-12-13 | 2013-04-17 | 曙光信息产业(北京)有限公司 | 多元数据服务器的日志处理方法和装置 |
CN103049351B (zh) * | 2012-12-13 | 2016-06-08 | 曙光信息产业(北京)有限公司 | 多元数据服务器的日志处理方法和装置 |
CN103077187A (zh) * | 2012-12-20 | 2013-05-01 | 曙光信息产业(北京)有限公司 | 日志管理方法和日志管理系统 |
CN103428288A (zh) * | 2013-08-13 | 2013-12-04 | 浙江大学 | 基于分区状态表和协调节点的副本同步方法 |
CN103428288B (zh) * | 2013-08-13 | 2016-03-09 | 浙江大学 | 基于分区状态表和协调节点的副本同步方法 |
CN103607448A (zh) * | 2013-11-18 | 2014-02-26 | 四川川大智胜软件股份有限公司 | 一种atc系统动态数据存储的方法 |
CN103607448B (zh) * | 2013-11-18 | 2016-08-24 | 四川川大智胜软件股份有限公司 | 一种atc系统动态数据存储的方法 |
CN105589887A (zh) * | 2014-10-24 | 2016-05-18 | 中兴通讯股份有限公司 | 分布式文件系统的数据处理方法及分布式文件系统 |
CN107153671A (zh) * | 2016-03-02 | 2017-09-12 | 阿里巴巴集团控股有限公司 | 一种在分布式系统中实现多文件副本读写的方法与设备 |
CN107153671B (zh) * | 2016-03-02 | 2020-11-24 | 阿里巴巴集团控股有限公司 | 一种在分布式系统中实现多文件副本读写的方法与设备 |
CN106203167B (zh) * | 2016-07-08 | 2019-05-07 | 北京小米移动软件有限公司 | 应用权限管理方法及装置 |
CN106203167A (zh) * | 2016-07-08 | 2016-12-07 | 北京小米移动软件有限公司 | 应用权限管理方法及装置 |
CN106295550A (zh) * | 2016-08-08 | 2017-01-04 | 苏州佳世达电通有限公司 | 电器设备的操作识别方法及应用其的操作识别系统 |
CN106295550B (zh) * | 2016-08-08 | 2019-10-22 | 苏州佳世达电通有限公司 | 电器设备的操作识别方法及应用其的操作识别系统 |
CN106506704A (zh) * | 2016-12-29 | 2017-03-15 | 北京奇艺世纪科技有限公司 | 一种缓存更新方法及装置 |
CN106951443A (zh) * | 2017-02-15 | 2017-07-14 | 北京百度网讯科技有限公司 | 基于分布式系统的副本同步的方法、设备和系统 |
CN107239544A (zh) * | 2017-06-05 | 2017-10-10 | 山东浪潮云服务信息科技有限公司 | 一种分布式存储的实现方法及装置 |
CN107579865A (zh) * | 2017-10-18 | 2018-01-12 | 北京奇虎科技有限公司 | 分布式代码服务器的权限管理方法、装置及系统 |
CN108664356A (zh) * | 2018-05-03 | 2018-10-16 | 吉林亿联银行股份有限公司 | 一种数据库备份方法及装置、数据库系统 |
CN108616598A (zh) * | 2018-05-10 | 2018-10-02 | 新华三技术有限公司成都分公司 | 数据同步方法、装置和分布式存储系统 |
CN108616598B (zh) * | 2018-05-10 | 2021-01-01 | 新华三技术有限公司成都分公司 | 数据同步方法、装置和分布式存储系统 |
CN109117093A (zh) * | 2018-08-20 | 2019-01-01 | 赛凡信息科技(厦门)有限公司 | 保证分布式对象存储中的数据、流量、容量一致性的方案 |
CN109117093B (zh) * | 2018-08-20 | 2021-10-01 | 赛凡信息科技(厦门)有限公司 | 保证分布式对象存储中的数据、流量、容量一致性的方法 |
CN110895545A (zh) * | 2018-08-22 | 2020-03-20 | 阿里巴巴集团控股有限公司 | 共享数据同步方法及装置 |
CN110895545B (zh) * | 2018-08-22 | 2023-08-15 | 阿里云计算有限公司 | 共享数据同步方法及装置 |
CN112819592A (zh) * | 2021-04-16 | 2021-05-18 | 深圳华锐金融技术股份有限公司 | 业务请求处理方法、系统、计算机设备和存储介质 |
CN112819592B (zh) * | 2021-04-16 | 2021-08-03 | 深圳华锐金融技术股份有限公司 | 业务请求处理方法、系统、计算机设备和存储介质 |
US11620275B2 (en) | 2021-08-26 | 2023-04-04 | International Business Machines Corporation | Multi-text interconnection |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102368267A (zh) | 一种维护分布式系统中副本一致性的方法 | |
US10503616B2 (en) | Periodic data replication | |
US10261719B2 (en) | Volume and snapshot replication | |
US9575849B2 (en) | Synchronized backup and recovery of database systems | |
US10452271B2 (en) | Reconstructing in-memory indices in a distributed data storage system | |
US7330859B2 (en) | Database backup system using data and user-defined routines replicators for maintaining a copy of database on a secondary server | |
CN102891849B (zh) | 业务数据同步方法、恢复方法及装置和网络设备 | |
US10565071B2 (en) | Smart data replication recoverer | |
US8356017B2 (en) | Replication of deduplicated data | |
US8527459B2 (en) | System and method for data replication between heterogeneous databases | |
CN105302667B (zh) | 基于集群架构的高可靠性数据备份与恢复方法 | |
US9772783B2 (en) | Constructing an index to facilitate accessing a closed extent in an append-only storage system | |
CN105574187B (zh) | 一种异构数据库复制事务一致性保障方法及系统 | |
TW201020824A (en) | Efficient transfer of deduplicated data | |
US8296536B2 (en) | Synchronization of replicated sequential access storage components | |
TW201209576A (en) | Approach for optimizing restores of deduplicated data | |
US20110035356A1 (en) | Transactional archiving of an electronic document | |
US9720607B2 (en) | Append-only storage system supporting open and closed extents | |
US10484179B1 (en) | Data consistency in an encrypted replication environment | |
CN102708166B (zh) | 数据复制方法、数据恢复方法及装置 | |
WO2017122060A1 (en) | Parallel recovery for shared-disk databases | |
CN104991739A (zh) | 元数据服务器失效接替中精确一次执行语义的方法及系统 | |
WO2013091183A1 (zh) | 一种键值对的操作方法及装置 | |
US8990161B1 (en) | System and method for single segment backup | |
JP2007257416A (ja) | レプリケーションシステムにおけるデータ復旧方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20120307 |