CN102368267A - 一种维护分布式系统中副本一致性的方法 - Google Patents

一种维护分布式系统中副本一致性的方法 Download PDF

Info

Publication number
CN102368267A
CN102368267A CN201110326044XA CN201110326044A CN102368267A CN 102368267 A CN102368267 A CN 102368267A CN 201110326044X A CN201110326044X A CN 201110326044XA CN 201110326044 A CN201110326044 A CN 201110326044A CN 102368267 A CN102368267 A CN 102368267A
Authority
CN
China
Prior art keywords
copy
disk
copies
daily record
internal memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201110326044XA
Other languages
English (en)
Inventor
姜国梁
付根希
彭成
苗艳超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dawning Information Industry Beijing Co Ltd
Original Assignee
Dawning Information Industry Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Beijing Co Ltd filed Critical Dawning Information Industry Beijing Co Ltd
Priority to CN201110326044XA priority Critical patent/CN102368267A/zh
Publication of CN102368267A publication Critical patent/CN102368267A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供了一种维护分布式系统中副本一致性的方法,存储系统中的元数据服务器记录索引和副本的状态,客户端仅修改主副本,从副本由主副本进行同步,同步过程中,副本记录内存日志,并依据操作结果将日志写入磁盘或丢弃。本发明能够在副本最小可用的情况下,保证数据一致,能够处理网络失效、服务器失效、磁盘失效等引发数据不一致的故障,能够以最小的代价,快速恢复副本。

Description

一种维护分布式系统中副本一致性的方法
技术领域
本发明涉及计算机存储领域,具体地说是在基于对象存储系统的维护副本一致性的方法。
背景技术
随着信息化的发展,信息资源爆炸式的增长,存储技术在各个方面出现了前所未有的发展。随着存储容量的持续增长和存储设备成本的不断增加,存储系统逐渐成为提高计算机性能的关键。
对象存储技术是充分利用对象存储设备(OSD)的功能和处理能力,对外提供对象接口。为了提高对象的可靠性、可用性和高效性,往往将对象存储成多个副本,存储在不同的OSD上,这样访问所需的对象时,只需访问其中一个副本,这种机制称为复制机制。
OSD通常使用廉价的普通磁盘作为存储设备,磁盘故障及OSD本身的故障发生的概率较大。存储系统的日渐大型化,硬件规模的逐渐扩大,错误出现的次数也随之增大。在复制机制中,易造成多个副本间数据的不一致性。因此需要一种保证数据一致性的手段,维护多副本策略的正确性。
发明内容
本发明的目的在于提供一种能够在出现副本故障后,准确的记录与恢复不一致副本的方法。
一种维护分布式系统中副本一致性的方法,
存储系统中的元数据服务器记录索引和副本的状态,客户端仅修改主副本,从副本由主副本进行同步,同步过程中,副本记录内存日志,并依据操作结果将日志写入磁盘或丢弃。
优选的,所述同步过程包括内存操作阶段和磁盘操作阶段。
优选的,所述内存操作阶段过程为:
主副本接收到客户端的数据修改请求后,修改本地缓存,并同步从副本缓存,各副本缓存一致后,主副本应答客户端,表示此请求已被处理完成;各副本节点记录操作日志到内存中,将错误副本上报至元数据服务器。
优选的,所述磁盘操作阶段过程为:
主副本根据前一阶段的日志,将缓存数据写入本地磁盘,并同步副本磁盘,主副本根据操作结果,将错误副本上报至元数据服务器,并通知从副本节点记录日志至磁盘或丢弃日志。
本发明能够在副本最小可用的情况下,保证数据一致,能够处理网络失效、服务器失效、磁盘失效等引发数据不一致的故障,能够以最小的代价,快速恢复副本。
附图说明
图1为本发明的同步过程
图2为本发明的副本同步过程
图3为本发明的内存操作阶段
图4为本发明的磁盘操作阶段
具体实施方式
存储系统中的元数据服务器(MOS)在记录索引之外,也记录副本的状态。客户端仅修改主副本,从副本由主副本进行同步(图2)。同步过程分为两步:内存操作阶段与磁盘操作阶段。同步过程中,副本记录内存日志,并依据操作结果将日志写入磁盘或丢弃。
1.内存操作阶段
主副本接收到客户端的数据修改请求后,修改本地缓存,并同步从副本缓存。各副本缓存一致后,主副本应答客户端,表示此请求已被处理完成。此过程仅操作内存数据,不操作磁盘中的数据,各副本节点记录操作日志到内存中,将错误副本上报至MOS(图3)。
2.磁盘操作阶段
主副本根据前一阶段的日志,将缓存数据写入本地磁盘,并同步副本磁盘。主副本根据操作结果,将错误副本上报至MOS,并通知从副本节点记录日志至磁盘或丢弃日志(图4)。
两个阶段的同步,分别保证了内存与磁盘的一致性。在确定的状态下,各副本的内存与磁盘数据状态也是确定的,且在正确的情况的是一致的。这样就为出错副本错误时的数据修复提供了基础。
数据修复时,查找MOS,可以准确的找到不一致副本。日志功能可以提供在不重建全部数据的情况下恢复副本。每个副本上均有日志,保证了仅需要一个正确副本,就可以进行副本恢复,提高系统的容错度。

Claims (4)

1.一种维护分布式系统中副本一致性的方法,其特征在于:
存储系统中的元数据服务器记录索引和副本的状态,客户端仅修改主副本,从副本由主副本进行同步,同步过程中,副本记录内存日志,并依据操作结果将日志写入磁盘或丢弃。
2.如权利要求1所述的方法,其特征在于:所述同步过程包括内存操作阶段和磁盘操作阶段。
3.如权利要求1所述的方法,其特征在于:所述内存操作阶段过程为:
主副本接收到客户端的数据修改请求后,修改本地缓存,并同步从副本缓存,各副本缓存一致后,主副本应答客户端,表示此请求已被处理完成;各副本节点记录操作日志到内存中,将错误副本上报至元数据服务器。
4.如权利要求1所述的方法,其特征在于:所述磁盘操作阶段过程为:
主副本根据前一阶段的日志,将缓存数据写入本地磁盘,并同步副本磁盘,主副本根据操作结果,将错误副本上报至元数据服务器,并通知从副本节点记录日志至磁盘或丢弃日志。
CN201110326044XA 2011-10-25 2011-10-25 一种维护分布式系统中副本一致性的方法 Pending CN102368267A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110326044XA CN102368267A (zh) 2011-10-25 2011-10-25 一种维护分布式系统中副本一致性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110326044XA CN102368267A (zh) 2011-10-25 2011-10-25 一种维护分布式系统中副本一致性的方法

Publications (1)

Publication Number Publication Date
CN102368267A true CN102368267A (zh) 2012-03-07

Family

ID=45760831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110326044XA Pending CN102368267A (zh) 2011-10-25 2011-10-25 一种维护分布式系统中副本一致性的方法

Country Status (1)

Country Link
CN (1) CN102368267A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102970350A (zh) * 2012-11-05 2013-03-13 曙光信息产业(北京)有限公司 在存储系统中维护副本一致性的方法
CN103049351A (zh) * 2012-12-13 2013-04-17 曙光信息产业(北京)有限公司 多元数据服务器的日志处理方法和装置
CN103077187A (zh) * 2012-12-20 2013-05-01 曙光信息产业(北京)有限公司 日志管理方法和日志管理系统
CN103428288A (zh) * 2013-08-13 2013-12-04 浙江大学 基于分区状态表和协调节点的副本同步方法
CN103580906A (zh) * 2012-08-09 2014-02-12 腾讯科技(深圳)有限公司 一种数据备份的方法、系统及服务器
CN103607448A (zh) * 2013-11-18 2014-02-26 四川川大智胜软件股份有限公司 一种atc系统动态数据存储的方法
CN105589887A (zh) * 2014-10-24 2016-05-18 中兴通讯股份有限公司 分布式文件系统的数据处理方法及分布式文件系统
CN106203167A (zh) * 2016-07-08 2016-12-07 北京小米移动软件有限公司 应用权限管理方法及装置
CN106295550A (zh) * 2016-08-08 2017-01-04 苏州佳世达电通有限公司 电器设备的操作识别方法及应用其的操作识别系统
CN106506704A (zh) * 2016-12-29 2017-03-15 北京奇艺世纪科技有限公司 一种缓存更新方法及装置
CN106951443A (zh) * 2017-02-15 2017-07-14 北京百度网讯科技有限公司 基于分布式系统的副本同步的方法、设备和系统
CN107153671A (zh) * 2016-03-02 2017-09-12 阿里巴巴集团控股有限公司 一种在分布式系统中实现多文件副本读写的方法与设备
CN107239544A (zh) * 2017-06-05 2017-10-10 山东浪潮云服务信息科技有限公司 一种分布式存储的实现方法及装置
CN107579865A (zh) * 2017-10-18 2018-01-12 北京奇虎科技有限公司 分布式代码服务器的权限管理方法、装置及系统
CN108616598A (zh) * 2018-05-10 2018-10-02 新华三技术有限公司成都分公司 数据同步方法、装置和分布式存储系统
CN108664356A (zh) * 2018-05-03 2018-10-16 吉林亿联银行股份有限公司 一种数据库备份方法及装置、数据库系统
CN109117093A (zh) * 2018-08-20 2019-01-01 赛凡信息科技(厦门)有限公司 保证分布式对象存储中的数据、流量、容量一致性的方案
CN110895545A (zh) * 2018-08-22 2020-03-20 阿里巴巴集团控股有限公司 共享数据同步方法及装置
CN112819592A (zh) * 2021-04-16 2021-05-18 深圳华锐金融技术股份有限公司 业务请求处理方法、系统、计算机设备和存储介质
US11620275B2 (en) 2021-08-26 2023-04-04 International Business Machines Corporation Multi-text interconnection

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060129614A1 (en) * 2004-12-14 2006-06-15 Kim Hong Y Crash recovery system and method for distributed file server using object based storage
US7415488B1 (en) * 2004-12-31 2008-08-19 Symantec Operating Corporation System and method for redundant storage consistency recovery
CN101706805A (zh) * 2009-10-30 2010-05-12 中国科学院计算技术研究所 对象存储方法及其系统
CN102023816A (zh) * 2010-11-04 2011-04-20 天津曙光计算机产业有限公司 一种对象存储系统的对象存放策略和访问方法
CN102033786A (zh) * 2010-11-04 2011-04-27 天津曙光计算机产业有限公司 一种对象存储系统中修复副本一致性的方法
CN102129435A (zh) * 2010-01-13 2011-07-20 中国移动通信集团公司 数据存储业务控制方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060129614A1 (en) * 2004-12-14 2006-06-15 Kim Hong Y Crash recovery system and method for distributed file server using object based storage
US7415488B1 (en) * 2004-12-31 2008-08-19 Symantec Operating Corporation System and method for redundant storage consistency recovery
CN101706805A (zh) * 2009-10-30 2010-05-12 中国科学院计算技术研究所 对象存储方法及其系统
CN102129435A (zh) * 2010-01-13 2011-07-20 中国移动通信集团公司 数据存储业务控制方法及系统
CN102023816A (zh) * 2010-11-04 2011-04-20 天津曙光计算机产业有限公司 一种对象存储系统的对象存放策略和访问方法
CN102033786A (zh) * 2010-11-04 2011-04-27 天津曙光计算机产业有限公司 一种对象存储系统中修复副本一致性的方法

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103580906A (zh) * 2012-08-09 2014-02-12 腾讯科技(深圳)有限公司 一种数据备份的方法、系统及服务器
CN103580906B (zh) * 2012-08-09 2018-02-27 腾讯科技(深圳)有限公司 一种数据备份的方法、系统及服务器
CN102970350A (zh) * 2012-11-05 2013-03-13 曙光信息产业(北京)有限公司 在存储系统中维护副本一致性的方法
CN103049351A (zh) * 2012-12-13 2013-04-17 曙光信息产业(北京)有限公司 多元数据服务器的日志处理方法和装置
CN103049351B (zh) * 2012-12-13 2016-06-08 曙光信息产业(北京)有限公司 多元数据服务器的日志处理方法和装置
CN103077187A (zh) * 2012-12-20 2013-05-01 曙光信息产业(北京)有限公司 日志管理方法和日志管理系统
CN103428288A (zh) * 2013-08-13 2013-12-04 浙江大学 基于分区状态表和协调节点的副本同步方法
CN103428288B (zh) * 2013-08-13 2016-03-09 浙江大学 基于分区状态表和协调节点的副本同步方法
CN103607448A (zh) * 2013-11-18 2014-02-26 四川川大智胜软件股份有限公司 一种atc系统动态数据存储的方法
CN103607448B (zh) * 2013-11-18 2016-08-24 四川川大智胜软件股份有限公司 一种atc系统动态数据存储的方法
CN105589887A (zh) * 2014-10-24 2016-05-18 中兴通讯股份有限公司 分布式文件系统的数据处理方法及分布式文件系统
CN107153671A (zh) * 2016-03-02 2017-09-12 阿里巴巴集团控股有限公司 一种在分布式系统中实现多文件副本读写的方法与设备
CN107153671B (zh) * 2016-03-02 2020-11-24 阿里巴巴集团控股有限公司 一种在分布式系统中实现多文件副本读写的方法与设备
CN106203167B (zh) * 2016-07-08 2019-05-07 北京小米移动软件有限公司 应用权限管理方法及装置
CN106203167A (zh) * 2016-07-08 2016-12-07 北京小米移动软件有限公司 应用权限管理方法及装置
CN106295550A (zh) * 2016-08-08 2017-01-04 苏州佳世达电通有限公司 电器设备的操作识别方法及应用其的操作识别系统
CN106295550B (zh) * 2016-08-08 2019-10-22 苏州佳世达电通有限公司 电器设备的操作识别方法及应用其的操作识别系统
CN106506704A (zh) * 2016-12-29 2017-03-15 北京奇艺世纪科技有限公司 一种缓存更新方法及装置
CN106951443A (zh) * 2017-02-15 2017-07-14 北京百度网讯科技有限公司 基于分布式系统的副本同步的方法、设备和系统
CN107239544A (zh) * 2017-06-05 2017-10-10 山东浪潮云服务信息科技有限公司 一种分布式存储的实现方法及装置
CN107579865A (zh) * 2017-10-18 2018-01-12 北京奇虎科技有限公司 分布式代码服务器的权限管理方法、装置及系统
CN108664356A (zh) * 2018-05-03 2018-10-16 吉林亿联银行股份有限公司 一种数据库备份方法及装置、数据库系统
CN108616598A (zh) * 2018-05-10 2018-10-02 新华三技术有限公司成都分公司 数据同步方法、装置和分布式存储系统
CN108616598B (zh) * 2018-05-10 2021-01-01 新华三技术有限公司成都分公司 数据同步方法、装置和分布式存储系统
CN109117093A (zh) * 2018-08-20 2019-01-01 赛凡信息科技(厦门)有限公司 保证分布式对象存储中的数据、流量、容量一致性的方案
CN109117093B (zh) * 2018-08-20 2021-10-01 赛凡信息科技(厦门)有限公司 保证分布式对象存储中的数据、流量、容量一致性的方法
CN110895545A (zh) * 2018-08-22 2020-03-20 阿里巴巴集团控股有限公司 共享数据同步方法及装置
CN110895545B (zh) * 2018-08-22 2023-08-15 阿里云计算有限公司 共享数据同步方法及装置
CN112819592A (zh) * 2021-04-16 2021-05-18 深圳华锐金融技术股份有限公司 业务请求处理方法、系统、计算机设备和存储介质
CN112819592B (zh) * 2021-04-16 2021-08-03 深圳华锐金融技术股份有限公司 业务请求处理方法、系统、计算机设备和存储介质
US11620275B2 (en) 2021-08-26 2023-04-04 International Business Machines Corporation Multi-text interconnection

Similar Documents

Publication Publication Date Title
CN102368267A (zh) 一种维护分布式系统中副本一致性的方法
US10503616B2 (en) Periodic data replication
US10261719B2 (en) Volume and snapshot replication
US9575849B2 (en) Synchronized backup and recovery of database systems
US10452271B2 (en) Reconstructing in-memory indices in a distributed data storage system
US7330859B2 (en) Database backup system using data and user-defined routines replicators for maintaining a copy of database on a secondary server
CN102891849B (zh) 业务数据同步方法、恢复方法及装置和网络设备
US10565071B2 (en) Smart data replication recoverer
US8356017B2 (en) Replication of deduplicated data
US8527459B2 (en) System and method for data replication between heterogeneous databases
CN105302667B (zh) 基于集群架构的高可靠性数据备份与恢复方法
US9772783B2 (en) Constructing an index to facilitate accessing a closed extent in an append-only storage system
CN105574187B (zh) 一种异构数据库复制事务一致性保障方法及系统
TW201020824A (en) Efficient transfer of deduplicated data
US8296536B2 (en) Synchronization of replicated sequential access storage components
TW201209576A (en) Approach for optimizing restores of deduplicated data
US20110035356A1 (en) Transactional archiving of an electronic document
US9720607B2 (en) Append-only storage system supporting open and closed extents
US10484179B1 (en) Data consistency in an encrypted replication environment
CN102708166B (zh) 数据复制方法、数据恢复方法及装置
WO2017122060A1 (en) Parallel recovery for shared-disk databases
CN104991739A (zh) 元数据服务器失效接替中精确一次执行语义的方法及系统
WO2013091183A1 (zh) 一种键值对的操作方法及装置
US8990161B1 (en) System and method for single segment backup
JP2007257416A (ja) レプリケーションシステムにおけるデータ復旧方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120307