CN104778095B - 一种云平台数据管理方法 - Google Patents

一种云平台数据管理方法 Download PDF

Info

Publication number
CN104778095B
CN104778095B CN201510027930.0A CN201510027930A CN104778095B CN 104778095 B CN104778095 B CN 104778095B CN 201510027930 A CN201510027930 A CN 201510027930A CN 104778095 B CN104778095 B CN 104778095B
Authority
CN
China
Prior art keywords
data
seg
section
thread
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510027930.0A
Other languages
English (en)
Other versions
CN104778095A (zh
Inventor
刘洋
敬皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHENGDU SHINE TECHNOLOGY Co Ltd
Original Assignee
CHENGDU SHINE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHENGDU SHINE TECHNOLOGY Co Ltd filed Critical CHENGDU SHINE TECHNOLOGY Co Ltd
Priority to CN201510027930.0A priority Critical patent/CN104778095B/zh
Publication of CN104778095A publication Critical patent/CN104778095A/zh
Application granted granted Critical
Publication of CN104778095B publication Critical patent/CN104778095B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

本发明提供了一种云平台数据管理方法,该方法包括:云平台通过数据去重处理进行备份数据的压缩,记录每个数据段写操作的版本信息,在数据恢复时查询并读取对应的版本信息进行数据恢复。本发明使用各类云存储平台作为后端存储,通过全局数据去重,具有比传统数据备份系统更好的数据压缩效果和更短的数据恢复时间。

Description

一种云平台数据管理方法
技术领域
本发明涉及基于云计算,特别涉及一种云平台数据管理方法。
背景技术
云计算作为一种新型计算模式,其相对无限的计算和存储资源可以灵活配置、动态伸缩,并且以实际资源消耗量为依据进行计费。因此云存储资源比本地资源具有更高的性价比。在数据备份应用场景中,多数的恢复请求都是恢复到离当前时刻较近的某个时间点,很少需要读取较旧版本的数据。对于这类数据,如果采用本地存储资源容纳,将导致严重的资源浪费。云存储资源则非常适用于存储这类海量备份数据,可以达到很低廉的备份成本。然而,云计算的数据备份面临以下几个问题,(1)如何兼容各类云存储平台。对于云存储后端,由于云存储平台接口各不相同,很难实现最大的兼容性,在选择云存储提供商时受限。(2)在云存储模式下备份和恢复成本较高。然而云存储的计费模型比本地存储更加复杂。(3)云存储的低带宽高延迟缺陷将显著影响备份系统的恢复速度。
因此,针对相关技术中所存在的上述问题,目前尚未提出有效的解决方案。
发明内容
为解决上述现有技术所存在的问题,本发明提出了一种云平台数据管理方法,其特征在于,包括:
云平台通过数据去重处理进行备份数据的压缩,记录每个数据段写操作的版本信息,在数据恢复时查询并读取对应的版本信息进行数据恢复。
优选地,所述备份数据的压缩进一步包括:
在数据保护模式下,所述云平台业务接口不断从客户系统接收写操作流数据段,客户将自身驱动层的所有段写入请求发送给业务接口;
把接收到的每一个请求都切分成若干个四元组<Client_ID,LA,Timestamp,Seg_Data>,每个元组表示对某个段的一次写操作;其中Client_ID表示客户的编号;LA表示目标段的逻辑段号;Timestamp表示写请求发生的时间戳;Seg_Data表示新写入的段数据;
将每个段的写操作的Seg_Data传递给云平台的数据去重模块,计算出Seg_Data_ID即Seg_Data的标识符进行去重;
将新段的写操作传递给云平台的版本索引模块,记录相应的版本信息,在索引更新粒度上采用定期更新策略,每次索引更新时,读取当前的一级索引,将内存cache内每个段的新版本记录追加到该段的一级索引记录区末尾,二级索引是一个固定长度的结构,在新的一级索引生成之后进行原地更新,在索引更新开始前,一个新的内存cache会被生成,以容纳新的记录,而已有的cache则在更新操作完成之后被释放;
根据数据去重模块的结果更新元数据信息,对新的Seg_Data建立新的元组并赋初始值,对重复的Seg_Data则更新其引用计数;
将每一个新段的写操作信息传递给云平台的磁盘缓存模块,仅将磁盘缓存内不存在的Seg_Data写入磁盘,同步更新所有Seg_Data在磁盘缓存中的位置和引用计数信息;
利用云平台中的数据归档模块,从去重得到所有的去重结果批量存储到云端,同时更新其云端位置信息。
优选地,所述数据恢复进一步包括:
当业务接口从客户系统接收到一个数据恢复请求时将启动数据恢复进程,首先启动工作线程,包括一个版本查询线程、多个数据读取线程和一个数据合成线程,上述工作线程并发工作,形成一个数据恢复流水线;
对于每个数据段,版本査询线程会从版本索引中査找到时间戳不晚于待恢复时间戳的最新的版本信息,对于第i号段,首先査询内存cache,如存在查询结果则直接返回,否则査询线程从二级索引中读取该段的信息<Ai,Ti,Bi>以及Ai+1,其中Ai表示第i号段的版本信息在一级索引中的起始位置,Ti,Bi则表示该段最新版本的时间戳和Seg_Data_ID,
如果Ti满足条件,则直接返回Bi,否则继续在一级索引中,根据Ai和Ai+1指明的起止位置,采用二分搜索算法査找到满足条件的结果;
将查找到的每个段的待恢复版本的Seg_Data_ID传递给数据读取线程和数据合成线程,数据合成线程在内存中维护一个队列结构作为滑动恢复窗口,每个队列元素依次表示一个连续待恢复区域内的某个段,对于某个需读取的Seg_Data_ID,合成线程首先检查内存缓存,如果缓存命中则直接读取,否则查找其元数据信息,如果其大于0,则根据该Seg_Data的存储位置从磁盘读取,否则根据该Seg_Data的存储位置从云端读取;
读取操作由数据读取线程并发执行,对于每个读取到的Seg_Data,合成线程将其数据复制到当前滑动恢复窗口内所有其出现的位置,随后,滑动恢复窗口前部已读取的段数据被批量传输给客户系统供其写入,恢复窗口则继续向后滑动,直至完成所有段的恢复操作。
优选地,所述云平台的数据去重模块用于对每一个新的Seg_Data使用hash算法计算其Seg_Data_ID,通过比对该标识符,判断此Seg_Data是否与已有的Seg_Data重复,进而进行去重,云平台采用统一的后端存储池,其数据去重是针对所有客户的所有段的版本数据进行的。
优选地,所述云平台保存所有Seg_Data的元数据信息,由五元组<Seg_Data_ID,Cloud_RC,Cloud_Location,Cache_RC,Cache_Location〉组成;其中Cloud_RC和Cache_RC分别表示该在云存储和本地磁盘缓存中的引用计数,即冗余度;Cloud_Location和Cache_Location分别表示该Seg_Data在云存储和本地磁盘缓存中的存储位置。
优选地,所述云平台的磁盘缓存模块用于对每个客户在磁盘存储两类数据以加速恢复过程,第一类数据是所有段的最新版本Seg_Data,其逻辑上等效于被保护系统的实时镜像,第二类数据是客户系统内最近若干次段写入操作的Seg_Data,使用具有较高随机读写性能的固态盘作为磁盘缓存,并且直接使用裸分区存储去重后的Seg_Data;磁盘缓存使用段分配位图来管理存储空间,其段大小被设置成所有客户系统段大小的最小值,每个Seg_Data在磁盘上连续存储,其存储位置用其起始段号来表示。
优选地,所述云平台包括数据归档模块,用于将经过去重的所有Seg_Data存储到云端,并在数据恢复时从云端读取;
所述云平台包括数据恢复模块,用于根据客户传递的数据恢复请求,査询并获取相应的版本数据,进行合成之后批量传输给客户系统供其写入。
本发明相比现有技术,具有以下优点:
本发明的方法支持使用各类云存储平台作为后端存储,通过采用全局数据去重技术,本发明具有比传统数据备份系统更好的数据压缩效果和更短的数据恢复时间;通过采用两级缓存机制,进一步优化了云存储模式下的数据恢复速度。
附图说明
图1是根据本发明实施例的云平台数据管理方法的流程图。
具体实施方式
下文与图示本发明原理的附图一起提供对本发明一个或者多个实施例的详细描述。结合这样的实施例描述本发明,但是本发明不限于任何实施例。本发明的范围仅由权利要求书限定,并且本发明涵盖诸多替代、修改和等同物。在下文描述中阐述诸多具体细节以便提供对本发明的透彻理解。出于示例的目的而提供这些细节,并且无这些具体细节中的一些或者所有细节也可以根据权利要求书实现本发明。
数据备份系统能够备份所有数据段的改变,能够将磁盘恢复到过去任意时间点的状态。然而系统长时间运行将生成大量备份数据,存储成本髙昂,因此需要采用数据压缩技术以减少备份数据量。要在云存储模式下减少备份成本,必须减少备份数据量和数据请求次数。而要优化恢复速度,则必须降低云端数据读取量。
传统方案不能利用不同段间的数据相似性,丧失了一部分压缩机会,而且在恢复过程需要读取基础版本进行解码运算,在云存储模式下将造成较大的恢复延迟。因此本发明采用的云平台使用数据去重技术进行备份数据的压缩,以取得更高的压缩率。恢复过程只需要查询并读取对应的数据版本,不需要额外的数据读取和运算,因此在云存储模式下能够取得更低的备份成本和更快的恢复速度。由于不存在数据版本间的依赖关系,本发明还支持直接删除任意的数据版本而不会影响到其他的数据版本。针对云环境下的数据安全和隐私保护问题,本发明支持对备份数据加密之后再存储到云端。
本发明的一方面提供了一种云平台数据管理方法。图1是根据本发明实施例的云平台数据管理方法流程图。
本发明采用的云平台系统包含几个主要的模块,分别介绍如下:
⑴业务接口模块
若干个被保护系统即客户系统通过统一的业务接口与本发明云平台系统进行业务交互。在进行数据保护时,被保护系统将自身驱动层的所有段写入请求都拷贝一份发送给业务接口。把接收到的每一个请求都切分成若干个四元组<Client_ID,LA,Timestamp,Seg_Data>,每个元组表示对某个段的一次写操作。其中表示Client_ID客户的编号;LA表示目标段的逻辑段号;Timestamp表示写请求发生的时间戳;Seg_Data表示新写入的段数据。在进行数据恢复时,客户将恢复请求三元组〈Timestamp,Start_LA,End_LA>发送给本发明业务接口。其中Timestamp指明需要恢复的时间点;Start_LA和End_LA则表示需要进行恢复的逻辑段地址起止范围。如果客户需要删除部分版本数据,则将一个删除请求二元组<Start_Timestamp,End_Timestamp>发送给本发明业务接口,指明其需要删除的版本时间戳范围。
⑵版本索引模块
本发明为每个客户都维护一套版本索引,保存该客户所有段的所有版本信息,以便在恢复时快速查询。版本索引在逻辑上存储的是从二元组〈LA,Timestamp>到Seg_Data的映射关系。由于段数众多,因此采用专门设计的数据结构来实现版本信息的保存、更新和查询,版本索引由存储在磁盘上的两级索引和在内存cache组成。磁盘索引定期进行更新操作,而内存cache则存储上次磁盘索引更新之后直至当前的新增的段版本信息。磁盘索引分为一级索引和二级索引。一级索引由固定长度的二元组<Ti,j,Bi,j>顺序组成,Ti,j,Bi,j分别表示对第i号段的第j次写入操作的时间戳和Seg_Data_ID)(即Seg_Data的标识符)。二级索引由固定长度的三元组<Ai,Ti,Bi>顺序组成,其中Ai表示第i号段的版本信息在一级索引中的起始位置,Ti,Bi则表示该段最新版本的时间戳和Seg_Data_ID。
内存cache使用一个散列表结构来存储若干对段号和指针,每个指针指向一个队列,指明上次磁盘索引更新后发生的对某个段的新写入信息。为了增强本发明系统鲁棒性,cache内的信息被同步写入到一个磁盘日志中,以便系统异常重启之后可以恢复这些信息。
(3)数据去重模块
负责对每一个新的Seg_Data使用hash算法计算其Seg_Data_ID,通过比对该标识符,判断此Seg_Data是否与已有的Seg_Data重复,进而进行去重。重复的只会被保存一份。本发明云平台采用统一的后端存储池,因此其数据去重是针对所有客户的所有段版本数据进行的。
⑷元数据模块
该模块保存了所有Seg_Data的元数据信息,由五元组<Seg_Data_ID,Cloud_RC,Cloud_Location,Cache_RC,Cache_Location〉组成。其中Cloud_RC和Cache_RC分别表示该在云存储和本地磁盘缓存中的引用计数(即冗余度);Cloud_Location和Cache_Location分别表示该Seg_Data在云存储和本地磁盘缓存中的存储位置。
(5)数据归档模块
该模块负责将经过去重的所有Seg_Data存储到云端,并在数据恢复时从云端读取。为了降低请求数量,该模块将Seg_Data批量存储至云端,同时为了充分利用带宽资源,该模块使用多线程并发地存取云端数据。
(6)数据恢复模块
负责根据客户传递的数据恢复请求,査询并获取相应的版本数据,进行合成之后批量传输给客户系统供其写入。
(7)磁盘缓存模块
本发明对每个客户都在本地磁盘缓存两类数据以加速恢复过程。第一类数据是所有段的最新版本Seg_Data(逻辑上等效于被保护系统的实时镜像),第二类数据是客户系统内最近若干次段写入操作的Seg_Data。为了优化I/O性能,本发明使用具有较高随机读写性能的固态盘作为磁盘缓存,并且直接使用裸分区存储去重后的Seg_Data。磁盘缓存使用段分配位图来管理存储空间,其段大小被设置成所有客户系统段大小的最小值,每个Seg_Data在磁盘上连续存储,这样其存储位置就可用其起始段号来表示。
(8)内存缓存模块
该模块数据恢复过程中,采用LRU算法在内存中缓存一定数量的去重Seg_Data,从而进一步减少从云端或磁盘读取的需要,以加速恢复过程。
根据上述搭建的云平台,以下描述数据保护、数据恢复的业务流程。
1.数据保护
在数据保护模式下,本发明业务接口持续不断地从客户系统接收写操作流数据段,并分割成针对单个段的写操作。每个段的写操作的Seg_Data都被传递给数据去重模块计算出Seg_Data_ID进行去重。
新段的写操作都会被传递给版本索引模块,以记录相应的版本信息。由于版本索引体量巨大,且内部采用有序存储结构,其更新操作具有较大的复杂度,需要耗费较长时间。因此本发明在索引更新粒度上进行了妥协,采用定期更新策略。在每次索引更新时,本发明读取当前的一级索引,将内存cache内每个段的新版本记录追加到该段的一级索引记录区末尾,从而生成一个全新的一级索引。此过程是以旧的索引顺序读取数据,并顺序写出数据到新索引,可以达到很快的更新速度。二级索引是一个固定长度的结构,可以在新的一级索引生成之后进行原地更新,其更新操作也是从头至尾一次性顺序完成,同样具有极高的更新速度。在索引更新开始前,一个新的内存cache会被生成,以容纳新的记录,而已有的cache则在更新操作完成之后被释放。
根据数据去重模块的结果更新元数据信息,对新的Seg_Data建立新的元组并赋初始值,对重复的Seg_Data则更新其引用计数。
每一个新段的写操作信息还会被传递给磁盘缓存模块,只有磁盘缓存内不存在的Seg_Data才会被写入磁盘。根据缓存数据的定义,旧数据将被新数据逐步替换,各Seg_Data在磁盘缓存中的位置和引用计数信息则被同步更新。
数据归档模块则从去重模块得到所有的去重并批量存储到云端,同时更新其云端位置信息。至此完成了一次对新段的写操作的记录和备份过程。
3.2数据恢复
当本发明业务接口从客户系统接收到一个数据恢复请求时将启动数据恢复进程。首先启动一系列工作线程,包括一个版本查询线程、多个数据读取线程和一个数据合成线程。这些线程并发工作,形成一个数据恢复流水线。
对于每个数据段,版本査询线程会从版本索引中査找到时间戳不晚于待恢复时间戳的最新的版本信息。对于第i号段,该线程首先査询内存cache,如能查到结果则直接返回,否则査询线程从二级索引中读取该段的信息<Ai,Ti,Bi>以及Ai+1。如果Ti满足条件,则直接返回Bi,否则继续在一级索引中,根据Ai和Ai+1指明的起止位置,采用二分搜索算法査找到满足条件的结果。两级索引都是由定长元素构成的数组,因此对其元素的定位和查找速度较快。
查找到的每个段的待恢复版本的Seg_Data_ID都会被传递给数据读取线程和数据合成线程。数据合成线程在内存中维护一个队列结构作为滑动恢复窗口,每个队列元素依次表示一个连续待恢复区域内的某个段。对于某个需读取的Seg_Data_ID,合成线程首先检查内存缓存,如果缓存命中则直接读取,否则查找其元数据信息,如果其大于0,则根据Cache_Location从磁盘读取,否则根据Cache_Location从云端读取。读取操作由数据读取线程并发执行。对于每个读取到的Seg_Data,合成线程会将其数据复制到当前滑动恢复窗口内所有其出现的位置。随后,滑动恢复窗口前部已读取的段数据被批量传输给客户系统供其写入,恢复窗口则继续向后滑动,直至完成所有段的恢复操作。
在实际应用场景中,待恢复的时间点往往离当前时刻较近,因此大部分段都没有被改变过,其最新版本就是待恢复版本,只需要查询二级索引即可获得版本信息,其数据也被缓存在本地磁盘中。对于近期发生过改变的段,其待恢复版本也有很大概率存在于内存cache或二级索引中,其数据也很可能被缓存在本地磁盘中。恢复过程所需的较早段数据版本则也有可能与磁盘缓存中的段数据重复(即Seg_Data_ID相同)。因此对于这类恢复请求,大部分段数据都只需从本地磁盘缓存中读取。再加上内存cache进一步减少了本地磁盘和云端的读取量,本发明的本地缓存机制有效地优化了云环境下的数据恢复速度和成本。
综上所述,本发明提出了利用云资源存储备份数据,并且采用全局数据去重技术压缩数据量,从而取得了比传统CDP系统更低的备份成本;通过使用特殊的版本索引结构和本地磁盘/内存两级缓存机制,优化低带宽高延迟云环境下的数据恢复速度。
显然,本领域的技术人员应该理解,上述的本发明的各模块或各步骤可以用通用的计算系统来实现,它们可以集中在单个的计算系统上,或者分布在多个计算系统所组成的网络上,可选地,它们可以用计算系统可执行的程序代码来实现,从而,可以将它们存储在存储系统中由计算系统来执行。这样,本发明不限制于任何特定的硬件和软件结合。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (1)

1.一种云平台数据管理方法,其特征在于,包括:
云平台通过数据去重处理进行备份数据的压缩,记录每个数据段写操作的版本信息,在数据恢复时查询并读取对应的版本信息进行数据恢复;
所述备份数据的压缩进一步包括:
在数据保护模式下,所述云平台业务接口不断从客户系统接收写操作流数据段,客户将自身驱动层的所有段写入请求发送给业务接口;
把接收到的每一个请求都切分成若干个四元组<Client_ID,LA,Timestamp,Seg_Data>,每个元组表示对某个段的一次写操作;其中Client_ID表示客户的编号;LA表示目标段的逻辑段号;Timestamp表示写请求发生的时间戳;Seg_Data表示新写入的段数据;
将每个段的写操作的Seg_Data传递给云平台的数据去重模块,计算出Seg_Data_ID即Seg_Data的标识符进行去重;
将新段的写操作传递给云平台的版本索引模块,记录相应的版本信息,在索引更新粒度上采用定期更新策略,每次索引更新时,读取当前的一级索引,将内存cache内每个段的新版本记录追加到该段的一级索引记录区末尾,二级索引是一个固定长度的结构,在新的一级索引生成之后进行原地更新,在索引更新开始前,一个新的内存cache会被生成,以容纳新的记录,而已有的内存cache则在更新操作完成之后被释放;
根据数据去重模块的结果更新元数据信息,对新的Seg_Data建立新的元组并赋初始值,对重复的Seg_Data则更新其引用计数;
将每一个新段的写操作信息传递给云平台的磁盘缓存模块,仅将磁盘缓存内不存在的Seg_Data写入磁盘,同步更新所有Seg_Data在磁盘缓存中的位置和引用计数信息;
利用云平台中的数据归档模块,从去重得到所有的去重结果批量存储到云端,同时更新其云端位置信息;
所述数据恢复进一步包括:
当业务接口从客户系统接收到一个数据恢复请求时将启动数据恢复进程,首先启动工作线程,包括一个版本查询线程、多个数据读取线程和一个数据合成线程,上述工作线程并发工作,形成一个数据恢复流水线;
对于每个数据段,版本査询线程会从版本索引中査找到时间戳不晚于待恢复时间戳的最新的版本信息,对于第i号段,首先査询内存cache,如存在查询结果则直接返回,否则査询线程从二级索引中读取第i号段段的信息<Ai,Ti,Bi>以及Ai+1,其中Ai表示第i号段的版本信息在一级索引中的起始位置,Ti,Bi则表示该段最新版本的时间戳和Seg_Data_ID,
如果Ti满足条件,则直接返回Bi,否则继续在一级索引中,根据Ai和Ai+1指明的起止位置,采用二分搜索算法査找到满足条件的结果;
将查找到的每个段的待恢复版本的Seg_Data_ID传递给数据读取线程和数据合成线程,数据合成线程在内存中维护一个队列结构作为滑动恢复窗口,每个队列元素依次表示一个连续待恢复区域内的某个段,对于某个需读取的Seg_Data_ID,数据合成线程首先检查内存缓存,如果缓存命中则直接读取,否则查找其元数据信息,如果其大于0,则根据该Seg_Data的存储位置从磁盘读取,否则根据该Seg_Data的存储位置从云端读取;
读取操作由数据读取线程并发执行,对于每个读取到的Seg_Data,合成线程将其数据复制到当前滑动恢复窗口内所有其出现的位置,随后,滑动恢复窗口前部已读取的段数据被批量传输给客户系统供其写入,恢复窗口则继续向后滑动,直至完成所有段的恢复操作;
所述云平台保存所有Seg_Data的元数据信息,由五元组<Seg_Data_ID,Cloud_RC,Cloud_Location,Cache_RC,Cache_Location〉组成;其中Cloud_RC和Cache_RC分别表示在云存储和本地磁盘缓存中的引用计数,即冗余度;Cloud_Location和Cache_Location分别表示该Seg_Data在云存储和本地磁盘缓存中的存储位置;
所述云平台的磁盘缓存模块用于对每个客户在磁盘存储两类数据以加速恢复过程,第一类数据是所有段的最新版本Seg_Data,其逻辑上等效于被保护系统的实时镜像,第二类数据是客户系统内最近若干次段写入操作的Seg_Data,使用具有较高随机读写性能的固态盘作为磁盘缓存,并且直接使用裸分区存储去重后的Seg_Data;磁盘缓存使用段分配位图来管理存储空间,其段大小被设置成所有客户系统段大小的最小值,每个Seg_Data在磁盘上连续存储,其存储位置用其起始段号来表示。
CN201510027930.0A 2015-01-20 2015-01-20 一种云平台数据管理方法 Active CN104778095B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510027930.0A CN104778095B (zh) 2015-01-20 2015-01-20 一种云平台数据管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510027930.0A CN104778095B (zh) 2015-01-20 2015-01-20 一种云平台数据管理方法

Publications (2)

Publication Number Publication Date
CN104778095A CN104778095A (zh) 2015-07-15
CN104778095B true CN104778095B (zh) 2017-11-17

Family

ID=53619576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510027930.0A Active CN104778095B (zh) 2015-01-20 2015-01-20 一种云平台数据管理方法

Country Status (1)

Country Link
CN (1) CN104778095B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105242881B (zh) * 2015-10-12 2018-02-16 创新科软件技术(深圳)有限公司 分布式存储系统及其数据读写方法
CN106843760A (zh) * 2017-01-17 2017-06-13 郑州云海信息技术有限公司 一种基于重删的异步远程复制系统及方法
CN106713489A (zh) * 2017-01-17 2017-05-24 郑州云海信息技术有限公司 一种基于重删的同步远程复制系统及方法
CN109660611B (zh) * 2018-12-10 2021-08-31 浪潮(北京)电子信息产业有限公司 一种云备份的数据存储方法及存储系统的数据云备份方法
CN112882992A (zh) * 2019-11-29 2021-06-01 北京百度网讯科技有限公司 用于显示信息的方法和装置
CN112269905B (zh) * 2020-11-06 2023-07-21 湖南快乐阳光互动娱乐传媒有限公司 一种提高系统数据查询能力的方法及系统
CN112506713B (zh) * 2020-12-25 2023-11-24 北京字跳网络技术有限公司 多级容灾系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814045A (zh) * 2010-04-22 2010-08-25 华中科技大学 一种用于备份服务的数据组织方法
CN101908077A (zh) * 2010-08-27 2010-12-08 华中科技大学 一种适用于云备份的重复数据删除方法
CN103152430A (zh) * 2013-03-21 2013-06-12 河海大学 一种缩减数据占用空间的云存储方法
CN103944988A (zh) * 2014-04-22 2014-07-23 南京邮电大学 一种适用于云存储的重复数据删除系统和方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8694469B2 (en) * 2009-12-28 2014-04-08 Riverbed Technology, Inc. Cloud synthetic backups

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814045A (zh) * 2010-04-22 2010-08-25 华中科技大学 一种用于备份服务的数据组织方法
CN101908077A (zh) * 2010-08-27 2010-12-08 华中科技大学 一种适用于云备份的重复数据删除方法
CN103152430A (zh) * 2013-03-21 2013-06-12 河海大学 一种缩减数据占用空间的云存储方法
CN103944988A (zh) * 2014-04-22 2014-07-23 南京邮电大学 一种适用于云存储的重复数据删除系统和方法

Also Published As

Publication number Publication date
CN104778095A (zh) 2015-07-15

Similar Documents

Publication Publication Date Title
CN104778095B (zh) 一种云平台数据管理方法
CN104536849B (zh) 一种基于云计算的数据备份方法
US11921684B2 (en) Systems and methods for database management using append-only storage devices
CN104537112B (zh) 一种安全云计算的方法
US11269885B2 (en) Cache for efficient record lookups in an LSM data structure
US10776315B2 (en) Efficient and flexible organization and management of file metadata
US10564850B1 (en) Managing known data patterns for deduplication
US11307765B2 (en) System and methods for storage data deduplication
US8799601B1 (en) Techniques for managing deduplication based on recently written extents
US8930648B1 (en) Distributed deduplication using global chunk data structure and epochs
US8280858B2 (en) Storage pool scrubbing with concurrent snapshots
US9436559B2 (en) Storage apparatus and method for controlling cache of storage apparatus
JP2011513853A (ja) 連想ストレージのシステムと方法
CN107003814A (zh) 存储系统中的有效元数据
US10649682B1 (en) Focused sanitization process for deduplicated storage systems
US11436102B2 (en) Log-structured formats for managing archived storage of objects
US10360195B1 (en) Absolute and relative log-structured storage
US10372688B2 (en) Moving data within a distributed data storage system using virtual file links
US11397706B2 (en) System and method for reducing read amplification of archival storage using proactive consolidation
US9575990B2 (en) Partitioning data within a distributed data storage system using virtual file links
US11860840B2 (en) Update of deduplication fingerprint index in a cache memory
US9063656B2 (en) System and methods for digest-based storage
CN105162891A (zh) 一种基于ip网络的数据存储方法
CN104821907B (zh) 一种电子邮件处理方法
KR101404129B1 (ko) 데이터 저장 시스템 및 데이터 관리 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A cloud platform data management method

Effective date of registration: 20210412

Granted publication date: 20171117

Pledgee: The Agricultural Bank of Chengdu branch of Limited by Share Ltd. Chinese Sichuan

Pledgor: SHINE TECHNOLOGY Co.,Ltd.

Registration number: Y2021980002529

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20220424

Granted publication date: 20171117

Pledgee: The Agricultural Bank of Chengdu branch of Limited by Share Ltd. Chinese Sichuan

Pledgor: SHINE TECHNOLOGY Co.,Ltd.

Registration number: Y2021980002529

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A cloud platform data management method

Effective date of registration: 20220505

Granted publication date: 20171117

Pledgee: CHENGDU RURAL COMMERCIAL BANK CO.,LTD.

Pledgor: SHINE TECHNOLOGY Co.,Ltd.

Registration number: Y2022510000118