CN107220002B - 一种支持内存快照重复数据删除的存储方法和装置 - Google Patents
一种支持内存快照重复数据删除的存储方法和装置 Download PDFInfo
- Publication number
- CN107220002B CN107220002B CN201710384830.2A CN201710384830A CN107220002B CN 107220002 B CN107220002 B CN 107220002B CN 201710384830 A CN201710384830 A CN 201710384830A CN 107220002 B CN107220002 B CN 107220002B
- Authority
- CN
- China
- Prior art keywords
- memory
- memory snapshot
- snapshot
- fingerprint value
- storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 101100217298 Mus musculus Aspm gene Proteins 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 abstract description 8
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 238000010367 cloning Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0608—Saving storage space on storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
- G06F3/0641—De-duplication techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0662—Virtualisation aspects
- G06F3/0664—Virtualisation aspects at device level, e.g. emulation of a storage device or system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45583—Memory management, e.g. access or allocation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种支持内存快照重复数据删除的存储方法和装置,其中,该方法包括识别虚拟机操作系统的类型,构造内存布局模板;根据所述内存布局模板,对虚拟机的内存分段进行快照,得到内存快照;计算每个所述内存快照的指纹值;查询所述内存快照的指纹值是否在过滤器中,如果在,则不上传该内存快照,如果不在,则上传该内存快照。上述支持内存快照重复数据删除的存储方法和装置,能够只保存一份相同内容的内存快照区域,达到优化内存快照的存储和传输带宽的目的。
Description
技术领域
本发明属于云计算技术领域,特别是涉及一种支持内存快照重复数据删除的存储方法和装置。
背景技术
目前的技术方案中,从数据去重的位置上来说,分为源端去重和目的端去重,服务端与客户端进行交互,由客户端确认数据的重复,相同的数据不再上传,以节约网络带宽;从数据去重的范围上来说,数据去重可以在客户端进行,可采取在云服务端进行统一全局处理;从数据划分的方法上讲,分为全文件划分、静态划分和基于数据内容的划分,重复内容只保留一份,副本内容使用链接的形式取代。在虚拟化环境中,数据去重也得到一定支持,一方面借助存储设备原生的去重机制,一方面在上层对于磁盘内容的存储和链接克隆已经支持较完善,其中的冗余数据得到一定的优化。
目前云环境下关注的焦点往往在于虚拟机的镜像文件存储的优化,但在大规模的场景下,尤其是在线快照较频繁的场景,对内存的快照并未做特别的优化。而目前云环境中,虚拟机操作系统往往被限定在有限的范围内,其内存结构布局相似,内存快照相似性较高,内存快照过多,会导致存储中有大量重复的内存快照数据存在。
发明内容
为解决上述问题,本发明提供了一种支持内存快照重复数据删除的存储方法和装置,能够只保存一份相同内容的内存快照区域,达到优化内存快照的存储和传输带宽的目的。
本发明提供的一种支持内存快照重复数据删除的存储方法,包括:
识别虚拟机操作系统的类型,构造内存布局模板;
根据所述内存布局模板,对虚拟机的内存分段进行快照,得到内存快照;
计算每个所述内存快照的指纹值;
查询所述内存快照的指纹值是否在过滤器中,如果在,则不上传该内存快照,如果不在,则上传该内存快照。
优选的,在上述支持内存快照重复数据删除的存储方法中,所述查询内存快照的指纹值是否在过滤器中之后还包括:
对于所述过滤器无法正确过滤的内存快照,在存储端进行所述内存快照的指纹值的二次校验,如果所述存储端存在所述内存快照,则不保存所述内存快照。
优选的,在上述支持内存快照重复数据删除的存储方法中,在所述查询所述内存快照的指纹值是否在过滤器中之前,还包括:
将所述过滤器保存在运行所述虚拟机的宿主机上。
优选的,在上述支持内存快照重复数据删除的存储方法中,所述计算每个所述内存快照的指纹值为:
利用SHA1算法计算每个所述内存快照的指纹值。
优选的,在上述支持内存快照重复数据删除的存储方法中,所述过滤器为bloomfilter。
本发明提供的一种支持内存快照重复数据删除的存储装置,包括:
构造单元,用于识别虚拟机操作系统的类型,构造内存布局模板;
快照单元,用于根据所述内存布局模板,对虚拟机的内存分段进行快照,得到内存快照;
计算单元,用于计算每个所述内存快照的指纹值;
查询单元,用于查询所述内存快照的指纹值是否在过滤器中,如果在,则不上传该内存快照,如果不在,则上传该内存快照。
优选的,在上述支持内存快照重复数据删除的存储装置中,还包括:
校验单元,用于对于所述过滤器无法正确过滤的内存快照,在存储端进行所述内存快照的指纹值的二次校验,如果所述存储端存在所述内存快照,则不保存所述内存快照。
优选的,在上述支持内存快照重复数据删除的存储装置中,还包括:
保存单元,用于将所述过滤器保存在运行所述虚拟机的宿主机上。
优选的,在上述支持内存快照重复数据删除的存储装置中,所述计算单元具体用于利用SHA1算法计算每个所述内存快照的指纹值。
优选的,在上述支持内存快照重复数据删除的存储装置中,所述查询单元具体用于查询所述内存快照的指纹值是否在bloom filter中,如果在,则不上传该内存快照,如果不在,则上传该内存快照。
通过上述描述可知,本发明提供的上述支持内存快照重复数据删除的存储方法和装置,由于该方法包括识别虚拟机操作系统的类型,构造内存布局模板;根据所述内存布局模板,对虚拟机的内存分段进行快照,得到内存快照;计算每个所述内存快照的指纹值;查询所述内存快照的指纹值是否在过滤器中,如果在,则不上传该内存快照,如果不在,则上传该内存快照,因此能够只保存一份相同内容的内存快照区域,达到优化内存快照的存储和传输带宽的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的第一种支持内存快照重复数据删除的存储方法的示意图;
图2为本申请实施例提供的第一种支持内存快照重复数据删除的存储装置的示意图。
具体实施方式
本发明的核心思想在于提供一种支持内存快照重复数据删除的存储方法和装置,能够只保存一份相同内容的内存快照区域,达到优化内存快照的存储和传输带宽的目的。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例提供的第一种支持内存快照重复数据删除的存储方法如图1所示,图1为本申请实施例提供的第一种支持内存快照重复数据删除的存储方法的示意图,该方法包括如下步骤:
S1:识别虚拟机操作系统的类型,构造内存布局模板;
以Linux系统为例,其虚拟机内存空间布局类似,对于相同的Linux内核,其内核地址空间内核代码段完全相同,其共享库映射空间也有一定重复率,部分进程的代码段页面,也有一定重复率。
S2:根据所述内存布局模板,对虚拟机的内存分段进行快照,得到内存快照;
S3:计算每个所述内存快照的指纹值;
需要说明的是,使用指纹值索引是数据删重技术中的最常用方法,易于实现,且效率高。
S4:查询所述内存快照的指纹值是否在过滤器中,如果在,则不上传该内存快照,如果不在,则上传该内存快照。
需要说明的是,可以但不限于利用bloom filter协同源端和目的端去重的方式,以对相同内容的内存快照区域只保存一份,最终优化内存快照的存储和传输带宽。
通过上述描述可知,本申请实施例提供的第一种支持内存快照重复数据删除的存储方法,由于包括识别虚拟机操作系统的类型,构造内存布局模板;根据所述内存布局模板,对虚拟机的内存分段进行快照,得到内存快照;计算每个所述内存快照的指纹值;查询所述内存快照的指纹值是否在过滤器中,如果在,则不上传该内存快照,如果不在,则上传该内存快照,因此能够只保存一份相同内容的内存快照区域,达到优化内存快照的存储和传输带宽的目的。
本申请实施例提供的第二种支持内存快照重复数据删除的存储方法,是在上述第一种支持内存快照重复数据删除的存储方法的基础上,还包括如下技术特征:
所述查询内存快照的指纹值是否在过滤器中之后还包括:
对于所述过滤器无法正确过滤的内存快照,在存储端进行所述内存快照的指纹值的二次校验,如果所述存储端存在所述内存快照,则不保存所述内存快照。
需要说明的是,该步骤是为了消除过滤器必然存在的误差,从而更好的保证过滤的准确性。
本申请实施例提供的第三种支持内存快照重复数据删除的存储方法,是在上述第一种支持内存快照重复数据删除的存储方法的基础上,还包括如下技术特征:
在所述查询所述内存快照的指纹值是否在过滤器中之前,还包括:
将所述过滤器保存在运行所述虚拟机的宿主机上。
需要说明的是,虚拟机运行在宿主机上,因此这里讲过滤器保存在该宿主机上。
本申请实施例提供的第四种支持内存快照重复数据删除的存储方法,是在上述第一种支持内存快照重复数据删除的存储方法的基础上,还包括如下技术特征:所述计算每个所述内存快照的指纹值为:
利用SHA1算法计算每个所述内存快照的指纹值。
需要说明的是,该SHA1算法(安全哈希算法,Secure Hash Algorithm)主要适用于数字签名标准(Digital Signature Standard DSS)里面定义的数字签名算法(DigitalSignature Algorithm DSA)。对于长度小于2^64位的消息,SHA1会产生一个160位的消息摘要。当接收到消息的时候,这个消息摘要可以用来验证数据的完整性。
本申请实施例提供的第五种支持内存快照重复数据删除的存储方法,是在上述第一种至第四种支持内存快照重复数据删除的存储方法中任一种的基础上,还包括如下技术特征:
所述过滤器为bloom filter。
这种过滤器具有很好的空间和时间效率,被用来检测一个元素是不是集合中的一个成员。如果检测结果为是,该元素不一定在集合中;但如果检测结果为否,该元素一定不在集合中。因此Bloom filter具有100%的召回率。这样每个检测请求返回有“在集合内(可能错误)”和“不在集合内(绝对不在集合内)”两种情况,可见Bloom filter是牺牲了正确率和时间以节省空间。
本申请实施例提供的第一种支持内存快照重复数据删除的存储装置如图2所示,图2为本申请实施例提供的第一种支持内存快照重复数据删除的存储装置的示意图,该装置包括:
构造单元201,用于识别虚拟机操作系统的类型,构造内存布局模板,以Linux系统为例,其虚拟机内存空间布局类似,对于相同的Linux内核,其内核地址空间内核代码段完全相同,其共享库映射空间也有一定重复率,部分进程的代码段页面,也有一定重复率;
快照单元202,用于根据所述内存布局模板,对虚拟机的内存分段进行快照,得到内存快照;
计算单元203,用于计算每个所述内存快照的指纹值;
查询单元204,用于查询所述内存快照的指纹值是否在过滤器中,如果在,则不上传该内存快照,如果不在,则上传该内存快照,可以但不限于利用bloom filter协同源端和目的端去重的方式,以对相同内容的内存快照区域只保存一份,最终优化内存快照的存储和传输带宽。
本申请实施例提供的第二种支持内存快照重复数据删除的存储装置,是在上述第一种支持内存快照重复数据删除的存储装置的基础上,还包括如下技术特征:
校验单元,用于对于所述过滤器无法正确过滤的内存快照,在存储端进行所述内存快照的指纹值的二次校验,如果所述存储端存在所述内存快照,则不保存所述内存快照,这是为了消除过滤器必然存在的误差,从而更好的保证过滤的准确性。
本申请实施例提供的第三种支持内存快照重复数据删除的存储装置,是在上述第一种支持内存快照重复数据删除的存储装置的基础上,还包括如下技术特征:
保存单元,用于将所述过滤器保存在运行所述虚拟机的宿主机上。
本申请实施例提供的第四种支持内存快照重复数据删除的存储装置,是在上述第一种支持内存快照重复数据删除的存储装置的基础上,还包括如下技术特征:
所述计算单元具体用于利用SHA1算法计算每个所述内存快照的指纹值。
需要说明的是,该SHA1算法(安全哈希算法,Secure Hash Algorithm)主要适用于数字签名标准(Digital Signature Standard DSS)里面定义的数字签名算法(DigitalSignature Algorithm DSA)。对于长度小于2^64位的消息,SHA1会产生一个160位的消息摘要。当接收到消息的时候,这个消息摘要可以用来验证数据的完整性。
本申请实施例提供的第五种支持内存快照重复数据删除的存储装置,是在上述第一种至第四种支持内存快照重复数据删除的存储装置中任一种的基础上,还包括如下技术特征:
所述查询单元具体用于查询所述内存快照的指纹值是否在bloom filter中,如果在,则不上传该内存快照,如果不在,则上传该内存快照。
这种过滤器具有很好的空间和时间效率,被用来检测一个元素是不是集合中的一个成员。如果检测结果为是,该元素不一定在集合中;但如果检测结果为否,该元素一定不在集合中。因此Bloom filter具有100%的召回率。这样每个检测请求返回有“在集合内(可能错误)”和“不在集合内(绝对不在集合内)”两种情况,可见Bloom filter是牺牲了正确率和时间以节省空间。
综上所述,上述方案对每个虚拟机的内存进行分段指纹计算,利用源端去重优化了内存快照时宿主机与存储间的传输带宽,利用目的端去重,降低了后端数据存储的空间占用,最终以达到对相同内容的内存快照区域只保存一份,优化内存快照的存储和传输带宽的目的,适用于大规模的云环境场景。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (6)
1.一种支持内存快照重复数据删除的存储方法,其特征在于,包括:
识别虚拟机操作系统的类型,构造内存布局模板;
根据所述内存布局模板,对虚拟机的内存分段进行快照,得到内存快照;
计算每个所述内存快照的指纹值;
查询所述内存快照的指纹值是否在过滤器中,如果在,则不上传该内存快照,如果不在,则上传该内存快照;
所述过滤器为bloom filter;
所述查询内存快照的指纹值是否在过滤器中之后还包括:
对于所述过滤器无法正确过滤的内存快照,在存储端进行所述内存快照的指纹值的二次校验,如果所述存储端存在所述内存快照,则不保存所述内存快照。
2.根据权利要求1所述的支持内存快照重复数据删除的存储方法,其特征在于,
在所述查询所述内存快照的指纹值是否在过滤器中之前,还包括:
将所述过滤器保存在运行所述虚拟机的宿主机上。
3.根据权利要求1所述的支持内存快照重复数据删除的存储方法,其特征在于,
所述计算每个所述内存快照的指纹值为:
利用SHA1算法计算每个所述内存快照的指纹值。
4.一种支持内存快照重复数据删除的存储装置,其特征在于,包括:
构造单元,用于识别虚拟机操作系统的类型,构造内存布局模板;
快照单元,用于根据所述内存布局模板,对虚拟机的内存分段进行快照,得到内存快照;
计算单元,用于计算每个所述内存快照的指纹值;
查询单元,用于查询所述内存快照的指纹值是否在bloom filter过滤器中,如果在,则不上传该内存快照,如果不在,则上传该内存快照;
还包括:
校验单元,用于对于所述过滤器无法正确过滤的内存快照,在存储端进行所述内存快照的指纹值的二次校验,如果所述存储端存在所述内存快照,则不保存所述内存快照。
5.根据权利要求4所述的支持内存快照重复数据删除的存储装置,其特征在于,
还包括:
保存单元,用于将所述过滤器保存在运行所述虚拟机的宿主机上。
6.根据权利要求4所述的支持内存快照重复数据删除的存储装置,其特征在于,
所述计算单元具体用于利用SHA1算法计算每个所述内存快照的指纹值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710384830.2A CN107220002B (zh) | 2017-05-26 | 2017-05-26 | 一种支持内存快照重复数据删除的存储方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710384830.2A CN107220002B (zh) | 2017-05-26 | 2017-05-26 | 一种支持内存快照重复数据删除的存储方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107220002A CN107220002A (zh) | 2017-09-29 |
CN107220002B true CN107220002B (zh) | 2020-08-21 |
Family
ID=59946811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710384830.2A Active CN107220002B (zh) | 2017-05-26 | 2017-05-26 | 一种支持内存快照重复数据删除的存储方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107220002B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109753228B (zh) * | 2017-11-08 | 2022-08-02 | 阿里巴巴集团控股有限公司 | 快照删除方法、装置及系统 |
CN113886027B (zh) * | 2021-12-07 | 2022-03-08 | 广州锦和科技有限公司 | 虚拟机模板创建及虚拟机的进入方法、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915278A (zh) * | 2012-09-19 | 2013-02-06 | 浪潮(北京)电子信息产业有限公司 | 重复数据删除方法 |
CN103970875A (zh) * | 2014-05-15 | 2014-08-06 | 华中科技大学 | 一种并行重复数据删除方法 |
CN105677238A (zh) * | 2015-12-28 | 2016-06-15 | 国云科技股份有限公司 | 一种基于分布式存储重复数据删除的虚拟机系统盘的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7100008B2 (en) * | 2004-03-15 | 2006-08-29 | Hitachi, Ltd. | Long term data protection system and method |
-
2017
- 2017-05-26 CN CN201710384830.2A patent/CN107220002B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915278A (zh) * | 2012-09-19 | 2013-02-06 | 浪潮(北京)电子信息产业有限公司 | 重复数据删除方法 |
CN103970875A (zh) * | 2014-05-15 | 2014-08-06 | 华中科技大学 | 一种并行重复数据删除方法 |
CN105677238A (zh) * | 2015-12-28 | 2016-06-15 | 国云科技股份有限公司 | 一种基于分布式存储重复数据删除的虚拟机系统盘的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107220002A (zh) | 2017-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10545833B1 (en) | Block-level deduplication | |
US9792306B1 (en) | Data transfer between dissimilar deduplication systems | |
US8402250B1 (en) | Distributed file system with client-side deduplication capacity | |
US10545987B2 (en) | Replication to the cloud | |
US8356017B2 (en) | Replication of deduplicated data | |
EP3519965B1 (en) | Systems and methods for healing images in deduplication storage | |
US9928248B2 (en) | Self-healing by hash-based deduplication | |
US8683156B2 (en) | Format-preserving deduplication of data | |
US9569357B1 (en) | Managing compressed data in a storage system | |
US10339112B1 (en) | Restoring data in deduplicated storage | |
US8620886B1 (en) | Host side deduplication | |
US8453031B2 (en) | Data deduplication using CRC-seed differentiation between data and stubs | |
US20150293817A1 (en) | Secure Relational File System With Version Control, Deduplication, And Error Correction | |
US9684569B2 (en) | Data deduplication using chunk files | |
CN107135662B (zh) | 一种差异数据备份方法、存储系统和差异数据备份装置 | |
US10409497B2 (en) | Systems and methods for increasing restore speeds of backups stored in deduplicated storage systems | |
CN108027713A (zh) | 用于固态驱动器控制器的重复数据删除 | |
CN107220002B (zh) | 一种支持内存快照重复数据删除的存储方法和装置 | |
EP3522040B1 (en) | Method and device for file storage | |
US20140156607A1 (en) | Index for deduplication | |
US20220398220A1 (en) | Systems and methods for physical capacity estimation of logical space units | |
CN111857603B (zh) | 数据处理方法及相关装置 | |
US20220083513A1 (en) | Post-processing global deduplication algorithm for scaled-out deduplication file system | |
TWI420333B (zh) | 分散式的重複數據刪除系統及其處理方法 | |
CN109542860B (zh) | 基于hdfs的业务数据管理方法、终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200723 Address after: 215100 No. 1 Guanpu Road, Guoxiang Street, Wuzhong Economic Development Zone, Suzhou City, Jiangsu Province Applicant after: SUZHOU LANGCHAO INTELLIGENT TECHNOLOGY Co.,Ltd. Address before: 450018 Henan province Zheng Dong New District of Zhengzhou City Xinyi Road No. 278 16 floor room 1601 Applicant before: ZHENGZHOU YUNHAI INFORMATION TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |