CN113535670A - 一种虚拟化资源镜像存储系统及其实现方法 - Google Patents

一种虚拟化资源镜像存储系统及其实现方法 Download PDF

Info

Publication number
CN113535670A
CN113535670A CN202110787216.7A CN202110787216A CN113535670A CN 113535670 A CN113535670 A CN 113535670A CN 202110787216 A CN202110787216 A CN 202110787216A CN 113535670 A CN113535670 A CN 113535670A
Authority
CN
China
Prior art keywords
data block
index
data
mirror image
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110787216.7A
Other languages
English (en)
Other versions
CN113535670B (zh
Inventor
杨美红
王天伟
郭莹
王继彬
袁梦
孙明辉
曹文泰
陈泳杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Computer Science Center National Super Computing Center in Jinan
Original Assignee
Shandong Computer Science Center National Super Computing Center in Jinan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Computer Science Center National Super Computing Center in Jinan filed Critical Shandong Computer Science Center National Super Computing Center in Jinan
Priority to CN202110787216.7A priority Critical patent/CN113535670B/zh
Publication of CN113535670A publication Critical patent/CN113535670A/zh
Application granted granted Critical
Publication of CN113535670B publication Critical patent/CN113535670B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/188Virtual file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/134Distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1748De-duplication implemented within the file system, e.g. based on file segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种虚拟化资源镜像存储系统及其实现方法,包括FUSE文件系统、镜像重复数据删除系统;FUSE文件系统接收来自若干镜像服务的R/W请求,将读写信息发送给镜像重复数据删除系统处理,处理完成后,所述FUSE文件系统将数据存储到磁盘或从磁盘中读取数据。本发明实现了虚拟化资源镜像的高效存储,解决了虚拟机镜像与容器镜像统一存储的管理问题,并在一定程度上减轻了镜像数据日益增多导致的存储压力大等问题。

Description

一种虚拟化资源镜像存储系统及其实现方法
技术领域
本发明涉及云计算技术领域,特别是涉及一种虚拟化资源镜像存储系统及其实现方法。
背景技术
云计算技术与虚拟化技术的不断发展,使得越来越多的企业开始部署公有云与私有云,云计算的IaaS(基础设施即服务)与PaaS(平台即服务)模式以虚拟化资源镜像为服务形式向租户提供计算服务,用户可以根据自身需要在云端创建虚拟机或者容器资源,并以此获取操作系统以及平台服务。
为了对平台提供良好的运行支撑,虚拟机镜像被广泛应用于云计算的各个领域。某些企业中的虚拟机镜像数量会高达5000~20000个。而容器化技术依靠存储占用小,启动速度快,系统开销小,简化的应用程序开发、部署和管理等特点迅速发展,很大程度上增大了容器镜像存储市场规模。
虚拟机镜像的构成方式会导致大量添零数据块的产生,这些数据块对于镜像存储系统来说是重复的、无效的。此外,容器镜像是按层存储的,在容器镜像叠加层(Layer)的过程中,每新增加一层,镜像的大小就会有大幅度增长。不同镜像中包含相同的公共依赖项(例如,库文件),这也导致不同的容器镜像往往包含大量重复数据。
为了减少数据冗余,重复数据删除是一种常见的减少冗余数据的方法。在虚拟机镜像存储中,分块去重技术日渐成熟,通过分块去重算法去掉重复数据;而在容器镜像存储中,通常只对容器镜像的层进行去重处理,但是容器镜像的层很少完全相同,在容器镜像中使用的层共享技术不能有效降低存储空间损耗,直接像虚拟机镜像使用分块去重方案会提高性能开销。
现有的镜像重复数据删除系统为了提高检索性能通常使用Hash索引,使用Hash索引很大程度上提高了查询的速度,但是现有的Hash索引不支持使用索引进行排序,无法得到有序的索引表,同时在大规模的数据存储中的效率损失较为严重。而在磁盘存储上,直接使用HDD(Hard Disk Drive,硬盘驱动器)机械硬盘存储数据块降低了成本,但是读写速度达不到快速读取的要求。
此外,容器技术短期内无法完全替代虚拟机技术,所以较长一段时间内企业将处于虚拟机镜像和容器镜像共存的时期。基于上述内容,研究并实现一套虚拟化资源镜像存储系统是有必要的。
发明内容
为了克服上述技术问题的缺点,本发明提供了一种虚拟化资源镜像存储系统及其实现方法。
术语解释:
1、Docker Registry,是Docker官方提供的私有镜像仓库,用于存储Docker镜像。
2、OpenStack Glance,是OpenStack镜像服务组件,提供虚拟机镜像的发现、注册和获取服务。
3、R/W请求,读/写请求。
4、B树,是为磁盘存储而专门设计的一类平衡搜索树,B树的高度仅随着它所包含的节点数按对数增长。
5、Hash算法,又称摘要算法,对任意一组输入数据进行计算,得到一个固定长度的输出摘要。
本发明的技术方案为:
一种虚拟化资源镜像存储系统,包括FUSE文件系统、镜像重复数据删除系统;
所述FUSE文件系统接收来自若干镜像服务例如包括Docker Registry和OpenStack Glance镜像服务的R/W请求,并将R/W请求发送给镜像重复数据删除系统,镜像重复数据删除系统分析R/W请求中R请求的内容,调用FUSE文件系统从磁盘中取出所需的数据返回给镜像服务;根据R/W请求中W请求对镜像去重并通过FUSE文件系统将去重产生的镜像元数据、索引数据和数据块存储到磁盘。
根据本发明优选的,所述镜像重复数据删除系统包括分块去重模块以及与其连接的元数据管理模块、索引单元、多级缓存管理模块;
所述分块去重模块用于:对虚拟机镜像和容器镜像进行分块并删除重复数据;所述元数据管理模块用于:对元数据表进行读/写操作,元数据表中存储虚拟机镜像(容器镜像层)指纹值、名称、作者、版本号、数据块指纹值及其数据块排列顺序;所述索引单元用于:对索引表进行读/写操作,索引表中存储键值对索引数据;所述多级缓存管理模块用于:处理磁盘间的数据提取、数据写入操作。
根据本发明优选的,所述分块去重模块包括虚拟机镜像分块去重单元和容器镜像分块去重单元;
根据虚拟机镜像中零块多的特点,所述虚拟机镜像分块去重单元用于:采用固定块长分块算法对虚拟机镜像按照8KB大小的固定长度分割,得到若干数据块,使用Hash算法(SHA-1算法)计算出数据块的指纹值,通过查询索引表中的节点key值,查看该指纹值是否存在于索引表中,如果存在,则证明该数据块及其指纹值已经存储在系统中;如果不存在,将该指纹值和数据块地址按照<key:value>的方式存储到索引表中;所述容器镜像分块去重单元用于:使用CDC(Content-Defined Chunking)可变长分块算法对容器镜像分块,数据块的长度定义在最小值r和最大值D之间,可变长度的数据块用一个大小为w滑动窗口来划分,当滑动窗口在位置k的Hash值f满足f mod D=r时,该位置k为数据块的一个边界,重复这个过程,直到整个容器镜像都被分块;分块结束后通过Hash算法计算出数据块的指纹值,并将该指纹值和数据块地址按照<key:value>的方式存储到索引表中。
根据本发明优选的,所述元数据管理模块存储元数据表,并对元数据表中的数据包括虚拟机镜像(容器镜像层)指纹值、名称、作者、版本号、数据块指纹值及其数据块排列顺序进行增、删、改、查处理。
根据本发明优选的,所述多级缓存管理模块包括对HDD(Hard Disk Drive,硬盘驱动器)机械硬盘、SSD(Solid State Disk,固态硬盘)硬盘、NVMe(Non-Volatile MemoryExpress,非易失性存储器)磁盘和内存的管理;
在NVMe磁盘中存储索引表和元数据表;SSD硬盘中存储容器镜像层、高热度的虚拟机镜像数据块,高热度的虚拟机镜像数据块是指访问次数多的数据块,即访问次数多于某一数值的数据块;HDD机械硬盘中存储容器镜像数据库、低热度的虚拟机镜像数据块,低热度的虚拟机镜像数据块是指访问次数少的数据块,即访问次数少于某一数值的数据块。
根据本发明优选的,所述索引单元为三级B树索引单元,每级索引均存放键值对数据<key:value>,其中,key为数据块指纹值,value为key所对应数据块地址;所述索引单元的三级索引的索引表均存储于NVMe磁盘中。以提高访问速度。
进一步优选的,在索引单元中,通过数据块热度置换方法将被访问次数高的节点提高到更高层级的索引中,数据块热度置换方法具体步骤如下:
(1)设置初始基准值N;
(2)索引节点p0被访问,统计索引节点p0的访问次数n(p0);
(3)如果索引节点p0访问次数n(p0)大于初始基准值N,进入步骤(4);否则,返回步骤(2);
(4)如果索引节点p0为一级索引,则无需进行置换,结束;否则,进入步骤(5);
(5)将索引节点p0与其上一级索引中pmin最小的pmin比较被访问次数,n(pmin)是指pmin的访问次数,pmin是指上一级索引中最小访问次数的节点,如果n(p0)<n(pmin),则返回步骤(1),否则,进入步骤(6);
(6)如果p0是二级索引,直接执行步骤(7),如果p0是三级索引,将p0节点中的数据块地址所对应的数据块由HDD机械硬盘转存入SSD硬盘,并将pmin中数据块地址所对应的数据块由SSD磁盘转存入HDD机械硬盘,更新p0与pmin对应的数据块地址,执行步骤(7);
(7)将pmin及其对应的数据块地址存入其右子树,并使用p0及其对应的数据块地址替换掉pmin及其对应的数据块地址,删除原索引表中的p0及其对应的数据块地址;
(8)置换完成。
索引单元中,插入过程如下:
(9)存储系统获取到指纹值后,将数据块标识以及其指向数据块的地址存储到索引表中,如果索引节点中数据存储空间已满,则搜索下一级索引;
(10)从一级索引节点开始,沿搜索路径找到要插入的键值对数据的索引节点,如果该节点未满,则把数据段按照其中的指纹值数值大小插入到有序位置上,插入完成,否则进入步骤(11);
(11)如果该节点已满,节点数据量为K,需要新的存储空间存储数据,存储系统将产生新的节点,将已满节点的K/2个数据从该节点移动到新的节点中;
(12)新的节点产生后,将该新的节点与其父节点使用指针建立连接,插入过程完成。
索引单元中,查询过程如下:
(13)从根节点出发,按照二分查找数据结构查询一级索引中的数据,如果存在,则直接根据节点数据段中的数据块地址找到该数据块,如果不存在,则执行步骤(14);
(14)二分查找确定指纹值在索引中所处的区间,通过索引中的指针到下一级索引中查找,比对索引中的指纹值;
(15)如果未匹配到相同指纹值,则返回步骤(13),退出查询过程。
上述虚拟化资源镜像存储系统的实现方法,包括步骤如下:
A、所述FUSE文件系统接收来自若干镜像服务的R/W请求;
B、如果是读请求,进入步骤C,如果是写请求,进入步骤D;
C、调用所述元数据管理模块,所述元数据管理模块通过查询元数据表中是否存在该镜像的指纹值来确定该镜像是否存在于存储系统中,如果存在指纹值,则证明镜像已存在,查找元数据表中该镜像所需的数据块指纹值,通过索引单元查询指纹值对应的数据块地址通过多级缓存管理模块找到数据块,通过元数据表中的数据块顺序恢复镜像数据,返回查询结果,结束;否则,直接返回查询结果,结束;
D、调用元数据管理模块查询镜像元数据,判断是否存在该镜像元数据,如果存在,直接返回查询结果,结束;否则,进入步骤E;
E、存储镜像元数据到元数据表,如果镜像为容器镜像,则存储容器镜像的元数据,进入步骤F,如果镜像为虚拟机镜像,直接进入步骤F;
F、通过分块去重模块将数据块分成大小相等的数据块,使用Hash算法(SHA-1算法)计算出数据块指纹值,元数据管理模块将数据块排列顺序以及数据块指纹值写入元数据表,查询索引单元中索引表的指纹值(key值),判断存储系统中是否存在该数据块,如果存在则不需要处理,如果不存在,通过多级缓存管理模块存储数据块,并将该数据块的指纹值和其数据块地址存入索引表中,结束。
本发明的有益效果为:
本发明实现了虚拟化资源镜像的高效存储,解决了虚拟机镜像与容器镜像统一存储的管理问题,并在一定程度上减轻了镜像数据日益增多导致的存储压力大等问题;根据虚拟机镜像与容器镜像的构建方式、存储特点对镜像使用相适应的去重存储策略,提高了系统的重复数据删除率
Figure BDA0003159467160000051
Image size为去重前的镜像大小,Deduplicated size为去重后的镜像大小,尽可能的降低了存储性能损耗;通过数据块热度置换方法、B树索引和多级缓存架构降低系统性能开销,并且可以获得有序的索引表,B树索引相比Hash索引查询、插入的速度更快,在一定程度上提高了系统性能;通过FUSE文件系统解决了现存文件系统难以满足用户需求以及内核态定制开发文件系统难度较高的问题。
附图说明
图1为本发明虚拟化资源镜像存储系统的结构示意图;
图2为本发明虚拟化资源镜像存储系统的实现方法流程示意图;
图3为本发明三级B树文件索引的示意图;
图4为本发明多级缓存管理模块的示意图。
具体实施方式
下面结合说明书附图和实施例对本发明作进一步说明,但不限于此。
实施例1
一种虚拟化资源镜像存储系统,如图1所示,包括FUSE文件系统、镜像重复数据删除系统;
FUSE文件系统接收来自若干镜像服务例如包括Docker Registry和OpenStackGlance镜像服务的R/W请求,并将R/W请求发送给镜像重复数据删除系统,镜像重复数据删除系统分析R/W请求中R请求的内容,调用FUSE文件系统从磁盘中取出所需的数据返回给镜像服务;根据R/W请求中W请求对镜像去重并通过FUSE文件系统将去重产生的镜像元数据、索引数据和数据块存储到磁盘。
镜像重复数据删除系统包括分块去重模块以及与其连接的元数据管理模块、索引单元、多级缓存管理模块;分块去重模块用于:对虚拟机镜像和容器镜像进行分块并删除重复数据;元数据管理模块用于:对元数据表进行读/写操作,元数据表中存储虚拟机镜像(容器镜像层)指纹值、名称、作者、版本号、数据块指纹值及其数据块排列顺序;索引单元用于:对索引表进行读/写操作,索引表中按照<key:value>的方式存储索引数据;key是指数据块指纹值,value是指数据块地址;多级缓存管理模块用于:处理多级缓存间的数据提取、数据写入操作。
分块去重模块包括虚拟机镜像分块去重单元和容器镜像分块去重单元;根据虚拟机镜像中零块多的特点,虚拟机镜像分块去重单元用于:采用固定块长分块算法对虚拟机镜像按照8KB大小的固定长度分割,得到若干数据块,使用Hash算法(SHA-1算法)计算出数据块的指纹值,通过查询索引表中的节点key值,查看该指纹值是否存在于索引表中,如果存在,则证明该数据块及其指纹值已经存储在系统中;如果不存在,将该指纹值和数据块地址按照<key:value>的方式存储到索引表中;
容器镜像分块去重单元用于:使用CDC(Content-Defined Chunking)可变长分块算法对容器镜像分块,数据块的长度定义在最小值r和最大值D之间,可变长度的数据块用一个大小为w滑动窗口来划分,当滑动窗口在位置k的Hash值f满足f mod D=r时,该位置k为数据块的一个边界,本实施例中按照CDC可变长分块算法将容器镜像层按照4KB~16KB、平均8KB的数据块大小进行分块,重复这个过程,直到整个容器镜像都被分块;分块结束后通过Hash算法计算出数据块的指纹值,并将该指纹值和数据块地址按照<key:value>的方式存储到索引表中。
元数据管理模块存储元数据表,并对元数据表中的数据包括虚拟机镜像(容器镜像层)指纹值、名称、作者、版本号、数据块指纹值及其数据块排列顺序进行增、删、改、查处理。在镜像重复数据删除系统接受到R/W请求后将访问元数据管理模块,用于查看所要操作的镜像是否存在于存储系统中。
实施例2
根据实施例1所述的一种虚拟化资源镜像存储系统,其区别在于:
如图4所示,多级缓存管理模块包括对HDD机械硬盘、SSD硬盘、NVMe硬盘以及内存的管理;
多级缓存架构主要负责数据的存储,内存负责系统运行,在NVMe磁盘中存储索引表和元数据表;SSD硬盘中存储容器镜像层(高热度容器镜像层不会被分块去重)、高热度的虚拟机镜像数据块(一、二级索引中所对应的数据块),高热度的虚拟机镜像数据块是指访问次数多的数据块,即访问次数多于某一数值的数据块;HDD机械硬盘中存储容器镜像数据库、低热度的虚拟机镜像数据块,低热度的虚拟机镜像数据块是指访问次数少的数据块,即访问次数少于某一数值的数据块。
多级缓存架构在现有HDD机械硬盘、SSD硬盘、内存三级架构基础上增加一层NVMe磁盘构成四级缓存架构。
实施例3
根据实施例2所述的一种虚拟化资源镜像存储系统,其区别在于:
索引单元为三级B树文件索引单元,如图3所示,图3中,p*代表指针,指向下一级索引节点,sum为每个节点的被索引次数,p*与sum中间的数字部分为存储的十六进制指纹值(key值),addr为指纹值key所对应的数据块地址(value);每级索引均存放键值对数据<key:value>,其中,key为数据块标识,value为key所对应数据块地址;索引单元包括一级索引、二级索引及三级索引,索引单元的三级索引的索引表均存储于NVMe磁盘中。以提高访问速度。
在索引单元中,通过数据块热度置换方法将被访问次数高的节点提高到更高层级的索引中,以提高一、二级索引访问命中率,降低访问次数,提高索引性能。数据块热度置换方法具体步骤如下:
(1)设置初始基准值N;
(2)索引节点p0被访问,统计索引节点p0的访问次数n(p0);
(3)如果索引节点p0访问次数n(p0)大于初始基准值N,进入步骤(4);否则,返回步骤(2);
(4)如果索引节点p0为一级索引,则无需进行置换,结束;否则,进入步骤(5);
(5)将索引节点p0与其上一级索引中pmin最小的pmin比较被访问次数,n(pmin)是指pmin的访问次数,pmin是指上一级索引中最小访问次数的节点,如果n(p0)<n(pmin),则返回步骤(1),否则,进入步骤(6);
(6)如果p0是二级索引,直接执行步骤(7),如果p0是三级索引,将p0节点中的数据块地址所对应的数据块由HDD机械硬盘转存入SSD硬盘,并将pmin中数据块地址所对应的数据块由SSD磁盘转存入HDD机械硬盘,更新p0与pmin对应的数据块地址,执行步骤(7);
(7)将pmin及其对应的数据块地址存入其右子树,并使用p0及其对应的数据块地址替换掉pmin及其对应的数据块地址,删除原索引表中的p0及其对应的数据块地址;
(8)置换完成。
实施例4
实施例1-3任一所述的虚拟化资源镜像存储系统的实现方法,如图2所示,包括步骤如下:
A、FUSE文件系统接收来自若干镜像服务的R/W请求;
本实施例选取的虚拟机镜像和容器镜像如表1所示。
表1
Figure BDA0003159467160000071
Figure BDA0003159467160000081
B、如果是读请求,进入步骤C,如果是写请求,进入步骤D;
C、调用元数据管理模块,元数据管理模块通过查询元数据表中是否存在该镜像的指纹值来确定该镜像是否存在于存储系统中,如果存在指纹值,则证明镜像已存在,查找元数据表中该镜像所需的数据块指纹值,通过索引单元查询指纹值对应的数据块地址通过多级缓存管理模块找到数据块,通过元数据表中的数据块顺序依次排列拼接数据块,直至镜像恢复完成,返回查询结果,结束;否则,直接返回查询结果,结束;
D、调用元数据管理模块查询镜像元数据,判断是否存在该镜像元数据,如果存在,直接返回查询结果,结束;否则,进入步骤E;
E、存储镜像元数据到元数据表,如果镜像为容器镜像,则存储容器镜像的元数据,进入步骤F,如果镜像为虚拟机镜像,直接进入步骤F;
F、通过分块去重模块将数据块分成大小相等的数据块,使用Hash算法(SHA-1算法)计算出数据块指纹值,元数据管理模块将数据块排列顺序以及数据块指纹值写入元数据表,查询索引单元中索引表的指纹值(key值),判断存储系统中是否存在该数据块,如果存在则不需要处理,如果不存在,通过多级缓存管理模块存储数据块,并将该数据块的指纹值和其数据块地址存入索引表中,结束。
所选取镜像的重复数据删除效果如表2所示:
表2
Figure BDA0003159467160000082
Figure BDA0003159467160000091
如图3所示,基于B树索引的索引单元存储<key:value>值,其中key值使用十六进制处理的数据,value值为数据块的地址,同时增加读写次数值,该值将记录该节点的访问次数,通过该值配合数据块热度置换算法,通过将访问命中率高的数据放在更高层的索引中,并在每个节点(索引表)中增加二分查找数据结构,以提高查询速度;
索引单元中,插入过程如下:
(9)存储系统获取到指纹值后,将数据块标识以及其指向数据块的地址存储到索引表中,如果索引节点中数据存储空间已满,则搜索下一级索引;
(10)从一级索引节点开始,沿搜索路径找到要插入的键值对数据段的索引节点,如果该节点未满,则把数据段按照其中的指纹值key数值大小插入到有序位置上,插入完成,否则进入步骤(11);
(11)如果该节点已满,节点数据量为K,需要新的存储空间存储数据,存储系统将产生新的节点,将已满节点的K/2个数据从该节点移动到新的节点中;
(12)新的节点产生后,将该新的节点与其父节点使用指针建立连接,插入过程完成。
索引单元中,查询过程如下:
(13)从根节点出发,按照二分查找数据结构查询一级索引中的数据,如果存在,则直接根据节点数据段中的数据块地址找到该数据块,如果不存在,则执行步骤(14);
(14)二分查找确定指纹值在索引中所处的区间,通过索引中的指针到下一级索引中查找,比对索引中的指纹值;
(15)如果未匹配到相同指纹值,则返回步骤(13),退出查询过程。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。

Claims (8)

1.一种虚拟化资源镜像存储系统,其特征在于,包括FUSE文件系统、镜像重复数据删除系统;
所述FUSE文件系统接收来自若干镜像服务的R/W请求,并将R/W请求发送给镜像重复数据删除系统,镜像重复数据删除系统分析R/W请求中R请求的内容,调用FUSE文件系统从磁盘中取出所需的数据返回给镜像服务;根据R/W请求中W请求对镜像去重并通过FUSE文件系统将去重产生的镜像元数据、索引数据和数据块存储到磁盘。
2.根据权利要求1所述的一种虚拟化资源镜像存储系统,其特征在于,所述镜像重复数据删除系统包括分块去重模块以及与其连接的元数据管理模块、索引单元、多级缓存管理模块;
所述分块去重模块用于:对虚拟机镜像和容器镜像进行分块并删除重复数据;所述元数据管理模块用于:对元数据表进行读/写操作,元数据表中存储虚拟机镜像指纹值、名称、作者、版本号、数据块指纹值及其数据块排列顺序;所述索引单元用于:对索引表进行读/写操作,索引表中存储键值对索引数据;所述多级缓存管理模块用于:处理磁盘间的数据提取、数据写入操作。
3.根据权利要求2所述的一种虚拟化资源镜像存储系统,其特征在于,所述分块去重模块包括虚拟机镜像分块去重单元和容器镜像分块去重单元;
根据虚拟机镜像中零块多的特点,所述虚拟机镜像分块去重单元用于:采用固定块长分块算法对虚拟机镜像按照8KB大小的固定长度分割,得到若干数据块,使用Hash算法计算出数据块的指纹值,通过查询索引表中的节点key值,查看该指纹值是否存在于索引表中,如果存在,则证明该数据块及其指纹值已经存储在系统中;如果不存在,将该指纹值和数据块地址按照<key:value>的方式存储到索引表中;所述容器镜像分块去重单元用于:使用CDC可变长分块算法对容器镜像分块,数据块的长度定义在最小值r和最大值D之间,可变长度的数据块用一个大小为w滑动窗口来划分,当滑动窗口在位置k的Hash值f满足f mod D=r时,该位置k为数据块的一个边界,重复这个过程,直到整个容器镜像都被分块;分块结束后通过Hash算法计算出数据块的指纹值,并将该指纹值和数据块地址按照<key:value>的方式存储到索引表中。
4.根据权利要求2所述的一种虚拟化资源镜像存储系统,其特征在于,所述元数据管理模块存储元数据表,并对元数据表中的数据包括虚拟机镜像指纹值、名称、作者、版本号、数据块指纹值及其数据块排列顺序进行增、删、改、查处理。
5.根据权利要求2所述的一种虚拟化资源镜像存储系统,其特征在于,所述多级缓存管理模块包括对HDD机械硬盘、SSD硬盘、NVMe磁盘和内存的管理;
在NVMe磁盘中存储索引表和元数据表;SSD硬盘中存储容器镜像层、高热度的虚拟机镜像数据块,高热度的虚拟机镜像数据块是指访问次数多的数据块,即访问次数多于某一数值的数据块;HDD机械硬盘中存储容器镜像数据库、低热度的虚拟机镜像数据块,低热度的虚拟机镜像数据块是指访问次数少的数据块,即访问次数少于某一数值的数据块。
6.根据权利要求5所述的一种虚拟化资源镜像存储系统,其特征在于,所述索引单元为三级B树索引单元,每级索引均存放键值对数据<key:value>,其中,key为数据块指纹值,value为key所对应数据块地址;所述索引单元的三级索引的索引表均存储于NVMe磁盘中。
7.根据权利要求6所述的一种虚拟化资源镜像存储系统,其特征在于,在索引单元中,通过数据块热度置换方法将被访问次数高的节点提高到更高层级的索引中,数据块热度置换方法具体步骤如下:
(1)设置初始基准值N;
(2)索引节点p0被访问,统计索引节点p0的访问次数n(p0);
(3)如果索引节点p0访问次数n(p0)大于初始基准值N,进入步骤(4);否则,返回步骤(2);
(4)如果索引节点p0为一级索引,则无需进行置换,结束;否则,进入步骤(5);
(5)将索引节点p0与其上一级索引中pmin最小的pmin比较被访问次数,n(pmin)是指pmin的访问次数,pmin是指上一级索引中最小访问次数的节点,如果n(p0)<n(pmin),则返回步骤(1),否则,进入步骤(6);
(6)如果p0是二级索引,直接执行步骤(7),如果p0是三级索引,将p0节点中的数据块地址所对应的数据块由HDD机械硬盘转存入SSD硬盘,并将pmin中数据块地址所对应的数据块由SSD磁盘转存入HDD机械硬盘,更新p0与pmin对应的数据块地址,执行步骤(7);
(7)将pmin及其对应的数据块地址存入其右子树,并使用p0及其对应的数据块地址替换掉pmin及其对应的数据块地址,删除原索引表中的p0及其对应的数据块地址;
(8)置换完成。
8.权利要求2-7任一所述虚拟化资源镜像存储系统的工作方法,其特征在于,包括步骤如下:
A、所述FUSE文件系统接收来自若干镜像服务的R/W请求;
B、如果是读请求,进入步骤C,如果是写请求,进入步骤D;
C、调用所述元数据管理模块,所述元数据管理模块通过查询元数据表中是否存在该镜像的指纹值来确定该镜像是否存在于存储系统中,如果存在指纹值,则证明镜像已存在,查找元数据表中该镜像所需的数据块指纹值,通过索引单元查询指纹值对应的数据块地址通过多级缓存管理模块找到数据块,通过元数据表中的数据块顺序恢复镜像数据,返回查询结果,结束;否则,直接返回查询结果,结束;
D、调用元数据管理模块查询镜像元数据,判断是否存在该镜像元数据,如果存在,直接返回查询结果,结束;否则,进入步骤E;
E、存储镜像元数据到元数据表,如果镜像为容器镜像,则存储容器镜像的元数据,进入步骤F,如果镜像为虚拟机镜像,直接进入步骤F;
F、通过分块去重模块将数据块分成大小相等的数据块,使用Hash算法计算出数据块指纹值,元数据管理模块将数据块排列顺序以及数据块指纹值写入元数据表,查询索引单元中索引表的指纹值,判断存储系统中是否存在该数据块,如果存在则不需要处理,如果不存在,通过多级缓存管理模块存储数据块,并将该数据块的指纹值和其数据块地址存入索引表中,结束。
CN202110787216.7A 2021-07-13 2021-07-13 一种虚拟化资源镜像存储系统及其实现方法 Active CN113535670B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110787216.7A CN113535670B (zh) 2021-07-13 2021-07-13 一种虚拟化资源镜像存储系统及其实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110787216.7A CN113535670B (zh) 2021-07-13 2021-07-13 一种虚拟化资源镜像存储系统及其实现方法

Publications (2)

Publication Number Publication Date
CN113535670A true CN113535670A (zh) 2021-10-22
CN113535670B CN113535670B (zh) 2022-11-11

Family

ID=78098728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110787216.7A Active CN113535670B (zh) 2021-07-13 2021-07-13 一种虚拟化资源镜像存储系统及其实现方法

Country Status (1)

Country Link
CN (1) CN113535670B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114399006A (zh) * 2022-03-24 2022-04-26 山东省计算中心(国家超级计算济南中心) 基于超算的多源异构图数据融合方法及系统
CN115617707A (zh) * 2022-12-07 2023-01-17 摩尔线程智能科技(北京)有限责任公司 用于管理存储空间的装置及方法、计算设备、芯片
CN117112268A (zh) * 2023-10-23 2023-11-24 深圳市七彩虹禹贡科技发展有限公司 一种内存共享管理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103139300A (zh) * 2013-02-05 2013-06-05 杭州电子科技大学 一种基于重复数据删除的虚拟机镜像管理的优化方法
CN105446895A (zh) * 2014-08-25 2016-03-30 北京云巢动脉科技有限公司 一种存储系统非同源数据运行时io去重的方法及系统
WO2017008584A1 (zh) * 2015-07-15 2017-01-19 中兴通讯股份有限公司 一种虚拟机启动方法、装置及管理节点

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103139300A (zh) * 2013-02-05 2013-06-05 杭州电子科技大学 一种基于重复数据删除的虚拟机镜像管理的优化方法
CN105446895A (zh) * 2014-08-25 2016-03-30 北京云巢动脉科技有限公司 一种存储系统非同源数据运行时io去重的方法及系统
WO2017008584A1 (zh) * 2015-07-15 2017-01-19 中兴通讯股份有限公司 一种虚拟机启动方法、装置及管理节点

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114399006A (zh) * 2022-03-24 2022-04-26 山东省计算中心(国家超级计算济南中心) 基于超算的多源异构图数据融合方法及系统
CN114399006B (zh) * 2022-03-24 2022-07-12 山东省计算中心(国家超级计算济南中心) 基于超算的多源异构图数据融合方法及系统
CN115617707A (zh) * 2022-12-07 2023-01-17 摩尔线程智能科技(北京)有限责任公司 用于管理存储空间的装置及方法、计算设备、芯片
CN117112268A (zh) * 2023-10-23 2023-11-24 深圳市七彩虹禹贡科技发展有限公司 一种内存共享管理方法及系统
CN117112268B (zh) * 2023-10-23 2024-02-13 深圳市七彩虹禹贡科技发展有限公司 一种内存共享管理方法及系统

Also Published As

Publication number Publication date
CN113535670B (zh) 2022-11-11

Similar Documents

Publication Publication Date Title
USRE49148E1 (en) Reclaiming space occupied by duplicated data in a storage system
US20230273916A1 (en) Data Block Allocation For Storage System
US20240012714A1 (en) Indirect Dataset Replication To Cloud-Based Targets
USRE49011E1 (en) Mapping in a storage system
US9891858B1 (en) Deduplication of regions with a storage system
US8954710B2 (en) Variable length encoding in a storage system
US9047301B2 (en) Method for optimizing the memory usage and performance of data deduplication storage systems
US9454476B2 (en) Logical sector mapping in a flash storage array
US8370315B1 (en) System and method for high performance deduplication indexing
CN113535670B (zh) 一种虚拟化资源镜像存储系统及其实现方法
US8639669B1 (en) Method and apparatus for determining optimal chunk sizes of a deduplicated storage system
US9367448B1 (en) Method and system for determining data integrity for garbage collection of data storage systems
US9141621B2 (en) Copying a differential data store into temporary storage media in response to a request
US9424185B1 (en) Method and system for garbage collection of data storage systems
US20130262758A1 (en) Systems and Methods for Tracking Block Ownership
JP6807395B2 (ja) プロセッサ・グリッド内の分散データ重複排除
US11372576B2 (en) Data processing apparatus, non-transitory computer-readable storage medium, and data processing method
CN112416879A (zh) 一种基于ntfs文件系统的块级数据去重方法
US20200019539A1 (en) Efficient and light-weight indexing for massive blob/objects
CN114296630A (zh) 缓存存储器中重复数据删除指纹索引的更新

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant