CN103631729A - 一种基于块级的分级存储方法及系统 - Google Patents

一种基于块级的分级存储方法及系统 Download PDF

Info

Publication number
CN103631729A
CN103631729A CN201310658837.0A CN201310658837A CN103631729A CN 103631729 A CN103631729 A CN 103631729A CN 201310658837 A CN201310658837 A CN 201310658837A CN 103631729 A CN103631729 A CN 103631729A
Authority
CN
China
Prior art keywords
data
blocks
migration
eigenwert
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310658837.0A
Other languages
English (en)
Inventor
施光源
张宇
梁志诚
张延枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201310658837.0A priority Critical patent/CN103631729A/zh
Publication of CN103631729A publication Critical patent/CN103631729A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供一种基于块级的分级存储方法及系统。应用在数据智能管理领域,包括以下步骤:块数据特征收集器获取块数据的特征值;迁移管理器获取所述块数据的特征值,同时,根据从策略配置管理器获取的管理参数,依据预设策略,进行块数据迁移。通过实施本发明的技术方案,实现了对于扩展块级的数据进行自动分级管理,能够解决数据分级存储管理过程中存在热点数据定位不准确的问题并能够有效提高存储资源的利用率。

Description

一种基于块级的分级存储方法及系统
技术领域
本发明涉及数据智能管理领域,尤其涉及一种基于块级的分级存储方法及系统。
背景技术
数据分级存储技术主要是根据数据访问特征在存储虚拟层对存储设备组成的存储资源进行合理组织,形成多级的存储层次(如根据设备传输速率分为高速、中速和慢速存储设备,并可根据存储需求扩展到更多设备级别),并对上层应用需求进行特征提取和聚类处理,基于数据访问的局部性原理,构建应用数据与存储空间映射的数据特征模型,将不经常访问的数据自动迁移到存储成本层次中较低的设备,释放出较高成本的存储空间给更频繁访问或更高优先级的数据,从而大大减少非重要性数据在一级本地磁盘所占用的空间,加快整个系统的存储性能,降低整个存储系统的拥有成本,进而获得更好的性价比。
在现有的分级存储技术中主要是利用文件对象包括的多种数据特征属性,如文件大小,类型等进行数据特征的映射,将具有不同特征的数据进行分类管理。但是,基于文件级的分级存储以文件作为数据特征统计的基本单位,如果文件比较大,并且当只有局部信息经常被访问时,那么就存在对于热点数据定位不准确的问题,从而导致不能够将真正需要被分级的数据放置于高效且昂贵的存储资源上,不利于提高存储管理效率。
基于块级的分级存储是一种细粒度的数据分级管理方案,能够将数据管理的粒度细化到以根据应用需求所定义的扩展块级,但是现有工作中缺乏对于基于块数据的分级存储系统架构的深入研究。
发明内容
本发明提供一种基于块级的分级存储方法及系统,以解决上述问题。
本发明提供一种基于块级的分级存储方法。上述方法包括以下步骤:
块数据特征收集器获取块数据的特征值;
迁移管理器获取所述块数据的特征值,同时,根据从策略配置管理器获取的管理参数,依据预设策略,进行块数据迁移。
本发明还提供一种基于块级的分级存储系统,包括:
迁移管理器、块数据特征收集器、策略配置管理器、存储资源管理器;迁移管理器分别与块数据特征收集器、策略配置管理器相连;存储资源管理器分别与块数据特征收集器、策略配置管理器相连;
所述块数据特征收集器,用于获取块数据的特征值;
所述迁移管理器,用于获取所述块数据的特征值及从策略配置管理器获取的管理参数,依据预设策略,进行块数据迁移;
所述策略配置管理器,用于设置管理参数;
所述存储资源管理模块,用于按照性能由高到低的顺序组织磁盘并构建多级设备链表,将设备进行统一管理。
通过实施本发明的技术方案,实现了对于扩展块级的数据进行自动分级管理,能够解决数据分级存储管理过程中存在热点数据定位不准确的问题并能够有效提高存储资源的利用率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1所示为本发明实施例1的分级存储系统架构示意图;
图2所示为本发明实施例2的数据迁移结构示意图;
图3所示为本发明实施例3的数据迁移窗口示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明提供了一种基于块级的分级存储方法,包括以下步骤:
块数据特征收集器获取块数据的特征值;
迁移管理器获取所述块数据的特征值,同时,根据从策略配置管理器获取的管理参数,依据预设策略,进行块数据迁移。
其中,迁移管理器获取块数据的特征值的途径为:块数据特征收集器获取块数据的特征值后,发送至迁移管理器。
其中,所述管理参数包括:块数据的扫描周期、不同层级设备上最大未使用时间。
其中,块数据特征收集器获取块数据的特征值的具体过程为:块数据特征收集器根据获取的读/写的引用次数的统计值,周期地计算每一个块数据的引用频率。
其中,所述预设策略为:
当迁移管理器到达扫描周期时,触发迁移工作开始,迁移工作遍历整个存储设备中的所有数据块,根据设备的最大未使用时间、数据块的最大未使用时间、块的访问引用计数的统计、设备的访问引用计数的统计,判断数据块是否向上级或者向下级进行迁移操作;预设某一阀值,若监控的块数据的特征值超过该阀值,则触发分级系统,开始基于块数据迁移。
其中,块数据特征收集器获取块数据的特征值之前,还包括:存储资源管理模块按照性能由高到低的顺序组织磁盘并构建多级设备链表,将设备进行统一管理。
其中,块数据特征收集器获取块数据的特征值之前,还包括:策略配置管理器对块数据的扫描周期,不同层级设备上最大未使用时间进行设置。
如图1所示,在基于块级的分级存储系统中主要包括了迁移管理器、块数据特征收集器、策略配置管理器以及存储资源管理模块四个组件。
1)块数据特征收集器获取块数据的特征值(例如:块数据的引用频率),同时,能够完成对于I/O队列的扫描以及I/O统计工作;
2)迁移管理器获取块数据的特征值,同时,根据从策略配置管理器获取的管理参数,依据预设策略,进行块数据迁移;
其中,迁移管理器获取块数据的特征值的途径为:块数据特征收集器获取块数据的特征值后,发送至迁移管理器。
其中,管理参数包括:块数据的扫描周期、不同层级设备上最大未使用时间。
其中,块数据特征收集器获取块数据的特征值的具体过程为:
块数据特征收集器,能够对完整I/O事件进行管理,其中I/O事件包括传输大小、响应时间、逻辑块地址LBA以及发生I/O事件的磁盘ID,还包括执行I/O的队列。块数据特征收集器将每一个I/O二元组(LBA,磁盘ID)映射给唯一的块,并且统计每一个块的I/O数。然后,根据获取的读/写的引用次数的统计值,周期地计算每一个块数据的引用频率。
其中,预设策略为:
当迁移管理器到达扫描周期时,触发迁移工作开始,迁移工作遍历整个存储设备中的所有数据块,根据设备的最大未使用时间、数据块的最大未使用时间、块的访问引用计数的统计、设备的访问引用计数的统计,判断数据块是否向上级或者向下级进行迁移操作;预设某一阀值,若监控的块数据的特征值超过该阀值,则触发分级系统,开始基于块数据迁移。
3)策略配置管理器负责用户对于分级存储系统中所需要的管理参数进行设置,这些管理参数将被迁移管理器所使用。
4)存储资源管理模块是位于内核当中的驱动模块,其主要功能是对不同类型的物理存储资源进行整合,从而形成包括不同读写性能存储设备的存储资源池。
在如图1所示的分级存储系统架构中,首先需要将存储资源进行整合,形成具备分级存储能力的存储资源池,利用存储资源管理模块按照性能由高到低的顺序组织磁盘,并且构建多级设备链表,将设备进行统一管理。其次,开始对分级存储系统的管理参数进行设置,利用策略配置管理器对块数据的扫描周期,不同层级设备上最大未使用时间等管理参数进行设置。
在分级存储系统启动后,开始对块数据的特征信息进行统计,为了能够统计块数据特征信息,需要对I/O事件进行定义,以便能够对其进行监控。对于读、写I/O的处理,块数据特征收集器的请求队列接收来自通用块设备模块的I/O请求,当I/O入队列后,通知分级系统工作线程运转,工作线程根据I/O的不同类型划分不同的设备块给I/O请求存储写数据,数据写入分配的块设备之后,I/O结束,在处理写请求时,记录数据块的写信息,包括设备的写请求数量、块的写请求数量;对于读I/O请求统计设备以及块的访问引用计数和访问时间信息,之后将I/O进行转发。然后,计算整个队列的引用频率信息,并且根据给定的阀值进行度量。当然,对于海量存储而言,数据的收集将是非常巨大的,因此,适时地通过调整数据块的大小来降低统计信息的数据量。
当迁移管理器到达扫描周期时,触发迁移工作开始,迁移工作遍历整个存储设备中的所有数据块,根据设备的最大未使用时间、数据块的最大未使用时间、块的访问引用计数的统计、设备的访问引用计数的统计等,以便判断数据块是否向上级或者向下级进行迁移操作;对于数据的向上级迁移参考上层级设备的访问引用计数信息,减少数据块的迁移抖动;基于扩展块等级的统计分析,根据该分级结果来将扩展块匹配到合适的层级。若监控的块特征值超过阀值,那么将触发分级系统,开始基于块的数据迁移。
分级存储系统在执行过程中将数据时间轴和访问频度等热点数据访问特征作为数据资源的分级依据,存储资源特征将作为存储设备分级的凭据,然后根据这些数据特征和存储设备的分级情况,确定数据的分级标准及数据分级变化的触发条件,整个数据迁移系统结构如图2所示。
基于扩展块级的统计分析,根据该分级结果来将扩展块匹配到合适的层级。在此基础上,预设某一阀值,如果监控的块特征值超过阀值,那么将触发分级系统,开始基于块的数据迁移。
在系统中引入块数据特征收集器,它能够对完整I/O事件进行管理,其中I/O事件包括传输大小、响应时间、逻辑块地址LBA以及发生I/O事件的磁盘ID,还包括执行I/O的队列。块数据特征收集器将每一个I/O二元组(LBA,磁盘ID)映射给唯一的块,并且统计每一个块的I/O数。然后,周期地计算每一个块的引用频率,分别统计读引用数与写引用数。
当数据信息达到迁移触发条件时,进行自动数据迁移,实现数据信息的降级或升级存储。迁移时,设置了一个数据迁移窗口,其大小与迁移的粒度有关。
如图3所示,它是一个逻辑视图上的区间,与磁盘上数据的物理分布无关,迁移前和迁移后数据的逻辑视图都是不变的,每次处理迁移进程为当前数据迁移窗口申请读写锁,以保证迁移进程与写操作进程之间的数据一致性。
当需要迁移时,首先根据数据分级策略来制定数据迁移计划,数据迁移时就是依次将该计划中的数据进行移动,具体到每个操作而言,就是将迁移窗口内的数据重新分布到其它存储空间中,考虑到底层存储设备的并行性,将迁移窗口设置为底层存储设备条带大小的整数倍。
另外,在分级存储系统中设计块迁移器,它负责管理块的特征统计信息,以及数据移动请求,它通过比较所统计的特征信息与阀值,进而标记需要迁移的扩展块,并且负责安排和优化迁移过程。另外,也需要特别小心迁移所引起额外的I/O传输量,从而避免对主要的I/O性能产生影响。
当块的引用数超过阀值后,将引发分级管理系统对于数据块的迁移操作;当设备不停止时,开始循环等待事件中断信号,该中断信号应该是进行迁移的中断指令wait_event_interruptible。当触发迁移指令后,首先需要对被迁移的设备进行加锁处理,为的是能够确保数据的一致性。
然后,开始对块列表开始遍历walk_blocklist,在遍历块链表的时候,首先需要获取块信息,块信息当中包含了读/写的引用次数的统计值,在获取统计值后,开始计算块的数据特征值,然后与阀值进行比对,从而确定是升级操作还是降级操作;利用f_op->read操作函数将从文件中读取数据,并且利用f_op->write操作函数将数据写入到新的设备当中,并且要完成对于块列表的更新操作,包括该块最近访问的时间,以及该块最新的存储设备等信息;当一个块被迁移到不同的层,那么将读写计数器置零。
本发明还提供了一种基于块级的分级存储方法,包括:迁移管理器、块数据特征收集器、策略配置管理器、存储资源管理器;迁移管理器分别与块数据特征收集器、策略配置管理器相连;存储资源管理器分别与块数据特征收集器、策略配置管理器相连;
所述块数据特征收集器,用于获取块数据的特征值;
所述迁移管理器,用于获取所述块数据的特征值及从策略配置管理器获取的管理参数,依据预设策略,进行块数据迁移;
所述策略配置管理器,用于设置管理参数;
所述存储资源管理模块,用于按照性能由高到低的顺序组织磁盘并构建多级设备链表,将设备进行统一管理。
本发明所涉及的基于块级的分级存储系统架构能够实现对于逻辑卷中一部分固定大小的块数据进行监控以及数据热度的统计分析,继而完成对于块数据的分级管理操作;由于所管理的块数据粒度细,并且在逻辑卷中需要管理的数据量值比较少,因此,能够获得更高的数据分配效率,在进行迁移等操作时损耗较少,有利于提高存储资源的利用率与管理效率。
通过实施本发明的技术方案,实现了对于扩展块级的数据进行自动分级管理,能够解决数据分级存储管理过程中存在热点数据定位不准确的问题并能够有效提高存储资源的利用率。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于块级的分级存储方法,其特征在于,包括以下步骤:
块数据特征收集器获取块数据的特征值;
迁移管理器获取所述块数据的特征值,同时,根据从策略配置管理器获取的管理参数,依据预设策略,进行块数据迁移。
2.根据权利要求1所述的方法,其特征在于:迁移管理器获取块数据的特征值的途径为:块数据特征收集器获取块数据的特征值后,发送至迁移管理器。
3.根据权利要求1所述的方法,其特征在于:所述管理参数包括:块数据的扫描周期、不同层级设备上最大未使用时间。
4.根据权利要求1所述的方法,其特征在于:块数据特征收集器获取块数据的特征值的具体过程为:块数据特征收集器根据获取的读/写的引用次数的统计值,周期地计算每一个块数据的引用频率。
5.根据权利要求1所述的方法,其特征在于:所述预设策略为:
当迁移管理器到达扫描周期时,触发迁移工作开始,迁移工作遍历整个存储设备中的所有数据块,根据设备的最大未使用时间、数据块的最大未使用时间、块的访问引用计数的统计、设备的访问引用计数的统计,判断数据块是否向上级或者向下级进行迁移操作;预设某一阀值,若监控的块数据的特征值超过该阀值,则触发分级系统,开始基于块数据迁移。
6.根据权利要求1所述的方法,其特征在于:块数据特征收集器获取块数据的特征值之前,还包括:存储资源管理模块按照性能由高到低的顺序组织磁盘并构建多级设备链表,将设备进行统一管理。
7.根据权利要求1所述的方法,其特征在于:块数据特征收集器获取块数据的特征值之前,还包括:策略配置管理器对块数据的扫描周期,不同层级设备上最大未使用时间进行设置。
8.一种基于块级的分级存储方法,其特征在于,包括:迁移管理器、块数据特征收集器、策略配置管理器、存储资源管理器;迁移管理器分别与块数据特征收集器、策略配置管理器相连;存储资源管理器分别与块数据特征收集器、策略配置管理器相连;
所述块数据特征收集器,用于获取块数据的特征值;
所述迁移管理器,用于获取所述块数据的特征值及从策略配置管理器获取的管理参数,依据预设策略,进行块数据迁移;
所述策略配置管理器,用于设置管理参数;
所述存储资源管理模块,用于按照性能由高到低的顺序组织磁盘并构建多级设备链表,将设备进行统一管理。
CN201310658837.0A 2013-12-06 2013-12-06 一种基于块级的分级存储方法及系统 Pending CN103631729A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310658837.0A CN103631729A (zh) 2013-12-06 2013-12-06 一种基于块级的分级存储方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310658837.0A CN103631729A (zh) 2013-12-06 2013-12-06 一种基于块级的分级存储方法及系统

Publications (1)

Publication Number Publication Date
CN103631729A true CN103631729A (zh) 2014-03-12

Family

ID=50212811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310658837.0A Pending CN103631729A (zh) 2013-12-06 2013-12-06 一种基于块级的分级存储方法及系统

Country Status (1)

Country Link
CN (1) CN103631729A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104503924A (zh) * 2014-12-16 2015-04-08 华为技术有限公司 一种分层存储系统中的区域分配方法及装置
CN105022753A (zh) * 2014-04-29 2015-11-04 中国移动通信集团内蒙古有限公司 一种数据存储方法及系统
CN106598501A (zh) * 2016-12-16 2017-04-26 郑州云海信息技术有限公司 用于存储自动分层的数据迁移设备及方法
CN104077081B (zh) * 2014-06-28 2017-04-26 华为技术有限公司 一种存储方法及装置
CN106775467A (zh) * 2016-12-06 2017-05-31 郑州云海信息技术有限公司 一种基于自动分层技术热度统计数据的存储系统优化方法
CN110262758A (zh) * 2019-06-28 2019-09-20 深信服科技股份有限公司 一种数据存储管理方法、系统及相关设备
CN111427969A (zh) * 2020-03-18 2020-07-17 清华大学 一种分级存储系统的数据替换方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096561A (zh) * 2011-02-09 2011-06-15 成都市华为赛门铁克科技有限公司 分层数据存储处理方法、装置以及存储设备
CN102156738A (zh) * 2011-04-13 2011-08-17 成都市华为赛门铁克科技有限公司 数据块处理方法、数据块存储设备及系统
CN102521152A (zh) * 2011-11-29 2012-06-27 成都市华为赛门铁克科技有限公司 一种分级存储方法及系统
US20130124734A1 (en) * 2004-04-30 2013-05-16 Commvault Systems, Inc. System and method for allocation of organizational resources

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130124734A1 (en) * 2004-04-30 2013-05-16 Commvault Systems, Inc. System and method for allocation of organizational resources
CN102096561A (zh) * 2011-02-09 2011-06-15 成都市华为赛门铁克科技有限公司 分层数据存储处理方法、装置以及存储设备
CN102156738A (zh) * 2011-04-13 2011-08-17 成都市华为赛门铁克科技有限公司 数据块处理方法、数据块存储设备及系统
CN102521152A (zh) * 2011-11-29 2012-06-27 成都市华为赛门铁克科技有限公司 一种分级存储方法及系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105022753A (zh) * 2014-04-29 2015-11-04 中国移动通信集团内蒙古有限公司 一种数据存储方法及系统
CN105022753B (zh) * 2014-04-29 2018-09-04 中国移动通信集团内蒙古有限公司 一种数据存储方法及系统
CN104077081B (zh) * 2014-06-28 2017-04-26 华为技术有限公司 一种存储方法及装置
CN104503924A (zh) * 2014-12-16 2015-04-08 华为技术有限公司 一种分层存储系统中的区域分配方法及装置
CN104503924B (zh) * 2014-12-16 2018-02-13 华为技术有限公司 一种分层存储系统中的区域分配方法及装置
CN106775467A (zh) * 2016-12-06 2017-05-31 郑州云海信息技术有限公司 一种基于自动分层技术热度统计数据的存储系统优化方法
CN106598501A (zh) * 2016-12-16 2017-04-26 郑州云海信息技术有限公司 用于存储自动分层的数据迁移设备及方法
CN106598501B (zh) * 2016-12-16 2019-06-28 郑州云海信息技术有限公司 用于存储自动分层的数据迁移设备及方法
CN110262758A (zh) * 2019-06-28 2019-09-20 深信服科技股份有限公司 一种数据存储管理方法、系统及相关设备
CN110262758B (zh) * 2019-06-28 2023-07-14 深信服科技股份有限公司 一种数据存储管理方法、系统及相关设备
CN111427969A (zh) * 2020-03-18 2020-07-17 清华大学 一种分级存储系统的数据替换方法
CN111427969B (zh) * 2020-03-18 2022-05-27 清华大学 一种分级存储系统的数据替换方法

Similar Documents

Publication Publication Date Title
CN103631729A (zh) 一种基于块级的分级存储方法及系统
US20180276233A1 (en) Techniques for implementing hybrid flash/hdd-based virtual disk files
US10754573B2 (en) Optimized auto-tiering, wherein subset of data movements are selected, utilizing workload skew point, from a list that ranks data movements based on criteria other than I/O workload
US8909887B1 (en) Selective defragmentation based on IO hot spots
Canim et al. SSD bufferpool extensions for database systems
CN103605615B (zh) 一种分级存储中基于块级数据的定向分配方法
US9026760B1 (en) Techniques for enforcing capacity restrictions of an allocation policy
US8478731B1 (en) Managing compression in data storage systems
US9280300B2 (en) Techniques for dynamically relocating virtual disk file blocks between flash storage and HDD-based storage
Stoica et al. Enabling efficient OS paging for main-memory OLTP databases
US20150006788A1 (en) Techniques for Implementing Hybrid Flash/HDD-based Virtual Disk Files
CN110268391A (zh) 用于缓存数据的系统和方法
CN103095805A (zh) 一种对数据进行智能分层管理的云存储系统
Tai et al. Improving flash resource utilization at minimal management cost in virtualized flash-based storage systems
US9367262B2 (en) Assigning a weighting to host quality of service indicators
CN103605483A (zh) 一种分级存储系统中块级数据特征处理方法
CN103558992A (zh) 堆外直接内存数据存储器,创建和/或管理堆外直接内存数据存储器的方法,和/或包括堆外直接内存数据存储器的系统
CN104346284B (zh) 一种内存管理方法及内存管理设备
US9086882B2 (en) DRAM energy use optimization using application information
CN109710184A (zh) 瓦记录磁盘感知的分层式混合存储方法及系统
KR20150089538A (ko) 인-메모리 데이터 관리 장치 및 인-메모리 데이터 관리 방법
CN104268099A (zh) 一种管理数据读写的方法及装置
WO2014142337A1 (ja) ストレージ装置と方法及びプログラム
CN106598501A (zh) 用于存储自动分层的数据迁移设备及方法
Carniel et al. A generic and efficient framework for flash-aware spatial indexing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140312