CN104407987A - 一种分级存储的方法 - Google Patents

一种分级存储的方法 Download PDF

Info

Publication number
CN104407987A
CN104407987A CN201410603327.8A CN201410603327A CN104407987A CN 104407987 A CN104407987 A CN 104407987A CN 201410603327 A CN201410603327 A CN 201410603327A CN 104407987 A CN104407987 A CN 104407987A
Authority
CN
China
Prior art keywords
strategy
policy
module
hierarchical
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410603327.8A
Other languages
English (en)
Other versions
CN104407987B (zh
Inventor
马照云
付根希
喻燕军
杨浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Zhongke Shuguang Storage Technology Co ltd
Original Assignee
Dawning Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Co Ltd filed Critical Dawning Information Industry Co Ltd
Priority to CN201410603327.8A priority Critical patent/CN104407987B/zh
Publication of CN104407987A publication Critical patent/CN104407987A/zh
Application granted granted Critical
Publication of CN104407987B publication Critical patent/CN104407987B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种实现分级存储的方法,该方法包括策略分析模块和客户端模块分析系统内的所有分级策略,查看策略对应的文件是否满足策略要求,将不满足策略要求的文件发送到迁移控制模块;元数据服务模块向策略分析模块提供文件信息;迁移控制模块接收策略分析模块发送的待迁移文件,根据策略要求需要选择新的介质,发送给迁移模块进行迁移,迁移模块完成迁移工作;管理模块实现分级策略维护;图形模块以图形界面的形式向用户展示分级功能,在界面进行策略的添加、删除和修改,并将命令发送给管理模块进行而通知到策略分析模块。

Description

一种分级存储的方法
技术领域
本发明涉及一种计算机文件存储技术,具体讲涉及一种分级存储实现方法。 
背景技术
分布式文件系统有多种介质类型,在存取速度及价格方面都有很大差别;在同一分布式文件系统中存储的用户数据,存储需求也不相同,对于需要经常访问的且对访问速度比较敏感的数据需要存放在快设备上,而对于数据量巨大,对速度要求不高的场景则需要选择价格相对低廉的慢设备来存放。 
这就对分布式文件系统提出了以下需求:即在系统内支持一种以上存储介质,并且能够根据需要将数据存放到不同的介质类型上。 
由于元数据服务器上的辅助文件记录了各个磁盘上存放的对象,原来实现方式是首先获取系统内所有磁盘,然后读取每个磁盘上的对象记录并根据记录读取inode(索引节点),获取访问时间及修改时间。如果在规定时间内有修改则迁移到快速设备;如果在规定的时间内没有修改则迁移到慢速设备(规定时间可以通过配置参数进行修改)。 
现有的实现方式具有以下缺点:首先,策略单一,可扩展性很差,只能根据访问及修改时间分级,如果想在原来框架上增加其他策略,非常困难;其次,灵活性非常差,虽然规定时间可以通过配置参数修改,但是这一时间是对所有对象生效的,对象之间不能设置不同时间区间,此外系统内所有对象要么都根据设定时间进行迁移,要么关闭分级功能,都不进行迁移。 
这些缺点导致分级功能不能满足很多应用场景:如根据文件名特点分级;系统内部有的目录需要根据时间策略分级存储,有的目录则不需要等等。 
发明内容
为了克服上述现有技术的不足,本发明提供一种实现分级存储的方法,该方法利用策略分析工具在客户端之上,获取文件所有信息。其中每个策略都包含所有策略单元,利用valid字段表示是否有效,方便实现单一或者组合条件的分级需求;具有非常好的扩展性。 
为了实现上述发明目的,本发明采取如下技术方案: 
一种实现分级存储的方法,该方法包括如下步骤: 
(1)元数据服务模块向策略分析模块提供文件信息; 
(2)策略分析模块分析存储系统内的所有分级策略,查看策略对应的文件是否满足策略要求,将不满足策略要求的待迁移文件发送到迁移控制模块; 
(3)迁移控制模块根据分级策略要求需要选择新的存储介质,并将所接收到的待迁移文件发送给迁移模块迁移至新的存储介质; 
(4)通过管理模块进行分级策略维护后,在人机交互界面上显示维护结果。 
本发明提供的优选技术方案中,该方法进一步包括如下步骤: 
(5)当用户需要对分级策略进行更新时,则通过人机交互界面设置存储系统内的分级策略,并跳转至步骤(2)由策略分析模块重新分析存储系统内更新后的分级策略。 
本发明提供的第二优选技术方案中,对分级策略进行更新的方法包括:增加、删除、修改分级策略。 
本发明提供的第三优选技术方案中,所述分级策略包括策略适用的目录、策略要求的目标存储介质类型和策略组;若所述目标介质类型为多个,按介质类型的排列顺序迁移;所述策略组包括的策略单元中的每一策略单元对应一种分级要求,策略单元包括一个valid字段和该单元的具体内容,若val id字段为1表示该策略单元对该策略有效,为0表示无效。 
本发明提供的第四优选技术方案中,所述策略分析模块包括三类线程:dispatch、scan和worker,采用多线程流水方式实现策略分级。 
本发明提供的第五优选技术方案中,多线程流水方式的具体步骤如下: 
(1)所述dispatch获取当前系统所有分级的策略,合并策略涉及到的目录,并将目录投递到scan全局队列; 
(2)所述scan线程从scan队列获取一个目录后开始调用函数readdir进行扫描,若是子目录则将子目录投递到scan线程的队列,若是文件则将其投递到队列最短的worker线程队列; 
(3)所述worker线程从队列获取文件后通过函数ioctl获取文件的访问时间、大小和当前所在磁盘的信息,与当前系统策略进行匹配,找到匹配策略后,若发现当前文件的介质类型与策略不符,则将文件及策略要求的目标介质类型存放到一个buf,若buf达到768byte的缓存或者缓存超过5秒钟没有发送,则将buf中的文件发送给迁移控制模块; 
(4)所述迁移控制模块根据策略要求的介质类型选择磁盘,发送给迁移模块; 
(5)所述迁移模块迁移完成后通知元数据模块修改文件信息。 
本发明提供的第六优选技术方案中,所述步骤(4)中,对所述分级策略进行维护的方法包括:增加、删除、修改分级策略。 
与现有技术相比,本发明的有益效果在于: 
本发明提供的技术方案可以满足多种分级存储需要,具有非常好的可扩展性。分级策略针对目录设置,具有非常好的灵活性,可以满足不同目录的不同分级需求。 
附图说明
图1是分级存储模块流程图 
图2是分级存储策略结构图 
具体实施方式
下面结合附图对本发明作进一步详细说明。 
如图1所示,实现分级存储的方法,具体步骤如下: 
(1)元数据服务模块向策略分析模块提供文件信息; 
(2)策略分析模块分析存储系统内的所有分级策略,查看策略对应的文件是否满足策略要求,将不满足策略要求的待迁移文件发送到迁移控制模块; 
(3)迁移控制模块根据策略要求需要选择新的存储介质,并将所接收到的待迁移文件发送给迁移模块迁移至新的存储介质; 
(4)通过管理模块进行分级策略维护后,在人机交互界面上显示维护结果。 
如图2所示,分级策略包括策略适用的目录、策略要求的目标介质类型和策略组;若所述目标介质类型为多个,则迁移时优先选择排在前面的介质类型;所述策略组包括若干个策略单元,每个策略单元对应一种分级要求,策略单元包括一个valid字段和该单元的具体内容(阈值),若valid字段为1表示该策略单元对该策略有效,为0表示无效。如果一个策略的多个策 略单元valid字段为1则表示该策略是一个组合策略。 
策略分析模块包括三类线程:dispatch、scan和worker,采用多线程流水方式实现策略分级。 
多线程流水方式的具体步骤如下: 
(1)所述dispatch获取当前系统所有分级的策略,合并策略涉及到的目录,并将目录投递到scan全局队列; 
(2)所述scan线程从scan队列获取一个目录后开始调用函数readdir进行扫描,若是子目录则将子目录投递到scan队列的队头,若是文件则将其投递到队列最短的worker线程队列; 
(3)所述worker线程从队列获取文件后通过函数ioctl获取文件的访问时间、大小和当前所在磁盘的信息,与当前系统策略进行匹配,找到匹配策略后,若发现当前文件的介质类型与策略不符则将文件及策略要求的目标介质类型存放到一个buf,若buf达到768byte的缓存或者缓存超过5秒钟没有发送,则将buf中的文件发送给迁移控制模块; 
(4)所述迁移控制模块根据策略要求的介质类型选择磁盘,发送给迁移模块; 
(5)所述迁移模块迁移完成后通知元数据模块修改文件信息。 
为了防止上次任务没有完成前dispatch线程就再次投递目录,scan队列即worker队列的在任务产生时抓一个全局引用计数,任务处理完成后释放计数,dispatch线程等计数为0时才可开始下一次投递。 
假设目录/mnt/parastor/example下大小在0-1024byte并且访问修改时间在0-60s之间(即最近一分钟有访问或修改)的文件则迁移到ssd介质上。这种策略组织方式具有很好的可扩展性,若有新的分级需求,则增加一个策 略单元即可。 
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员在其启发下依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。 

Claims (7)

1.一种分级存储方法,该方法包括如下步骤:
(1)元数据服务模块向策略分析模块提供文件信息;
(2)策略分析模块分析存储系统内的所有分级策略,查看策略对应的文件是否满足策略要求,将不满足策略要求的待迁移文件发送到迁移控制模块;
(3)迁移控制模块根据分级策略要求需要选择新的存储介质,并将所接收到的待迁移文件发送给迁移模块迁移至新的存储介质;
(4)通过管理模块进行分级策略维护后,在人机交互界面上显示维护结果。
2.根据权利要求1所述分级存储方法,其特征在于,该方法进一步包括如下步骤:
(5)当用户需要对分级策略进行更新时,则通过人机交互界面更新存储系统内的分级策略,并跳转至步骤(2)由策略分析模块重新分析存储系统内更新后的分级策略。
3.根据权利要求2所述分级存储方法,其特征在于,对分级策略进行更新的方法包括:增加、删除、修改分级策略。
4.根据权利要求1所述分级存储方法,其特征在于,所述分级策略包括策略适用的目录、策略要求的目标存储介质类型和策略组;若所述目标介质类型为多个,按介质类型的排列顺序迁移;所述策略组包括的策略单元中的每一策略单元对应一种分级要求,策略单元包括一个valid字段和该单元的具体内容,若valid字段为1表示该策略单元对该策略有效,为0表示无效。
5.根据权利要求1所述分级存储方法,其特征在于,所述策略分析模块包括三类线程:dispatch、scan和worker,采用多线程流水方式实现策略分级。
6.根据权利要求5所述分级存储方法,其特征在于,多线程流水方式的具体步骤如下:
(1)所述dispatch获取当前系统所有分级的策略,合并策略涉及到的目录,并将目录投递到scan全局队列;
(2)所述scan线程从scan队列获取一个目录后开始调用函数readdir进行扫描,若是子目录则将子目录投递到scan线程的队列,若是文件则将其投递到队列最短的worker线程队列;
(3)所述worker线程从队列获取文件后通过函数ioctl获取文件的访问时间、大小和当前所在磁盘的信息,与当前系统策略进行匹配,找到匹配策略后,若发现当前文件的介质类型与策略不符,则将文件及策略要求的目标介质类型存放到一个buf,若buf达到768byte的缓存或者缓存超过5秒钟没有发送,则将buf中的文件发送给迁移控制模块;
(4)所述迁移控制模块根据策略要求的介质类型选择磁盘,发送给迁移模块;
(5)所述迁移模块迁移完成后通知元数据模块修改文件信息。
7.根据权利要求1所述分级存储方法,其特征在于,所述步骤(4)中,对所述分级策略进行维护的方法包括:增加、删除、修改分级策略。
CN201410603327.8A 2014-10-30 2014-10-30 一种分级存储方法 Active CN104407987B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410603327.8A CN104407987B (zh) 2014-10-30 2014-10-30 一种分级存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410603327.8A CN104407987B (zh) 2014-10-30 2014-10-30 一种分级存储方法

Publications (2)

Publication Number Publication Date
CN104407987A true CN104407987A (zh) 2015-03-11
CN104407987B CN104407987B (zh) 2018-10-23

Family

ID=52645620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410603327.8A Active CN104407987B (zh) 2014-10-30 2014-10-30 一种分级存储方法

Country Status (1)

Country Link
CN (1) CN104407987B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110119251A (zh) * 2019-05-14 2019-08-13 北京杰思安全科技有限公司 一种基于磁盘大流量的缓冲控制方法和系统
CN110515947A (zh) * 2019-08-23 2019-11-29 苏州浪潮智能科技有限公司 一种存储系统
CN114253473A (zh) * 2021-11-30 2022-03-29 海南大学 数据处理方法、装置和医学设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521419A (zh) * 2011-12-31 2012-06-27 曙光信息产业股份有限公司 分级存储的实现方法和系统
CN103631931A (zh) * 2013-12-06 2014-03-12 浪潮(北京)电子信息产业有限公司 一种数据分级存储方法及系统
US20140082028A1 (en) * 2011-06-27 2014-03-20 Amazon Technologies, Inc. System and method for implementing a scalable data storage service

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140082028A1 (en) * 2011-06-27 2014-03-20 Amazon Technologies, Inc. System and method for implementing a scalable data storage service
CN102521419A (zh) * 2011-12-31 2012-06-27 曙光信息产业股份有限公司 分级存储的实现方法和系统
CN103631931A (zh) * 2013-12-06 2014-03-12 浪潮(北京)电子信息产业有限公司 一种数据分级存储方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110119251A (zh) * 2019-05-14 2019-08-13 北京杰思安全科技有限公司 一种基于磁盘大流量的缓冲控制方法和系统
CN110119251B (zh) * 2019-05-14 2023-01-03 北京杰思安全科技有限公司 一种基于磁盘大流量的缓冲控制方法和系统
CN110515947A (zh) * 2019-08-23 2019-11-29 苏州浪潮智能科技有限公司 一种存储系统
CN114253473A (zh) * 2021-11-30 2022-03-29 海南大学 数据处理方法、装置和医学设备

Also Published As

Publication number Publication date
CN104407987B (zh) 2018-10-23

Similar Documents

Publication Publication Date Title
US11245759B2 (en) Consolidated processing of storage-array commands by a snapshot-control media agent
US11061714B2 (en) System for assignment of proxies for virtual-machine secondary copy operations
US11238173B2 (en) Automated intelligent provisioning of data storage resources in response to user requests in a data storage management system
US10712946B2 (en) Hybrid drive caching in a backup system with SSD deletion management
US10891197B2 (en) Consolidated processing of storage-array commands using a forwarder media agent in conjunction with a snapshot-control media agent
US10496442B2 (en) Job management and resource allocation in a data protection system
US10915255B2 (en) Restore of secondary data using thread pooling
US11816063B2 (en) Automatic archiving of data store log data
US9823978B2 (en) User-level quota management of data objects stored in information management systems
US10956051B2 (en) Data-packed storage containers for streamlined access and migration
US10891266B2 (en) File handling in a hierarchical storage system
CN104407987A (zh) 一种分级存储的方法
CN104199926B (zh) 文件归档实现方法和装置以及文件访问方法和装置
US20140279926A1 (en) Active archive bridge

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230920

Address after: 300451 floor 3, No. 15, Haitai Huake street, Huayuan Industrial Zone (outside the ring), Binhai New Area, Tianjin

Patentee after: Tianjin Zhongke Shuguang Storage Technology Co.,Ltd.

Address before: 300384 Xiqing District, Tianjin Huayuan Industrial Zone (outside the ring) 15 1-3, hahihuayu street.

Patentee before: DAWNING INFORMATION INDUSTRY Co.,Ltd.