CN111427844A - 一种面向文件分级存储的数据迁移系统及方法 - Google Patents

一种面向文件分级存储的数据迁移系统及方法 Download PDF

Info

Publication number
CN111427844A
CN111427844A CN202010296769.8A CN202010296769A CN111427844A CN 111427844 A CN111427844 A CN 111427844A CN 202010296769 A CN202010296769 A CN 202010296769A CN 111427844 A CN111427844 A CN 111427844A
Authority
CN
China
Prior art keywords
data
file
cold
migration
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010296769.8A
Other languages
English (en)
Other versions
CN111427844B (zh
Inventor
陈宏宇
王亚强
刘魁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Cheng Xin High Tech Information Technology Co ltd
Chengdu University of Information Technology
Original Assignee
Chengdu Cheng Xin High Tech Information Technology Co ltd
Chengdu University of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Cheng Xin High Tech Information Technology Co ltd, Chengdu University of Information Technology filed Critical Chengdu Cheng Xin High Tech Information Technology Co ltd
Priority to CN202010296769.8A priority Critical patent/CN111427844B/zh
Publication of CN111427844A publication Critical patent/CN111427844A/zh
Application granted granted Critical
Publication of CN111427844B publication Critical patent/CN111427844B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/119Details of migration of file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/1824Distributed file systems implemented using Network-attached Storage [NAS] architecture
    • G06F16/183Provision of network file services by network file servers, e.g. by using NFS, CIFS
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种面向文件分级存储的数据迁移系统及方法,根据周期内文件的访问次数和最近访问时间为依据对文件进行冷热程度的判别;并在数据的性质由潜热数据转变为潜冷数据时引发真正的文件迁移;包括迁移速率控制和数据迁移的控制流程。本发明通过数据冷热程度算法对数据性质进行分类,并通过计算时间长度确定负载状态,达到通过内部的数据存储调度和迁移调度,以及在业务场景下的数据自动评估方法,实现系统中数据的自动迁移,从而达到在降低数据存储成本的同时保证数据访问的高性能访问的发明目的。

Description

一种面向文件分级存储的数据迁移系统及方法
技术领域
本发明涉及计算机领域,主要涉及一种面向文件分级存储的数据迁移系统及方法。
背景技术
随着网络技术的发展,数据存储服务器分为两类:高速存储服务器和低速存储服务器,而系统中存储的数据则分为四类:热数据、潜热数据、潜冷数据以及冷数据。高速存储服务器上存储的是热数据和潜热数据,低速存储服务器上存储的是潜冷数据和冷数据。
热数据指的是周期内被访问较为频繁的数据;冷数据指的是周期内较少被访问的数据;潜热数据指的是存储在高速存储服务器上、周期内被访问的次数相较于热数据较少或频率较低的数据;潜冷数据指的是存储在低速存储上、周期内被访问次数相较于冷数据来说较多或频率较高的数据。数据的冷热变化顺序为:热数据->潜热数据->潜冷数据->冷数据。一般地,数据性质逐级递增或递减,特殊情况下可能会发生越级变化。其中,数据的性质由潜热数据转变为潜冷数据时才会引发真正的文件迁移,而数据的性质在热数据和潜热数据、冷数据和潜冷数据之间的转换不会引起实质上的文件迁移,只是改变了文件元数据中的相应的字段。
因此,依据文件访问的局部性和不同存储设备的特性和应用场景,可以构建一种多级的存储系统。将经常访问的文件存储在高性能的存储设备中,以提高新能,将不经常访问的文件存储在价格低廉的大容量存储设备中,以节约成本。
目前存在的主要问题:分层存储系统可以基于阵列、存储虚拟化和文件系统实现。不同的实现方式具有不同的特点。基于阵列和存储虚拟化的实现方式迁移粒度较小,往往为子 LUN级别或块级别,且也具有较好的性能,但是应用范围较小,不具有兼容性。
发明内容
针对现有技术中存在的问题,本发明旨在发明一种面向文件分级存储的数据迁移系统及方法,其中:
一种面向文件分级存储的数据迁移系统,其特征在于,包括:元数据服务器,用于管理存储服务器上所有文件的元数据,以及文件的存储和迁移调度;据存储服务器,用于存储文件内容的服务器,通过冷热程度算法对数据进行冷热程度判别;其中,数据存储服务器存储的数据,包括热数据、潜热数据、潜冷数据和冷数据;所述的热数据指的是周期内被访问较为频繁的数据;冷数据指的是周期内较少被访问的数据;潜热数据指的是存储在高速存储服务器上、周期内被访问的次数相较于热数据较少或频率较低的数据;潜冷数据指的是存储在低速存储上、周期内被访问次数相较于冷数据来说较多或频率较高的数据。
进一步的,所述的数据存储服务器,包括高性能存储服务器和低速存储服务器,其中,高性能存储服务器用于保证经常访问的文件读写的高性能,从而保证系统的整体性能,由性能较高的新型存储设备组成;低速存储服务器用于管理系统中不经常访问的文件的存储以及文件的备份、归档,从而降低系统的整体存储成本。
进一步的,所述的高性能存储服务器,存储热数据和潜热数据。
进一步的,所述的低速存储服务器,存储潜冷数据和冷数据。
进一步的,所述的元数据服务器,包括FTP服务器、数据存储调度器和数据迁移调度器。
进一步的,所述的元数据服务器,通过对ApacheFTPServer的改造,实现为上层应用程序提供了一个系统全局统一的透明性视图,并通过Redis将所有文件的元数据缓存在DRAM 中,加速文件索引。
进一步的,所述的元数据服务器,通过使用标准的FTP接口连接经过改造的FTPServer,对系统中HPS和LCS上的所有文件进行直接访问。
进一步的,所述的冷热程度算法,根据周期内文件的访问次数和最近访问时间为依据对文件进行冷热程度的判别;
数据冷热程度表达式如下:
Figure BDA0002452477600000021
其中,D表示数据冷热程度;T表示设定的周期,根据实际业务来设定的;Lat表示文件最近访问时间,N是周期内该文件的访问次数,由系统监控记录,在每个周期结束后清零;通过计算出的数据冷热程度与数据性质的阈值对比,即可判别数据的性质。
一种面向文件分级存储的数据迁移方法,其特征在于,包括以下步骤:
S1.通过冷热程度算法对存储数据的性质进行分类;
S2.判断存储数据的性质是否发生变化;
S3进行文件迁移。
进一步的,所述的步骤S1,根据周期内文件的访问次数和最近访问时间为依据对文件进行冷热程度的判别;
数据冷热程度表达式如下:
Figure BDA0002452477600000022
其中,D表示数据冷热程度;T表示设定的周期,根据实际业务来设定的;Lat表示文件最近访问时间,N是周期内该文件的访问次数,由系统监控记录,在每个周期结束后清零;通过计算出的数据冷热程度与数据性质的阈值对比,即可判别数据的性质。
进一步的,所述的步骤S2,根据数据性质逐级递增或递减顺序,数据的冷热变化顺序为:热数据->潜热数据->潜冷数据->冷数据;
数据的性质由潜热数据转变为潜冷数据时,引发真正的文件迁移;
数据的性质在热数据和潜热数据、冷数据和潜冷数据之间的转换,改变了文件元数据中的相应的字段,不会引发实质上的文件迁移。
进一步的,所述的步骤S3,通过迁移速率控制,对文件迁移进行控制,具体如下:
计算数据迁移应该等待的时间长度;
W=E×(L-T)
其中W表示时间长度;E是一个常数;L表示I/O队列长度;T表示设置的阈值;E和T的值依据实际情况设定。
本发明的有益效果:
(1)按照周期内访问次数对数据进行分类;
(2)根据计算时间长度判定前端负载状态;
(3)降低数据存储成本的同时保证数据访问的高性能访问。
附图说明
图1是本发明的不同性质数据的分布图;
图2是本发明的系统架构图;
图3是本发明的FTPMDS技术架构图。
具体实施方式
为了对发明的技术特征、目的和效果有更加清楚的理解,先对照附图说明本发明的具体实施方式。
一种面向文件分级存储的数据迁移系统,其特征在于,包括:元数据服务器,用于管理存储服务器上所有文件的元数据,以及文件的存储和迁移调度;据存储服务器,用于存储文件内容的服务器,通过冷热程度算法对数据进行冷热程度判别;其中,数据存储服务器存储的数据,包括热数据、潜热数据、潜冷数据和冷数据;所述的热数据指的是周期内被访问较为频繁的数据;冷数据指的是周期内较少被访问的数据;潜热数据指的是存储在高速存储服务器上、周期内被访问的次数相较于热数据较少或频率较低的数据;潜冷数据指的是存储在低速存储上、周期内被访问次数相较于冷数据来说较多或频率较高的数据。
进一步的,所述的数据存储服务器,包括高性能存储服务器和低速存储服务器,其中,高性能存储服务器用于保证经常访问的文件读写的高性能,从而保证系统的整体性能,由性能较高的新型存储设备组成;低速存储服务器用于管理系统中不经常访问的文件的存储以及文件的备份、归档,从而降低系统的整体存储成本。
进一步的,所述的高性能存储服务器,存储热数据和潜热数据。
进一步的,所述的低速存储服务器,存储潜冷数据和冷数据。
进一步的,所述的元数据服务器,包括FTP服务器、数据存储调度器和数据迁移调度器。
进一步的,所述的元数据服务器,通过对ApacheFTPServer的改造,实现为上层应用程序提供了一个系统全局统一的透明性视图,并通过Redis将所有文件的元数据缓存在DRAM 中,加速文件索引。
进一步的,所述的元数据服务器,通过使用标准的FTP接口连接经过改造的FTPServer,对系统中HPS和LCS上的所有文件进行直接访问。
进一步的,所述的冷热程度算法,根据周期内文件的访问次数和最近访问时间为依据对文件进行冷热程度的判别;
数据冷热程度表达式如下:
Figure BDA0002452477600000041
其中,D表示数据冷热程度;T表示设定的周期,根据实际业务来设定的;Lat表示文件最近访问时间,N是周期内该文件的访问次数,由系统监控记录,在每个周期结束后清零;通过计算出的数据冷热程度与数据性质的阈值对比,即可判别数据的性质。
一种面向文件分级存储的数据迁移方法,其特征在于,包括以下步骤:
S1.通过冷热程度算法对存储数据的性质进行分类;
S2.判断存储数据的性质是否发生变化;
S3进行文件迁移。
进一步的,所述的步骤S1,根据周期内文件的访问次数和最近访问时间为依据对文件进行冷热程度的判别;
数据冷热程度表达式如下:
Figure BDA0002452477600000042
其中,D表示数据冷热程度;T表示设定的周期,根据实际业务来设定的;Lat表示文件最近访问时间,N是周期内该文件的访问次数,由系统监控记录,在每个周期结束后清零;通过计算出的数据冷热程度与数据性质的阈值对比,即可判别数据的性质。
进一步的,所述的步骤S2,根据数据性质逐级递增或递减顺序,数据的冷热变化顺序为:热数据->潜热数据->潜冷数据->冷数据;
数据的性质由潜热数据转变为潜冷数据时,引发真正的文件迁移;
数据的性质在热数据和潜热数据、冷数据和潜冷数据之间的转换,改变了文件元数据中的相应的字段,不会引发实质上的文件迁移。
进一步的,所述的步骤S3,通过迁移速率控制,对文件迁移进行控制,具体如下:
计算数据迁移应该等待的时间长度;
W=E×(L-T)
其中W表示时间长度;E是一个常数;L表示I/O队列长度;T表示设置的阈值;E和T的值依据实际情况设定。
以下结合附图描述根本发明实施例的一种面向文件分级存储的数据迁移系统及方法:
图1是根据本发明实例中,不同性质数据的分布图。数据存储服务器分为两类:高速存储服务器和低速存储服务器,而系统中存储的数据则分为四类:热数据、潜热数据、潜冷数据以及冷数据。高速存储服务器上存储的是热数据和潜热数据,低速存储服务器上存储的是潜冷数据和冷数据。
热数据指的是周期内被访问较为频繁的数据;冷数据指的是周期内较少被访问的数据;潜热数据指的是存储在高速存储服务器上、周期内被访问的次数相较于热数据较少或频率较低的数据;潜冷数据指的是存储在低速存储上、周期内被访问次数相较于冷数据来说较多或频率较高的数据。数据的冷热变化顺序为:热数据->潜热数据->潜冷数据->冷数据。一般地,数据性质逐级递增或递减,特殊情况下可能会发生越级变化。其中,数据的性质由潜热数据转变为潜冷数据时才会引发真正的文件迁移,而数据的性质在热数据和潜热数据、冷数据和潜冷数据之间的转换不会引起实质上的文件迁移,只是改变了文件元数据中的相应的字段。
目前的阶段中,我们只根据周期内文件的访问次数和最近访问时间为依据对文件进行冷热程度的判别。数据冷人程度D的计算公式如下:
D=Lat/T×N
其中,T是设定的周期,是一个经验值或根据实际业务来设定的;Lat是文件最近访问时间,N是周期内该文件的访问次数,由系统监控记录,在每个周期结束后清零。根据计算出的数据冷热程度与数据性质的阈值对比,即可判别数据的性质。
图2是本发明的系统架构图。以ApacheFTPServer为基础进行分布式存储系统的改造,我们将该分布式分级存储系统称作HK-HSM。
HK-HSM系统由一个改造后的FTP服务器和若干数据存储服务器(DSS,DataStorage Server)组成,数据存储服务器包括了高性能存储服务器HPS和低速存储服务器LCS。FTP 服务器经过改造后作为元数据管理服务器MDS,用于数据的接收,然后直接转发给存储服务器进行数据的存储。元数据服务器可以配置一个备份节点以避免单点故障,存储服务器可以根据业务需求自由地进行横向扩展,通过更改配置文件,元数据服务器可以对扩展的存储服务器进行识别和判断。数据从收集到分布式存储系统的存储一共经历一次转发操作和一次持久化写操作。数据的收集利用FTP提供的通用接口,在接入后进入FTPDS系统的处理流程,经过分布式消息队列以及负载均衡处理后,向存储服务器进行数据写入请求派发,存储服务器收到数据写入请求后可进行数据存储。
图3是根据本发明实例中,MDS上Apache FTPServer的改造示意图,即FTPMDS结构示意图。如图1所示,FTPDS提供和FTP服务一样的数据读写接口,也提供了系统中所有文件的透明性统一视图。FTPDS中MDS主要分为五个模块:FTP分发器,日志引擎,元数据管理,相应的业务处理和系统监控。其中元数据管理模块包括了对文件和文件夹元数据信息的管理以及系统的命名空间的管理;FTP分发器包括了数据的接收、处理、传播和迁移;日志引擎包括了操作日志、监控日志、检查点日志等;系统监控模块用于监控各存储节点的使用情况、IO情况等。FTP分发器主要的技术点在于对数据的统一调度技术,统一调度技术中主要包含了数据存储调度器和数据迁移调度器,存储调度器是在数据从收集到入库的过程中对数据存储的调度以及在数据迁移时对数据在相同层级的服务器间的存储调度;迁移调度器是协同存储调度器负责整个系统的负载均衡的。存储调度器负责的是整个系统中数据的高可用性以及数据存储的负载均衡;而迁移调度器负责的是数据的高性能访问以及协同存储调度器实现数据存储的可扩展性。
由于存储系统中I/O访问负载的不确定性,系统使用逻辑上开/关两种状态来调整数据迁移速度。文件迁移进行与否,是依据数据管理客户端中前端应用的负载来确定的。如果前端负载相对较低,则进行数据迁移,如果负载过高,则对文件迁移进行限制。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (12)

1.一种面向文件分级存储的数据迁移系统,其特征在于,包括:
元数据服务器,用于管理存储服务器上所有文件的元数据,以及文件的存储和迁移调度;
数据存储服务器,用于存储文件内容的服务器,通过冷热程度算法对数据进行冷热程度判别;其中,数据存储服务器存储的数据,包括热数据、潜热数据、潜冷数据和冷数据;所述的热数据指的是周期内被访问较为频繁的数据;冷数据指的是周期内较少被访问的数据;潜热数据指的是存储在高速存储服务器上、周期内被访问的次数相较于热数据较少或频率较低的数据;潜冷数据指的是存储在低速存储上、周期内被访问次数相较于冷数据来说较多或频率较高的数据。
2.根据权利要求1所述的一种面向文件分级存储的数据迁移系统,其特征在于,所述的数据存储服务器,包括高性能存储服务器和低速存储服务器,其中,高性能存储服务器用于保证经常访问的文件读写的高性能,从而保证系统的整体性能,由性能较高的新型存储设备组成;低速存储服务器用于管理系统中不经常访问的文件的存储以及文件的备份、归档,从而降低系统的整体存储成本。
3.根据权利要求2所述的一种面向文件分级存储的数据迁移系统,其特征在于,所述的高性能存储服务器,存储热数据和潜热数据。
4.根据权利要求2所述的一种面向文件分级存储的数据迁移系统,其特征在于,所述的低速存储服务器,存储潜冷数据和冷数据。
5.根据权利要求1所述的一种面向文件分级存储的数据迁移系统,其特征在于,所述的元数据服务器,包括FTP服务器、数据存储调度器和数据迁移调度器。
6.根据权利要求1所述的一种面向文件分级存储的数据迁移系统,其特征在于,所述的元数据服务器,通过对Apache FTPServer的改造,实现为上层应用程序提供了一个系统全局统一的透明性视图,并通过Redis将所有文件的元数据缓存在DRAM中,加速文件索引。
7.根据权利要求1所述的一种面向文件分级存储的数据迁移系统,其特征在于,所述的元数据服务器,通过使用标准的FTP接口连接经过改造的FTPServer,对系统中HPS和LCS上的所有文件进行直接访问。
8.根据权利要求1所述的一种面向文件分级存储的数据迁移系统,其特征在于,所述的冷热程度算法,根据周期内文件的访问次数和最近访问时间为依据对文件进行冷热程度的判别;数据冷热程度表达式如下:
Figure FDA0002452477590000011
其中,D表示数据冷热程度;T表示设定的周期,根据实际业务来设定的;Lat表示文件最近访问时间,N是周期内该文件的访问次数,由系统监控记录,在每个周期结束后清零;
通过计算出的数据冷热程度与数据性质的阈值对比,即可判别数据的性质。
9.一种面向文件分级存储的数据迁移方法,其特征在于,包括以下步骤:
S1.通过冷热程度算法对存储数据的性质进行分类;
S2.判断存储数据的性质是否发生变化;
S3进行文件迁移。
10.根据权利要求9所述的一种面向文件分级存储的数据迁移方法,其特征在于,所述的步骤S1,根据周期内文件的访问次数和最近访问时间为依据对文件进行冷热程度的判别;
数据冷热程度表达式如下:
Figure FDA0002452477590000021
其中,D表示数据冷热程度;T表示设定的周期,根据实际业务来设定的;Lat表示文件最近访问时间,N是周期内该文件的访问次数,由系统监控记录,在每个周期结束后清零;
通过计算出的数据冷热程度与数据性质的阈值对比,即可判别数据的性质。
11.根据权利要求9所述的一种面向文件分级存储的数据迁移方法,其特征在于,所述的步骤S2,根据数据性质逐级递增或递减顺序,数据的冷热变化顺序为:热数据->潜热数据->潜冷数据->冷数据;
数据的性质由潜热数据转变为潜冷数据时,引发真正的文件迁移;
数据的性质在热数据和潜热数据、冷数据和潜冷数据之间的转换,改变了文件元数据中的相应的字段,不会引发实质上的文件迁移。
12.根据权利要求9所述的一种面向文件分级存储的数据迁移方法,其特征在于,所述的步骤S3,通过迁移速率控制,对文件迁移进行控制,具体如下:
计算数据迁移应该等待的时间长度;
W=E×(L-T)
其中W表示时间长度;E是一个常数;L表示I/O队列长度;T表示设置的阈值;E和T的值依据实际情况设定。
CN202010296769.8A 2020-04-15 2020-04-15 一种面向文件分级存储的数据迁移系统及方法 Active CN111427844B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010296769.8A CN111427844B (zh) 2020-04-15 2020-04-15 一种面向文件分级存储的数据迁移系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010296769.8A CN111427844B (zh) 2020-04-15 2020-04-15 一种面向文件分级存储的数据迁移系统及方法

Publications (2)

Publication Number Publication Date
CN111427844A true CN111427844A (zh) 2020-07-17
CN111427844B CN111427844B (zh) 2023-05-19

Family

ID=71556418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010296769.8A Active CN111427844B (zh) 2020-04-15 2020-04-15 一种面向文件分级存储的数据迁移系统及方法

Country Status (1)

Country Link
CN (1) CN111427844B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112395262A (zh) * 2020-11-17 2021-02-23 江苏普旭软件信息技术有限公司 一种基于大数据平台审计日志的用户行为分析方法及系统
CN112860520A (zh) * 2021-02-23 2021-05-28 合肥大多数信息科技有限公司 一种基于人工智能的信息数据格式化组件
CN112948398A (zh) * 2021-04-29 2021-06-11 电子科技大学 一种面向冷热数据的分级存储系统及方法
CN112947860A (zh) * 2021-03-03 2021-06-11 成都信息工程大学 一种分布式数据副本的分级存储与调度方法
CN113296696A (zh) * 2021-03-02 2021-08-24 阿里巴巴新加坡控股有限公司 一种数据的访问方法、计算设备及存储介质
CN113515238A (zh) * 2021-07-27 2021-10-19 华云数据控股集团有限公司 一种基于分层存储的数据调度方法、系统及电子设备
CN113760176A (zh) * 2020-12-02 2021-12-07 北京沃东天骏信息技术有限公司 数据存储方法和装置
CN113835615A (zh) * 2020-09-17 2021-12-24 北京焱融科技有限公司 一种基于分布式文件存储的智能分层方法和系统
CN116661685A (zh) * 2023-05-18 2023-08-29 清华大学 业务行为感知的对象存储元数据分级存储方法与系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989999A (zh) * 2010-11-12 2011-03-23 华中科技大学 一种分布式环境中的分级存储系统
CN104516678A (zh) * 2013-09-29 2015-04-15 国际商业机器公司 用于数据存储的方法和设备
CN105917318A (zh) * 2012-07-24 2016-08-31 英特尔公司 用于实现基于ssd的i/o高速缓存的系统和方法
CN107621927A (zh) * 2017-09-29 2018-01-23 南京宏海科技有限公司 一种基于超融合系统的纵向扩展方法及其装置
CN107943867A (zh) * 2017-11-10 2018-04-20 中国电子科技集团公司第三十二研究所 支持异构存储的高性能层次化存储系统
US20180357160A1 (en) * 2017-06-12 2018-12-13 Western Digital Technologies, Inc. System and method of direct write and mapping of data in a non-volatile memory having multiple sub-drives
CN109871367A (zh) * 2019-02-28 2019-06-11 江苏实达迪美数据处理有限公司 一种基于Redis和HBase的分布式冷热数据分离方法
US10409516B1 (en) * 2018-01-12 2019-09-10 EMC IP Holding Company LLC Positional indexing for a tiered data storage system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989999A (zh) * 2010-11-12 2011-03-23 华中科技大学 一种分布式环境中的分级存储系统
CN105917318A (zh) * 2012-07-24 2016-08-31 英特尔公司 用于实现基于ssd的i/o高速缓存的系统和方法
CN104516678A (zh) * 2013-09-29 2015-04-15 国际商业机器公司 用于数据存储的方法和设备
US20180357160A1 (en) * 2017-06-12 2018-12-13 Western Digital Technologies, Inc. System and method of direct write and mapping of data in a non-volatile memory having multiple sub-drives
CN107621927A (zh) * 2017-09-29 2018-01-23 南京宏海科技有限公司 一种基于超融合系统的纵向扩展方法及其装置
CN107943867A (zh) * 2017-11-10 2018-04-20 中国电子科技集团公司第三十二研究所 支持异构存储的高性能层次化存储系统
US10409516B1 (en) * 2018-01-12 2019-09-10 EMC IP Holding Company LLC Positional indexing for a tiered data storage system
CN109871367A (zh) * 2019-02-28 2019-06-11 江苏实达迪美数据处理有限公司 一种基于Redis和HBase的分布式冷热数据分离方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HONGPING SHU等: ""Empirical Study of Transactional Management for Persistent Memory"" *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113835615A (zh) * 2020-09-17 2021-12-24 北京焱融科技有限公司 一种基于分布式文件存储的智能分层方法和系统
CN112395262A (zh) * 2020-11-17 2021-02-23 江苏普旭软件信息技术有限公司 一种基于大数据平台审计日志的用户行为分析方法及系统
CN113760176A (zh) * 2020-12-02 2021-12-07 北京沃东天骏信息技术有限公司 数据存储方法和装置
CN112860520A (zh) * 2021-02-23 2021-05-28 合肥大多数信息科技有限公司 一种基于人工智能的信息数据格式化组件
CN113296696A (zh) * 2021-03-02 2021-08-24 阿里巴巴新加坡控股有限公司 一种数据的访问方法、计算设备及存储介质
CN112947860A (zh) * 2021-03-03 2021-06-11 成都信息工程大学 一种分布式数据副本的分级存储与调度方法
CN112948398A (zh) * 2021-04-29 2021-06-11 电子科技大学 一种面向冷热数据的分级存储系统及方法
CN113515238A (zh) * 2021-07-27 2021-10-19 华云数据控股集团有限公司 一种基于分层存储的数据调度方法、系统及电子设备
CN113515238B (zh) * 2021-07-27 2024-02-06 华云数据控股集团有限公司 一种基于分层存储的数据调度方法、系统及电子设备
CN116661685A (zh) * 2023-05-18 2023-08-29 清华大学 业务行为感知的对象存储元数据分级存储方法与系统

Also Published As

Publication number Publication date
CN111427844B (zh) 2023-05-19

Similar Documents

Publication Publication Date Title
CN111427844A (zh) 一种面向文件分级存储的数据迁移系统及方法
CN107168657B (zh) 一种基于分布式块存储的虚拟磁盘分层缓存设计方法
CN105653591B (zh) 一种工业实时数据分级存储及迁移方法
Cheng et al. Erms: An elastic replication management system for hdfs
US9286006B2 (en) Systems and methods for scheduling deduplication of a storage system
CN100571281C (zh) 海量数据分级存储方法
CN103399713B (zh) 平衡多级存储性能与固态硬盘寿命的数据缓冲方法
US8352517B2 (en) Infrastructure for spilling pages to a persistent store
CN102117248A (zh) 一种缓存系统和在缓存系统中缓存数据的方法
CN112947860B (zh) 一种分布式数据副本的分级存储与调度方法
CN107273200B (zh) 一种针对异构存储的任务调度方法
US11080207B2 (en) Caching framework for big-data engines in the cloud
CN112579528B (zh) 嵌入式网络文件系统服务器端高效率文件访问的方法
CN110362277B (zh) 基于混合存储系统的数据分类存储方法
CN111984191A (zh) 一种支持分布式存储的多客户端缓存方法及系统
Otoo et al. Disk cache replacement algorithm for storage resource managers in data grids
CN108776690B (zh) 基于分层治理的hdfs分布式与集中式混合数据存储系统的方法
US10037271B1 (en) Data-temperature-based control of buffer cache memory in a database system
Zhou et al. Improving big data storage performance in hybrid environment
KR101686346B1 (ko) 하이브리드 ssd 기반 하둡 분산파일 시스템의 콜드 데이터 축출방법
Pan et al. Penalty-and locality-aware memory allocation in Redis using enhanced AET
Selvi et al. Popularity (hit rate) based replica creation for enhancing the availability in cloud storage
CN112711564B (zh) 合并处理方法以及相关设备
CN108537719A (zh) 一种提高通用图形处理器性能的系统及方法
US11809733B2 (en) Systems and methods for object migration in storage devices

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant