CN103150347A - 基于文件热度的动态副本管理方法 - Google Patents

基于文件热度的动态副本管理方法 Download PDF

Info

Publication number
CN103150347A
CN103150347A CN2013100489282A CN201310048928A CN103150347A CN 103150347 A CN103150347 A CN 103150347A CN 2013100489282 A CN2013100489282 A CN 2013100489282A CN 201310048928 A CN201310048928 A CN 201310048928A CN 103150347 A CN103150347 A CN 103150347A
Authority
CN
China
Prior art keywords
file
temperature
copy
server
formation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100489282A
Other languages
English (en)
Other versions
CN103150347B (zh
Inventor
尹建伟
蒋浩
邓水光
李莹
吴健
吴朝晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201310048928.2A priority Critical patent/CN103150347B/zh
Publication of CN103150347A publication Critical patent/CN103150347A/zh
Application granted granted Critical
Publication of CN103150347B publication Critical patent/CN103150347B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及计算机应用领域,公开了一种基于文件热度的动态副本管理方法,包括主管理服务器、存储服务器集群,所述主管理服务器用于接受用户文件访问请求、更新被访问文件的访问记录,所述存储服务器集群包括多个用于储存文件的存储服务器,具体步骤包括:多频率文件热度计算机制、多队列文件热度更新机制、多频率副本执行机制。本发明的优点在于,有效解决了文件热度的统计周期与统计热度准确性之间的矛盾和用户的突发性访问问题,大幅度减少了系统开支,同时具有较高的可靠性。

Description

基于文件热度的动态副本管理方法
技术领域
本发明涉及计算机应用领域,特别涉及一种基于文件热度的动态副本管理方法。
背景技术
传统的数据存储技术在可扩展性,高可用性等方面远远无法满足当今的数据存储需求,20世纪80年代,分布式文件存储的概念被提出。
分布式文件存储是指一些不一定直接连接在本地节点上的物理存储资源,通过计算机网络与节点相连,被存储系统统一管理,向用户提供统一的、对象化的访问接口,屏蔽对物理设备的直接操作和资源管理。分布式文件存储系统通过分布式的架构支持海量文件数据的存储。通过分布式文件存储,可以将各类存储设备结合使用,提供良好的可扩展的存储服务。相比传统的存储设备,其在扩展性,安全性,可靠性等方面,都有了很大的提升。
在分布式文件存储系统中,文件副本策略的提出,主要是为了解决两个关键的问题:1.保证存储系统的高可用性和高可靠性。2.提升系统的整体性能。
为了解决以上两个问题,系统需要进行两方面的决策:副本数量和副本存放位置。较高的副本数量不仅可以增加系统的可用性和可靠性,而且可以为高效的负载均衡提供有效的支持。但是会增加系统的负担,包括副本传输复制的代价,副本信息维护的代价以及占用系统的存储空间。较低的副本数量可能会降低系统可靠性,甚至有可能带来数据丢失,数据不可用的后果。合理的副本存放位置可以让负载请求均衡到较为空闲的服务器。不合理的副本存放位置可能引发大量的请求集中在某几个存储服务器,造成系统负载失衡。
近年来提出了很多的分布式架构下的文件存储副本管理方案。主要可以分为静态副本管理策略和动态副本管理策略。
静态副本管理策略是指文件在生成的时候就已经决定了文件的数量和文件的存放位置,当系统状态发生改变时,文件的数量和存放位置不会做相应的调整。
动态副本管理策略是指副本的策略会跟着系统的改变而做出相应的调整。这个调整可以是文件数量的调整,也可以是文件存储位置的调整。但是,如何进行动态调整,是增加还是减少副本数,副本的迁移策略以及如何在系统代价和系统性能、可靠性上得到均衡,另外,用户的访问行为有一定的突发性,即用户可以在短时间内大量的发起相似的请求,而且请求维持的时间非常短,在这种情况下,如果创建过多的副本,不但不能提升系统性能,而且还会增加系统的开销。这些都是副本策略的动态调整所面临的巨大挑战。
发明内容
本发明针对现有技术中存在的副本数量和系统性能无法兼顾的缺点,提供了一种通过调整文件的热度来动态地管理文件副本的新型基于文件热度的动态副本管理方法。
为实现上述目的,本发明可采取下述技术方案:
基于文件热度的动态副本管理方法,包括主管理服务器、存储服务器集群,所述主管理服务器用于接受用户文件访问请求、更新被访问文件的访问记录,所述存储服务器集群包括多个用于储存文件的存储服务器,具体步骤包括:
多频率文件热度计算机制:为每一个储存在所述存储服务器上的文件建立热度,所述热度包括四元组(h0,n1,n2,n3)、状态二元组(N,S),其中,n1、n2、n3分别表示上一个统计周期T1、T2、T3中所述文件的被访问次数N,h0表示所述文件上一个统计周期T1的热度值,N表示所述文件的被访问次数,S表示所述文件的热度状态;所述主管理服务器接收一个文件访问请求,将该文件的被访问次数N加1;每隔T1、T2和T3个统计周期,所述主管理服务器更新所述四元组,其中h0的更新方法如下:计算
Figure BDA00002829722700021
f1、f2、f3分别为统计周期T1、T2、T3内所述文件的访问频率,Δti表示当前时间与上一个统计周期T1的统计时刻的差值,Δt1表示当前时刻与零时的差值;分别计算
N 1 = N - n 1 N 2 = N - n 2 N 3 = N - n 3 μ = Δ t 1 T 1 h = ( 1 - μ ) h 0 + μ ( ( N 1 Δ t 1 ) + ( N 2 × f 2 f 1 + N 3 × f 3 f 1 ) / T 1 ) ,
用所述h更新所述四元组的h0
多队列文件热度更新机制:将所述存储服务器中储存的文件分为三个队列:低热度队列LQ、中热度队列MQ、高热度队列HQ,对不同的队列分别采用不同的更新周期进行更新,所述更新周期分别为TL、TM、TH,设定热度阈值Hl、Hh,所述文件的热度值h小于H1则该文件归入低热度队列LQ,所述文件的热度值h大于Hl且小于Hh则该文件归入中热度队列MQ,所述文件的热度值h大于Hh则该文件归入高热度队列HQ;
多频率副本执行机制:设定所述文件的最小副本数Nmin,计算所述文件的副本数量
N F i = ( N min &times; h F i H 1 - N cur ) &times; Sp total - Sp used Sp total , N min h F i H 1 - N cur &GreaterEqual; 0 ( N min &times; h F i H 1 - N cur ) &times; Sp used Sp total , N min h F i H 1 - N cur < 0 ,
其中,
Figure BDA00002829722700033
为所述文件的热度值,Ncur为所述文件当前的副本数量,Sptotal表示所述存储服务器的总存储空间大小,Spused表示所述存储服务器已经使用的存储空间;将负载较低的存储服务器确认为副本放置服务器,将所述文件的副本放置在所述副本放置服务器中。
作为优选,所述多队列文件热度更新机制还包括:所述热度状态S包括5个不同的状态等级,由低到高分别用状态标识{SL2}、{SL1}、{S0}、{SH1}、{SH2}表示;当所述主管理服务器应用所述多队列文件热度更新机制时,如果
Figure BDA00002829722700034
所述热度状态S的状态等级提升一级;如果
Figure BDA00002829722700035
所述热度状态S的状态等级降低一级;所述热度状态的状态等级改变时,如果改变前所述热度状态S为{SH2},则所述文件切换为中热度队列MQ或者高热度队列HQ,如果改变前所述热度状态S为{SL2},则所述文件切换为低热度队列LQ或者中热度队列MQ;所述热度状态S改变后的初始值为{S0}。
作为优选,所述低热度队列LQ中文件的热度状态S为{S0、SH1、SH2},高热度队列HQ中文件的S为{SL2、SL1、S0},中热度队列中MQ中文件的S为{SL2、SL1、S0、SH1、SH2}。
作为优选,多频率副本执行机制还包括:计算所述存储服务器的负载权值,所述存储服务器的负载权值越大则该存储服务器的负载越低。
作为优选,多频率副本执行机制还包括:删除文件副本时,如果所述文件的副本分别储存在多个存储服务器中,优先删除储存在负载权值较小的存储服务器中的文件副本;增加文件副本时,所述主管理服务器随机选定一个储存有文件副本的存储服务器,由该选定的存储服务器向所述副本放置服务器发送所述文件副本。
作为优选,所述统计周期T1、T2、T3为预设值,其中,T3>T2>T1。
作为优选,所述更新周期TL、TM、TH为预设值,其中,TL>TM>TH
作为优选,所述低热度队列LQ中文件的副本数为Nmin且保持不变。
本发明由于采用了以上技术方案,具有显著的技术效果:
本发明通过引入文件热度机制,有效解决了文件热度的统计周期与统计热度准确性之间的矛盾和用户的突发性访问问题。针对不同热度的文件执行不同的更新策略和副本执行策略,大幅度减少了系统开支,提升了系统性能。
进一步地,通过将文件划分为不同的热度队列,采用不同的更新周期,控制不同热度文件的更新频率,低热度的文件较少更新,高热度的文件则具有更高的更新频率,提高了系统性能。同时,限制低热度队列LQ和高热度队列HQ的热度状态S的状态等级,低热度队列LQ中文件的热度状态S为{S0、SH1、SH2},高热度队列HQ中文件的S为{SL2、SL1、S0},提高了切换文件队列的效率。
进一步地,通过计算存储服务器的负载权值来确定服务器的负载,可以保证文件副本储存在负载较低的服务器中,充分利用了系统闲置计算能力,降低了系统的整体反应时间。
在3个统计周期中,统计周期T1最短,统计频率最高,可以由此来计算并确定文件的热度值h0
此外,将低热度队列LQ中文件的副本数量固定为Nmin,由于低热度队列LQ中文件的更新频率较低,因此,固定地确定文件副本的数量,可以减少计算文件副本数量所带来额外的计算量。同时,由于低热度队列LQ中文件更新频率较低,固定文件副本的数量对文件的安全性影响较小。
附图说明
图1为本发明的分布式存储系统的拓扑结构示意图。
图2为本发明所述动态副本管理方法的流程示意图。
图3为文件热度队列的切换示意图。
具体实施方式
下面结合实施例对本发明作进一步的详细描述。
实施例1
基于文件热度的动态副本管理方法,整个系统采用分布式架构,分布式文件存储系统如图1所示,包括主管理服务器1、存储服务器集群2,所述主管理服务器1用于接受用户文件访问请求、更新被访问文件的访问记录,所述存储服务器集群2包括多个用于储存文件的存储服务器3。分布式文件存储系统支持大规模的高并发访问与缓存服务器集群的动态扩展,主管理服务器1通过双机热备,可消除单点故障,主管理服务器1管理存储服务器集群2中的存储节点和存储系统中文件的元数据信息。存储服务器集群2实现动态加载和删除节点的功能,以提供动态可扩展的存储服务,其主要功能是负责数据文件的实际存储。客户端通过与主管理服务器1和存储服务器集群2的通信来实现对文件的操作
本发明的具体流程步骤如图2所示,包括:
多频率文件热度计算机制:
为每一个储存在所述存储服务器3上的文件建立热度,所述热度包括四元组(h0,n1,n2,n3)、状态二元组(N,S),其中,n1、n2、n3分别表示上一个统计周期T1、T2、T3中所述文件的被访问次数N,这里,统计周期T1、T2、T3为预设值,其中,T3>T2>T1,h0表示所述文件上一个统计周期T1的热度值,N表示所述文件的被访问次数,S表示所述文件的热度状态;所述主管理服务器1接收一个文件访问请求,将该文件的被访问次数N加1。
每隔T1、T2和T3个统计周期,所述主管理服务器1更新所述四元组,更新规则是根据不同的周期将N更新到n1,n2,n3中,其中h0的更新方法如下:计算
Figure BDA00002829722700061
f1、f2、f3分别为统计周期T1、T2、T3内所述文件的访问频率,Δti表示当前时间与上一个统计周期T1的统计时刻的差值,如T1=24小时,则最近统计时刻为零时,Δt1表示当前时刻与零时的差值。所以Δt1小于等于T1,Δt2小于等于T2,Δt3小于等于T3。N-ni则表示相应的上次统计时刻至当前时刻的文件的被访问次数。
分别计算
N 1 = N - n 1 N 2 = N - n 2 N 3 = N - n 3 &mu; = &Delta; t 1 T 1 h = ( 1 - &mu; ) h 0 + &mu; ( ( N 1 &Delta; t 1 ) + N 2 &times; f 2 f 1 + N 3 &times; f 3 f 1 ) / T 1 ) ,
计算出当前时刻的N1,N2,N3值,即上一次统计至当前时刻的文件访问次数。计算出当前时刻距离最近一次T1统计时刻的差值与T1周期的比值μ。用所述h更新所述四元组的h0
多队列文件热度更新机制:
在分布式文件存储系统中,所有的文件是一个集合,我们用F表示在此分布式文件存储系统中的所有文件的集合。将所述存储服务器3中储存的文件分为三个队列:低热度队列LQ、中热度队列MQ、高热度队列HQ,F=LQ∪MQ∪HQ。对不同的队列分别采用不同的更新周期进行更新,所述更新周期分别为TL、TM、TH,更新周期TL、TM、TH为预设值,其中,TL>TM>TH。需要说明的是,和统计周期不同,这里的更新周期不涉及文件热度值的计算,而是通过统计得到的热度值确定文件的归属队列。设定热度阈值Hl、Hh,所述文件的热度值h小于H1则该文件归入低热度队列LQ,所述文件的热度值h大于H1且小于Hh则该文件归入中热度队列MQ,所述文件的热度值h大于Hh则该文件归入高热度队列HQ。
分布式文件存储系统中的文件在某一时刻只能属于一个队列,但是,文件可以在不同队列中进行切换,如图3所示,二元组(N,S)中的热度状态S是队列之间切换的主要标志。所述热度状态S包括5个不同的状态等级,由低到高分别用状态标识{SL2}、{SL1}、{S0}、{SH1}、{SH2}表示。其中,所述低热度队列LQ中文件的热度状态S为{S0、SH1、SH2},高热度队列HQ中文件的S为{SL2、SL1、S0},中热度队列中MQ中文件的S为{SL2、SL1、S0、SH1、SH2}。当所述主管理服务器1应用所述多队列文件热度更新机制时,如果
Figure BDA00002829722700071
所述热度状态S的状态等级提升一级;如果
Figure BDA00002829722700072
所述热度状态S的状态等级降低一级;所述热度状态的状态等级改变时,如果改变前所述热度状态S为{SH2},则所述文件切换为中热度队列MQ或者高热度队列HQ,如果改变前所述热度状态S为{SL2},则所述文件切换为低热度队列LQ或者中热度队列MQ;所述热度状态S改变后的初始值一律设定为{S0}。
多频率副本执行机制:
设定所述文件的最小副本数Nmin,低热度队列LQ中文件的副本数为Nmin且保持不变,计算所述文件的副本数量
N F i = ( N min &times; h F i H 1 - N cur ) &times; Sp total - Sp used Sp total , N min h F i H 1 - N cur &GreaterEqual; 0 ( N min &times; h F i H 1 - N cur ) &times; Sp used Sp total , N min h F i H 1 - N cur < 0 ,
其中,为所述文件的热度值,Ncur为所述文件当前的副本数量,Sptotal表示所述存储服务器3的总存储空间大小,Spused表示所述存储服务器3已经使用的存储空间,所以(Sptotal-Spused)/Sptotal表示系统当前剩余可用存储空间的百分比。Spused/Sptotal表示系统当前已使用的存储空间的百分比。
计算所述存储服务器3的负载权值,权值包括CPU、内存、磁盘读写能力、剩余存储空间、网络读写等因素,所述存储服务器3的负载权值越大则该存储服务器3的负载越低。将负载较低的存储服务器3确认为副本放置服务器,将所述文件的副本放置在所述副本放置服务器中。
删除文件副本时,如果所述文件的副本分别储存在多个存储服务器3中,优先删除储存在负载权值较小的存储服务器3中的文件副本。
增加文件副本时,所述主管理服务器1随机选定一个储存有文件副本的存储服务器3,由该选定的存储服务器3向所述副本放置服务器发送所述文件副本。
总之,以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所作的均等变化与修饰,皆应属本发明专利的涵盖范围。

Claims (8)

1.一种基于文件热度的动态副本管理方法,其特征在于,包括主管理服务器(1)、存储服务器集群(2),所述主管理服务器(1)用于接受用户文件访问请求、更新被访问文件的访问记录,所述存储服务器集群(2)包括多个用于储存文件的存储服务器(3),具体步骤包括:
多频率文件热度计算机制:为每一个储存在所述存储服务器(3)上的文件建立热度,所述热度包括四元组(h0,n1,n2,n3)、状态二元组(N,S),其中,n1、n2、n3分别表示上一个统计周期T1、T2、T3中所述文件的被访问次数N,h0表示所述文件上一个统计周期T1的热度值,N表示所述文件的被访问次数,S表示所述文件的热度状态;所述主管理服务器(1)接收一个文件访问请求,将该文件的被访问次数N加1;每隔T1、T2和T3个统计周期,所述主管理服务器(1)更新所述四元组,其中h0的更新方法如下:计算
Figure FDA00002829722600011
f1、f2、f3分别为统计周期T1、T2、T3内所述文件的访问频率,Δti表示当前时间与上一个统计周期T1的统计时刻的差值,Δt1表示当前时刻与零时的差值;分别计算 N 1 = N - n 1 N 2 = N - n 2 N 3 = N - n 3 &mu; = &Delta; t 1 T 1 h = ( 1 - &mu; ) h 0 + &mu; ( ( N 1 &Delta; t 1 ) + ( N 2 &times; f 2 f 1 + N 3 &times; f 3 f 1 ) / T 1 ) , 用所述h更新所述四元组的h0;多队列文件热度更新机制:将所述存储服务器(3)中储存的文件分为三个队列:低热度队列LQ、中热度队列MQ、高热度队列HQ,对不同的队列分别采用不同的更新周期进行更新,所述更新周期分别为TL、TM、TH,设定热度阈值Hl、Hh,所述文件的热度值h小于Hl则该文件归入低热度队列LQ,所述文件的热度值h大于Hl且小于Hh则该文件归入中热度队列MQ,所述文件的热度值h大于Hh则该文件归入高热度队列HQ;多频率副本执行机制:设定所述文件的最小副本数Nmin,计算所述文件的副本数量 N F i = ( N min &times; h F i H 1 - N cur ) &times; Sp total - Sp used Sp total , N min h F i H 1 - N cur &GreaterEqual; 0 ( N min &times; h F i H 1 - N cur ) &times; Sp used Sp total , N min h F i H 1 - N cur < 0 , 其中,
Figure FDA00002829722600022
为所述文件的热度值,Ncur为所述文件当前的副本数量,Sptotal表示所述存储服务器(3)的总存储空间大小,Spused表示所述存储服务器(3)已经使用的存储空间;将负载较低的存储服务器(3)确认为副本放置服务器,将所述文件的副本放置在所述副本放置服务器中。
2.根据权利要求1所述基于文件热度的动态副本管理方法,其特征在于,所述多队列文件热度更新机制还包括:所述热度状态S包括5个不同的状态等级,由低到高分别用状态标识{SL2}、{SL1}、{S0}、{SH1}、{SH2}表示;当所述主管理服务器(1)应用所述多队列文件热度更新机制时,如果
Figure FDA00002829722600023
所述热度状态S的状态等级提升一级;如果
Figure FDA00002829722600024
所述热度状态S的状态等级降低一级;所述热度状态的状态等级改变时,如果改变前所述热度状态S为{SH2},则所述文件切换为中热度队列MQ或者高热度队列HQ,如果改变前所述热度状态S为{SL2},则所述文件切换为低热度队列LQ或者中热度队列MQ;所述热度状态S改变后的初始值为{S0}。
3.根据权利要求2所述基于文件热度的动态副本管理方法,其特征在于,所述低热度队列LQ中文件的热度状态S为{S0、SH1、SH2},高热度队列HQ中文件的S为{SL2、SL1、S0},中热度队列中MQ中文件的S为{SL2、SL1、S0、SH1、SH2}。
4.根据权利要求1所述基于文件热度的动态副本管理方法,其特征在于,多频率副本执行机制还包括:计算所述存储服务器(3)的负载权值,所述存储服务器(3)的负载权值越大则该存储服务器(3)的负载越低。
5.根据权利要求1所述基于文件热度的动态副本管理方法,其特征在于,多频率副本执行机制还包括:删除文件副本时,如果所述文件的副本分别储存在多个存储服务器(3)中,优先删除储存在负载权值较小的存储服务器(3)中的文件副本;增加文件副本时,所述主管理服务器(1)随机选定一个储存有文件副本的存储服务器(3),由该选定的存储服务器(3)向所述副本放置服务器发送所述文件副本。
6.根据权利要求1所述基于文件热度的动态副本管理方法,其特征在于,所述统计周期T1、T2、T3为预设值,其中,T3>T2>T1。
7.根据权利要求1所述基于文件热度的动态副本管理方法,其特征在于,所述更新周期TL、TM、TH为预设值,其中,TL>TM>TH
8.根据权利要求1所述基于文件热度的动态副本管理方法,其特征在于,所述低热度队列LQ中文件的副本数为Nmin且保持不变。
CN201310048928.2A 2013-02-07 2013-02-07 基于文件热度的动态副本管理方法 Active CN103150347B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310048928.2A CN103150347B (zh) 2013-02-07 2013-02-07 基于文件热度的动态副本管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310048928.2A CN103150347B (zh) 2013-02-07 2013-02-07 基于文件热度的动态副本管理方法

Publications (2)

Publication Number Publication Date
CN103150347A true CN103150347A (zh) 2013-06-12
CN103150347B CN103150347B (zh) 2015-10-21

Family

ID=48548425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310048928.2A Active CN103150347B (zh) 2013-02-07 2013-02-07 基于文件热度的动态副本管理方法

Country Status (1)

Country Link
CN (1) CN103150347B (zh)

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103327116A (zh) * 2013-07-05 2013-09-25 山东大学 一种网络文件的动态副本存储方法
CN103428288A (zh) * 2013-08-13 2013-12-04 浙江大学 基于分区状态表和协调节点的副本同步方法
CN103475709A (zh) * 2013-09-09 2013-12-25 国家电网公司 一种面向云计算平台的副本动态控制方法及其系统
CN104869138A (zh) * 2014-02-25 2015-08-26 中国电信股份有限公司 对云存储数据文件副本自动管理的方法与装置
CN105094700A (zh) * 2015-07-15 2015-11-25 浪潮(北京)电子信息产业有限公司 云存储系统中分层存储的数据热度计算方法和装置
CN105577763A (zh) * 2015-12-16 2016-05-11 浪潮(北京)电子信息产业有限公司 一种动态副本一致性维护系统、方法及云存储平台
CN105574153A (zh) * 2015-12-16 2016-05-11 南京信息工程大学 一种基于文件热度分析和K-means的副本放置方法
CN105763585A (zh) * 2014-12-17 2016-07-13 中兴通讯股份有限公司 一种实现数据推送的方法和gslb
CN105827744A (zh) * 2016-06-08 2016-08-03 四川新环佳科技发展有限公司 云存储平台的数据处理方法
CN106294362A (zh) * 2015-05-15 2017-01-04 中兴通讯股份有限公司 一种文件管理的方法、设备和系统
CN106302656A (zh) * 2016-08-01 2017-01-04 成都鼎智汇科技有限公司 云存储平台的医药数据处理方法
CN107302561A (zh) * 2017-05-23 2017-10-27 南京邮电大学 一种云存储系统中热点数据副本放置方法
CN107463606A (zh) * 2017-06-22 2017-12-12 浙江力石科技股份有限公司 一种用于大数据存储系统的数据压缩引擎及方法
CN107728951A (zh) * 2017-10-24 2018-02-23 华中科技大学 一种基于pcm的磨损均衡方法及系统
CN107770259A (zh) * 2017-09-30 2018-03-06 武汉理工大学 基于文件热度和节点负载的副本数量动态调整方法
CN107783720A (zh) * 2016-08-24 2018-03-09 深圳市深信服电子科技有限公司 一种数据均衡方法及存储设备
CN108228106A (zh) * 2017-12-30 2018-06-29 广东技术师范学院 一种成本驱动副本的自适应控制方法
CN108241725A (zh) * 2017-05-24 2018-07-03 新华三大数据技术有限公司 一种数据热度统计系统和方法
CN108416054A (zh) * 2018-03-20 2018-08-17 东北大学 基于文件访问热度的动态hdfs副本个数计算方法
CN108989373A (zh) * 2017-06-02 2018-12-11 华为技术有限公司 访问数据的方法和装置
CN109257403A (zh) * 2017-07-14 2019-01-22 杭州海康威视数字技术股份有限公司 数据存储方法及设备、分布式存储系统
CN109522151A (zh) * 2017-09-15 2019-03-26 北京京东尚科信息技术有限公司 用于数据冗余储存的方法及装置
CN109902797A (zh) * 2019-04-22 2019-06-18 桂林电子科技大学 一种基于蚁群算法的云副本放置方案
CN110351374A (zh) * 2019-07-16 2019-10-18 深圳市网心科技有限公司 一种文件部署方法、装置及设备
WO2020134609A1 (zh) * 2018-12-27 2020-07-02 中兴通讯股份有限公司 数据存储的方法及装置
CN113760870A (zh) * 2020-06-10 2021-12-07 北京沃东天骏信息技术有限公司 业务数据的处理方法、装置及设备
CN114793236A (zh) * 2021-12-14 2022-07-26 合肥哈工轩辕智能科技有限公司 一种高可用性的实时消息分发方法及装置
CN115297122A (zh) * 2022-09-29 2022-11-04 数字江西科技有限公司 基于负载自动监测的政务运维方法和系统
CN115544377A (zh) * 2022-11-25 2022-12-30 浙江星汉信息技术股份有限公司 基于云端存储的档案的热度评估和更新方法
CN117041258A (zh) * 2023-10-09 2023-11-10 中交一公局集团有限公司 一种bim工程信息管理系统
CN117118742A (zh) * 2023-10-16 2023-11-24 思创数码科技股份有限公司 基于访问频率监测的政务数据运营方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101729357A (zh) * 2008-10-14 2010-06-09 华为技术有限公司 媒体文件存储处理与业务处理方法及装置、服务器集群
CN102055650A (zh) * 2009-10-29 2011-05-11 华为技术有限公司 负载均衡方法及系统和管理服务器

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101729357A (zh) * 2008-10-14 2010-06-09 华为技术有限公司 媒体文件存储处理与业务处理方法及装置、服务器集群
CN102055650A (zh) * 2009-10-29 2011-05-11 华为技术有限公司 负载均衡方法及系统和管理服务器

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HAO JIANG: "DALB: A Dynamic Application-sensitive", 《2012 INTERNATIONAL CONFERENCE ON COMPUTER SCIENCE AND SERVICE SYSTEM》, 13 August 2012 (2012-08-13) *
张聪萍,尹建伟: "分布式文件系统的动态负载均衡算法", 《小型微型计算机系统》, vol. 32, no. 7, 31 July 2001 (2001-07-31), pages 1424 - 1426 *

Cited By (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103327116B (zh) * 2013-07-05 2016-06-01 山东大学 一种网络文件的动态副本存储方法
CN103327116A (zh) * 2013-07-05 2013-09-25 山东大学 一种网络文件的动态副本存储方法
CN103428288A (zh) * 2013-08-13 2013-12-04 浙江大学 基于分区状态表和协调节点的副本同步方法
CN103428288B (zh) * 2013-08-13 2016-03-09 浙江大学 基于分区状态表和协调节点的副本同步方法
CN103475709A (zh) * 2013-09-09 2013-12-25 国家电网公司 一种面向云计算平台的副本动态控制方法及其系统
CN103475709B (zh) * 2013-09-09 2017-01-04 国家电网公司 一种面向云计算平台的副本动态控制方法及其系统
CN104869138A (zh) * 2014-02-25 2015-08-26 中国电信股份有限公司 对云存储数据文件副本自动管理的方法与装置
CN104869138B (zh) * 2014-02-25 2018-11-02 中国电信股份有限公司 对云存储数据文件副本自动管理的方法与装置
CN105763585A (zh) * 2014-12-17 2016-07-13 中兴通讯股份有限公司 一种实现数据推送的方法和gslb
CN106294362A (zh) * 2015-05-15 2017-01-04 中兴通讯股份有限公司 一种文件管理的方法、设备和系统
CN105094700A (zh) * 2015-07-15 2015-11-25 浪潮(北京)电子信息产业有限公司 云存储系统中分层存储的数据热度计算方法和装置
CN105094700B (zh) * 2015-07-15 2018-05-01 浪潮(北京)电子信息产业有限公司 云存储系统中分层存储的数据热度计算方法和装置
CN105577763A (zh) * 2015-12-16 2016-05-11 浪潮(北京)电子信息产业有限公司 一种动态副本一致性维护系统、方法及云存储平台
CN105574153A (zh) * 2015-12-16 2016-05-11 南京信息工程大学 一种基于文件热度分析和K-means的副本放置方法
CN105827744A (zh) * 2016-06-08 2016-08-03 四川新环佳科技发展有限公司 云存储平台的数据处理方法
CN106302656A (zh) * 2016-08-01 2017-01-04 成都鼎智汇科技有限公司 云存储平台的医药数据处理方法
CN107783720A (zh) * 2016-08-24 2018-03-09 深圳市深信服电子科技有限公司 一种数据均衡方法及存储设备
CN107302561A (zh) * 2017-05-23 2017-10-27 南京邮电大学 一种云存储系统中热点数据副本放置方法
CN107302561B (zh) * 2017-05-23 2019-08-13 南京邮电大学 一种云存储系统中热点数据副本放置方法
CN108241725A (zh) * 2017-05-24 2018-07-03 新华三大数据技术有限公司 一种数据热度统计系统和方法
CN108241725B (zh) * 2017-05-24 2019-07-05 新华三大数据技术有限公司 一种数据热度统计系统和方法
US10868884B2 (en) 2017-06-02 2020-12-15 Huawei Technologies Co., Ltd. System for determining whether to cache data locally at cache server based on access frequency of edge server
CN108989373B (zh) * 2017-06-02 2020-12-04 华为技术有限公司 访问数据的方法和装置
CN108989373A (zh) * 2017-06-02 2018-12-11 华为技术有限公司 访问数据的方法和装置
CN107463606B (zh) * 2017-06-22 2020-11-13 浙江力石科技股份有限公司 一种用于大数据存储系统的数据压缩引擎及方法
CN107463606A (zh) * 2017-06-22 2017-12-12 浙江力石科技股份有限公司 一种用于大数据存储系统的数据压缩引擎及方法
CN109257403B (zh) * 2017-07-14 2022-01-18 杭州海康威视数字技术股份有限公司 数据存储方法及设备、分布式存储系统
CN109257403A (zh) * 2017-07-14 2019-01-22 杭州海康威视数字技术股份有限公司 数据存储方法及设备、分布式存储系统
CN109522151A (zh) * 2017-09-15 2019-03-26 北京京东尚科信息技术有限公司 用于数据冗余储存的方法及装置
CN107770259A (zh) * 2017-09-30 2018-03-06 武汉理工大学 基于文件热度和节点负载的副本数量动态调整方法
CN107728951B (zh) * 2017-10-24 2019-12-20 华中科技大学 一种基于pcm的磨损均衡方法及系统
CN107728951A (zh) * 2017-10-24 2018-02-23 华中科技大学 一种基于pcm的磨损均衡方法及系统
CN108228106A (zh) * 2017-12-30 2018-06-29 广东技术师范学院 一种成本驱动副本的自适应控制方法
CN108416054A (zh) * 2018-03-20 2018-08-17 东北大学 基于文件访问热度的动态hdfs副本个数计算方法
CN108416054B (zh) * 2018-03-20 2021-10-22 东北大学 基于文件访问热度的动态hdfs副本个数计算方法
WO2020134609A1 (zh) * 2018-12-27 2020-07-02 中兴通讯股份有限公司 数据存储的方法及装置
CN109902797A (zh) * 2019-04-22 2019-06-18 桂林电子科技大学 一种基于蚁群算法的云副本放置方案
CN110351374A (zh) * 2019-07-16 2019-10-18 深圳市网心科技有限公司 一种文件部署方法、装置及设备
CN110351374B (zh) * 2019-07-16 2022-04-01 深圳市网心科技有限公司 一种文件部署方法、装置及设备
CN113760870A (zh) * 2020-06-10 2021-12-07 北京沃东天骏信息技术有限公司 业务数据的处理方法、装置及设备
CN114793236A (zh) * 2021-12-14 2022-07-26 合肥哈工轩辕智能科技有限公司 一种高可用性的实时消息分发方法及装置
CN115297122A (zh) * 2022-09-29 2022-11-04 数字江西科技有限公司 基于负载自动监测的政务运维方法和系统
CN115544377A (zh) * 2022-11-25 2022-12-30 浙江星汉信息技术股份有限公司 基于云端存储的档案的热度评估和更新方法
CN117041258A (zh) * 2023-10-09 2023-11-10 中交一公局集团有限公司 一种bim工程信息管理系统
CN117041258B (zh) * 2023-10-09 2024-01-26 中交一公局集团有限公司 一种bim工程信息管理系统
CN117118742A (zh) * 2023-10-16 2023-11-24 思创数码科技股份有限公司 基于访问频率监测的政务数据运营方法及系统
CN117118742B (zh) * 2023-10-16 2024-01-12 思创数码科技股份有限公司 基于访问频率监测的政务数据运营方法及系统

Also Published As

Publication number Publication date
CN103150347B (zh) 2015-10-21

Similar Documents

Publication Publication Date Title
CN103150347B (zh) 基于文件热度的动态副本管理方法
US11068395B2 (en) Cached volumes at storage gateways
US10387673B2 (en) Fully managed account level blob data encryption in a distributed storage environment
CN103139302B (zh) 考虑负载均衡的实时副本调度方法
US11086898B2 (en) Token-based admission control for replicated writes
TWI733514B (zh) 儲存系統、區塊鏈網路的網路節點以及基於區塊鏈的日誌結構儲存系統
US9268651B1 (en) Efficient recovery of storage gateway cached volumes
US9274956B1 (en) Intelligent cache eviction at storage gateways
CN104023088B (zh) 一种应用于分布式文件系统的存储服务器选择方法
US9559889B1 (en) Cache population optimization for storage gateways
CN102307221A (zh) 一种云存储系统及其实现方法
CN103581332B (zh) HDFS架构及HDFS架构中NameNode节点的压力分解方法
CN103516549B (zh) 一种基于共享对象存储的文件系统元数据日志机制
Zhang et al. Survey of research on big data storage
CN108776758A (zh) 一种雾存储中支持动态所有权管理的块级数据去重方法
Rajalakshmi et al. An improved dynamic data replica selection and placement in cloud
WO2014135011A1 (zh) 数据库系统以及数据同步方法
CN103501319A (zh) 一种低延迟的面向小文件的分布式存储系统
CN108776690B (zh) 基于分层治理的hdfs分布式与集中式混合数据存储系统的方法
CN103428288A (zh) 基于分区状态表和协调节点的副本同步方法
Yu et al. Achieving load-balanced, redundancy-free cluster caching with selective partition
US20150088826A1 (en) Enhanced Performance for Data Duplication
WO2022121387A1 (zh) 数据存储方法、装置、服务器及介质
CN103246716A (zh) 基于对象集群文件系统的对象副本高效管理方法及系统
JP2013004067A (ja) ストレージシステム、ストレージ制御方法、プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20130612

Assignee: Xinhua three Technology Co., Ltd.

Assignor: Zhejiang University

Contract record no.: 2018330000036

Denomination of invention: Dynamic replica management method based on file heat

Granted publication date: 20151021

License type: Common License

Record date: 20180417

EE01 Entry into force of recordation of patent licensing contract