CN103473335A - 一种热点数据检测方法及装置 - Google Patents

一种热点数据检测方法及装置 Download PDF

Info

Publication number
CN103473335A
CN103473335A CN2013104305875A CN201310430587A CN103473335A CN 103473335 A CN103473335 A CN 103473335A CN 2013104305875 A CN2013104305875 A CN 2013104305875A CN 201310430587 A CN201310430587 A CN 201310430587A CN 103473335 A CN103473335 A CN 103473335A
Authority
CN
China
Prior art keywords
data block
data
read
write
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013104305875A
Other languages
English (en)
Other versions
CN103473335B (zh
Inventor
李伟国
吕烁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201310430587.5A priority Critical patent/CN103473335B/zh
Publication of CN103473335A publication Critical patent/CN103473335A/zh
Application granted granted Critical
Publication of CN103473335B publication Critical patent/CN103473335B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种热点数据检测方法及装置,该方法包括:根据数据块k与一个或多个数据块的相关系数以及数据块k的读写频次确定数据块k的价值,所述相关系数表示两个数据块之间的读写关联程度;根据所述数据块k的价值及预先设定的数据迁移策略确定所述数据块k是否为热点数据。本发明根据数据块的相关系数确定数据块的价值,根据数据块的价值确定数据块是否为热点数据,能使热点数据检测比传统方法更加精准与可靠,增强数据迁移的效率,在不增加硬件成本的前提下,实现了热点数据按价值高低在磁盘内磁道与外磁道进行迁移,能有效提高磁盘的访问性能,从而极大提高磁盘阵列的整体性能。

Description

一种热点数据检测方法及装置
技术领域
本发明涉及磁盘阵列领域,尤其涉及一种热点数据检测方法及装置。
背景技术
在实际应用中对大容量存储的需求促使RAID(Redundant Arrays ofInexpensive Disks,磁盘阵列)技术诞生,并形成了磁盘阵列产品。随着云计算、云存储等技术的不断发展,信息存储容量呈爆炸式增长,磁盘阵列的需求日益扩大,存储系统作为一种共享资源,需要同时向多种不同类型的应用提供服务,这些不同类型的应用具有不同的负载特征和性能需求,许多应用在访问存储系统时,对随机IO并发性有很高的要求。为了满足应用的要求,提高存储系统的每秒钟处理IO请求(I/O per second,IOPS)的能力,引入了热点数据迁移、二级缓存等新技术,但这些技术都依赖于热点数据识别技术。
现有的热点数据识别技术主要包括,将存储区域划分为若干数据块,对所有数据块做精细化统计,统计每个数据块被访问的次数,根据被访问的次数计算被访问的频率,再根据数据块的被访问的频率判断其是否是热点数据区域。
在现有的方法中,只考虑了访问的频率,在实际的应用中由于应用数据读写的相关性,只单纯地考虑IO频繁程度和块粒度具有一定的局限性。
发明内容
本发明要解决的技术问题是提供一种热点数据检测方法及装置,能够使热点数据检测更加精准与可靠,增强数据迁移的的效率。
为解决上述技术问题,本发明的一种热点数据检测方法,包括:
根据数据块k与一个或多个数据块的相关系数以及数据块k的读写频次确定数据块k的价值,所述相关系数表示两个数据块之间的读写关联程度;
根据所述数据块k的价值及预先设定的数据迁移策略确定所述数据块k是否为热点数据。
进一步地,所述根据数据块k与一个或多个数据块的相关系数以及数据块k的读写频次确定数据块k的价值,包括:
根据
Figure BDA0000384173870000021
确定数据块k的价值,其中,RLkj为数据块k与数据块j的相关系数,M为与数据块k相关的数据块的数量,Wi和Ri分别为数据块k在第i时间段的写频次和读频次,Pi为数据块k第i时间段的平均读写粒度,N为时间段的总数量。
进一步地,所述RLkj为根据
Figure BDA0000384173870000022
确定,其中,Qk为数据块k的读写次数向量,表示为Qk(qk1,qk2,....qkN),Qk中的元素表示数据块k在第i时间段的写频次与读频次之和,Qj为数据块j的读写次数向量,表示为Qj(qj1,qj2,....qjN),Qj中的元素表示数据块j在第i时间段的写频次与读频次之和。
进一步地,在确定数据块k的价值前,判断所述数据块k与所述一个或多个数据块是否具有相关性,包括:判断两数据块在每个时间段上是否具有相同的读写变化。
进一步地,所述判断两数据块在每个时间段上是否具有相同的读写变化,包括:
对两数据块的操作标记向量进行匹配,所述操作标记向量为N维,操作标记向量的元素表示数据块在相应时间段上是否有读/写操作,如果两数据块的操作标记向量的每个元素均匹配,则判断两数据块具有相同的读写变化。
进一步地,所述方法还包括:
在确定数据块k的价值前,截取应用的IO请求,确定请求读写的数据块,统计数据块的读写频次,按照数据块的读写频次更新数据块的读写次数向量,并更新数据块的操作标记向量。
进一步地,一种热点数据检测装置,包括:热点数据关联度计算模块和策略模块,其中:
所述热点数据关联度计算模块,用于根据数据块k与一个或多个数据块的相关系数以及数据块k的读写频次确定数据块k的价值,所述相关系数表示两个数据块之间的读写关联程度;
所述策略模块,用于根据所述数据块k的价值及预先设定的数据迁移策略确定所述数据块k是否为热点数据。
进一步地,所述热点数据关联度计算模块根据数据块k与一个或多个数据块的相关系数以及数据块k的读写频次确定数据块k的价值,包括:
根据
Figure BDA0000384173870000031
确定数据块k的价值,其中,RLkj为数据块k与数据块j的相关系数,M为与数据块k相关的数据块的数量,Wi和Ri分别为数据块k在第i时间段的写频次和读频次,Pi为数据块k第i时间段的平均读写粒度,N为时间段的总数量。
进一步地,所述热点数据关联度计算模块根据确定所述RLkj,其中,Qk为数据块k的读写次数向量,表示为Qk(qk1,qk2,....qkN),Qk中的元素表示数据块k在第i时间段的写频次与读频次之和,Qj为数据块j的读写次数向量,表示为Qj(qj1,qj2,....qjN),Qj中的元素表示数据块j在第i时间段的写频次与读频次之和。
进一步地,还包括IO截获模块,其中:
所述热点数据关联度计算模块在确定数据块k的价值前,判断所述数据块k与所述一个或多个数据块是否具有相关性,包括:对两数据块的操作标记向量进行匹配,所述操作标记向量为N维,操作标记向量的元素表示数据块在相应时间段上是否有读/写操作,如果两数据块的操作标记向量的每个元素均匹配,则判断两数据块具有相同的读写变化;
所述IO截获模块,用于在确定数据块k的价值前,截取应用的IO请求,确定请求读写的数据块,统计数据块的读写频次,按照数据块的读写频次更新数据块的读写次数向量,并更新数据块的操作标记向量。
综上所述,本发明根据数据块的相关系数确定数据块的价值,根据数据块的价值确定数据块是否为热点数据,能使热点数据检测比传统方法更加精准与可靠,增强数据迁移的的效率,在不增加硬件成本的前提下,实现了热点数据按价值高低在磁盘内磁道与外磁道进行迁移,能有效提高磁盘的访问性能,从而极大提高磁盘阵列的整体性能。
附图说明
图1为本发明实施方式的热点数据检测方法的流程图;
图2为本发明实施方式的热点数据检测装置的架构图。
具体实施方式
本申请中考虑到,比如,在图书馆管理应用中,首次录入包括书名、出版年月和编号等信息,在具体的图书借阅活动中,记录了借书人的姓名、书名和编号等,以后每次查询本书的使用时,同时会索引出借书人的信息,这样此两类数据便存在了关联,本申请中在识别热点数据时,考虑数据之间的相关性。
本申请中考虑数据块之间的相关性,如数据块A、数据块B、数据块C及数据块D有相同的访问频率,而数据块A和数据块B之间具有相关性,如在访问数据块A时也会访问到数据块B,则认为数据块A和数据块B的优先级会更高,迁移时会优先将数据块A和数据块B迁移,从而可以指导分层存储策略,通过对多个数据块之间相关性的评估,预测存储系统整体的变化趋势,进而提前更准确地确定数据迁移对象和迁移范围,避免反复迁移等系统震荡现象的发生,提高存储管理的自主性和智能性。
本申请中通过考察数据块之间的关联性,确定存储系统中的热点数据,从而确定数据迁移对象,能够使迁移范围更准确,本申请采用具有预测性的分层存储策略,避免了反复迁移等颠簸现象的发生,使得自动分层更具有智能性和自主性。本申请中数据块之间的关联性是指某一数据块在以某种规律或特性被读写的时间段内,另外的一个或几个数据块上也呈现出相同的读写规律或特性。
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,申请中的实施例及实施例中的特征可以相互任意组合。
为实现本实施方式的热点数据检测方法,需要截取来自应用的IO请求,获得请求读写的数据块的大小、偏移量以及读写类型,进行数据块读写频次和数据块大小的统计分析,按照数据块的读写频次更新数据块的读写次数向量,并更新数据块的操作标记向量。
本实施方式中采用Q表示数据块的读写次数向量,表示为Q(q1,q2,....qN),Q中的元素表示数据块在第i(i取1~N)时间段的写频次与读频次之和。
操作标记向量可以采用F表示,F为N维,操作标记向量的元素表示数据块在相应时间段上是否有读/写操作。
可以根据硬件定时器或者软件定时器,定期截取IO请求,统计读写频次,将每个数据块的读写频次记录在数据块的读写次数向量,并更新操作标记向量F。
如图1所示,本实施方式的热点数据检测方法,包括:
步骤101:计算数据块k与一个或多个数据块的相关系数;
数据块之间的相关系数,是衡量两个数据块,如数据块k和数据块j之间的读写关联程度的数学模型,用RLkj表示,当数据块k在时间区间T上的任意第i时间段内有读写操作时,在数据块j上也有读写操作时,则认为数据块j和数据块k相关。
相关系数的计算方法如下:
根据确定RLkj,其中,Qk为数据块k的读写次数向量,读写次数向量Qk(qk1,qk2,....qkN)记录数据块k在时间区间[t-B*l,t]上的读写情况,其中qki表示在第i时间段内的读频次与写频次之和,Qj为数据块j的读写次数向量,读写次数向量Qj表示为Qj(qj1,qj2,....qjN),Qj中的元素qji表示数据块j在第i时间段的写频次与读频次之和。
RL kj = Q k · Q j | Q k | | Q j | 中的 Q k · Q j = Σ i = 1 N q ki q ji , | Q k | = Σ i = 1 N q ki 2 , | Q j | = Σ i = 1 N q ji 2 .
步骤102:根据数据块k与一个或多个数据块的相关系数以及数据块k的读写频次确定数据块k的价值;
数据块的价值模型如下:
其中,Vt(k)表示数据块k在t时刻的价值,M为与数据块k相关的数据块的数量,,Wi和Ri分别表示数据块k在第i时间段的写频次和读频次,Pi为数据块k在第i时间段的平均读写粒度,N为时间段的总数量。在评价时间区间内,如果一个数据块有M个相关联的数据块,则将所有的M个相关系数之和作为该数据块价值的一个评价因子。
步骤103:根据数据块k的价值及预先设定的数据迁移策略确定数据块k是否为热点数据。
数据迁移策略中可以配置价值阈值,在数据块k的价值大于价值阈值时,确定数据块k为热点数据;否则,确定数据块k不为热点数据。
数据迁移策略还可以包含数据迁移的时机以及数据迁移的位置等。在确定数据块k为热点数据后,可以按照数据迁移策略将数据块k在数据迁移策略指示的时间迁移到数据迁移策略指示的位置。
例如,可以将热点数据写到磁盘外圈上,将“冷”数据迁移到磁盘内圈上,来合理保存数据的分布。
不仅如此,本实施方式中,在确定数据块k的价值前,还可以判断数据块k与要计算相关系数的一个或多个数据块是否具有相关性,虽然,两个数据块的相关系数是根据读写次数向量计算,但判断两数据块是否具有相关性,即是否需要计算相关系数的依据是在指定的时间区间内的各个时间段上两数据块是否具有相同的读写变化。
本实施方式中判断两数据块在每个时间段上是否具有相同的读写变化,包括:对两数据块的操作标记向量进行匹配,如果两数据块的操作标记向量的每个元素均匹配,则判断两数据块具有相同的读写变化。
在截获IO请求后,为数据块在操作标记向量F中标记相应时间段的读写操作的有无,进而在时间区间T上,每个数据块获得一个N维的操作标记向量F,例如,若在任意的第i(i=1,2,......,N)时间段上有读/写操作就将该操作标记向量的第i维标记为1,否则标记为0,通过对数据块k和数据块j各自对应的操作标记向量F(Fk和Fj)按维做同或运算(Fk异或Fj),当结果向量为全1时,则说明数据块k和数据块j相关联,需要进一步求解相关系数。
如图2所示,本实施方式的热点数据检测装置,包括:IO截获模块、热点数据关联度计算模块、策略模块和数据写入模块等,其中:
热点数据关联度计算模块,用于计算数据块k与一个或多个数据块的相关系数,根据相关系数以及数据块k的读写频次确定数据块k的价值;
数据块之间的相关系数,是衡量两个数据块,如数据块k和数据块j之间的读写关联程度的数学模型,用RLkj表示,当数据块k在时间区间T上的任意第i时间段内有读写操作时,在数据块j上也有读写操作时,则认为数据块j和数据块k相关。
热点数据关联度计算模块计算相关系数的方法如下:
根据
Figure BDA0000384173870000071
确定RLkj,其中,Qk为数据块k的读写次数向量,读写次数向量Qk(qk1,qk2,....qkN)记录数据块k在时间区间[t-B*l,t]上的读写情况,其中qki表示在第i时间段内的读频次与写频次之和,Qj为数据块j的读写次数向量,读写次数向量Qj表示为Qj(qj1,qj2,....qjN),Qj中的元素qji表示数据块j在第i时间段的写频次与读频次之和。
RL kj = Q k · Q j | Q k | | Q j | 中的 Q k · Q j = Σ i = 1 N q ki q ji , | Q k | = Σ i = 1 N q ki 2 , | Q j | = Σ i = 1 N q ji 2 .
热点数据关联度计算模块根据相关系数以及数据块k的读写频次确定数据块k的价值,包括:
根据
Figure BDA0000384173870000081
其中,Vt(k)表示数据块k在t时刻的价值,M为与数据块k相关的数据块的数量,Wi和Ri分别表示数据块k在第i时间段的写频次和读频次,Pi为数据块k在第i时间段的平均读写粒度,N为时间段的总数量。在评价时间区间内,如果一个数据块有M个相关联的数据块,则将所有的M个相关系数之和作为该数据块价值的一个评价因子。
策略模块,用于设定数据迁移策略以及IO截获的频率、时间段i的长度等,根据数据块k的价值及预先设定的数据迁移策略确定数据块k是否为热点数据。
数据迁移策略中可以配置价值阈值,在数据块k的价值大于价值阈值时,确定数据块k为热点数据;否则,确定数据块k不为热点数据。
数据迁移策略还可以包含数据迁移的时机以及数据迁移的位置等。在确定数据块k为热点数据后,可以按照数据迁移策略将数据块k在数据迁移策略指示的时间迁移到数据迁移策略指示的位置。
IO截获模块,用以截获来自上层应用的IO请求,并获取对应的数据块的大小、偏移量以及读写类型,进行数据块读写频次和数据块大小统计分析,按照数据块的读写频次更新数据块的读写次数向量,并更新数据块的操作标记向量。
数据写入模块,用于根据数据迁移策略将热点数据写入磁盘的内圈或者外圈。当进行迁移时,数据写入模块用来将数据写入到不同的存储介质中。
该装置还可以包含用户配置模块,用于对策略模块进行配置,如设置数据迁移策略以及IO截获的频率、时间段i的长度等。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现,相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本申请不限制于任何特定形式的硬件和软件的结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种热点数据检测方法,包括:
根据数据块k与一个或多个数据块的相关系数以及数据块k的读写频次确定数据块k的价值,所述相关系数表示两个数据块之间的读写关联程度;
根据所述数据块k的价值及预先设定的数据迁移策略确定所述数据块k是否为热点数据。
2.如权利要求1所述的方法,其特征在于,所述根据数据块k与一个或多个数据块的相关系数以及数据块k的读写频次确定数据块k的价值,包括:
根据
Figure FDA0000384173860000011
确定数据块k的价值,其中,RLkj为数据块k与数据块j的相关系数,M为与数据块k相关的数据块的数量,Wi和Ri分别为数据块k在第i时间段的写频次和读频次,Pi为数据块k第i时间段的平均读写粒度,N为时间段的总数量。
3.如权利要求2所述的方法,其特征在于:
所述RLkj为根据确定,其中,Qk为数据块k的读写次数向量,表示为Qk(qk1,qk2,....qkN),Qk中的元素表示数据块k在第i时间段的写频次与读频次之和,Qj为数据块j的读写次数向量,表示为Qj(qj1,qj2,....qjN),Qj中的元素表示数据块j在第i时间段的写频次与读频次之和。
4.如权利要求3所述的方法,其特征在于:
在确定数据块k的价值前,判断所述数据块k与所述一个或多个数据块是否具有相关性,包括:判断两数据块在每个时间段上是否具有相同的读写变化。
5.如权利要求4所述的方法,其特征在于,所述判断两数据块在每个时间段上是否具有相同的读写变化,包括:
对两数据块的操作标记向量进行匹配,所述操作标记向量为N维,操作标记向量的元素表示数据块在相应时间段上是否有读/写操作,如果两数据块的操作标记向量的每个元素均匹配,则判断两数据块具有相同的读写变化。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
在确定数据块k的价值前,截取应用的IO请求,确定请求读写的数据块,统计数据块的读写频次,按照数据块的读写频次更新数据块的读写次数向量,并更新数据块的操作标记向量。
7.一种热点数据检测装置,包括:热点数据关联度计算模块和策略模块,其中:
所述热点数据关联度计算模块,用于根据数据块k与一个或多个数据块的相关系数以及数据块k的读写频次确定数据块k的价值,所述相关系数表示两个数据块之间的读写关联程度;
所述策略模块,用于根据所述数据块k的价值及预先设定的数据迁移策略确定所述数据块k是否为热点数据。
8.如权利要求7所述的装置,其特征在于:
所述热点数据关联度计算模块根据数据块k与一个或多个数据块的相关系数以及数据块k的读写频次确定数据块k的价值,包括:
根据
Figure FDA0000384173860000021
确定数据块k的价值,其中,RLkj为数据块k与数据块j的相关系数,M为与数据块k相关的数据块的数量,Wi和Ri分别为数据块k在第i时间段的写频次和读频次,Pi为数据块k第i时间段的平均读写粒度,N为时间段的总数量。
9.如权利要求8所述的装置,其特征在于:
所述热点数据关联度计算模块根据
Figure FDA0000384173860000022
确定所述RLkj,其中,Qk为数据块k的读写次数向量,表示为Qk(qk1,qk2,....qkN),Qk中的元素表示数据块k在第i时间段的写频次与读频次之和,Qj为数据块j的读写次数向量,表示为Qj(qj1,qj2,....qjN),Qj中的元素表示数据块j在第i时间段的写频次与读频次之和。
10.如权利要求9所述的装置,其特征在于,还包括IO截获模块,其中:
所述热点数据关联度计算模块在确定数据块k的价值前,判断所述数据块k与所述一个或多个数据块是否具有相关性,包括:对两数据块的操作标记向量进行匹配,所述操作标记向量为N维,操作标记向量的元素表示数据块在相应时间段上是否有读/写操作,如果两数据块的操作标记向量的每个元素均匹配,则判断两数据块具有相同的读写变化;
所述IO截获模块,用于在确定数据块k的价值前,截取应用的IO请求,确定请求读写的数据块,统计数据块的读写频次,按照数据块的读写频次更新数据块的读写次数向量,并更新数据块的操作标记向量。
CN201310430587.5A 2013-09-18 2013-09-18 一种热点数据检测方法及装置 Active CN103473335B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310430587.5A CN103473335B (zh) 2013-09-18 2013-09-18 一种热点数据检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310430587.5A CN103473335B (zh) 2013-09-18 2013-09-18 一种热点数据检测方法及装置

Publications (2)

Publication Number Publication Date
CN103473335A true CN103473335A (zh) 2013-12-25
CN103473335B CN103473335B (zh) 2016-08-17

Family

ID=49798183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310430587.5A Active CN103473335B (zh) 2013-09-18 2013-09-18 一种热点数据检测方法及装置

Country Status (1)

Country Link
CN (1) CN103473335B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447062A (zh) * 2014-09-30 2016-03-30 中国电信股份有限公司 热点数据识别方法和装置
CN105493024A (zh) * 2014-11-28 2016-04-13 华为技术有限公司 一种数据阈值预测方法与相关装置
CN106202070A (zh) * 2015-04-29 2016-12-07 中国电信股份有限公司 文件存储处理方法与系统
CN106709068A (zh) * 2017-01-22 2017-05-24 郑州云海信息技术有限公司 一种热点数据识别方法及其装置
CN106775461A (zh) * 2016-11-30 2017-05-31 华为技术有限公司 热点数据确定方法、设备及装置
EP3195103A1 (en) * 2014-09-15 2017-07-26 Microsoft Technology Licensing, LLC Online data movement without compromising data integrity
CN107368364A (zh) * 2017-07-24 2017-11-21 郑州云海信息技术有限公司 基于Linux noop调度算法的读写方法及装置
CN107463514A (zh) * 2017-08-16 2017-12-12 郑州云海信息技术有限公司 一种数据存储方法及装置
CN107728938A (zh) * 2017-09-18 2018-02-23 暨南大学 一种低能耗集群环境下基于频度关联的冷数据放置策略
CN108268211A (zh) * 2017-01-03 2018-07-10 中国移动通信有限公司研究院 一种数据处理方法及装置
CN111095864A (zh) * 2017-09-25 2020-05-01 联邦印刷有限公司 数据微粒结构和防篡改存储数据的方法
CN111881346A (zh) * 2020-07-15 2020-11-03 北京浪潮数据技术有限公司 一种热点数据的识别方法、系统及相关装置
CN112230860A (zh) * 2020-10-23 2021-01-15 苏州浪潮智能科技有限公司 一种提高数据分层效率的方法及装置
CN113504881A (zh) * 2021-09-13 2021-10-15 飞狐信息技术(天津)有限公司 热点数据的处理方法、客户端、目标计算设备及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6742080B1 (en) * 1996-09-06 2004-05-25 Intel Corporation Disk block allocation optimization methodology and application
CN101788995A (zh) * 2009-12-31 2010-07-28 成都市华为赛门铁克科技有限公司 一种热点数据识别方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6742080B1 (en) * 1996-09-06 2004-05-25 Intel Corporation Disk block allocation optimization methodology and application
CN101788995A (zh) * 2009-12-31 2010-07-28 成都市华为赛门铁克科技有限公司 一种热点数据识别方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋丽娜等: "基于海量数据存储系统多级存储介质的热点数据区分方法", 《计算机研究与发展》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3195103A1 (en) * 2014-09-15 2017-07-26 Microsoft Technology Licensing, LLC Online data movement without compromising data integrity
CN105447062A (zh) * 2014-09-30 2016-03-30 中国电信股份有限公司 热点数据识别方法和装置
CN105493024A (zh) * 2014-11-28 2016-04-13 华为技术有限公司 一种数据阈值预测方法与相关装置
CN106202070A (zh) * 2015-04-29 2016-12-07 中国电信股份有限公司 文件存储处理方法与系统
CN106775461A (zh) * 2016-11-30 2017-05-31 华为技术有限公司 热点数据确定方法、设备及装置
CN108268211A (zh) * 2017-01-03 2018-07-10 中国移动通信有限公司研究院 一种数据处理方法及装置
CN106709068B (zh) * 2017-01-22 2020-11-20 苏州浪潮智能科技有限公司 一种热点数据识别方法及其装置
CN106709068A (zh) * 2017-01-22 2017-05-24 郑州云海信息技术有限公司 一种热点数据识别方法及其装置
CN107368364A (zh) * 2017-07-24 2017-11-21 郑州云海信息技术有限公司 基于Linux noop调度算法的读写方法及装置
CN107463514A (zh) * 2017-08-16 2017-12-12 郑州云海信息技术有限公司 一种数据存储方法及装置
CN107728938A (zh) * 2017-09-18 2018-02-23 暨南大学 一种低能耗集群环境下基于频度关联的冷数据放置策略
CN107728938B (zh) * 2017-09-18 2020-06-16 暨南大学 一种低能耗集群环境下基于频度关联的冷数据放置策略
CN111095864A (zh) * 2017-09-25 2020-05-01 联邦印刷有限公司 数据微粒结构和防篡改存储数据的方法
CN111095864B (zh) * 2017-09-25 2023-06-13 联邦印刷有限公司 防篡改存储数据的方法、电子数据存储系统和电信系统
CN111881346A (zh) * 2020-07-15 2020-11-03 北京浪潮数据技术有限公司 一种热点数据的识别方法、系统及相关装置
CN111881346B (zh) * 2020-07-15 2022-06-17 北京浪潮数据技术有限公司 一种热点数据的识别方法、系统及相关装置
CN112230860A (zh) * 2020-10-23 2021-01-15 苏州浪潮智能科技有限公司 一种提高数据分层效率的方法及装置
CN112230860B (zh) * 2020-10-23 2022-07-22 苏州浪潮智能科技有限公司 一种提高数据分层效率的方法及装置
CN113504881A (zh) * 2021-09-13 2021-10-15 飞狐信息技术(天津)有限公司 热点数据的处理方法、客户端、目标计算设备及装置

Also Published As

Publication number Publication date
CN103473335B (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
CN103473335A (zh) 一种热点数据检测方法及装置
CN106548789B (zh) 用于操作叠瓦式磁记录设备的方法和装置
CN103631538B (zh) 冷热数据识别门限值计算方法、装置和系统
KR100974043B1 (ko) 디스크 데이터 기억 시스템의 유지보수비를 결정하기 위한주문형 비용량성 기반 방법, 장치 및 컴퓨터 프로그램
US9665630B1 (en) Techniques for providing storage hints for use in connection with data movement optimizations
CN103019887B (zh) 数据备份方法及装置
WO2007009910A3 (en) Virtualisation engine and method, system, and computer program product for managing the storage of data
CN103927251A (zh) 一种嵌入式系统的日志管理方法
ATE296464T1 (de) Speichersystem das aus mehreren speichergeräten besteht, mit verschiedenen fehlertoleranten verfahren
CN107291889A (zh) 一种数据存储方法及系统
US9135262B2 (en) Systems and methods for parallel batch processing of write transactions
CN103761059B (zh) 一种用于海量数据管理的多盘位存储方法及系统
CN111367469B (zh) 一种分层存储数据迁移方法和系统
CN110033799A (zh) 基于屏障命令按顺序存储数据的存储设备
CN103577115B (zh) 数据的排布处理方法、装置和服务器
CN103064902A (zh) Hdfs中数据的存储方法、读取方法及存储系统、读取系统
CN103106050A (zh) 一种实现存储系统数据分层存储复制的方法
Wang et al. A new reliability model in replication-based big data storage systems
CN103309820A (zh) 磁盘阵列缓存的实现方法
CN109598156A (zh) 一种写时重定向引擎快照流方法
CN103916459A (zh) 一种大数据归档存储系统
CN104714753A (zh) 一种数据访问存储方法及装置
CN102495834A (zh) 基于内存映像的增量数据清洗方法
CN103729149A (zh) 一种存储数据的方法
CN103645862B (zh) 一种磁盘阵列初始化性能提升方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant