CN103365897A - 一种支持Bigtable数据模型的片段缓存方法 - Google Patents

一种支持Bigtable数据模型的片段缓存方法 Download PDF

Info

Publication number
CN103365897A
CN103365897A CN201210095160XA CN201210095160A CN103365897A CN 103365897 A CN103365897 A CN 103365897A CN 201210095160X A CN201210095160X A CN 201210095160XA CN 201210095160 A CN201210095160 A CN 201210095160A CN 103365897 A CN103365897 A CN 103365897A
Authority
CN
China
Prior art keywords
fragment
spatial cache
data model
row
bigtable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210095160XA
Other languages
English (en)
Inventor
周敏奇
钱卫宁
魏金仙
周傲英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Priority to CN201210095160XA priority Critical patent/CN103365897A/zh
Publication of CN103365897A publication Critical patent/CN103365897A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于数据库技术领域,公开了一种支持Bigtable数据模型的片段缓存方法,主要包括:将服务器的磁盘上存储的行中经常被访问的单元格归并为一组片段,单个片断中的单元格逻辑连续;所述服务器根据所述片段所在行的行关键字,将所述片段存入所述缓存空间。本发明将行中经常被访问的单元格作为片段存放于缓存空间中,且对片段中的单元格数量进行限定,提高缓存空间的利用率,并且能更好地适应社交网络用户邻近性的操作特点。

Description

一种支持Bigtable数据模型的片段缓存方法
技术领域
本发明属数据库技术领域,具体涉及一种支持Bigtable数据模型的片段缓存方法。
背景技术
近年来,开心网、微博等社交网络(social network)呈现蓬勃发展的势头。如何高效地存储与管理社交网络中海量的用户及用户产生的数据,如何有效地提供低延时服务提高用户体验成了学术界和工业界共同关注的热点。谷歌公司于2004年初开始开发并于2005年2月投入使用的Bigtable数据库系统提供了一种灵活高效的解决方案,很快被业界接受并获得广泛研究与使用。Bigtable数据库系统首次提出Bigtable数据模型,即一个稀疏的、分布式的、常驻外存的多维排序映射表(map)。这个映射表依靠行关键字(row key)、列名(column name)和时间戳(timestamp)检索数据(如公式1所示),表中的值都是未经解释的字符数组。
(row: string, column: string, time: int64)-> string   公式1
受Bigtable数据模型的启发,Hbase、Cassandra等数据库系统随后诞生,并部署在Facebook、Twitter等流行社交网站存储与管理海量数据。为方便理解同时也为更好的通用性,下面介绍简化版(不包含column family即列族的介绍)的Bigtable数据模型(以下简称类Bigtable数据模型)中主要概念。在类Bigtable数据模型中,行(row)由行关键字(key)和行的具体内容两部分组成。而行的具体内容又由一个个单元格(cell)拼接而成。每一个单元格有一个名字和具体的值。从列(column)的角度来看,名字相同的单元格属于同一列。不同的列依据列名通过指定的比较器(comparator)排序。需要注意的是,行没有大小的限制,即对一行中单元格的数目不作限制。图1给出用类Bigtable数据模型存储微博转发信息的片段并标注了在此示例中各个概念的代表例子。
由于这些数据库系统广泛地为社交网络服务,而低延时又是社交网络用户体验的关键,学术界和工业界都在致力于提升这些系统的性能。通过将常访问的数据放在内存中以减少磁盘I/O(输入/输出)次数从而提升查询性能,缓存技术(caching)自诞生以来一直被用来加速查询处理(query processing)。考虑到社交网络中的热点现象(如热点人物、热点事件)和内存容量的持续增大,在类Bigtable数据库系统中采用缓存技术会有效减小这些系统查询请求的响应延时。
现有的构建在类Bigtable数据模型上的缓存策略有行缓存(row cache)和行关键字缓存(key cache)两种。其中,行关键字缓存只缓存一个行关键字和它对应的行在磁盘上的位置;行缓存则缓存一个行关键字所对应的整行内容。因为行关键字缓存没有存放行的内容只存放了地址,所以虽然它比较节约缓存空间但最多只能减少一次磁盘寻址,即使命中(hit)对性能的提升也不明显。行缓存如果命中就可以避免磁盘的访问,但行缓存所消耗的空间过大,尤其考虑到类Bigtable数据模型中对行没有大小的限制,如果采用行缓存在很多情况下能够缓存的行的数量不多;此外,实际应用中,一行中的所有单元格未必都会被访问,如微博用户往往只关心最近一段时间内上传的微博内容,一旦选用行缓存会有大量不被访问的单元格被缓存到内存中,大大地降低了内存的有效利用率。
本发明克服了现有技术中缓存空间利用率不高的缺陷,提出一种支持Bigtable数据模型的片段缓存方法。本发明将行中经常被访问的单元格以片段的形式存放于缓存空间中,且对单个片段中的单元格数量进行限定,提高缓存空间的利用率。由于社交网络如微博中,用户浏览了一条微博后点击其相邻微博的可能性远远高过其它微博,所以应用本发明的支持Bigtable数据模型的片段缓存方法更适应这种用户的邻近性行为特点,在社交网络的数据缓存中具有优势。
发明内容
本发明公开了一种支持Bigtable数据模型的片段缓存方法,包括以下步骤:
步骤一:将服务器的磁盘上存储的行中经常被访问的单元格归并为一组片段,单个片断中的单元格逻辑连续。
步骤二:根据所述片段所在行的行关键字进行判断,若所述行关键字已存在于服务器的缓存空间中,则所述服务器将所述片段存入所述缓存空间中行关键字所在的行内;否则,所述服务器将所述片段及其行关键字一并存入所述缓存空间。
本发明方法,进一步包括步骤三:当所述服务器接收到客户的请求时,所述服务器对所述缓存空间内部的数据进行查询或维护操作。
本发明中,所述缓存空间中存放片段缓存的方法包括散列表存储方法和列表存储方法。
本发明中,所述步骤二中,所述行关键字后各片段之间通过比较器根据字典序进行先后排序。
本发明中,所述步骤二与步骤三中,当所述片段中的单元格数量超过设定的阈值时,进一步包括片段分割方法;所述片段分割方法包括如下步骤:
步骤A1:将所述片段分割为单元格数量不高于所述阈值的多个片段;
步骤A2:将所述多个片段依次存入所在的行。
本发明中,所述步骤三中的维护操作包括片段更新操作,当片段因为写操作在磁盘上进行更新时,触发所述缓存空间中所述片段进行更新。
本发明中,所述步骤三中的查询操作包括片段查询方法,所述片段查询方法包括如下步骤:
步骤B1:将向所述服务器发送的请求作为多个片段的集合;
步骤B2:将每个所述片段通过二分查找法在所述缓存空间查找所述片段,若所述片段存在于所述缓存空间中,则将所述片段反馈至所述服务器进行响应;否则所述服务器从所述磁盘空间中获取所述片段进行响应,并根据所述步骤二将所述片段存入所述缓存空间中。
本发明中,所述步骤三中的维护操作包括片段合并方法,所述片段合并方法包括如下步骤:
步骤C:若两个相邻片段的单元格数量之和不高于阈值,则将所述两个相邻片段合并为一个片段。
本发明中,所述步骤三中的维护操作包括片段更新方法,所述片段更新方法包括如下步骤:
步骤D1:当所述缓存空间处于饱和状态且仍有新的片段加入时,根据同一片段访问间隔数与最近访问间隔数为依据,对所有已存储在所述缓存空间中的片段进行判断,将所述同一片段访问间隔数与最近访问间隔数最高的片段进行删除;
步骤D2:将所述新的片段根据所述步骤二存入所述缓存空间。
本发明中,所述同一片段访问间隔数与最近访问间隔数分别参照小引用间隔集合算法获得。
本发明具有以下有益效果:
本发明采用片段缓存,将经常访问的单元格以片段的形式存放于缓存空间中,单个片断中的单元格必须是逻辑连续的,较好地适应了类Bigtable的数据模型,提高了缓存空间的利用率,并且能够提高数据查找的速度。
本发明将逻辑连续的单元格放入一个片段,能够较好地应对社交网络中用户行为邻近性的特点。
本发明在片段查找时采用二分查找法,二分查找法能够较快地定位到待查的片段。
本发明在缓存过程中设定片段中单元格数量的阈值,能够使缓存空间保留尽可能多的常被访问的单元格,有利于提高缓存空间的利用率,有利于减小缓存片段替换带来的不利影响。
本发明利用小引用间隔集合算法(LIRS算法)进行缓存片段的替换,能够最有可能被将来请求访问的数据保留在缓存空间中。
附图说明
图1为现有技术中类Bigtable数据模型的示意图。
图2为本发明支持Bigtable数据模型的片段缓存方法的步骤示意图。
图3为本发明支持Bigtable数据模型的片段缓存方法的缓存结构示意图。
图4为本发明中利用片段分割方法分割片段的步骤示意图。
图5为本发明中片段查询方法的步骤示意图。
图6为本发明参照的小引用间隔集合算法中两个参数的示意图。
具体实施方式
结合以下具体实施例和附图,对本发明作进一步的详细说明,本发明的保护内容不局限于以下实施例。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求书为保护范围。
本发明支持Bigtable数据模型的片段缓存方法,如图2所示,包括以下步骤:
步骤一:将服务器的磁盘上存储的行中经常被访问的单元格作为一组片段,单个片断中的单元格必须是逻辑连续的;
步骤二:根据片段所在行的行关键字进行判断,若行关键字已存在于服务器的缓存空间中,则服务器将片段存入缓存空间中行关键字所在的行内;否则,服务器将片段及其行关键字一并存入缓存空间;
本发明还进一步包括步骤三:当服务器接收到客户的请求时,服务器对缓存空间内部的数据进行查询或维护操作。
缓存空间中存放片段缓存的方法包括散列表存储方法和列表存储方法,如图3所示,在本发明中,存放片段缓存的数据结构为散列表(hash table)和排序列表。散列表的关键码(key)为行关键字,散列表的值(value)为一个排序列表,该列表包含一行中被缓存选中的各个片段,片段间按所含单元格列名排序。
如图3中,行关键字后的各片段之间通过比较器根据字典序进行先后排序。关键字为key1的行被缓存了两个片段,而根据比较器k1n5在k1n1之后,所以k1n5所在的片段排在k1n1所在片段之后。
如图4所示,当片段中的单元格数量超过设定的阈值时,采用片段分割方法将片段分成多个长度符合阈值的片段。片段分割方法包括如下步骤:
步骤A1:将片段分割为单元格数量不高于阈值的多个片段;
步骤A2:将多个片段依次存入所在的行。
如图5所示,步骤三中的查询操作包括片段查询方法,本发明的片段查询方法在处理查询时须先确定查询请求在缓存空间的命中情况,会有“完全命中”、“部分命中”、“没有命中”、“无法判断”四种可能性,片段查询方法包括如下步骤:
步骤B1:将向缓存空间发送的请求作为多个片段的集合;
步骤B2:将每个那段通过二分查找法在缓存空间查找片段,若请求的片段存在于缓存空间中,则将请求的片段反馈至服务器;否则从磁盘获取数据,根据步骤二存入缓存空间中,并将数据反馈至服务器。
步骤三中的维护操作包括片段合并方法,片段合并方法包括如下步骤:
步骤C:若两个相邻片段的单元格数量之和不高于阈值,则将两个相邻片段合并为一个片段。
步骤三中的维护操作还包括片段更新方法,片段更新方法包括如下步骤:
步骤D1:当缓存空间处于饱和状态且仍有新的片段加入时,根据同一片段访问间隔数与最近访问间隔数为依据,对所有已存储在缓存空间中的的缓存片段进行判断,将同一片段访问间隔数与最近访问间隔数最高的片段进行删除。同一片段访问间隔数与最近访问间隔数分别通过LIRS算法(Low Inter-Reference Recency Set Algorithm, 小引用间隔集合算法)获得,如图6所示。
步骤D2:将新的片段根据步骤二存入缓存空间。
上述的片段更新操作,当片段因为写操作在磁盘上进行了更新,在缓存空间中也一并更新该片段。
实施例1:片段缓存存储
本发明中,片段缓存由行关键字和片段组成。存放片段缓存的数据结构为散列表(hash table)和列表。散列表的关键码(key)为行关键字,散列表的值(value)为一个列表,该列表包含一行中被选缓存的各个片段,片段间按照指定的比较器排好序,排序的方法按照字典序。片段缓存的结构如图3所示。
对于一个即将加入片段缓存的目标片段,需先通过其所在行的行关键字判断该行是否已有片段在缓存空间中。如果是,那么将目标片段加入其行关键字所对应的排序列表的合适位置即可;如果此片段所在行尚没有一个片段在缓存空间中,那么需在散列表中新创建一项,该项的关键码为其行关键字,值为一个只含有目标片段的列表。需要注意的是,如果片段过长(片段所含的单元格过多),需通过片段分割方法对该片段进行分割(参照实施例3),再加入缓存空间。
实施例2:缓存片段查询
本发明中,缓存片段的查找主要有两步:先通过目标片段所在行的行关键字确定缓存空间中是否有该行的片段,如果没有,则认为没有找到存片段(miss);如果有,接着在存放该行所有缓存片段的排序列表通过二分查找法确定目标片段是否存在。本发明中,查询处理分以下几种情况讨论:
1)      可以确定请求结果全部被缓存空间命中。假设当前服务器端缓存内容如图3所示,客户端显式请求行关键字为key1列名为n6和n7的单元格数据,服务器端通过key1这个关键码在缓存空间的散列表中找到了相应的列表,接着,在列表中通过二分查找确定请求数据只可能出现在第二个片段:[k1n5:k1v5,k1n6:k1v6,k1n7:k1v7,k1n8:k1v8],进一步查找便找到了n6和n7的数据。这样,直接将这部分数据传输至服务器返回客户端,此查询即处理完毕。参照实施例2,此时第二个片段被视为命中一次。
2)      可以确定请求结果完全不被缓存空间命中。假设当前服务器端缓存内容如图3所示,客户端请求行关键字为key2的列名为n1到n9所有数据,服务器端通过查找缓存空间发现片段缓存散列表中并没有key2的数据,接着,只能通过磁盘I/O获取数据,这些数据返回客户端后,需要放入缓存空间,在片段长度阈值为5的假设下,需要将列名为n1到n9这九个单元格分为两个片段(长度分别为4和5)连同行关键字key2放入缓存空间。这样,此查询处理完毕。
3)      可以确定请求结果部分被缓存空间命中部分未被缓存空间命中。假设当前服务器端缓存内容如图3所示,客户端显式请求行关键字为key3列名为n1,n2,n3的单元格数据,服务器端通过key3这个关键码在片段缓存散列表中找到了相应的列表,接着,在列表中通过二分查找发现n1的数据不在缓存空间中,n2和n3的数据在缓存空间中,对n1的处理参照上述情形2),对n2,n3的处理参照上述情形1),最终将这两部分结果合并返回客户端即处理完了此查询。
4)无法确定请求结果是否被缓存空间完全命中。假设当前服务器端缓存内容如图3所示,客户端请求行关键字为key1从列名为n2的单元格开始往后的四个单元格。此时,服务器端先确定n2在缓存中,但无法判断n3,n4,n5是否在缓存中,因为只知道列名为n5的单元格在列名为n2的单元格之后,但不知道两者具体的间隔位置,所以需要访问磁盘,通过磁盘存储的数据发现n3和n4尚没有被存入缓存空间,而n5已在缓存空间中,对n3,n4的处理参照情形2),对n5的处理参照情形1)。值得注意的是,在这样的查询请求下,即使缓存中,行关键字为key1的缓存信息为:key1{[k1n1:k1v1,k1n2:k1v2,k1n3:k2v3,k1n4:k1v4] [k1n5:k1v5]},仍然需要访问磁盘以确定k1n5:k1v5为n5的数据,当然,此时不必从磁盘请求数据。
实施例3:缓存片段分割
本发明中,如果待缓存的片段所含的单元格数量超过了事先设定的阈值θ,那么需将分裂该片段,直至单个片段大小都小于θ。以θ=5为例,假设缓存空间中有key2{[k2n1:k2v1,k2n2:k2v2,k2n3:k2v3,k2n4:k2v4,k2n5:k2v5,k2n6:k2v6,k2n7:k2v7,k2n8:k2v8,k2n9:k2v9]},key2的片段中含有9个单元格,单元格的数量大于了阈值θ=5。所以将前5个单元格从原有片段中分割出来组成新的片段。分割之后原有片段中的单元格数量为4,小于阈值θ=5,所以不用再次分割。分割后的片段为key2{[k2n1:k2v1,k2n2:k2v2,k2n3:k2v3,k2n4: k2v4,k2n5:k2v5],[k2n6:k2v6,k2n7:k2v7,k2n8:k2v8,k2n9:k2v9]}。片段分裂的过程如图4所示。
实施例4:缓存片段合并
本发明中,为了减小后续查询的延时,会根据一定的规则合并片段。必要的规则有1)待合并片段必须相邻,2)合并后的片段长度不超过阈值θ。片段合并操作由查询触发。举例来说,假设现在缓存空间中有key2{[k2n1:k2v1,k2n2:k2v2],[k2n3:k2v3,k2n4:k2v4]}, 而θ=5,此时,如果可以从后续的查询获知列名n3与n2相邻,那么,缓存片段的合并结果为:key2{[k2n1:k2v1,k2n2:k2v2,k2n3:k2v3,k2n4:k2v4]}。 
实施例5:缓存片段替换
本发明中,当有新的片段需要加入缓存但缓存空间处于饱和状态时需要替换已有的缓存片段。选择目标片段时,主要依据片段最近两次命中的间隔和片段最近一次命中到现在的间隔,其中间隔是指这段时间内有多少其它片段被命中(不计重复)。可以参照已有的LIRS(Low Inter-Reference Recency Set,小引用间隔集合)算法。 在 LIRS算法中有IRR(Inter-Reference Recency,前后引用间隔)和R(Recency,最近一次访问到现在的间隔)这两个参数,分别对应第一个和第二个替换依据。IRR 和R参数的计算示例如图5所示。在如图6所示的信息下,片段C会首先从缓存空间移除。
如果从缓存空间中移除一个缓存片段仍然不能满足新加入片段的空间需求,那么按照上述规则继续移除其它缓存片段直到新的片段能加入缓存空间为止。
如果被移除的片段恰好为其所在行的最后一个片段,那么直接删除片段缓存散列表中的项,即将行关键字连同其对应的列表一并删除;如果不是,那么从对应列表删除该片段即可。
实施例6:缓存片段更新
本发明中,如果已缓存的片段因为写操作在磁盘上更新了,那么须将缓存空间中的片段也一并更新。具体为,当客户端对服务器端发起写请求时,服务器端先更新磁盘上的对应的片段内容,再判断该片段是否存在于缓存空间中,如果是那么更新缓存空间中的片段跟磁盘保持同步。

Claims (10)

1.一种支持Bigtable数据模型的片段缓存方法,其特征在于,包括以下步骤:
步骤一:将服务器的磁盘上存储的行中经常被访问的单元格归并为一组片段,单个片断中的单元格逻辑连续;
步骤二:根据所述片段所在行的行关键字进行判断,若所述行关键字已存在于服务器的缓存空间中,则所述服务器将所述片段存入所述缓存空间中行关键字所在的行内;否则,所述服务器将所述片段及其行关键字一并存入所述缓存空间。
2.如权利要求1所述支持Bigtable数据模型的片段缓存方法,其特征在于,进一步包括步骤三:当所述服务器接收到客户的请求时,所述服务器对所述缓存空间内部的数据进行查询或维护操作。
3.如权利要求1所述支持Bigtable数据模型的片段缓存方法,其特征在于,所述缓存空间中存放片段缓存的方法包括散列表存储方法和列表存储方法。
4.如权利要求1所述支持Bigtable数据模型的片段缓存方法,其特征在于,所述步骤二中,所述行关键字后各片段之间通过比较器根据字典序进行先后排序。
5.如权利要求1-2所述支持Bigtable数据模型的片段缓存方法,其特征在于,所述步骤二与步骤三中,当所述片段中的单元格数量超过设定的阈值时,进一步包括片段分割方法;所述片段分割方法包括如下步骤:
步骤A1:将所述片段分割为单元格数量不高于所述阈值的多个片段;
步骤A2:将所述多个片段依次存入所在的行。
6.如权利要求2所述支持Bigtable数据模型的片段缓存方法,其特征在于,所述步骤三中的维护操作包括片段更新操作,当片段因为写操作在磁盘上进行更新时,触发所述缓存空间中所述片段进行更新。
7.如权利要求2所述支持Bigtable数据模型的片段缓存方法,其特征在于,所述步骤三中的查询操作包括片段查询方法,所述片段查询方法包括如下步骤:
步骤B1:将向所述服务器发送的请求作为多个片段的集合;
步骤B2:将每个所述片段通过二分查找法在所述缓存空间查找所述片段,若所述片段存在于所述缓存空间中,则将所述片段反馈至所述服务器进行响应;否则所述服务器从所述磁盘空间中获取所述片段进行响应,并根据所述步骤二将所述片段存入所述缓存空间中。
8.如权利要求2所述支持Bigtable数据模型的片段缓存方法,其特征在于,所述步骤三中的维护操作包括片段合并方法,所述片段合并方法包括如下步骤:
步骤C:若两个相邻片段的单元格数量之和不高于阈值,则将所述两个相邻片段合并为一个片段。
9.如权利要求2所述支持Bigtable数据模型的片段缓存方法,其特征在于,所述步骤三中的维护操作包括片段更新方法,所述片段更新方法包括如下步骤:
步骤D1:当所述缓存空间处于饱和状态且仍有新的片段加入时,根据同一片段访问间隔数与最近访问间隔数为依据,对所有已存储在所述缓存空间中的片段进行判断,将所述同一片段访问间隔数与最近访问间隔数最高的片段进行删除;
步骤D2:将所述新的片段根据所述步骤二存入所述缓存空间。
10.如权利要求9所述支持Bigtable数据模型的片段缓存方法,其特征在于,所述同一片段访问间隔数与最近访问间隔数分别参照小引用间隔集合算法获得。
CN201210095160XA 2012-04-01 2012-04-01 一种支持Bigtable数据模型的片段缓存方法 Pending CN103365897A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210095160XA CN103365897A (zh) 2012-04-01 2012-04-01 一种支持Bigtable数据模型的片段缓存方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210095160XA CN103365897A (zh) 2012-04-01 2012-04-01 一种支持Bigtable数据模型的片段缓存方法

Publications (1)

Publication Number Publication Date
CN103365897A true CN103365897A (zh) 2013-10-23

Family

ID=49367261

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210095160XA Pending CN103365897A (zh) 2012-04-01 2012-04-01 一种支持Bigtable数据模型的片段缓存方法

Country Status (1)

Country Link
CN (1) CN103365897A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103731500A (zh) * 2014-01-09 2014-04-16 西安电子科技大学 基于Bigtable存储系统的数据批量插入方法
CN103905545A (zh) * 2014-03-22 2014-07-02 哈尔滨工程大学 一种内容中心网络中增强的lru缓存替换方法
CN105302840A (zh) * 2014-07-31 2016-02-03 阿里巴巴集团控股有限公司 一种缓存管理方法与设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101453410A (zh) * 2007-12-07 2009-06-10 北京闻言科技有限公司 一种通过应用缓存提高文件下载速度的方法
US20100161565A1 (en) * 2008-12-18 2010-06-24 Electronics And Telecommunications Research Institute Cluster data management system and method for data restoration using shared redo log in cluster data management system
CN102053916A (zh) * 2010-12-17 2011-05-11 天津曙光计算机产业有限公司 一种分配内核大片连续内存的方法
US20110196866A1 (en) * 2010-02-09 2011-08-11 Yahoo! Inc. Small table: multitenancy for lots of small tables on a cloud database
US20110218971A1 (en) * 2010-03-08 2011-09-08 Yahoo! Inc. System, Method And Computer Program Product For Managing Caches

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101453410A (zh) * 2007-12-07 2009-06-10 北京闻言科技有限公司 一种通过应用缓存提高文件下载速度的方法
US20100161565A1 (en) * 2008-12-18 2010-06-24 Electronics And Telecommunications Research Institute Cluster data management system and method for data restoration using shared redo log in cluster data management system
US20110196866A1 (en) * 2010-02-09 2011-08-11 Yahoo! Inc. Small table: multitenancy for lots of small tables on a cloud database
US20110218971A1 (en) * 2010-03-08 2011-09-08 Yahoo! Inc. System, Method And Computer Program Product For Managing Caches
CN102053916A (zh) * 2010-12-17 2011-05-11 天津曙光计算机产业有限公司 一种分配内核大片连续内存的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
梧桐雨: "Bigtable:一个分布式的结构化数据存储系统", 《HTTP://BLOG.SINA.COM.CN/S/BLOG_4AA4093F0100MALW.HTML》, 17 November 2010 (2010-11-17) *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103731500A (zh) * 2014-01-09 2014-04-16 西安电子科技大学 基于Bigtable存储系统的数据批量插入方法
CN103731500B (zh) * 2014-01-09 2017-02-08 西安电子科技大学 基于Bigtable存储系统的数据批量插入方法
CN103905545A (zh) * 2014-03-22 2014-07-02 哈尔滨工程大学 一种内容中心网络中增强的lru缓存替换方法
CN105302840A (zh) * 2014-07-31 2016-02-03 阿里巴巴集团控股有限公司 一种缓存管理方法与设备
CN105302840B (zh) * 2014-07-31 2019-11-15 阿里巴巴集团控股有限公司 一种缓存管理方法与设备

Similar Documents

Publication Publication Date Title
CN102523285B (zh) 一种基于对象分布式文件系统的存储缓存方法
US9116819B2 (en) Reducing metadata in a write-anywhere storage system
CN104850572B (zh) HBase非主键索引构建与查询方法及其系统
US8463846B2 (en) File bundling for cache servers of content delivery networks
US7805416B1 (en) File system query and method of use
US7783615B1 (en) Apparatus and method for building a file system index
US11537584B2 (en) Pre-caching of relational database management system based on data retrieval patterns
US11561930B2 (en) Independent evictions from datastore accelerator fleet nodes
US10409728B2 (en) File access predication using counter based eviction policies at the file and page level
JP2012256324A (ja) データ管理方法、および、複合型データ管理システム
CN101887398B (zh) 一种动态提高服务器输入输出吞吐量的方法和系统
CN103942289A (zh) 一种Hadoop上面向范围查询的内存缓存方法
Cambazoglu et al. Scalability challenges in web search engines
CN101236569B (zh) 一种基于ContextFS上下文文件系统的高效动态路径解析方法
CN110232049A (zh) 一种元数据缓存管理方法和装置
CN103176754A (zh) 一种海量小文件读取存储方法
CN107368608A (zh) 基于arc替换算法的hdfs小文件缓存管理方法
KR20160060550A (ko) 효율적인 맵핑을 위한 페이지 캐시 장치 및 방법
CN103294785A (zh) 一种基于分组的元数据服务器集群管理方法
CN111159176A (zh) 一种海量流数据的存储和读取的方法和系统
US11593268B2 (en) Method, electronic device and computer program product for managing cache
CN110647542B (zh) 一种数据获取方法和装置
CN114817195A (zh) 一种分布式存储缓存管理的方法、系统、存储介质及设备
CN105915619A (zh) 顾及访问热度的网络空间信息服务高性能内存缓存方法
CN108319634A (zh) 分布式文件系统的目录访问方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20131023

WD01 Invention patent application deemed withdrawn after publication