CN101340458B - 一种基于时间空间局部性的网格数据副本生成方法 - Google Patents

一种基于时间空间局部性的网格数据副本生成方法 Download PDF

Info

Publication number
CN101340458B
CN101340458B CN2008101235935A CN200810123593A CN101340458B CN 101340458 B CN101340458 B CN 101340458B CN 2008101235935 A CN2008101235935 A CN 2008101235935A CN 200810123593 A CN200810123593 A CN 200810123593A CN 101340458 B CN101340458 B CN 101340458B
Authority
CN
China
Prior art keywords
data
visit
grid
formula
limit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008101235935A
Other languages
English (en)
Other versions
CN101340458A (zh
Inventor
王汝传
付雄
任勋益
邓松
季一木
易侃
杨明慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN2008101235935A priority Critical patent/CN101340458B/zh
Publication of CN101340458A publication Critical patent/CN101340458A/zh
Application granted granted Critical
Publication of CN101340458B publication Critical patent/CN101340458B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种基于时间空间局部性的网格数据副本生成方法是一种基于网格用户数据访问的行为特征,来确定网格中数据副本的数目和其在网格节点上的分布,从而进行数据副本生成的方法。该方法基于网格用户数据访问的行为特征,来确定网格中数据副本的数目和其在网格节点上的分布。其基本思想是利用用户访问数据的时间局部性分布来获取网格中数据之间的空间局部性,然后基于空间局部性确定数据副本的数目以及分布原则,从而复制和分布数据的各个副本。这样根据数据在邻近关系图上的分组情况,就能得到数据需要的副本数目和副本分布的方法,从而利用较少的副本数目和有效的副本分布,达到降低网格中数据访问的延迟和减少网络带宽消耗。

Description

一种基于时间空间局部性的网格数据副本生成方法
技术领域
本发明是一种网格中数据副本生成问题的解决方案,主要用于解决网格中,特别是数据网格中的数据副本生成问题,属于分布式环境下数据管理领域。
背景技术
自20世纪90年代以来,随着互联网技术的迅速发展,为了解决网络虚拟环境上的高性能资源共享和协同求解问题,网格(Grid)技术应运而生,并且得到了广泛应用。目前,各个国家都已经建立了许多面向多种应用的网格,仅在国内就已经建立了中国国家网格、973语义网格、863网格、上海网格、织女星网格等多个网格。网格这种新型分布式计算的基础架构被广泛应用于多种重大应用研究问题,已经成为国家级高性能计算和信息服务的战略性基础设施。
根据应用目标的不同,网格可以分为计算网格、数据网格、语义网格等,在各种网格,特别是数据网格中,都需要进行分布式环境下的数据管理,以便对各种数据资源的提供一体化访问。为了减少访问数据时的延迟,减轻网络带宽的消耗,往往在任务执行的节点或者其附件节点上缓存该任务所需的数据的副本。同时,由于网格节点的动态性,数据副本的采用也增强了网格的容错性和可靠性,并且使整个网格具有较好的负载平衡。这样,随着数据副本的采用而出现的数据副本管理成为各种网格(特别是数据网格)中数据管理的重要组成部分之一,其性能也对网格中数据管理,甚至整个网格的性能也产生重大影响。
副本生成被认为是网格数据副本管理中的四个主要难点之一(另外三个主要难点是副本定位、副本选择以及副本一致性管理)。副本的生成包括副本数目的决定以及其在网格节点上的分布。数据副本的数目受到多种影响:网格中节点的存储能力有限,相比于一些应用中的海量数据,大部分的节点存储能力都相对较弱,所能保存数据的容量有限,限制了数据的副本数目;数据的副本数目增大,也必然增加维护数据副本一致性的困难;网格中不同数据被使用的频率和模式几乎完全不同,不同数据采用相同的副本数目无法满足这些数据各自的副本要求;数据副本数目过少,必然增加数据访问的延迟和带宽消耗,同时降低网格系统的容错能力。在实际数据副本生成中,往往要求数据副本数目少,分布合理,同时能确保访问数据的性能和数据的可靠性。
发明内容
技术问题:本发明的目的是提供一种基于时间/空间局部性的网格数据副本生成方法,通过分析用户在过去某一段时间内数据访问的规律,或者典型用户数据访问的行为特征,来确定网格中数据副本的生成方法。
技术方案:本发明的方法是一种基于时间/空间局部性的网格数据副本生成方法,基于网格用户数据访问的行为特征,来确定网格中数据副本的数目和其在网格节点上的分布。其基本思想是利用用户访问数据的时间局部性分布来获取网格中数据之间的空间局部性,然后基于空间局部性确定数据副本的数目以及分布原则,从而复制和分布数据的各个副本。
该方法基于网格中数据被访问时表现出的时间局部性来分析数据之间的空间局部性,然后根据空间局部性生成数据在网格中的副本,其步骤主要如下:步骤1.标记网格中存储的数据集合为{D1,D2,...,Dn},具有存储能力的节点集合为{X1,X2,...,Xm},其中m>n,记录k个典型网格用户的访问数据序列分别为S1,S2,...,Sk,则有Si={Da...Db}(0≤i≤k,0≤a,b≤n);
步骤2.对用户t访问数据序列St(0≤t≤k),依据下面的公式1计算访问距离:
dist(a,j)=j-i-1      公式1
其中dist(a,j)表示数据序列中第j次访问所访问的数据a的访问距离,i表示上一次访问数据a为访问序列中第i次访问,依次计算该序列中每次访问的访问距离。然后依据公式2计算所有用户对数据a的访问的距离集合Dis(a),
Dis ( a ) = { dist u , k u ( a ) | u ∈ U ; k u = 0,1,2 , · · · } 公式2
其中
Figure S2008101235935D00022
表示用户u第k次访问的距离,U表示所有用户的集合;
步骤3.对每个数据D的访问距离集合Dis(Dj)中的值按照区间[2i-1,2i)进行分组,其中0和∞除外,统计每个分组i中访问距离出现的访问次数步骤4.从数据集合{D1,D2,...,Dn}选择两个数据Dp和Dq,其中0≤p≤n,0≤q≤n,p≠q,根据公式3和公式4计算两者分布的差异
Figure S2008101235935D00032
N D p , D q , i = | N D p , i - N D q , i | 公式3
N D p , D q = Σ i ∈ G N D p , D q , i 公式4
其中
Figure S2008101235935D00035
分别为数据Dp和Dq按步骤3中计算得到的访问距离在分组i中的次数,
Figure S2008101235935D00037
为第i组的差异。然后根据公式5分别计算
Figure S2008101235935D00039
N D p = Σ i ∈ G N D p , i 公式5
其中
Figure S2008101235935D000311
为数据Dp按步骤3中计算得到的访问距离在分组i中的次数。在此基础上根据(6)计算数据Dp和Dq的差异Diff(Dp,Dq):
Diff ( D p , D q ) = N D p , D q / N D p + N D q 公式6
其中为Dp和Dq之间分布的差异,
Figure S2008101235935D000314
Figure S2008101235935D000315
为Dp和Dq的分布次数,
步骤5.建立邻近关系图G=(V,E),其中顶点集合V为数据集合{D1,D2,...,Dn},E为边集,如果两个顶点Dp和Dq之间存在Diff(Dp,Dq)≤δ,则两个顶点Dp和Dq之间存在边,其权值为Diff(Dp,Dq);δ为阀值,可以根据需要进行调整,初始值为0.5;
步骤6.从邻近图G中寻找任意一条边,如果不存在,将邻近图中没有标记为已分组的顶点各自作为一组分组保存到组集合R中,同时跳转到第11步;
步骤7.如果存在一条边,则选择该边的两顶点表示的数据Dp,Dq组成集合T,并将Dp,Dq标记为已分组,同时将该边从图G中去掉;
步骤8.从邻近图中寻找不属于集合S的顶点Dw,并且Dw到集合T中每个元素所表示的顶点存在一条边;
步骤9.如果Dw存在,则从邻近图中去掉Dw到集合T中每个元素所表示的顶点的边,并且将Dw加入到集合T中,将Dw标记为已分组,然后跳转到第8步;
步骤10.如果Dw不存在,则将集合T中的元素作为一组邻近数据保存到组集合R中,并跳转到第6步;
步骤11.从组集合R中选择每一组Rz,从数据集合{D1,D2,...,Dn}中复制Rz所包含的数据Dtemp={Di|i∈Rz},然后从节点集合{X1,X2,...,Xm}中找到拥有足够存储空间的节点Xt,将数据组合Dtemp拷贝到网格节点Xt上。
有益效果:本发明方法提出了一种基于时间/空间局部性的网格数据副本生成方法,主要解决网格数据副本的生成问题。通过使用本发明的方法,能够采用尽量少的网格数据副本,节省网格节点存储空间,同时通过对这些数据副本的有效分布,达到减少网格数据访问延迟,减轻网络带宽压力的目的。下面给出具体的说明。
基于用户的时间/空间局部性特征生成网格数据副本,既限制了副本生成的数目,节省存储空间,又根据用户行为特征生成较为足够的副本,尽量降低数据的访问延迟和减少带宽消耗。目前网格中的数据副本在初始时数目固定,然后根据数据被访问时动态生成数据副本。基于固定的副本数目忽略了数据被访问的模式,由于局部性原理,大部分时候用户访问的数据集中在少量数据,固定的副本数目为不经常使用的数据生成了大量的副本,浪费了存储空间。并且副本的分布主要考虑网格节点负载均衡,并没有基于用户访问数据的模式,使用户难以在与任务执行节点相邻近的各节点上获取全部所需的数据。本发明方法基于用户访问数据时的行为特征,提出了一种副本数目不相等的副本生成方法,有效地弥补了过去副本生成中的这些弱点。
附图说明
图1是数据副本生成方案流程图。
图2是数据访问距离分布图。
图3是数据邻近关系图。
具体实施方式
整个副本生成的流程如图1所示,主要包含下面几个主要的子过程:
一、访问距离(Reference Distance)计算
用户对网格中某数据某次访问的访问距离(Reference Distance)是指用户在对该数据前一次访问和这次访问这两次相继访问中所访问的数据的数目。其中的相继访问指两次访问该数据中没有再访问该数据,例如,假设用户对网格中数据的访问序列为adcdcfageft,两次对数据a的访问中只访问了d,c,f三个数据,没有再次访问a,则这两次对a的访问就是相继访问。
在用户对网格中数据的访问序列中,如果两次对某数据(记为a)的相继访问的序号分别为i和j,则序号为j的对a的访问的距离dist(a,j)可以通过下面的公式计算:
dist(a,j)=j-i-1             (1)
例如,假设用户对网格中数据的访问序列为adcdcfageft,则根据公式可以得出第二次对a的访问距离为5。需要注意的是,如果是第一次对某个数据进行访问,由于没有前面访问作为基准,则认为访问距离极为∞,如前面访问序列中的第一次对a的访问距离。
二、数据访问距离分布
一般来说,网格中各用户对数据的访问各自独立,相互之间不受影响。这样,网格中所有用户对数据a的访问的距离Dis(a)由各个用户自己对该数据的访问的距离组成。下面给出了相应的计算公式:
Dis ( a ) = { dist u , k u ( a ) | u ∈ U ; k u = 0,1,2 , · · · } - - - ( 2 )
其中
Figure S2008101235935D00052
表示用户u第k次访问的距离,U表示所有用户的集合。
在本发明中,我们用如图2所示的柱状图来表示某一数据的访问距离分布。在图中,横坐标i表示访问距离属于区间[2i-1,2i),纵坐标的值表示访问距离在该区间的访问次数。需要注意的是,有两个例外的情况:横坐标为0时,表示此时的访问距离为0;横坐标为∞时,表示此时的访问距离为∞。由于访问距离较大的访问的次数一般较少,我们通常将超出某一大小的访问距离也认为是∞。在图2中,我们将访问距离大小超出217的访问的距离都认为是∞。
实际上,数据的访问距离分布表示了该数据被访问过程中的时间局部性。如果对一个数据的绝大部分访问的访问距离较小,即在图中绝大部分的访问都集中在横坐标值比较小的区域,则表示对该数据的访问具有较好的时间局部性。反之,如果数据的绝大部分访问的访问距离较大,则表示对该数据的访问的时间局部性较差。
三、数据邻近关系
数据邻近关系分析指分析网格中数据被在一起访问的机会,也就是网格中各数据之间的空间局部性。即两个数据之间的空间局部性取决于这两个数据被访问时邻近的概率。
通常,如果两个数据之间的空间局部性较好,两者被邻近访问的机会较大,则它们各自的时间局部性分布比较相近。在本发明中,就是依据这一基本思想,基于数据的访问距离分布来进行数据邻近关系分析。
在前面我们用网格中数据的访问距离分布图来表示数据的时间局部性,则分析数据访问距离分布图之间的相似程度就可以用来表示其时间局部性分布的相似程度了。
在分析网格中数据的访问距离分布图之间的差异时,我们将访问距离分布图中分组集合记为G(横坐标值为0和∞的分组不进行统计),集合中第i组表示访问距离的区间为[2i-1,2i),则数据A和B之间第i组访问次数的差异NA,B,i可以通过下面的公式来计算:
NA,B,i=|NA,i-NB,i|        (3)
其中NA,i表示数据A在第i组中出现的次数。从而,数据A和B之间的整个访问距离分布图的差异NA,B可以通过下面的公式来计算:
N A , B = Σ i ∈ G N A , B , i - - - ( 4 )
由于网格中不同数据被访问的次数基本上不会相同,为了便于比较数据之间的邻近关系,我们通过下面的公式对上面的整个访问距离分布图的差异进行归一化处理:
N A = Σ i ∈ G N A , i - - - ( 5 )
Diff(A,B)=NA,B/NA+NB                        (6)
其中NA和NB分别表示数据A和B的总的访问次数。
根据Diff(A,B)的值,我们就可以量化数据A和B之间的邻近关系:如果A和B之间的空间局部性较好,则其时间局部性分布比较相似,则Diff(A,B)的值比较小。反之则比较大。
我们可以通过给Diff(A,B)值限定一个阀值δ,只有其值小于这个阀值,才认为这两个数据具有较好的邻近关系,在网格中复制副本并分布时,需要将这两个数据的副本分布在一起,以便用户访问网格中数据时经常在一起访问这两个数据。
对网格中的数据进行邻近关系分析,就能得到整个网格中所有数据的邻近关系图。图3给出了一个网格中部分数据邻近关系图的示例,图中每个顶点表示一个数据,相互之间的边表示这两个数据之间的Diff值小于阀值δ,经常在一起访问的机会比较大。
如果两个数据之间存在边,则表示这两个数据之间具有比较好的邻近关系,其副本应该位于网格中同一个节点上。同时,我们可以通过调整阀值δ的大小,根据网格所具备的存储能力调整副本的生成方法,达到既生成较少的副本数目,又充分利用网格存储能力,提高网格中数据访问的性能。
四、副本生成方案
根据前面得到的网格中数据的邻近关系图,我们就可以得到网格中应该分布在一起的数据分组了。下面给出了相应的分组算法:
  算法1:邻近图中数据分组算法输入:数据邻近图G输出:存储数据分组的组集合R算法过程:(1)从邻近图G中寻找任意一条边,如果不存在,将邻近图中没有标记为已分组的顶点各自作为一组分组保存到组集合R中,同时退出;(2)如果存在一条边,则选择该边的两顶点表示的数据Dp,Dq组成集合T,并将Dp,Dq标记为已分组,同时将该边从图G中去掉;(3)从邻近图中寻找不属于集合S的顶点Dw,并且Dw到集合T中每个元素所表示的顶点存在一条边;(4)如果Dw存在,则从邻近图中去掉Dw到集合T中每个元素所表示的顶点的边,并且将Dw加入到集合T中,将Dw标记为已分组,然后跳转到第3步;(5)如果Dw不存在,则将集合T中的元素作为一组邻近数据保存到组集合R中,并跳转到第1步;
根据上面的算法,我们对图3所示的网格中数据邻近关系图进行分组,就可以得到下面的分组:
<A,B>,<B,C,D>,<B,J>,<D,F>,<C,E>,<E,F>,<H,F>,<G,F>,<I>
这样网格中每个数据在分组中出现的次数就代表了该数据需要的数据数目,其减1就表示数据的副本数目,下面的表1给出了依据图3得到的数据数目和相应的副本数目。
表1 网格中数据分数和副本份数
  数据   数据份数   副本份数   数据   数据份数   副本份数
  A   1   0   F   4   3
  B   3   2   G   1   0
  C   2   1   H   1   0
  D   2   1   I   1   0
  E   2   1   J   1   0
五、数据副本分布
根据上面的副本生成方案中的数据分组就能够决定网格数据的数目,然后就可以进行数据副本分布了。数据副本分布的思想比较简单,对于副本生成方案中每个分组,计算分组中数据的大小,在网格节点中选择一个具有足够存储能力的节点,将分组中的数据复制一份,传输到该网格节点上,这样就完成了数据副本的分布。
为了方便描述,我们假设有如下应用实例:
网格中需要管理的数据集合{D1,D2,...,Dn},具有存储能力的节点集合{X1,X2,...,Xm}。同时,已经获取了k个典型网格用户的数据访问序列(S1,S2,...,Sk)。则其具体实施方式如下:
(1)对用户t的访问序列St(0≤t≤k),依次计算该序列中每次访问的访问距离,并将其值加入到该次访问的数据Dj(0≤j≤n)的访问距离的集合Dis(Dj)中;
(2)对每个数据Dj(0≤j≤n)的访问距离集合Dis(Dj)中的值按照区间[2i-1,2i)进行分组(0和∞除外),计算每个分组中出现的访问次数
Figure S2008101235935D00091
(3)从数据集合{D1,D2,...,Dn}选择两个Dp和Dq(0≤p≤n,0≤q≤n,p≠q),分别计算其从而计算Diff(Dp,Dq)的值;
(4)建立邻近关系图G=(V,E),其中顶点集合V为数据集合{D1,D2,...,Dn},E为边集,如果两个顶点Dp和Dq之间存在Diff(Dp,Dq)≤δ,则两个顶点Dp和Dq之间存在边,其权值为Diff(Dp,Dq)。δ为阀值,可以根据需要进行调整,初始值为0.5;
(5)从邻近图G中寻找任意一条边,如果不存在,将邻近图中没有标记为已分组的顶点各自作为一组分组保存到组集合R中,同时跳转到第10步;
(6)如果存在一条边,则选择该边的两顶点表示的数据Dp,Dq组成集合T,并将Dp,Dq标记为已分组,同时将该边从图G中去掉;
(7)从邻近图中寻找不属于集合S的顶点Dw,并且Dw到集合T中每个元素所表示的顶点存在一条边;
(8)如果Dw存在,则从邻近图中去掉Dw到集合T中每个元素所表示的顶点的边,并且将Dw加入到集合T中,将Dw标记为已分组,然后跳转到第7步;
(9)如果Dw不存在,则将集合T中的元素作为一组邻近数据保存到组集合R中,并跳转到第5步;
(10)从组集合R中选择每一组Rz,从数据集合{D1,D2,...,Dn}中复制Rz所包含的数据Dtemp={Di|i∈Rz},然后从节点集合{X1,X2,...,Xm}中找到拥有足够存储空间的节点Xt,将数据组合Dtemp拷贝到网格节点Xt上。

Claims (1)

1.一种基于时间/空间局部性的网格数据副本生成方法,其特征在于该方法基于网格中数据被访问时表现出的时间局部性来分析数据之间的空间局部性,然后根据空间局部性生成数据在网格中的副本,其步骤如下:
步骤1.标记网格中存储的数据集合为{D1,D2,…,Dn},具有存储能力的节点集合为{X1,X2,…,Xm},其中m>n,记录k个典型网格用户的访问数据序列分别为S1,S2,…,Sk,则有Si={Da…Db},0<i≤k,0<a,b≤n;
步骤2.对用户t访问数据序列St(0<t≤k)依据下面的公式1计算访问距离:
dist(a,j)=j-i-1                                公式1
其中dist(a,j)表示数据序列中第j次访问所访问的数据a的访问距离,i表示上一次访问数据a为访问序列中第i次访问,依次计算该序列中每次访问的访问距离,然后依据公式2计算所有用户对数据a的访问的距离集合Dis(a),
Figure FSB00000351422000011
公式2
其中 
Figure FSB00000351422000012
表示用户u第k次访问的距离,U表示所有用户的集合;
步骤3.对每个数据Dj的访问距离集合Dis(Dj)中的值按照区间[2i-1,2i)进行分组,其中0和∞除外,统计每个分组i中访问距离出现的访问次数 
Figure FSB00000351422000013
步骤4.从数据集合{D1,D2,...,Dn}选择两个数据Dp和Dq,其中,0<p≤n,0<q≤n,p≠q,根据公式3和公式4计算两者分布的差异 
公式3
Figure FSB00000351422000016
公式4
其中 
Figure FSB00000351422000017
和 
Figure FSB00000351422000018
分别为数据Dp和Dq按步骤3中计算得到的访问距离在分组i中的次数, 
Figure FSB00000351422000019
为第i组的差异,然后根据公式5分别计算 
Figure FSB000003514220000110
和 
Figure FSB000003514220000111
邻近关系图G:
Figure FSB00000351422000021
公式5
其中 
Figure FSB00000351422000022
为数据Dp按步骤3中计算得到的访问距离在分组i中的次数,在此基础上根据公式6计算数据Dp和Dq的差异Diff(Dp,Dq):
Figure FSB00000351422000023
公式6
其中 
Figure FSB00000351422000024
为Dp和Dq之间分布的差异, 
Figure FSB00000351422000025
和 
Figure FSB00000351422000026
为Dp和Dq的分布次数,
步骤5.建立邻近关系图G=(V,E),其中顶点集合V为数据集合{D1,D2,...,Dn},E为边集,如果两个顶点Dp和Dq之间存在Diff(Dp,Dq)≤δ,则两个顶点Dp和Dq之间存在边,其权值为Diff(Dp,Dq);δ为阀值,根据需要进行调整,初始值为0.5;
步骤6.从邻近关系图G中寻找任意一条边,如果不存在,将邻近图中没有标记为已分组的顶点各自作为一组分组保存到组集合R中,同时跳转到第11步;
步骤7.如果存在一条边,则选择该边的两顶点表示的数据Dp,Dq组成集合T,并将Dp,Dq标记为已分组,同时将该边从邻近关系图G中去掉;
步骤8.从邻近关系图G中寻找不属于集合S的顶点Dw,并且Dw到集合T中每个元素所表示的顶点存在一条边;
步骤9.如果Dw存在,则从邻近关系图G中去掉Dw到集合T中每个元素所表示的顶点的边,并且将Dw加入到集合T中,将Dw标记为已分组,然后跳转到第8步;
步骤10.如果Dw不存在,则将集合T中的元素作为一组邻近数据保存到组集合R中,并跳转到第6步;
步骤11.从组集合R中选择每一组Rz,从数据集合{D1,D2,...,Dn}中复制Rz所包含的数据组合Dtemp={Di|i∈Rz},然后从节点集合{X1,X2,...,Xm}中找到拥有足够存储空间的节点Xt,将数据组合Dtemp拷贝到网格节点Xt上。 
CN2008101235935A 2008-07-09 2008-07-09 一种基于时间空间局部性的网格数据副本生成方法 Expired - Fee Related CN101340458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101235935A CN101340458B (zh) 2008-07-09 2008-07-09 一种基于时间空间局部性的网格数据副本生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101235935A CN101340458B (zh) 2008-07-09 2008-07-09 一种基于时间空间局部性的网格数据副本生成方法

Publications (2)

Publication Number Publication Date
CN101340458A CN101340458A (zh) 2009-01-07
CN101340458B true CN101340458B (zh) 2011-03-16

Family

ID=40214410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101235935A Expired - Fee Related CN101340458B (zh) 2008-07-09 2008-07-09 一种基于时间空间局部性的网格数据副本生成方法

Country Status (1)

Country Link
CN (1) CN101340458B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751309B (zh) * 2009-12-28 2011-06-29 北京理工大学 数据网格中一种优化的副本分布方法
CN102457571B (zh) * 2011-09-15 2014-11-05 中标软件有限公司 一种云存储中数据均衡分布方法
CN103500117B (zh) * 2013-09-10 2016-08-24 华东师范大学 一种程序数据与代码局部性的量化方法
CN104796433B (zh) * 2015-05-08 2018-05-22 中国地质大学(武汉) 一种网络计算模式下的资源访问性能优化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101022396A (zh) * 2007-03-15 2007-08-22 上海交通大学 网格数据副本管理系统
CN101187931A (zh) * 2007-12-12 2008-05-28 浙江大学 分布式文件系统多文件副本的管理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101022396A (zh) * 2007-03-15 2007-08-22 上海交通大学 网格数据副本管理系统
CN101187931A (zh) * 2007-12-12 2008-05-28 浙江大学 分布式文件系统多文件副本的管理方法

Also Published As

Publication number Publication date
CN101340458A (zh) 2009-01-07

Similar Documents

Publication Publication Date Title
Ren et al. On querying historical evolving graph sequences
Yang et al. Hypergraph partitioning for social networks based on information entropy modularity
CN103179052B (zh) 一种基于接近度中心性的虚拟资源分配方法及系统
JP5147162B2 (ja) オブジェクトの類似性を異種の関係に基づいて判定するための方法およびシステム
US20130024412A1 (en) Methods and systems for using map-reduce for large-scale analysis of graph-based data
CN104065568A (zh) 一种Web服务器集群的路由方法
CN103678520A (zh) 一种基于云计算的多维区间查询方法及其系统
CN101778005A (zh) 复杂网络配置方法和系统
Ma et al. A classification of file placement and replication methods on grids
CN108376143A (zh) 一种新型的olap预计算模型及生成预计算结果的方法
CN102281290A (zh) 一种PaaS云平台的仿真系统及方法
Gu et al. Chronos: An elastic parallel framework for stream benchmark generation and simulation
CN101340458B (zh) 一种基于时间空间局部性的网格数据副本生成方法
Wu A generalized tree augmented naive Bayes link prediction model
CN101419600A (zh) 基于面向对象文件系统的数据副本映射方法及装置
Suriarachchi et al. Big provenance stream processing for data intensive computations
Lin et al. A hybrid recommendation algorithm based on hadoop
CN106022936B (zh) 适用论文合作网络的基于社团结构的影响最大化算法
CN105138536A (zh) 基于有向超图的移动社交网络数据分片方法
Wang et al. Sublinear algorithms for big data applications
Liu et al. Parallelizing uncertain skyline computation against n‐of‐N data streaming model
Zhang et al. Communication-efficient distributed skyline computation
CN112579831B (zh) 基于SimRank全局矩阵平滑收敛的网络社区发现方法、装置及存储介质
Li et al. Learning-based dynamic graph stream sketch
Huang et al. Massive data oriented replication algorithms for consistency maintenance in data grids

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Assignee: Jiangsu Jiqun Information Industry Co., Ltd.

Assignor: Nanjing Post & Telecommunication Univ.

Contract record no.: 2012320000280

Denomination of invention: Grid data copy generation method based on time and space limitation

Granted publication date: 20110316

License type: Exclusive License

Open date: 20090107

Record date: 20120322

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110316

Termination date: 20170709