CN1815989A - 通过互连拓扑嵌入高效地构造网络覆盖的方法 - Google Patents

通过互连拓扑嵌入高效地构造网络覆盖的方法 Download PDF

Info

Publication number
CN1815989A
CN1815989A CNA200510109571XA CN200510109571A CN1815989A CN 1815989 A CN1815989 A CN 1815989A CN A200510109571X A CNA200510109571X A CN A200510109571XA CN 200510109571 A CN200510109571 A CN 200510109571A CN 1815989 A CN1815989 A CN 1815989A
Authority
CN
China
Prior art keywords
network
node
index
network coverage
coverage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200510109571XA
Other languages
English (en)
Inventor
G·V·波佩斯库
刘震
D·彭达拉基斯
P·杜布
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1815989A publication Critical patent/CN1815989A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1087Peer-to-peer [P2P] networks using cross-functional networking aspects
    • H04L67/1089Hierarchical topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

通过将互连网络嵌入网络覆盖图中来构造网络覆盖的方法和装置。此处所提出的是一种近似算法的一个例子,该算法用于高效地将超立方体拓扑映射到N节点的网络覆盖上从而最小化在该网络覆盖上测量的平均网络延迟距离。在最短网络路径上测量覆盖节点对之间的网络延迟距离。互连拓扑到网络覆盖节点的映射优选地涉及将2m个长度为m的二进制索引分配给网络覆盖节点。此处提出了一种使用迭代簇划分和节点二进制索引分配的用于互连拓扑嵌入的多项式时间算法。此处进一步提出了一种用于通过互连网络拓扑嵌入构造网络覆盖的方法,其目的是使服务度量的质量最优(例如,平均网络覆盖路由延迟的最小化)。

Description

通过互连拓扑嵌入高效地构造网络覆盖的方法
技术领域
本发明一般地涉及网络覆盖(network overlay)的构造以及相关装置。
背景技术
在整个当前公开中,方括号[]中的数字为本公开末尾经过编号的参考书目列表的索引。
可伸缩和健壮的分布式数据传播需要可伸缩的控制网络来高效地处理控制信息。分布式数据索引技术一般将数据索引集分区,并将各分区分配给一组分布在网络中的节点。使用分布式数据索引的应用的例子为:分布式目录、内容分发网络以及web缓存。
覆盖网络提供应用层数据路由并控制支持分布式数据索引所需的功能。覆盖具有需要动态伸缩分布式数据的应用所需要的更高的可管理性和适应性的优点;它们对于具有这种动态特性的应用可更为高效,尽管有由于在应用层提供网络功能而产生的开销。
几种互连拓扑具有支持分布式数据索引所需要的可伸缩性和弹性的特性。尽管主要是为并行计算系统设计的,互连拓扑可以通过提供互连拓扑到网络覆盖的高效映射来用作路由网络。在覆盖构造之后,一分布式散列法将键分配给网络覆盖节点以便最优化数据检索的计算和通信成本。用于数据索引的最优分布的典型的度量为:平均键查找延迟、查找查询的平均转发开销等。
分布式散列法的一种应用是对组通信(group communication)的可伸缩控制。用于可伸缩组通信的控制拓扑有几种合意的特性:控制节点度(每个控制节点的连接数)随控制拓扑的大小按对数增长,定位任何项目(通信组)所需的平均跳数与网络的大小呈对数关系,每节点控制开销进行了负载平衡,并且控制拓扑的动态作用的开销与其大小的对数成比例增减。为分布式索引应用构造网络覆盖的历史方法并未最优化网络服务质量度量;开销度量被计算为键查找所需要的平均跳数而未考虑网络延迟。如果构造的覆盖网络的拓扑与底层网络的距离无关,则底层网络上的路由成本可能非常大。通过提供网络覆盖的最优(延迟最小化)的配置,提供给延迟敏感的分布式索引应用的服务质量得到了显著的提高。
最近提出了几种为分布式索引应用构造覆盖拓扑的方法:Chord、Can、超立方体、以及deBruijn结构等[6,7]。这些中的每一个都表现出上面提及的特性的一子集。然而,用于上述DHT的网络覆盖的构造并未考虑到由底层网络提供给分布式索引应用的服务质量。
考虑到前述情况,已认识到,对于在针对分布式数据的传播及其索引的历史方法中遇到的缺点和不利,越来越需要改进。
发明内容
根据本发明的至少一个当前优选实施例,此处概略考虑了一种用于通过将一互连网络嵌入一网络覆盖图来构造网络覆盖的方法。此处所提出的是一种用于高效地将超立方体拓扑映射到一个N节点的网络覆盖上从而最小化在该网络覆盖上测量的平均网络延迟距离的一种近似算法的例子。覆盖节点对之间的网络延迟距离是在最短网络路径上测量的。互连拓扑到网络覆盖节点的映射优选地涉及将2m个长度为m的二进制索引分配给网络覆盖节点。此处提出了一种使用迭代簇划分和节点二进制索引分配的用于互连拓扑嵌入的多项式时间算法。
此处进一步提出了一种用于通过互连网络拓扑嵌入来构造网络覆盖的方法,其目的是使服务质量的度量最优(例如,平均网络覆盖路由延迟的最小化)。
总之,本发明的一个方面提供了一种便利网络覆盖构造的方法,该方法包括以下步骤:提供一网络覆盖图;以及将一互连网络嵌入该网络覆盖图中。
本发明的另一个方面提供了一种用于便利网络覆盖构造的装置,该装置包括:用于提供网络覆盖图的装置;以及用于将互连网络嵌入到该网络覆盖图的装置。
进一步地,本发明的另外的一个方面提供了一种可以由机器读取的程序存储装置,该装置有形地体现了一可由该机器执行以执行用于便利网络覆盖构造的方法步骤的指令程序,该方法包括以下步骤:提供一网络覆盖图;并将一互连网络嵌入到该网络覆盖图中。
为了更好的理解本发明,以及其其它和进一步的特征和优点,结合附图参照下面的描述,并且本发明的范围将在所附的权利要求中给出。
附图说明
图1示出了使用网络节点索引的覆盖构造的示意图。
图2示出了一测量基础结构的示意图。
图3示出了一迭代索引构造算法的示意图。
具体实施方式
根据本发明至少一个当前优选实施例,此处概略考虑了一种通过嵌入一互连网络来高效地构造网络覆盖的方法。图1中示出了描述一可能的应用的样本网络,其示出了一物理网络,该物理网络具有由物理链路和网络节点(路由器)互连的客户机(最终主机)和控制节点。这里的目标是以能最小化搜索延迟的高效的控制拓扑来互连控制节点。下文给出的一种近似算法用于在一N节点的网络覆盖中高效地嵌入一超立方体拓扑以使得在该网络覆盖上测量到的平均网络延迟距离最小化。在网络覆盖控制节点处收集网络信息(网络节点对之间的在最短网络路径上测量到的延迟)。互连拓扑的嵌入包括将2m个长度为m的二进制索引分配给每个网络覆盖节点。描述了一种用于通过覆盖网络簇索引来进行互连拓扑嵌入的多项式时间算法。
下文也提出了一种用于网络覆盖的分布式构造的方法。每个节点接收其覆盖拓扑邻居的IP地址及其相关索引。每个覆盖节点打开到其覆盖邻居的网络连接。随后,每个节点构造一个包含覆盖邻居网络地址及其分配索引的路由表。
首先来看用于最优互连图嵌入的网络测量值收集,这个阶段包括收集一组用来将一度量分配给该覆盖网络的每个链路的全网络范围内的测量值。此处概略考虑的是使用延迟测量,这样产生一组成对的网络延迟测量值。然而,也可以使用任何其它的一组网络测量,例如也可使用可获得的吞吐量或丢失率。
下面给出可以用来收集网络延迟测量值的两组机制。
一组这种机制包括相对于“陆标”节点的延迟测量。这种方法,在本领域的文献中也被称为全球网络定位(GNP),其依赖于分布在一个大的地理区域的一小组参考节点。网络节点对所有的陆标进行往返延迟测量,然后使用这些延迟的向量的变换来得到欧几里德坐标(参见第2图)。在执行一种根据本发明的至少一个实施例的嵌入方法的控制节点处收集这些坐标。由于网络被迭代地分区,在每个分区控制器处收集一分区内的节点的坐标。陆标方法的优点是,对于N个节点和K个陆标,需要N*K个延迟测量。对于N>>K的典型情况,这与“对等”方法相比,大大地减少了测量的数量。然而,它依赖于适当的陆标的选择,这可能会是一个问题。
另一组机制包括“对等”测量。在这种方法中,每个节点相对于所有其它节点进行往返延迟测量(见图2)。也可以利用缩减技术来相对于所有其他节点的一子集进行测量。这些测量值被收集到控制节点处,所述控制节点在我们的方法中直接使用这些测量值作为节点间的距离。迭代地进行测量值的收集,正如基于陆标测量的情况中一样。
在根据本发明的至少一个实施例的方法的下一个步骤中,在收集测量值后,创建一数据结构以维护网络测量信息。将在一控制节点处收集的网络延迟信息记录到一数据结构中,该数据结构通过网络节点标签来索引节点对之间的延迟。用于记录网络延迟信息的数据结构的一例子是一带有对应于网络图节点标签的行/列索引的大小为N的矩阵。矩阵中的每个条目对应于其标签对应于行索引的网络节点和其标签对应于列索引的网络节点之间的网络延迟。
带宽和网络损耗被类似地记录到网络信息矩阵结构中。节点覆盖数据如最大节点转发能力被记录在一具有(节点标签、节点转发能力)形式的条目的列表中。
现在来看网络感知的的覆盖拓扑构造,应当认识到,最优网络覆盖拓扑构造的一个重要目标是覆盖节点之间的平均网络延迟的最小化。最小化平均延迟导致对底层网络基础结构的更好利用以及在网络覆盖节点之间更小的端到端网络延迟。下面用公式来表达互连拓扑在网络图上的最优嵌入的问题。
覆盖构造所需要的信息是在任何两个网络节点间固定的网络延迟。互连拓扑是一满足结构约束的无向图G=(V,E)。最优映射问题包括将互连拓扑图的每个顶点与一网络覆盖节点相关联,以便最小化目标函数(如平均网络延迟)。
给定一组节点N(i),i=0...N-1,每个节点都具有一相关的网络空间向量,最优网络覆盖构造在于寻找最小化互连网络图的网络延迟(边权重)的总和的互连拓扑嵌入。
对于超立方体互连网络,最优拓扑嵌入在于寻找对网络节点的这样的索引(互连图的索引和网络覆盖节点之间的映射),其最小化:
S ( N ) = Σ i = 0 N - 1 Σ j = 0 , j ≠ i N - 1 d N ( N ( i ) , N ( j ) ) , d H ( I ( i ) , I ( j ) ) = 1 , 其中dH(I(i),I(j))是与对应于节点N(i)和N(j)的索引之间的汉明距离。
N=2m个节点的互连拓扑的映射涉及将2m个长度为m的二进制索引分配给网络覆盖节点N(i),i=1...N。假设I(i)是分配给节点N(i)的索引。一种映射算法将来自集合{I(i),i=1...2m}的二进制索引分配给每个覆盖节点{N(j),j=1...N}。互连拓扑到网络覆盖的最优映射最小化了所有互连拓扑边的总和。下面提出的是一种用于将一超立方体拓扑嵌入一网络覆盖中的多项式时间算法。该算法使用对网络覆盖节点的迭代簇索引。
一般地,根据本发明的至少一个实施例,这种算法的一主要思想是,将具有相同前缀的超立方体节点集合映射到网络节点簇(使用一网络延迟距离)。每个簇包含具有相同前缀的超立方体节点。根据[4],在基数为2k的其索引在(m-k)位簇前缀的最后一位不相同的两个超立方体节点集合之间正好有2k个边。因此,将索引前缀分配给2k个节点的簇消除了2k(2k-1)个边。超立方体嵌入算法在每一步贪婪地最大化由簇索引消除的网络覆盖边权重(网络延迟)的总和。
优选地,进行节点子集的迭代分割以使整个网络图的被消除的边权重的总和最大化。每个分割优选地将当前覆盖节点集合分割成两个基数相等的子集。该分割是沿被分割的节点集合的主轴进行的。主轴是通过使用一PCA变换将该集合中的节点坐标进行局部变换得到。分割重复进行直到达到基数为1的集合。节点索引是通过将可变长度的索引分配给每个集合来构造的。集合索引在经过j次分割后长度为j。集合索引在每次分割后扩展一位,并遵循邻近法则:如果两个簇中心都在父簇主轴的同侧,则包含父簇对角线节点的子集使用相同的位扩展;否则,簇使用互补位扩展。包含索引扩展为“0”的父集合的对角线节点的集合使用相同的位扩展。
节点集合分割以及索引扩展的过程如图3所示。在索引构造树的每一级别j,有多个集合,每个集合都有一长度为j的索引。树的叶节点是超立方体拓扑节点。每个叶节点连接到k个其它节点,这些节点是k个平行的树路径上的叶。在级别j处的一集合被分割成两个作为子的子集,每个子集包含父集合的节点的一半。使用上述的法则扩展子索引,仅使用父集合中心及其兄弟相对于主轴的位置。
表1(见下)中示出的是使用簇索引的用于网络覆盖中的超立方体互连拓扑嵌入的一种算法。
              表1:用于超立方体嵌入的簇索引
                         1.1簇索引
I.迭代索引构造:
1.从集合S(k,1)={ni,0≤i<N},N=2k中的所有节点开始,并从0索引级j=0开始。
2.按如下方式将级别j上(级别指示分割的数量)的2j个集合S(k-j,m),m=1..2j中的每个集合分割为具有相等基数的两个子集:S0((k-j)-1,m),S1((k-j)-1,m):
-在该集合S(k-j,m)上进行一PCA变换。
-选择沿主轴的任何节点对之间的最大距离 max 0 &le; o < p < 2 k - j , n 0 , n p &Element; S ( k - j , m ) { d ( n 0 , n p ) } ; 节点nj,m,0和nj,m,1(对角线节点)相应于集合的节点中的在主轴上的最大距离;
-将集合S(k-j,m)分割成两个具有相等基数的子集S0((k-j)-1,m),S1((k-j)-1,m),从而S0((k-j)-1,m)包含nj,m,0并且S1((k-j)-1,m)包含nj,m,1-见分割算法。
3.索引扩展:以如下方式递增等级j处的2j个父中的每一个的索引I(k-j,m),I(k-j,m+1),m=2*k-1,k=1..2j-1
-令兄弟集合S(k-j,m)和S(k-j,m+1)的父集合的对角线节点为
Figure A20051010957100112
且对应的索引扩展为
Figure A20051010957100114
Figure A20051010957100115
为S(k-j,m)的主轴的向量。
-计算
Figure A20051010957100117
I(k-j+1,2*m-1)=I0(k-j,m),I(k-j+1,2*m)=I1(k-j,m)
else I(k-j+1,2*m-1)=I1(k-j,m),I(k-j+1,2*m)=I0(k-j,m)
Figure A200510109571001110
Figure A200510109571001111
I(k-j+1,2*m+1)=I0(k-j,m+1),I(k-j+1,2*m+2)=I1(k-j,m+1)
else
I(k-j+1,2*m+1)=I1(k-j,m+1),I(k-j+1,2*m+2)=I0(k-j,m+1
4.如果j<k,j=j+1,则从1迭代该分割。
                      1.2覆盖节点分割
II集合分割:
使用对角线节点nj,m,0和nj,m,1将基数为2k-j的集合S(k-j,m)={ni,i=0..2k-j-1}分割为子集S0((k-j)-1,m),S1((k-j)-1,m):
for(i=0;i<2k-j;i++)
Figure A20051010957100121
<2k-j-1)‖(card(S1((k-j)-1,m))==2k-j-1))
将ni添加到S0((k-j)-1,m);
else
将ni添加到S1((k-j)-1,m);
表2(如下)中给出的是一种使用簇索引的用于在网络覆盖中的超立方体互连拓扑嵌入的算法。在索引分配后,根据互连网络连接规则构造网络覆盖拓扑。因此,一种用于超立方体拓扑的覆盖构造的方法优选地为如下:
            表2:用于分布式网络覆盖构造的方法
1.每个网络覆盖节点接收在互连拓扑中其直接邻居(在互连拓扑中与其相距为汉明距离1的节点)的集合网络地址及索引。节点N(i)具有相应的IP地址IP(i)及分配的如前面部分I(i)中计算的索引。
for(i=0;i<N;i+)
{
  Index_list=I(i);
  for(j=0;j<N;j++)
  {if(distanceHamming(I(i),I(j))==1)
  insert(IP(j),I(j),Index_list);
  }
  Send(IP(i),Index_list);
}
2.接着网络覆盖的每个节点N(i)与其具有更大索引的邻居建立连接(以避免重复网络连接)。
While((j=0;j<size(Index_list);j++)&&(I(j)>I(i))
{
open Connection(IP(j));
}
3.每个网络节点创建一个包含相邻节点的应用索引及其IP地址的路由表;该路由表的构造如下所述。
下面所述的超立方体嵌入算法可以非常容易地并行化。通过图嵌入的网络覆盖的构造可以被分布到一组2k个控制节点中,每一个控制节点为一网络节点簇构造一大小为2p(p=m-k)的覆盖。在覆盖构造前,对应于具有相同前缀的超立方体节点的2k个索引集合被分配给每个控制器。
优选地,如表3所示,用于分布式网络覆盖构造的算法的步骤为:
                表3:分布式超立方体嵌入算法
1.使用网络延迟将网络覆盖节点分簇在基数<2p的2k个簇中
2.在2k个簇控制器覆盖节点的每一个处收集网络测量值;
3.将具有相同前缀的2p个索引的集合分配给每个覆盖控制器
4.通过在每个覆盖控制器处嵌入大小2p的超立方体来构造覆盖
然后该分布式网络覆盖构造继续进行到遵循如在表4(见下)中所示的类似步骤的、覆盖的分布式构造。每个覆盖节点在其簇中有p个邻居且在2k个簇的每一个中有1个邻居;邻居节点的计算需要首先分布在每个覆盖控制器处计算的映射,然后在每个控制器处分布式计算分簇的覆盖节点的相邻集合。网络覆盖的分布式构造的步骤在表4中给出。
表4:用于分布式超立方体嵌入的网络覆盖构造
1.为每个网络覆盖节点计算相邻节点的集合:
a.2p个覆盖控制器的每一个将其超立方体网络索引的映射广播到所有的控制器;
b.每个控制器为其簇中的每个覆盖节点计算(IP地址,索引)对的相邻集合。
c.每个控制器向簇中每个覆盖节点发送(IP地址,索引)对的集合。
2.每个覆盖节点打开到其相邻集合中的所有覆盖节点的网络连接;
3.每个覆盖节点从其相邻集合创建路由表。
参与到嵌入的超立方体的分布式构造的节点将需要实现一通信协议以交换测量值、选择邻居、并向这些邻居发起和接收连接。该协议优选地将支持下列对应于不同消息类型的操作:
·控制节点指示其它节点针对一组潜在邻居进行延迟测量。消息将包含该组其它节点(并且可能包含待进行的测量的类型)。
·各节点向控制节点报告(延迟)测量值。该消息包括对每个目标节点的测量的延迟。
·控制节点将一超立方体索引分配给一节点并提供其邻居的地址。
·一节点请求建立超立方体中的与另一个节点的相邻关系。
该协议也将优选地包括用于建立与控制节点连接的消息、认证连接和控制节点的消息、报告错误情况的消息、以及在失去连接时将其重新建立的消息。
一般地,分布式索引应用需要这样的网络覆盖,该网络覆盖根据一组包含在应用层报头中的索引来路由数据包。为从应用数据路由中抽象出网络覆盖管理,覆盖节点创建通过网络节点的被分配的索引(例如,超立方体网络索引)来寻址网络节点的路由表。然后,应用使用网络索引来查找/检索数据项/对象。在每个网络覆盖节点处本地创建和管理被分布到相邻覆盖节点的应用标识符的本地索引。下面给出的是为基于索引的应用层路由创建路由表的方法。
1.路由表的创建和管理
这涉及到在每个网络覆盖节点处从包含覆盖网络节点索引及其IP地址对的相邻集合创建表查找。该表优选地由每个覆盖节点本地管理。由于网络节点的增加、节点的去除或索引的重新分配而在从超立方体索引到网络覆盖节点的映射中改变被分布到其相邻集合被修改了的覆盖节点中;每个覆盖节点将此改变应用到其本地表而不需要在用于路由数据包的应用层报头中有任何改变。
2.从相邻集合和应用对象索引创建应用层路由索引结构
应用层路由(ALR)优选地涉及基于包含在消息报头中的应用索引来路由消息。向每个应用对象分配一个标识符和多个描述符。根据应用对象索引和覆盖节点相邻集合计算分布式路由索引结构。ALR索引结构的构造优选地涉及:
1.通过对对象分簇将该组应用对象标识符分区以最大化在同一分区中的对象描述符的相似性;
2.将分区映射到被索引的网络节点以最小化总的消息路由开销;
3.在每个网络覆盖节点[2]处构造ALR索引结构[2]。
下一跳网络节点的地址是通过使用包含在消息报头中的描述符查询层次索引来获得的;查询的结果是一组下一跳网络节点索引。网络节点地址是通过查找在路由列表中的网络索引获得的。最后,数据优选地被转发给每个由路由列表查询所输出地网络地址。
按前面所述构造的覆盖提供了一种用于控制大规模组通信[3]、内容分发网络、和发布-订阅系统的高效的网络基础结构。网络覆盖节点由其被分配的索引(如,在此处提出的覆盖构造方法中分配的超立方体索引)来标识。
在大规模组通信中,向每个通信组分配一标识符以及一组通信兴趣描述符(其描述该组中的客户的总合通信兴趣)。将通信控制信息分布到一管理组通信的控制器网络。根据包含在应用层报头中的通信兴趣描述符将控制消息在控制覆盖网络中路由。实时组通信约束要求具有最小路由延迟的控制覆盖网络。
在内容分发网络中,将对象标识符和一组内容描述符分配给应用对象(数据文件)。将对象标识符分区成子集,这些子集被分配给网络覆盖节点,并且在所分配的网络覆盖节点处复制对象(文件)。通过使用对象标识符或对象描述符查询对象的位置来查找对象。通过查询每个节点处的ALR索引结构以获得下一跳节点的地址,来在网络覆盖中路由包含该查询的消息。
在发布-订阅系统中,由一组在应用层中连网的代理来控制消息传递。客户订阅包括一组感兴趣的主题和它们的限定语。由发布者发送的消息包括主题和限定语以及发布的数据。代理寻找具有与发布的数据匹配的订阅兴趣的客户的子集。消息在被转发之前在应用层被“过滤”-即,在每一代理处通过将发布的数据描述符与客户订阅相匹配来计算下一跳节点的集合。可以使用本发明中所描述的互连拓扑嵌入方法来构造代理网络,从而最小化平均消息路由延迟。
作为简要重述,根据本发明的至少一个优选实施例,这里概略地考虑了一种用于使用图嵌入为网络覆盖构造收集网络信息的方法,其包括:在多个覆盖控制节点处的网络测量数据的收集;以及一网络测量数据结构的创建。
这里同样概略考虑了一种使用图嵌入对网络覆盖构造进行建模的方法,其包括:将覆盖建模为具有代表网络测量数据(网络节点对之间的延迟)的边权重的完整的网络图;将网络覆盖构造建模为将超立方体互连网络图嵌入到网络覆盖图中;以及将互连网络图索引分配给网络覆盖节点以使目标功能(如,具有互连图结构的网络覆盖的平均延迟)最小化。
进一步地,这里概略考虑了一种网络覆盖的分布式构造的方法,其包括:选择对应于网络覆盖结构的相邻节点的网络地址;将相邻网络节点地址的集合及其对应索引分配给每个网络覆盖节点;打开到相邻集合中的网络节点的网络连接;以及在每个网络覆盖节点处建立路由表。
应当理解,根据至少一个当前优选实施例,本发明包括一种用于提供网络覆盖图的装置和用于将互连网络嵌入到网络覆盖图中的装置。这些单元可以被共同实现在至少一台运行合适的软件程序的通用计算机中。这些单元也可以被实现在至少一个集成电路上或至少一个集成电路的一部分上。因此,应当理解本发明可以在硬件、软件或二者之结合中实现。
如果不作其它说明,认为此处提及和引用的所有专利、专利申请、专利出版物以及其它出版物(包括基于web的出版物)在此作为参考完全引入本文,就如同其全文出现在本文中一样。
虽然在里已参考附图说明了本发明的示例性实施例,应当理解本发明并不限于这些精确的实施例,并且本领域的技术人员可以在其中进行各种其他改变及修改而不脱离本发明的范围或精神。
参考文献
[1]“Interconnection Topologies and Routing for Parallel ProcessingSystems”,Kotsis,G,ACPC TR 92-19,1992.
[2]G.Popescu,Z.Liu,“Hierarchical space partitioning for scalable datadissemination in large-scale distributed interactive applications”.
[3]Dube,P.,Pendarakis,D.,Popescu,G.,“On the performance oflarge-scale distributed indexing architectures for dynamic groupcommunication”,to be submitted to ICC 2005.
[4]“Topological properties of the Hypercubes”,Y.Saad,M.Schultz,IEEETransaction on Computers,Vol.37,No.7.,July,1988.
[5]“Introduction to Parallel Algorithms and Architectures:Arrays,Trees,and Hypercubes”,F.T.Leighton,Morgan Kaufman,1992.
[6]I.Stoica,R.Morris,D.Karger,F.Kaashoek,and H.Balakrishnan,“Chord:A Scalable Content-Addressable Network”,In Proceedings of theACM SIGCOMM 2001 Technical Conference,San Diego,CA,USA,August 2001.
[7]S.Ratnasamy,P.Francis,M.Handley,R.Karp,and S.Shenker,“Ascalable content addressable network”In Proc ACM SIGCOMM,pages161-172,2001.

Claims (19)

1.一种便利网络覆盖构造的方法,所述方法包括以下步骤:
提供网络覆盖图;以及
将互连网络嵌入该网络覆盖图。
2.根据权利要求1所述的方法,还包括以下步骤:
在所述网络覆盖图中指定多个覆盖控制节点;
在该多个覆盖控制节点处收集网络测量数据;以及
创建网络测量数据结构。
3.根据权利要求1所述的方法,还包括以下步骤:
为所述覆盖网络构造建模;
所述提供网络覆盖图的步骤包括提供包含节点和边权重的完整的网络覆盖图,所述边权重表示网络测量数据;
所述嵌入步骤包括将超立方体互连网络图嵌入所述网络覆盖图;以及
将互连索引分配给节点,从而最小化目标函数。
4.根据权利要求3所述的方法,其中所述网络测量数据包括网络节点对之间的延迟。
5.根据权利要求3所述的方法,其中所述目标函数包括网络覆盖在所述超立方体互连网络图中的平均延迟。
6.根据权利要求3所述的方法,其中所述嵌入步骤包括将2m个长度为m的二进制索引分配给所述节点。
7.根据权利要求3所述的方法,其中所述嵌入步骤包括使用多项式时间算法。
8.根据权利要求7所述的方法,其中所述多项式时间算法使用以下各项中的至少一个:迭代簇划分和节点二进制索引分配。
9.根据权利要求1所述的方法,其中:
所述提供网络覆盖结构的步骤包括提供节点,每个节点包括节点地址及节点索引;以及
所述方法还包括:
选择对应于所述网络覆盖构造中的相邻节点的网络节点地址和相关节点索引;
将所选择的网络节点地址和相关索引分布到每个节点;
打开到对应于所选择的地址和索引的节点的网络连接;以及
在每个节点处建立至少一个相应的路由表。
10.一种用于便利网络覆盖构造的装置,所述装置包括:
用于提供网络覆盖图的装置;以及
用于将互连网络嵌入该网络覆盖图的装置。
11.根据权利要求10所述的装置,其中在所述网络覆盖图中指定多个覆盖控制节点,所述装置还包括:
用于在所述多个覆盖控制节点处收集网络测量数据的装置;以及
用于创建网络测量数据结构的装置。
12.根据权利要求10所述的装置,还包括:
用于为网络覆盖构造建模的装置;
所述网络覆盖图包括完整的网络覆盖图,该完整的网络覆盖图包括节点和边权重,所述边权重表示网络测量数据;
所述嵌入装置适合于将超立方体互连网络图嵌入所述网络覆盖图;以及
用于将互连索引分配给节点以便最小化目标函数的装置。
13.根据权利要求12所述的装置,其中所述网络测量数据包括网络节点对之间的延迟。
14.根据权利要求12所述的装置,其中所述目标函数包括网络覆盖在所述超立方互连网络图中的平均延迟。
15.根据权利要求12所述的装置,其中所述嵌入装置适合于将2m个长度为m的二进制索引分配给所述节点。
16.根据权利要求12所述的装置,其中所述嵌入装置使用多项式时间算法。
17.根据权利要求16所述的装置,其中所述多项式时间算法中使用以下各项中的至少一个:迭代簇划分和节点二进制索引分配。
18.根据权利要求10所述的装置,其中所述网络覆盖结构包含节点,每个节点包括节点地址和节点索引,所述装置还包括:
用于选择相应于所述网络覆盖结构中的相邻节点的网络节点地址和相关的节点索引的装置;
用于将所选择的网络节点地址和相关索引分布到每个节点的装置;
用于打开到相应于所选择的地址和索引的节点的网络连接的装置;以及
用于在每个节点处建立至少一个相应的路由表的装置。
19.一种可由机器读的程序存储装置,其有形地体现可由该机器执行以执行用于便利网络覆盖构造的方法步骤的指令程序,所述方法包括以下步骤:
提供网络覆盖图;以及
将互连网络嵌入到该网络覆盖图中。
CNA200510109571XA 2004-10-26 2005-10-26 通过互连拓扑嵌入高效地构造网络覆盖的方法 Pending CN1815989A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/973,329 2004-10-26
US10/973,329 US7466656B2 (en) 2004-10-26 2004-10-26 Method, apparatus and program storage device for efficient construction of network overlays through interconnection topology embedding

Publications (1)

Publication Number Publication Date
CN1815989A true CN1815989A (zh) 2006-08-09

Family

ID=36206080

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200510109571XA Pending CN1815989A (zh) 2004-10-26 2005-10-26 通过互连拓扑嵌入高效地构造网络覆盖的方法

Country Status (2)

Country Link
US (1) US7466656B2 (zh)
CN (1) CN1815989A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101674233B (zh) * 2008-09-12 2011-09-14 中国科学院声学研究所 基于彼得森图的存储网络系统及数据读写方法
CN101557300B (zh) * 2008-04-10 2012-08-08 华为技术有限公司 一种网络中的拓扑重构方法、装置及设备
CN102833151A (zh) * 2012-07-02 2012-12-19 上海交通大学 基于内容覆盖和反馈机制的用户个性化优先级路由算法
CN101364992B (zh) * 2007-08-10 2013-04-24 华为技术有限公司 提供数据、形成聚类及选择目标聚类的方法、系统及设备
CN104767693A (zh) * 2015-03-18 2015-07-08 中国科学技术大学苏州研究院 一种基于交换的交叉双折叠立方体网络结构
CN105306247A (zh) * 2014-06-19 2016-02-03 帕洛阿尔托研究中心公司 用于部署最小成本ccn拓扑的方法和设备

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060004714A1 (en) * 2004-06-30 2006-01-05 Ibm Corporation Transposition search method for optimal topology construction
US20060114911A1 (en) * 2004-11-03 2006-06-01 Applied Expert Systems, Inc. Collection and analysis of route data for "Forward and Reverse" routes
US7468952B2 (en) * 2005-11-29 2008-12-23 Sony Computer Entertainment Inc. Broadcast messaging in peer to peer overlay network
US7953785B2 (en) * 2006-06-30 2011-05-31 Microsoft Corporation Content synchronization in a file sharing environment
US7756064B2 (en) * 2007-01-19 2010-07-13 Lockheed Martin Corporation Reduced complexity staged topologies for wireless communications
US7756063B2 (en) * 2007-01-19 2010-07-13 Lockheed Martin Corporation Parallel wireless topologies
US7756062B2 (en) * 2007-01-19 2010-07-13 Lockheed Martin Corporation Periodically reconfigured networks
CN100438450C (zh) * 2007-02-08 2008-11-26 北京航空航天大学 稳定节能分群维护方法
US8275866B2 (en) 2007-11-13 2012-09-25 At&T Intellectual Property I, L.P. Assigning telecommunications nodes to community of interest clusters
US7380005B1 (en) * 2007-11-20 2008-05-27 International Business Machines Corporation Systems, methods and computer program products for improving placement performance of message transforms by exploiting aggressive replication
US7840677B2 (en) * 2008-03-11 2010-11-23 International Business Machines Corporation Systems, methods and computer program products for improving placement performance of message transforms by exploiting guided replication
WO2010035565A1 (ja) * 2008-09-29 2010-04-01 日本電気株式会社 距離メトリック推定システム、座標算出ノード、距離メトリック推定方法及びプログラム
US8180887B2 (en) * 2008-12-16 2012-05-15 Microsoft Corporation Geolocation mapping of network devices
US9537747B2 (en) * 2010-06-11 2017-01-03 International Business Machines Corporation Publish/subscribe overlay network control system
US20120023260A1 (en) * 2010-07-26 2012-01-26 International Business Machines Corporation Diagonally enhanced concentrated hypercube topology
CN102420797B (zh) * 2010-09-27 2014-10-22 北京系统工程研究所 一种拓扑映射方法及系统
US20140189082A1 (en) * 2012-12-28 2014-07-03 Futurewei Technologies, Inc. Local Partitioning in a Distributed Communication System
US9077613B2 (en) 2013-04-10 2015-07-07 International Business Machines Corporation System and method for graph based K-redundant resiliency for IT cloud
JP6459630B2 (ja) * 2015-02-27 2019-01-30 富士通株式会社 データ転送制御装置、データ転送制御プログラム、および並列計算システム
CN104935462B (zh) * 2015-06-02 2018-10-19 清华大学 一种端服务器部署方法及装置
CN106790620B (zh) * 2016-12-30 2020-02-11 许昌学院 一种分布式大数据处理方法
US11216420B2 (en) 2018-07-31 2022-01-04 Nutanix, Inc. System and method for high replication factor (RF) data replication
US10936810B2 (en) 2018-12-04 2021-03-02 International Business Machines Corporation Token embedding based on target-context pairs
JP7167687B2 (ja) * 2018-12-18 2022-11-09 富士通株式会社 情報処理装置、情報処理方法および情報処理プログラム
US11388136B2 (en) * 2019-06-18 2022-07-12 Nutanix, Inc. Dynamic distributed service location discovery

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6920497B1 (en) * 2000-07-31 2005-07-19 The Boeing Company Contacting a broadcast channel
US6910069B1 (en) * 2000-07-31 2005-06-21 The Boeing Company Joining a broadcast channel
AU2002323364A1 (en) * 2001-08-24 2003-03-10 Peribit Networks, Inc. Dynamic multi-point meshed overlay network
US6856991B1 (en) * 2002-03-19 2005-02-15 Cisco Technology, Inc. Method and apparatus for routing data to a load balanced server using MPLS packet labels
US7388841B2 (en) * 2003-10-20 2008-06-17 Mitsubishi Electric Research Laboratories, Inc. Selecting multiple paths in overlay networks for streaming data
US7593353B2 (en) * 2004-03-13 2009-09-22 International Business Machines Corporation Methods and apparatus for content delivery via application level multicast with minimum communication delay
US7355975B2 (en) * 2004-04-30 2008-04-08 International Business Machines Corporation Method and apparatus for group communication with end-to-end reliability
US7782787B2 (en) * 2004-06-18 2010-08-24 Avaya Inc. Rapid fault detection and recovery for internet protocol telephony
US7814426B2 (en) * 2004-06-30 2010-10-12 Sap Aktiengesellschaft Reusable component in a collaboration workspace
US7853615B2 (en) 2004-09-03 2010-12-14 International Business Machines Corporation Hierarchical space partitioning for scalable data dissemination in large-scale distributed interactive applications

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101364992B (zh) * 2007-08-10 2013-04-24 华为技术有限公司 提供数据、形成聚类及选择目标聚类的方法、系统及设备
CN101557300B (zh) * 2008-04-10 2012-08-08 华为技术有限公司 一种网络中的拓扑重构方法、装置及设备
CN101674233B (zh) * 2008-09-12 2011-09-14 中国科学院声学研究所 基于彼得森图的存储网络系统及数据读写方法
CN102833151A (zh) * 2012-07-02 2012-12-19 上海交通大学 基于内容覆盖和反馈机制的用户个性化优先级路由算法
CN102833151B (zh) * 2012-07-02 2015-07-08 上海交通大学 基于内容覆盖和反馈机制的用户个性化优先级路由方法
CN105306247A (zh) * 2014-06-19 2016-02-03 帕洛阿尔托研究中心公司 用于部署最小成本ccn拓扑的方法和设备
CN104767693A (zh) * 2015-03-18 2015-07-08 中国科学技术大学苏州研究院 一种基于交换的交叉双折叠立方体网络结构
CN104767693B (zh) * 2015-03-18 2018-05-11 中国科学技术大学苏州研究院 一种基于交换的交叉双折叠立方体网络结构

Also Published As

Publication number Publication date
US7466656B2 (en) 2008-12-16
US20060087986A1 (en) 2006-04-27

Similar Documents

Publication Publication Date Title
CN1815989A (zh) 通过互连拓扑嵌入高效地构造网络覆盖的方法
Newsome et al. GEM: Graph embedding for routing and data-centric storage in sensor networks without geographic information
US8756253B2 (en) Two-level structured overlay design for cluster management in a peer-to-peer network
Xu et al. Building low-maintenance expressways for p2p systems
CN100342698C (zh) 对转发信息进行动态管理的分布式路由器及其方法
US9160571B2 (en) Requesting a service from a multicast network
CN1764171A (zh) 将资源请求与对应的资源会合
KR101120847B1 (ko) 데이터 오버레이, 자가-조직 메타데이터 오버레이 및 애플리케이션 레벨 멀티캐스팅
CN1620027A (zh) 基于测量构件的基于目标覆盖网络
US20050223102A1 (en) Routing in peer-to-peer networks
CN1270728A (zh) 快速路由查找的方法和系统
CN102143199A (zh) 获取内容的方法、节点及内容网络
CN1404591A (zh) 执行高速互联网协议路由查找和管理路由选择/转发表的装置和方法
JP2009508410A (ja) マルチデスティネーション・ルーティングを利用したピアツーピア・オーバーレイ通信の並列実行
CN109905497A (zh) 一种IPv6活跃地址动态发现方法
CN1692616A (zh) 对等环境中的网络流量控制
JP5324266B2 (ja) P2pモードで記憶されたコンテンツにアクセスするようにピア識別子を得る要求を管理する方法、それに関連する管理装置及びネットワーク装置
CN1832454A (zh) 在移动网络之间路由的方法和设备
CN1968164A (zh) 基于全局Internet拓扑知识的P2P应用构建方法
Wu et al. LDHT: Locality-aware distributed hash tables
EP2057822A1 (en) System and method for the location of caches
CN1152516C (zh) Ip网络节点发现方法
JP5692757B2 (ja) P2pネットワークのノード情報を提供するサーバ、方法、およびシステム
CN1885812A (zh) 一种流媒体点播系统中时间相关的对等网络组织方法
Bertier et al. D2HT: the best of both worlds, Integrating RPS and DHT

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
C20 Patent right or utility model deemed to be abandoned or is abandoned