CN101605150B - 对等网络的优化容错机制 - Google Patents
对等网络的优化容错机制 Download PDFInfo
- Publication number
- CN101605150B CN101605150B CN200910148821.9A CN200910148821A CN101605150B CN 101605150 B CN101605150 B CN 101605150B CN 200910148821 A CN200910148821 A CN 200910148821A CN 101605150 B CN101605150 B CN 101605150B
- Authority
- CN
- China
- Prior art keywords
- node
- peer
- network
- management equipment
- peer network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0893—Assignment of logical groups to network elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
- H04L67/1044—Group management mechanisms
- H04L67/1046—Joining mechanisms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/40—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Computer And Data Communications (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
- Information Transfer Between Computers (AREA)
Abstract
一种通信单元(E2),包括至少一个与包含其它通信单元(E1)的通信网络(NTEL)的接口,以及用于处理来自所述其它通信单元的请求(Req)的对等网络(Np2p),所述对等网络包括多个节点(N1,N2,N3,N4,N5),其分布在一组处理设备之间并排列成环状。对等网络与管理设备相关联,该管理设备包括用于将新节点插入对等网络内的准入装置。通信单元用于使得用于处理所述请求的上下文信息存储在节点中,其特征在于,准入装置还用于确定部署在同一个处理设备上的相邻节点对,以及将新节点插入所述相邻节点对的两个节点之间。
Description
技术领域
本发明涉及对等网络在一组处理设备上的部署。更具体地,本发明涉及对于通信应用使用这些对等网络。
背景技术
特别在一组处理节点上分发某些电信应用是已知的。这样,每个节点只处理寻址到该应用的那部分请求,并且可以基于处理这些请求所需要的资源,动态地(如果需要)调整节点的数量。这种体系结构也意味着应用可以容易地通过节点之间固有的冗余进行容错。
然而,对于某些应用,仍然存在上下文信息在该组节点内的位置。某些应用,诸如信令单元可要求上下文存储在其所发送的两个消息之间。该上下文可以用于适当地处理后面的消息。这是SIP或“代理SIP”信令单元的情况,该信令单元必须基于SIP会话的状态处理请求(SIP是指“会话初始化协议”)。
对于这种类型的应用,还需要首先存储该上下文信息,然后才能够在合适的时刻定位所述信息。
一个可能的方法涉及具有每个节点可访问的集中式数据库,其可以存储并取回用于其管理的会话的上下文信息。
然而,当该集中式数据库在硬盘或等同的硬件支持上实现时,信息访问时间变得有限制,并使该解决方案不适合于要求非常短的响应时间的应用,诸如电信应用。
在存储器中实现数据库解决了该访问时间的问题,但是结合冗余以分发访问的负载并满足容错限制的需求使系统变得复杂。实际上,它涉及构成与一组处理节点分离的基础网络。除了这种方法在智能级别看起来不很满意之外,它还引起配置问题并且管理不灵活且不容易。
通过使用所分发的哈希表,对等网络用于以对应用的开发者和应用之外且必须与所述应用通信的设备自动并透明的方式解决这些问题。
图1以简图方式示出包括N个节点X1、X2、X3、X4……XN的对等网络。
将被存储的上下文信息与在该组节点上分发的密钥相关联。一般地,该分发由哈希函数执行,该函数用于当在这些节点中获得好的负载分布时将密钥的空间投射到节点的空间。
上下文信息可以根据密钥找到。相同的哈希函数的应用可以用于确定与该密钥相关联的节点,然后取回存储在该节点上并与密钥相关联的信息。
为了使系统容错,对于在密钥与上下文信息之间的每个关联一般试图在第二节点上被复制。这样,如果第一节点不再工作,则上下文信息可以从该第二节点中取回。
通常用于确定哪个节点必须存储上下文信息的副本的简单算法包括选择后继者,换句话说,遵循对等网络的顺序的节点。这种选择的优势是如果节点故障,则可以立即定位上下文信息的副本。因此,这避免了故障之后的不确定时间段,要求额外的程序以正确地管理该时间段,而不会冒对请求的不正确响应的风险。
因此,如果应用于被要求的密钥的哈希函数指定节点X2,并且该节点不再是可访问的或者不再包含故障之后的信息,则系统自动确定所需要的上下文信息的副本位于节点X3中。
对等网络的这些实现在Ian Stoica、Robert Morris、David Karger、M.Frans Kaashoek和Hari Balakrishnan的文章“Chord:A ScalablePeer-to-peer Lookup Service for Internet Application”(ACM SIGCOMM2001,加州圣地亚哥,2001年8月,第149-160页)中进行了更为详细的描述。
然而,在实践中,容错的技术问题一直存在。在实践中,对等网络被部署在处理设备网络上。由于这些设备逐渐强大,因此,有利于在同一个设备上部署几个节点。在图1的例子中,节点X2和X3位于设备M2上,节点X1和XN位于设备M1上,而节点X4位于设备M3上。
结果,如果处理设备遭遇了故障,则当前节点可能受到影响而不再工作。因此,如果处理设备M2发生故障,则两个节点X2和X3不再工作。
然而,根据涉及将信息的副本设置在后继节点上的传统算法,存储在节点X2上的信息在节点X3上进行复制。结果是,不管现有技术的容错机制,与该节点相关联的上下文信息不再可用。
因此,现有技术不适合于提供足够的容错。本发明的目的是通过提高对等网络的管理来克服该不足。
发明内容
为此,本发明的第一个目的是提供对等网络管理设备,其包括一组节点,其分布在一组处理设备中并排列成环状,以致每个节点具有唯一的后继节点。管理设备包括用于将新节点插入对等网络的准入装置(或者准入元件)。其特征在于,准入装置还用于确定部署在同一个处理设备上的相邻节点对,并将该新节点插入所确定的相邻节点对的两个节点之间。
准入装置可以例如是由与所述节点不同的设备实现的准入元件,或者是由对等网络的节点的全部或部分实现的准入元件。
本发明还具有提供通信单元的目的,其包括至少一个与包含其它通信单元的通信网络的接口,以及用于处理来自这些其它通信单元的请求的对等网络。对等网络包括多个节点,其分布在一组处理设备中并排列成环状,以致每个节点具有唯一的后继节点。该对等网络还与包括将新节点插入对等网络的准入装置的管理设备相关联。
根据本发明的通信单元使得用于处理请求的上下文信息被存储在节点中,其特征在于,准入装置用于确定部署在同一个处理设备上的相邻节点对,并将新节点插入在所述相邻节点对的两个节点之间。
上下文信息可以在后继节点中复制。
准入装置可以例如是由与所述节点不同的设备实现的准入元件,或者是由网络的节点的全部或部分实现的准入元件。
与通信网络的接口可以用于发送符合SIP协议的信令消息。
附图说明
在以下参照附图的说明中,本发明将变得更加清楚。
图1以简图的方式示出符合现有技术的对等网络。
图2以简图形式示出根据本发明的部署在一组处理设备上的对等网络。
图3a和3b示出存储在对等网络中的信息的分布。
图4示出根据本发明的通信单元。
具体实施方式
首先,将描述对等网络和管理设备,然后描述在通信单元内的应用。
图2示出了对等网络,其部署在包含3个处理设备M1、M2和M3的网络上。对等网络包括排列成环状的一组节点N1、N2、N3和N4,以致每个节点具有唯一的后继节点(和唯一的前继节点)。
附着于该对等网络的是管理设备,其特别包括准入装置。这些准入装置负责在对等网络内插入新节点。可升级性是对等网络的本质特性,在节点可以在任意时间添加或去除并且网络必须设计为自组织的意义上。
如果我们假定网络在给定的时间包括节点N1、N2和N3,新节点N4的准入包括在已构建的网络内确定进入的节点的位置,以及在该组节点中确定新的密钥分发。该分发尤其用于通过从新节点在处理和存储资源方面的贡献中提取来分发负载。
图3a和3b更清楚地示出确定新的密钥分发。
每个水平线代表密钥的空间。当前在网络中的节点被放置在这些线上。这些节点的每一个都与密钥的子集合相关联,对应于其所存储的密钥。
图3a对应于第一种情况,其中网络包括节点N1、N2和N3组成。每一个节点存储与整个密钥集合的三分之一对应的子集合。在图3a中,该子集合对应于位于其左边的水平线的部分,直到前一个节点或者该线的起点。
当节点N4将被加入对等网络时,准入装置确定其必须在网络内占据的位置以及密钥的分发。
在处理设备M1、M2、M3、M4上部署的节点的定位可以由准入装置触发,但是该位置的确定通常是由管理系统的其它模块负责。例如,对于该位置,可以试图由基础的操作系统确定,而不需要准入装置有装置来控制。
准入装置是可由与对等网络的节点不同的设备实现的准入元件。它也可以由这些节点的全部或部分实现。因此,新进入的节点可以被寻址到任何已是网络的成员的节点,或者被寻址到承担特定准入功能的这些节点的一部分。
根据本发明,准入元件用于确定部署在同一个处理设备上的相邻节点对。如果在对等网络内一个节点是另一个节点的后继者,则两个节点是相邻的。例如,在网络是由节点形成的情况下,如果我们假定在给定时间,网络包括节点N1、N2、N3,那么节点N1和N2是相邻的,节点N2和N3是相邻的,节点N1和N3是相邻的。节点N2和N3形成唯一的部署在同一个处理设备M2上的相邻节点对。
然后准入元件用于将新节点N4插入在该节点对的两个节点N2、N3之间。
新的对等网络形成环状,包括按顺序排列的节点N1、N2、N4和N3。因此,相邻节点对N2、N3被打破,不再有部署在同一个处理设备上的相邻节点对。更一般地,新节点的准入用于减少这些节点对的数量一个单位。
如果没有该类型的节点对,则准入元件可以根据现有技术进行操作,例如将新节点插入在该网络形成的环的最后一个节点与第一个节点之间。
图3b示出在节点N2和N3之间加入的节点N4。对等网络配置自身,以致以前与节点N3相关联的密钥的子集合被分成两部分,最左侧的部分与新节点N4相关联,最右侧的部分保持与节点N3相关联。这两部分差不多是相同的大小。
新与节点N4相关联的密钥部分从节点N3传递到该新节点。与这些密钥一起,与其相关联的信息也被传递。在下面将要描述的具有通信单元的应用的情况下,该信息可以是上下文信息。
为了确保对等网络的容错,(上下文)信息在后继节点上被复制。后继节点是网络N1、N2、N4、N3的按环形顺序的跟随节点。
由于新节点插入对等网络的方式,每个节点的后继者并不位于与该节点相同的处理设备上。
因此,节点N2的后继者现在是部署在处理设备M3上的节点N4。
如果处理设备M2遭遇故障,则位于设备M3上的节点N4可以提供来自节点N2的信息的副本,而位于设备M1上的节点N1可以提供来自节点N3的信息的副本。
因此,在节点N4准入之前网络状态中由节点N2和N3引起的问题得到了解决。
图4示出根据本发明的具有通信单元的对等网络的应用。这可以是通信体系结构中的应用服务器,诸如IMS(IP多媒体子系统)体系结构。它也可以是信令单元,诸如符合如IETF的RFC 3261规定的SIP协议(会话初始化协议)的代理,或者IMS体系结构中的CSCF功能(呼叫会话控制功能)。
该通信单元E2具有接收通过通信网络NTEL来自另一个单元E1的请求Req的装置。该请求Req由负载分发模块LB处理,用于对于通信会话的每个第一个请求,确定哪个节点N1、N2、N3、N4、N5必须处理该请求。这些节点形成如前所描述的对等网络Np2p。
该请求的处理可导致上下文信息的生成,该上下文信息对于属于同一个会话的另一个请求的处理是有用或必需的。
关联由应用于会话标识符(例如,发起通信单元E1的IP地址,SIP请求的“呼叫ID”字头等等)的哈希函数进行。该哈希函数的结果可以直接给出节点的号码对网络中的节点的数量的模。这些不同的机制在现有技术中是已知的,在此不做详细描述。可以参考前面提到有关“Chord”的机制的文章以获得一些详情。
在图4的例子中,上下文信息C存储在节点N2中。该上下文信息在其后继者节点N3中被复制。正如我们之前所看到的,对等网络Np2p的管理设备的准入模块已经确保相邻节点N2和N3不被部署在同一个处理设备上。
这样,属于同一个会话的下一个请求可以通过重新获得在节点N2上存在的上下文信息来处理,如果该节点N2发生故障,则重新获得在其后继者节点N3上存在的上下文信息。
由于两个节点N2和N3不在同一个处理设备上,则这些节点同时发生故障的概率非常低。
因此,本发明解决了技术问题,而没有根本改变现有的对等网络管理的机制。
Claims (8)
1.一种用于对等网络的管理设备,包括:
多个节点,其分布在多个处理设备之中并排列成环状,以致每个节点具有唯一的后继节点,所述管理设备被配置为将新节点插入所述对等网络内,确定所述多个节点中部署在同一个处理设备上的相邻节点对,以及将所述新节点插入所述相邻节点对的两个节点之间。
2.根据权利要求1所述的管理设备,其中,所述管理设备是由与所述多个节点不同的设备实现的准入元件。
3.根据权利要求1所述的管理设备,其中,所述管理设备是由所述多个节点中的至少一个实现的准入元件。
4.一种通信单元,包括:
至少一个与包含通信单元的通信网络的接口;以及
用于处理来自所述通信单元的请求的对等网络,所述对等网络包括多个节点,其分布在多个处理设备之中并排列成环状,以致每个节点具有唯一的后继节点;所述对等网络与管理设备相关联,所述管理设备被配置为将新节点插入所述对等网络内,所述多个节点被配置为存储用于处理所述请求的上下文信息,
其中,所述管理设备被配置为确定所述多个节点中部署在同一个处理设备上的相邻节点对,并将所述新节点插入所述相邻节点对的两个节点之间。
5.根据权利要求4所述的通信单元,其中,存储在所述多个节点中的一个中的所述上下文信息在对应的所述唯一的后继节点中的一个中复制。
6.根据权利要求4所述的通信单元,其中,所述管理设备是由与所述多个节点不同的设备实现的准入元件。
7.根据权利要求4所述的通信单元,其中,所述管理设备是由所述多个节点中的至少一个实现的准入元件。
8.根据权利要求4所述的通信单元,其中,所述与所述通信网络的接口被配置为发送符合会话初始化协议SIP的信令消息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0853867 | 2008-06-11 | ||
FR0853867A FR2932629B1 (fr) | 2008-06-11 | 2008-06-11 | Mecanisme de tolerance aux fautes optimise pour reseau pair-a-pair |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101605150A CN101605150A (zh) | 2009-12-16 |
CN101605150B true CN101605150B (zh) | 2014-12-24 |
Family
ID=40343681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910148821.9A Expired - Fee Related CN101605150B (zh) | 2008-06-11 | 2009-06-11 | 对等网络的优化容错机制 |
Country Status (10)
Country | Link |
---|---|
US (1) | US9294559B2 (zh) |
EP (1) | EP2134033B1 (zh) |
JP (1) | JP5226124B2 (zh) |
KR (1) | KR101507197B1 (zh) |
CN (1) | CN101605150B (zh) |
AT (1) | ATE495608T1 (zh) |
DE (1) | DE602009000558D1 (zh) |
ES (1) | ES2356711T3 (zh) |
FR (1) | FR2932629B1 (zh) |
WO (1) | WO2010000992A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102769614A (zh) * | 2012-07-03 | 2012-11-07 | 华中科技大学 | 一种基于分布式cscf拓扑的通信方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101110707A (zh) * | 2006-07-20 | 2008-01-23 | 阿尔卡特朗讯 | 对等网络中的分布式在线管理 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7035858B2 (en) * | 2002-04-29 | 2006-04-25 | Sun Microsystems, Inc. | System and method dynamic cluster membership in a distributed data system |
US7139925B2 (en) * | 2002-04-29 | 2006-11-21 | Sun Microsystems, Inc. | System and method for dynamic cluster adjustment to node failures in a distributed data system |
US7206836B2 (en) * | 2002-09-23 | 2007-04-17 | Sun Microsystems, Inc. | System and method for reforming a distributed data system cluster after temporary node failures or restarts |
US7239605B2 (en) * | 2002-09-23 | 2007-07-03 | Sun Microsystems, Inc. | Item and method for performing a cluster topology self-healing process in a distributed data system cluster |
US20040254984A1 (en) * | 2003-06-12 | 2004-12-16 | Sun Microsystems, Inc | System and method for coordinating cluster serviceability updates over distributed consensus within a distributed data system cluster |
JP2005198201A (ja) * | 2004-01-09 | 2005-07-21 | Ntt Docomo Inc | ネットワークトポロジー構成方法及びノード |
EP1999871A2 (en) * | 2006-03-10 | 2008-12-10 | Peerant Inc. | Peer to peer inbound contact center |
US7881223B2 (en) * | 2006-03-31 | 2011-02-01 | Panasonic Corporation | Method for on demand distributed hash table update |
-
2008
- 2008-06-11 FR FR0853867A patent/FR2932629B1/fr not_active Expired - Fee Related
-
2009
- 2009-05-11 ES ES09159875T patent/ES2356711T3/es active Active
- 2009-05-11 EP EP09159875A patent/EP2134033B1/fr not_active Not-in-force
- 2009-05-11 KR KR1020107027747A patent/KR101507197B1/ko not_active IP Right Cessation
- 2009-05-11 AT AT09159875T patent/ATE495608T1/de not_active IP Right Cessation
- 2009-05-11 WO PCT/FR2009/050853 patent/WO2010000992A1/fr active Application Filing
- 2009-05-11 DE DE602009000558T patent/DE602009000558D1/de active Active
- 2009-05-11 JP JP2011513024A patent/JP5226124B2/ja not_active Expired - Fee Related
- 2009-06-10 US US12/457,413 patent/US9294559B2/en not_active Expired - Fee Related
- 2009-06-11 CN CN200910148821.9A patent/CN101605150B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101110707A (zh) * | 2006-07-20 | 2008-01-23 | 阿尔卡特朗讯 | 对等网络中的分布式在线管理 |
Also Published As
Publication number | Publication date |
---|---|
JP5226124B2 (ja) | 2013-07-03 |
DE602009000558D1 (de) | 2011-02-24 |
JP2011524679A (ja) | 2011-09-01 |
CN101605150A (zh) | 2009-12-16 |
FR2932629A1 (fr) | 2009-12-18 |
EP2134033B1 (fr) | 2011-01-12 |
KR101507197B1 (ko) | 2015-03-30 |
FR2932629B1 (fr) | 2010-05-28 |
ES2356711T3 (es) | 2011-04-12 |
KR20110040757A (ko) | 2011-04-20 |
US9294559B2 (en) | 2016-03-22 |
WO2010000992A1 (fr) | 2010-01-07 |
EP2134033A1 (fr) | 2009-12-16 |
ATE495608T1 (de) | 2011-01-15 |
US20090313375A1 (en) | 2009-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5016063B2 (ja) | 整合性のとれた耐障害性分散ハッシュテーブル(dht)オーバレイネットワーク | |
JP5049344B2 (ja) | ランデブーフェデレーション内の近傍域間通信 | |
KR101183050B1 (ko) | 자기조직화 네트워크들을 위한 분산 해싱 메커니즘 | |
JP2009543447A (ja) | ランデブーフェデレーション内の近傍域間通信 | |
JP2009543447A5 (zh) | ||
CN103098437B (zh) | 基于sip的呼叫会话服务器和消息路由选择方法 | |
CN101356769A (zh) | 对等消息格式数据结构 | |
US20120136962A1 (en) | Systems and methods for distributing data | |
US20120036187A1 (en) | Decentralized data casting in an iterest aware peer network | |
JP2005536956A (ja) | 通信ネットワークにおけるリソースを提供するための方法 | |
WO2005081453A1 (en) | Nonstop service system using voting and, information updating and providing method in the same | |
CN102037711B (zh) | 在对等网络中限制存储消息 | |
CN101242251A (zh) | 提高p2p重叠网稳定性的方法和装置 | |
CN101605150B (zh) | 对等网络的优化容错机制 | |
US8072982B2 (en) | Gateway entity for distinguishing between different messages without full knowledge of underlying protocol | |
US20100121980A1 (en) | Method of generating round robin service order lists for improving service performance during server failures | |
CN1745541A (zh) | 基于网际协议的通信系统的资源共享 | |
KR101584837B1 (ko) | 피어 투 피어 네트워크에 최적화된 장애 허용 메커니즘 | |
JP5542216B2 (ja) | ピアツーピアネットワークのノードの個別再起動 | |
JP2012248091A (ja) | 信号振分複製先決定システム、信号振分複製先決定方法およびプログラム | |
US7788347B2 (en) | Method and apparatus for configuring a network node using multiple peer-to-peer layers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20141224 Termination date: 20180611 |