CN107888393B - 一种非对称冗余通信链路中生成全连接集合的方法 - Google Patents
一种非对称冗余通信链路中生成全连接集合的方法 Download PDFInfo
- Publication number
- CN107888393B CN107888393B CN201610863785.4A CN201610863785A CN107888393B CN 107888393 B CN107888393 B CN 107888393B CN 201610863785 A CN201610863785 A CN 201610863785A CN 107888393 B CN107888393 B CN 107888393B
- Authority
- CN
- China
- Prior art keywords
- connection
- nodes
- full
- new
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 11
- 238000004891 communication Methods 0.000 title claims abstract description 10
- 238000001514 detection method Methods 0.000 claims abstract description 4
- 230000009191 jumping Effects 0.000 claims 2
- 239000000523 sample Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明公开了一种非对称冗余通信链路中生成全连接集合的方法,每个节点都有对应的服务用于探测和响应探测。通过探测和响应探测的结果,每个节点建立和其他连接成功的列表、以及连接不成功节点的列表共同构成本地的网络状态连接。各节点之间同步网络连接状态,构成整个网络的连接状态列表。根据网络状态列表,将集群中节点划分为多个全连接集合。本发明(1)解决了全连接集合的生成问题;(2)能够尽可能的最大化生成全连接集合;(3)容易扩展,能够随着连接的断开和恢复自动进行调整集合;(4)在各节点间有同样的连接信息,所以会生成相同的最大连接集合,避免不一致的决定。
Description
技术领域
本发明涉计算机系统领域,尤其涉及一种生成全连接集合的方法。
背景技术
在计算机系统体系结构从集中式到分布式演变过程中,都会通过增加冗余链路的方式来增强网络的可靠性。但是增加的部件越多,部件出问题的几率越高,而且还会出现原来集中方式不会出现的问题。原来节点出现问题在每个节点的探测结果都会是一致的,但是在冗余链路工作方式,会出现某个节点在部分节点可以访问,但是另外部分节点不可以访问的情况,这时的分布式系统的调整优化就会出现多种可能。
如图1所示,节点1通过交换机2之间的链路3或链路4连接,全冗余连接中有两条链路失效,形成一个非对称的网络连接,即每个节点所能直接连接的个数和节点是不一样的,但是可以通过间接通信使每个节点都掌握连接信息。
随着分布式系统的发展,在通信异常、网络分区存在特有的三态(即成功、失败与超时),随机的节点故障。为了屏蔽这些底层的不稳定性,对外提供一个统一的、稳定的、可自我管理、自我恢复的服务具有重要意义。
发明内容
本发明为了解决上述问题,为此,本发明提供一种非对称冗余通信链路中生成全连接集合的方法,它具有(1)解决了全连接集合的生成问题;(2)能够尽可能的最大化生成全连接集合;(3)容易扩展,能够随着连接的断开和恢复自动进行调整集合;(4)在各节点间有同样的连接信息,所以会生成相同的最大连接集合,避免不一致的决定等优点。
为了实现上述目的,本发明采用如下技术方案。
一种非对称冗余通信链路中生成全连接集合的方法,每个节点都有对应的服务用于探测和响应探测。其步骤是:
步骤1、通过探测和响应探测的结果,每个节点建立和其他连接成功的列表、以及连接不成功节点的列表共同构成本地的网络状态连接。
步骤2、各节点之间同步网络连接状态,构成整个网络的连接状态列表。
步骤3、根据网络状态列表,将集群中节点划分为多个全连接集合,全连接集合要满足以下条件:(1)全连接集合中每两个节点之间都能够直接通信。(2)每个节点必定在一个全连接集合中。(3)最大全连接集合无法通过添加其他节点来构成更大的满足要求的全连接集合。
步骤4、验证各个集合是否达到过半的法定数量,如果多个集合都能达到过半的法定数量则选择集合中节点最多的方案,并选择该节点最多的集合为当前集合跳到步骤5。如果没有集合能够达到过半的法定数量,则选择包含当前节点作为当前全连接集合的集合方案,跳到步骤8。
步骤5、在集群备选节点中选择能够全连接当前集合节点的集合。如果当前集合是需要加入仲裁磁盘(quorum disk)才能达到过半的法定数量,则排除那些无法连接到仲裁磁盘(quorum disk)的备选节点。
步骤6、将备选节点和当前集合一起构成一个新的当前集合。
步骤7、找到具有最多数量节点的当前集合,然后和步骤3中发现的其他集合构成集合方案。
步骤8、提交这个集合方案给管理节点用于发布。如果方案涉及新旧管理节点的切换(比如新方案的最大的全连接当前集合不包含旧的管理节点),则将该方案提交给旧的管理节点进行执行(该方案包含当前集合)。
在集合切换时,一般会出现工作暂停的情况,为了提高执行效率,采用以下步骤加快集合发布后的执行效率:
步骤9、集合管理部分提供从最后一个执行了的发布集合之后,又发生变化的信息(包括连接断开和一系列的重建信息)。
步骤10、根据信息进行判断:
如果新的集合是旧集合的一部分(由于连接出现问题,或者仲裁磁盘(quorumdisk)出现变化而产生的新的集合),则新的集合会被立即发布。
如果新的集合和旧集合一致,只是由于一些临时性的连接错误出现而生成了新的集合,则新的集合不会被立即发布、或者不被发布。
如果新的集合和旧集合一致,只是由于增加了连接而且没有连接断开,新集合只是在旧集合基础上加强了冗余,则新集合不会被发布、或者不会被立即发布。
如果新集合是旧集合的超集,则新集合会等待一定超时时间后再发布。
如果在超时时间内,集合又发生了新的变化,又有更新的集合生成,则新集合不会发布,然后重复执行步骤10的判断。
本发明的有益效果:
(1)解决了全连接集合的生成问题;
(2)能够尽可能的最大化生成全连接集合;
(3)容易扩展,能够随着连接的断开和恢复自动进行调整集合;
(4)在各节点间有同样的连接信息,所以会生成相同的最大连接集合,避免不一致的决定。
附图说明
图1是非对称失效示意图;
图2是节点状态示意图;
图3是最大全连接集合示意图;
图中,1.节点、2.交换机、3.正常连接、4.异常连接、5.最大全连接集合。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
图2是由图1简化而来的网路拓扑图,在右图2b中这样可以直接看出左右两个节点实际是不连通的,上下节点可以连接到所有节点,是不对称的网络拓扑。左图2a是全连接网络拓扑。按步骤1~步骤10所描述的方法,确定的最大全连接集合如图3所示。
图3中左图3a的最大全连接集合包含所有节点,右图3b的最大全连接集合只包含三个节点。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (3)
1.一种非对称冗余通信链路中生成全连接集合的方法,其特征在于:每个节点都有对应的服务用于探测和响应探测;包含以下步骤:
步骤1、通过探测和响应探测的结果,每个节点建立和其他连接成功的列表、以及连接不成功节点的列表共同构成本地的网络状态连接;
步骤2、各节点之间同步网络连接状态,构成整个网络的连接状态列表;
步骤3、根据网络状态列表,将集群中节点划分为多个全连接集合;
步骤4、验证各个集合是否达到过半的法定数量;
如果多个集合都能达到过半的法定数量则选择集合中节点最多的方案,并选择该节点最多的集合为当前集合,跳到步骤5;
如果没有集合能够达到过半的法定数量,则选择包含当前节点作为当前全连接集合的集合方案,跳到步骤8;
步骤5、在集群备选节点中选择能够全连接当前集合节点的集合;
如果当前集合是需要加入仲裁磁盘才能达到过半的法定数量,则排除那些无法连接到仲裁磁盘的备选节点;
步骤6、将备选节点和当前集合一起构成一个新的当前集合;
步骤7、找到具有最多数量节点的当前集合,然后和步骤3中发现的其他集合构成集合方案;
步骤8、提交这个集合方案给管理节点用于发布;如果方案涉及新旧管理节点的切换,则将该方案提交给旧的管理节点进行执行。
2.如权利要求1所述的非对称冗余通信链路中生成全连接集合的方法,其特征在于:步骤3的全连接集合满足以下条件:(1)全连接集合中每两个节点之间都能够直接通信;(2)每个节点必定在一个全连接集合中;(3)最大全连接集合无法通过添加其他节点来构成更大的满足要求的全连接集合。
3.如权利要求1所述的非对称冗余通信链路中生成全连接集合的方法,其特征在于:步骤8后执行以下步骤:
步骤9、集合管理部分提供从最后一个执行了的发布集合之后,又发生变化的信息;
步骤10、根据信息进行判断:
如果新的集合是旧集合的一部分,则新的集合会被立即发布;
如果新的集合和旧集合一致,只是由于一些临时性的连接错误出现而生成了新的集合,则新的集合不会被立即发布、或者不被发布;
如果新的集合和旧集合一致,只是由于增加了连接而且没有连接断开,新集合只是在旧集合基础上加强了冗余,则新集合不会被发布、或者不会被立即发布;
如果新集合是旧集合的超集,则新集合会等待一定超时时间后再发布;
如果在超时时间内,集合又发生了新的变化,又有更新的集合生成,则新集合不会发布,重复执行步骤10的判断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610863785.4A CN107888393B (zh) | 2016-09-30 | 2016-09-30 | 一种非对称冗余通信链路中生成全连接集合的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610863785.4A CN107888393B (zh) | 2016-09-30 | 2016-09-30 | 一种非对称冗余通信链路中生成全连接集合的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107888393A CN107888393A (zh) | 2018-04-06 |
CN107888393B true CN107888393B (zh) | 2021-04-27 |
Family
ID=61769388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610863785.4A Active CN107888393B (zh) | 2016-09-30 | 2016-09-30 | 一种非对称冗余通信链路中生成全连接集合的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107888393B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112242913B (zh) * | 2019-07-18 | 2023-06-16 | 海能达通信股份有限公司 | 通信系统及通信节点 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402395A (zh) * | 2010-09-16 | 2012-04-04 | 上海中标软件有限公司 | 基于仲裁磁盘的高可用系统不间断运行方法 |
CN103368910A (zh) * | 2012-03-31 | 2013-10-23 | 国际商业机器公司 | 虚拟无线通信网络系统及其建立方法 |
CN103414752A (zh) * | 2013-07-16 | 2013-11-27 | 上海交通大学 | 一种网络感知的云数据中心虚拟机分配方法 |
-
2016
- 2016-09-30 CN CN201610863785.4A patent/CN107888393B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402395A (zh) * | 2010-09-16 | 2012-04-04 | 上海中标软件有限公司 | 基于仲裁磁盘的高可用系统不间断运行方法 |
CN103368910A (zh) * | 2012-03-31 | 2013-10-23 | 国际商业机器公司 | 虚拟无线通信网络系统及其建立方法 |
CN103414752A (zh) * | 2013-07-16 | 2013-11-27 | 上海交通大学 | 一种网络感知的云数据中心虚拟机分配方法 |
Non-Patent Citations (3)
Title |
---|
"Maximum clique-based resource allocation in device-to-device communications";Golnoosh Elhami ,etc.;《2015 IEEE 26th Annual International Symposium on Personal, Indoor, and Mobile Radio Communications (PIMRC)》;20150902;全文 * |
"基于极大全连通子图的无线Mesh网络网关部署研究";范人胜等;《小型资源计算机系统》;20151115;全文 * |
"最大团问题";佚名;《https://wenku.baidu.com/view/7e9876bd7375a417876f8f3a.html》;20150812;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN107888393A (zh) | 2018-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20070053283A1 (en) | Correlation and consolidation of link events to facilitate updating of status of source-destination routes in a multi-path network | |
US8923113B2 (en) | Optimizations in multi-destination tree calculations for layer 2 link state protocols | |
JP2005209201A (ja) | 高可用性クラスタにおけるノード管理 | |
Hu et al. | Adaptive slave controller assignment for fault-tolerant control plane in software-defined networking | |
CN104935481A (zh) | 一种分布式存储下基于冗余机制的数据恢复方法 | |
CN103383689A (zh) | 一种服务进程故障检测方法、装置及服务节点 | |
CN102882704B (zh) | 一种issu的软重启升级过程中的链路保护方法和设备 | |
CN111769981A (zh) | 去中心化架构主节点推选方法、数据文件传输方法、系统 | |
TW201931821A (zh) | 用於在分布式系統中使管理能力自恢復的方法和裝置 | |
CN112217847A (zh) | 微服务平台及其实现方法、电子设备及存储介质 | |
CN107277886A (zh) | 一种基于wifi的物联网设备自组网方法 | |
Fang et al. | A fast and load-aware controller failover mechanism for software-defined networks | |
CN104917827A (zh) | 一种实现oracle负载均衡集群的方法 | |
CN107888393B (zh) | 一种非对称冗余通信链路中生成全连接集合的方法 | |
CN113901047A (zh) | 一种基于内存数据库的简便集群主从选举方法 | |
Li et al. | Towards robust controller placement in software-defined networks against links failure | |
CN111880932A (zh) | 一种基于多网口的数据存储方法及装置 | |
CN111309515B (zh) | 一种容灾控制方法、装置及系统 | |
CN116545842A (zh) | 一种通信故障网络重构方法、系统、电子设备及存储介质 | |
CN111901448B (zh) | 一种集群节点故障场景ctdb虚拟ip均衡分配方法 | |
CN109753292B (zh) | 一种在多单实例数据库服务中部署多个应用的方法及装置 | |
KR101909264B1 (ko) | 분산 sdn 제어기 구조에서 제어기 장애 복구 시스템 및 방법 | |
CN101958845A (zh) | 一种覆盖网络环境下的多播路由树前向式重构恢复方法 | |
CN105141445A (zh) | 一种实现高可用集群系统中多流量组多备份的方法及装置 | |
Liu et al. | Edge node data replica management method for distribution Internet of Things |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |