CN109412838A

CN109412838A - 基于散列计算以及性能评估的服务器集群主节点选择方法

Info

Publication number: CN109412838A
Application number: CN201811151372.9A
Authority: CN
Inventors: 吴志培
Original assignee: Individual
Current assignee: Individual
Priority date: 2018-09-29
Filing date: 2018-09-29
Publication date: 2019-03-01

Abstract

本发明提出基于散列计算及性能评估的服务器集群主节点选择方法，涉及计算机领域，所述方法包括：由管理节点向全部数据节点发起问讯，选出最大节点Xdn；管理节点向全部数据节点分配随机数值，各不相等；Xdn内节点分别向周围节点开展问讯，收集分配数值，并随机生成Key；发送该key的节点建立长联接，并通知管理节点；管理节点收到从节点的通知后，进行投票统计；在所有节点完成投票后，选出最多投票节点集Ydn。本发明在多台服务器一起集群的工作时，若主节点发生了故障，需要快速的挑选出一台可用的节点，通过散列的计算方式寻找出性能最优能保证最持久工作的节点，选出的主节点空闲算力最高，成为主节点后能长久高效工作。

Description

基于散列计算以及性能评估的服务器集群主节点选择方法

技术领域

本发明涉及计算机技术领域，尤其是一种基于散列计算以及性能评估的服务器集群主节点选择方法。

背景技术

目前，随着信息技术的不断发展，集群技术正在越来越多的领域中被广泛应用，常见的如服务集群、SAN(Storage Area Network，网络存储)等。服务集群是一组计算机系统，其作为一个整体向用户提供一组计算资源。这些单个的计算机系统就是服务集群的计算节点(Node)。在应用集群的技术中，服务集群通常会按照一定的策略设置主从节点，然后主从节点按各自承担的任务工作。在一个服务集群中，主节点监控从节点的工作状态。服务集群中主节点可能在运行过程中出现单点故障的问题。

相关技术中，为了解决服务集群中主节点可能出现的单点故障问题，通常会在服务器集群中设置多个可以作为主节点的计算机。当无主节点或原主节点故障情况下，就进入“选举”状态，通过投票方式选出新的主节点，集群所有提交状态又会通过新的主节点分发给集群所有节点，从而使分布式集群的状态重新恢复可用。现有各算法没有考虑算力问题，无法保障选出的主节点服务器性能最优，从而不能保障其最大程度长时间的运转；其次，算力因素很难通过评估来预测，通过实际计算比较是最可靠的做法。服务器最主要算力因素是CPU 和内存，散列计算可以对CPU和内存性能进行极好的测试；且散列计算结果概率均衡(即高小熵)，计算过程公平；且通过对散列计算结果前N位为零的规则设定，可以有效控制计算难度，从而对选出主节点耗费时间进行有效的控制，以免浪费算力，造成集群服务中断，体现本算法的灵活性；散列计算验证时极为容易，将分配数值+Key进行相同的散列计算即可，只进行一次计算，方便从节点快速验证。

发明内容

本发明提供一种基于散列计算及性能评估的服务器集群主节点选择方法，应用于无主节点或原主节点故障情况下，所述方法包括：

S1、由管理节点向全部数据节点发起问讯，收集数据版本号，选出版本号最大的节点，即数据最新的节点集Xdn；

如果Xdn个数为1，则以该节点为主节点，算法结束；

如果Xdn个数大于1，则进入S2；

S2、管理节点向全部数据节点分配随机数值，各不相等，然后通知Xdn内节点开始S3；

S3、Xdn内节点分别向周围节点开展问讯，收集他们的分配数值，并尝试随机生成Key，使得收集到的分配数值+Key，进行散列计算后，产生的散列值的前N位为零；

S4、从节点收到Key后，用相同散列计算验证、通过，则与发送该Key的 Xdn内节点建立长联接，并通知管理节点；

S5、管理节点收到从节点的通知后，进行投票统计，并通知其他节点停止对该从节点的Key计算；

S6、在所有从节点完成投票后，选出最多投票节点集Ydn；

如果Ydn个数为1，则为主节点，算法结束；

如果Ydn个数大于1，则以分配数值最大的从节点投票的Ydn候选节点为主节点，算法结束。

作为优选，所述步骤S3中散列计算，详细步骤如下：

S3.1收集从节点的分配数值，记为Num；

S3.2Xdn内节点随机生成Key；

S3.3将Num和Key做字符串相加得到新的数值记为V；

S3.4将V进行散列计算，例如SHA1，得到二进制串B；

S3.5验证B是否满足前N位为零，如满足，结束；

如不满足，重复步骤S3.2至S3.4直至B满足S3.5的验证要求。

本发明提供的一种基于散列计算以及性能评估的服务器集群主节点选择方法，其有益效果在于：在多台服务器一起集群的工作时，若主节点服务器发生了故障，需要快速的挑选出一台可用的服务器，通过散列的计算方式寻找出性能最优能保证最持久工作的服务器，选出的主节点空闲算力最高，成为主节点后更可能长久高效的工作。现有各算法没有考虑算力问题，无法保障选出的主节点服务器性能最优，从而不能保障其最大程度长时间的运转；其次，算力因素很难通过评估来预测，通过实际计算比较是最可靠的做法。服务器最主要算力因素是CPU和内存，散列计算可以对CPU和内存性能进行极好的测试；且散列计算结果概率均衡(即高小熵)，计算过程公平；且通过对散列计算结果前N 位为零的规则设定，可以有效控制计算难度，从而对选出主节点耗费时间进行有效的控制，以免浪费算力，造成集群服务中断，体现本算法的灵活性；散列计算验证时极为容易，将分配数值+Key进行相同的散列计算即可，只进行一次计算，方便从节点快速验证。

附图说明

图1是本发明主节点选择方法的流程图；

图2是散列计算的流程图。

具体实施方式

为进一步说明各实施例，本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。

现结合具体实施方式对本发明进一步说明。

本实施例提供的一种基于散列计算及性能评估的服务器集群主节点选择方法，应用于无主节点或原主节点故障情况下，如图1、2所示，所述方法包括：

如果Xdn个数为1，则以该节点为主节点，算法结束；

如果Xdn个数大于1，则进入S2；

S3、Xdn内节点分别向周围节点开展问讯，收集他们的分配数值，并尝试随机生成Key，使得收集到的分配数值+Key，进行散列计算后，产生的散列值的前N位为零(N可以根据实际需要调整，可以有效控制难度，从而对选出主节点耗费时间进行有效的控制)；

S6、在所有从节点完成投票后，选出最多投票节点集Ydn；

如果Ydn个数为1，则为主节点，算法结束；

上述的一种基于散列计算以及性能评估的服务器集群主节点选择方法，其特征在于所述步骤S3中散列计算，计算过程包括如下步骤：

S3.1收集从节点的分配数值，记为Num；

S3.2Xdn内节点随机生成Key；

S3.3将Num和Key做字符串相加得到数值记为V；

S3.4将V进行散列计算，得到二进制串B；

S3.5验证B是否满足前N位为零，如满足，结束；

如不满足，重复步骤S3.2到S3.4直至B满足S3.5的验证要求。

本实施例中，根据权利要求1所述的一种基于散列计算以及性能评估的服务器集群主节点选择方法，通过控制前N位为零以控制难度和时效的说明，设置平均计算次数为C(N)，概率由于散列计算结果均匀分布，所以P(N)＝P(N) 2¹/2ⁿ，平均计算次数C(N)＝2ⁿ，假设节点每一秒能进行m此散列计算，则平均计算时间T(N)＝2ⁿ/m，平均需要2ⁿ次散列计算才能获得一个满足条件的Key，时间随N增大而增大，随节点计算能力m增大而减小。

本实施例的主节点选择方法，具体计算过程如下：

设从节点i，从节点总个数为k，候选节点集Xdn中的候选节点j，j∈Xdn， T_ij为候选节点j对从节点i的计算时间，则从节点的投票目标为:

候选节点j的投票数：

说明：函数I[condition]为二进制函数，condition为真时取1，为假时取0，用以计数。

得票数最多的节点集Ydn为:

候选节点j的最大从节点分配随机数值Key

i满足N(i)＝j,则最终主节点Z为:

本发明提供的一种基于散列计算以及性能评估的服务器集群主节点选择方法，在多台服务器一起集群的工作时，若主节点服务器发生了故障，需要快速的挑选出一台可用的服务器，通过散列的计算方式寻找出性能最优能保证最持久工作的服务器，选出的主节点空闲算力最高，成为主节点后更可能长久高效的工作。

尽管结合优选实施方案具体展示和介绍了本发明，但所属领域的技术人员应该明白，在不脱离所附权利要求书所限定的本发明的精神和范围内，在形式上和细节上可以对本发明做出各种变化，均为本发明的保护范围。

Claims

1.一种基于散列计算及性能评估的服务器集群主节点选择方法，应用于无主节点或原主节点故障情况下，其特征在于，所述方法包括：

如果Xdn个数为1，则以该节点为主节点，算法结束；

如果Xdn个数大于1，则进入S2；

S4、从节点收到Key后，用相同散列计算验证、通过，则与发送该Key的Xdn内节点建立长联接，并通知管理节点；

S6、在所有从节点完成投票后，选出最多投票节点集Ydn；

如果Ydn个数为1，则为主节点，算法结束；

2.根据权利要求1所述的基于散列计算及性能评估的服务器集群主节点选择方法，其特征在于，所述步骤S3中散列计算，详细步骤如下：

S3.1收集从节点的分配数值，记为Num；

S3.2Xdn内节点随机生成Key；

S3.3将Num和Key做字符串相加得到新的数值记为V；

S3.4将V进行散列计算，例如SHA1，得到二进制串B；

S3.5验证B是否满足前N位为零，如满足，结束；

如不满足，重复步骤S3.2至S3.4直至B满足S3.5的验证要求。