WO2012163211A1 - 选择系统主节点的方法和设备 - Google Patents

选择系统主节点的方法和设备 Download PDF

Info

Publication number
WO2012163211A1
WO2012163211A1 PCT/CN2012/074983 CN2012074983W WO2012163211A1 WO 2012163211 A1 WO2012163211 A1 WO 2012163211A1 CN 2012074983 W CN2012074983 W CN 2012074983W WO 2012163211 A1 WO2012163211 A1 WO 2012163211A1
Authority
WO
WIPO (PCT)
Prior art keywords
node
resource
value
nodes
qualification value
Prior art date
Application number
PCT/CN2012/074983
Other languages
English (en)
French (fr)
Inventor
朱朋志
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2012163211A1 publication Critical patent/WO2012163211A1/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/30Decision processes by autonomous network management units using voting and bidding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays

Definitions

  • the present invention relates to network communication technologies, and in particular, to a method and apparatus for selecting a system master node.
  • a master node performs unified management of software and hardware resources in an entire system to ensure performance and stability of a distributed system. Choosing the right master node in the system has a significant impact on the performance of the system.
  • each node selected by the system operator to power on before powering up constitutes a partition, and a master node is manually selected in the partition.
  • the above scheme belongs to the manual intervention scheme, which cannot be implemented when there is no intervention, the arbitrariness is selected, and the primary node cannot be automatically selected after the system restarts.
  • the embodiments of the present invention provide a method and a device for selecting a system master node, which are used to solve the problem of the manual selection method existing in the prior art.
  • An aspect of the present invention provides a method for selecting a system master node, including:
  • the distance between the nodes is used to represent the external resource of the node; the eligibility value of each node is calculated according to the access delay parameter and the resource weight, and the eligibility value is used to represent a node and the remaining nodes.
  • the distance situation and the external resource condition of the node; according to the size of the qualification value, the primary node is selected for the system.
  • Another aspect of the present invention provides a device for selecting a system master node, including:
  • An obtaining module configured to determine system logic topology information and system resource information
  • a first determining module configured to calculate an access delay parameter between each two nodes in the system according to the system logic topology information, and calculate resource rights of each node in the system according to the system resource information
  • the access delay parameter is used to represent the distance between the nodes
  • the resource weight is used to represent the external resource of the node
  • a second determining module configured to calculate, according to the access delay parameter and the resource weight determined by the first determining module, an eligibility value of each node, where the eligibility value is used to represent a distance between a node and other nodes And the external resources of the node;
  • a selection module configured to select a primary node for the system according to the size of the qualification value determined by the second determining module.
  • the embodiment of the present invention determines the qualification value of each node in the system according to the system logic topology information and the system resource information, and determines the master node according to the qualification value, thereby realizing automatic selection of the master node and avoiding manual selection.
  • the problem caused by the program. BRIEF DESCRIPTION OF THE DRAWINGS
  • the drawings used in the description of the embodiments will be briefly described below. Obviously, the drawings in the following description are some of the present invention. For the embodiments, those skilled in the art can obtain other drawings according to the drawings without any creative labor.
  • FIG. 1 is a schematic flowchart of a method for selecting a primary node of a system according to an embodiment of the present invention
  • FIG. 2 is a schematic flowchart of another embodiment of a method for selecting a primary node of a system according to the present invention
  • FIG. 3 is a schematic diagram of a distributed system networking used in an embodiment of the present invention.
  • FIG. 4 is a schematic diagram of a logical topology corresponding to FIG. 3;
  • FIG. 5 is a schematic structural diagram of a device for selecting a primary node of a system according to the present invention.
  • the technical solutions in the embodiments of the present invention are clearly and completely described in the following with reference to the accompanying drawings in the embodiments of the present invention.
  • the embodiments are a part of the embodiments of the invention, and not all of the embodiments. All other embodiments obtained by those skilled in the art based on the embodiments of the present invention without creative efforts are within the scope of the present invention.
  • FIG. 1 is a schematic flowchart of a method for selecting a primary node of a system according to an embodiment of the present invention, including: Step 1 1: Determine system logic topology information and system resource information;
  • the device that selects the primary node of the system may be a Device Management Software (DMS) module.
  • DMS Device Management Software
  • the DMS can manage information about distributed systems.
  • the DMS stores system logic topology information (also known as Top Logic) and system resource information (also known as Source Map).
  • the system logic topology information may indicate a topology relationship between nodes in the distributed system.
  • the system logic topology information includes: the system includes a node, a node B, and a node C, and the distance between the node A and the node B is L1, the distance between node B and node C is L2.
  • the system resource information may be used to indicate the external resource of the node.
  • the system resource information may include: a storage device with a node A having no external connection, a node B having a plug-in capacity of C1, and a node C having a storage capacity of C2.
  • Step 12 Calculate an access delay parameter between each node in the system according to the system logic topology information, and calculate a resource weight of each node in the system according to the system resource information, where the access delay parameter is used.
  • the resource weight is used to represent the external resource of the node;
  • Step 13 The device selecting the primary node of the system calculates the qualification value of each node according to the access delay parameter and the resource weight, and the qualification value is used to represent the distance between a node and the remaining nodes and the plug-in of the node. Resource situation;
  • the extended resource configuration of each node in the distributed system is different, that is, the external device is different, for example, the node will be externally connected to the storage, PCIE expansion card and other peripherals; Selecting the master node affects the management efficiency of the master node to the system because the master node assumes the work of the resource agent. In addition, the distance between the primary node and the remaining nodes will also affect the quality of communication between the primary node and each of the remaining nodes.
  • the above qualification value can reflect the distance between the corresponding node and the rest of the nodes in the system and the external device of the node.
  • the distance between the above nodes and the rest of the nodes in the system can be characterized by the access delay parameters.
  • the external devices of the above nodes can be characterized by resource weights.
  • the calculation formula of the qualification value can be specifically referred to the subsequent embodiments.
  • Step 14 Select the device of the system master node to select the master node for the system according to the size of the qualification value.
  • the selection principle of the master node is as follows: the access delay parameters between the master node and the remaining nodes are as small as possible and the number of plug-in devices is as small as possible.
  • the node with the smallest qualification value is selected as the main node, or the node with the largest qualification value is selected as the main node.
  • the node with the lowest qualification value is used as the master node; when the qualification value is inversely proportional to the access delay parameter and inversely proportional to the situation of the external device, the node with the highest qualification value is selected as the master node.
  • the resource weight can be selected to be proportional to the situation of the external device, and can also be inversely proportional to the situation of the external device.
  • the calculation formula of the qualification value may be: ⁇ . ⁇ , where 4 is the qualification value of the node, 7; is the number of access delays between the node and the node, and 4 is the resource weight of the node ⁇ , ni, and A are the set constants, respectively.
  • the smallest node is selected as the primary node; or, when 4 is proportional to the external resource of the node, When the sum is positive, the smallest node is selected as the main node; or, when 4 is inversely proportional to the external resource of the node, and the negative value and the positive value are positive, then ⁇ is selected.
  • the largest node is the primary node.
  • the automatic selection of the master node can be realized, and the problem caused by the manual selection scheme can be avoided.
  • Step 201 The DMS reads system logic topology information (Top Logic) and system resource information (Source Map).
  • Step 202 The DMS calculates an access delay parameter (T) between each node in the system according to the system logic topology information, and calculates a resource weight (A) of each node in the system according to the system resource information.
  • T access delay parameter
  • A resource weight
  • Step 203 Calculate the qualification value Z of each node according to the access delay parameter T and the resource weight A, select the master node after sorting the Z, and then start the system with the master node to complete the system power-on.
  • FIG. 3 is a schematic diagram of a distributed system networking according to an embodiment of the present invention.
  • the distributed system shown in FIG. 3 is taken as an example.
  • the system includes a node A without an external device, and a node B extending the PCIE. Expanding smaller storage nodes, node 0 without external devices, expanding larger storage Node E, each node is connected through a switch.
  • FIG. 4 is a schematic diagram of the logic topology corresponding to FIG. 3.
  • the access delay parameters and resource weights can be separately calculated and the master node can be determined as follows.
  • T — T — T — T 1 T — T — T — , T — T — ⁇ — T — 4
  • the resource weight of each node can be calculated as follows:
  • the formula for calculating the qualification value is: Where ⁇ , is the qualification value of the node, 7; is the access delay parameter between the node and the node, and 4 is the resource weight of the node.
  • the qualification values of each node are obtained as follows:
  • A The smaller the eligibility value of a node is, the smaller the eligibility value is.
  • the smaller the eligibility value is selected as the main node in this embodiment.
  • T — T — T — T 1 T — T — T — , T — T — ⁇ — T — 4
  • the resource weight of each node can be calculated as follows:
  • the C node is connected to the disk storage device and has a small capacity.
  • the E node has a larger capacity due to the external disk storage device.
  • the calculation formula of the qualification value is: where ; ⁇ , is the qualification value of the node, 7; is the access delay parameter between the node and the node, and 4 is the resource weight of the node.
  • the qualification values of each node are obtained as follows:
  • T — T — T — T 1 T — T — T — , T — T — ⁇ — T — 4
  • the resource weight of each node can be calculated as follows:
  • the resource weight is 1, that is,
  • the formula for calculating the qualification value is: Where ⁇ , is the qualification value of the node, 7; is the access delay parameter between the node and the node, and 4 is the resource weight of the node.
  • the qualification values of each node are obtained: . ⁇ 2 . ⁇ 2 + T a 2 el 2 + 2 2 +3 : ! +4 2
  • calculation method is not limited to the above three types, and the remaining methods can be used.
  • Step 204 The DMS determines whether the selected primary node is invalid. If yes, go to step 205, otherwise go to step 206.
  • the system fault tolerance mechanism in the DMS can detect that the selected master node is damaged, so the DMS can determine that the master node is invalid.
  • Step 205 The DMS deletes the system logic topology information and system resource information corresponding to the selected primary node, and alarms. Then go to step 21 1.
  • Step 206 The DMS determines whether at least one of the system logic topology information and the system resource information changes. If yes, go to step 208, otherwise go to step 207.
  • Step 207 Continue running.
  • Step 208 The DMS determines whether the number of update retries is exceeded. If yes, go to step 209, otherwise go to step 210.
  • the number of update retries can be preset.
  • Step 209 Alarm, notify the administrator to handle it manually.
  • Step 210 The DMS updates the stored system logic topology information and system resource information.
  • Step 21 1 Reselect the primary node.
  • Step 212 Determine whether the primary node changes. If yes, go to step 213, otherwise go to step 214.
  • Step 213 Restart the system with a new primary node and power it on.
  • Step 214 Continue running.
  • the network information refers to at least one of system logic topology information and system resource information.
  • the automatic selection of the primary node can be implemented, the system interconnection performance can be improved, and the average delay between the primary node and the secondary nodes of the system can be reduced; the access efficiency of the extended device of the system can be improved; and the system can bootstrap after the failure of the primary node; Calculate the logical topology of the distributed system, determine the manpower time of the master node, and avoid the performance loss caused by manual selection.
  • the obtaining module 51 is configured to determine system logic topology information and system resource information.
  • the first determining module 52 is configured to calculate an access delay parameter between each node in the system according to the system logic topology information, and calculate a resource weight of each node in the system according to the system resource information, where The access delay parameter is used to represent the distance between the nodes, and the resource weight is used to represent the external resource condition of the node; the second determining module 53 is configured to use the access delay parameter and the resource determined by the first determining module.
  • Weighting calculating a qualification value of each node, the qualification value is used to represent a distance between a node and the remaining nodes, and an external resource situation of the node; the selecting module 54 is configured to determine, according to the second determining module The size of the qualification value is selected for the system.
  • the selecting module 54 is specifically configured to:
  • the node with the smallest qualification value is determined as the master node
  • the qualification value is inversely proportional to the distance between the nodes and the external resource condition, the node with the highest qualification value is determined as the master node.
  • the second determining module 52 calculates the qualification value by using the following formula:
  • ⁇ , ' ⁇ is the qualification value of the node, 7; is the access delay parameter between the node and the node, 4 is the resource weight of the node, and ni, and A are the set constants respectively.
  • the selecting module 54 is specifically configured to:
  • the device further includes: a first determining module, configured to determine whether the primary node selected by the selecting module has failed, and when invalidating, delete the qualification value of the primary node and reselect the new primary node.
  • a first determining module configured to determine whether the primary node selected by the selecting module has failed, and when invalidating, delete the qualification value of the primary node and reselect the new primary node.
  • the method further includes: a second determining module, configured to: when the first determining module obtains that the primary node is not invalid, determine whether at least one of the system logical topology information and the system resource information changes If a change occurs, the new primary node is reselected according to the changed system logic topology information and system resource information.
  • a second determining module configured to: when the first determining module obtains that the primary node is not invalid, determine whether at least one of the system logical topology information and the system resource information changes If a change occurs, the new primary node is reselected according to the changed system logic topology information and system resource information.
  • the method further includes: a third determining module, configured to: after the first determining module obtains the reselected primary node or the second determining module obtains the reselected primary node, determining whether the reselected primary node changes, and if a change occurs, Then power on again with the new primary node.
  • a third determining module configured to: after the first determining module obtains the reselected primary node or the second determining module obtains the reselected primary node, determining whether the reselected primary node changes, and if a change occurs, Then power on again with the new primary node.
  • the automatic selection of the master node can be realized, and the problem caused by the manual selection scheme can be avoided.
  • the foregoing program may be stored in a computer readable storage medium, and when executed, the program includes The foregoing steps of the method embodiment; and the foregoing storage medium includes: a medium that can store program codes, such as a ROM, a RAM, a magnetic disk, or an optical disk.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种选择系统主节点的方法和设备。本发明实施例包括确定系统逻辑拓扑信息和系统资源信息;根据所述系统逻辑拓扑信息计算系统内每两个节点间的访问延时参数,以及,根据所述系统资源信息计算系统内每个节点的资源权重,所述访问延时参数用于表征节点间的距离情况,所述资源权重用于表征节点的外挂资源情况;根据所述访问延时参数和资源权重,计算每个节点的资格值,所述资格值用于表征一个节点与其余节点间的距离情况和所述节点的外挂资源情况;根据所述资格值的大小,为所述系统选择主节点。本发明实施例可以实现系统主节点的自动选择,避免人工选择引起的问题。

Description

选择系统主节点的方法和设备 技术领域 本发明涉及网络通信技术, 尤其涉及一种选择系统主节点的方法和设备。 背景技术 在分布式系统中, 由主节点对整个系统中的软硬件资源进行统一的管理, 以保证分布式系统的性能与稳定。在系统中选择正确的主节点对系统的性能影 响重大。 现有技术中是由系统操作员在上电前选择上电的各节点组成一个分 区, 在该分区内手动选择一个主节点。
但是, 上述方案属于人工干预方案, 存在无人干预时无法实施、 选取存在 任意性、 系统重启后无法自动选取主节点等问题。 发明内容 本发明实施例提供一种选择系统主节点的方法和设备,用以解决现有技术 中存在的人工选取方式存在的问题。
本发明一方面提供了一种选择系统主节点的方法, 包括:
确定系统逻辑拓朴信息和系统资源信息;
根据所述系统逻辑拓朴信息计算系统内每两个节点间的访问延时参数,以 及,根据所述系统资源信息计算系统内每个节点的资源权重, 所述访问延时参 数用于表征节点间的距离情况, 所述资源权重用于表征节点的外挂资源情况; 根据所述访问延时参数和资源权重,计算每个节点的资格值, 所述资格值 用于表征一个节点与其余节点间的距离情况和所述节点的外挂资源情况; 根据所述资格值的大小 , 为所述系统选择主节点。
本发明另一方面提供了一种选择系统主节点的设备, 包括:
获取模块, 用于确定系统逻辑拓朴信息和系统资源信息;
第一确定模块,用于根据所述系统逻辑拓朴信息计算系统内每两个节点间 的访问延时参数, 以及,根据所述系统资源信息计算系统内每个节点的资源权 重, 所述访问延时参数用于表征节点间的距离情况, 所述资源权重用于表征节 点的外挂资源情况;
第二确定模块,用于根据所述第一确定模块确定的所述访问延时参数和资 源权重,计算每个节点的资格值, 所述资格值用于表征一个节点与其余节点间 的距离情况和所述节点的外挂资源情况;
选择模块, 用于根据所述第二确定模块确定的所述资格值的大小, 为所述 系统选择主节点。
由上述技术方案可知,本发明实施例通过根据系统逻辑拓朴信息和系统资 源信息确定系统内每个节点的资格值, 并根据资格值确定主节点, 可以实现主 节点的自动选择, 避免人工选择方案引起的问题。 附图说明 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所 需要使用的附图作一简单地介绍,显而易见地, 下面描述中的附图是本发明的 一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。
图 1为本发明选择系统主节点的方法一实施例的流程示意图;
图 2为本发明选择系统主节点的方法另一实施例的流程示意图;
图 3为本发明实施例釆用的一种分布式系统组网示意图;
图 4为图 3对应的逻辑拓朴示意图;
图 5为本发明选择系统主节点的设备结构示意图。 具体实施方式 为使本发明实施例的目的、技术方案和优点更加清楚, 下面将结合本发明 实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然, 所描述的实施例是本发明一部分实施例, 而不是全部的实施例。基于本发明中 的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其 他实施例, 都属于本发明保护的范围。
图 1为本发明选择系统主节点的方法一实施例的流程示意图, 包括: 步骤 1 1: 确定系统逻辑拓朴信息和系统资源信息;
其中,选择系统主节点的设备可以为设备管理软件( Device Management Software, DMS )模块。
DMS可以对分布式系统的相关信息进行管理, 例如, DMS中会保存系统 逻辑拓朴信息 (也称为 Top Logic )和系统资源信息 (也称为 Source Map ) 。 其中, 系统逻辑拓朴信息可以表明分布式系统中节点间的拓朴关系, 例如, 系 统逻辑拓朴信息包括: 系统中包括节点 、 节点 B和节点 C, 节点 A与节点 B之 间的距离为 L1 , 节点 B与节点 C之间的距离为 L2。 系统资源信息可以表明表征 节点的外挂资源情况, 例如, 系统资源信息可以包括: 节点 A无外挂、 节点 B 外挂容量为 C1的存储设备, 节点 C外挂容量为 C2的存储设备。
步骤 12:根据所述系统逻辑拓朴信息计算系统内每两个节点间的访问延时 参数, 以及, 根据所述系统资源信息计算系统内每个节点的资源权重, 所述访 问延时参数用于表征节点间的距离情况,所述资源权重用于表征节点的外挂资 源情况;
上述的访问延时参数以及资源权重的计算方法可以参见后续实施例。
步骤 13:选择系统主节点的设备根据所述访问延时参数和资源权重,计算 每个节点的资格值,所述资格值用于表征一个节点与其余节点间的距离情况和 所述节点的外挂资源情况;
其中,在生产环境中, 分布式系统中的各节点的扩展资源配置情况各不相 同, 即外挂设备情况不同, 例如节点会外接存储、 PCIE扩展卡等外设; 如果 将外挂设备较多的节点选为主节点会因为主节点承担资源代理的工作而影响 到主节点对系统的管理效率。 另外, 主节点与其余节点间的距离也将影响到主 节点与各其余节点之间的通信质量。
因此,上述的资格值能够反映对应的节点与系统中其余节点间的距离以及 该节点的外挂设备情况。上述的节点与系统中其余节点间的距离可以通过访问 延时参数表征, 上述的节点的外挂设备情况可以通过资源权重表征。
该资格值的计算公式具体可以参见后续实施例。
步骤 14:选择系统主节点的设备根据所述资格值的大小,为所述系统选择 主节点。 主节点的选择原则是:主节点与其余节点两两间的访问延时参数尽量小并 且外挂设备尽量少。
在具体实施时, 可以根据资格值的具体计算公式, 选择资格值最小的节点 为主节点, 或者选择资格值最大的节点为主节点。 资格值最小的节点作为主节点;当资格值与访问延时参数成反比且与外挂设备 情况成反比时, 选择资格值最大的节点作为主节点。 另外, 在具体实施时, 资 源权重可以选择为外挂设备情况成正比, 也可以选择与外挂设备情况成反比。
例如, 资格值的计算公式可以为: ζ^^^^.ΓΓχΜ ,其中, 4为节点 的 资格值, 7;.为节点 与节点 ·之间的访问延日 数, 4为节点 ζ·的资源权重, ni、 和 A分别为设置的常数。 当 4与节点 ζ·的外挂资源情况成反比, 且 m为正值以 及 A为负值时, 则选取 Ζ,.最小的节点为主节点; 或者, 当 4与节点 的外挂资源 情况成正比,且∞和 均为正值时,则选取 ζ,.最小的节点为主节点; 或者, 当 4 与节点 的外挂资源情况成反比,且 为负值以及 Α为正值时, 则选取 ζ,.最大的 节点为主节点。
本实施例通过根据系统逻辑拓朴信息和系统资源信息确定系统内每个节 点的资格值, 并根据资格值确定主节点, 可以实现主节点的自动选择, 避免人 工选择方案引起的问题。
图 2为本发明选择系统主节点的方法另一实施例的流程示意图, 包括: 步骤 201 : DMS读取系统逻辑拓朴信息 (Top Logic ) 和系统资源信息 ( Source Map ) 。
步骤 202: DMS根据系统逻辑拓朴信息计算系统内每两个节点间的访问延 时参数(T ) , 以及,根据系统资源信息计算系统内每个节点的资源权重(A ) 。
步骤 203: 根据访问延时参数 T和资源权重 A, 计算每个节点的资格值 Z, 并对 Z排序后选择主节点, 之后釆用主节点启动系统, 完成系统上电。
上述实施例中可以釆用如下方式确定访问延时参数、 资源权重、 资格值以 及主节点。 具体地, 图 3为本发明实施例釆用的一种分布式系统组网示意图, 以图 3所示的分布式系统为例, 该系统包括没有外接设备的节点 A、 扩展 PCIE 的节点 B、扩展较小的存储的节点〇、 没有外接设备的节点0、扩展较大的存储 的节点 E, 各节点通过交换机连接。 图 4为图 3对应的逻辑拓朴示意图。
依据上述的系统可以釆用如下方式分别计算访问延时参数和资源权重以 及确定主节点。
方式一:
在图 4中, 4叚设对于 、 B、 C、 D、 E节点, 每两个相邻节点延时相等, 归 一化单位时间为 1 , 则每两个节点间的访问延时参数分别为:
T — T — T — T =1 T — T — T — , T —T —^ - T — 4
ab be 1cd 1 de ■, 1 ac ~ 1bd ~ 1 ce ~ ^ ^ αά ~ 1be ~ J ^ 1 ae ~ ^ °
每个节点的资源权重可以如下计算:
B节点因外接 PCIE功能扩展设备, 资源权重低于 1, 假设为 4 =0.8;
C节点因外接磁盘存储设备且容量较小, 资源权重低于 1, 假设为 =0.9;
E节点因外接磁盘存储设备且容量较大, 资源权重低于 1, 且低于 4, 假 设为 4 = 0.6;
A节点和 D节点由于没有外接扩展设备, 资源权重为 1, 即 Α= ί=ι。 本方式中, 资格值的计算公式为:
Figure imgf000007_0001
其中, ζ,.为节点 的资格值, 7;.为节点 与节点 ·之间的访问延时参数, 4为 节点 的资源权重。
依据上述的计算公式以及各节点的访问延时参数和资源权重,得到各节点 的资格值为:
.477;
4.841;
Figure imgf000007_0002
A
+Th 2 c+Tc 2 d+Tc]― — 22 + 12 +12 +22 _
3.514;
A 0.9
+Th 2 d+Tc 2 d+T _ 32 +22 +12 + 12 _
:3.873;
A,
Figure imgf000008_0001
由于根据上述资格值的计算公式, 当一节点的外挂资源越少、与其余节点 的距离越近, 则资格值越小, 因此, 本实施例中将资格值最小的节点选为主节 点。 通过上述计算由于: Ac < Ad < Ab < Aa < Ae , 则选取节点 C作为主节点。
方式二:
在图 4中, 4叚设对于 、 B、 C、 D、 E节点, 每两个相邻节点延时相等, 归 一化单位时间为 1 , 则每两个节点间的访问延时参数分别为:
T — T — T — T =1 T — T — T — , T —T —^ - T — 4
ab be 1cd 1 de ■, 1 ac ~ 1bd ~ 1 ce ~ ^ ^ αά ~ 1be ~ J ^ 1 ae ~ ^ °
每个节点的资源权重可以如下计算:
B节点因外接 PCIE功能扩展设备, 资源权重高于 1, 假设为 4 =1.2;
C节点因外接磁盘存储设备且容量较小, 资源权重高于 1, 假设为 4=1.1; E节点因外接磁盘存储设备且容量较大, 资源权重高于 1, 且高于 4, 假 设为 4 =1.4;
A节点和 D节点由于没有外接扩展设备, 资源权重为 1, 即 Α= ί=ι。
本方式中, 资格值的计算公式为: 其中 ;Γζ,.为节点 的资格值, 7;.为节点 与节点 ·之间的访问延时参数, 4为 节点 的资源权重。
依据上述的计算公式以及各节点的访问延时参数和资源权重,得到各节点 的资格值为:
Ζα =(ΤΛαεαάα6)χΑα =(\ + 2 + 3 + 4)χ\ = \0;
Ζ, =(ΤΛ+Τ,ε + ΤΜ+Τ^χΑ, =(\ + \ + 2 + 3)χ\.2 = ^Α;
^=(^ + ¾c + ^ + ^)x =(2 + l + l + )xl.1 = 6.6;
Zd =(Tad+Tbd+Tcd+Tde)xAd =(3 + 2 + \ + \)x\ = 7;
4=σ + Γ¾δ+ ;δ + Γ)Χ4=(4 + 3 + 2 + 1)Χ1.4 = 14。
由于根据上述资格值的计算公式, 当一节点的外挂资源越少、与其余节点 的距离越近, 则资格值越小, 因此, 本实施例中将资格值最小的节点选为主节 点。 通过上述计算由于: Ac < Ad < Ab < Aa < Ae , 则选取节点 C作为主节点。 方式三:
在图 4中, 4叚设对于 、 B C D E节点, 每两个相邻节点延时相等, 归 一化单位时间为 1 , 则每两个节点间的访问延时参数分别为:
T — T — T — T =1 T — T — T — , T —T —^ - T — 4
ab be 1cd 1 de ■ , 1 ac ~ 1bd ~ 1 ce ~ ^ ^ αά ~ 1be ~ J ^ 1 ae ~ ^ °
每个节点的资源权重可以如下计算:
B节点因外接 PCIE功能扩展设备, 资源权重低于 1, 假设为 4 =0.8;
C节点因外接磁盘存储设备且容量较小, 资源权重低于 1, 假设为 =0.9;
E节点因外接磁盘存储设备且容量较大, 资源权重低于 1, 且低于 4, 假 设为 4 = 0.6;
A节点和 D节点由于没有外接扩展设备, 资源权重为 1, 即
Figure imgf000009_0001
本方式中, 资格值的计算公式为:
Figure imgf000009_0002
其中, Ζ,.为节点 的资格值, 7;.为节点 与节点 ·之间的访问延时参数, 4为 节点 的资源权重。
依据上述的计算公式以及各节点的访问延时参数和资源权重,得到各节点 的资格值为: . Τ2 . Τ2 + T a2e l2 + 22+3: !+42
Figure imgf000009_0003
1
= , d = , =0.258;
--T2 2+22+l 2 + l2
Figure imgf000009_0004
由于根据上述资格值的计算公式, 当一节点的外挂资源越少、与其余节点 的距离越近, 则资格值越大, 因此, 本实施例中将资格值最大的节点选为主节 点。 通过上述计算由于: Ac > Ad > Ab > Aa > Ae , 则选取节点 C作为主节点。
上述给出了三种计算方式, 但是, 可以理解的是, 计算方式并不限于上述 的三种, 也可以釆用其余方式。
步骤 204: DMS判断选择的主节点是否失效, 若是, 执行步骤 205, 否则 执行步骤 206。
其中, 当主节点失效后, DMS中的系统容错机制可以检测到该选择的主 节点已经损坏, 因此 DMS可以确定主节点失效。
步骤 205: DMS删除该选择的主节点对应的系统逻辑拓朴信息和系统资源 信息, 并报警。 之后执行步骤 21 1。
步骤 206: DMS判断系统逻辑拓朴信息与系统资源信息中的至少一项是否 发生变化, 若是, 执行步骤 208, 否则执行步骤 207。
步骤 207: 继续运行。
步骤 208: DMS判断是否超过更新重试次数, 若是, 执行步骤 209, 否则 执行步骤 210。
其中, 该更新重试次数可以预先设定。
步骤 209: 警, 通知管理员手动处理。
步骤 210: DMS更新存储的系统逻辑拓朴信息和系统资源信息。
步骤 21 1 : 重新选择主节点。
可以是, 釆用更新后的系统逻辑拓朴信息和系统资源信息重新计算 T和 A, 之后釆用新的 T和 A计算 Z, 并确定出新的主节点。
步骤 212: 判断主节点是否变化,若是,执行步骤 213, 否则执行步骤 214。 步骤 213: 釆用新的主节点重启系统并上电。
步骤 214: 继续运行。
可选的,上述的判断选择的主节点是否失效与判断网络信息是否发生变化 之间无时序限制关系, 例如, 可以如上述所示的先判断是否失效再判断网络信 息是否变化,也可以先判断网络信息是否发生变化再判断是否失效,也可以只 判断主节点是否失效或者网络信息是否发生变化。其中的网络信息是指系统逻 辑拓朴信息与系统资源信息中的至少一项。 本实施例可以实现主节点的自动选取,提升系统互联性能, 降低系统主节 点与各从节点之间的平均延迟; 提升系统扩展设备的访问效率; 解决主节点失 效后系统能够自举; 节省用于计算分布式系统逻辑拓朴、确定主节点人力时间 并避免人工选择所带来的性能损失。
图 5为本发明选择系统主节点的设备结构示意图, 包括获取模块 51、 第一 确定模块 52、 第二确定模块 53和选择模块 54; 获取模块 51用于确定系统逻辑 拓朴信息和系统资源信息;第一确定模块 52用于根据所述系统逻辑拓朴信息计 算系统内每两个节点间的访问延时参数, 以及,根据所述系统资源信息计算系 统内每个节点的资源权重, 所述访问延时参数用于表征节点间的距离情况, 所 述资源权重用于表征节点的外挂资源情况;第二确定模块 53用于根据所述第一 确定模块确定的所述访问延时参数和资源权重,计算每个节点的资格值, 所述 资格值用于表征一个节点与其余节点间的距离情况和所述节点的外挂资源情 况;选择模块 54用于根据所述第二确定模块确定的所述资格值的大小,为所述 系统选择主节点。
可选的, 所述选择模块 54具体用于:
如果所述资格值与节点间的距离和外挂资源情况成正比 ,则将资格值最小 时的节点确定为主节点; 或者,
如果所述资格值与节点间的距离和外挂资源情况成反比,则将资格值最大 时的节点确定为主节点。
可选的 , 所述第二确定模块 52釆用如下公式计算资格值:
Figure imgf000011_0001
其中 ;≠,' Ζ,.为节点 的资格值, 7;.为节点 与节点 ·之间的访问延时参数, 4为 节点 的资源权重, ni、 和 A分别为设置的常数。
可选的, 所述选择模块 54具体用于:
当 4与节点 ζ·的外挂资源情况成反比,且 m为正值以及 Α为负值时,则选取 Ζ,.最小的节点为主节点; 或者,
当 4与节点 ζ·的外挂资源情况成正比,且 m和 Α均为正值时, 则选取 ζ,.最小 的节点为主节点; 或者,
当 4与节点 ζ·的外挂资源情况成反比,且 m为负值以及 Α为正值时,则选取 ζ,.最大的节点为主节点。
可选的, 该设备还包括: 第一判断模块, 用于判断所述选择模块选择的所 述主节点是否已经失效, 当失效时,将所述主节点的资格值删除并重新选择新 的主节点。
可选的, 还包括: 第二判断模块, 用于当所述第一判断模块得到所述主节 点未失效时,判断所述系统逻辑拓朴信息和系统资源信息中的至少一项是否发 生变化,如果发生变化, 则根据变化后的系统逻辑拓朴信息和系统资源信息重 新选择新的主节点。
可选的, 还包括: 第三判断模块, 用于在第一判断模块得到重新选择主节 点或者第二判断模块得到重新选择主节点后,判断重新选择的主节点是否发生 变化, 如果发生变化, 则釆用新的主节点重新上电。
本实施例通过根据系统逻辑拓朴信息和系统资源信息确定系统内每个节 点的资格值, 并根据资格值确定主节点, 可以实现主节点的自动选择, 避免人 工选择方案引起的问题。
可以理解的是, 上述方法及设备中的相关特征可以相互参考。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可 以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储 介质中, 该程序在执行时, 执行包括上述方法实施例的步骤; 而前述的存储介 质包括: ROM、 RAM, 磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是: 以上实施例仅用以说明本发明的技术方案, 而非对其限 制; 尽管参照前述实施例对本发明进行了详细的说明, 本领域的普通技术人员 应当理解: 其依然可以对前述各实施例所记载的技术方案进行修改, 或者对其 中部分技术特征进行等同替换; 而这些修改或者替换, 并不使相应技术方案的 本质脱离本发明各实施例技术方案的精神和范围。

Claims

1、 一种选择系统主节点的方法, 其特征在于, 包括:
确定系统逻辑拓朴信息和系统资源信息;
根据所述系统逻辑拓朴信息计算系统内每两个节点间的访问延时参数,以 及,根据所述系统资源信息计算系统内每个节点的资源权重, 所述访问延时参 数用于表征节点间的距离情况, 所述资源权重用于表征节点的外挂资源情况; 根据所述访问延时参数和资源权重,计算每个节点的资格值, 所述资格值 用于表征一个节点与其余节点间的距离情况和所述节点的外挂资源情况;
根据所述资格值的大小 , 为所述系统选择主节点。
2、根据权利要求 1所述的方法,其特征在于,所述根据所述资格值的大小, 为所述系统选择主节点, 包括:
如果所述资格值与节点间的距离和外挂资源情况成正比 ,则将资格值最小 时的节点确定为主节点; 或者,
如果所述资格值与节点间的距离和外挂资源情况成反比,则将资格值最大 时的节点确定为主节点。
3、根据权利要求 1所述的方法, 其特征在于, 所述根据所述访问延时参数 和资源权重, 计算每个节点的资格值的计算公式为:
Figure imgf000013_0001
其中 ;≠,' ζ,.为节点 的资格值, 7;.为节点 与节点 ·之间的访问延时参数, 4为 节点 的资源权重, ni、 和 A分别为设置的常数。
4、根据权利要求 3所述的方法,其特征在于,所述根据所述资格值的大小, 为所述系统选择主节点, 包括:
当 4与节点 ζ·的外挂资源情况成反比,且 m为正值以及 Α为负值时,则选取 ζ,.最小的节点为主节点; 或者,
当 4与节点 ζ·的外挂资源情况成正比,且™和 Α均为正值时, 则选取 ζ,.最小 的节点为主节点; 或者,
当 4与节点 ζ·的外挂资源情况成反比,且™为负值以及 Α为正值时,则选取 ζ,.最大的节点为主节点。
5、 根据权利要求 1 -4任一项所述的方法, 其特征在于, 还包括:
判断所述主节点是否已经失效, 当失效时,将所述主节点的资格值删除并 重新选择新的主节点。
6、 根据权利要求 5所述的方法, 其特征在于, 还包括:
当所述主节点未失效时,判断所述系统逻辑拓朴信息和系统资源信息中的 至少一项是否发生变化, 如果发生变化, 则根据变化后的系统逻辑拓朴信息和 系统资源信息重新选择新的主节点。
7、 根据权利要求 6所述的方法, 其特征在于, 还包括:
判断重新选择的主节点是否发生变化, 如果发生变化, 则釆用新的主节点 重新上电。
8、 一种选择系统主节点的设备, 其特征在于, 包括:
获取模块, 用于确定系统逻辑拓朴信息和系统资源信息;
第一确定模块,用于根据所述系统逻辑拓朴信息计算系统内每两个节点间 的访问延时参数, 以及,根据所述系统资源信息计算系统内每个节点的资源权 重, 所述访问延时参数用于表征节点间的距离情况, 所述资源权重用于表征节 点的外挂资源情况;
第二确定模块,用于根据所述第一确定模块确定的所述访问延时参数和资 源权重,计算每个节点的资格值, 所述资格值用于表征一个节点与其余节点间 的距离情况和所述节点的外挂资源情况;
选择模块, 用于根据所述第二确定模块确定的所述资格值的大小, 为所述 系统选择主节点。
9、 根据权利要求 8所述的设备, 其特征在于, 所述选择模块具体用于: 如果所述资格值与节点间的距离和外挂资源情况成正比 ,则将资格值最小 时的节点确定为主节点; 或者,
如果所述资格值与节点间的距离和外挂资源情况成反比,则将资格值最大 时的节点确定为主节点。
10、 根据权利要求 8所述的设备, 其特征在于, 所述第二确定模块釆用如 下公式计算资格值:
Figure imgf000014_0001
其中 ;≠,' ζ,.为节点 的资格值, 7;.为节点 与节点 ·之间的访问延时参数, 4为 节点 的资源权重, 《、 和 Α分别为设置的常数。
1 1、 根据权利要求 1 0所述的设备, 其特征在于, 所述选择模块具体用于: 当 4与节点 ζ·的外挂资源情况成反比,且 m为正值以及 Α为负值时,则选取 ζ,.最小的节点为主节点; 或者,
当 4与节点 ζ·的外挂资源情况成正比,且 m和 Α均为正值时, 则选取 ζ,.最小 的节点为主节点; 或者,
当 4与节点 ζ·的外挂资源情况成反比,且™为负值以及 Α为正值时,则选取 ζ,.最大的节点为主节点。
12、 根据权利要求 8-1 1任一项所述的设备, 其特征在于, 还包括: 第一判断模块, 用于判断所述选择模块选择的所述主节点是否已经失效, 当失效时, 将所述主节点的资格值删除并重新选择新的主节点。
1 3、 根据权利要求 12所述的设备, 其特征在于, 还包括:
第二判断模块, 用于当所述第一判断模块得到所述主节点未失效时, 判断 所述系统逻辑拓朴信息和系统资源信息中的至少一项是否发生变化,如果发生 变化, 则根据变化后的系统逻辑拓朴信息和系统资源信息重新选择新的主节 点。
14、 根据权利要求 1 3所述的设备, 其特征在于, 还包括:
第三判断模块,用于在第一判断模块得到重新选择主节点或者第二判断模 块得到重新选择主节点后, 判断重新选择的主节点是否发生变化,如果发生变 化, 则釆用新的主节点重新上电。
PCT/CN2012/074983 2011-10-18 2012-05-02 选择系统主节点的方法和设备 WO2012163211A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201110316320.4 2011-10-18
CN2011103163204A CN102340543B (zh) 2011-10-18 2011-10-18 选择系统主节点的方法和设备

Publications (1)

Publication Number Publication Date
WO2012163211A1 true WO2012163211A1 (zh) 2012-12-06

Family

ID=45516040

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2012/074983 WO2012163211A1 (zh) 2011-10-18 2012-05-02 选择系统主节点的方法和设备

Country Status (2)

Country Link
CN (1) CN102340543B (zh)
WO (1) WO2012163211A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113708968A (zh) * 2021-08-27 2021-11-26 中国互联网络信息中心 区块链的节点选举控制方法和装置

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102340543B (zh) * 2011-10-18 2013-12-04 华为技术有限公司 选择系统主节点的方法和设备
CN103475742B (zh) * 2013-09-30 2017-02-01 北京华胜天成科技股份有限公司 云计算环境中主控节点确定的方法及系统
CN104616080A (zh) * 2015-02-10 2015-05-13 浪潮电子信息产业股份有限公司 一种多节点高端计算机系统中主节点选取优化方法
CN106331063B (zh) * 2016-08-15 2019-04-09 成都轻车快马网络科技有限公司 数据库部署方法
CA3061746A1 (en) * 2017-04-28 2018-11-01 Aptos, Inc. Systems and methods for point of sale data synchronization
CN107800789A (zh) * 2017-10-24 2018-03-13 麦格创科技(深圳)有限公司 分布式爬虫系统中任务管理器的分配方法及系统
WO2019079967A1 (zh) * 2017-10-24 2019-05-02 麦格创科技(深圳)有限公司 分布式爬虫系统中任务管理器的分配方法及系统
CN108322922B (zh) * 2018-01-02 2021-02-12 西安万像电子科技有限公司 链路切换方法及装置
CN109302406B (zh) * 2018-10-31 2021-06-25 法信公证云(厦门)科技有限公司 一种分布式网页取证的方法及系统
CN109802997B (zh) * 2018-12-20 2021-02-09 华为技术服务有限公司 一种节点设备的选择方法及其相关设备
CN110335601A (zh) * 2019-07-10 2019-10-15 三星电子(中国)研发中心 语音助手设备及其语音唤醒方法
CN112000042B (zh) * 2020-08-26 2024-03-12 中国石油化工集团有限公司 多电动压裂装置平等网路控制系统及方法
CN113489697A (zh) * 2021-06-24 2021-10-08 江苏大学 一种物联网中无中心的密钥分发方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090190496A1 (en) * 2006-03-03 2009-07-30 France Telecom Method of Organizing Nodes of a Network into Groupings of Nodes, Computer Program for Implementing such a Method and Communication Device Forming a Node of a Network of Nodes
CN101924650A (zh) * 2010-08-04 2010-12-22 浙江省电力公司 故障信息系统的服务和服务器智能自治的实现方法
CN101977159A (zh) * 2010-11-26 2011-02-16 重庆金美通信有限责任公司 窄带网络带宽资源的管理方法
CN102098706A (zh) * 2011-03-18 2011-06-15 福建星网锐捷网络有限公司 信道管理方法和接入点
CN102340543A (zh) * 2011-10-18 2012-02-01 华为技术有限公司 选择系统主节点的方法和设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6751616B1 (en) * 2000-01-28 2004-06-15 Oracle International Corp. Techniques for DLM optimization with re-mapping responsibility for lock management
CN101252603B (zh) * 2008-04-11 2011-03-30 清华大学 基于存储区域网络san的集群分布式锁管理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090190496A1 (en) * 2006-03-03 2009-07-30 France Telecom Method of Organizing Nodes of a Network into Groupings of Nodes, Computer Program for Implementing such a Method and Communication Device Forming a Node of a Network of Nodes
CN101924650A (zh) * 2010-08-04 2010-12-22 浙江省电力公司 故障信息系统的服务和服务器智能自治的实现方法
CN101977159A (zh) * 2010-11-26 2011-02-16 重庆金美通信有限责任公司 窄带网络带宽资源的管理方法
CN102098706A (zh) * 2011-03-18 2011-06-15 福建星网锐捷网络有限公司 信道管理方法和接入点
CN102340543A (zh) * 2011-10-18 2012-02-01 华为技术有限公司 选择系统主节点的方法和设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113708968A (zh) * 2021-08-27 2021-11-26 中国互联网络信息中心 区块链的节点选举控制方法和装置
CN113708968B (zh) * 2021-08-27 2023-08-11 中国互联网络信息中心 区块链的节点选举控制方法和装置

Also Published As

Publication number Publication date
CN102340543A (zh) 2012-02-01
CN102340543B (zh) 2013-12-04

Similar Documents

Publication Publication Date Title
WO2012163211A1 (zh) 选择系统主节点的方法和设备
US20180316594A1 (en) Dynamic update of virtual network topology
EP2911351B1 (en) Method and device for updating a routing search tree
US20060050630A1 (en) Storage network management server, storage network managing method, storage network managing program, and storage network management system
WO2014101044A1 (zh) 分布式存储系统中的分区平衡方法、装置及服务器
WO2012149789A1 (zh) Vpc迁移中的资源匹配方法及装置
JPWO2010131288A1 (ja) ノード装置および通信方法
JP2017216682A (ja) 無線ネットワーク構築のための方法、装置及び端末装置
JP2010262551A5 (zh)
CN104811392A (zh) 用于处理网络中的资源访问请求的方法和系统
CN106792838B (zh) Dtn中继节点候选集选择方法
CN103378919A (zh) 一种fi消息的传输方法及装置
US9794122B2 (en) Method for propagating network management data for energy-efficient IoT network management and energy-efficient IoT node apparatus
US11799753B2 (en) Dynamic discovery of service nodes in a network
JP2011160363A (ja) コンピュータシステム、コントローラ、スイッチ、及び通信方法
US9225590B2 (en) Graceful restart (GR) methods and devices
EP3338416A1 (en) Reducing flooding of link state changes in networks
JP2017059885A (ja) コントローラ及び経路再設定方法
CN104283780A (zh) 建立数据传输路径的方法和装置
CN104580107A (zh) 恶意攻击检测方法及控制器
CN114244713B (zh) 一种电力5g网络切片的资源备份方法及装置
WO2014078992A1 (zh) 一种升级方法和节点设备
CN117978623A (zh) 应对网络攻击的韧性数据共享网络构建方法、装置和设备
CN110502581A (zh) 分布式数据库系统监测方法及装置
EP2709322A1 (en) Node routing method for multi-processor system, controller, and multi-processor system

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12793106

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12793106

Country of ref document: EP

Kind code of ref document: A1