CN110401651A - 一种分布式集群节点监测方法、装置及系统 - Google Patents

一种分布式集群节点监测方法、装置及系统 Download PDF

Info

Publication number
CN110401651A
CN110401651A CN201910656839.3A CN201910656839A CN110401651A CN 110401651 A CN110401651 A CN 110401651A CN 201910656839 A CN201910656839 A CN 201910656839A CN 110401651 A CN110401651 A CN 110401651A
Authority
CN
China
Prior art keywords
node
address
connection
module
udp message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910656839.3A
Other languages
English (en)
Inventor
李昂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910656839.3A priority Critical patent/CN110401651A/zh
Publication of CN110401651A publication Critical patent/CN110401651A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
    • H04L69/161Implementation details of TCP/IP or UDP/IP stack architecture; Specification of modified or new header fields
    • H04L69/162Implementation details of TCP/IP or UDP/IP stack architecture; Specification of modified or new header fields involving adaptations of sockets based mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
    • H04L69/164Adaptation or special uses of UDP protocol

Abstract

本申请公开了一种分布式集群节点监测方法、装置、系统及主节点服务器,该方案通过在主节点设置监听模块,实现了主动发现加入集群的从节点,将从节点的信息写入本地配置文件,并建立与从节点的socket长连接。当从节点因为断电等原因宕机后,socket长连接会断开,这时主节点的监听模块能够捕获到这个异常断开,并尝试重新建立与从节点的连接,若超过一定的重试次数后,还未能建立连接,则认为该节点已离线,并自动更新主节点的配置文件,将该从节点的信息移除。最终实现了自动发现从节点并更新配置文件的目的,避免了手动修改主节点配置文件带来的风险和不确定性,同时这种自动化管理节点的方式也提高了分布式集群管理的效率和时效性。

Description

一种分布式集群节点监测方法、装置及系统
技术领域
本申请涉及计算机技术领域,特别涉及一种分布式集群节点监测方法、装置、系统及主节点服务器。
背景技术
随着分布式集群节点规模的不断增大,传统的依靠手工完成多个节点的配置已十分困难,大规模的节点配置工作量巨大,单纯依靠人工完成不仅效率低下,而且容易出错。
因此,如何提升分布式集群节点配置效率,是亟待本领域技术人员解决的问题。
发明内容
本申请的目的是提供一种分布式集群节点监测方法、装置、系统及主节点服务器,用以解决传统的分布式集群节点依靠人工配置,导致配置效率低下且易出错的问题。具体方案如下:
第一方面,本申请提供了一种分布式集群节点监测方法,应用于主节点,包括:
利用监听模块监听目标端口以获取从节点广播到局域网的UDP报文;
根据所述UDP报文,确定所述从节点的IP地址;
将所述IP地址存储至本地配置文件;并根据所述IP地址,建立与所述从节点的socket长连接;
响应所述socket长连接的异常断开信号,重新建立与所述从节点的socket长连接;
在重新建立连接失败的次数超过预设阈值时,则删除所述本地配置文件中所述从节点的IP地址。
优选的,所述根据所述UDP报文,确定所述从节点的IP地址;将所述IP地址存储至本地配置文件,包括:
根据所述UDP报文,确定所述从节点的IP地址和节点类型;将所述IP地址和所述节点类型存储至本地配置文件。
优选的,所述利用监听模块监听目标端口以获取从节点广播到局域网的UDP报文,包括:
利用以守护进程的方式运行在本地的监听模块监听目标端口,以获取从节点广播到局域网的UDP报文。
优选的,在所述在重新建立连接失败的次数超过预设阈值时,则删除所述本地配置文件中所述从节点的IP地址之后,还包括:
生成提示信息以提示所述从节点离线。
优选的,在所述根据所述IP地址,建立与所述从节点的socket长连接之后,还包括:
生成所述从节点的配置文件;
通过查询所述本地配置文件中所述从节点的IP地址,将所述从节点的配置文件同步至所述从节点。
优选的,所述生成所述从节点的配置文件,包括:
根据所述从节点的节点类型生成所述从节点的配置文件。
第二方面,本申请提供了一种分布式集群节点监测装置,应用于主节点,包括:
监听模块:用于利用监听模块监听目标端口以获取从节点广播到局域网的UDP报文;
IP地址确定模块:用于根据所述UDP报文,确定所述从节点的IP地址;
连接建立模块:用于将所述IP地址存储至本地配置文件;并根据所述IP地址,建立与所述从节点的socket长连接;
重新连接模块:用于响应所述socket长连接的异常断开信号,重新建立与所述从节点的socket长连接;
删除模块:用于在重新建立连接失败的次数超过预设阈值时,则删除所述本地配置文件中所述从节点的IP地址。
第三方面,本申请提供了一种主节点服务器,应用于分布式集群,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序以实现如上所述的一种分布式集群节点监测方法的步骤。
第四方面,本申请提供了一种分布式集群节点监测系统,包括:主节点和从节点,以守护进程的方式运行在所述主节点的监听模块,设置于所述从节点的发送模块;
所述发送模块用于在所述从节点上电时,将所述从节点的IP地址打包成UDP报文并发送至局域网;
所述监听模块用于监听所述主节点的目标端口以获取所述UDP报文;
所述主节点用于根据所述UDP报文确定所述IP地址;将所述IP地址存储至本地配置文件;并根据所述IP地址,建立与所述从节点的socket长连接;响应所述socket长连接的异常断开信号,重新建立与所述从节点的socket长连接;在重新建立连接失败的次数超过预设阈值时,则删除所述本地配置文件中所述从节点的IP地址。
优选的,所述发送模块具体用于:在所述从节点上电时,将所述从节点的IP地址和节点类型打包成UDP报文并发送至局域网。
本申请所提供的一种分布式集群节点监测方法、装置、系统及主节点服务器,方案包括:利用监听模块监听目标端口以获取从节点广播到局域网的UDP报文;根据UDP报文确定从节点的IP地址;将IP地址存储至本地配置文件;并根据IP地址建立与从节点的socket长连接;响应socket长连接的异常断开信号,重新建立与从节点的socket长连接;在重新建立连接失败的次数超过预设阈值时,则删除本地配置文件中该从节点的IP地址。
可见,该方案通过在主节点设置监听模块,实现了主动发现加入分布式集群的从节点,将从节点的信息写入本地配置文件,并建立与从节点的socket长连接。当从节点因为断电等原因宕机后,socket长连接会断开,这时主节点的监听模块能够捕获到这个异常断开,并尝试重新建立与从节点的连接,若超过一定的重试次数后,还未能建立连接,则认为该节点已离线,并自动更新主节点的配置文件,将该从节点的信息移除。最终实现了自动发现从节点并更新配置文件的目的,避免了手动修改主节点配置文件带来的风险和不确定性,同时这种自动化管理节点的方式也提高了分布式集群管理的效率和时效性。
附图说明
为了更清楚的说明本申请实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种分布式集群节点监测方法实施例一的实现流程图;
图2为一种分布式集群节点监测方法实施例一中建立连接的过程示意图;
图3为一种分布式集群节点监测方法实施例一中重连机制的过程示意图;
图4为一种分布式集群节点监测方法实施例二的实现流程图;
图5为一种分布式集群节点监测装置实施例的功能框图;
图6为一种主节点服务器实施例的结构示意图;
图7为一种分布式集群节点监测系统实施例的架构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,分布式集群的节点配置往往通过人工完成,对于大规模的分布式集群,配置工作量巨大,依靠人工完成费时费力,且容易出错。针对该问题,本申请提供一种分布式集群节点监测方法、装置、系统及主节点服务器,实现了自动发现从节点并更新配置文件的目的,避免了手动修改主节点配置文件带来的风险和不确定性,同时这种自动化管理节点的方式也提高了分布式集群管理的效率和时效性。
下面对本申请提供的一种分布式集群节点监测方法实施例一进行介绍,参见图1,实施例一应用于主节点,具体包括:
S101、利用监听模块监听目标端口以获取从节点广播到局域网的UDP报文;
本实施例以主节点为执行主体进行描述,可以理解的是,在实际应用场景中,需要主节点与从节点相互配合,共同完成本方案。其中,主节点是指分布式集群中某一个和某一些服务器节点,而从节点则是分布式集群中主节点之外的服务器节点,例如可以是分布式集群中的第一个服务器节点,具体如何选取主节点或从节点可以根据实际需求来确定,本实施例不做限定。
如图2所示,主节点上设置有监听模块,具体的,该监听模块可以以守护进程的方式运行在主节点上,用于监听特定的端口,即上述目标端口,从而获取各个从节点发送到局域网的UDP报文。所述UDP报文为设置于从节点的发送模块发出的,发送模块与从节点一一对应,用于在相应的从节点上电时,将该从节点的IP地址等信息打包为UDP报文,并广播到局域网中。
S102、根据所述UDP报文,确定所述从节点的IP地址;
值得一提的是,本实施例中UDP报文所包含的信息包括但不限于从节点的IP地址,例如,对于异构分布式集群,上述UDP报文中可以包括从节点的节点类型。
S103、将所述IP地址存储至本地配置文件;并根据所述IP地址,建立与所述从节点的socket长连接;
上述本地配置文件是指主节点的配置文件,在从UDP报文解析出从节点的IP地址后,如图2所示,将从节点的IP地址加入本地配置文件以更新本地配置文件,即认为从节点加入当前分布式集群。同时,主节点和从节点通过socket建立并保持长连接,所谓socket,网络上的两个程序通过一个双向的通信连接实现数据的交换,这个连接的一端称为socket。
S104、响应所述socket长连接的异常断开信号,重新建立与所述从节点的socket长连接;
当从节点因为断电等原因宕机时,如图3所示,利用socket长连接断开后会产生异常的特性,主节点通过捕获这个异常断开信号,进入异常处理流程,即通过重连机制重新建立与从节点的连接,当重连超过一定次数均未成功后,即可认为该从节点已离线,在本地配置文件中删除该从节点的信息,将该从节点从当前分布式集群中移除。
S105、在重新建立连接失败的次数超过预设阈值时,则删除所述本地配置文件中所述从节点的IP地址。
上述预设阈值可以根据实际应用场景来确定具体数值,本实施例对此不做限定。可以理解的是,当需要将某从节点从当前分布式集群中移除时,删除的内容包括但不限于该从节点的IP地址。
综上,本实施例所提供一种分布式集群节点监测方法,通过在主节点设置监听模块,实现了主动发现加入分布式集群的从节点,将从节点的信息写入本地配置文件,并建立与从节点的socket长连接。当从节点因为断电等原因宕机后,socket长连接会断开,这时主节点的监听模块能够捕获到这个异常断开,并尝试重新建立与从节点的连接,若超过一定的重试次数后,还未能建立连接,则认为该节点已离线,并自动更新主节点的配置文件,将该从节点的信息移除。最终实现了自动发现从节点并更新配置文件的目的,避免了手动修改主节点配置文件带来的风险和不确定性,同时这种自动化管理节点的方式也提高了分布式集群管理的效率和时效性。
下面开始详细介绍本申请提供的一种分布式集群节点监测方法实施例二,实施例二基于前述实施例一实现,并在实施例一的基础上进行了一定程度上的拓展。
参见图4,实施例二应用于主节点,具体包括:
S401、利用以守护进程的方式运行在本地的监听模块监听目标端口,以获取从节点广播到局域网的UDP报文;
S402、根据所述UDP报文,确定所述从节点的IP地址和节点类型;
S403、将所述IP地址和所述节点类型存储至本地配置文件;并根据所述IP地址,建立与所述从节点的socket长连接;
S404、根据所述从节点的节点类型生成所述从节点的配置文件;
S405、通过查询所述本地配置文件中所述从节点的IP地址,将所述从节点的配置文件同步至所述从节点;
S406、响应所述socket长连接的异常断开信号,重新建立与所述从节点的socket长连接;
S407、在重新建立连接失败的次数超过预设阈值时,则删除所述本地配置文件中所述从节点的IP地址;
S408、生成提示信息以提示所述从节点离线。
可见,本实施例提供的一种分布式集群节点监测方法,在从节点上电时可自动发现该从节点,减少手动修改配置文件的操作,保证了准确性和实时性,提高网络管理的效率;利用socket长连接特性,在从节点宕机时,自动从集群中移除,避免持续向离线从节点发送指令,部署方案灵活;此外,适用于异构分布式集群,在发现从节点的同时能够确定从节点的节点类型,并在后续过程中,在主节点根据从节点的节点类型生成相应的配置文件,并根据主节点的本地配置文件将该从节点的配置文件同步到相应的从节点。避免了逐个登录各个从节点的繁琐性,提升了分布式集群的管理效率。
下面对本申请实施例提供的一种分布式集群节点监测装置进行介绍,下文描述的一种分布式集群节点监测装置与上文描述的一种分布式集群节点监测方法可相互对应参照。
如图5所示,该装置包括:
监听模块501:用于利用监听模块监听目标端口以获取从节点广播到局域网的UDP报文;
IP地址确定模块502:用于根据所述UDP报文,确定所述从节点的IP地址;
连接建立模块503:用于将所述IP地址存储至本地配置文件;并根据所述IP地址,建立与所述从节点的socket长连接;
重新连接模块504:用于响应所述socket长连接的异常断开信号,重新建立与所述从节点的socket长连接;
删除模块505:用于在重新建立连接失败的次数超过预设阈值时,则删除所述本地配置文件中所述从节点的IP地址。
本实施例的一种分布式集群节点监测装置用于实现前述的一种分布式集群节点监测方法,因此该装置中的具体实施方式可见前文中的一种分布式集群节点监测方法的实施例部分,例如,监听模块501、IP地址确定模块502、连接建立模块503、重新连接模块504、删除模块505,分别用于实现上述一种分布式集群节点监测方法中步骤S101,S102,S103,S104,S105。所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再展开介绍。
另外,由于本实施例的一种分布式集群节点监测装置用于实现前述的一种分布式集群节点监测方法,因此其作用与上述方法的作用相对应,这里不再赘述。
此外,本申请还提供了一种主节点服务器,应用于分布式集群,如图6所示,包括:
存储器601:用于存储计算机程序;
处理器602:用于执行所述计算机程序以实现如上所述的一种分布式集群节点监测方法的步骤。
最后,本申请提供了一种分布式集群节点监测系统,如图7所示,包括:主节点701和从节点702,以守护进程的方式运行在所述主节点的监听模块703,设置于所述从节点的发送模块704;
所述发送模块704用于在所述从节点702上电时,将所述从节点702的IP地址打包成UDP报文并发送至局域网;
所述监听模块703用于监听所述主节点701的目标端口以获取所述UDP报文;
所述主节点701用于根据所述UDP报文确定所述IP地址;将所述IP地址存储至本地配置文件;并根据所述IP地址,建立与所述从节点702的socket长连接;响应所述socket长连接的异常断开信号,重新建立与所述从节点702的socket长连接;在重新建立连接失败的次数超过预设阈值时,则删除所述本地配置文件中所述从节点702的IP地址。
在一些具体的实施例中,所述发送模块704具体用于:在所述从节点702上电时,将所述从节点702的IP地址和节点类型打包成UDP报文并发送至局域网。
作为一种具体的实施方式,可以将集群的第一个节点认为是集群的主节点701,在主节点701部署一个监听模块703,作为守护进程运行在该主节点701上,用于监听特定的端口以接收UDP报文。对于各个从节点702,在安装系统时为其增加一个发送模块704,在从节点702上电时,发送模块704用于收集从节点的信息,例如IP、从节点类型等信息,然后通过UDP的方式将这些信息广播到局域网中;局域网中,只有主节点701部署了监听模块703,因此只有主节点701能够接收到其他从节点702的UDP报文,通过UDP报文,主节点701即可知道该从节点702的IP地址、节点类型,并将其写入到自身的配置文件中,即完成了从节点702的自动发现。之后可以在主节点701上完成相关操作,例如修改所有从节点702的配置文件等,即可通过该主节点701的配置文件查询到集群内的所有从节点702的IP地址,进而通过IP地址将修改后的配置文件同步到各个从节点702上。
具体的,主节点701的监听模块703和从节点702的发送模块704,通过socket建立了长连接。当从节点702因为断电等原因宕机后,socket长连接会断开,这时主节点701的监听模块703能够捕获到这个异常断开,而在异常处理流程中,则可以尝试重新和从节点702建立连接,若超过一定的重试次数后,还未能建立连接,则认为该从节点702已离线,并更新主节点701的配置文件,将该从节点702的信息移除。这样,当在主节点701上执行集群相关操作时,就不用往该离线从节点702发送操作的相关命令了。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种分布式集群节点监测方法,其特征在于,应用于主节点,包括:
利用监听模块监听目标端口以获取从节点广播到局域网的UDP报文;
根据所述UDP报文,确定所述从节点的IP地址;
将所述IP地址存储至本地配置文件;并根据所述IP地址,建立与所述从节点的socket长连接;
响应所述socket长连接的异常断开信号,重新建立与所述从节点的socket长连接;
在重新建立连接失败的次数超过预设阈值时,则删除所述本地配置文件中所述从节点的IP地址。
2.如权利要求1所述的方法,其特征在于,所述根据所述UDP报文,确定所述从节点的IP地址;将所述IP地址存储至本地配置文件,包括:
根据所述UDP报文,确定所述从节点的IP地址和节点类型;将所述IP地址和所述节点类型存储至本地配置文件。
3.如权利要求1所述的方法,其特征在于,所述利用监听模块监听目标端口以获取从节点广播到局域网的UDP报文,包括:
利用以守护进程的方式运行在本地的监听模块监听目标端口,以获取从节点广播到局域网的UDP报文。
4.如权利要求1所述的方法,其特征在于,在所述在重新建立连接失败的次数超过预设阈值时,则删除所述本地配置文件中所述从节点的IP地址之后,还包括:
生成提示信息以提示所述从节点离线。
5.如权利要求1-4任意一项所述的方法,其特征在于,在所述根据所述IP地址,建立与所述从节点的socket长连接之后,还包括:
生成所述从节点的配置文件;
通过查询所述本地配置文件中所述从节点的IP地址,将所述从节点的配置文件同步至所述从节点。
6.如权利要求5所述的方法,其特征在于,所述生成所述从节点的配置文件,包括:
根据所述从节点的节点类型生成所述从节点的配置文件。
7.一种分布式集群节点监测装置,其特征在于,应用于主节点,包括:
监听模块:用于利用监听模块监听目标端口以获取从节点广播到局域网的UDP报文;
IP地址确定模块:用于根据所述UDP报文,确定所述从节点的IP地址;
连接建立模块:用于将所述IP地址存储至本地配置文件;并根据所述IP地址,建立与所述从节点的socket长连接;
重新连接模块:用于响应所述socket长连接的异常断开信号,重新建立与所述从节点的socket长连接;
删除模块:用于在重新建立连接失败的次数超过预设阈值时,则删除所述本地配置文件中所述从节点的IP地址。
8.一种主节点服务器,其特征在于,应用于分布式集群,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序以实现如权利要求1-6任意一项所述的一种分布式集群节点监测方法的步骤。
9.一种分布式集群节点监测系统,其特征在于,包括:主节点和从节点,以守护进程的方式运行在所述主节点的监听模块,设置于所述从节点的发送模块;
所述发送模块用于在所述从节点上电时,将所述从节点的IP地址打包成UDP报文并发送至局域网;
所述监听模块用于监听所述主节点的目标端口以获取所述UDP报文;
所述主节点用于根据所述UDP报文确定所述IP地址;将所述IP地址存储至本地配置文件;并根据所述IP地址,建立与所述从节点的socket长连接;响应所述socket长连接的异常断开信号,重新建立与所述从节点的socket长连接;在重新建立连接失败的次数超过预设阈值时,则删除所述本地配置文件中所述从节点的IP地址。
10.如权利要求9所述的系统,其特征在于,所述发送模块具体用于:在所述从节点上电时,将所述从节点的IP地址和节点类型打包成UDP报文并发送至局域网。
CN201910656839.3A 2019-07-19 2019-07-19 一种分布式集群节点监测方法、装置及系统 Pending CN110401651A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910656839.3A CN110401651A (zh) 2019-07-19 2019-07-19 一种分布式集群节点监测方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910656839.3A CN110401651A (zh) 2019-07-19 2019-07-19 一种分布式集群节点监测方法、装置及系统

Publications (1)

Publication Number Publication Date
CN110401651A true CN110401651A (zh) 2019-11-01

Family

ID=68325288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910656839.3A Pending CN110401651A (zh) 2019-07-19 2019-07-19 一种分布式集群节点监测方法、装置及系统

Country Status (1)

Country Link
CN (1) CN110401651A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111478953A (zh) * 2020-03-27 2020-07-31 北京金山云网络技术有限公司 服务器集群的自构建方法、装置、系统、设备及存储介质
CN111935727A (zh) * 2020-07-10 2020-11-13 展讯半导体(成都)有限公司 通信异常处理方法、主节点、室内分布系统及存储介质
CN111970329A (zh) * 2020-07-24 2020-11-20 苏州浪潮智能科技有限公司 一种集群服务的部署方法、系统、设备以及介质
CN112100004A (zh) * 2020-08-12 2020-12-18 福建天泉教育科技有限公司 Redis集群节点的管理方法、存储介质
CN112422368A (zh) * 2020-11-18 2021-02-26 青岛以萨数据技术有限公司 基于clickhouse的数据库集群监控方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105656653A (zh) * 2014-11-14 2016-06-08 华为技术有限公司 分布式协调系统中新增节点的入网方法、装置和系统
CN108256311A (zh) * 2017-10-27 2018-07-06 新华三技术有限公司 一种授权认证方法及装置
CN108650119A (zh) * 2018-04-24 2018-10-12 烽火通信科技股份有限公司 一种远程配置终端设备的方法及系统
CN108696595A (zh) * 2018-05-28 2018-10-23 郑州云海信息技术有限公司 分布式集群数据同步方法、主节点、从节点、系统及介质
CN108737574A (zh) * 2018-06-28 2018-11-02 郑州云海信息技术有限公司 一种节点离线判断方法、装置、设备及可读存储介质
CN109542865A (zh) * 2018-12-03 2019-03-29 郑州云海信息技术有限公司 分布式集群系统配置文件同步方法、装置、系统及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105656653A (zh) * 2014-11-14 2016-06-08 华为技术有限公司 分布式协调系统中新增节点的入网方法、装置和系统
CN108256311A (zh) * 2017-10-27 2018-07-06 新华三技术有限公司 一种授权认证方法及装置
CN108650119A (zh) * 2018-04-24 2018-10-12 烽火通信科技股份有限公司 一种远程配置终端设备的方法及系统
CN108696595A (zh) * 2018-05-28 2018-10-23 郑州云海信息技术有限公司 分布式集群数据同步方法、主节点、从节点、系统及介质
CN108737574A (zh) * 2018-06-28 2018-11-02 郑州云海信息技术有限公司 一种节点离线判断方法、装置、设备及可读存储介质
CN109542865A (zh) * 2018-12-03 2019-03-29 郑州云海信息技术有限公司 分布式集群系统配置文件同步方法、装置、系统及介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111478953A (zh) * 2020-03-27 2020-07-31 北京金山云网络技术有限公司 服务器集群的自构建方法、装置、系统、设备及存储介质
CN111478953B (zh) * 2020-03-27 2022-09-06 北京金山云网络技术有限公司 服务器集群的自构建方法、装置、系统、设备及存储介质
CN111935727A (zh) * 2020-07-10 2020-11-13 展讯半导体(成都)有限公司 通信异常处理方法、主节点、室内分布系统及存储介质
CN111970329A (zh) * 2020-07-24 2020-11-20 苏州浪潮智能科技有限公司 一种集群服务的部署方法、系统、设备以及介质
CN112100004A (zh) * 2020-08-12 2020-12-18 福建天泉教育科技有限公司 Redis集群节点的管理方法、存储介质
CN112422368A (zh) * 2020-11-18 2021-02-26 青岛以萨数据技术有限公司 基于clickhouse的数据库集群监控方法及系统

Similar Documents

Publication Publication Date Title
CN110401651A (zh) 一种分布式集群节点监测方法、装置及系统
CN106331098B (zh) 一种服务器集群系统
JP5910811B2 (ja) スイッチ装置の制御システム、その構成制御装置および構成制御方法
CN105607590B (zh) 用于在过程控制系统中提供冗余性的方法和装置
CN103812823A (zh) 虚拟机热迁移时配置信息迁移的方法、设备及系统
CN107820043B (zh) 视频监控系统的控制方法、装置及系统
CN105337904A (zh) 控制器集群的升级方法及装置
CN103024065A (zh) 用于云存储系统的系统配置管理方法
CN105635216A (zh) 分布式应用的升级方法、设备和分布式系统
CN103532741A (zh) 一种接入级网络拓扑管理方法与系统
CN104038376A (zh) 一种管理真实服务器的方法、装置及lvs集群系统
WO2016177049A1 (zh) 一种实现接入设备扩缩容的方法和装置
CN105357048A (zh) 网络设备数据同步方法和系统
CN112202853B (zh) 数据同步方法、系统、计算机设备和存储介质
CN108572976A (zh) 一种分布式数据库中数据恢复方法、相关设备和系统
CN104468231A (zh) Sdn交换机和控制器动态注册方法
CN102685877B (zh) 用户数据同步方法、无线控制器及网管设备
CN103346914A (zh) 分布式文件系统的拓扑结构更新方法和装置
CN110391940A (zh) 服务地址的响应方法、装置、系统、设备和存储介质
CN100563263C (zh) 在网络存储业务中实现系统高可用性的方法和系统
KR101650691B1 (ko) 소프트웨어 정의 네트워크에서 분산 컨트롤러를 운용하는 방법 및 장치
CN104125079A (zh) 一种确定双机热备份配置信息的方法及装置
CN101404594A (zh) 热备份性能的测试方法与装置、通信设备
CN104243473A (zh) 一种数据传输的方法以及装置
CN111901187A (zh) 一种测试方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191101