CN113311766A - 分布式系统批量节点监控方法、节点及系统 - Google Patents

分布式系统批量节点监控方法、节点及系统 Download PDF

Info

Publication number
CN113311766A
CN113311766A CN202110618110.4A CN202110618110A CN113311766A CN 113311766 A CN113311766 A CN 113311766A CN 202110618110 A CN202110618110 A CN 202110618110A CN 113311766 A CN113311766 A CN 113311766A
Authority
CN
China
Prior art keywords
nodes
central monitoring
node
monitoring
batch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110618110.4A
Other languages
English (en)
Other versions
CN113311766B (zh
Inventor
林慕云
殷富成
李芳�
徐晨予
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110618110.4A priority Critical patent/CN113311766B/zh
Publication of CN113311766A publication Critical patent/CN113311766A/zh
Application granted granted Critical
Publication of CN113311766B publication Critical patent/CN113311766B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/042Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
    • G05B19/0428Safety, monitoring
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24024Safety, surveillance

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种分布式系统批量节点监控方法、节点及系统,可用于人工智能技术领域,所述方法包括:接收批量节点的注册请求;根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点以使所述批量节点向所述目标非中心监控节点发送监控报文;若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点以使所述批量节点向所述新增目标非中心监控节点发送监控报文,本发明可提供低资源消耗、低维护成本和低流量消耗的分布式系统批量节点监控方法。

Description

分布式系统批量节点监控方法、节点及系统
技术领域
本发明涉及分布式系统节点监控技术领域,尤其涉及一种分布式系统批量节点监控方法、节点及系统。
背景技术
目前的对象监控主要为由被监控对象向监控服务器发送报文,报文分为心跳和非心跳两种。其中,心跳型的报文需要被监控对象定期发送,监控服务器在一定周期内没有收到规定数量的心跳报文即可认为被监控对象处于异常状态;非心跳型的无需定期发送,仅需在被监控者出现问题时,发送报文告知监控者。目前服务器使用的监控方式基本为心跳型和非心跳型的混用,由所有的被监控对象(服务器节点)向监控中心(一台或多台监控服务器)发送报警。目前的对象监控需要监控的对象数量相对有限,而且监控内容复杂,不能适用目前具有大量需要监控的批量节点的分布式系统。例如,目前基于边缘云的柜员机对账系统虽然可以通过有效利用柜员机的空闲计算资源,但是会大幅增加用于维持节点运行的资源,特别是该系统对中心监控节点的网络传输量依赖较大,容易陷入瓶颈。
发明内容
本发明的一个目的在于提供一种分布式系统批量节点监控方法,本发明提供了一种低资源消耗、低维护成本和低流量消耗的分布式系统批量节点监控方法。本发明的另一个目的在于提供一种中心监控节点。本发明的再一个目的在于提供一种批量节点。本发明的还一个目的在于提供一种非中心监控节点。本发明的还一个目的在于提供一种计算机设备。本发明的还一个目的在于提供一种可读介质。
为了达到以上目的,本发明一方面公开了一种分布式系统批量节点监控方法,包括:
接收批量节点的注册请求;
根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点以使所述批量节点向所述目标非中心监控节点发送监控报文;
若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点以使所述批量节点向所述新增目标非中心监控节点发送监控报文。
优选的,进一步包括:
当所述非中心监控节点的数量大于预设第一阈值时,对所有非中心监控节点进行优先级排序;
将优先级排序后的所有非中心监控节点中的至少部分节点的监控节点修改为其他非中心监控节点,形成下一层非中心监控节点。
优选的,所述对所有非中心监控节点进行优先级排序具体包括:
对所有非中心监控节点按照监控的非中心监控节点的层数和各非中心监控节点的新增时间进行优先级排序,其中,层数越少优先级越高,新增时间越早优先级越高,层数优先级高于新增时间优先级。
优选的,所述将优先级排序后的所有非中心监控节点中的至少部分节点的监控节点修改为其他非中心监控节点具体包括:
根据预设单层常规监控节点数得到节点序列号;
将所述优先级排序后的所有非中心监控节点中排序在第二个到所述节点序列号间的非中心监控节点的监控节点修改为排序在第一个的非中心监控节点。
优选的,进一步包括:
若所述非中心监控节点下一层的非中心监控节点数量大于预设第二阈值时,对下一层的所有非中心监控节点进行优先级排序;
将优先级排序后的下一层的非中心监控节点中的至少部分节点的监控节点修改为下一层的非中心监控节点中的其他非中心监控节点,形成再下一层非中心监控节点。
优选的,所述对下一层的所有非中心监控节点进行优先级排序具体包括:
对下一层的所有非中心监控节点按照监控的非中心监控节点的层数和各非中心监控节点的新增时间进行优先级排序,其中,层数越少优先级越高,新增时间越早优先级越高,层数优先级高于新增时间优先级。
优选的,所述将优先级排序后的下一层的非中心监控节点中的至少部分节点的监控节点修改为下一层的非中心监控节点中的其他非中心监控节点具体包括:
根据预设单层常规监控节点数得到节点序列号;
将优先级排序后的下一层的非中心监控节点中排序在第二个到所述节点序列号间的下一层的非中心监控节点的监控节点修改为排序在第一个的下一层的非中心监控节点。
优选的,进一步包括:
接收批量节点或非中心监控节点发送的重新确定监控节点请求,所述重新确定监控节点请求为批量节点或非中心监控节点超过预设时间阈值没有接收到监控节点发送的心跳报文时形成的;
根据所述重新确定监控节点请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点或非中心监控节点以使所述批量节点或非中心监控节点向所述目标非中心监控节点发送监控报文;
若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点或非中心监控节点以使所述批量节点或非中心监控节点向所述新增目标非中心监控节点发送监控报文。
本发明还公开了一种分布式系统批量节点监控方法,包括:
向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息以向所述目标非中心监控节点发送监控报文;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息以向所述新增目标非中心监控节点发送监控报文。
本发明还公开了一种分布式系统批量节点监控方法,包括:
接收批量节点根据监控节点信息发送的监控报文,其中,所述监控节点信息为所述批量节点向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息得到的。
优选的,若存在监控的下一层非中心监控节点,进一步包括:
接收下一层非中心监控节点发送的监控报文。
优选的,所述监控报文包括心跳报文和非心跳报文,所述方法进一步包括:
若经过第一预设时间间隔接收到批量节点或非中心监控节点发送的心跳报文,形成正常的心跳报文并与接收到的批量节点或非中心监控节点发送的非心跳报文进行合并后的报文发送至监控节点;
若经过第二预设时间间隔未接收到批量节点或非中心监控节点发送的心跳报文或接收到包括错误信息的心跳报文,形成包括异常信息的心跳报文并与接收到的批量节点或非中心监控节点发送的非心跳报文进行合并后的报文发送至监控节点;
每隔第三预设时间间隔将接收到的批量节点或非中心监控节点发送的非心跳报文发送至监控节点。
优选的,若发送至监控节点的报文大小大于预设文件大小,所述报文发送至监控节点包括:
将所述报文拆分为多个子报文后将多个子报文;
将多个子报文分别发送至所述监控节点。
本发明还公开了一种中心监控节点,包括:
请求接收模块,用于接收批量节点的注册请求;
监控节点动态配置模块,用于根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点以使所述批量节点向所述目标非中心监控节点发送监控报文;若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点以使所述批量节点向所述新增目标非中心监控节点发送监控报文。
本发明还公开了一种批量节点,包括:
向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息以向所述目标非中心监控节点发送监控报文;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息以向所述新增目标非中心监控节点发送监控报文。
本发明还公开了一种非中心监控节点,包括:
接收批量节点根据监控节点信息发送的监控报文,其中,所述监控节点信息为所述批量节点向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息得到的。
本发明还公开了一种分布式系统,包括中心监控节点、非中心监控节点和批量节点;
其中,所述中心监控节点用于接收批量节点的注册请求,根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点以使所述批量节点向所述目标非中心监控节点发送监控报文,若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点以使所述批量节点向所述新增目标非中心监控节点发送监控报文。
本发明还公开了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,
所述处理器执行所述程序时实现如上所述方法。
本发明还公开了一种计算机可读介质,其上存储有计算机程序,
该程序被处理器执行时实现如上所述方法。
本发明在接收到批量节点的注册请求时,首先查找是否存在监控的批量节点的数量小于预设阈值的非中心监控节点,若是,表示该非中心监控节点还可以监控新的批量节点。若否,表示各非中心监控节点都已经监控了足够多的批量节点,不能够再分配新的批量节点进行监控。进而,本发明可重新确定分布式系统中的一个节点为监控节点得到新增非中心监控节点,通过该新增非中心监控节点对注册的批量节点进行监控。本发明可对发送注册请求的批量节点动态分配监控节点,从而减少中心监控节点需要交互的报文数量,减少中心监控节点的连接维持压力和流量压力,最大限度排除正常运行情况下的大多数报文,并且不影响对于各节点运行状态的判断准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明运行分布式系统批量节点监控方法的分布式系统具体实施例的结构图;
图2示出本发明分布式系统批量节点监控方法具体实施例的流程图;
图3示出本发明分布式系统批量节点监控方法具体实施例S400的流程图;
图4示出本发明分布式系统批量节点监控方法具体实施例S420的流程图;
图5~图7示出本发明分布式系统批量节点监控方法一个具体例子中将至少部分节点的监控节点修改为其他非中心监控节点的示意图;
图8示出本发明分布式系统批量节点监控方法具体实施例S500的流程图;
图9示出本发明分布式系统批量节点监控方法具体实施例S520的流程图;
图10~图11示出本发明分布式系统批量节点监控方法一个具体例子中优先级排序后的下一层的非中心监控节点中的至少部分节点的监控节点修改为下一层的非中心监控节点中的其他非中心监控节点的示意图;
图12示出本发明分布式系统批量节点监控方法具体实施例S600的流程图;
图13示出本发明中心监控节点具体实施例的结构图;
图14示出适于用来实现本发明实施例的计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请公开的一种分布式系统批量节点监控方法、节点及系统可用于人工智能技术领域,也可用于除人工智能技术领域之外的任意领域,本申请公开的一种分布式系统批量节点监控方法、节点及系统的应用领域不做限定。
为了便于理解本申请提供的技术方案,下面先对本申请技术方案的相关内容进行说明。本发明实施例提供的分布式系统批量节点监控方法可对发送注册请求的批量节点动态分配监控节点,从而减少中心监控节点需要交互的报文数量,减少中心监控节点的连接维持压力和流量压力,最大限度排除正常运行情况下的大多数报文,并且不影响对于各节点运行状态的判断准确性。
图1是本发明实施例提供的运行分布式系统批量节点监控方法的分布式系统的结构示意图,如图1所示,本发明实施例提供的分布式系统包括中心监控节点、非中心监控节点和批量节点。
其中,中心监控节点可接收批量节点的注册请求。根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点以使所述批量节点向所述目标非中心监控节点发送监控报文。若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点以使所述批量节点向所述新增目标非中心监控节点发送监控报文。
批量节点可向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息以向所述目标非中心监控节点发送监控报文;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息以向所述新增目标非中心监控节点发送监控报文。
非中心监控节点可接收批量节点根据监控节点信息发送的监控报文,其中,所述监控节点信息为所述批量节点向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息得到的。
下面以中心监控节点作为执行主体为例,说明本发明实施例提供的分布式系统批量节点监控方法的实现过程。可理解的是,本发明实施例提供的分布式系统批量节点监控方法的执行主体包括但不限于该中心监控节点。
根据本发明的一个方面,本实施例公开了一种分布式系统批量节点监控方法。如图2所示,本实施例中,所述方法包括:
S100:接收批量节点的注册请求。
S200:根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点以使所述批量节点向所述目标非中心监控节点发送监控报文。
S300:若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点以使所述批量节点向所述新增目标非中心监控节点发送监控报文。
本发明在接收到批量节点的注册请求时,首先查找是否存在监控的批量节点的数量小于预设阈值的非中心监控节点,若是,表示该非中心监控节点还可以监控新的批量节点。若否,表示各非中心监控节点都已经监控了足够多的批量节点,不能够再分配新的批量节点进行监控。进而,本发明可重新确定分布式系统中的一个节点为监控节点得到新增非中心监控节点,通过该新增非中心监控节点对注册的批量节点进行监控。本发明可对发送注册请求的批量节点动态分配监控节点,从而减少中心监控节点需要交互的报文数量,减少中心监控节点的连接维持压力和流量压力,最大限度排除正常运行情况下的大多数报文,并且不影响对于各节点运行状态的判断准确性。
在优选的实施方式中,如图3所示,所述方法进一步包括S400:
S410:当所述非中心监控节点的数量大于预设第一阈值时,对所有非中心监控节点进行优先级排序。
S420:将优先级排序后的所有非中心监控节点中的至少部分节点的监控节点修改为其他非中心监控节点,形成下一层非中心监控节点。
具体的,为了减少中心监控节点交互的报文数量,减少中心监控节点的连接维持压力和流量压力,在该优选的实施方式中,可预先设置中心监控节点可监控的最大非中心监控节点数量,即预设第一阈值。从而,当中心监控节点直接监控的直属非中心监控节点的数量大于预设第一阈值时,表示中心监控节点直接监控的非中心监控节点过多,可能会增加中心监控节点的压力。因此,当非中心监控节点的数量大于预设第一阈值时,可对所有非中心监控节点进行优先级排序,然后根据排序后的非中心监控节点的优先级将至少部分节点的监控节点修改为其他非中心监控节点,则该至少部分节点作为其监控节点的下一层非中心监控节点。
例如,在一个具体例子中,可预先设置一个监控节点监控的批量节点的预设阈值Nm为3。分布式系统批量开始前,各批量节点(例如,柜员机)需要向中心监控节点发送注册请求进行注册,中心监控节点按照一个非中心监控节点,Nm个批量节点给批量节点分配非中心监控节点。即Nm个批量节点向一个非中心监控节点发送监控报文。具体的,根据注册请求确定是否存在非中心监控节点,其监控的批量节点的数量小于3。若是,可将该注册的批量节点分配给该非中心监控节点进行监控;若否,则重新确定一个非中心监控节点为新增非中心监控节点,将该注册的批量节点分配给该新增非中心监控节点进行监控。中心监控节点在为批量节点分配监控节点后,可将监控节点的监控节点信息返回给批量节点,以使批量节点可根据监控节点信息访问并将监控报文发送至对应的非中心监控节点。优选的,该监控节点信息可包括节点的IP地址。在实际应用中,监控节点信息还可采用其他信息,本领域技术人员可根据实际情况进行设置,本发明对此并不作限定。
在该具体例子中,可预设第一阈值为4,即中心监控节点可直属监控至多4个非中心监控节点。当中心监控节点监控的非中心监控节点超过4个时,可对所有非中心监控节点进行优先级排序,将优先级排序后的所有非中心监控节点中的至少部分节点的监控节点修改为其他非中心监控节点,形成下一层非中心监控节点。
在优选的实施方式中,所述S410对所有非中心监控节点进行优先级排序具体可包括:
S411:对所有非中心监控节点按照监控的非中心监控节点的层数和各非中心监控节点的新增时间进行优先级排序,其中,层数越少优先级越高,新增时间越早优先级越高,层数优先级高于新增时间优先级。
具体的,当中心监控节点监控的非中心监控节点超过预设第一阈值时,可按非中心监控节点监控的层数以及注册的新增时间进行优先级排序。其中,可将非中心监控节点的层数从小到大排序(相同情况下使用随机算法选择),即当前一层的非中心监控节点的下属节点深度(该节点下面管了几层节点)。如图1所示,R为中心监控节点,其深度(层数)为2。N1到N4非中心监控节点的深度为1,批量节点深度都是0。同时,非中心监控节点还可按照新增时间的时间先后顺序进行排序。综合层数及新增时间对所有非中心监控节点进行排序,其中层数优先级高于新增时间,即层数越少、新增时间越早,优先级越高。
在优选的实施方式中,如图4所示,所述S420将优先级排序后的所有非中心监控节点中的至少部分节点的监控节点修改为其他非中心监控节点具体可包括:
S421:根据预设单层常规监控节点数得到节点序列号。
S422:将所述优先级排序后的所有非中心监控节点中排序在第二个到所述节点序列号间的非中心监控节点的监控节点修改为排序在第一个的非中心监控节点。
具体的,排序在前的非中心监控节点的下层监控层数较少,可预设单层常规监控节点数,根据单层常规监控节点数可得到一个节点序列号,可将排序在第二个到节点序列号间的非中心监控节点的监控节点修改为排序在第一个的非中心监控节点,则第二个到节点序列号间的非中心监控节点向第一个的非中心监控节点发送监控报文。此时,第一个非中心监控节点的层数由2变为3。例如,在一个具体例子中,预设单层常规监控节点数为2,则可将优先级排序后的第2到3个非中心监控节点改为向第1个非中心监控节点发送监控报文,这个第1个的非中心监控节点的下属批量节点数量加上第2到3个非中心监控节点的下属批量节点数量的值更新为第1个监控节点的最新下属批量节点数量。
在图5所示的具体例子中,R为中心监控节点,R监控N1到N4四个非中心监控节点。其中,预设阈值为3,预设第一阈值为4,单层常规监控节点数为2。此时,新增一个非中心监控节点N5,R监控的非中心监控节点大于预设第一阈值。假设新增时间的先后顺序为N1、N2、N3、N4和N5,那么优先级排序为N1>N2>N3>N4>N5。然后,可将第2~第3的N2和N3非中心监控节点的监控节点修改为N1,如图6所示。此时,再新增N6和N7两个非中心监控节点,N6和N7都分别监控3个批量节点。此时,当前一层的非中心监控节点的优先级排序为N4>N5>N6>N7>N1。则可将第2~第3的N5和N6非中心监控节点的监控节点修改为N4,如图7所示。
在优选的实施方式中,如图8所示,所述方法进一步包括S500:
S510:若所述非中心监控节点下一层的非中心监控节点数量大于预设第二阈值时,对下一层的所有非中心监控节点进行优先级排序。
S520:将优先级排序后的下一层的非中心监控节点中的至少部分节点的监控节点修改为下一层的非中心监控节点中的其他非中心监控节点,形成再下一层非中心监控节点。
具体的,在该优选的实施方式中,可预先设置非中心监控节点可监控的最大非中心监控节点数量,即预设第二阈值。从而,当非中心监控节点直接监控的非中心监控节点的数量大于预设第二阈值时,表示非中心监控节点直接监控的非中心监控节点过多,可能会增加该非中心监控节点的压力。因此,当下一层非中心监控节点的数量大于预设第二阈值时,可对下一层所有非中心监控节点进行优先级排序,然后根据排序后的非中心监控节点的优先级将至少部分节点的监控节点修改为其他非中心监控节点,则该至少部分节点作为其监控节点的下一层非中心监控节点。
在该具体例子中,可预设第二阈值为2,即一个非中心监控节点可监控至多2个下一层非中心监控节点。当非中心监控节点监控的下一层非中心监控节点超过2个时,可对下一层所有非中心监控节点进行优先级排序,将优先级排序后的所有非中心监控节点中的至少部分节点的监控节点修改为该层其他非中心监控节点,形成再下一层非中心监控节点。
在优选的实施方式中,所述S510对下一层的所有非中心监控节点进行优先级排序具体包括:
S511:对下一层的所有非中心监控节点按照监控的非中心监控节点的层数和各非中心监控节点的新增时间进行优先级排序,其中,层数越少优先级越高,新增时间越早优先级越高,层数优先级高于新增时间优先级。
具体的,当非中心监控节点监控的下一层非中心监控节点的数量超过预设第二阈值时,可按下一层所有非中心监控节点监控的层数以及注册的新增时间进行优先级排序。其中,可将非中心监控节点的层数从小到大排序(相同情况下使用随机算法选择),即当前一层的非中心监控节点的下属节点深度(该节点下面管了几层节点)。同时,非中心监控节点还可按照新增时间的时间先后顺序进行排序。综合层数及新增时间对所有非中心监控节点进行排序,其中层数优先级高于新增时间,即层数越少、新增时间越早,优先级越高。
在优选的实施方式中,如图9所示,所述S520将优先级排序后的下一层的非中心监控节点中的至少部分节点的监控节点修改为下一层的非中心监控节点中的其他非中心监控节点具体可包括:
S521:根据预设单层常规监控节点数得到节点序列号。
S522:将优先级排序后的下一层的非中心监控节点中排序在第二个到所述节点序列号间的下一层的非中心监控节点的监控节点修改为排序在第一个的下一层的非中心监控节点。
具体的,排序在前的非中心监控节点的下层监控层数较少,可预设单层常规监控节点数,根据单层常规监控节点数可得到一个节点序列号,可将排序在第二个到节点序列号间的非中心监控节点的监控节点修改为排序在第一个的非中心监控节点,则第二个到节点序列号间的非中心监控节点向第一个的非中心监控节点发送监控报文。此时,第一个非中心监控节点的层数由2变为3。例如,在一个具体例子中,预设单层常规监控节点数为2,则可将优先级排序后的第2到3个非中心监控节点改为向第1个非中心监控节点发送监控报文,这个第1个的非中心监控节点的下属批量节点数量加上第2到3个非中心监控节点的下属批量节点数量的值更新为第1个监控节点的最新下属批量节点数量。
在图10所示的具体例子中,Nx为非中心监控节点,Nx监控N13、N14、N17和N18四个非中心监控节点。其中,预设第二阈值为2,单层常规监控节点数为2。此时,Nx监控的非中心监控节点数大于预设第二阈值。其中,N13监控N11和N12节点,N14监控N15和N16节点,假设N13和N14是后新增进来的且N13的优先级高于N14,N17的新增时间早于N18,并且N17和N18的深度为1,N13和N14的深度为2,则Nx下一层的所有非中心监控节点的优先级排序为N17>N18>N13>N14。
然后,可将第2~第3的N18和N13非中心监控节点的监控节点修改为N17,如图11所示。
在优选的实施方式中,如图12所示,所述方法进一步包括S600:
S610:接收批量节点或非中心监控节点发送的重新确定监控节点请求,所述重新确定监控节点请求为批量节点或非中心监控节点超过预设时间阈值没有接收到监控节点发送的心跳报文时形成的。
S620:根据所述重新确定监控节点请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点或非中心监控节点以使所述批量节点或非中心监控节点向所述目标非中心监控节点发送监控报文。
S630:若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点或非中心监控节点以使所述批量节点或非中心监控节点向所述新增目标非中心监控节点发送监控报文。
具体的,批量节点或非中心监控节点向监控节点发送监控报文,监控节点也会向批量节点或非中心监控节点反馈心跳报文。若监控节点超过预设时间阈值没有接收到监控节点发送的心跳报文,表示监控节点发生异常。则批量节点或非中心监控节点可向中心监控节点发送重新确定监控节点请求。
中心监控节点接收到批量节点或非中心监控节点发送的重新确定监控节点请求后,根据所述重新确定监控节点请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点或非中心监控节点以使所述批量节点或非中心监控节点向所述目标非中心监控节点发送监控报文。若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点或非中心监控节点以使所述批量节点或非中心监控节点向所述新增目标非中心监控节点发送监控报文。
批量操作由于都是非即时响应任务,对告警时效性相比即时响应任务的服务器要求较低。因此,除心跳类报文以外,非心跳类报文无需保证第一时间送到中心监控服务器,仅需保证能在一定时间内尽可能送达核心服务器即可。因此需设定非心跳报文最大可接受时间T(第三预设时间),T可选一分钟。批量节点每隔第一预设时间间隔t向其监控节点发送监控报文,t可选20s。对于柜员机等批量节点,在对账过程中出现不可自行修正的错误,则向其监控节点发送错误信息的心跳报文。
监控节点接收其直属节点的心跳报文,在时长为第二预设时间间隔nt周期内有收到目标被监控节点的心跳报文,且该节点最新一条报文内容为正常即认为该节点仍存活(如果该节点发送了报文,但是最新一条包含错误信息,则将该错误信息纳入到当前节点需要上送的心跳报文中;如果在nt(n优选的可选3)周期内没有收到一条报文,则认为该节点及下属节点异常,将该节点的错误信息写入心跳报文,形成异常信息的心跳报文。如果收到非心跳报文,则等待时间T,如果该周期内收到其他非心跳报文,进行整合,直到达到时间T或者到了发送心跳报文的时间,发送至其上级服务器(如果是到了发送心跳报文的时候发送的话,则将报文内容整合进心跳报文)。
中心监控节点接收直属监控的非中心监控节点发送的心跳报文,如果在nt周期内没有收到目标被监控节点的心跳报文,则认为该节点及下属节点异常(该节点的下属节点根据中心节点记录的节点监控关系树形图推算)并将异常信息推送给运维中心工作人员;如果收到带有错误信息的报文(包括心跳报文和非心跳报文),同样将对应的错误信息推送给运维中心工作人员。
需要注意的是,当某个报文因为下属的节点有大量异常信息导致报文过大时,需要对报文进行拆分发送。报文格式规范为:[报文类型(00,心跳报文;01,事件报文)+报文拆分数+分隔符+报文序号+分隔符+报文发送节点唯一ID+分隔符+报文发送节点IP+分隔符+问题数量+分隔符]+(问题节点唯一ID1+分隔符+问题节点唯一ID1+分隔符+问题描述1+分隔符)+(问题节点唯一ID2+分隔符+问题节点唯一ID2+分隔符+问题描述2+分隔符)+(问题节点唯一ID3+分隔符+问题节点唯一ID3+分隔符+问题描述3+分隔符)+(问题节点唯一ID4+分隔符+问题节点唯一ID4+分隔符+问题描述4+分隔符)。
假设报文过长,需要拆分为5条的话,那么这五条的报文拆分数都是5,报文序号依次是1/2/3/4/5,如果不拆分的话这两个值都是1。中括号内的内容每个报文都一样(除了报文序号和问题数量),小括号内(具体问题描述)的内容是拆分部分,一个小括号内的内容对应一个问题,例如设定上按照报文长度限制,原本一共有7个问题,长度限制每个报文为200字符(长度仅限制小括号内部分,忽略中括号内的长度),每个小括号内的内容刚好长度60,那么200个字符除以60向下取整为3,一共拆成3条报文,第一条报文问题数为3,内含第1/2/3个问题的描述,第二条报文问题数为3,内含第4/5/6个问题的描述,第三条报文问题数为1,内含第7个问题的描述。
其中报文发送节点指生成并发出这条报文的节点;报文发送节点唯一ID是每台柜员机出厂时的预设编号;报文发送节点IP是发送这条报文的节点当前的IP地址。其中问题节点指发生问题的节点,不一定是当前发生问题的节点。其来源分为从当前节点获取和收到的心跳报文和事件报文中获取,如果当前节点发生问题则将该问题信息纳入,此时的问题节点就是当前节点,对应唯一ID和IP就是当前节点的唯一ID和IP;如果当前节点收到了被其监控的节点送来的报文,则将收到的报文中的问题信息纳入到当前节点的报文中,此时的问题节点就是报文中记载的问题节点,对应唯一ID和IP就是原报文中记载的唯一ID和IP。
基于相同原理,本实施例还公开了一种分布式系统批量节点监控方法(执行主体为批量节点)。所述方法包括:向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息以向所述目标非中心监控节点发送监控报文;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息以向所述新增目标非中心监控节点发送监控报文。
由于该方法解决问题的原理与以上方法类似,因此本方法的实施可以参见方法的实施,在此不再赘述。
基于相同原理,本实施例还公开了一种分布式系统批量节点监控方法(执行主体为非中心监控节点)。所述方法包括:接收批量节点根据监控节点信息发送的监控报文,其中,所述监控节点信息为所述批量节点向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息得到的。
在优选的实施方式中,若存在监控的下一层非中心监控节点,进一步包括:
接收下一层非中心监控节点发送的监控报文。
在优选的实施方式中,所述监控报文包括心跳报文和非心跳报文,所述方法进一步包括:
若经过第一预设时间间隔接收到批量节点或非中心监控节点发送的心跳报文,形成正常的心跳报文并与接收到的批量节点或非中心监控节点发送的非心跳报文进行合并后的报文发送至监控节点;
若经过第二预设时间间隔未接收到批量节点或非中心监控节点发送的心跳报文或接收到包括错误信息的心跳报文,形成包括异常信息的心跳报文并与接收到的批量节点或非中心监控节点发送的非心跳报文进行合并后的报文发送至监控节点;
每隔第三预设时间间隔将接收到的批量节点或非中心监控节点发送的非心跳报文发送至监控节点。
在优选的实施方式中,若发送至监控节点的报文大小大于预设文件大小,所述将报文发送至监控节点包括:
将所述报文拆分为多个子报文后将多个子报文;
将多个子报文分别发送至所述监控节点。
由于该方法解决问题的原理与以上方法类似,因此本方法的实施可以参见方法的实施,在此不再赘述。
基于相同原理,本实施例还公开了一种中心监控节点。如图13所示,本实施例中,所述中心监控节点包括请求接收模块11和监控节点动态配置模块12。
其中,请求接收模块用于接收批量节点的注册请求。
监控节点动态配置模块用于根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点以使所述批量节点向所述目标非中心监控节点发送监控报文;若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点以使所述批量节点向所述新增目标非中心监控节点发送监控报文。
由于该节点解决问题的原理与以上方法类似,因此本节点的实施可以参见方法的实施,在此不再赘述。
基于相同原理,本实施例还公开了一种批量节点。批量节点被配置为向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息以向所述目标非中心监控节点发送监控报文;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息以向所述新增目标非中心监控节点发送监控报文。
由于该节点解决问题的原理与以上方法类似,因此本节点的实施可以参见方法的实施,在此不再赘述。
基于相同原理,本实施例还公开了一种非中心监控节点。非中心监控节点被配置为接收批量节点根据监控节点信息发送的监控报文,其中,所述监控节点信息为所述批量节点向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息得到的。
由于该节点解决问题的原理与以上方法类似,因此本节点的实施可以参见方法的实施,在此不再赘述。
基于相同原理,本实施例还公开了一种分布式系统。分布式系统包括中心监控节点、非中心监控节点和批量节点。
其中,所述中心监控节点用于接收批量节点的注册请求,根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点以使所述批量节点向所述目标非中心监控节点发送监控报文,若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点以使所述批量节点向所述新增目标非中心监控节点发送监控报文。
由于该系统解决问题的原理与以上方法类似,因此本系统的实施可以参见方法的实施,在此不再赘述。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机设备,具体的,计算机设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在一个典型的实例中计算机设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的由客户端执行的方法,或者,所述处理器执行所述程序时实现如上所述的由服务器执行的方法。
下面参考图14,其示出了适于用来实现本申请实施例的计算机设备600的结构示意图。
如图14所示,计算机设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM))603中的程序而执行各种适当的工作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602、以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶反馈器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口606。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包括用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (19)

1.一种分布式系统批量节点监控方法,其特征在于,包括:
接收批量节点的注册请求;
根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点以使所述批量节点向所述目标非中心监控节点发送监控报文;
若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点以使所述批量节点向所述新增目标非中心监控节点发送监控报文。
2.根据权利要求1所述的分布式系统批量节点监控方法,其特征在于,进一步包括:
当所述非中心监控节点的数量大于预设第一阈值时,对所有非中心监控节点进行优先级排序;
将优先级排序后的所有非中心监控节点中的至少部分节点的监控节点修改为其他非中心监控节点,形成下一层非中心监控节点。
3.根据权利要求2所述的分布式系统批量节点监控方法,其特征在于,所述对所有非中心监控节点进行优先级排序具体包括:
对所有非中心监控节点按照监控的非中心监控节点的层数和各非中心监控节点的新增时间进行优先级排序,其中,层数越少优先级越高,新增时间越早优先级越高,层数优先级高于新增时间优先级。
4.根据权利要求2所述的分布式系统批量节点监控方法,其特征在于,所述将优先级排序后的所有非中心监控节点中的至少部分节点的监控节点修改为其他非中心监控节点具体包括:
根据预设单层常规监控节点数得到节点序列号;
将所述优先级排序后的所有非中心监控节点中排序在第二个到所述节点序列号间的非中心监控节点的监控节点修改为排序在第一个的非中心监控节点。
5.根据权利要求4所述的分布式系统批量节点监控方法,其特征在于,进一步包括:
若所述非中心监控节点下一层的非中心监控节点数量大于预设第二阈值时,对下一层的所有非中心监控节点进行优先级排序;
将优先级排序后的下一层的非中心监控节点中的至少部分节点的监控节点修改为下一层的非中心监控节点中的其他非中心监控节点,形成再下一层非中心监控节点。
6.根据权利要求5所述的分布式系统批量节点监控方法,其特征在于,所述对下一层的所有非中心监控节点进行优先级排序具体包括:
对下一层的所有非中心监控节点按照监控的非中心监控节点的层数和各非中心监控节点的新增时间进行优先级排序,其中,层数越少优先级越高,新增时间越早优先级越高,层数优先级高于新增时间优先级。
7.根据权利要求5所述的分布式系统批量节点监控方法,其特征在于,所述将优先级排序后的下一层的非中心监控节点中的至少部分节点的监控节点修改为下一层的非中心监控节点中的其他非中心监控节点具体包括:
根据预设单层常规监控节点数得到节点序列号;
将优先级排序后的下一层的非中心监控节点中排序在第二个到所述节点序列号间的下一层的非中心监控节点的监控节点修改为排序在第一个的下一层的非中心监控节点。
8.根据权利要求1所述的分布式系统批量节点监控方法,其特征在于,进一步包括:
接收批量节点或非中心监控节点发送的重新确定监控节点请求,所述重新确定监控节点请求为批量节点或非中心监控节点超过预设时间阈值没有接收到监控节点发送的心跳报文时形成的;
根据所述重新确定监控节点请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点或非中心监控节点以使所述批量节点或非中心监控节点向所述目标非中心监控节点发送监控报文;
若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点或非中心监控节点以使所述批量节点或非中心监控节点向所述新增目标非中心监控节点发送监控报文。
9.一种分布式系统批量节点监控方法,其特征在于,包括:
向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息以向所述目标非中心监控节点发送监控报文;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息以向所述新增目标非中心监控节点发送监控报文。
10.一种分布式系统批量节点监控方法,其特征在于,包括:
接收批量节点根据监控节点信息发送的监控报文,其中,所述监控节点信息为所述批量节点向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息得到的。
11.根据权利要求10所述的分布式系统批量节点监控方法,其特征在于,若存在监控的下一层非中心监控节点,进一步包括:
接收下一层非中心监控节点发送的监控报文。
12.根据权利要求10所述的分布式系统批量节点监控方法,其特征在于,所述监控报文包括心跳报文和非心跳报文,所述方法进一步包括:
若经过第一预设时间间隔接收到批量节点或非中心监控节点发送的心跳报文,形成正常的心跳报文并与接收到的批量节点或非中心监控节点发送的非心跳报文进行合并后的报文发送至监控节点;
若经过第二预设时间间隔未接收到批量节点或非中心监控节点发送的心跳报文或接收到包括错误信息的心跳报文,形成包括异常信息的心跳报文并与接收到的批量节点或非中心监控节点发送的非心跳报文进行合并后的报文发送至监控节点;
每隔第三预设时间间隔将接收到的批量节点或非中心监控节点发送的非心跳报文发送至监控节点。
13.根据权利要求12所述的分布式系统批量节点监控方法,其特征在于,若发送至监控节点的报文大小大于预设文件大小,所述报文发送至监控节点包括:
将所述报文拆分为多个子报文后将多个子报文;
将多个子报文分别发送至所述监控节点。
14.一种中心监控节点,其特征在于,包括:
请求接收模块,用于接收批量节点的注册请求;
监控节点动态配置模块,用于根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点以使所述批量节点向所述目标非中心监控节点发送监控报文;若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点以使所述批量节点向所述新增目标非中心监控节点发送监控报文。
15.一种批量节点,其特征在于,被配置为:
向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息以向所述目标非中心监控节点发送监控报文;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息以向所述新增目标非中心监控节点发送监控报文。
16.一种非中心监控节点,其特征在于,被配置为:
接收批量节点根据监控节点信息发送的监控报文,其中,所述监控节点信息为所述批量节点向中心监控节点接收批量节点的注册请求,以使所述中心监控节点根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,接收所述中心监控节点返回的所述目标非中心监控节点的监控节点信息;若否,确定一个新增非中心监控节点并接收所述中心监控节点发送的所述新增非中心监控节点的监控节点信息得到的。
17.一种分布式系统,其特征在于,包括中心监控节点、非中心监控节点和批量节点;
其中,所述中心监控节点用于接收批量节点的注册请求,根据所述注册请求确定是否存在监控的批量节点的数量小于预设阈值的目标非中心监控节点,若是,返回所述目标非中心监控节点的监控节点信息至所述批量节点以使所述批量节点向所述目标非中心监控节点发送监控报文,若否,确定一个新增非中心监控节点并将所述新增非中心监控节点的监控节点信息发送至所述批量节点以使所述批量节点向所述新增目标非中心监控节点发送监控报文。
18.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,
所述处理器执行所述程序时实现如权利要求1-13任一项所述方法。
19.一种计算机可读介质,其上存储有计算机程序,其特征在于,
该程序被处理器执行时实现如权利要求1-13任一项所述方法。
CN202110618110.4A 2021-06-03 2021-06-03 分布式系统批量节点监控方法、节点及系统 Active CN113311766B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110618110.4A CN113311766B (zh) 2021-06-03 2021-06-03 分布式系统批量节点监控方法、节点及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110618110.4A CN113311766B (zh) 2021-06-03 2021-06-03 分布式系统批量节点监控方法、节点及系统

Publications (2)

Publication Number Publication Date
CN113311766A true CN113311766A (zh) 2021-08-27
CN113311766B CN113311766B (zh) 2022-09-06

Family

ID=77377143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110618110.4A Active CN113311766B (zh) 2021-06-03 2021-06-03 分布式系统批量节点监控方法、节点及系统

Country Status (1)

Country Link
CN (1) CN113311766B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106302726A (zh) * 2016-08-15 2017-01-04 浪潮(北京)电子信息产业有限公司 一种分布式集群数据的管理节点的监控方法及模块
CN109525456A (zh) * 2018-11-07 2019-03-26 郑州云海信息技术有限公司 一种服务器监控方法、装置和系统
US20190207873A1 (en) * 2017-12-28 2019-07-04 Facebook, Inc. Techniques for batched bulk processing
CN110457176A (zh) * 2019-07-12 2019-11-15 平安普惠企业管理有限公司 用于分布式系统的监控方法、装置、存储介质及电子设备
CN111897658A (zh) * 2020-08-26 2020-11-06 中国工商银行股份有限公司 一种基于函数计算节点的云计算系统扩容方法及装置
CN111949494A (zh) * 2020-09-16 2020-11-17 北京浪潮数据技术有限公司 一种任务调控方法、装置及相关设备
CN112035234A (zh) * 2020-09-02 2020-12-04 中国银行股份有限公司 分布式批量作业分配方法及装置
CN112235383A (zh) * 2020-10-09 2021-01-15 腾讯科技(深圳)有限公司 容器服务集群节点调度方法及装置、服务器、存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106302726A (zh) * 2016-08-15 2017-01-04 浪潮(北京)电子信息产业有限公司 一种分布式集群数据的管理节点的监控方法及模块
US20190207873A1 (en) * 2017-12-28 2019-07-04 Facebook, Inc. Techniques for batched bulk processing
CN109525456A (zh) * 2018-11-07 2019-03-26 郑州云海信息技术有限公司 一种服务器监控方法、装置和系统
CN110457176A (zh) * 2019-07-12 2019-11-15 平安普惠企业管理有限公司 用于分布式系统的监控方法、装置、存储介质及电子设备
CN111897658A (zh) * 2020-08-26 2020-11-06 中国工商银行股份有限公司 一种基于函数计算节点的云计算系统扩容方法及装置
CN112035234A (zh) * 2020-09-02 2020-12-04 中国银行股份有限公司 分布式批量作业分配方法及装置
CN111949494A (zh) * 2020-09-16 2020-11-17 北京浪潮数据技术有限公司 一种任务调控方法、装置及相关设备
CN112235383A (zh) * 2020-10-09 2021-01-15 腾讯科技(深圳)有限公司 容器服务集群节点调度方法及装置、服务器、存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
何绪兰 等: "分布式实时系统网络节点管理解决方案", 《铁道通信信号》 *
刘立帮 等: "一种多层网络下动态负载均衡算法", 《计算机技术与发展》 *

Also Published As

Publication number Publication date
CN113311766B (zh) 2022-09-06

Similar Documents

Publication Publication Date Title
US11290381B2 (en) Method and system for transmitting data resource acquisition request
EP2822236B1 (en) Network bandwidth distribution method and terminal
CN108696374B (zh) 更新客户端配置的方法和装置
US9853906B2 (en) Network prioritization based on node-level attributes
US10338964B1 (en) Computing node job assignment for distribution of scheduling operations
CN106713168B (zh) 一种流量控制方法及系统
CN106844055B (zh) 一种任务的执行方法和装置
CN106603689B (zh) 基于分布式发布订阅消息系统的数据处理方法及装置
CN109981467B (zh) 静态路由更新方法和路由集中管理分发方法
CN110888735A (zh) 基于一致性哈希的分布式消息分发方法、装置和调度节点
CN109428926B (zh) 一种调度任务节点的方法和装置
EP3723343B1 (en) Resource processing method and system, storage medium and electronic device
CN112838980B (zh) 一种消息处理方法、系统、装置、电子设备及存储介质
CN113311766B (zh) 分布式系统批量节点监控方法、节点及系统
WO2020248633A1 (zh) 群成员管理和群消息处理的方法、装置、设备及存储介质
CN109862069B (zh) 消息处理方法和装置
CN111740806A (zh) 一种自适应变帧长的遥测数据组帧方法及系统
CN114500546B (zh) 基于负载均衡集群的通信消息发送方法、装置及设备
CN108037897B (zh) 一种元数据扩散的方法、计算机装置及可读存储介质
CN107710793A (zh) 一种定位方法及对应装置
CN112631727B (zh) 一种容器组pod的监控方法及装置
CN115118475A (zh) 密码设备集群调度方法、装置、设备及介质
CN115604273A (zh) 用于管理计算系统的方法、设备和程序产品
CN114760304A (zh) 算力信息的处理方法、处理系统及算力网关
CN106559835B (zh) 一种车联网通信方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant