CN114745387A - 一种多集群管控方法和系统 - Google Patents

一种多集群管控方法和系统 Download PDF

Info

Publication number
CN114745387A
CN114745387A CN202210415721.3A CN202210415721A CN114745387A CN 114745387 A CN114745387 A CN 114745387A CN 202210415721 A CN202210415721 A CN 202210415721A CN 114745387 A CN114745387 A CN 114745387A
Authority
CN
China
Prior art keywords
list
management list
service
management
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210415721.3A
Other languages
English (en)
Other versions
CN114745387B (zh
Inventor
朱日辉
余志伟
王斌彬
黄红娟
李楠楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lion Digital Technology Co ltd
Original Assignee
Zhejiang Lion Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lion Digital Technology Co ltd filed Critical Zhejiang Lion Digital Technology Co ltd
Priority to CN202210415721.3A priority Critical patent/CN114745387B/zh
Publication of CN114745387A publication Critical patent/CN114745387A/zh
Application granted granted Critical
Publication of CN114745387B publication Critical patent/CN114745387B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及边缘计算技术领域中的一种多集群管控方法和系统,包括以下步骤:从逻辑集群中获取各个物理集群的清单,得到第一更新管理列表;获取数据库内的历史更新管理列表,并从历史更新管理列表内筛选出被动更新管理列表,其中历史更新管理列表包括主动更新管理列表和被动更新管理列表;将第一更新管理列表分别与被动更新管理列表和主动更新管理列表进行比对,依次得到被动调整管理列表和主动调整管理列表;调节物理集群与管理中心的连接;获取主动调整管理列表,并将主动调整管理列表与被动调整管理列表形成最近一次历史更新管理列表进行存储,具有配置简单、灵活的优点,解决了管理与被管理的归属关系配置的问题。

Description

一种多集群管控方法和系统
技术领域
本发明涉及边缘计算技术领域,具体涉及一种多集群管控方法和系统。
背景技术
现有集群节点在上线时,需要进行很详细的配置,例如管控服务器的IP、端口等信息,以及对接过程中具体的配置信息,另外,对于节点注册和上线的相关流程要求也很高,还需要使用心跳等信息进行状态的同步和维系,所以在配置的复杂度和细致度上要求很高,同时还有不少由于心跳等带来的额外开销,且对于节点的下线,同样也需要基于一定的时序和流程进行节点的下线才能完成退服。
同时,一般在生产环境中,都会部署服务发现功能,但对于健康管理往往是独立的,也就是说,在底层的物理集群和节点管理中,往往相关的管理程序会进行相关的健康管理,而在服务发现中,服务注册后,注册中心往往也会进行健康管理,而这两个健康管理一般都是独立的。
发明内容
本发明针对现有技术中的缺点,提供了一种多集群管控方法和系统,具有配置简单、灵活的优点,解决了管理与被管理的归属关系配置的问题。
为了解决上述技术问题,本发明通过下述技术方案得以解决:
一种多集群管控方法,包括以下步骤:
从逻辑集群中获取各个物理集群的清单,得到第一更新管理列表;
获取历史更新管理列表,并从历史更新管理列表内筛划分出被动更新管理列表和主动更新管理列表,其中历史更新管理列表包括主动更新管理列表和被动更新管理列表;
将所述第一更新管理列表分别与被动更新管理列表和主动更新管理列表进行比对,依次得到被动调整管理列表和主动调整管理列表;
根据所述被动调整管理列表和主动调整管理列表,调节物理集群与管理中心的连接;
获取主动调整管理列表,并将所述主动调整管理列表与被动调整管理列表形成最近一次历史更新管理列表进行存储。
可选的,从逻辑集群中获取各个物理集群的清单,包括以下步骤:
锁定需要筛选的目标服务任务,并通过服务发现查找所有含有目标服务任务的物理集群,得到中间管理列表;
设定筛选条件,并根据所述筛选条件,筛选物理集群,形成第一更新管理列表。
可选的,根据所述被动调整管理列表和主动调整管理列表,调节物理集群与管理中心的连接,包括以下步骤:
将被动调整管理列表划分为新增集群列表和多余集群列表;
将新增集群列表内的物理集群与管理中心建立连接,并断开多余集群列表内的物理集群与管理中心的连接;
所述主动调整管理列表根据主动变更状态,进行建立或断开物理集群与管理中心的连接;
向物理集群发送建立连接或断开连接信息。
可选的,将被动调整管理列表划分为新增集群列表和多余集群列表,包括以下步骤:
判断被动调整管理列表内的物理集群是否存在于第一更新管理列表;
若是,则划分为新增集群列表,若否,则判断被动调整管理列表内的物理集群是否存在于被动更新管理列表;
若是,则划分为多余集群列表,若否,则重新比对第一更新管理列表与被动更新管理列表。
可选的,还包括以下步骤:
更新并同步所述物理集群的服务任务。
可选的,更新并同步所述物理集群的服务任务包括以下步骤:
获取当前物理集群的当前服务列表,并周期性检测当前服务列表的响应情况,得到当前服务离线结果;
获取其他物理集群的服务列表,并在其他物理集群的服务列表内查找与当前服务离线结果具有相同服务功能的服务任务,得到同步列表;
将所述同步列表内的服务任务更新到当前物理集群内。
可选的,周期性检测当前服务列表的响应情况,得到当前服务离线结果,包括以下步骤:
向物理集群的服务节点发送一定次数的服务在线检查请求;
设定响应时间阈值,判断在响应时间阈值内,是否接收到相同次数的服务节点的请求响应,若是,则判定服务任务在线,若否,则判定服务任务离线;
将所有判定离线的服务任务集合,得到当前服务离线结果。
可选的,获取其他物理集群的服务列表,包括以下步骤:
设定获取路径距离,并根据路径距离,获取其他物理集群的服务列表。
一种多集群管控系统,包括:
第一筛选模组,用于从逻辑集群中获取各个物理集群的清单,得到第一更新管理列表;
第二筛选模组,用于获取历史更新管理列表,并从历史更新管理列表内划分出被动更新管理列表和主动更新管理列表,其中历史更新管理列表包括主动更新管理列表和被动更新管理列表;
比对模组,用于将所述第一更新管理列表分别与被动更新管理列表和主动更新管理列表进行比对,依次得到被动调整管理列表和主动调整管理列表;
调整模组,用于根据所述被动调整管理列表和主动调整管理列表,调节物理集群与管理中心的连接;
存储模组,用于获取主动调整管理列表,并将所述主动调整管理列表与被动调整管理列表形成最近一次历史更新管理列表进行存储。
可选的,所述第一筛选模组包括查找模组和过滤模组;
所述查找模组用于锁定需要筛选的目标服务任务,并通过服务发现查找所有含有目标服务任务的物理集群,得到中间管理列表;
所述过滤模组用于设定筛选条件,并根据所述筛选条件筛选物理集群,形成第一更新管理列表。
采用本发明提供的技术方案,与现有技术相比,具有如下有益效果:
通过服务发现所组成的逻辑集群实现跨物理集群管理,并利用服务发现与物理集群之间的关联,实现物理集群之间的服务节点与服务任务的相关信息同步以及查询,可及时刷新管理信息,并及时进行上线和下线调整,简化了物理集群中的相关管控流程,同时能适用移动的边缘计算节点,从物理集群的层面上实现配置的自适应。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本实施例一和实施例二提出的一种多集群管控方法和系统的实例图。
具体实施方式
下面结合实施例对本发明做进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。
实施例一
一种多集群管控方法,包括以下步骤:从逻辑集群中获取各个物理集群的清单,得到第一更新管理列表,具体的,包括以下步骤:锁定需要筛选的目标服务任务,并通过服务发现查找所有含有目标服务任务的物理集群,得到中间管理列表;设定筛选条件,并根据筛选条件筛选物理集群,形成第一更新管理列表。
如图1所示,多集群管控中,包括多个物理集群以及管理中心,物理集群和管理中心中的方块代表服务节点,每个服务节点内均提供服务任务,而每个物理集群和管理中心中均可以布置多个服务节点,且在物理集群和管理中心中存在一个服务节点用于提供服务发现任务,所有的服务发现任务组成了一个逻辑集群,本实施例中,以高铁运行为例进行说明,多个物理集群相当于高铁a、高铁b、高铁c和高铁d上的边缘计算机房,每个机房包含若干台服务器以提供该车的资源和服务,管理中心相当于高铁经过地的高铁管理部,由于高铁运行过程中的具体位置不定,从而对应时刻高铁管理部的具体位置和信息为未知。
当高铁管理部这个管理中心需要对自身管辖范围内所经过的高铁内的某项服务任务进行管控时,首先确定需要管控的该项服务任务,即目标服务任务,在高铁运行实例中,目标服务任务可以为提供无线通信服务、叫餐服务或补票服务等,以目标服务任务为无线通信服务为例,此时设置于高铁管理部的服务发现会向所有物理集群,即高铁a、高铁b、高铁c和高铁d查找,车辆内的服务节点含有无线通信服务的高铁,并进行汇集,例如高铁a、高铁b和高铁c的服务节点含有无线通信服务,则将高铁a、高铁b和高铁c进行汇集,该汇集的清单即为中间管理列表,然后设置筛选条件,该筛选条件可以为高铁管理部所管辖的IP地址范围,此时高铁管理部根据自身管辖的IP地址范围,与高铁a、高铁b和高铁c的当前所在的IP地址进行确认,高铁a、高铁b和高铁c是否在高铁管理部的管辖范围内,从而进一步筛选得到第一更新管理列表,并存储于高铁管理部的数据库内。
获取数据库内的历史更新管理列表,并从历史更新管理列表内划分出被动更新管理列表和主动更新管理列表,并分别将第一更新管理列表与被动更新管理列表和主动更新管理列表进行对比,依次得到被动调整管理列表和主动调整管理列表;得到第一更新管理列表后,考虑数据防抖问题,因此从高铁管理部的数据库中获取三至五次的历史更新管理列表,并取出每一次的历史更新管理列表内的被动更新管理列表,然后将被动更新管理列表和第一更新管理列表进行比较,得到三至五次比较结果,删除三至五次比较结果内两个列表共有的高铁,即得到需要管理中心进行管理调整的被动调整管理列表。
主动更新管理列表指的是高铁根据自身的运行位置,主动进行地址的切换,因此对于自发地发起IP地址切换的高铁部分,也需要进行调整其是否与管理中心建立连接或断开连接的操作,因此,同样的,将第一更新管理列表与主动更新管理列表进行比对,得到主动调整管理列表;而考虑数据防抖问题,因此需要从高铁管理部的数据库中获取三至五次的历史更新管理列表,并取出每一次的历史更新管理列表内的主动更新管理列表,然后将主动更新管理列表和第一更细管理列表进行比较,得到三至五次比较结果,删除三至五次比较结果内两个列表共有的高挑,即得到需要管理中心进行管理调整的主动调整管理列表。
其中历史更新管理列表包括主动更新管理列表和被动更新管理列表,其中主动更新管理列表代表的是物理集群根据自身的位置变化,能够自身主动修改IP地址。
根据被动调整管理列表和主动调整管理列表,调节物理集群与管理中心的连接,包括以下步骤:将被动调整管理列表划分为新增集群列表和多余集群列表;具体的,将被动调整管理列表划分为新增集群列表和多余集群列表,包括以下步骤:判断被动调整管理列表内的物理集群是否存在于第一更新管理列表;若是,则划分为新增集群列表,若否,则判断被动调整管理列表内的物理集群是否存在于被动更新管理列表;若是,则划分为多余集群列表,若否,则重新比对第一更新管理列表与被动更新管理列表。
在高铁运行的实例中,获得被动调整管理名单后,还需将其分为新增集群列表和多余集群列表,新增集群列表代表新进入高铁管理部管辖范围内的高铁清单,而多余集群列表则代表已经离开高铁管理部管辖范围的高铁清单,然后将新增集群列表内的物理集群与管理中心建立连接,并断开多余集群列表内的物理集群与管理中心的连接;主动调整管理列表根据主动变更状态,进行建立或断开物理集群与管理中心的连接;向物理集群发送建立连接或断开连接信息,即向离开高铁管理部的高铁发送断开服务连接的信息,然后切断服务连接,向新进入高铁管理部管辖范围的高铁发送建立服务连接的信息,然后开始服务器连接,所发送的信息可以为短信提醒方式,从而实现高铁管理部与高铁的管理与被管理的配置,解决了高铁即物理集群的归属关系问题,其中主动调整管理列表的主动变更状态可以理解为,当高铁从高铁管理部管辖范围内运行至管辖范围外时,主动调整管理列表内的高铁主动将IP地址修改为非管辖范围内的地址;当高铁从高铁管理部管辖范围外运行至管辖范围内时,主动调整管理列表内的高铁主动将IP地址修改为管辖范围内的地址。
将主动调节管理列表与被动调整管理列表形成最近一次历史更新管理列表,存入数据库,完成物理集群与管理中心的管理与被管理的配置后,为便于下一次的配置管理,还需将主动调整管理列表与被动调整管理列表进行汇总,并存储在数据库内,使得各次的存储在数据库内形成一次次的历史更新管理列表。
一种多集群管控方法,还包括以下步骤:更新并同步物理集群的服务任务,具体的,包括以下步骤:获取当前物理集群的当前服务列表,并周期性检测当前服务列表的响应情况,得到当前服务离线结果,进一步的,周期性检测当前服务列表的响应情况,得到当前服务离线结果,包括以下步骤:向物理集群的服务节点发送一定次数的服务在线检查请求;设定响应时间阈值,判断在响应时间阈值内,是否接收到相同次数的服务节点的请求响应,若是,则判定服务任务在线,若否,则判定服务任务离线;将所有判定离线的服务任务集合,得到当前服务离线结果。
在本实施例中,以物理集群为高铁a、高铁b、高铁c或高铁d为例,除高铁管理部与高铁之间的归属关系问题,高铁的服务任务也存在一些管理,即高铁a、高铁b、高铁c和高铁d内均布置有若干个服务节点,该服务节点可以为服务器、交换机等设备,且每个服务节点提供服务任务,从而每辆高铁内均含有服务任务的清单,而位于高铁内的服务发现则会定期对清单上的服务任务进行健康检查,确认该项服务任务是否正常运行,例如服务发现连续发送服务在线检查请求3次,且每次间隔5分钟发送一次请求,然后设定相应时间阈值为1分钟,若每一次所发送的请求在1分钟内,服务发现接收到该服务节点所发送的响应反馈,则有效,当3次均收到请求响应,则该服务节点以及其内置的服务任务在线,否则为离线状态,然后将所有离线的服务任务以及服务节点进行汇集,得到当前服务离线结果。
获取其他物理集群的服务列表,并在其他物理集群的服务列表内查找与当前服务离线结果具有相同服务功能的服务任务,得到同步列表;将同步列表内的服务任务更新到当前物理集群内,其中,获取其他物理集群的服务列表,包括以下步骤:设定获取路径距离,并根据路径距离,获取其他物理集群的服务列表。
对于当前服务离线结果内的离线的服务任务而言,其不再提供服务,但可以通过与其他高铁的服务任务进行同步的方式进行继续提供服务,例如,高铁a内的叫餐服务出现异常而下线了,此时确定距离高铁a最近的一辆高铁,如搜寻到距离高铁a有一公里的高铁c,然后高铁a内的服务发现查询高铁c含有的服务任务,然后确认是否具有叫餐服务,若含有该项服务,则获取高铁c的该项叫餐服务的信息,例如叫餐服务的服务节点的连接端口等,然后高铁a与高铁c的含有叫餐服务的服务节点建立连接,并通过高铁c的服务节点为高铁a提供叫餐服务,若高铁c内不含该项服务,则继续搜寻距离高铁a最近的高铁,需要说明的是,本实施例中的高铁均为运行中的高铁,从而使服务任务的管理更为完善。
实施例二
一种多集群管控系统,包括:第一筛选模组,从逻辑集群中获取各个物理集群的清单,得到第一更新管理列表,其中,第一筛选模组包括查找模组和过滤模组,查找模组用于锁定需要筛选的目标服务任务,并通过服务发现查找所有含有目标服务任务的物理集群,得到中间管理列表;过滤模组用于设定筛选条件,并根据筛选条件筛选物理集群,形成第一更新管理列表。
如图1所示,多集群管控中,包括多个物理集群以及管理中心,物理集群和管理中心中的方块代表服务节点,每个服务节点内均提供服务任务,而每个物理集群和管理中心中均可以布置多个服务节点,且在物理集群和管理中心中存在一个服务节点用于提供服务发现任务,所有的服务发现任务组成了一个逻辑集群,本实施例中,以高铁运行为例进行说明,多个物理集群相当于高铁a、高铁b、高铁c和高铁d上的边缘计算机房,每个机房包含若干台服务器以提供该车的资源和服务,管理中心相当于高铁经过地的高铁管理部,由于高铁运行过程中的具体位置不定,从而对应时刻高铁管理部的具体位置和信息为未知。
当高铁管理部这个管理中心需要对自身管辖范围内所经过的高铁内的某项服务任务进行管控时,首先确定需要管控的该项服务任务,即目标服务任务,在高铁运行实例中,目标服务任务可以为提供无线通信服务、叫餐服务或补票服务等,以目标服务任务为无线通信服务为例,此时设置于高铁管理部的服务发现会向所有物理集群,即高铁a、高铁b、高铁c和高铁d查找,车辆内的服务节点含有无线通信服务的高铁,并进行汇集,例如高铁a、高铁b和高铁c的服务节点含有无线通信服务,则将高铁a、高铁b和高铁c进行汇集,该汇集的清单即为中间管理列表,然后设置筛选条件,该筛选条件可以为高铁管理部所管辖的IP地址范围,此时高铁管理部根据自身管辖的IP地址范围,与高铁a、高铁b和高铁c的当前所在的IP地址进行确认,高铁a、高铁b和高铁c是否在高铁管理部的管辖范围内,从而进一步筛选得到第一更新管理列表,并存储于高铁管理部的数据库内。
第二筛选模组获取数据库内的历史更新管理列表,并从历史更新管理列表内划分出被动更新管理列表和主动更新管理列表,比对模组分别将第一更新管理列表与被动更新管理列表和主动更新管理列表进行比对,依次得到被动调整管理列表和主动调整管理列表;得到第一更新管理列表后,考虑数据防抖问题,因此从高铁管理部的数据库中获取三至五次的历史更新管理列表,并取出每一次的历史更新管理列表内的被动更新管理列表,然后将被动更新管理列表和第一更新管理列表进行比较,得到三至五次比较结果,删除三至五次比较结果内两个列表共有的高铁,即得到需要管理中心进行管理调整的被动调整管理列表。
主动更新管理列表指的是高铁根据自身的运行位置,主动进行地址的切换,因此对于自发地发起IP地址切换的高铁部分,也需要进行调整其是否与管理中心建立连接或断开连接的操作,因此,同样的,将第一更新管理列表与主动更新管理列表进行比对,得到主动调整管理列表;而考虑数据防抖问题,因此需要从高铁管理部的数据库中获取三至五次的历史更新管理列表,并取出每一次的历史更新管理列表内的主动更新管理列表,然后将主动更新管理列表和第一更细管理列表进行比较,得到三至五次比较结果,删除三至五次比较结果内两个列表共有的高挑,即得到需要管理中心进行管理调整的主动调整管理列表。
其中历史更新管理列表包括主动更新管理列表和被动更新管理列表,其中主动更新管理列表代表的是物理集群根据自身的位置变化,能够自身主动修改IP地址。
调整模组根据被动调整管理列表和主动调整管理列表,调节物理集群与管理中心的连接,包括执行以下步骤:将被动调整管理列表划分为新增集群列表和多余集群列表;具体的,将被动调整管理列表划分为新增集群列表和多余集群列表,包括以下步骤:判断被动调整管理列表内的物理集群是否存在于第一更新管理列表;若是,则划分为新增集群列表,若否,则判断被动调整管理列表内的物理集群是否存在于被动更新管理列表;若是,则划分为多余集群列表,若否,则重新比对第一更新管理列表与被动更新管理列表。
在高铁运行的实例中,获得被动调整管理名单后,还需将其分为新增集群列表和多余集群列表,新增集群列表代表新进入高铁管理部管辖范围内的高铁清单,而多余集群列表则代表已经离开高铁管理部管辖范围的高铁清单,然后将新增集群列表内的物理集群与管理中心建立连接,并断开多余集群列表内的物理集群与管理中心的连接;主动调整管理列表根据主动变更状态,进行建立或断开物理集群与管理中心的连接;向物理集群发送建立连接或断开连接信息,即向离开高铁管理部的高铁发送断开服务连接的信息,然后切断服务连接,向新进入高铁管理部管辖范围的高铁发送建立服务连接的信息,然后开始服务器连接,所发送的信息可以为短信提醒方式,从而实现高铁管理部与高铁的管理与被管理的配置,解决了高铁即物理集群的归属关系问题,其中主动调整管理列表的主动变更状态可以理解为,当高铁从高铁管理部管辖范围内运行至管辖范围外时,主动调整管理列表内的高铁主动将IP地址修改为非管辖范围内的地址;当高铁从高铁管理部管辖范围外运行至管辖范围内时,主动调整管理列表内的高铁主动将IP地址修改为管辖范围内的地址。
存储模组将主动调节管理列表与被动调整管理列表形成最近一次历史更新管理列表,存入数据库,完成物理集群与管理中心的管理与被管理的配置后,为便于下一次的配置管理,还需将主动调整管理列表与被动调整管理列表进行汇总,并存储在数据库内,使得各次的存储在数据库内形成一次次的历史更新管理列表。
一种多集群管控系统,还执行以下步骤:更新并同步物理集群的服务任务,具体的,包括以下步骤:获取当前物理集群的当前服务列表,并周期性检测当前服务列表的响应情况,得到当前服务离线结果,进一步的,周期性检测当前服务列表的响应情况,得到当前服务离线结果,包括以下步骤:向物理集群的服务节点发送一定次数的服务在线检查请求;设定响应时间阈值,判断在响应时间阈值内,是否接收到相同次数的服务节点的请求响应,若是,则判定服务任务在线,若否,则判定服务任务离线;将所有判定离线的服务任务集合,得到当前服务离线结果。
在本实施例中,以物理集群为高铁a、高铁b、高铁c或高铁d为例,除高铁管理部与高铁之间的归属关系问题,高铁的服务任务也存在一些管理,即高铁a、高铁b、高铁c和高铁d内均布置有若干个服务节点,该服务节点可以为服务器、交换机等设备,且每个服务节点提供服务任务,从而每辆高铁内均含有服务任务的清单,而位于高铁内的服务发现则会定期对清单上的服务任务进行健康检查,确认该项服务任务是否正常运行,例如服务发现连续发送服务在线检查请求3次,且每次间隔5分钟发送一次请求,然后设定相应时间阈值为1分钟,若每一次所发送的请求在1分钟内,服务发现接收到该服务节点所发送的响应反馈,则有效,当3次均收到请求响应,则该服务节点以及其内置的服务任务在线,否则为离线状态,然后将所有离线的服务任务以及服务节点进行汇集,得到当前服务离线结果。
获取其他物理集群的服务列表,并在其他物理集群的服务列表内查找与当前服务离线结果具有相同服务功能的服务任务,得到同步列表;将同步列表内的服务任务更新到当前物理集群内,其中,获取其他物理集群的服务列表,包括以下步骤:设定获取路径距离,并根据路径距离,获取其他物理集群的服务列表。
对于当前服务离线结果内的离线的服务任务而言,其不再提供服务,但可以通过与其他高铁的服务任务进行同步的方式进行继续提供服务,例如,高铁a内的叫餐服务出现异常而下线了,此时确定距离高铁a最近的一辆高铁,如搜寻到距离高铁a有一公里的高铁c,然后高铁a内的服务发现查询高铁c含有的服务任务,然后确认是否具有叫餐服务,若含有该项服务,则获取高铁c的该项叫餐服务的信息,例如叫餐服务的服务节点的连接端口等,然后高铁a与高铁c的含有叫餐服务的服务节点建立连接,并通过高铁c的服务节点为高铁a提供叫餐服务,若高铁c内不含该项服务,则继续搜寻距离高铁a最近的高铁,需要说明的是,本实施例中的高铁均为运行中的高铁,从而使服务任务的管理更为完善。
此外,需要说明的是,本说明书中所描述的具体实施例,其零、部件的形状、所取名称等可以不同。凡依本发明专利构思所述的构造、特征及原理所做的等效或简单变化,均包括于本发明专利的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (10)

1.一种多集群管控方法,其特征在于,包括以下步骤:
从逻辑集群中获取各个物理集群的清单,得到第一更新管理列表;
获取历史更新管理列表,并从历史更新管理列表内划分出被动更新管理列表和主动更新管理列表,其中历史更新管理列表包括主动更新管理列表和被动更新管理列表;
将所述第一更新管理列表分别与被动更新管理列表和主动更新管理列表进行比对,依次得到被动调整管理列表和主动调整管理列表;
根据所述被动调整管理列表和主动调整管理列表,调节物理集群与管理中心的连接;
将所述主动调整管理列表与被动调整管理列表形成最近一次历史更新管理列表进行存储。
2.根据权利要求1所述的一种多集群管控方法,其特征在于,从逻辑集群中获取各个物理集群的清单,包括以下步骤:
锁定需要筛选的目标服务任务,并通过服务发现查找所有含有目标服务任务的物理集群,得到中间管理列表;
设定筛选条件,并根据所述筛选条件,筛选物理集群,形成第一更新管理列表。
3.根据权利要求1所述的一种多集群管控方法,其特征在于,根据所述被动调整管理列表和主动调整管理列表,调节物理集群与管理中心的连接,包括以下步骤:
将被动调整管理列表划分为新增集群列表和多余集群列表;
将新增集群列表内的物理集群与管理中心建立连接,并断开多余集群列表内的物理集群与管理中心的连接;
所述主动调整管理列表根据主动变更状态,进行建立或断开物理集群与管理中心的连接;
向物理集群发送建立连接或断开连接信息。
4.根据权利要求3所述的一种多集群管控方法,其特征在于,将被动调整管理列表划分为新增集群列表和多余集群列表,包括以下步骤:
判断被动调整管理列表内的物理集群是否存在于第一更新管理列表;
若是,则划分为新增集群列表,若否,则判断被动调整管理列表内的物理集群是否存在于被动更新管理列表;
若是,则划分为多余集群列表,若否,则重新比对第一更新管理列表与被动更新管理列表。
5.根据权利要求1所述的一种多集群管控方法,其特征在于,还包括以下步骤:
更新并同步所述物理集群的服务任务。
6.根据权利要求5所述的一种多集群管控方法,其特征在于,更新并同步所述物理集群的服务任务包括以下步骤:
获取当前物理集群的当前服务列表,并周期性检测当前服务列表的响应情况,得到当前服务离线结果;
获取其他物理集群的服务列表,并在其他物理集群的服务列表内查找与当前服务离线结果具有相同服务功能的服务任务,得到同步列表;
将所述同步列表内的服务任务更新到当前物理集群内。
7.根据权利要求6所述的一种多集群管控方法,其特征在于,周期性检测当前服务列表的响应情况,得到当前服务离线结果,包括以下步骤:
向物理集群的服务节点发送一定次数的服务在线检查请求;
设定响应时间阈值,判断在响应时间阈值内,是否接收到相同次数的服务节点的请求响应,若是,则判定服务任务在线,若否,则判定服务任务离线;
将所有判定离线的服务任务集合,得到当前服务离线结果。
8.根据权利要求6所述的一种多集群管控方法,其特征在于,获取其他物理集群的服务列表,包括以下步骤:
设定获取路径距离,并根据路径距离,获取其他物理集群的服务列表。
9.一种多集群管控系统,其特征在于,包括:
第一筛选模组,用于从逻辑集群中获取各个物理集群的清单,得到第一更新管理列表;
第二筛选模组,用于获取历史更新管理列表,并从历史更新管理列表内划分出被动更新管理列表和主动更新管理列表,其中历史更新管理列表包括主动更新管理列表和被动更新管理列表;
比对模组,用于将所述第一更新管理列表分别与被动更新管理列表和主动更新管理列表进行比对,依次得到被动调整管理列表和主动调整管理列表;
调整模组,用于根据所述被动调整管理列表和主动调整管理列表,调节物理集群与管理中心的连接;
存储模组,用于将所述主动调整管理列表与被动调整管理列表形成最近一次历史更新管理列表进行存储。
10.根据权利要求9所述的一种多集群管控系统,其特征在于,所述第一筛选模组包括查找模组和过滤模组;
所述查找模组用于锁定需要筛选的目标服务任务,并通过服务发现查找所有含有目标服务任务的物理集群,得到中间管理列表;
所述过滤模组用于设定筛选条件,并根据所述筛选条件筛选物理集群,形成第一更新管理列表。
CN202210415721.3A 2022-04-20 2022-04-20 一种多集群管控方法和系统 Active CN114745387B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210415721.3A CN114745387B (zh) 2022-04-20 2022-04-20 一种多集群管控方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210415721.3A CN114745387B (zh) 2022-04-20 2022-04-20 一种多集群管控方法和系统

Publications (2)

Publication Number Publication Date
CN114745387A true CN114745387A (zh) 2022-07-12
CN114745387B CN114745387B (zh) 2024-07-09

Family

ID=82283809

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210415721.3A Active CN114745387B (zh) 2022-04-20 2022-04-20 一种多集群管控方法和系统

Country Status (1)

Country Link
CN (1) CN114745387B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109981810A (zh) * 2019-03-08 2019-07-05 福建天泉教育科技有限公司 一种路由地址列表更新的方法及系统
CN112087333A (zh) * 2020-09-07 2020-12-15 上海浦东发展银行股份有限公司 一种微服务注册中心集群及其信息处理方法
CN112422309A (zh) * 2019-08-23 2021-02-26 阿里巴巴集团控股有限公司 分布式服务发现的系统及方法、存储介质及终端
CN112572542A (zh) * 2019-09-30 2021-03-30 西门子交通有限责任公司 列车自动保护系统以及方法
US20210203754A1 (en) * 2020-09-24 2021-07-01 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for acquiring rpc member information, electronic device and storage medium
CN113282604A (zh) * 2021-07-14 2021-08-20 北京远舢智能科技有限公司 基于消息队列实现的高可用时序数据库集群系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109981810A (zh) * 2019-03-08 2019-07-05 福建天泉教育科技有限公司 一种路由地址列表更新的方法及系统
CN112422309A (zh) * 2019-08-23 2021-02-26 阿里巴巴集团控股有限公司 分布式服务发现的系统及方法、存储介质及终端
CN112572542A (zh) * 2019-09-30 2021-03-30 西门子交通有限责任公司 列车自动保护系统以及方法
CN112087333A (zh) * 2020-09-07 2020-12-15 上海浦东发展银行股份有限公司 一种微服务注册中心集群及其信息处理方法
US20210203754A1 (en) * 2020-09-24 2021-07-01 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for acquiring rpc member information, electronic device and storage medium
CN113282604A (zh) * 2021-07-14 2021-08-20 北京远舢智能科技有限公司 基于消息队列实现的高可用时序数据库集群系统

Also Published As

Publication number Publication date
CN114745387B (zh) 2024-07-09

Similar Documents

Publication Publication Date Title
CN109729111B (zh) 用于管理分布式系统的方法、设备和计算机程序产品
US8396956B2 (en) Mobility service clustering using network service segments
US9407703B2 (en) Connection management system, and a method for linking connection management server in thin client system
US20210191826A1 (en) Building system with ledger based software gateways
KR20090114917A (ko) 피투피 네트워크 시스템 및 그의 지역 기반 운용 방법
CN109547875B (zh) 一种fc交换网络任意端口接入设计方法
CN109639773B (zh) 一种动态构建的分布式数据集群控制系统及其方法
CN111901705B (zh) 一种olt设备的omci功能虚拟化系统
EP1351527A1 (en) Unique repository server in an operations and maintenance center for a telecommunications system
CN105592139A (zh) 一种分布式文件系统管理平台的ha实现方法及装置
CN110611603A (zh) 一种集群网卡监控方法及装置
CN115499447A (zh) 一种集群主节点确认方法、装置、电子设备及存储介质
CN110851527B (zh) 一种主备服务器的数据同步方法
US11477276B2 (en) Systems and methods for automated, controllerless and stateless network connection selection based on distributed server information
CN110290163B (zh) 一种数据处理方法及装置
CN112558943B (zh) 微服务架构下配置信息管理系统
CN114745387A (zh) 一种多集群管控方法和系统
CN107046474A (zh) 一种服务集群
CN107294773B (zh) 一种软件可定义的网络业务配置方法
CN113765690A (zh) 集群切换方法、系统、装置、终端、服务器及存储介质
US12034800B2 (en) Systems and methods for automated, controllerless and stateless network connection selection based on distributed server information
CN111478943A (zh) 跨局域网的文件存储方法和系统、存储介质、终端
EP3424182B1 (en) Neighbor monitoring in a hyperscaled environment
US20240176762A1 (en) Geographically dispersed hybrid cloud cluster
CN113742416A (zh) 数据处理方法、设备、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant