CN111130820A - 集群管理方法、装置及计算机系统 - Google Patents

集群管理方法、装置及计算机系统 Download PDF

Info

Publication number
CN111130820A
CN111130820A CN201811278148.6A CN201811278148A CN111130820A CN 111130820 A CN111130820 A CN 111130820A CN 201811278148 A CN201811278148 A CN 201811278148A CN 111130820 A CN111130820 A CN 111130820A
Authority
CN
China
Prior art keywords
cluster
management
node
instance
configuration information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811278148.6A
Other languages
English (en)
Other versions
CN111130820B (zh
Inventor
林沐晖
李临川
王恒欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811278148.6A priority Critical patent/CN111130820B/zh
Publication of CN111130820A publication Critical patent/CN111130820A/zh
Application granted granted Critical
Publication of CN111130820B publication Critical patent/CN111130820B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/046Network management architectures or arrangements comprising network management agents or mobile agents therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请公开了一种集群管理方法、装置及计算机系统。其中,该方法包括:在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动上述实例,并通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。本申请解决了现有技术中在单向隔离网络下,存在无法实现用户网络集群管控的技术问题。

Description

集群管理方法、装置及计算机系统
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种集群管理方法、装置及计算机系统。
背景技术
相关领域中,企业基础设施由于规划IP资源有限或因互联访问限制的问题,两个子网(例如,子网A和子网B)之间往往进行单向隔离。其中,单向隔离是指子网A可以使用IP地址直接访问子网B的主机或者服务,反之则不可以,即子网B不能使用IP地址直接访问子网A的主机或者服务。
但是,子网A中的集群需要在子网B的主机进行管控操作时,则无法实现在单向隔离网络下的用户网络集群管控。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种集群管理方法、装置及计算机系统,以至少解决现有技术中在单向隔离网络下,存在无法实现用户网络集群管控的技术问题。
根据本申请实施例的一个方面,提供了一种集群管理方法,包括:在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动上述实例,并通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
根据本申请实施例的另一方面,还提供了一种集群管理方法,包括:在受控集群中建立管控集群对应的虚拟化集群,其中,上述虚拟化集群中的集群节点与上述管控集群对受控集群的管理功能是对应的;通过上述受控集群中的代理进程建立上述虚拟化集群与上述管控集群的连接;以及在建立连接后,上述受控集群通过上述代理进程接收来自上述管控集群的管理操作。
根据本申请实施例的另一方面,还提供了一种集群管理装置,包括:建立模块,用于在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动模块,用于启动上述实例;控制模块,用于通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
根据本申请实施例的另一方面,还提供了一种存储介质,上述存储介质包括存储的程序,其中,在上述程序运行时控制上述存储介质所在设备执行任意一项上述的集群管理方法。
根据本申请实施例的另一方面,还提供了一种计算机系统,包括:处理器;以及存储器,与上述处理器连接,用于为上述处理器提供处理以下处理步骤的指令:在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动上述实例,并通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
在本申请实施例中,通过在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动上述实例,并通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
容易注意到的是,本申请实施例立足虚拟化,在单向隔离环境下通过虚拟化平台建立虚拟化集群,通过集群成员的管控代理建立单向隔离网络内部客户端到外部管控服务的长连接,管控端可以同客户端实时通信,控制集群账户/调度/计算以及登录节点的配置,能够支持复杂通信协议和支持更复杂应用,从而实现在单向隔离条件下使用云计算弹性资源为用户提供一站式高性能计算。
由此,本申请实施例达到了在单向隔离网络下实现用户网络集群管控的目的,从而实现了提高单向隔离网络内的虚拟化集群管控效率的技术效果,进而解决了现有技术中在单向隔离网络下,存在无法实现用户网络集群管控的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种用于实现集群管理方法的计算机终端(或移动设备)的硬件结构框图;
图2是根据本申请实施例的一种集群管理方法的流程图;
图3是根据本申请实施例的一种可选的集群管理方法的应用场景示意图;
图4是根据本申请实施例的另一种集群管理方法的流程图;
图5是根据本申请实施例的一种集群管理装置的示意图;
图6是根据本申请实施例的另一种集群管理装置的示意图;以及
图7是根据本申请实施例的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
网络地址转换(Network Address Translation,NAT):是一种将私有(保留)地址转化为合法IP地址的转换技术,被广泛应用于各种类型Internet接入方式和各种类型的网络中。
虚拟私有云(virtual private cloud,VPC):又称为专有网络,能够帮助用户基于云构建出一个隔离的网络环境,用户在虚拟网络上使用云计算资源,用户可以完全掌控自己的虚拟网络,包括选择自有IP地址范围、划分网段、配置路由表和网关等。
HPC:是高性能计算(High Performance Computing)机群的简称,指能够执行一般个人电脑无法处理的大资料量与高速运算的电脑。
ETCD:是一个应用在分布式环境下的key/value存储服务系统,利用ETCD的特性,应用程序可以在集群中共享信息、配置或服务的注册和发现。
弹性IP地址(Elastic IP,EIP):是与用户账户相关联的公网IP地址,可以在任何时候应用到用户申请的任何一台云主机上。
虚拟机(Virtual Machine,VM):是指通过软件模拟的具有完整硬件系统的、运行在一个完全隔离环境中的完整计算机系统。
实施例1
根据本申请实施例,还提供了一种集群管理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例1所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现集群管理方法的计算机终端(或移动设备)的硬件结构框图,如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的集群管理方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的集群管理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
在本技术领域中,弹性高性能服务构建在云资源之上,为用户提供一站式的弹性高性能计算服务的平台,支持弹性的公有云、混合云的全栈高性能计算服务,包括:集群资源管理、任务调度、并行文件系统、高性能计算框架/中间件、性能监控,应用软件管理(云License模式)。
弹性高性能服务针对应用特征符合云基础架构配置的应用(例如,小规模制造业集群,生命科学应用等对主频,网络带宽和延迟不非常敏感的应用),提供快捷、弹性和all-in-one的一键运行的高性能计算全栈软件。并且,弹性高性能服务还具备混合调度用户计算节点资源的能力,使占行业30-40%市场的主力高性能计算应用落地弹性高性能服务,支持按服务计费的云许可。
在云上提供高性能服务时,用户机群放在一个子网A里(虚拟私有云VPC),提供弹性高性能机器管控的服务集群放在另外一个子网B里,通常情况下这两个网络属于单向隔离网络,即子网A可以直接访问子网B提供的存储或者其他服务,子网B无法直接访问子网A提供的存储或者其他服务,通过本申请实施例提供的集群管理方法,可以实现部署在子网B的服务对在子网A中的集群进行管控。
在上述运行环境下,本申请提供了如图2所示的一种集群管理方法,图2是根据本申请实施例的一种集群管理方法的流程图,如图2所示,上述方法可以包括如下步骤:
步骤S202,在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络。
在上述步骤S202中,上述第一集群为管控集群,上述第二集群为受控集群;在一种可选的实施例中,如图3所示,管控服务区的集群管控服务器中运行管控集群,受控集群运行在另外一个受控的网络里,管控集群和受控集群之间的网络通过虚拟私有云VPC、NAT网关或者防火墙进行单向隔离,并且,管控集群不能直接通过单向网络的连接控制受控集群。
步骤S204,启动上述实例,并通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
在本申请实施例中,集群管控服务器首先通过云计算虚拟化平台,在第一集群中建立与第二集群中的管控服务对应的实例。由于集群管控服务器无法直接连到受控账号服务器,因此,在云平台上初始化实例时,可以通过该实例在指定的存储服务上获取第一集群的配置信息,该配置信息包括:第二集群所在的网络和第一集群的链接地址。
可选的,仍如图3所示,上述实例可以为集群账号节点实例、集群调度节点实例、集群计算节点实例、集群登录节点实例;上述实例所在的节点可以为集群账号节点、集群调度节点、集群计算节点、集群登录节点;上述代理进程可以为集群管控代理进程。
在一种可选的实施例中,在启动实例后,可以根据集群的配置信息从指定的存储服务上下载集群管控代理进程;通过运行集群管控代理进程可以实现单向网络连接到管控服务,管控服务通过集群管控代理进程进行虚拟化集群节点的控制操作,例如,虚拟化集群节点的增删改查,作业调度排队分发等。
在本申请实施例中,通过在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动上述实例,并通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
容易注意到的是,本申请实施例立足虚拟化,在单向隔离环境下通过虚拟化平台建立虚拟化集群,通过集群成员的管控代理建立单向隔离网络内部客户端到外部管控服务的长连接,管控端可以同客户端实时通信,控制集群账户/调度/计算以及登录节点的配置,能够支持复杂通信协议和支持更复杂应用,从而实现在单向隔离条件下使用云计算弹性资源为用户提供一站式高性能计算。
由此,本申请实施例达到了在单向隔离网络下实现用户网络集群管控的目的,从而实现了提高单向隔离网络内的虚拟化集群管控效率的技术效果,进而解决了现有技术中在单向隔离网络下,存在无法实现用户网络集群管控的技术问题。
在一种可选的实施例中,上述实例包括:集群账户节点实例;上述方法还包括:
步骤S302,通过上述集群账户节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;
步骤S304,依据上述配置信息从存储服务节点中下载与上述集群账户节点实例对应的第一代理进程,并基于上述第一代理进程建立上述第一集群与上述管控服务的连接。
可选的,上述集群账户节点实例为一种账户服务节点实例,上述第一代理进程为集群账户节点的集群管控代理进程。
作为一种可选的实施例,管控服务可以通过如图3所示的云计算虚拟化平台生成集群调度节点实例,管控服务无法直接连到受控集群调度节点实例,通过集群调度节点实例在指定的存储服务获取第一集群的配置信息,该配置信息包括:第二集群所在的网络和上述第二集群的链接地址。进而,本申请实施例通过启动集群调度节点后依据配置信息从存储服务节点中下载集群管控代理进程,并通过运行集群管控代理进程,实现第一集群通过单向网络连接管控区管控服务。
在一种可选的实施例中,控制上述第一集群执行与上述管控服务对应的操作,包括:控制上述第一集群对上述第二集群进行以下至少之一操作:删除上述第二集群对应的集群账户、增加上述第二集群对应的集群账号、修改上述第二集群对应的集群账户、查询上述第二集群对应的集群账户。
在一种可选的实施例中,上述实例包括:集群调度节点实例;通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作之前,上述方法还包括:
步骤S402,通过上述集群调度节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;
步骤S404,依据上述配置信息从存储服务节点中下载与上述集群调度节点实例对应的第二代理进程,并基于上述第二代理进程建立上述第一集群与上述管控服务的连接,其中,在建立上述第一集群与上述管控服务的连接后,上述管控服务通过上述第二代理进程对虚拟化集群节点进行控制操作。
在一种可选的实施例中,上述实例包括:集群计算节点实例;通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作之前,上述方法还包括:
步骤S502,通过上述集群调度节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;
步骤S504,依据上述配置信息从存储服务节点中下载与上述集群计算节点实例对应的第三代理进程,并基于上述第三代理进程建立上述第一集群与上述管控服务的连接。
可选的,上述第三代理进程可以为集群调度节点的集群管控代理进程。
作为一种可选的实施例,管控服务可以通过云计算虚拟化平台生成集群计算节点实例,管控服务无法直接连到受控集群计算节点实例,通过集群调度节点实例在指定的存储服务获取第一集群的配置信息,该配置信息包括:第二集群所在的网络和上述第二集群的链接地址。并且,在启动集群计算节点后,可以依据配置信息从存储服务节点中下载集群管控代理进程,通过运行集群管控代理进程,建立上述第一集群与上述管控服务的连接。
在一种可选的实施例中,控制上述第一集群执行与上述管控服务对应的操作,包括:
步骤S602,上述管控服务通过集群调度节点实例的第二代理进程控制调度节点将上述集群计算节点实例加入到虚拟化集群;
步骤S604,上述管控服务控制上述集群计算节点实例连接到虚拟化集群共享的上述存储服务节点,以使上述第一集群中的计算节点能够在虚拟化集群的计算节点共享;
步骤S606,上述管控服务通过上述集群计算节点实例向集群账户节点实例获取账号信息,其中,上述账号信息所指示的账号支持在不同的集群节点提交集群作业,并且上述账号支持在不同的集群节点进行登录。
可选的,上述第二代理进程可以为集群计算节点的集群管控代理进程。
在一种可选的实施例中,管控服务通过集群调度服务器的管控代理进程进行控制调度节点,将该集群计算节点加入到虚拟化集群,同时管控节点控制计算节点连接到虚拟化集群共享的NAS存储或其他存储服务(例如,对象存储服务)以便共享数据能够在虚拟化集群的计算节点共享,管控服务通过计算节点向账号服务节点获取账号信息,从而可以实现同一集群账号在不同的集群节点提交集群作业,同时使得同一个账号能在不同的集群节点进行登录,以及进行其他操作。
在一种可选的实施例中,上述实例包括:集群登录节点实例;通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作之前,上述方法还包括:
步骤S702,通过上述集群调度节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;
步骤S704,依据上述配置信息从存储服务节点中下载与上述集群登录节点实例对应的第四代理进程,并基于上述第四代理进程建立上述第一集群与上述管控服务的连接。
可选的,上述第四代理进程可以为集群登录节点的集群管控代理进程。
作为一种可选的实施例,管控服务可以通过云计算虚拟化平台生成集群登录节点实例,管控服务无法直接连到受控集群计算节点实例,通过集群调度节点实例在指定的存储服务获取第一集群的配置信息,该配置信息包括:第二集群所在的网络和上述第二集群的链接地址。并且,在启动集群登录节点后,可以依据配置信息从存储服务节点中下载集群管控代理进程,通过运行集群管控代理进程,建立上述第一集群与上述管控服务的连接。
在一种可选的实施例中,控制上述第一集群执行与上述管控服务对应的操作,包括:
步骤S802,上述管控服务通过在上述第四代理进程控制上述集群登录节点实例从集群账号节点实例中获取集群账号信息,并控制集群登录节点实例使能弹性IP地址。
在上述可选的实施例中,管控服务通过在第四代理进程控制集群登录节点从集群账号节点实例获取集群账号信息,同时控制集群登录节点实例使能弹性IP地址,以便用户能够登录到虚拟化集群。
需要说明的是,由于用户通过使能弹性IP地址即可够登录到集群,提交集群作业给集群调度器,集群调度器将作业分发到合适不同计算节点执行,由于之前不同计算节点已通过账号服务器互相打通,因此,即使涉及多机并行的集群作业也可以顺利运行并返回结果。
实施例2
根据本申请实施例,还提供了另一种集群管理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请提供了如图4所示的另一种集群管理方法,图4是根据本申请实施例的另一种集群管理方法的流程图,如图4所示,上述方法可以包括如下步骤:
步骤S902,在受控集群中建立管控集群对应的虚拟化集群。
在步骤S902中,上述虚拟化集群中的集群节点与上述管控集群对受控集群的管理功能是对应的。
可选的,上述虚拟化集群可以为管控集群对应的实例,例如,集群账号节点实例、集群调度节点实例、集群计算节点实例、集群登录节点实例等。
步骤S904,通过上述受控集群中的代理进程建立上述虚拟化集群与上述管控集群的连接;
步骤S906,在建立连接后,上述受控集群通过上述代理进程接收来自上述管控集群的管理操作。
在一种可选的实施例中,可以根据集群的配置信息从指定的存储服务上下载集群管控代理进程;通过上述受控集群中的代理进程建立上述虚拟化集群与上述管控集群的连接,在建立连接后,受控集群通过集群管控代理进程进行虚拟化集群节点的控制操作,例如,虚拟化集群节点的增删改查,作业调度排队分发等。
在本申请实施例中,通过在受控集群中建立管控集群对应的虚拟化集群,其中,上述虚拟化集群中的集群节点与上述管控集群对受控集群的管理功能是对应的;通过上述受控集群中的代理进程建立上述虚拟化集群与上述管控集群的连接;以及在建立连接后,上述受控集群通过上述代理进程接收来自上述管控集群的管理操作。
容易注意到的是,本申请实施例立足虚拟化,在单向隔离环境下通过虚拟化平台建立虚拟化集群,通过集群成员的管控代理建立单向隔离网络内部客户端到外部管控服务的长连接,管控端可以同客户端实时通信,控制集群账户/调度/计算以及登录节点的配置,能够支持复杂通信协议和支持更复杂应用,从而实现在单向隔离条件下使用云计算弹性资源为用户提供一站式高性能计算。
由此,本申请实施例达到了在单向隔离网络下实现用户网络集群管控的目的,从而实现了提高单向隔离网络内的虚拟化集群管控效率的技术效果,进而解决了现有技术中在单向隔离网络下,存在无法实现用户网络集群管控的技术问题。
在一种可选的实施例中,上述受控集群中包括:集群账户节点实例;上述受控集群通过上述代理进程接收来自上述管控集群的管理操作之后,上述方法还包括:
步骤S1002,上述集群账户节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;
步骤S1004,依据上述配置信息从存储服务节点中下载与上述集群账户节点实例对应的第一代理进程,并基于上述第一代理进程建立上述第一集群与管控集群中管控服务的连接。
可选的,上述集群账户节点实例为一种账户服务节点实例,上述第一代理进程为集群账户节点的集群管控代理进程。
作为一种可选的实施例,上述管控服务可以通过云计算虚拟化平台生成集群调度节点实例,由于管控服务无法直接连到受控集群调度节点实例,通过集群调度节点实例在指定的存储服务获取第一集群的配置信息,该配置信息包括:第二集群所在的网络和上述第二集群的链接地址。进而,本申请实施例通过启动集群调度节点后依据配置信息从存储服务节点中下载集群管控代理进程,并通过运行集群管控代理进程,实现第一集群通过单向网络连接管控区管控服务。
作为一种可选的实施例,上述实例包括:集群调度节点实例;上述受控集群通过上述代理进程接收来自上述管控集群的管理操作之后,上述方法还包括:
步骤S1102,上述集群调度节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;
步骤S1104,依据上述配置信息从存储服务节点中下载与上述集群调度节点实例对应的第二代理进程,并基于上述第二代理进程建立上述第一集群与上述管控服务的连接,其中,在建立上述第一集群与上述管控服务的连接后,上述管控服务通过上述第二代理进程对虚拟化集群节点进行控制操作。
在一种可选的实施例中,上述实例包括:集群计算节点实例和集群调度节点实例;上述受控集群通过上述代理进程接收来自上述管控集群的管理操作之后,上述方法还包括:
步骤S1202,上述集群调度节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;
步骤S1204,依据上述配置信息从存储服务节点中下载与上述集群计算节点实例对应的第三代理进程,并基于上述第三代理进程建立上述第一集群与上述管控服务的连接。
可选的,上述第三代理进程可以为集群调度节点的集群管控代理进程。
作为一种可选的实施例,管控服务可以通过云计算虚拟化平台生成集群计算节点实例,管控服务无法直接连到受控集群计算节点实例,通过集群调度节点实例在指定的存储服务获取第一集群的配置信息,该配置信息包括:第二集群所在的网络和上述第二集群的链接地址。并且,在启动集群计算节点后,可以依据配置信息从存储服务节点中下载集群管控代理进程,通过运行集群管控代理进程,建立上述第一集群与上述管控服务的连接。
在另一种可选的实施例中,上述实例包括:集群登录节点实例和集群调度节点实例;上述受控集群通过上述代理进程接收来自上述管控集群的管理操作之后,上述方法还包括:
步骤S1302,通过上述集群调度节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;
步骤S1304,依据上述配置信息从存储服务节点中下载与上述集群登录节点实例对应的第四代理进程,并基于上述第四代理进程建立上述第一集群与上述管控服务的连接。
可选的,上述第四代理进程可以为集群登录节点的集群管控代理进程。
作为一种可选的实施例,管控服务可以通过云计算虚拟化平台生成集群登录节点实例,管控服务无法直接连到受控集群计算节点实例,通过集群调度节点实例在指定的存储服务获取第一集群的配置信息,该配置信息包括:第二集群所在的网络和上述第二集群的链接地址。并且,在启动集群登录节点后,可以依据配置信息从存储服务节点中下载集群管控代理进程,通过运行集群管控代理进程,建立上述第一集群与上述管控服务的连接。
需要说明的是,本实施例的可选或优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例上述的方法。
实施例3
根据本申请实施例,还提供了一种用于实施上述实施例1中的集群管理方法的装置实施例,图5是根据本申请实施例的一种集群管理装置的示意图,如图5所示,该装置500包括:建立模块502和启动模块504,其中:
建立模块502,用于在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动模块504,用于启动上述实例;控制模块,用于通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
此处需要说明的是,上述建立模块502和启动模块504对应于实施例1中的步骤S202至步骤S204,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
需要说明的是,本实施例的可选或优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
实施例4
根据本申请实施例,还提供了一种用于实施上述实施例2中的集群管理方法的装置实施例,图6是根据本申请实施例的另一种集群管理装置的示意图,如图6所示,该装置600包括:第一建立单元602、第二建立单元604和接收单元606,其中:
第一建立单元602,用于在受控集群中建立管控集群对应的虚拟化集群,其中,上述虚拟化集群中的集群节点与上述管控集群对受控集群的管理功能是对应的;第二建立单元604,用于通过上述受控集群中的代理进程建立上述虚拟化集群与上述管控集群的连接;以及接收单元606,用于在建立连接后,上述受控集群通过上述代理进程接收来自上述管控集群的管理操作。
此处需要说明的是,上述第一建立单元602、第二建立单元604和接收单元606对应于实施例2中的步骤S902至步骤S906,三个单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
需要说明的是,本实施例的可选或优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
实施例5
根据本申请实施例,还提供了一种计算机系统的实施例,上述计算机系统包括:处理器;以及存储器,与上述处理器连接,用于为上述处理器提供处理以下处理步骤的指令:在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动上述实例,并通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
在本申请实施例中,通过在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动上述实例,并通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
容易注意到的是,本申请实施例立足虚拟化,在单向隔离环境下通过虚拟化平台建立虚拟化集群,通过集群成员的管控代理建立单向隔离网络内部客户端到外部管控服务的长连接,管控端可以同客户端实时通信,控制集群账户/调度/计算以及登录节点的配置,能够支持复杂通信协议和支持更复杂应用,从而实现在单向隔离条件下使用云计算弹性资源为用户提供一站式高性能计算。
由此,本申请实施例达到了在单向隔离网络下实现用户网络集群管控的目的,从而实现了提高单向隔离网络内的虚拟化集群管控效率的技术效果,进而解决了现有技术中在单向隔离网络下,存在无法实现用户网络集群管控的技术问题。
需要说明的是,本实施例的可选或优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
实施例6
根据本申请的实施例,还提供一种计算机终端的实施例,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行集群管理方法中以下步骤的程序代码:在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动上述实例,并通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
可选地,图7是根据本申请实施例的一种计算机终端的结构框图,如图7所示,该计算机终端700可以包括:一个或多个(图中仅示出一个)处理器702、存储器704、以及外设接口706。
其中,存储器可用于存储软件程序以及模块,如本申请实施例中的集群管理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的集群管理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端700。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动上述实例,并通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
可选的,上述处理器还可以执行如下步骤的程序代码:通过上述集群账户节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;依据上述配置信息从存储服务节点中下载与上述集群账户节点实例对应的第一代理进程,并基于上述第一代理进程建立上述第一集群与上述管控服务的连接。
可选的,上述处理器还可以执行如下步骤的程序代码:控制上述第一集群对上述第二集群进行以下至少之一操作:删除上述第二集群对应的集群账户、增加上述第二集群对应的集群账号、修改上述第二集群对应的集群账户、查询上述第二集群对应的集群账户。
可选的,上述处理器还可以执行如下步骤的程序代码:通过上述集群调度节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;依据上述配置信息从存储服务节点中下载与上述集群调度节点实例对应的第二代理进程,并基于上述第二代理进程建立上述第一集群与上述管控服务的连接,其中,在建立上述第一集群与上述管控服务的连接后,上述管控服务通过上述第二代理进程对虚拟化集群节点进行控制操作。
可选的,上述处理器还可以执行如下步骤的程序代码:通过上述集群调度节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;依据上述配置信息从存储服务节点中下载与上述集群计算节点实例对应的第三代理进程,并基于上述第三代理进程建立上述第一集群与上述管控服务的连接。
可选的,上述处理器还可以执行如下步骤的程序代码:上述管控服务通过集群调度节点实例的第二代理进程控制调度节点将上述集群计算节点实例加入到虚拟化集群;上述管控服务控制上述集群计算节点实例连接到虚拟化集群共享的上述存储服务节点,以使上述第一集群中的计算节点能够在虚拟化集群的计算节点共享;上述管控服务通过上述集群计算节点实例向集群账户节点实例获取账号信息,其中,上述账号信息所指示的账号支持在不同的集群节点提交集群作业,并且上述账号支持在不同的集群节点进行登录。
可选的,上述处理器还可以执行如下步骤的程序代码:通过上述集群调度节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;依据上述配置信息从存储服务节点中下载与上述集群登录节点实例对应的第四代理进程,并基于上述第四代理进程建立上述第一集群与上述管控服务的连接。
可选的,上述处理器还可以执行如下步骤的程序代码:上述管控服务通过在上述第四代理进程控制上述集群登录节点实例从集群账号节点实例中获取集群账号信息,并控制集群登录节点实例使能弹性IP地址。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:在受控集群中建立管控集群对应的虚拟化集群,其中,上述虚拟化集群中的集群节点与上述管控集群对受控集群的管理功能是对应的;通过上述受控集群中的代理进程建立上述虚拟化集群与上述管控集群的连接;以及在建立连接后,上述受控集群通过上述代理进程接收来自上述管控集群的管理操作。
采用本申请实施例,提供了一种集群管理的方案,通过在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动上述实例,并通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
由此,本申请实施例达到了在单向隔离网络下实现用户网络集群管控的目的,从而实现了提高单向隔离网络内的虚拟化集群管控效率的技术效果,进而解决了现有技术中在单向隔离网络下,存在无法实现用户网络集群管控的技术问题。
本领域普通技术人员可以理解,图7所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图7其并不对上述电子装置的结构造成限定。例如,计算机终端700还可包括比图7中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图7所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例7
根据本申请的实施例,还提供了一种存储介质的实施例。可选地,在本实施例中,上述存储介质可以用于保存上述实施例1和2所提供的集群管理方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:在第一集群中建立与第二集群中的管控服务对应的实例,其中,上述第一集群和第二集群满足以下条件:允许上述第一集群访问上述第二集群所在网络,并拒绝上述第二集群访问上述第一集群所在网络;启动上述实例,并通过上述实例所在节点上运行的代理进程,控制上述第一集群执行与上述管控服务对应的操作。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过上述集群账户节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;依据上述配置信息从存储服务节点中下载与上述集群账户节点实例对应的第一代理进程,并基于上述第一代理进程建立上述第一集群与上述管控服务的连接。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:控制上述第一集群对上述第二集群进行以下至少之一操作:删除上述第二集群对应的集群账户、增加上述第二集群对应的集群账号、修改上述第二集群对应的集群账户、查询上述第二集群对应的集群账户。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过上述集群调度节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;依据上述配置信息从存储服务节点中下载与上述集群调度节点实例对应的第二代理进程,并基于上述第二代理进程建立上述第一集群与上述管控服务的连接,其中,在建立上述第一集群与上述管控服务的连接后,上述管控服务通过上述第二代理进程对虚拟化集群节点进行控制操作。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过上述集群调度节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;依据上述配置信息从存储服务节点中下载与上述集群计算节点实例对应的第三代理进程,并基于上述第三代理进程建立上述第一集群与上述管控服务的连接。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:上述管控服务通过集群调度节点实例的第二代理进程控制调度节点将上述集群计算节点实例加入到虚拟化集群;上述管控服务控制上述集群计算节点实例连接到虚拟化集群共享的上述存储服务节点,以使上述第一集群中的计算节点能够在虚拟化集群的计算节点共享;上述管控服务通过上述集群计算节点实例向集群账户节点实例获取账号信息,其中,上述账号信息所指示的账号支持在不同的集群节点提交集群作业,并且上述账号支持在不同的集群节点进行登录。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过上述集群调度节点实例获取上述第一集群的配置信息,该配置信息包括上述第二集群所在的网络和上述第二集群的链接地址;依据上述配置信息从存储服务节点中下载与上述集群登录节点实例对应的第四代理进程,并基于上述第四代理进程建立上述第一集群与上述管控服务的连接。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:上述管控服务通过在上述第四代理进程控制上述集群登录节点实例从集群账号节点实例中获取集群账号信息,并控制集群登录节点实例使能弹性IP地址。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:在受控集群中建立管控集群对应的虚拟化集群,其中,上述虚拟化集群中的集群节点与上述管控集群对受控集群的管理功能是对应的;通过上述受控集群中的代理进程建立上述虚拟化集群与上述管控集群的连接;以及在建立连接后,上述受控集群通过上述代理进程接收来自上述管控集群的管理操作。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (16)

1.一种集群管理方法,包括:
在第一集群中建立与第二集群中的管控服务对应的实例,其中,所述第一集群和第二集群满足以下条件:允许所述第一集群访问所述第二集群所在网络,并拒绝所述第二集群访问所述第一集群所在网络;
启动所述实例,并通过所述实例所在节点上运行的代理进程,控制所述第一集群执行与所述管控服务对应的操作。
2.根据权利要求1所述的方法,其中,所述实例包括:集群账户节点实例;通过所述实例所在节点上运行的代理进程,控制所述第一集群执行与所述管控服务对应的操作之前,所述方法还包括:
通过所述集群账户节点实例获取所述第一集群的配置信息,该配置信息包括所述第二集群所在的网络和所述第二集群的链接地址;
依据所述配置信息从存储服务节点中下载与所述集群账户节点实例对应的第一代理进程,并基于所述第一代理进程建立所述第一集群与所述管控服务的连接。
3.根据权利要求2所述的方法,其中,控制所述第一集群执行与所述管控服务对应的操作,包括:控制所述第一集群对所述第二集群进行以下至少之一操作:删除所述第二集群对应的集群账户、增加所述第二集群对应的集群账号、修改所述第二集群对应的集群账户、查询所述第二集群对应的集群账户。
4.根据权利要求1所述的方法,其中,所述实例包括:集群调度节点实例;所述方法还包括:
通过所述集群调度节点实例获取所述第一集群的配置信息,该配置信息包括所述第二集群所在的网络和所述第二集群的链接地址;
依据所述配置信息从存储服务节点中下载与所述集群调度节点实例对应的第二代理进程,并基于所述第二代理进程建立所述第一集群与所述管控服务的连接,其中,在建立所述第一集群与所述管控服务的连接后,所述管控服务通过所述第二代理进程对虚拟化集群节点进行控制操作。
5.根据权利要求1所述的方法,其中,所述实例包括:集群计算节点实例;通过所述实例所在节点上运行的代理进程,控制所述第一集群执行与所述管控服务对应的操作之前,所述方法还包括:
通过集群调度节点实例获取所述第一集群的配置信息,该配置信息包括所述第二集群所在的网络和所述第二集群的链接地址;
依据所述配置信息从存储服务节点中下载与所述集群计算节点实例对应的第三代理进程,并基于所述第三代理进程建立所述第一集群与所述管控服务的连接。
6.根据权利要求5所述的方法,其中,控制所述第一集群执行与所述管控服务对应的操作,包括:
所述管控服务通过集群调度节点实例的第二代理进程控制调度节点将所述集群计算节点实例加入到虚拟化集群;
所述管控服务控制所述集群计算节点实例连接到虚拟化集群共享的所述存储服务节点,以使所述第一集群中的计算节点能够在虚拟化集群的计算节点共享;
所述管控服务通过所述集群计算节点实例向集群账户节点实例获取账号信息,其中,所述账号信息所指示的账号支持在不同的集群节点提交集群作业,并且所述账号支持在不同的集群节点进行登录。
7.根据权利要求1所述的方法,其中,所述实例包括:集群登录节点实例;通过所述实例所在节点上运行的代理进程,控制所述第一集群执行与所述管控服务对应的操作之前,所述方法还包括:
通过集群调度节点实例获取所述第一集群的配置信息,该配置信息包括所述第二集群所在的网络和所述第二集群的链接地址;
依据所述配置信息从存储服务节点中下载与所述集群登录节点实例对应的第四代理进程,并基于所述第四代理进程建立所述第一集群与所述管控服务的连接。
8.根据权利要求7所述的方法,其中,控制所述第一集群执行与所述管控服务对应的操作,包括:
所述管控服务通过在所述第四代理进程控制所述集群登录节点实例从集群账号节点实例中获取集群账号信息,并控制集群登录节点实例使能弹性IP地址。
9.一种集群管理方法,包括:
在受控集群中建立管控集群对应的虚拟化集群,其中,所述虚拟化集群中的集群节点与所述管控集群对受控集群的管理功能是对应的;
通过所述受控集群中的代理进程建立所述虚拟化集群与所述管控集群的连接;以及
在建立连接后,所述受控集群通过所述代理进程接收来自所述管控集群的管理操作。
10.根据权利要求9所述的方法,其中,所述受控集群中包括:集群账户节点实例;所述受控集群通过所述代理进程接收来自所述管控集群的管理操作之后,所述方法还包括:
所述集群账户节点实例获取第一集群的配置信息,该配置信息包括第二集群所在的网络和所述第二集群的链接地址,所述第一集群和第二集群满足以下条件:允许所述第一集群访问所述第二集群所在网络,并拒绝所述第二集群访问所述第一集群所在网络;
依据所述配置信息从存储服务节点中下载与所述集群账户节点实例对应的第一代理进程,并基于所述第一代理进程建立所述第一集群与管控集群中管控服务的连接。
11.根据权利要求10所述的方法,其中,所述受控集群中还包括:集群调度节点实例;所述受控集群通过所述代理进程接收来自所述管控集群的管理操作之后,所述方法还包括:
所述集群调度节点实例获取所述第一集群的配置信息,该配置信息包括所述第二集群所在的网络和所述第二集群的链接地址;
依据所述配置信息从存储服务节点中下载与所述集群调度节点实例对应的第二代理进程,并基于所述第二代理进程建立所述第一集群与所述管控服务的连接,其中,在建立所述第一集群与所述管控服务的连接后,所述管控服务通过所述第二代理进程对虚拟化集群节点进行控制操作。
12.根据权利要求10所述的方法,其中,所述受控集群中还包括:集群计算节点实例和集群调度节点实例;所述受控集群通过所述代理进程接收来自所述管控集群的管理操作之后,所述方法还包括:
所述集群调度节点实例获取所述第一集群的配置信息,该配置信息包括所述第二集群所在的网络和所述第二集群的链接地址;
依据所述配置信息从存储服务节点中下载与所述集群计算节点实例对应的第三代理进程,并基于所述第三代理进程建立所述第一集群与所述管控服务的连接。
13.根据权利要求10所述的方法,其中,所述受控集群中还包括:集群登录节点实例和集群调度节点实例;所述受控集群通过所述代理进程接收来自所述管控集群的管理操作之后,所述方法还包括:
通过所述集群调度节点实例获取所述第一集群的配置信息,该配置信息包括所述第二集群所在的网络和所述第二集群的链接地址;
依据所述配置信息从存储服务节点中下载与所述集群登录节点实例对应的第四代理进程,并基于所述第四代理进程建立所述第一集群与所述管控服务的连接。
14.一种集群管理装置,包括:
建立模块,用于在第一集群中建立与第二集群中的管控服务对应的实例,其中,所述第一集群和第二集群满足以下条件:允许所述第一集群访问所述第二集群所在网络,并拒绝所述第二集群访问所述第一集群所在网络;
启动模块,用于启动所述实例;
控制模块,用于通过所述实例所在节点上运行的代理进程,控制所述第一集群执行与所述管控服务对应的操作。
15.一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至13中任意一项所述的集群管理方法。
16.一种计算机系统,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
在第一集群中建立与第二集群中的管控服务对应的实例,其中,所述第一集群和第二集群满足以下条件:允许所述第一集群访问所述第二集群所在网络,并拒绝所述第二集群访问所述第一集群所在网络;
启动所述实例,并通过所述实例所在节点上运行的代理进程,控制所述第一集群执行与所述管控服务对应的操作。
CN201811278148.6A 2018-10-30 2018-10-30 集群管理方法、装置及计算机系统 Active CN111130820B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811278148.6A CN111130820B (zh) 2018-10-30 2018-10-30 集群管理方法、装置及计算机系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811278148.6A CN111130820B (zh) 2018-10-30 2018-10-30 集群管理方法、装置及计算机系统

Publications (2)

Publication Number Publication Date
CN111130820A true CN111130820A (zh) 2020-05-08
CN111130820B CN111130820B (zh) 2023-05-30

Family

ID=70484586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811278148.6A Active CN111130820B (zh) 2018-10-30 2018-10-30 集群管理方法、装置及计算机系统

Country Status (1)

Country Link
CN (1) CN111130820B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113220479A (zh) * 2021-04-28 2021-08-06 北京淇瑀信息科技有限公司 一种基于隔离网络的工作流调度方法、装置及电子设备
CN114584555A (zh) * 2022-03-08 2022-06-03 浪潮云信息技术股份公司 一种分布式云场景下的全域事件分发方法和系统
CN114598700A (zh) * 2022-01-25 2022-06-07 阿里巴巴(中国)有限公司 通信方法及通信系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609463A (zh) * 2012-01-13 2012-07-25 广东电网公司电力科学研究院 一种基于准实时平台的数据集群管理系统
US20140195687A1 (en) * 2013-01-09 2014-07-10 Microsoft Corporation Service Migration across Cluster Boundaries
CN104408071A (zh) * 2014-10-30 2015-03-11 北京思特奇信息技术股份有限公司 一种基于集群管理器的分布式数据库高可用方法及系统
CN105468429A (zh) * 2014-08-19 2016-04-06 西安慧泽知识产权运营管理有限公司 一种高效虚拟化集群管理方法和集群节点
US20170339008A1 (en) * 2016-05-17 2017-11-23 Microsoft Technology Licensing, Llc Distributed operational control in computing systems
CN107608755A (zh) * 2010-07-01 2018-01-19 纽戴纳公司 为了优化群集特定配置的使用而按进程类型在群集之间分割进程

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107608755A (zh) * 2010-07-01 2018-01-19 纽戴纳公司 为了优化群集特定配置的使用而按进程类型在群集之间分割进程
CN102609463A (zh) * 2012-01-13 2012-07-25 广东电网公司电力科学研究院 一种基于准实时平台的数据集群管理系统
US20140195687A1 (en) * 2013-01-09 2014-07-10 Microsoft Corporation Service Migration across Cluster Boundaries
CN105468429A (zh) * 2014-08-19 2016-04-06 西安慧泽知识产权运营管理有限公司 一种高效虚拟化集群管理方法和集群节点
CN104408071A (zh) * 2014-10-30 2015-03-11 北京思特奇信息技术股份有限公司 一种基于集群管理器的分布式数据库高可用方法及系统
US20170339008A1 (en) * 2016-05-17 2017-11-23 Microsoft Technology Licensing, Llc Distributed operational control in computing systems

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113220479A (zh) * 2021-04-28 2021-08-06 北京淇瑀信息科技有限公司 一种基于隔离网络的工作流调度方法、装置及电子设备
CN113220479B (zh) * 2021-04-28 2023-11-10 北京淇瑀信息科技有限公司 一种基于隔离网络的工作流调度方法、装置及电子设备
CN114598700A (zh) * 2022-01-25 2022-06-07 阿里巴巴(中国)有限公司 通信方法及通信系统
CN114598700B (zh) * 2022-01-25 2024-03-29 阿里巴巴(中国)有限公司 通信方法及通信系统
CN114584555A (zh) * 2022-03-08 2022-06-03 浪潮云信息技术股份公司 一种分布式云场景下的全域事件分发方法和系统

Also Published As

Publication number Publication date
CN111130820B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN109561171B (zh) 虚拟私有云服务的配置方法和装置
EP3512233B1 (en) Method for managing network slice and management unit
CN109040276B (zh) 一种构建云平台的方法、装置、计算机存储介质及终端
CN105430108B (zh) 一种测试环境访问方法及代理服务器
US10791458B2 (en) Transferring information to a mobile device
EP3843440A1 (en) Network slice selection method and device
CN108810993B (zh) 网络切片选择方法、设备、ue、控制面功能实体及介质
CN111934918A (zh) 对同一容器集群内的容器实例的网络隔离方法和装置
CN109120444B (zh) 云资源管理方法、处理器以及存储介质
CN109246201B (zh) 云资源交付方法、处理器以及存储介质
CN111130820B (zh) 集群管理方法、装置及计算机系统
CN112367711A (zh) 网络切片的资源配置方法、装置及系统
CN110832909B (zh) 一种网络注册的方法、相关设备及系统
CN112995247A (zh) 数据发送或处理的方法、装置和系统
EP3702915B1 (en) Data processing method and device, storage medium, processor, and system
CN108347472B (zh) Ip地址的配置方法、云服务器、云平台及可读存储介质
CN111464334A (zh) 软件定义广域网系统下实现终端设备管理的系统、方法、及服务器
CN114020478A (zh) 混合云资源的管理方法、装置、存储介质及计算设备
CN110869919B (zh) 用于远程节点发现、通信信道确认和连接的方法
CN112637221B (zh) 一种设备控制方法及装置
CN110737502A (zh) 镜像文件的处理方法、装置和系统
CN103379148A (zh) 一种云计算器及其处理文件的方法
CN113904871B (zh) 网络切片的接入方法、pcf实体、终端和通信系统
CN112422602B (zh) 分布式协调服务的处理方法及装置、系统
CN112532405A (zh) 软件定义网络sdn网络构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant