CN112559519A - 一种大数据集群管理系统 - Google Patents

一种大数据集群管理系统 Download PDF

Info

Publication number
CN112559519A
CN112559519A CN202011448024.5A CN202011448024A CN112559519A CN 112559519 A CN112559519 A CN 112559519A CN 202011448024 A CN202011448024 A CN 202011448024A CN 112559519 A CN112559519 A CN 112559519A
Authority
CN
China
Prior art keywords
management system
module
cluster management
cluster
host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011448024.5A
Other languages
English (en)
Inventor
陈松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hongshan Information Technology Research Institute Co Ltd
Original Assignee
Beijing Hongshan Information Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hongshan Information Technology Research Institute Co Ltd filed Critical Beijing Hongshan Information Technology Research Institute Co Ltd
Priority to CN202011448024.5A priority Critical patent/CN112559519A/zh
Publication of CN112559519A publication Critical patent/CN112559519A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2219Large Object storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供一种大数据集群管理系统,包括管理中心、单集群管理系统和主机,所述管理中心用于接收用户输入的集群控制命令,基于预设的集群列表将所述集群控制命令生成所述单集群管理系统对应的一级子命令,并将所述一级子命令发送至对应的所述单集群管理系统;所述单集群管理系统用于接收所述一级子命令,基于预设的主机列表将所述一级子命令生成对应所述主机的二级子命令,并将所述二级子命令发送至对应的所述主机,还用于将第一采集数据发送至所述管理中心;所述主机用于基于所述二级子命令执行任务并生成第二采集数据,将所述第二采集数据合并生成所述第一采集数据并发送至所述单集群管理系统。本发明通过管理中心连接多个单集群管理系统,实现了对多集群的管理,降低运维成本,使集群间的数据互通更快捷。

Description

一种大数据集群管理系统
技术领域
本发明实施例涉及大数据领域,尤其涉及一种大数据集群管理系统。
背景技术
随着大数据产业发展,公司大数据业务的快速发展和市场的拓展,公司管理的大数据的集群越来越多,往往都是分开独立管理的,集群之间也是封闭的,每个集群都有自己的数据存储、数据处理和作业提交的系统,每个集群也需要单独升级,版本需要分开开发和维护。
现有的方式是多个集群分开管理,导致多个集群之间指标的查看对比非常困难,当出现需要增加或减少集群数量、修改服务配置,提高了运维成本,导致效率降低。
发明内容
本发明提供了一种大数据集群管理系统,通过使用管理中心连接多个单集群管理系统的系统,实现了对多集群的综合管理,降低运维成本,使集群间的数据互通更快捷。
第一方面,本发明提供一种大数据集群管理系统,包括管理中心、单集群管理系统和主机,所述管理中心与一个或多个单集群管理系统对接,每个所述单集群管理系统与一个或多个主机对接;
所述管理中心用于接收用户输入的集群控制命令,基于预设的集群列表将所述集群控制命令生成所述单集群管理系统对应的一级子命令,并将所述一级子命令发送至对应的所述单集群管理系统;
所述单集群管理系统用于接收所述一级子命令,基于预设的主机列表将所述一级子命令生成对应所述主机的二级子命令,并将所述二级子命令发送至对应的所述主机,还用于将第一采集数据发送至所述管理中心;
所述主机用于基于所述二级子命令执行任务并生成第二采集数据,将所述第二采集数据合并生成所述第一采集数据并发送至所述单集群管理系统。
进一步地,所述管理中心包括第一REST API模块、Master模块、ClusterInterface模块,
所述第一REST API模块用于接收用户输入的集群控制命令;
所述Master模块用于基于预设的集群列表将所述集群控制命令生成一个或多个一级子命令;
所述Cluster Interface模块用于将所述一级子命令发送至所述单集群管理系统,并获取所述一个或多个所述单集群管理系统上报的第一采集数据。
进一步地,所述管理中心还包括第一Database模块,用于存储所述第一采集数据。
进一步地,所述第一Database模块包括集群列表、第一服务信息表和/或基础配置列表;
所述集群列表用于存储所述大数据集群管理系统的一个或多个单集群管理系统的基本信息,所述第一服务信息表用于存储单集群管理系统的服务参数,所诉基础配置列表用于存储所述单集群管理系统的服务配置参数。
进一步地,所述单集群管理系统包括第二REST API模块、Core模块和AgentInterface模块,
所述第二REST API模块用于从第一REST API模块获取所述一级子命令;
所述Core模块用于基于预设的主机列表将所述一级子命令生成一个或多个二级子命令,接收所述一个或多个第二采集数据,将所述第二采集数据合并为第一采集数据,将所述第一采集数据上报至所述管理中心;
所述Agent Interface模块用于将所述二级子命令发送至所述主机,接收所述主机的第二采集数据,将一个或多个所述第二采集数据发送至所述Core模块。
进一步地,所述单集群管理系统还包括第二Database模块,用于存储所述第二采集数据。
进一步地,所述第二Database模块包括主机列表、第二服务信息表、组件信息表和/或服务配置列表,所述主机列表用于存储一个或多个所述主机的主机信息;所述第二服务信息表用于存储一个或多个主机的服务信息;所述组件信息表用于存储一个或多个组件信息;所述服务配置列表用于存储一个或多个所述主机的服务配置参数。
进一步地,还包括第一WEB模块,所述第一WEB模块用于接收用户输入的集群控制命令,将所述集群控制命令控制指令发送至所述管理中心,以使管理中心基于所述集群控制命令从所述第一REST API接口调用对应的一个或多个单集群管理系统执行任务、增加单集群管理系统和/或删除单集群管理系统。
进一步地,还包括第二WEB模块,所述第二WEB模块用于获取用户输入的主机控制命令,将所述主机控制命令发送至所述单集群管理系统,以使所述单集群管理系统基于所述控制指令调用对应的一个或多个主机执行任务、增加主机和/或删除主机。
本发明通过使用管理中心连接多个单集群管理系统的系统,实现了对多集群的管理,降低运维成本,使集群间的数据互通更快捷。
附图说明
如图1所示为本实施例一的大数据集群管理系统模块图。
如图2所示为本实施例二的大数据集群管理系统模块图。
如图3所示为本实施例三的大数据集群管理系统模块图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
此外,术语“第一”、“第二”等可在本文中用于描述各种方向、动作、步骤或元件等,但这些方向、动作、步骤或元件不受这些术语限制。这些术语仅用于将第一个方向、动作、步骤或元件与另一个方向、动作、步骤或元件区分。举例来说,在不脱离本申请的范围的情况下,第一特征信息可以为第二特征信息或第三特征信息,类似地,第二特征信息、第三特征信息可以为第一特征信息。第一特征信息和第二特征信息、第三特征信息都是分布式文件系统的特征信息,但其不是同一特征信息。术语“第一”、“第二”等而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”、“批量”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
本实施例及下述实施例的部分英文缩写及专有名词含义如下:
REST API:Rest:Representational State Transfer,表现层状态转移,API:Application Programming Interface,应用程序接口。
FSM状态机:Finite State Machine有限状态机。
Web:指Web应用的操作界面。
ID:唯一序列标识,程序自动生成。
Agent:指代理应用程序,集群中每台主机都要求安装,本身设计是一个无状态程序。
实施例一
本实施例提供了一种大数据集群管理系统,如图1所示,包括管理中心100、单集群管理系统200和主机300,所述管理中心100与一个或多个单集群管理系统200对接,每个所述单集群管理系统200与一个或多个主机300对接。
其中,所述管理中心100为统一的集群服务中心,对单集群管理系统200进行全方位多角度管理,其中包括对已经存在的单集群管理系统200进行管理,例如接受用户输入的集群基本信息,如集群管理Server IP、登录ID和登录密码等,以实现自动化的数据采集。
所述管理中心100用于接收用户输入的集群控制命令,基于预设的单集群管理系统200列表将所述单集群管理系统200控制命令生成所述单集群管理系统200对应的一级子命令,并将所述一级子命令发送至对应的所述单集群管理系统200。
所述单集群管理系统200用于接收所述一级子命令,基于预设的主机300列表将所述一级子命令生成对应所述主机300的二级子命令,并将所述二级子命令发送至对应的所述主机300,还用于将第一采集数据发送至所述管理中心100;一个单集群管理系统200为一个集群系统,例如可以是分布式管理集群应用程序。
所述主机300用于基于所述二级子命令执行任务并生成第二采集数据,将所述第二采集数据合并生成所述第一采集数据并发送至所述单集群管理系统200。主机300中安装有代理应用程序,在接收指令后运行程序,执行数据采集、信息监控等任务。
本实施例通过管理中心实现对多个单集群管理系统的管理、控制功能,实现了对多集群的管理,降低运维成本,使集群间的数据互通更快捷。
实施例二
本实施例在上述实施例的基础上增加了对管理中心100、单集群管理系统200和主机300每个部分的功能模块的连接关系和介绍,如图2所示,包括:
管理中心100包括第一REST API模块101、Master模块102、Cluster Interface模块103,单集群管理系统200包括第二REST API模块201、Core模块202和Agent Interface模块203。
所述第一REST API模块101用于接收用户输入的集群控制命令;所述Master模块102用于基于预设的单集群管理系统200列表将所述集群控制命令生成一个或多个一级子命令;
所述Cluster Interface模块103用于将所述一级子命令发送至所述单集群管理系统200,并获取所述一个或多个所述单集群管理系统200上报的第一采集数据。
所述第二REST API模块201用于从第一REST API模块101获取所述一级子命令,第二REST API模块201主要用于与主机300交互,将接收到的一级子命令转发至主机300执行,同时接收主机300向Core模块202发送心跳请求,转接主机300上报的监控信息,发送至Core模块202。
其中,第一REST API模块101和第二REST API模块201的作用是实现管理中心100和单集群管理系统200的解耦,实现系统的灵活配置。
所述Core模块202用于基于预设的主机列表将所述一级子命令生成一个或多个二级子命令,接收所述一个或多个第二采集数据,将所述第二采集数据合并为第一采集数据,将所述第一采集数据上报至所述管理中心100。其中,该模块用于进行逻辑处理,对接收到的采集数据、监控信息等进行集中处理。在预设的主机列表中读取主机、服务、主机调用组件的信息,以确定将接收到的命令拆分后发送至对应的一个或多个主机。
在一种替代实施例中,该模块还用于基于所述一级子命令和/或二级子命令生成预期反馈数据,存储该命令预期状态,当获取到所述第二采集数据后,将所述第二采集数据和预期反馈数据进行对比。
在另一种替代实施例中,该模块内部还包括FSM有限状态机,用于简化状态处理的业务逻辑,并将简化后的业务逻辑进行存储。具体地,简化状态处理的业务逻辑包括:集群现有状态、用户希望节点所处的预期状态,和/或中间状态。其中,所述逾期状态指用户在页面进行了一系列的操作,需要更改某些服务的状态,但这些还没有在节点上产生作用。所述中间状态指状态改变时的中间状态,如单集群管理系统内部需要重启一个安装了3台主机的服务,下发服务重启命令,Core模块202基于服务重启命令查找服务安装的主机300,并分别下发命令到对应3台单集群管理系统上执行。同时Core模块202基于FSM状态机寻找到当前状态并执行。其中该步骤所述的状态指集群状态,即单集群管理系统中服务的状态、主机状态、配置状态等集群中所有的状态合集。
所述Agent Interface模块203用于将所述二级子命令发送至所述主机300,接收所述主机300的第二采集数据,将一个或多个所述第二采集数据发送至所述Core模块202。
在本实施例中,主机300还用于在执行完数据采集和/或信息监控后发送心跳至Core模块202。在替代实施例中,主机300还用于在生成第二采集数据后生成第一消息队列,用于缓存主机状态、第二采集数据以及基于第二采集数据生成的心跳信息,并将所述心跳信息发送至Core模块202的FSM有限状态机。可选地,主机300还用于接收到二级子命令后生成第二消息队列缓存所述第二子命令,以避免出现信息拥堵,降低运行效率。
本实施例通过管理中心连接多个单集群管理系统,实现了对多集群的管理,降低运维成本,使集群间的数据互通更快捷。
实施例三
本实施例在上述实施例的基础上增加了数据库存储的列表信息以及WEB界面,用户通过WEB界面可向管理中心100发起控制指令以批量控制单集群管理系统200,或者向单集群管理系统200发起控制指令,控制单个的单集群管理系统200执行任务。用户的指令还包括修改数据库的列表信息,实现对接入管理中心100的单集群管理系统200和主机300增添和删除,提高管理效率。如图3,具体包括如下模块:
管理中心100、单集群管理系统200和主机300,还包括第一WEB模块400和第二WEB模块500,所述管理中心100连接所述第一WEB模块400,同时与一个或多个单集群管理系统200对接;每个所述单集群管理系统200连接所述第二WEB模块500,同时与一个或多个主机300对接。
其中,所述管理中心100包括第一REST API模块101、Master模块102、ClusterInterface模块103和第一Database模块104。单集群管理系统200包括第二REST API模块201、Core模块202、Agent Interface模块203和第二Database模块204。
所述管理中心100用于接收用户输入的集群控制命令,基于预设的单集群管理系统200列表将所述集群控制命令生成所述单集群管理系统200对应的一级子命令,并将所述一级子命令发送至对应的所述单集群管理系统200。
所述单集群管理系统200用于接收所述一级子命令,基于预设的主机300列表将所述一级子命令生成对应所述主机300的二级子命令,并将所述二级子命令发送至对应的所述主机300,还用于将第一采集数据发送至所述管理中心100。
所述主机300用于基于所述二级子命令执行任务并生成第二采集数据,将所述第二采集数据合并生成所述第一采集数据并发送至所述单集群管理系统200。
第一WEB模块400用于接收用户的控制指令,还可以通过WEB界面展示管理系统分类汇总的信息。例如,按照单集群管理系统200级别分类展示单集群管理系统200资源使用情况、进程状态、磁盘使用情况等,也能通过Web对单集群管理系统200的操作功能进行管理,比如单集群管理系统200扩容、单集群管理系统200添加新服务、机器下线、服务安装、服务升级、服务配置、服务打补丁等,所有操作类的事件都可以实现统一管理而且语义上能单集群管理系统200管理到达一致,即使目前多个单集群管理系统200的单集群管理系统200版本不一致,也可以通过所述管理中心100接收用户控制指令进行操作,进行统一版本更新,实现单集群管理系统200版本统一。所述第一WEB模块400用于接收用户输入的集群控制命令,将所述集群控制命令控制指令发送至所述管理中心100,以使管理中心100基于所述集群控制命令从所述第一REST API模块101调用对应的一个或多个单集群管理系统200执行任务、增加单集群管理系统200和/或删除单集群管理系统200。
具体地,该步骤中,通过管理中心100进行统一的安装单集群管理系统,先分发安装单集群管理系统管理的Server然后通过调用管理中心100的第一REST API模块101进行后面的单集群管理系统200安装,安装成功后,该单集群管理系统纳入到管理中心100管理系统中。
所述第一REST API模块101用于接收用户输入的集群控制命令。该模块中,主要对外提供集群管理和监控所有功能对外开放API服务,为对接第一Web模块400和其他系统埋下铺垫,实现技术的完全解耦,扫清集群之间访问的障碍。
所述Master模块102用于基于预设的单集群管理系统200列表将所述集群控制命令生成一个或多个一级子命令。
所述Cluster Interface模块103用于将所述一级子命令发送至所述单集群管理系统200,并获取所述一个或多个所述单集群管理系统200上报的第一采集数据。
所述第一Database模块104包括集群列表、第一服务信息表和/或基础配置列表,其中集群列表用于存储所述大数据集群管理系统的一个或多个单集群管理系统的基本信息,如安装的集群ID、集群名称、集群管理IP、集群访问用户和密码;第一服务信息表用于存储单集群管理系统的服务参数,如集群版本、服务版本、服务名称、服务描述等;基础配置列表用于存储所述单集群管理系统的服务配置参数,包括集群版本、配置版本、服务ID、配置文件名、配置数据等。
所述第二REST API模块201用于从第一REST API模块101获取所述一级子命令;
所述Core模块202用于基于预设的主机300列表将所述一级子命令生成一个或多个二级子命令,接收所述一个或多个第二采集数据,将所述第二采集数据合并为第一采集数据,将所述第一采集数据上报至所述管理中心100;
所述Agent Interface模块203用于将所述二级子命令发送至所述主机300,接收所述主机300的第二采集数据,将一个或多个所述第二采集数据发送至所述Core模块202。
第二WEB模块500用于接收用户的控制指令,还可以通过WEB界面展示管理系统分类汇总的信息。例如,按照单集群管理系统级别分类展示集群资源使用情况、进程状态、磁盘使用情况等,也能通过Web对单集群管理系统的操作功能进行管理,比如集群扩容、集群添加新服务、机器下线、服务安装、服务升级、服务配置、服务打补丁等,所有操作类的事件都可以实现统一管理,即使目前多个单集群管理系统200的集群版本不一致,也可以通过所述管理中心100接收用户控制指令进行操作,进行统一版本更新,实现集群版本统一。
第二Database模块204,用于存储所述第二采集数据。所述第二Database模块204包括主机列表、第二服务信息表、组件信息表和/或服务配置列表,所述主机列表用于存储一个或多个所述主机300的主机信息;所述第二服务信息表用于存储一个或多个主机300的服务信息;所述组件信息表用于存储一个或多个组件信息;所述服务配置列表用于存储一个或多个所述主机300的服务配置参数。还包括告警信息表,包含告警基本信息,如告警主机ID、告警定义、服务名称、主机组件名称和/或告警状态;还包括度量表,用于记录某一时刻的统计信息,包括度量类型、总量、使用量和/或时间;还包括服务映射表,存储主机ID和服务ID的关系表;还包括服务组件映射表,存储服务ID和主机组件ID。
所述第二WEB模块500用于获取用户输入的主机300控制命令,将所述主机300控制命令发送至所述单集群管理系统200,以使所述单集群管理系统200基于所述控制指令调用对应的一个或多个主机300执行任务、增加主机300和/或删除主机300。
本实施例通过增加WEB模块实现了控制和展示功能,使用户能够直观看到多单集群管理系统的工作状态,实现批量控制单集群管理系统和主机,提高运维效率。同时通过REST API接口能够获取用户容WEB界面输入的指令,实现对系统中单个单集群管理系统或主机的控制。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种大数据集群管理系统,其特征在于,包括管理中心、单集群管理系统和主机,所述管理中心与一个或多个单集群管理系统对接,每个所述单集群管理系统与一个或多个主机对接;
所述管理中心用于接收用户输入的集群控制命令,基于预设的集群列表将所述集群控制命令生成所述单集群管理系统对应的一级子命令,并将所述一级子命令发送至对应的所述单集群管理系统;
所述单集群管理系统用于接收所述一级子命令,基于预设的主机列表将所述一级子命令生成对应所述主机的二级子命令,并将所述二级子命令发送至对应的所述主机,还用于将第一采集数据发送至所述管理中心;
所述主机用于基于所述二级子命令执行任务并生成第二采集数据,将所述第二采集数据合并生成所述第一采集数据并发送至所述单集群管理系统。
2.根据权利要求1所述的一种系统,其特征在于,所述管理中心包括第一REST API模块、Master模块、Cluster Interface模块,
所述第一REST API模块用于接收用户输入的集群控制命令;
所述Master模块用于基于预设的集群列表将所述集群控制命令生成一个或多个一级子命令;
所述Cluster Interface模块用于将所述一级子命令发送至所述单集群管理系统,并获取所述一个或多个所述单集群管理系统上报的第一采集数据。
3.根据权利要求1所述的系统,其特征在于,所述管理中心还包括第一Database模块,用于存储所述第一采集数据。
4.根据权利要求3所述的系统,其特征在于,所述第一Database模块包括集群列表、第一服务信息表和/或基础配置列表;
所述集群列表用于存储所述大数据集群管理系统的一个或多个单集群管理系统的基本信息,所述第一服务信息表用于存储单集群管理系统的服务参数,所诉基础配置列表用于存储所述单集群管理系统的服务配置参数。
5.根据权利要求1所述的系统,其特征在于,所述单集群管理系统包括第二REST API模块、Core模块和Agent Interface模块,
所述第二REST API模块用于从第一REST API模块获取所述一级子命令;
所述Core模块用于基于预设的主机列表将所述一级子命令生成一个或多个二级子命令,接收所述一个或多个第二采集数据,将所述第二采集数据合并为第一采集数据,将所述第一采集数据上报至所述管理中心;
所述Agent Interface模块用于将所述二级子命令发送至所述主机,接收所述主机的第二采集数据,将一个或多个所述第二采集数据发送至所述Core模块。
6.根据权利要求5所述的系统,其特征在于,所述单集群管理系统还包括第二Database模块,用于存储所述第二采集数据。
7.根据权利要求6所述的系统,其特征在于,所述第二Database模块包括主机列表、第二服务信息表、组件信息表和/或服务配置列表,所述主机列表用于存储一个或多个所述主机的主机信息;所述第二服务信息表用于存储一个或多个主机的服务信息;所述组件信息表用于存储一个或多个组件信息;所述服务配置列表用于存储一个或多个所述主机的服务配置参数。
8.根据权利要求1所述的系统,其特征在于,还包括第一WEB模块,所述第一WEB模块用于接收用户输入的集群控制命令,将所述集群控制命令控制指令发送至所述管理中心,以使管理中心基于所述集群控制命令从所述第一REST API接口调用对应的一个或多个单集群管理系统执行任务、增加单集群管理系统和/或删除单集群管理系统。
9.根据权利要求1所述的系统,其特征在于,还包括第二WEB模块,所述第二WEB模块用于获取用户输入的主机控制命令,将所述主机控制命令发送至所述单集群管理系统,以使所述单集群管理系统基于所述控制指令调用对应的一个或多个主机执行任务、增加主机和/或删除主机。
CN202011448024.5A 2020-12-09 2020-12-09 一种大数据集群管理系统 Pending CN112559519A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011448024.5A CN112559519A (zh) 2020-12-09 2020-12-09 一种大数据集群管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011448024.5A CN112559519A (zh) 2020-12-09 2020-12-09 一种大数据集群管理系统

Publications (1)

Publication Number Publication Date
CN112559519A true CN112559519A (zh) 2021-03-26

Family

ID=75061012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011448024.5A Pending CN112559519A (zh) 2020-12-09 2020-12-09 一种大数据集群管理系统

Country Status (1)

Country Link
CN (1) CN112559519A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104753706A (zh) * 2013-12-27 2015-07-01 中国移动通信集团公司 一种分布式集群配置管理方法及装置
CN104834722A (zh) * 2015-05-12 2015-08-12 网宿科技股份有限公司 基于cdn的内容管理系统
CN105703940A (zh) * 2015-12-10 2016-06-22 中国电力科学研究院 一种面向多级调度分布式并行计算的监控系统及监控方法
CN106100894A (zh) * 2016-07-11 2016-11-09 华南理工大学 一种高可靠的集群运维管理方法
CN109614283A (zh) * 2018-10-24 2019-04-12 世纪龙信息网络有限责任公司 分布式数据库集群的监控系统
CN110636103A (zh) * 2019-07-22 2019-12-31 中山大学 一种多异构集群作业统一调度方法及api接口

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104753706A (zh) * 2013-12-27 2015-07-01 中国移动通信集团公司 一种分布式集群配置管理方法及装置
CN104834722A (zh) * 2015-05-12 2015-08-12 网宿科技股份有限公司 基于cdn的内容管理系统
CN105703940A (zh) * 2015-12-10 2016-06-22 中国电力科学研究院 一种面向多级调度分布式并行计算的监控系统及监控方法
CN106100894A (zh) * 2016-07-11 2016-11-09 华南理工大学 一种高可靠的集群运维管理方法
CN109614283A (zh) * 2018-10-24 2019-04-12 世纪龙信息网络有限责任公司 分布式数据库集群的监控系统
CN110636103A (zh) * 2019-07-22 2019-12-31 中山大学 一种多异构集群作业统一调度方法及api接口

Similar Documents

Publication Publication Date Title
CN112099918A (zh) 容器化环境中的集群的实时迁移
US7502850B2 (en) Verifying resource functionality before use by a grid job submitted to a grid environment
CN111897638B (zh) 分布式任务调度方法及系统
US20140310278A1 (en) Creating global aggregated namespaces for storage management
CN110365762B (zh) 服务处理方法、装置、设备及存储介质
CN103532780A (zh) 用于it领域的运维监控一体化系统及一体化监控方法
WO2015149505A1 (zh) Sdn应用集成管理和控制的方法、系统及设备
CN107566214B (zh) 一种性能测试方法和装置
CN109857723B (zh) 基于可扩容数据库集群的动态数据迁移方法及相关设备
CN113157411B (zh) 一种基于Celery的可靠可配置任务系统及装置
CN108140035B (zh) 分布式系统的数据库复制方法及装置
US11221943B2 (en) Creating an intelligent testing queue for improved quality assurance testing of microservices
US20220182851A1 (en) Communication Method and Apparatus for Plurality of Administrative Domains
US20130204921A1 (en) Diagnostics agents for managed computing solutions hosted in adaptive environments
CN111752892B (zh) 分布式文件系统及其实现方法、管理系统、设备及介质
CN109324892B (zh) 分布式管理方法、分布式管理系统及装置
CN114816914A (zh) 基于Kubernetes的数据处理方法、设备及介质
CN110798358A (zh) 分布式服务标识方法、装置、计算机可读介质及电子设备
CN112559519A (zh) 一种大数据集群管理系统
CN114816866A (zh) 故障处理方法、装置、电子设备和存储介质
CN102255944A (zh) 集群系统的管理方法和系统
CN111897887A (zh) 参数配置方法及装置、系统、电子设备和存储介质
JP2018507499A (ja) サービス管理方法及び装置
CN111291101A (zh) 集群管理方法及系统
CN116010111B (zh) 一种跨集群资源调度方法、系统及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination