CN110247812A - 一种多集群管理方法、装置、系统及相关组件 - Google Patents

一种多集群管理方法、装置、系统及相关组件 Download PDF

Info

Publication number
CN110247812A
CN110247812A CN201910663000.2A CN201910663000A CN110247812A CN 110247812 A CN110247812 A CN 110247812A CN 201910663000 A CN201910663000 A CN 201910663000A CN 110247812 A CN110247812 A CN 110247812A
Authority
CN
China
Prior art keywords
data
cluster
status data
status
visualization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910663000.2A
Other languages
English (en)
Inventor
胡勇强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN201910663000.2A priority Critical patent/CN110247812A/zh
Publication of CN110247812A publication Critical patent/CN110247812A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0246Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols
    • H04L41/0253Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols using browsers or web-pages for accessing management information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种多集群管理方法,该方法通过管理平台向各集群发送数据获取请求,当接收到集群推送的状态数据时,对状态数据进行页面展示处理,并缓存处理得到的多集群可视化状态数据,以便浏览器客户端调用多集群可视化状态数据进行集群管理请求的响应。该方法通过对多个集群组件运行状态以及配置情况进行统一管理,使管理员可以同时对多个集群进行监控,大大简化了多集群管理流程以及工作量,提升了多集群运维管理效率,也进一步保障了多集群运行可靠性及稳定性。本申请还提供了一种多集群管理装置、系统、计算机设备及可读存储介质,具有上述有益效果。

Description

一种多集群管理方法、装置、系统及相关组件
技术领域
本申请涉及电子技术领域,特别涉及一种多集群管理方法、装置、系统、一种计算机设备及一种可读存储介质。
背景技术
多个节点服务器通过局域网络组建成为一个集群,共同实现业务服务。为保证大规模业务的全面管理,通常需要设置多个集群。在用户生产环境存在多个集群的情况下,集群管理员需要对所有集群中对业务可靠性存在影响的所有服务组件的运行状态,资源和配置状态等进行管理。
目前多集群管理需要管理员通过浏览器客户端登陆主控节点服务器对集群进行管理。集群各个服务组件的运行状态和配置分布在不同的管理页面上,管理员需要分别登陆到对应的集群主控上对每个集群进行配置管理,对于管理员,多次对不同集群主控的登录过程实现过程较为繁琐,导致集群运维效率低;而且检测各个服务组件的运行情况需要执行多次操作,而这可能导致检测遗漏,导致无法实现有效、可靠的集群运维。
因此,如何提升多集群运维管理效率,保障多集群运行可靠性及稳定性,是本领域技术人员需要解决的技术问题。
发明内容
本申请的目的是提供一种多集群管理方法,该方法通过对多集群进行集中管理展示,提升了多集群运维管理效率;本申请的另一目的是提供一种多集群管理装置、系统、计算机设备及可读存储介质。
为解决上述技术问题,本申请提供一种多集群管理方法,包括:
管理平台向至少两个待管理的集群发送数据获取请求;
当接收到多集群返回的状态数据时,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,得到多集群可视化状态数据;其中,所述状态数据为反映集群各组件运行状态及配置状态的数据;
缓存所述多集群可视化状态数据,以便浏览器客户端调用所述多集群可视化状态数据进行集群管理请求的响应。
可选地,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,包括:
统计所述状态数据中各集群对应的状态数据,得到集群状态数据;
对各所述集群状态数据根据对应的集群展示规则进行可视化处理。
可选地,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,包括:
统计所述状态数据中各集群间相同组件对应的状态数据,得到组件状态数据;
对所述组件状态数据根据对应的组件展示规则进行可视化处理。
可选地,在对所述状态数据按照预设多集群数据推送规则进行页面展示处理之前,还包括:
对所述状态数据进行数据有效性校验;
则相应地,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,具体为:对所述状态数据中校验通过的数据按照预设多集群数据推送规则进行页面展示处理。
可选地,在对所述状态数据按照预设多集群数据推送规则进行页面展示处理之前,还包括:
调用预先配置的组件正常工作标准判断所述状态数据中是否存在异常状态数据;
则相应地,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,具体为:
对不存在状态异常的组件状态数据按照第一可视化处理规则进行数据处理;
对存在状态异常的组件状态数据按照第二可视化处理规则进行数据处理。
可选地,所述多集群管理方法还包括:
当所述状态数据中存在异常状态数据时,控制连接的警示设备进行集群组件状态异常提示。
可选地,所述管理平台向至少两个待管理的集群发送数据获取请求,包括:
管理平台向至少两个待管理的集群定时发送数据获取请求。
可选地,所述管理平台向至少两个待管理的集群发送数据获取请求,包括:
管理平台向至少两个待管理的集群发送指定组件数据获取请求;其中,所述指定组件数据获取请求为面向预置指定组件的状态数据获取请求。
为实现上述目的,本申请还公开了一种多集群管理装置,包括:
获取请求发送单元,用于向至少两个待管理的集群发送数据获取请求;
数据处理单元,用于当接收到多集群返回的状态数据时,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,得到多集群可视化状态数据;其中,所述状态数据为反映集群各组件运行状态及配置状态的数据;
数据缓存单元,用于缓存所述多集群可视化状态数据,以便浏览器客户端调用所述多集群可视化状态数据进行集群管理请求的响应。
为实现上述目的,本申请还公开了一种多集群管理系统,包括:至少两个待管理的集群、与各所述集群连接的管理平台以及与所述管理平台连接的浏览器客户端;
其中,所述管理平台用于:向各所述集群发送数据获取请求;当接收到所述集群返回的状态数据时,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,得到多集群可视化状态数据;缓存所述多集群可视化状态数据;
所述集群用于:当接收到所述数据获取请求时,控制集群中各节点采集组件运行状态及配置状态信息,得到集群的状态数据,并将所述状态数据推送至所述管理平台;
所述浏览器客户端用于:与用户端进行信息交互;当接收到集群管理请求时,调用所述多集群可视化状态数据进行请求响应。
为实现上述目的,本申请还公开了一种计算机设备,包括:
存储器,用于存储程序;
处理器,用于执行所述程序时实现所述多集群管理方法的步骤。
为实现上述目的,本申请还公开了一种可读存储介质,所述可读存储介质上存储有程序,所述程序被处理器执行时实现所述多集群管理方法的步骤。
本申请所提供的多集群管理方法,通过管理平台向各集群发送数据获取请求,当接收到集群推送的状态数据时,对状态数据进行页面展示处理,并缓存处理得到的多集群可视化状态数据,以便浏览器客户端调用多集群可视化状态数据进行集群管理请求的响应。该方法通过对多个集群组件运行状态以及配置情况进行统一管理,使管理员可以同时对多个集群进行监控,大大简化了多集群管理流程以及工作量,提升了多集群运维管理效率,也进一步保障了多集群运行可靠性及稳定性。
本申请还提供了一种多集群管理装置、系统、计算机设备及可读存储介质,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为一种传统多集群管理示意图;
图2为本申请实施例提供的一种多集群管理方法的流程图;
图3为本申请实施例提供的一种多集群管理装置的结构框图;
图4为本申请实施例提供的一种多集群管理系统400的结构示意图;
图5为本申请实施例提供的一种企业场景下多集群管理系统结构及流转示意图;
图6为本申请实施例提供的一种aCloud组件的数据采集框架示意图;
图7为本申请实施例提供的一种aCMP数据采集时序图;
图8为本申请实施例提供的一种浏览器客户端查询数据的时序图;
图9为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
本申请的核心是提供一种多集群管理方法,该方法通过对多集群进行集中管理展示,提升了多集群运维管理效率;本申请的另一核心是提供一种多集群管理装置、系统、计算机设备及可读存储介质。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1所示为一种传统多集群管理示意图,各个节点服务器通过局域网络组建成为一个集群。集群管理员通过浏览器客户端登陆主控节点服务器对集群进行管理,对于多集群生产环境,集群各个服务组件的运行状态和配置分布在不同的管理页面上,管理员需要分别对多集群进行配置管理时,需要分别登陆到各集群对应的主控界面,管理员检测各个服务组件的运行情况需要执行多次操作,重复的登录行为在集群数量多的情况下会占用管理员较多的时间,且很容易导致检测遗漏。总而言之,分散的组件状态管理没有高用户价值点,即无法有效、可靠地降低运维成本,且用户体验较差。
本申请提供一种多集群管理方法,该方法通过同时对多个集群进行纳管,可以采集到所有已纳管的集群各个组件的运行状态和配置,实现同时对多个集群的运行状态的可视化管理,简化了运维管理流程,提升了管理效率。
实施例一:
请参考图2,图2为本实施例提供的一种多集群管理方法的流程图;该方法主要包括:
步骤s110、管理平台向至少两个待管理的集群发送数据获取请求。
管理平台通过集群的外部接口向待管理的集群发送数据获取请求,该数据获取请求为集群主机的组件状态数据获取请求,以便各集群采集相应的状态数据上传至管理平台端进行后续的整体分析处理。
一般来说管理平台需要向纳管的所有集群发送数据获取请求以便实现对所有集群的管理,当需要针对某些集群或某些集群下的组件进行单独管理时,也可以仅向指定集群发送数据获取请求,本实施例中对待管理的集群的数量不做限定,可以根据实际情况进行设定。
发送的数据获取请求中包含指定采集的集群组件,即需要对集群中哪些组件进行运行状态以及配置状态信息的采集,本实施例中对指定的主机组件,即目标组件不做限定,可以参照传统单集群管理过程中设定的组件类型进行设定,也可以根据用户对集群的监测需求确定等。优选地,可以预先设置指定监控组件,则具体地,管理平台向各集群发送数据获取请求的过程具体为:管理平台向至少两个待管理的集群发送指定组件数据获取请求;其中,指定组件数据获取请求为面向预置指定组件的状态数据获取请求。一种指定组件包括:计算组件、存储组件以及网络组件,当然,也可以配置其他的组件,在此不做限定。
步骤s120、当接收到多集群返回的状态数据时,对状态数据按照预设多集群数据推送规则进行页面展示处理,得到多集群可视化状态数据。
其中,状态数据为反映集群各组件运行状态及配置状态的数据;状态数据由各集群进行收集,本实施例中对集群采集状态数据的过程不做限定,可以参照相关技术中的采集方式,在此不再赘述。
待管理的集群不少于两个,管理平台会接收到至少两个集群的状态数据,对接收到的各集群状态数据按照预设多集群数据推送规则进行页面展示处理,页面展示处理即进行UI可视化处理,则生成的多集群可视化状态数据可以在同一浏览器客户端进行输出,实现了对多个集群组件运行状态和配置情况进行统一管理,使管理员可以同时对多个集群进行监控。
具体地,对于状态数据在同一浏览器客户端的页面配置方式即多集群数据推送规则可以根据用户需求进行设定,比如可以将多个集群的状态数据进行同一页面展示处理,即令多个集群的状态数据在一个界面输出;也可以对各集群的状态数据进行对应页面展示处理,即为每个集群设置对应的展示界面;也可以对多集群状态数据根据组件类型进行对应页面展示处理,即为各集群间相同类型的组件设置对应的展示界面等,以上仅以上述三种形式为例进行介绍,其它形式下的设置方式在此不再赘述。
步骤s130、缓存多集群可视化状态数据。
将多集群可视化状态数据缓存至预先配置的缓存空间中,以便浏览器客户端通过该缓存空间的缓存接口调用多集群可视化状态数据进行集群管理请求的响应。其中,浏览器调用多集群可视化状态数据的实现过程可以参照相关技术中的实现方式,在此不再赘述。
以上对单次多集群管理过程进行介绍,为保证集群的稳定性,一般需要长期持续进行集群管理,则优选地,可以定时触发管理流程,即管理平台向至少两个待管理的集群定时发送数据获取请求,并执行以后的步骤,当然,也可以不启动定时自动触发,由人工触发启动等,本实施例中对以上流程的触发时间间隔以及触发方式不做限定,可以根据实际使用需要进行设定。
基于上述介绍,本实施例提供的多集群管理方法通过对多个集群组件运行状态以及配置情况进行统一管理,使管理员可以同时对多个集群进行监控,大大简化了多集群管理流程以及工作量,提升了多集群运维管理效率,也进一步保障了多集群运行可靠性及稳定性。
实施例二:
区别于实施例一,本实例主要从多集群数据推送规则的角度出发,在实施例一的基础上,对几种多集群数据推送规则下的页面展示处理过程进行了进一步的介绍。
当待管理的集群数量较多、或者不同集群下指定采集的组件不同等情况下,为保证用户可以更直观地了解各集群下组件状态信息,优选地,对状态数据按照预设多集群数据推送规则进行页面展示处理的过程可以按照以下步骤实现:
1、统计状态数据中各集群对应的状态数据,得到集群状态数据;
2、对各集群状态数据根据对应的集群展示规则进行可视化处理。
当待管理的集群数量有限,各集群间采集的组件类型相同或差异较小时,为实现用户对多集群间运行状态的平行分析,优选地,对状态数据按照预设多集群数据推送规则进行页面展示处理的过程可以按照以下步骤实现:
1、统计状态数据中各集群间相同组件对应的状态数据,得到组件状态数据;
2、对组件状态数据根据对应的组件展示规则进行可视化处理。
本实施例中仅以上述两种页面展示处理的方式进行介绍,本实施例中提供的处理方式可以提升多集群状态数据管理效率,提升用户体验。出于其他的用户需求下设定的其他多集群数据推动规则以及对应的页面展示处理方式均可参照上述介绍,在此不再赘述。
实施例三:
由于在采集过程或者数据传输过程中可能会出现某些错误导致采集的组件类型错误、数据中包含不可识别部分等影响数据读取有效性的问题。
为避免在数据处理过程前的某些问题影响后续处理过程的进行效率,优选地,在对状态数据按照预设多集群数据推送规则进行页面展示处理之前,可以进一步对状态数据进行数据有效性校验。
数据有效性校验具体可以为数据格式有效性校验、组件类型有效性校验等,可以根据实际数据采集以及传输过程中可能会出现的问题进行设定,在此仅以该两种校验形式为例进行介绍,其他校验方式在此不再赘述。
则相应地,对状态数据按照预设多集群数据推送规则进行页面展示处理的过程具体为:对状态数据中校验通过的数据按照预设多集群数据推送规则进行页面展示处理。而对于校验未通过的数据,可以拒绝对该部分数据的页面展示处理,输出数据错误提示信息等,本实施例中该种情况下的处理方式不做限定,可以根据处理需要进行设定。
基于本实施例中介绍的数据处理方式,可以大大提升管理效率,降低多集群管理宕机几率,当然,也可以不执行数据校验的步骤,在此不做限定。
实施例四:
状态数据中包含组件的各种状态信息,比如正常工作下的运行状态以及配置状态、组件异常下的运行状态以及配置状态(异常还可以进一步分为预警异常、常规异常以及严重异常等)。
为让用户更直观的了解到组件的实际状态是正常或是异常,以便于用户通过浏览器快速了解集群工作情况方便后续的故障处理等,在对状态数据按照预设多集群数据推送规则进行页面展示处理之前,可以进一步调用预先配置的组件正常工作标准判断状态数据中是否存在异常状态数据;组件正常工作标准需要根据配置的采集组件类型以及对应类型下的组件正常工作标准参数进行设定,则相应地,对状态数据按照预设多集群数据推送规则进行页面展示处理的过程具体为:对不存在状态异常的组件状态数据按照第一可视化处理规则进行数据处理;对存在状态异常的组件状态数据按照第二可视化处理规则进行数据处理。
具体地,第一可视化处理规则与第二可视化处理规则的具体规则设置在此不做限定,可以实现两部分数据的区别显示即可,可以从数据的颜色、字体等方面进行设置,也可以以弹屏等方面进行设置。
通过对异常以及非异常下的状态数据采用差异性的可视化处理手段进行差异化处理,可以便于用户直观了解集群组件状态,提升管理效率。
另外,为避免用户不及时进行集群管理导致的集群故障处理延误,影响集群正常运行的问题,优选地,当状态数据中存在异常状态数据时,可以控制连接的警示设备进行集群组件状态异常提示,警示设备可以为与管理平台端远程连接的相关技术人员的移动终端,或者报警器等,在此对警示设备的类型不做限定,异常提示的方法需要根据警示设备的类型进行设定,由于本实施例中对警示设备的类型不做限定,则相应地,不同警示设备下的提示方式在此也不做限定,可以根据实际情况进行设定。
实施例五:
请参考图3,图3为本实施例提供的一种多集群管理装置的结构框图;可以包括:获取请求发送单元310、数据处理单元320以及数据缓存单元330。本实施例提供的多集群管理装置可与上述实施例中介绍的多集群管理方法相互对照。
其中,获取请求发送单元310主要用于向至少两个待管理的集群发送数据获取请求;
数据处理单元320主要用于当接收到多集群返回的状态数据时,对状态数据按照预设多集群数据推送规则进行页面展示处理,得到多集群可视化状态数据;其中,状态数据为反映集群各组件运行状态及配置状态的数据;
数据缓存单元330主要用于缓存多集群可视化状态数据,以便浏览器客户端调用多集群可视化状态数据进行集群管理请求的响应。
可选地,数据处理单元具体可以为第一数据处理单元,第一数据处理单元用于当接收到多集群返回的状态数据时,统计状态数据中各集群对应的状态数据,得到集群状态数据;对各集群状态数据根据对应的集群展示规则进行可视化处理。
可选地,数据处理单元具体可以为第二数据处理单元,第二数据处理单元用于统计状态数据中各集群间相同组件对应的状态数据,得到组件状态数据;对组件状态数据根据对应的组件展示规则进行可视化处理。
可选地,本实施例提供的多集群管理装置中可以进一步包括:数据校验单元,数据校验单元用于:对状态数据进行数据有效性校验;数据校验单元与数据处理单元的输入端连接,则相应地,与数据校验单元连接的数据处理单元具体用于对状态数据中校验通过的数据按照预设多集群数据推送规则进行页面展示处理。
可选地,本实施例提供的多集群管理装置中可以进一步包括:异常判断单元,异常判断单元用于:调用预先配置的组件正常工作标准判断状态数据中是否存在异常状态数据;异常判断单元与数据处理单元的输入端连接,则相应地,与异常判断单元连接的数据处理单元具体用于对不存在状态异常的组件状态数据按照第一可视化处理规则进行数据处理;对存在状态异常的组件状态数据按照第二可视化处理规则进行数据处理。
可选地,本实施例提供的多集群管理装置中可以进一步包括:异常提示单元,异常提示单元与异常判断单元连接,用于当状态数据中存在异常状态数据时,控制连接的警示设备进行集群组件状态异常提示。
可选地,获取请求发送单元具体可以为请求定时发送单元,用于向至少两个待管理的集群定时发送数据获取请求。
可选地,获取请求发送单元具体可以为指定请求发送单元,用于向至少两个待管理的集群发送指定组件数据获取请求;其中,指定组件数据获取请求为面向预置指定组件的状态数据获取请求。
本实施例提供的多集群管理装置对于多集群的运维管理效率高,可以提升用户体验。
实施例六:
本申请还提供了一种多集群管理系统,此部分内容原理与方案部分相对应,实现原理的部分此处不再赘述,以下将对该多集群管理系统的硬件组成进行描述,请参见图4,图4为本申请实施例提供的一种多集群管理系统400的结构示意图,该系统中主要包括:待管理的集群410、管理平台420以及浏览器客户端430。
其中,待管理的集群的数量不少于两个,主要用于:当接收到数据获取请求时,控制集群中各节点采集组件运行状态及配置状态信息,得到集群的状态数据,并将状态数据推送至管理平台。
集群中包括主控节点以及从节点;其中,主控节点一端连接于从节点,另一端连接于管理平台。
管理平台与各集群连接,主要用于:向各集群发送数据获取请求;当接收到集群返回的状态数据时,对状态数据按照预设多集群数据推送规则进行页面展示处理,得到多集群可视化状态数据;缓存多集群可视化状态数据;
浏览器客户端与管理平台连接,主要用于:与用户端进行信息交互;当接收到集群管理请求时,调用多集群可视化状态数据进行请求响应。
实施例七:
为加深对本申请提供的多集群管理系统的工作机制的理解,本实施例中以待管理的集群为aCloud(深信服企业级云SANGFOR Cloud),管理平台为aCMP(深信服云管理平台SANGFOR Cloud Manager Platform,支持同时对多个云平台进行集中式管理。支持管理的平台包括深信服企业级云aCloud、VMWare云平台和阿里云)为例对一种企业场景下的多集群管理系统的组成以及管理方式进行介绍,其它应用场景下的功能部件配置以及工作过程示意均可参照本实施例的介绍,在此不再赘述。
图5所示为本实施例提供的一种企业场景下多集群管理系统结构及流转示意图,该系统主要包括:aCMP、aCloud集群以及浏览器客户端三部分。
系统中,aCMP纳管多个aCloud,提供外部接口(REST API)、缓存服务和数据采集服务,浏览器通过调用外部接口获取集群主机的组件信息。
aCMP下包含aCMP数据采集服务、aCMP数据处理服务以及aCMP缓存服务。
具体地,aCMP数据采集服务负责采集各个aCloud集群的信息,并调用缓存服务接口将数据写入缓存;aCMP数据处理服务负责数据处理,主要工作是将推送过来的数据处理成为符合UI展示的格式并缓存;aCMP缓存服务提供临时缓存空间(内存),缓存接口供数据采集服务调用。
aCMP中还包括aCMP外部接口,aCMP外部接口提供REST API接口供浏览器调用,用于页面展示。
一个aCloud集群由一个主控节点和若干个从节点组成,各个节点通过集群管理服务统一管理。一个aCMP能够纳管多个aCloud集群。aCMP的数据采集服务通过调用aCloud的数据缓存服务接口采集aCloud集群上所有运行主机各个组件的信息,并提供外部接口(REST API)供浏览器客户端调用以展示组件状态。aCloud主控节点为提供对外服务的入口,一个aCloud集群只有一个主控节点,异常时自动选择其它节点为主控节点。一个aCloud集群有若干个从节点。
aCloud集群的每台物理主机中设置有采集服务、缓存服务和对外接口的web服务。数据采集服务负责定时收集当前主机各个组件的运行状态和配置,并将收集到的数据推送到主控节点的缓存服务,这个过程可以通过调用缓存服务的外部接口完成的;aCloud缓存服务指提供临时数据缓存空间和外部调用接口,web服务调用该接口读取缓存信息;aCloud外部接口指提供REST API给aCMP调用的接口。
计算组件运行在主控节点和从节点,提供采集计算组件状态信息(内存、CPU等)的接口;存储组件运行在主控节点和从节点,提供采集存储组件状态信息(磁盘、卷等)的接口;网络组件运行在主控节点和从节点,提供采集网络组件状态信息(网口、网络设备等)的接口。
监控的组件具体可以包括计算组件、存储组件、网络组件、HA组件等等,后续如果增加了新的组件,可以横向添加进本架构中,各个组件的定时间隔时间独立并且可配置。
图6所示为aCloud组件的数据采集框架示意图,aCloud集群上各个节点的采集服务分别采集各自组件的数据并调用缓存服务提供的接口将数据写入临时缓存空间。主控的web服务提供外部接口(REST API),aCMP通过调用这些API获得集群所有运行主机各个组件的状态信息。
图7所示为aCMP数据采集时序图,数据采集过程主要包括以下步骤:
1、aCMP数据采集服务定时向aCloud外部接口服务(web服务)发送获取集群主机的组件状态信息请求。
2、aCloud的web服务调用aCloud的缓存服务读接口读取组件状态信息。
3、aCloud外部接口服务返回组件状态信息。
4、aCMP数据采集服务采用异步方式将组件状态信息推送给aCMP数据处理服务。
5、aCMP数据处理服务收到数据后,对数据进行校验和格式转换(转换成UI容易处理的数据格式)。
6、aCMP数据处理服务调用aCMP缓存服务写接口,将处理完成的数据写入aCMP缓存服务提供的临时存储空间。
7、aCMP缓存服务返回写入结果。
在某个集群的某个组件出现问题时,可以通过调整页面显示的组件状态颜色等,以突出显示。
浏览器客户端在接收到用户的管理查询请求时,调用aCMP缓存的数据进行数据查询的响应,浏览器客户端查询数据的时序图如图8所示,主要包括以下步骤:
1、浏览器客户端发送获取集群某个组件信息的请求给aCMP web服务。
2、aCMP web服务对请求参数进行检查。
3、aCMP web服务调用aCMP缓存服务的外部接口,从临时缓存取得数据。
4、aCMP缓存服务返回请求数据。
在某个集群的某个组件出现问题时,管理员通过页面显示的组件状态颜色可以快速采取应对措施。
本实施例提供的多集群管理系统基于aCloud展示出对业务可靠性存在影响的所有服务组件的运行状态,资源和配置状态统一展示,做到让用户所见即所得;同时可以让用户可自主规划业务保护服务,并对整个数据中心的业务可靠情况有总体的掌握。业务可靠中心主要展示两方面内容:异常告警信息和配置信息。异常告警信息能够让用户及时发现集群异常并采取措施消除对正常业务的影响。配置信息能够让用户了解各个云平台的资源配置负载情况,使计算、存储和网络等资源的利用达到最优。
实施例八:
本实施例提供一种计算机设备,包括:存储器以及处理器。
其中,存储器用于存储程序;
处理器用于执行程序时实现如上述多集群管理方法的步骤,具体可参照上述实施例中对多集群管理方法的介绍,在此不再赘述。
请参考图9,为本实施例提供的一种计算机设备的结构示意图,该计算机设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)322(例如,一个或一个以上处理器)和存储器332,一个或一个以上存储应用程序342或数据344的存储介质330(例如一个或一个以上海量存储设备)。其中,存储器332和存储介质330可以是短暂存储或持久存储。存储在存储介质330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对数据处理设备中的一系列指令操作。更进一步地,中央处理器322可以设置为与存储介质330通信,在计算机设备301上执行存储介质330中的一系列指令操作。
计算机设备301还可以包括一个或一个以上电源326,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口358,和/或,一个或一个以上操作系统341,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中所描述的多集群管理方法中的步骤可以由本实施例中计算机设备的结构实现。
实施例九:
本实施例公开一种可读存储介质,其上存储有程序,程序被处理器执行时实现如多集群管理方法的步骤,具体可参照上述实施例中对多集群管理方法的介绍。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的多集群管理方法、装置、系统、计算机设备及可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (12)

1.一种多集群管理方法,其特征在于,包括:
管理平台向至少两个待管理的集群发送数据获取请求;
当接收到多集群返回的状态数据时,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,得到多集群可视化状态数据;其中,所述状态数据为反映集群各组件运行状态及配置状态的数据;
缓存所述多集群可视化状态数据,以便浏览器客户端调用所述多集群可视化状态数据进行集群管理请求的响应。
2.如权利要求1所述的多集群管理方法,其特征在于,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,包括:
统计所述状态数据中各集群对应的状态数据,得到集群状态数据;
对各所述集群状态数据根据对应的集群展示规则进行可视化处理。
3.如权利要求1所述的多集群管理方法,其特征在于,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,包括:
统计所述状态数据中各集群间相同组件对应的状态数据,得到组件状态数据;
对所述组件状态数据根据对应的组件展示规则进行可视化处理。
4.如权利要求1所述的多集群管理方法,其特征在于,在对所述状态数据按照预设多集群数据推送规则进行页面展示处理之前,还包括:
对所述状态数据进行数据有效性校验;
则相应地,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,具体为:对所述状态数据中校验通过的数据按照预设多集群数据推送规则进行页面展示处理。
5.如权利要求1所述的多集群管理方法,其特征在于,在对所述状态数据按照预设多集群数据推送规则进行页面展示处理之前,还包括:
调用预先配置的组件正常工作标准判断所述状态数据中是否存在异常状态数据;
则相应地,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,具体为:
对不存在状态异常的组件状态数据按照第一可视化处理规则进行数据处理;
对存在状态异常的组件状态数据按照第二可视化处理规则进行数据处理。
6.如权利要求5所述的多集群管理方法,其特征在于,还包括:
当所述状态数据中存在异常状态数据时,控制连接的警示设备进行集群组件状态异常提示。
7.如权利要求1所述的多集群管理方法,其特征在于,所述管理平台向至少两个待管理的集群发送数据获取请求,包括:
管理平台向至少两个待管理的集群定时发送数据获取请求。
8.如权利要求1所述的多集群管理方法,其特征在于,所述管理平台向至少两个待管理的集群发送数据获取请求,包括:
管理平台向至少两个待管理的集群发送指定组件数据获取请求;其中,所述指定组件数据获取请求为面向预置指定组件的状态数据获取请求。
9.一种多集群管理装置,其特征在于,包括:
获取请求发送单元,用于向至少两个待管理的集群发送数据获取请求;
数据处理单元,用于当接收到多集群返回的状态数据时,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,得到多集群可视化状态数据;其中,所述状态数据为反映集群各组件运行状态及配置状态的数据;
数据缓存单元,用于缓存所述多集群可视化状态数据,以便浏览器客户端调用所述多集群可视化状态数据进行集群管理请求的响应。
10.一种多集群管理系统,其特征在于,包括:至少两个待管理的集群、与各所述集群连接的管理平台以及与所述管理平台连接的浏览器客户端;
其中,所述管理平台用于:向各所述集群发送数据获取请求;当接收到所述集群返回的状态数据时,对所述状态数据按照预设多集群数据推送规则进行页面展示处理,得到多集群可视化状态数据;缓存所述多集群可视化状态数据;
所述集群用于:当接收到所述数据获取请求时,控制集群中各节点采集组件运行状态及配置状态信息,得到集群的状态数据,并将所述状态数据推送至所述管理平台;
所述浏览器客户端用于:与用户端进行信息交互;当接收到集群管理请求时,调用所述多集群可视化状态数据进行请求响应。
11.一种计算机设备,其特征在于,包括:
存储器,用于存储程序;
处理器,用于执行所述程序时实现如权利要求1至8任一项所述多集群管理方法的步骤。
12.一种可读存储介质,其特征在于,所述可读存储介质上存储有程序,所述程序被处理器执行时实现如权利要求1至8任一项所述多集群管理方法的步骤。
CN201910663000.2A 2019-07-22 2019-07-22 一种多集群管理方法、装置、系统及相关组件 Pending CN110247812A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910663000.2A CN110247812A (zh) 2019-07-22 2019-07-22 一种多集群管理方法、装置、系统及相关组件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910663000.2A CN110247812A (zh) 2019-07-22 2019-07-22 一种多集群管理方法、装置、系统及相关组件

Publications (1)

Publication Number Publication Date
CN110247812A true CN110247812A (zh) 2019-09-17

Family

ID=67893174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910663000.2A Pending CN110247812A (zh) 2019-07-22 2019-07-22 一种多集群管理方法、装置、系统及相关组件

Country Status (1)

Country Link
CN (1) CN110247812A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110932927A (zh) * 2019-10-31 2020-03-27 北京浪潮数据技术有限公司 一种业务处理方法、装置、设备及可读存储介质
CN111857953A (zh) * 2020-07-17 2020-10-30 苏州浪潮智能科技有限公司 一种容器集群管理方法、装置、设备及可读存储介质
CN112751709A (zh) * 2020-12-29 2021-05-04 北京浪潮数据技术有限公司 一种存储集群的管理方法、装置和系统
CN113703917A (zh) * 2021-08-26 2021-11-26 上海道客网络科技有限公司 一种多集群资源数据处理系统与方法、非暂态存储介质
CN118316831A (zh) * 2024-04-25 2024-07-09 朴道征信有限公司 一种节点状态检测方法、装置、电子设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104639347A (zh) * 2013-11-07 2015-05-20 北大方正集团有限公司 一种多集群监控方法、装置及系统
CN107196814A (zh) * 2017-07-28 2017-09-22 郑州云海信息技术有限公司 一种多集群的管理方法及系统
CN107360045A (zh) * 2017-08-31 2017-11-17 郑州云海信息技术有限公司 一种存储集群系统的监控方法及装置
CN107368583A (zh) * 2017-07-21 2017-11-21 郑州云海信息技术有限公司 一种多集群信息查询的方法及系统
CN109302324A (zh) * 2018-11-23 2019-02-01 快云信息科技有限公司 一种私有云监控预警方法及系统
CN109861878A (zh) * 2019-01-17 2019-06-07 平安科技(深圳)有限公司 kafka集群的topic数据的监控方法及相关设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104639347A (zh) * 2013-11-07 2015-05-20 北大方正集团有限公司 一种多集群监控方法、装置及系统
CN107368583A (zh) * 2017-07-21 2017-11-21 郑州云海信息技术有限公司 一种多集群信息查询的方法及系统
CN107196814A (zh) * 2017-07-28 2017-09-22 郑州云海信息技术有限公司 一种多集群的管理方法及系统
CN107360045A (zh) * 2017-08-31 2017-11-17 郑州云海信息技术有限公司 一种存储集群系统的监控方法及装置
CN109302324A (zh) * 2018-11-23 2019-02-01 快云信息科技有限公司 一种私有云监控预警方法及系统
CN109861878A (zh) * 2019-01-17 2019-06-07 平安科技(深圳)有限公司 kafka集群的topic数据的监控方法及相关设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110932927A (zh) * 2019-10-31 2020-03-27 北京浪潮数据技术有限公司 一种业务处理方法、装置、设备及可读存储介质
CN110932927B (zh) * 2019-10-31 2021-12-03 北京浪潮数据技术有限公司 一种业务处理方法、装置、设备及可读存储介质
CN111857953A (zh) * 2020-07-17 2020-10-30 苏州浪潮智能科技有限公司 一种容器集群管理方法、装置、设备及可读存储介质
CN111857953B (zh) * 2020-07-17 2023-06-16 苏州浪潮智能科技有限公司 一种容器集群管理方法、装置、设备及可读存储介质
CN112751709A (zh) * 2020-12-29 2021-05-04 北京浪潮数据技术有限公司 一种存储集群的管理方法、装置和系统
CN113703917A (zh) * 2021-08-26 2021-11-26 上海道客网络科技有限公司 一种多集群资源数据处理系统与方法、非暂态存储介质
CN118316831A (zh) * 2024-04-25 2024-07-09 朴道征信有限公司 一种节点状态检测方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
CN110247812A (zh) 一种多集群管理方法、装置、系统及相关组件
US10515000B2 (en) Systems and methods for performance testing cloud applications from multiple different geographic locations
CN106302565B (zh) 业务服务器的调度方法及系统
CN108776934B (zh) 分布式数据计算方法、装置、计算机设备及可读存储介质
CN104168333B (zh) Proxzone服务平台的工作方法
US20180375726A1 (en) Resource Configuration Method, Virtualized Network Function Manager, and Element Management System
US20100153482A1 (en) Cloud-Based Automation of Resources
CN107544837B (zh) 云服务设备性能数据采集系统、方法和装置
CN109800160B (zh) 机器学习系统中的集群服务器故障测试方法和相关装置
CN103607424B (zh) 一种服务器连接方法及服务器系统
US10296411B1 (en) Endpoint call backoff in a computing service environment
CN107666493B (zh) 一种数据库配置方法及其设备
CN113064744A (zh) 任务处理方法、装置、计算机可读介质及电子设备
CN114237937A (zh) 一种多线程的数据传输方法和装置
CN105049509A (zh) 一种集群调度方法、负载均衡器以及集群系统
US10122602B1 (en) Distributed system infrastructure testing
CN116028290A (zh) 一种固态硬盘测试方法、装置、设备及介质
CN114338684B (zh) 一种能源管理系统及方法
CN107666401B (zh) 一种配置信息获取方法及终端
CN112434050B (zh) 电网业务处理系统的数据同步方法、装置和业务处理系统
CN109257256A (zh) 设备监控方法、装置、计算机设备及存储介质
CN106375372B (zh) 一种大数据资源分配方法和装置
CN112527192A (zh) 数据获取方法、装置及服务设备
CN113760672A (zh) 多云平台资源的性能测试方法、设备及存储介质
CN111858199A (zh) 一种自适配硬盘日志采集方法、系统、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190917