CN111966558A - 集群的资源监控方法、装置、集群、设备和介质 - Google Patents
集群的资源监控方法、装置、集群、设备和介质 Download PDFInfo
- Publication number
- CN111966558A CN111966558A CN202010605264.5A CN202010605264A CN111966558A CN 111966558 A CN111966558 A CN 111966558A CN 202010605264 A CN202010605264 A CN 202010605264A CN 111966558 A CN111966558 A CN 111966558A
- Authority
- CN
- China
- Prior art keywords
- resource
- node
- monitoring
- cluster
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 278
- 238000000034 method Methods 0.000 title claims abstract description 119
- 230000008569 process Effects 0.000 claims description 58
- 230000015654 memory Effects 0.000 claims description 22
- 230000000007 visual effect Effects 0.000 claims description 6
- 238000012800 visualization Methods 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 9
- 230000002159 abnormal effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000002054 transplantation Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45591—Monitoring or debugging support
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请实施例公开了一种集群的资源监控方法、装置、集群、设备和介质,涉及资源监控、大数据及云计算技术领域。具体实现方案为:向集群中的每个节点分发资源监控工具;针对每个节点,启动资源监控工具,通过资源监控工具对节点的资源使用情况进行监控;利用监控到的节点的资源使用数据,生成数据回传网页并回传;以及从数据回传网页上下载资源使用数据。本申请实施例能够实现通过向集群中节点分发监控资源工具,获取集群中每个节点的资源使用数据,并控制每个节点通过回传数据回传网页回传资源使用数据,不仅根据资源使用数据对集群中每个节点的资源使用情况进行有效监控,还能实现对集群可插拔监控的效果。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及资源监控、大数据及云计算技术领域,具体涉及一种集群的资源监控方法、装置、集群、设备和介质。
背景技术
在当前k8s集群的火热时代,针对k8s的性能测试也至关重要,虽然k8s集群本身有相应的监控服务,以平台形式展示各类趋势图,但对于性能数据的可移植性,存储以及数据的输出,却是一个大工程,集群越大,需要手动处理的数据就越庞大,耗时也越长。
发明内容
本申请提供了一种集群的资源监控方法、装置、集群、设备和介质,提供一种对集群中节点的资源使用情况进行监控和收集的方案,实现可插拔监控集群资源。
根据本申请的一方面,提供了一种集群的资源监控方法,包括:
向集群中的每个节点分发资源监控工具;
针对每个所述节点,启动所述资源监控工具,通过所述资源监控工具对所述节点的资源使用情况进行监控;
利用监控到的所述节点的资源使用数据,生成数据回传网页并回传;以及
从所述数据回传网页上下载所述资源使用数据。
根据本申请的另一方面,提供了一种集群的资源监控装置,包括:
分发模块,用于向集群中的每个节点分发资源监控工具;
资源监控模块,用于针对每个所述节点,启动所述资源监控工具,通过所述资源监控工具对所述节点的资源使用情况进行监控;
生成模块,用于利用监控到的所述节点的资源使用数据,生成数据回传网页并回传;以及
下载模块,用于从所述数据回传网页上下载所述资源使用数据。
根据本申请的另一方面,提供了一种集群,包括:多个节点和本申请任一项所述的集群的资源监控装置。
根据本申请的另一方面,提供了一种电子设备,该电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请实施例中任一项所述的集群的资源监控方法。
根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如本申请实施例中任一项所述的集群的资源监控方法。
根据本申请的技术通过向集群中的各节点分发资源监控工具,以利用资源监控工具收集每个节点的资源使用数据,基于资源使用数据生成数据回传网页,并回传数据回传网页,以从数据回传网页上下载资源使用数据。由此,能够实现通过向集群中节点分发监控资源工具,获取集群中每个节点的资源使用数据,并控制每个节点通过回传数据回传网页回传资源使用数据,不仅根据资源使用数据对集群中每个节点的资源使用情况进行有效监控,还能实现对集群可插拔监控的效果。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例提供的一种集群的资源监控方法的流程示意图;
图2是本申请实施例提供的另一种集群的资源监控方法的流程示意图;
图3a是本申请实施例提供的对集群中节点资源使用情况进行监控的整体流程图;
图3b是本申请实施例提供的对集群中节点资源使用情况进行监控的场景系统图;
图4是根据本申请实施例提供的另一种集群的资源监控方法的流程示意图;
图5是根据本申请实施例提供的另一种集群的资源监控方法的流程示意图;
图6是根据本申请实施例提供的另一种集群的资源监控方法的流程示意图;
图7是根据本申请实施例提供的一种集群的资源监控装置的结构示意图;
图8是根据本申请实施例提供的一种集群的结构示意图;
图9是用来实现本申请实施例的集群的资源监控方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面具体参照附图描述本申请实施例提供的一种集群的资源监控方法、装置、集群、设备和介质,首先参照附图1描述本申请实施例提供的一种集群的资源监控方法。图1是本申请实施例提供的一种集群的资源监控方法的流程示意图,参见图1,该方法包括以下步骤:
S101,向集群中的每个节点分发资源监控工具。
其中,本实施例提供的集群的资源监控方法,可以由本申请实施例提供的集群的资源监控装置执行,该装置可以配置于电子设备中,以对集群中节点资源使用情况进行监控。在本申请实施例中,电子设备可为资源监控服务器(发压端)。
在本发明实施例中,集群是指k8s(Kubernetes)集群,k8s包括多个节点。Kubernetes(k8s)是一个全新的基于容器技术的分布式架构,建立在docker技术之上,为容器化的应用提供了资源调度、部署运行、服务发现和扩容缩容等丰富多样的功能。k8s的特点是自动化,自动化是指能够实现自动部署,自动重启,自动复制,自动伸缩/扩展。
其中,资源监控工具是用于监控集群中每个节点的资源使用情况的工具。
示例性的,可通过监控人员在电子设备中设置配置文件,在配置文件设置完成之后,启动电子设备,以使电子设备基于配置文件中的目标监控集群信息,通过网络向目标监控集群中的每个节点分发资源监控工具。其中,配置文件可包括目标监控集群信息和待监控业务类型等。在本实施例中,目标监控集群信息可以是指k8s集群所在机器的IP等能够确定目标监控集群的信息,此处对其不做具体限定。待监控业务类型是指需要监控的业务场景。
也就是说,本申请电子设备可以根据需要灵活设置,当电子设备通过接口接入后就可以向目标监控集群中每个节点分发资源监控工具,可选的,资源监控工具可以为封装在一个压缩包中,通过下发压缩包来向集群中的节点发送该资源监控工具。
S102,针对每个节点,启动资源监控工具,通过资源监控工具对节点的资源使用情况进行监控。
其中,资源使用情况可以是但不限于:CPU使用情况、内存使用情况和磁盘使用情况等,此处对其不做具体限定。
对集群中每个节点的资源使用情况进行监控时,相关技术中,通常采用如下方式:方式一,采用集群(如k8s集群)自带的资源监控工具(完整度量管道prometheus)从kubelet获取度量,然后通过适配器公开给kubernetes,其中Prometheus提供可视化服务。方式二,利用top工具对集群中每个节点的资源使用情况监控。然而,上述方式一应用场景只能在集群内部使用,可搜索查看每台机器及节点中实例(pod)的性能数据,但无法做到数据的可视化无损移植,同时随着pod的异常或删除,数据也会出现丢失;方式二,实现比较简单,同时也可以做到数据的可视化无损移植但只能收集单台机器,不适合k8s集群,并且随着k8s集群的扩容、pod的扩容,更加无法做到动态的扩容监控。
为了解决相关技术中通过采用集群自带的资源监控工具无法实现数据无损移植,以及采用top工具只能收集单台机器和无法动态扩容的问题。本申请实施例创造性的将能够实现数据移植,集群的监控以及随着集群的扩容相应进行动态扩容的资源监控工具分发给集群中的每个节点后,通过启动每个节点上的资源监控工具,以控制资源监控工具对所在节点的资源使用情况进行监控。其中,启动每个节点上的资源监控工具可通过向电子设备发送资源监控工具启动指令,以同步启动每个节点上的资源监控工具,实现对资源监控工具所在节点的资源使用情况进行同步监控,从而能够最大限度的满足数据的无损迁移,且不会出现数据丢失,同时针对k8s集群的自动弹性伸缩的特性,资源监控工具同样支持可自动伸缩监控项,即具备自动弹性伸缩的特性。
S103,利用监控到的节点的资源使用数据,生成数据回传网页并回传。
其中,资源使用数据可以是但不限于:CPU占用率、可用内存,磁盘剩余空间等数据。
可选的,通过每个节点上的资源监控工具,监控到每个资源节点的资源使用数据之后,需要将每个节点的资源使用数据回传至电子设备,以使电子设备基于每个监控资源工具回传的资源使用数据,确定集群中是否存在资源使用异常的节点。
相关技术中,一般资源节点工具监控到节点的资源使用数据之后,节点会采用资源使用数据加密的方式,将资源使用数据进行加密之后回传给电子设备。然而,密码属于敏感信息,使得不能轻易共享,导致回传错误或失败。为此,本申请实施例通过采用基于监控到的节点的资源使用数据,生成数据回传网页,以将该数据回传网页回传给电子设备,从而实现节点的资源使用数据的免密回传,提高资源使用数据的回传成功率。
S104,从数据回传网页上下载资源使用数据。
可选的,接收到集群中每个节点的数据回传网页后,电子设备可从接收的数据回传网页上下载集群中每个节点的资源使用数据,并基于每个节点的资源使用数据确定节点的资源使用情况是否出现异常。也就是说,本实施例通过数据回传网页获取节点的资源使用数据,实现了节点上数据的无损移植。
本申请实施例的技术方案,通过向集群中的各节点分发资源监控工具,以利用资源监控工具收集每个节点的资源使用数据,基于资源使用数据生成数据回传网页,并回传数据回传网页,以从数据回传网页上下载资源使用数据。由此,实现通过向集群中节点分发监控资源工具,获取集群中每个节点的资源使用数据,并控制每个节点通过回传数据回传网页回传资源使用数据,不仅根据资源使用数据对集群中每个节点的资源使用情况进行有效监控,还能实现对集群可插拔监控的效果。
通过上述分析可知,本申请实施例通过集群各节点上的资源监控工具对各节点的资源使用情况进行监控,并基于节点回传的数据回传网页,得到每个节点的资源使用数据。具体实现过程中,集群中的每个节点上可运行多个实例(pod),并且每个节点上还可具有正在运行的业务服务的主进程。为了对每个节点上的多个实例和每个节点上正在运行的业务服务的主进程的资源使用情况进行监控,本申请实施例可在资源监控工具中设置两种资源监控程序,例如第一资源监控程序和第二资源监控程序,通过第一资源监控程序和第二资源监控程序,分别对每个节点上的各实例的资源使用情况,以及每个节点上正在运行的业务服务的主进程的资源使用情况进行监控。下面结合图2,对本申请实施例提供的集群的资源监控方法的上述情况进行说明。
如图2所示,该方法包括以下步骤:
S201,向集群中的每个节点分发资源监控工具。
其中,资源监控工具包括第一资源监控程序和第二资源监控程序。在本申请实施例中,第一资源监控程序是指docker工具;第二资源监控程序是指top工具。具体的,docker工具用于对每个节点上实例的资源使用情况进行监控,top工具用于对每个节点上正在运行的业务服务的主进程的资源使用情况进行监控。
也就是说,本申请实施例可通过采用不同的监控程序,监控集群中每个节点上的实例和正在运行的业务服务的主进程的资源使用情况。从而实现对集群节点的多维度监控。
由于集群中的节点包括主节点(master节点)和隶属于主节点的其他节点(slave节点),其中主节点相当于管控节点,不仅对其他节点进行控制,还可作为中转机构,与上层设备(电子设备)进行数据交互。此外,主节点还可具有其他节点的功能,即主节点上也都部署有各种实例(pod)。
为此,本申请实施例对集群中的每个节点的资源使用情况进行监控时,可通过向集群中的主节点分发资源监控工具,并由主节点继续向隶属于主节点的各节点下发资源监控工具。
由于对隶属于主节点的其他节点上正在运行的业务服务的主进程的资源使用情况进行监控时,需要进入到部署有该其他节点上正在运行的业务服务的主进程,并且监控是由所属的主节点上的资源监控工具中的第二资源监控程序监控的,因此本申请实施例向主节点发送的资源监控工具中包括:第一资源监控程序和第二资源监控程序,而向隶属于主节点的各节点发送的资源监控工具中包括:第一资源监控程序。
本申请中通过向主节点发送包括第一资源监控程序和第二资源监控程序,以实现监控主节点上的多个实例的资源使用情况和主节点上正在运行的业务服务的主进程资源使用情况;通过向隶属于主节点的各节点发送包括第一资源监控程序,以实现监控隶属于主节点的各节点上多个实例的资源使用情况,并通过主节点上部署的第二资源监控程序,监控隶属于该主节点的其他节点上正在运行的业务服务的主进程的资源使用情况。
即,主节点上部署有第一资源监控程序和第二资源监控程序,而隶属于主节点的各节点上仅部署有第一资源监控程序。本申请中,利用主节点所具有的管控其他节点的特点,由主节点监控各节点主进程的资源使用情况,能够使得主节点能够更快速的监控到主进程资源使用情况,并反馈给电子设备,能够及时对主进程调度。通过各节点上部署第一资源监控程序,而不是全由主节点监控,能够有效降低主节点的监控负担。
S202,针对每个节点,启动并调用第一资源监控程序,对节点上实例的资源使用情况进行监控,以获取实例的第一资源使用数据。
其中,第一资源使用数据可包括:CPU占用率、可用内存,磁盘剩余空间等数据。
可选的,可通过检测集群中每个节点的类型,确定哪些节点属于主节点,哪些节点隶属于主节点的其他节点。在确定出集群中的主节点和其他节点之后,针对每个主节点,启动并调用部署于每个主节点上的资源监控工具中的第一资源监控程序,对每个主节点上每个实例的资源使用情况进行监控,以获取每个主节点上的每个实例的第一资源使用数据。针对每个隶属于主节点的其他节点,通过启动并调用部署于每个其他节点上资源监控工具中的第一资源监控程序,对每个其他节点上每个实例的资源使用情况进行监控,以获取每个其他节点上每个实例的第一资源使用数据。
S203,调用第二资源监控程序,对节点上正在运行的业务服务的主进程进行资源使用情况进行监控,以获取主进程的第二资源使用数据。
其中,第二资源使用数据可包括:CPU占用率、可用内存,磁盘剩余空间等数据。
在本申请实施例中,主进程可比作一个商店,商店提供商品服务,商店旁边可能还有其他售卖摊位,例如水果摊、蔬菜摊等,此种情况下,其他售卖摊位为次要的,可以不用关注,商店所提供的服务即为主进程。
可选的,可通过获取集群中每个节点上正在运行的业务服务,确定业务服务的主进程,然后确定集群中每个业务服务的主进程所属的节点是主节点还是隶属于主节点的其他节点。在确定业务服务的主进程所属的节点为主节点,启动并调用部署于每个主节点上的资源监控工具中的第二资源监控程序,对每个主节点上正在运行的业务服务的主进程的资源使用情况进行监控,以获取每个主节点上正在运行的业务服务的主进程的第二资源使用数据。在确定业务服务的主进程所属的节点为隶属于主节点的其他节点,通过启动并调用部署于每个其他节点所属主节点上资源监控工具中的第二资源监控程序,对每个其他节点上正在运行的业务服务的主进程的资源使用情况进行监控,以获取每个其他节点上正在运行的业务服务的主进程第二资源使用数据。从而实现通过主节点对隶属于主节点的其他节点上正在运行的业务服务的主进程的资源使用情况监控的管理。
即,本实施例所述调用所述第二资源监控程序,对所述节点上正在运行的业务服务的主进程进行资源使用情况进行监控,以获取第二资源使用数据,包括:获取各节点上正在运行的所述业务服务;获取所述业务服务的主进程;以及调用部署在所述主节点上的所述第二资源监控程序,分别对所述主节点和隶属于所述主节点的各节点上的所述业务服务的主进程的资源使用情况进行监控,以获取所述主进程的第二资源使用数据。
可以理解的是,本实施例中S202和S203中通过资源监控工具,对集群中每个节点的资源使用情况进行监控时,通过采用第一资源监控程序(docker工具)和第二资源监控程序(top工具)两种方式,其中docker监控需输送到每个node节点的监控服务,重点监控采集本节点下的各类服务资源使用情况;top监控采集以主节点(master)为执行入口,kubectlexec获取到集群中正在运行的业务服务,并进一步获取到正在运行的业务服务的主进程pid,进而通过主进程的pid收集资源使用情况。具体实现代码如下:
pid=$(kubectl exec-i$element-n$namespace--ps-ef|grep java|awk'{print$2'})
kubectl exec-i$element-n$namespace--top-b-d$interval-p$pid
S204,利用监控到的节点的资源使用数据,生成数据回传网页并回传。
S205,从数据回传网页上下载资源使用数据。
为了清楚说明本实施例,下面结合图3a和图3b对集群中每个节点的资源使用情况监控过程进行说明。
如图3a所示,监控人员可首先执行步骤1通过统一配置入口进行配置文件设置,在配置文件设置完成之后,执行步骤2以通过统一的执行入口启动电子设备监控服务,电子设备基于启动指令向目标监控集群中每个节点分发资源监控工具,并同步启动各节点上的资源监控工具,以使每个节点上的资源监控工具进行资源使用情况的监控。由于配置文件中还包括:待监控业务类型,因此资源监控工具还可根据待监控业务类型采集对应资源使用数据,并判断监控服务运行状态;如果监控服务运行停止,则确定监控服务停止,则集群中每个节点利用资源监控工具监控到的资源使用数据,生成数据回传网页并回传给电子设备,以使电子设备从数据回传网页中下载每个节点的资源使用数据。如果监控服务运行未停止,则继续进行资源使用情况的监控,并确定是否手动停止监控服务,如果是,则确定监控服务停止,则集群中每个节点利用资源监控工具监控到的资源使用数据,生成数据回传网页并回传给电子设备,以使电子设备从数据回传网页中下载每个节点的资源使用数据。
下面结合图3b的系统图进行说明,具体的可通过在上层中的电子设备上的唯一配置入口进行配置文件设置,然后再通过电子设备上的唯一执行入口控制启停监控服务。如果从配置文件中获取下层中的目标监控集群信息,电子设备根据目标监控集群信息向确定的目标集群中的主节点发送包括docker工具和top工具的资源监控工具,之后由主节点继续向隶属于主节点的各节点下发包括docker工具的资源监控工具。如果监测到启动监控服务指令时,可通过主节点上的docker工具对该节点上实例的资源使用情况进行监控,以及通过主节点上的top工具对该节点上正在运行的业务服务的主进程的资源使用情况进行监控;通过隶属于主节点的其他节点上的docker工具的该节点上实例的资源使用情况进行监控,以及通过所属主节点上的top工具对该节点上正在运行的业务服务的主进程资源使用情况进行监控。之后,集群中主节点和其他节点可根据监控的资源使用数据生成资源回传页面,并将资源回传页面回传给电子设备,以使电子设备从资源回传页面下载资源使用数据。其中,图3b中主节点部分还包括:机器资源占用监控服务、服务limits设置、pod主进程资源占用监控服务、docker监控数据收集和数据回传服务。服务limits设置是k8s集群中对pod的资源设置。其中,pod自身资源占用是为了可以更加清晰的了解每一个pod在有服务limits配置的情况下,自身的资源使用情况是否有异常,而增设的资源监控。
本申请实施例的技术方案,通过向集群中的各节点分发包括第一资源监控程序和第二资源监控程序的资源监控工具,以利用第一资源监控程序,对每个节点上实例的资源使用情况进行监控,以获取实例的第一资源使用数据,并调用第二资源监控程序,对每个节点上正在运行的业务服务的主进程进行资源使用情况进行监控,以获取主进程的第二资源使用数据,然后利用监控到的每个节点的第一资源使用数据和第二资源使用数据,生成数据回传网页并回传,使得电子设备从数据回传网页上下载资源使用数据。由此,实现通过向集群中节点分发监控资源工具,获取集群中每个节点的资源使用数据,并控制每个节点通过回传数据回传网页回传资源使用数据,不仅根据资源使用数据对集群中每个节点的资源使用情况进行有效监控,还能实现对集群可插拔监控的效果。此外,资源监控工具增设了多维度资源监控,为集群性能中的问题定位提供了更加便捷的途径。
图4是根据本申请实施例提供的另一种集群的资源监控方法的流程示意图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图4,该方法包括:
S401,向集群中的每个节点分发资源监控工具。
S402,向每个节点分发用于生成数据回传网页的网页服务程序。
其中,网页服务程序是指web服务。
可选的,本实施例通过向集群中每个节点分发web服务,以使每个节点可基于web服务生成数据回传网页并回传该数据回传网页,从而实现节点的资源使用数据的免密回传,提高资源使用数据的回传成功率,实现了节点上数据的无损移植。
可以理解的是,S401和S402的执行顺序,可以是向集群中的每个节点分发资源监控工具的同时,向每个节点分发用于生成数据回传网页的网页服务程序;或者,向集群中的每个节点分发资源监控工具之后,向每个节点分发用于生成数据回传网页的网页服务程序;又或者,向集群中的每个节点分发资源监控工具之前,向每个节点分发用于生成数据回传网页的网页服务程序。此处对其不做具体限定。
由于集群中节点包括主节点和隶属于主节点的其他节点,且主节点相当于管控节点,可对其他节点进行控制。为此,本申请实施例向每个节点分发用于生成所述数据回传网页的网页服务程序,包括:向所述集群中各主节点下发所述网页服务程序,由所述主节点继续向隶属于所述主节点的各节点下发所述网页服务程序。
S403,针对每个节点,启动资源监控工具,通过资源监控工具对节点的资源使用情况进行监控。
S404,利用监控到的节点的资源使用数据,基于用于生成数据回传网页的网页服务程序生成数据回传网页并回传。
S405,从数据回传网页上下载资源使用数据。
继续以图3b为例进行说明,图3b中主节点和隶属于主节点的其他节点上均配置有web服务。
本申请实施例的技术方案,通过向集群中的各节点分发资源监控工具,向每个节点分发用于生成数据回传网页的网页服务程序,以利用资源监控工具收集每个节点的资源使用数据,利用监控到的节点的资源使用数据,基于用于生成数据回传网页的网页服务程序生成数据回传网页,并回传数据回传网页,以从数据回传网页上下载资源使用数据。由此,实现通过向集群中节点分发监控资源工具,获取集群中每个节点的资源使用数据,并控制每个节点通过回传数据回传网页回传资源使用数据,不仅根据资源使用数据对集群中每个节点的资源使用情况进行有效监控,还能实现对集群可插拔监控的效果。此外,通过采用基于监控到的资源使用数据,生成数据回传网页,以将该数据回传网页回传给电子设备,从而实现节点的资源使用数据的免密回传,提高资源使用数据的回传成功率,实现了节点上数据的无损移植。
图5是根据本申请实施例提供的另一种集群的资源监控方法的流程示意图。本实施例是在上述实施例的基础上提出的一种可选方案。具体的,从数据回传网页上下载资源使用数据之后,还监控集群的扩容信息,并对扩容信息中新增节点(第一节点)分发资源监控工具,以获取新增节点的资源使用数据。参见图5,该方法包括:
S501,监控集群的扩容信息,以获取集群中扩容所新增的每个第一节点以及第一节点上所部署的第一实例。
S502,向所述第一节点分发资源监控工具,以获取第一节点的资源使用数据。
其中,扩容信息是指在集群中增加的新节点及新节点上实例的信息。在本发明实施例中,新节点即为第一节点,新节点上实例即为第一节点上所部属的第一实例。其中,第一节点和第一实例的数量为至少一个。
通常,k8s集群具有自动弹性伸缩特性,即动态扩容特性。一般k8s集群的扩容分两种:第一种:节点扩容;第二种:节点上实例(pod)扩容。本实施例向集群中的每个节点分发资源监控工具,并将资源监控工具部署在每个节点之后,资源监控工具还可自动识别扩容后的第一节点以及第一节点上的所有实例。然后,向第一节点分发资源监控工具,以获取第一节点的资源使用数据。
其中,获取第一节点的资源使用数据,包括:第一节点上各实例的资源使用数据,和第一节点上正在运行的业务服务的主进程的资源使用数据。
S503,利用监控到的第一节点的资源使用数据,生成数据回传网页并回传。
S504,从数据回传网页上下载第一节点的资源使用数据。
可选的,可利用监控到的第一节点的资源使用数据,根据分发的网页服务程序,生成数据回传网页,并将该数据回传网页回传给电子设备,使得电子设备从数据回传网页上下载资源使用数据,以分析第一节点上的实例和/或正在运行的业务服务的主进程的资源使用情况是否出现异常。
本申请实施例的技术方案,通过向集群中的各节点分发资源监控工具,以利用资源监控工具收集每个节点的资源使用数据,基于资源使用数据生成数据回传网页,并回传数据回传网页,以从数据回传网页上下载资源使用数据。由此,实现通过向集群中节点分发监控资源工具,获取集群中每个节点的资源使用数据,并控制每个节点通过回传数据回传网页回传资源使用数据,不仅根据资源使用数据对集群中每个节点的资源使用情况进行有效监控,还能实现对集群可插拔监控的效果。此外,还监控集群的扩容信息,以获取集群中扩容所新增的每个第一节点以及每个第一节点上部署的第一实例,并向每个第一节点分发资源监控工具,以获取第一节点的资源使用数据,从而基于资源使用数据确定第一节点资源使用情况是否出现异常,并且当任意第一节点资源使用情况出现异常时,能够直观定位出异常节点,为节点异常问题定位提供了更加便捷的途径。
图6是根据本申请实施例提供的另一种集群的资源监控方法的流程示意图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图6,该方法包括:
S601,向集群中的每个节点分发资源监控工具。
S602,针对每个节点,启动资源监控工具,通过资源监控工具对点的资源使用情况进行监控。
S603,利用监控到的节点的资源使用数据,生成数据回传网页并回传。
S604,从数据回传网页上下载资源使用数据。
S605,从资源使用数据中提取元数据,并对元数据进行落地存储。
其中,元数据是指描述资源使用数据的数据,或者用于提供信息资源的结构数据。
可选的,通过将从资源使用数据中提取的元数据进行落地存储,可实现简单高效地管理大量资源使用数据;实现信息资源的有效发现、查找、一体化组织和对信息资源的有效管理。
进一步的,本实施例对所述元数据进行落地存储之后,还包括:根据提取的元数据生成所述节点的可视化数据结果。
也就是说,根据提取的元数据生成节点的可视化数据结果,以使执行人员基于可视化数据结果直观且快速的定位出资源使用情况出现异常的节点及节点上实例或者节点上正在运行的业务服务的主进程。
本申请实施例的技术方案,通过向集群中的各节点分发资源监控工具,以利用资源监控工具收集每个节点的资源使用数据,基于资源使用数据生成数据回传网页,并回传数据回传网页,以从数据回传网页上下载资源使用数据。由此,实现通过向集群中节点分发监控资源工具,获取集群中每个节点的资源使用数据,并控制每个节点通过回传数据回传网页回传资源使用数据,不仅根据资源使用数据对集群中每个节点的资源使用情况进行有效监控,还能实现对集群可插拔监控的效果。此外,将从资源使用数据中提取的元数据进行落地存储,可实现简单高效地管理大量资源使用数据;实现信息资源的有效发现、查找、一体化组织和对信息资源的有效管理。
图7是根据本申请实施例提供的一种集群的资源监控装置的结构示意图。参见图7,本申请实施例公开了集群的资源监控装置700,该装置700可以配置于电子设备中,该装置700包括:分发模块710、资源监控模块720、生成模块730和下载模块740;
其中,分发模块710,用于向集群中的每个节点分发资源监控工具;
资源监控模块720,用于针对每个所述节点,启动所述资源监控工具,通过所述资源监控工具对所述节点的资源使用情况进行监控;
生成模块730,用于利用监控到的所述节点的资源使用数据,生成数据回传网页并回传;以及
下载模块740,用于从所述数据回传网页上下载所述资源使用数据。
可选的,所述资源监控工具包括第一资源监控程序和第二资源监控程序,所述资源监控模块720,包括:
第一监控单元,用于针对每个节点,调用所述第一资源监控程序,对所述节点上实例的资源使用情况进行监控,以获取所述实例的第一资源使用数据;以及
第二监控单元,用于调用所述第二资源监控程序,对所述节点上正在运行的业务服务的主进程进行资源使用情况进行监控,以获取所述主进程的第二资源使用数据。
可选的,所述分发模块710,进一步用于:
向所述集群中的主节点分发所述资源监控工具,并由所述主节点继续向隶属于所述主节点的各节点下发所述资源监控工具。
可选的,所述主节点上部署有所述第一资源监控程序和所述第二资源监控程序,而隶属于所述主节点的各节点上仅部署有所述第一资源监控程序。
可选的,所述第二监控单元,包括:
第一获取子单元,用于获取各节点上正在运行的所述业务服务;
第二获取子单元,用于获取所述业务服务的主进程;以及
监控子单元,用于调用部署在所述主节点上的所述第二资源监控程序,分别对所述主节点和隶属于所述主节点的各节点上的所述业务服务的主进程的资源使用情况进行监控,以获取所述主进程的第二资源使用数据。
可选的,所述分发模块710,还用于向每个节点分发用于生成所述数据回传网页的网页服务程序。
可选的,所述分发模块710,进一步用于:
向所述集群中各主节点下发所述网页服务程序,由所述主节点继续向隶属于所述主节点的各节点下发所述网页服务程序。
可选的,所属装置700还包括:
扩容监控模块,用于监控所述集群的扩容信息,以获取所述集群中扩容所新增的每个第一节点以及所述第一节点上所部署的第一实例;以及
所述分发模块710,还用于向所述第一节点分发所述资源监控工具,以获取所述第一节点的资源使用数据。
可选的,所属装置700还包括:
存储模块,用于在从所述数据回传网页上下载所述资源使用数据之后,从所述资源使用数据中提取元数据,并对所述元数据进行落地存储。
可选的,所属装置700还包括:
可视化模块,用于在所述对所述元数据进行落地存储之后,根据提取的所述元数据生成所述从节点的可视化数据结果。
需要说明的是,前述对集群的资源监控方法实施例的解释说明也适用于该实施例的集群的资源监控装置,其实现原理类似,此处不再赘述。
本申请实施例的技术方案,通过向集群中的各节点分发资源监控工具,以利用资源监控工具收集每个节点的资源使用数据,基于资源使用数据生成数据回传网页,并回传数据回传网页,以从数据回传网页上下载资源使用数据。由此,实现通过向集群中节点分发监控资源工具,获取集群中每个节点的资源使用数据,并控制每个节点通过回传数据回传网页回传资源使用数据,不仅根据资源使用数据对集群中每个节点的资源使用情况进行有效监控,还能实现对集群可插拔监控的效果。
本申请实施例还提供了一种集群。如图8所示,该集群800包括:多个节点810和本申请任一项所述的集群的资源监控装置700。
本申请实施例的技术方案,通过向集群中的各节点分发资源监控工具,以利用资源监控工具收集每个节点的资源使用数据,基于资源使用数据生成数据回传网页,并回传数据回传网页,以从数据回传网页上下载资源使用数据。由此,实现通过向集群中节点分发监控资源工具,获取集群中每个节点的资源使用数据,并控制每个节点通过回传数据回传网页回传资源使用数据,不仅根据资源使用数据对集群中每个节点的资源使用情况进行有效监控,还能实现对集群可插拔监控的效果。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图9所示,是根据本申请实施例的集群的资源监控方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图9所示,该电子设备包括:一个或多个处理器901、存储器902,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。
存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的集群的资源监控方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的集群的资源监控方法。
存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的集群的资源监控方法对应的程序指令/模块(例如,分发模块710、资源监控模块720、生成模块730和下载模块740)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的集群的资源监控方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用于集群的资源监控的电子设备的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至用于集群的资源监控的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
集群的资源监控方法的电子设备还可以包括:输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。
输入装置903可接收输入的数字或字符信息,以及产生与网页音频直播的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
本申请实施例的技术方案,根据提取的当前视频帧的视频显示时间戳和当前音频帧的音频显示时间戳,确定当前视频帧和当前音频帧不同步时,对当前音频帧进行处理,以使当前视频帧与处理后的当前音频帧同步。由此,实现在音视频播放不同步过程中,通过对音频进行处理,保留视频信息,提高视觉信息的完整性。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (23)
1.一种集群的资源监控方法,其中,包括:
向集群中的每个节点分发资源监控工具;
针对每个所述节点,启动所述资源监控工具,通过所述资源监控工具对所述节点的资源使用情况进行监控;
利用监控到的所述节点的资源使用数据,生成数据回传网页并回传;以及
从所述数据回传网页上下载所述资源使用数据。
2.根据权利要求1所述的集群的资源监控方法,其中,所述资源监控工具包括第一资源监控程序和第二资源监控程序,所述通过所述资源监控工具对所述节点的资源使用情况进行监控,包括:
针对每个节点,调用所述第一资源监控程序,对所述节点上实例的资源使用情况进行监控,以获取所述实例的第一资源使用数据;以及
调用所述第二资源监控程序,对所述节点上正在运行的业务服务的主进程进行资源使用情况进行监控,以获取所述主进程的第二资源使用数据。
3.根据权利要求2所述的集群的资源监控方法,其中,所述向集群中的节点分发资源监控工具,包括:
向所述集群中的主节点分发所述资源监控工具,并由所述主节点继续向隶属于所述主节点的各节点下发所述资源监控工具。
4.根据权利要求3所述的集群的资源监控方法,其中,所述主节点上部署有所述第一资源监控程序和所述第二资源监控程序,而隶属于所述主节点的各节点上仅部署有所述第一资源监控程序。
5.根据权利要求4所述的集群的资源监控方法,其中,所述调用所述第二资源监控程序,对所述节点上正在运行的业务服务的主进程进行资源使用情况进行监控,以获取第二资源使用数据,包括:
获取各节点上正在运行的所述业务服务;
获取所述业务服务的主进程;以及
调用部署在所述主节点上的所述第二资源监控程序,分别对所述主节点和隶属于所述主节点的各节点上的所述业务服务的主进程的资源使用情况进行监控,以获取所述主进程的第二资源使用数据。
6.根据权利要求1-5任一项所述的集群的资源监控方法,其中,还包括:
向每个节点分发用于生成所述数据回传网页的网页服务程序。
7.根据权利要求6所述的集群的资源监控方法,其中,所述向每个节点分发用于生成所述数据回传网页的网页服务程序,包括:
向所述集群中各主节点下发所述网页服务程序,由所述主节点继续向隶属于所述主节点的各节点下发所述网页服务程序。
8.根据权利要求1-5任一项所述的集群的资源监控方法,其中,还包括:
监控所述集群的扩容信息,以获取所述集群中扩容所新增的每个第一节点以及所述第一节点上所部署的第一实例;以及
向所述第一节点分发所述资源监控工具,以获取所述第一节点的资源使用数据。
9.根据权利要求1-6任一项所述的集群的资源监控方法,其中,所述从所述数据回传网页上下载所述资源使用数据之后,还包括:
从所述资源使用数据中提取元数据,并对所述元数据进行落地存储。
10.根据权利要求9所述的集群的资源监控方法,其中,所述对所述元数据进行落地存储之后,还包括:
根据提取的所述元数据生成所述节点的可视化数据结果。
11.一种集群的资源监控装置,其中,包括:
分发模块,用于向集群中的每个节点分发资源监控工具;
资源监控模块,用于针对每个所述节点,启动所述资源监控工具,通过所述资源监控工具对所述节点的资源使用情况进行监控;
生成模块,用于利用监控到的所述节点的资源使用数据,生成数据回传网页并回传;以及
下载模块,用于从所述数据回传网页上下载所述资源使用数据。
12.根据权利要求11所述的集群的资源监控装置,其中,所述资源监控工具包括第一资源监控程序和第二资源监控程序,所述资源监控模块,包括:
第一监控单元,用于针对每个节点,调用所述第一资源监控程序,对所述节点上实例的资源使用情况进行监控,以获取所述实例的第一资源使用数据;以及
第二监控单元,用于调用所述第二资源监控程序,对所述节点上正在运行的业务服务的主进程进行资源使用情况进行监控,以获取所述主进程的第二资源使用数据。
13.根据权利要求12所述的集群的资源监控装置,其中,所述分发模块,进一步用于:
向所述集群中的主节点分发所述资源监控工具,并由所述主节点继续向隶属于所述主节点的各节点下发所述资源监控工具。
14.根据权利要求13所述的集群的资源监控装置,其中,所述主节点上部署有所述第一资源监控程序和所述第二资源监控程序,而隶属于所述主节点的各节点上仅部署有所述第一资源监控程序。
15.根据权利要求14所述的集群的资源监控装置,其中,所述第二监控单元,包括:
第一获取子单元,用于获取各节点上正在运行的所述业务服务;
第二获取子单元,用于获取所述业务服务的主进程;以及
监控子单元,用于调用部署在所述主节点上的所述第二资源监控程序,分别对所述主节点和隶属于所述主节点的各节点上的所述业务服务的主进程的资源使用情况进行监控,以获取所述主进程的第二资源使用数据。
16.根据权利要求11-15任一项所述的集群的资源监控装置,其中,所述分发模块,还用于向每个节点分发用于生成所述数据回传网页的网页服务程序。
17.根据权利要求16所述的集群的资源监控装置,其中,所述分发模块,进一步用于:
向所述集群中各主节点下发所述网页服务程序,由所述主节点继续向隶属于所述主节点的各节点下发所述网页服务程序。
18.根据权利要求11-15任一项所述的集群的资源监控装置,其中,还包括:
扩容监控模块,用于监控所述集群的扩容信息,以获取所述集群中扩容所新增的每个第一节点以及所述第一节点上所部署的第一实例;以及
所述分发模块,还用于向所述第一节点分发所述资源监控工具,以获取所述第一节点的资源使用数据。
19.根据权利要求11-15任一项所述的集群的资源监控装置,其中,还包括:
存储模块,用于在从所述数据回传网页上下载所述资源使用数据之后,从所述资源使用数据中提取元数据,并对所述元数据进行落地存储。
20.根据权利要求19所述的集群的资源监控装置,其中,还包括:
可视化模块,用于在所述对所述元数据进行落地存储之后,根据提取的所述元数据生成所述从节点的可视化数据结果。
21.一种集群,其中,包括:多个节点和如权利要求11-20任一项所述的集群的资源监控装置。
22.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的集群的资源监控方法。
23.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的集群的资源监控方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010605264.5A CN111966558A (zh) | 2020-06-29 | 2020-06-29 | 集群的资源监控方法、装置、集群、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010605264.5A CN111966558A (zh) | 2020-06-29 | 2020-06-29 | 集群的资源监控方法、装置、集群、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111966558A true CN111966558A (zh) | 2020-11-20 |
Family
ID=73360770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010605264.5A Pending CN111966558A (zh) | 2020-06-29 | 2020-06-29 | 集群的资源监控方法、装置、集群、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111966558A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112328372A (zh) * | 2020-11-27 | 2021-02-05 | 新华智云科技有限公司 | 一种kubernetes节点自愈方法和系统 |
CN112965756A (zh) * | 2021-01-21 | 2021-06-15 | 北京达佳互联信息技术有限公司 | 页面资源加载量的监测方法、装置、电子设备及存储介质 |
CN114826905A (zh) * | 2022-03-31 | 2022-07-29 | 西安超越申泰信息科技有限公司 | 一种下层节点切换管理服务的方法、系统、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8706798B1 (en) * | 2013-06-28 | 2014-04-22 | Pepperdata, Inc. | Systems, methods, and devices for dynamic resource monitoring and allocation in a cluster system |
CN108829509A (zh) * | 2018-05-03 | 2018-11-16 | 山东汇贸电子口岸有限公司 | 基于国产cpu和操作系统的分布式容器集群框架资源管理方法 |
US10560353B1 (en) * | 2014-09-16 | 2020-02-11 | Amazon Technologies, Inc. | Deployment monitoring for an application |
-
2020
- 2020-06-29 CN CN202010605264.5A patent/CN111966558A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8706798B1 (en) * | 2013-06-28 | 2014-04-22 | Pepperdata, Inc. | Systems, methods, and devices for dynamic resource monitoring and allocation in a cluster system |
US10560353B1 (en) * | 2014-09-16 | 2020-02-11 | Amazon Technologies, Inc. | Deployment monitoring for an application |
CN108829509A (zh) * | 2018-05-03 | 2018-11-16 | 山东汇贸电子口岸有限公司 | 基于国产cpu和操作系统的分布式容器集群框架资源管理方法 |
Non-Patent Citations (1)
Title |
---|
刘婧珏;: "基于SaaS的云平台物理资源监控与调度系统研究", 呼伦贝尔学院学报, no. 05, 30 October 2018 (2018-10-30) * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112328372A (zh) * | 2020-11-27 | 2021-02-05 | 新华智云科技有限公司 | 一种kubernetes节点自愈方法和系统 |
CN112965756A (zh) * | 2021-01-21 | 2021-06-15 | 北京达佳互联信息技术有限公司 | 页面资源加载量的监测方法、装置、电子设备及存储介质 |
CN112965756B (zh) * | 2021-01-21 | 2023-09-26 | 北京达佳互联信息技术有限公司 | 页面资源加载量的监测方法、装置、电子设备及存储介质 |
CN114826905A (zh) * | 2022-03-31 | 2022-07-29 | 西安超越申泰信息科技有限公司 | 一种下层节点切换管理服务的方法、系统、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753997B (zh) | 分布式训练方法、系统、设备及存储介质 | |
CN111966558A (zh) | 集群的资源监控方法、装置、集群、设备和介质 | |
CN108513657B (zh) | 数据转换方法及备份服务器 | |
CN111897638B (zh) | 分布式任务调度方法及系统 | |
CN107800565B (zh) | 巡检方法、装置、系统、计算机设备和存储介质 | |
WO2016045403A1 (zh) | 运行环境的配置方法及装置、系统 | |
CN113742031B (zh) | 节点状态信息获取方法、装置、电子设备及可读存储介质 | |
CN111694646A (zh) | 资源调度方法、装置、电子设备及计算机可读存储介质 | |
CN111913884A (zh) | 分布式测试方法、装置、设备、系统和可读存储介质 | |
CN111835592B (zh) | 用于确定健壮性的方法、装置、电子设备及可读存储介质 | |
JP2016103144A (ja) | 仮想マシン配備方法、仮想マシン配備プログラム及び仮想マシン配備システム | |
CN110727557A (zh) | 日志采集器的管控方法、平台、电子设备及存储介质 | |
CN110874272A (zh) | 资源配置方法及装置、计算机可读存储介质、电子设备 | |
WO2019027597A1 (en) | WORKFLOW MANAGEMENT FRAMEWORK | |
CN111510480B (zh) | 一种请求发送方法、装置以及第一服务器 | |
CN112202746A (zh) | Rpc成员信息获取方法、装置、电子设备和存储介质 | |
CN111740859A (zh) | 一种测试环境的部署方法、装置、电子设备及存储介质 | |
CN105591782A (zh) | 测试设备的管理方法及装置 | |
CN110659184B (zh) | 健康状态检查方法、装置及系统 | |
CN112395126A (zh) | 故障日志处理方法、装置、电子设备和存储介质 | |
CN112084000A (zh) | 容器集群的测试方法和装置 | |
US20220405115A1 (en) | Server and application monitoring | |
CN111597026B (zh) | 用于获取信息的方法及装置 | |
González et al. | HerdMonitor: monitoring live migrating containers in cloud environments | |
CN111858260A (zh) | 信息显示方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |