CN114185734B - 一种监控集群的方法、装置及电子设备 - Google Patents

一种监控集群的方法、装置及电子设备 Download PDF

Info

Publication number
CN114185734B
CN114185734B CN202111428567.5A CN202111428567A CN114185734B CN 114185734 B CN114185734 B CN 114185734B CN 202111428567 A CN202111428567 A CN 202111428567A CN 114185734 B CN114185734 B CN 114185734B
Authority
CN
China
Prior art keywords
application
cluster
agent
storage
instance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111428567.5A
Other languages
English (en)
Other versions
CN114185734A (zh
Inventor
陈晓有
彭云鹏
李杨
张楠浠
高宇健
郭志越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111428567.5A priority Critical patent/CN114185734B/zh
Publication of CN114185734A publication Critical patent/CN114185734A/zh
Priority to PCT/CN2022/111163 priority patent/WO2023093127A1/zh
Application granted granted Critical
Publication of CN114185734B publication Critical patent/CN114185734B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Abstract

本公开提供了一种监控集群的方法、装置及电子设备,涉及云技术领域,尤其涉及数据监控技术领域。具体实现方案为:创建文件存储实例,将所述文件存储实例挂载至第一目录;其中,所述第一目录由集群中的至少一个节点创建;基于所述文件存储实例部署应用性能监控平台;响应于所述集群中的任意节点部署应用,配置所述应用的参数,以使所述应用基于所述第一目录存储的数据运行;所述应用性能监控平台监控运行所述应用产生的数据。

Description

一种监控集群的方法、装置及电子设备
技术领域
本公开涉及云计算技术领域,尤其涉及数据监控技术领域的监控集群的方法、装置及电子设备。
背景技术
随着云计算技术的发展,通常利用kubernetes等集群高效地管理应用;由于集群内部的调用链路复杂,因此可通过分布式性能监控工具(Pinpoint)对运行应用所产生的数据进行监控,以实现对集群的全链路追踪。在大数据时代,Pinpoint如何高效地对应用所产生的数据进行监控是一直追求的目标。
发明内容
本公开提供了一种监控集群的方法、装置及电子设备。
根据本公开的第一方面,提供了一种监控集群的方法,包括:
创建文件存储实例,将所述文件存储实例挂载至第一目录;其中,
所述第一目录由集群中的至少一个节点创建;
基于所述文件存储实例部署应用性能监控平台;
响应于所述集群中的任意节点部署应用,配置所述应用的参数,以使所述应用基于所述第一目录存储的数据运行;
所述应用性能监控平台监控运行所述应用产生的数据。
根据本公开的第二方面,提供了一种监控集群的装置,所述装置包括:
实例挂载模块,用于创建文件存储实例,将所述文件存储实例挂载至第一目录;其中,所述第一目录由集群中的至少一个节点创建;
部署模块,用于基于所述文件存储实例部署应用性能监控平台;
配置模块,用于响应于所述集群中的任意节点部署应用,配置所述应用的参数,以使所述应用基于所述第一目录存储的数据运行;
监控模块,用于监控运行所述应用产生的数据。
根据本公开的第三方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的监控集群的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述的监控集群的方法。
根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令在被处理器执行时实现根据上述的监控集群的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开实施例提供的k8s集群的架构示意图;
图2是本公开实施例提供的Pinpoint的组成结构示意图;
图3是本公开实施例提供的监控集群的方法的一种可选处理流程示意图;
图4是本公开实施例提供的监控集群的系统的一种可选示意图;
图5是本公开实施例提供的监控集群的装置的一种可选组成结构示意图;
图6是用来实现本公开实施例的监控集群的方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本公开实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本公开的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本公开实施例的目的,不是旨在限制本公开。
在对本公开实施例进行详细说明之前,对本公开涉及的名词进行解释。
1)k8s集群:全称kubernetes,用“8”代替8个字符"ubernete"而成的缩写;作为一个开源的、用于管理云平台中多个主机上的容器化的应用,kubernetes的目标是让部署容器化的应用部署和运维更加方便。
k8s集群的架构示意图,如图1所示,包括Master节点和Node节点;其中,Master节点是k8s集群的控制节点,用于管理和控制k8s集群,接收并执行k8s集群中的控制命令。k8s集群中除了Master以外的节点被称为Node节点(也可称为Worker节点)。每个Node节点都会被Master节点分配一些工作负载(如Docker容器),用于运行容器化的应用,并向Master上报容器的状态,根据Master的要求管理容器的生命周期;Node节点在Linux的操作系统上可以是物理机或者虚拟机。k8s集群的最小工作单元是Pod,Pod是若干相关容器的组合,通常一个pod里的多个容器运行的相同的应用。
2)Pinpoint:是一款全链路分析工具,提供了无侵入式的调用链监控、方法执行详情查看、应用状态信息监控等功能;具体的,Pinpoint能够提供服务拓扑图,对整个系统中应用的调用关系进行了可视化的展示,单击某个服务节点,可以显示该节点的详细信息,比如当前节点状态、请求数量等;Pinpoint能够提供实时活跃线程图,监控应用内活跃线程的执行情况,对应用的线程执行性能可以有比较直观的了解。Pinpoint能够提供请求响应散点图:以时间维度进行请求计数和响应时间的展示,拖过拖动图表可以选择对应的请求查看执行的详细情况。Pinpoint能够提供请求调用栈查看,对分布式环境中每个请求提供了代码维度的可见性,可以在页面中查看请求针对到代码维度的执行详情,帮助查找请求的瓶颈和故障原因。Pinpoint能够提供应用状态、机器状态检查,通过这个功能可以查看相关应用程序的其他的一些详细信息,比如中央处理器(Central Processing Unit,CPU)的使用情况,内存状态、垃圾收集状态,每秒处理事务的数量(Transactions Per Second,TPS)和Java虚拟机(Java Virtual Machine,JVM)的信息等参数。
Pinpoint的组成结构示意图,如图2所示,Pinpoint主要由3个组件以及Hbase数据库组成,三个组件分别为:代理器(Pinpoint-Agent)、收集器(Pinpoint-Collector)和WebUI。其中,Pinpoint-Agent:用于收集应用端监控数据,具体的,可通过无侵入式的方式,在启动命令中加入部分参数实现对应用端监控数据的收集。Pinpoint-Collector:作为数据收集模块,用于接收Pinpoint-Agent发送过来的监控数据,并存储到HBase。WebUI:作为监控展示模块,用于展示系统调用关系、调用详情、应用状态等,并支持报警等功能。
3)文件存储(Cloud File Storage,CFS),用于提供安全可靠、可扩展的共享文件存储服务。CFS可与云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。
相关技术中,利用Pinpoint监控部署在k8s集群上的应用时,需要在k8s集群的每台宿主机上都部署Pinpoint-Agent组件。在k8s集群中的节点比较多的情况下,将消耗大量的时间用于宿主机登录、文件复制等重复性的工作上。另外,若需要对Pinpoint-Agent组件的版本进行升级,则需分别登录每台宿主机,对每台宿主机上的Pinpoint-Agent组件进行更新,导致Pinpoint-Agent组件的运维成本高昂。
本公开提供一种监控集群的方法,包括:创建文件存储实例,将所述文件存储实例挂载至第一目录;其中,所述第一目录由集群中的至少一个节点创建;基于所述文件存储实例部署应用性能监控平台;响应于所述集群中的任意节点部署应用,配置所述应用的参数,以使所述应用基于所述第一目录存储的数据运行;所述应用性能监控平台监控运行所述应用产生的数据。基于文件存储(CFS)实例部署应用性能监控平台(Pinpoint),使得集群中的全部节点共用一个Pinpoint-Agent组件,节省了每个节点均需要部署一个Pinpoint-Agent组件带来的宿主机登录、复制文件等工作所消耗的时间。并且,在对Pinpoint-Agent组件更新时,仅需对集群中的全部节点共用的一个Pinpoint-Agent组件进行更新即可,降低Pinpoint-Agent组件的运维成本。
为进一步说明本申请实施例提供的技术方案,下面结合附图以及具体实施方式对此进行详细的说明。虽然本公开实施例提供了如下实施例或附图所示的方法操作步骤,但基于常规或者无需创造性的劳动在方法中可以包括更多或者更少的操作步骤。在逻辑上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。方法在实际的处理过程中或者控制设备执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。
图3是本公开提供的监控集群的方法的一种可选处理流程示意图,监控集群的方法至少可以包括以下步骤:
步骤S201,创建文件存储实例,将所述文件存储实例挂载至第一目录;其中,所述第一目录由集群中的至少一个节点创建。
在一些可选实施例中,创建CFS实例也可以称为创建文件系统;在具体实施时,可通过配置文件系统名称、区域、可用区、协议类型、自定义容量和容量上限等参数来创建CFS实例。其中,文件系统名称,可根据用户的需求设置;区域,为该文件系统创建所在的地域;可用区,可根据用户的需求设置,每一个地域中都包括若干个可用区,CFS实例的可用区可与虚拟机或容器在同一可用区,以避免跨可用区产生的时延;协议类型,包括CFS支持的NFS和SMB两种协议,可根据用户的需求设置。自定义容量,可根据用户的需求判断是否开启自定义容量,开启自定义容量后需要用户手动调整容量上限;容量上限,是指当实际使用容量达到该值时,将无法对文件系统进行写入操作,需要进行容量变更。
在一些可选实施例中,将所述文件存储实例挂载至第一目录的实现过程包括:添加所述文件存储实例的挂载点;在所述集群中创建存储资源和存储声明,基于所述存储资源和存储声明将所述文件存储实例挂载至所述第一目录。
在具体实施时,文件系统创建完成后,云平台上的虚拟机、容器等计算资源需要通过挂载点挂载至文件系统,因此需要为文件系统添加挂载点。具体的,集群中的每个节点均可创建同一个目录,将该目录作为挂载点,
在具体实施时,可通过动态PV/PVC的方式挂载CFS实例;具体的,在集群中创建存储资源和存储声明时,可使用kubectl执行kubectl create-fpv-cfs.yaml完成PV的创建。之后,建立一个能够与该PV绑定的PVC;可使用kubectl执行kubectl create-f pvc-cfs.yaml完成PVC的创建。最后,通过在Podspec内指定相应的PVC名称,使用kubectl执行kubectl create-f demo-cfs-pod.yaml完成Pod的创建;Pod创建后,可以读写容器内的/cfs-volume路径来访问相应的CFS存储上的内容。另外,在创建PV和PVC时指定了accessModes为ReadWriteMany,则PVC可以被多个节点上的Pod挂载读写。
其中,存储资源(PersistentVolume,PV)可以是集群内的存储资源,例如节点是集群的资源。PV根据不同的存储类型(StorageClass)创建不同类型的PV。存储声明(PersistentVolumeClaim,PVC)可以是指集群内的存储请求。例如,PV是Pod的使用节点资源,PVC则声明使用PV资源。当PV资源不足时,PVC也可以动态创建PV。StorageClass描述存储的类型,集群管理员可以为集群定义不同的存储类别,通过StorageClass配合PVC可以动态创建需要的存储资源。
本公开实施例中,对集群的种类不做限定,可以是k8s集群,也可以是作为示例,集群为k8s集群,k8s集群中的每个节点均创建第一目录,如第一目录为:/home/cfs;/home/cfs作为挂载点,将CFS实例(文件系统)挂载至/home/cfs。其中,/home/cfs为本地目录,也是CFS实例的挂载目录,存储在/home/cfs下的文件可以认为是存放在文件系统中的文件。如此,k8s集群中的多个节点共享一份k8sPinpoint-Agent组件,k8s集群中的多个节点均能访问该CFS实例(文件系统)中存放的文件;避免k8s集群中的每个节点均分别访问与自身对应的一个CFS实例中的文件所导致的频繁登录宿主机、文件复制等导致的时延,进而高效地对应用产生的数据进行监控。并且,在需要对Pinpoint-Agent组件的版本进行升级时,仅需对这一个Pinpoint-Agent组件进行更新,相较于现有技术中需要对每个节点分别对应的Pinpoint-Agent组件进行更新,极大地降低了Pinpoint-Agent组件的运维成本。
步骤S202,基于文件存储实例部署应用性能监控平台。
在一些可选实施例中,基于文件存储实例部署应用性能监控平台(Pinpoint)的实现过程,可以包括:基于挂载所述文件存储实例的所述第一目录,安装所述应用性能监控平台中的代理器;配置所述代理器的参数,以建立所述代理器与所述应用性能监控平台中的收集器的对应关系。
在具体实施时,基于挂载所述文件存储实例的所述第一目录,安装所述应用性能监控平台中的代理器的具体实现过程可以是:进入CFS的挂载目录,基于所述目录存储的数据下载相应的代理器(Pinpoint-Agent)版本,并解压、安装该版本的Pinpoint-Agent。其中,Pinpoint-Agent的版本与Pinpoint-Collector的版本相匹配。
在具体实施时,配置所述代理器的参数的具体实现过程可以是,修改所述代理器的第一参数为所述收集器(Pinpoint-Collector)的地址,所述第一参数可以为profiler.collector.ip参数,即将profiler.collector.ip参数修改为Collector对应的IP地址。
在一些实施例中,可以通过Doceker为k8s集群中的多个节点部署Pinpoint,并在部署Pinpoint成功后,记录Pinpoint的服务器地址以及补助路径。通过为k8s集群中的多个节点部署Pinpoint,使得Pinpoint能够为k8s集群中的多个节点服务,如监控k8s集群中的节点的调用链路。
步骤S203,响应于所述集群中的任意节点部署应用,配置所述应用的参数,以使所述应用基于所述第一目录存储的数据运行。
在一些实施例中,可以在集群中的一个以上的节点部署应用,以使节点内的容器运行应用。
在具体实施时,可以通过修改应用资源描述文件和文本文件应用的参数。其中,修改应用资源描述文件包括:配置所述应用对应的卷为第一目录,基于所述文件存储示例配置所述存储声明的名称。具体地,可通过修改应用资源描述文件中的Pod Spec中的volumeMounts参数为第一目录,实现将所述应用对应的卷配置为第一目录;其中,第一目录可以是Pinpoint-Agent的存储路径。通过配置yaml文件中的volumeMounts参数为Pinpoint-Agent的存储路径,使得k8s集群中的每个节点都能够使用Pinpoint-Agent。基于所述文件存储实例配置所述存储声明的名称可以是将PVC声明的名称配置为“cfs-pvc”。修改应用资源描述文件还可以包括:配置hostPath,使得Node上的文件系统挂载在Pod中,实现Pod能够使用Node上的文件。其中,修改文本文件可以是指在所述应用对应的文本文件中添加用于指示所述代理器的存储路径为所述第一目录;如文本文件为Dockerfile,则修改Dockerfile中的启动指令(ENTRYPOINT),在应用启动时添加javaageent参数,并将javaageent参数的值设置为Pinpoint-Agent的完整路径,表示在启动应用的时候植入pinpoint探针,以指定PinPoint代理。
在具体实施时,基于所述文件存储示例配置所述存储声明的名称,可以是指将PVC的名称指定为与CFS实例的名称相关的名称,如将PVC声明的名称配置为“cfs-pvc”。
步骤S204,应用性能监控平台监控运行应用产生的数据。
在一些实施例中,首先,集群节点上的容器读取第一目录中存储的数据,并基于所述数据运行应用。之后,Pinpoint监控运行应用产生的数据。
在具体实施时,性能监控平台包括的代理器获取运行应用产生的数据;代理器将所述应用产生的数据发送至应用性能监控平台包括的收集器;应用性能监控平台中的数据库存储所述应用产生的数据;所述应用性能监控平台基于所述应用产生的数据展示所述应用的调用信息以及应用状态。作为示例,Pinpoint-Agent获取运行应用产生的数据,Pinpoint-Agent将获取的数据发送至Pinpoint-Collector,Pinpoint中的Hbase存储运行应用产生的数据,WebUI基于应用产生的数据展示应用的调用信息以及应用状态;其中,应用的调用信息可以包括应用的调用关系以及调用详情。WebUI还可以基于提供报警功能,如应用程序运行错误时,发送报警信息。
本公开提供的监控集群的方法可以基于监控集群的系统实现,本公开提供的监控集群的系统的一种可选示意图,如图4所示,包括:k8s集群,CFS以及Pinpoint。其中,k8s集群中包括N个节点,每个节点内的Pod中的容器运行应用,节点1运行应用1,节点2运行应用2,节点3运行应用3;k8s集群中的每个节点都创建根目录/home/cfs,并将创建的CFS实例挂载至根目录/home/cfs;如此,k8s集群中的每个节点都可以访问CFS实例中存放的文件。通过创建CFS实例,以及部署CFS实例的挂载点为k8s集群中的多个节点所创建的根目录,使得k8s集群中的多个节点都能够共享Pinpoint中的Pinpoint-Agent。通过Docker的方式在k8s集群中的任意一个节点上部署Pinpoint服务,在根目录/home/cfs下下载、解压和安装Pinpoint包括的Pinpoint-Agent;同时,Pinpoint-Agent的版本参数与Pinpoint-Collector的版本参数匹配或一致,实现了Pinpoint-Agent与Pinpoint-Collector的一致性,使得Pinpoint-Agent能够成功连接到Pinpoint-Collector,实现Pinpoint-Agent将采集到的数据传输至Pinpoint-Collector。
在具体实施时,针对不同的云管理控制系统,创建CFS实例的具体流程不同。以某一云管理控制系统为例,第一步,在该云管理控制系统的首页中通过点击“文件系统CFS”下属的“文件系统列表”进入文件系统创建页面;并在文件系统创建页面上点击“新建文件系统”,点击“新建文件系统”后显示弹窗;在弹框中进行创建文件系统的各项参数配置,完成文件系统的创建。
在具体实施时,针对不同的云管理控制系统,添加CFS实例挂载点的具体流程不同。以某一云管理控制系统为例,添加CFS实例挂载点的具体流程可以是:点击“文件系统列表”的操作栏中的“添加挂载点”按钮,或者点击“文件系统分列表”中的“挂载点”对应的“数量统计”按钮,便可打开用于添加挂载点的页面。
本公开实施例提供的监控集群的方法,集群中的多个点均可创建第一目录,并将创建的CFS实例挂载至第一目录;如此,能够实现集群中的多个节点均能访问CFS实例中存放的文件,集群中的多个节点共享一个Pinpoint-Agent;与现有技术中每个节点分别对应一个Pinpoint-Agent,多个节点对应多个Pinpoint-Agent相比,能够避免集群中的每个节点均分别访问与自身对应的一个CFS实例中的文件所导致的频繁登录宿主机、文件复制等导致的时延,进而高效地对应用产生的数据进行监控。由于本公开实施例中仅需维护一个Pinpoint-Agent,在需要对Pinpoint-Agent组件的版本进行升级时,仅需对这一个Pinpoint-Agent组件进行更新,相较于现有技术中需要对每个节点分别对应的Pinpoint-Agent组件进行更新,极大地降低了Pinpoint-Agent组件的运维成本。另外,本公开实施例中,在第一目录中下载、解压和安装的Pinpoint-Agent组件的版本是与Pinpoint-Collector相匹配的,因此,能够成功地建立Pinpoint-Agent与Pinpoint-Collector的连接,实现数据在Pinpoint内的有效传输。
本公开实施例还提供一种监控集群的装置,所述监控集群的装置的一种可选组成结构示意图,如图5所示,监控集群的装置300包括:
实例挂载模块301,用于创建文件存储实例,将所述文件存储实例挂载至第一目录;其中,所述第一目录由集群中的至少一个节点创建;
部署模块302,用于基于所述文件存储实例部署应用性能监控平台;
配置模块303,用于响应于所述集群中的任意节点部署应用,配置所述应用的参数,以使所述应用基于所述第一目录存储的数据运行;
监控模块304,用于监控运行所述应用产生的数据。
在一些可选实施例中,实例挂载模块301,用于添加所述文件存储实例的挂载点;在所述集群中创建存储资源和存储声明,基于所述存储资源和存储声明将所述文件存储实例挂载至所述第一目录。
在一些可选实施例中,部署模块302,用于基于挂载所述文件存储实例的所述第一目录,安装所述应用性能监控平台中的代理器;配置所述代理器的参数,以建立所述代理器与所述应用性能监控平台中的收集器的对应关系。
在一些可选实施例中,配置模块303,用于修改所述代理器的第一参数为所述收集器的地址。
在一些可选实施例中,配置模块303,用于配置所述应用对应的卷为第一目录;基于所述文件存储示例配置所述存储声明的名称。
在一些可选实施例中,配置模块303,用于在所述应用对应的文本文件中添加用于指示所述代理器的存储路径为所述第一目录的参数。
在一些可选实施例中,监控模块304,用于读取所述第一目录中存储的数据;基于所述数据运行所述应用。
在一些可选实施例中,监控模块304的功能可以由应用性能监控平台实现;所述应用性能监控平台包括的代理器获取运行所述应用产生的数据;
所述代理器将所述应用产生的数据发送至所述应用性能监控平台包括的收集器;所述应用性能监控平台中的数据库存储所述应用产生的数据;所述应用性能监控平台基于所述应用产生的数据展示所述应用的调用信息以及应用状态。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品,所述电子设备包括本公开实施例提供的监控集群的装置。
图6示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。在一些实施例中,电子设备800可以是终端设备,也可以是服务器。在一些实施例中,电子设备800可以通过运行计算机程序来实现本申请实施例提供的监控集群的方法,例如,计算机程序可以是操作系统中的原生程序或软件模块;可以是本地(Native)应用程序(Application,APP),即需要在操作系统中安装才能运行的程序;也可以是小程序,即只需要下载到浏览器环境中就可以运行的程序;还可以是能够嵌入至任意APP中的小程序。总而言之,上述计算机程序可以是任意形式的应用程序、模块或插件。
在实际应用中,电子设备800可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器,其中,云技术(Cloud Technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。电子设备800可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能电视、智能手表等,但并不局限于此。
电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备、车载终端和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,电子设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储电子设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
电子设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许电子设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如监控集群的方法。例如,在一些实施例中,监控集群的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到电子设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的监控集群的方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为监控集群的方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的交通识别限制方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (7)

1.一种监控集群的方法,包括:
创建文件存储实例,添加所述文件存储实例的挂载点;在集群中创建存储资源和存储声明,基于所述存储资源和所述存储声明将所述文件存储实例挂载至第一目录下的文件存储系统 CFS;其中,所述第一目录由所述集群中的至少一个节点创建,所述第一目录为所述集群的本地目录;
基于挂载所述文件存储实例的所述第一目录,安装应用性能监控平台中的代理器;
修改所述代理器的第一参数为所述应用性能监控平台中的收集器的地址,以建立所述代理器与所述收集器的对应关系;
响应于所述集群中的任意节点部署应用,在所述应用对应的文本文件中添加用于指示所述代理器的存储路径为所述第一目录的参数,以使所述应用基于所述第一目录存储的数据运行;
所述应用性能监控平台监控运行所述应用产生的数据。
2.根据权利要求1所述的方法,其中,所述方法还包括:
配置所述应用对应的卷为所述第一目录;
基于所述文件存储实例配置所述存储声明的名称。
3.根据权利要求1或2所述的方法,其中,所述应用性能监控平台监控运行所述应用产生的数据之前,所述方法还包括:
所述节点上的容器读取所述第一目录中存储的数据;
所述容器基于所述数据运行所述应用。
4.根据权利要求1所述的方法,其中,所述应用性能监控平台监控运行所述应用产生的数据,包括:
所述应用性能监控平台包括的代理器获取运行所述应用产生的数据;
所述代理器将所述应用产生的数据发送至所述应用性能监控平台包括的收集器;
所述应用性能监控平台中的数据库存储所述应用产生的数据;
所述应用性能监控平台基于所述应用产生的数据展示所述应用的调用信息以及应用状态。
5.一种监控集群的装置,所述装置包括:
实例挂载模块,用于创建文件存储实例,添加所述文件存储实例的挂载点;在集群中创建存储资源和存储声明,基于所述存储资源和所述存储声明将所述文件存储实例挂载至第一目录下的文件存储系统CFS;其中,所述第一目录由所述集群中的至少一个节点创建,所述第一目录为所述集群的本地目录;
部署模块,用于基于挂载所述文件存储实例的所述第一目录,安装应用性能监控平台中的代理器;修改所述代理器的第一参数为所述应用性能监控平台中的收集器的地址,以建立所述代理器与所述收集器的对应关系;
配置模块,用于响应于所述集群中的任意节点部署应用,在所述应用对应的文本文件中添加用于指示所述代理器的存储路径为所述第一目录的参数,以使所述应用基于所述第一目录存储的数据运行;
监控模块,用于监控运行所述应用产生的数据。
6. 一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至4中任一项所述的方法。
7.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至4中任一项所述的方法。
CN202111428567.5A 2021-11-26 2021-11-26 一种监控集群的方法、装置及电子设备 Active CN114185734B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111428567.5A CN114185734B (zh) 2021-11-26 2021-11-26 一种监控集群的方法、装置及电子设备
PCT/CN2022/111163 WO2023093127A1 (zh) 2021-11-26 2022-08-09 一种监控集群的方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111428567.5A CN114185734B (zh) 2021-11-26 2021-11-26 一种监控集群的方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN114185734A CN114185734A (zh) 2022-03-15
CN114185734B true CN114185734B (zh) 2023-11-14

Family

ID=80602828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111428567.5A Active CN114185734B (zh) 2021-11-26 2021-11-26 一种监控集群的方法、装置及电子设备

Country Status (2)

Country Link
CN (1) CN114185734B (zh)
WO (1) WO2023093127A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114185734B (zh) * 2021-11-26 2023-11-14 北京百度网讯科技有限公司 一种监控集群的方法、装置及电子设备
CN115118717B (zh) * 2022-06-29 2024-03-15 济南浪潮数据技术有限公司 一种cifs共享挂载方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108471366A (zh) * 2018-02-02 2018-08-31 深圳市康拓普信息技术有限公司 一种面向云原生应用的立体监控系统
CN110888780A (zh) * 2019-11-19 2020-03-17 泰康保险集团股份有限公司 应用监控方法、装置、设备及存储介质
CN112199150A (zh) * 2020-08-13 2021-01-08 北京航空航天大学 一种基于微服务调用依赖感知的在线应用动态扩缩容方法
CN113051122A (zh) * 2019-12-26 2021-06-29 百度在线网络技术(北京)有限公司 性能数据获取方法、装置、电子设备和介质
CN113094238A (zh) * 2021-04-25 2021-07-09 深圳前海微众银行股份有限公司 一种业务系统异常监控方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200092180A1 (en) * 2018-09-14 2020-03-19 Capital One Services, Llc Methods and systems for microservices observability automation
US11146474B2 (en) * 2018-09-28 2021-10-12 Atlassian Pty Ltd. Systems and methods for testing resilience of a distributed network
CN109977093A (zh) * 2019-04-04 2019-07-05 中科创达(重庆)汽车科技有限公司 基于lxc的多虚拟系统查看容器日志的方法及装置
CN110134496A (zh) * 2019-05-22 2019-08-16 中国联合网络通信集团有限公司 容器监控方法、装置、设备及计算机可读存储介质
CN111277460B (zh) * 2020-01-17 2022-02-25 江苏满运软件科技有限公司 一种ZooKeeper容器化控制的方法、装置、存储介质及电子设备
US20210365445A1 (en) * 2020-05-25 2021-11-25 Fortior Solutions, Llc Technologies for collecting, managing, and providing contact tracing information for infectious disease response and mitigation
CN114185734B (zh) * 2021-11-26 2023-11-14 北京百度网讯科技有限公司 一种监控集群的方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108471366A (zh) * 2018-02-02 2018-08-31 深圳市康拓普信息技术有限公司 一种面向云原生应用的立体监控系统
CN110888780A (zh) * 2019-11-19 2020-03-17 泰康保险集团股份有限公司 应用监控方法、装置、设备及存储介质
CN113051122A (zh) * 2019-12-26 2021-06-29 百度在线网络技术(北京)有限公司 性能数据获取方法、装置、电子设备和介质
CN112199150A (zh) * 2020-08-13 2021-01-08 北京航空航天大学 一种基于微服务调用依赖感知的在线应用动态扩缩容方法
CN113094238A (zh) * 2021-04-25 2021-07-09 深圳前海微众银行股份有限公司 一种业务系统异常监控方法及装置

Also Published As

Publication number Publication date
WO2023093127A1 (zh) 2023-06-01
CN114185734A (zh) 2022-03-15

Similar Documents

Publication Publication Date Title
US11842222B2 (en) Using scripts to bootstrap applications with metadata from a template
CN114185734B (zh) 一种监控集群的方法、装置及电子设备
US20020178262A1 (en) System and method for dynamic load balancing
CN111190888A (zh) 一种管理图数据库集群的方法和装置
CN113934464A (zh) Linux系统中启动安卓应用的方法、装置和电子设备
CN107644075B (zh) 收集页面信息的方法和装置
CN113900834B (zh) 基于物联网技术的数据处理方法、装置、设备及存储介质
CN111064626B (zh) 配置更新方法、装置、服务器及可读存储介质
CN111225064A (zh) Ceph集群部署方法、系统、设备和计算机可读存储介质
CN115883407A (zh) 一种数据采集方法、系统、设备及存储介质
CN112860343B (zh) 配置变更方法、系统、装置、电子设备以及存储介质
CN111782341B (zh) 用于管理集群的方法和装置
CN111930565A (zh) 分布式管理系统中组件的进程故障自愈方法、装置及设备
US11777810B2 (en) Status sharing in a resilience framework
CN114070889B (zh) 配置方法、流量转发方法、设备、存储介质及程序产品
CN114756301A (zh) 日志处理方法、装置和系统
CN113138772B (zh) 数据处理平台的构建方法、装置、电子设备和存储介质
CN113747423A (zh) 云手机状态同步方法、装置、设备、存储介质及程序产品
CN110445628B (zh) 基于nginx的服务器及其部署、监控的方法和装置
CN113779122A (zh) 导出数据的方法和装置
CN110768855A (zh) 链路化性能测试的方法和装置
US11330079B2 (en) Environment for developing of distributed multicloud applications
CN117290014A (zh) 一种海外服务器部署方法、装置、设备和介质
CN113918329A (zh) 信息展示方法和装置
CN113220576A (zh) 测试环境的管理方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant