CN115695465A - 可扩展和可插拔式的云原生监控系统平台及其监控方法 - Google Patents

可扩展和可插拔式的云原生监控系统平台及其监控方法 Download PDF

Info

Publication number
CN115695465A
CN115695465A CN202211136807.9A CN202211136807A CN115695465A CN 115695465 A CN115695465 A CN 115695465A CN 202211136807 A CN202211136807 A CN 202211136807A CN 115695465 A CN115695465 A CN 115695465A
Authority
CN
China
Prior art keywords
monitoring
module
file
script
plug
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211136807.9A
Other languages
English (en)
Inventor
未元
柳开弘
杨明
郭界
段然
程致远
谢付波
张世豪
邓云亮
鲜习
罗治港
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial Bank Co Ltd
CIB Fintech Services Shanghai Co Ltd
Original Assignee
Industrial Bank Co Ltd
CIB Fintech Services Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial Bank Co Ltd, CIB Fintech Services Shanghai Co Ltd filed Critical Industrial Bank Co Ltd
Priority to CN202211136807.9A priority Critical patent/CN115695465A/zh
Publication of CN115695465A publication Critical patent/CN115695465A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供了一种可扩展和可插拔式的云原生监控系统平台及其监控方法,包括运营门户子系统、基础组件子系统和实施目标子系统;实施目标子系统通过插件形式运行在监控目标中,根据远程指令,执行脚本或探针程序收集监控目标的运行状态,产生即时性的监控指标数据;基础组件子系统,部署在每个防火墙区域,收集汇总该防火墙区域内所有监控目标即时性的监控指标数据,并进行持久化存储,对外提供查询接口;运营门户子系统对实施目标子系统各监控目标的监控脚本和探针程序进行编辑调动,统一管理基础组件子系统的配置。本发明通过此方案,实现了云原生体系下,大规模计算节点的批量化监控部署、个性化监控配置。

Description

可扩展和可插拔式的云原生监控系统平台及其监控方法
技术领域
本发明涉及云原生监控的技术领域,具体地,涉及一种可扩展和可插拔式的云原生监控系统平台及其监控方法,尤其是,优选的涉及一种可扩展、可插拔式的云原生监控系统平台的实现方案。
背景技术
云原生应用架构下,原有单体系统变成了众多微服务的协作,一个微服务的中断会造成整个系统的中断或使系统处于故障状态。因此,对这些微服务进行监控就成了必要的工作。
指标在生产系统中是必不可少的一部分,是系统稳定运行的重要基础,尤其是在云原生环境下,良好的指标监控系统对云原生应用的高效、平稳运行起到了重要的作用。
公开号为CN113268398A的中国发明专利文献公开了一种云原生数仓的业务监控方法及监控系统,该方法包括:将各个业务领域产生的数据同步到云原生数仓中,基于预先设定的指标计算配置数据从云原生数仓中查询对应的数据并进行指标计算,生成指标数据;根据预设报警规则对所述指标数据进行运算,获取报警信息,并在所述报警信息达到预设的报警阈值时,通知报警接收人。
针对上述中的现有技术,发明人认为目前的云原生监控技术领域,监控系统对监控指标的采集依赖于其所提供的监控指标采集组件,也称为探针(exporter)。对于探针的可扩展性和易用性方面仍存在诸多不足。虽然以普罗米修斯为代表的云原生监控组件,通过活跃的社区为用户提供了多种类型的探针(exporter),但是,仍难以满足大规模企业级场景下的多样化需求,具体来说原因如下:
1、用户下载获取探针(exporter)后需要手动部署安装到监控目标所在的服务器,不便于规模化的管理。目前行业内普遍采用人工运维的方式,管理难度随机器数量和探针数量的增加呈指数型增长,易用性不足。
2、探针(exporter)本身也是一个可运行的程序,若想产生个性化或者定制化的监控指标,则需要对已有探针程序的修改或者重新编写探针程序,对运维人员来说难度较大,可扩展性不足。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种可扩展和可插拔式的云原生监控系统平台及其监控方法。
根据本发明提供的一种可扩展和可插拔式的云原生监控系统平台,包括运营门户子系统、基础组件子系统和实施目标子系统;
所述实施目标子系统通过插件形式运行在监控目标中,根据远程指令,执行脚本或探针程序收集监控目标的运行状态,产生即时性的监控指标数据;
所述基础组件子系统,部署在每个防火墙区域,收集汇总该防火墙区域内所有监控目标即时性的监控指标数据,并进行持久化存储,对外提供查询接口;
所述运营门户子系统对实施目标子系统各监控目标的监控脚本和探针程序进行编辑调动,统一管理基础组件子系统的配置。
优选的,所述实施目标子系统包括监控插件模块;
所述监控插件模块接收远程的指令,对监控探针和公私函脚本进行下载更新和运行调度,并且根据监控脚本运行后的结果,产生即时性的监控指标数据,并对外暴露接口供采集;
所述监控插件模块提供指令接收接口、指令鉴权、公私函脚本结果转换、公私函脚本的运行调度、探针程序的运行调度、脚本的下载更新和探针程序的下载更新。
优选的,所述监控插件模块基于JAVA程序语言编写的WEB应用程序,通过暴露HTTP接口的方式,供远端程序进行指令的传达;
所述监控插件模块的指令鉴权,基于国产哈希算法的签名算法,得到签名的值;
签名的值由指令调用方,放在HTTP请求中的请求头中;
所述监控插件模块重新根据指令HTTP请求中的信息,重新计算签名,检验请求头中的签名是否合法。
优选的,所述基础组件子系统包括普罗米修斯模块、中台网关模块和文件网关模块;
所述普罗米修斯模块访问监控插件和探针暴露的监控接口,汇总收集监控数据并持久化存储至本地的时序数据库中,然后对外提供时序数据库的查询接口;
所述中台网关模块负责将监控插件的指令进行转发,以及对普罗米修斯监控查询的请求进行转发;
所述文件网关模块为探针文件、监控插件文件以及公私函脚本文件提供中转存储,并分发到各目标服务器中。
优选的,所述监控插件模块接收的指令包括脚本和探针程序下载和更新,监控插件模块访问与所运行的服务器在同一网络区域内的中台网关,下载目标文件介质;
公私函脚本为文本文件,下载后存放至指定目录;监控插件模块通过预定频率访问脚本文件并执行脚本文件中命令,访问和采集监控目标的运行信息,然后将运行信息作为结果,返回给监控插件模块,监控插件模块将结果收集,并转为普罗米修斯格式,提供普罗米修斯抓取接口,提供普罗米修斯模块进行随时采集;
探针程序为计算机程序,下载完成后,运行安装脚本来完成安装;当安装完成后,监控插件模块调用运行脚本,来启动探针程序;探针程序对监控目标进行数据采集并转为普罗米修斯格式,提供普罗米修斯抓取接口,提供普罗米修斯模块采集。
优选的,所述监控插件模块在运行的过程中,如果需要对公私函脚本的配置进行修改,此时远端向监控插件模块发送更新配置的指令,监控插件模块将新的配置以文件形式保存至本地,并根据新的配置,重新启动对应的公私函脚本或者探针程序。
优选的,该云原生监控系统与数据中心可用性系统联动,数据中心可用性系统批量将监控插件模块部署至全部的服务器中,并且加入到操作系统的定时任务中,定时判断程序的存活,使监控插件模块按照预期运行在每个服务器中。
8、根据权利要求2所述的可扩展和可插拔式的云原生监控系统平台,其特征在于,所述运营门户子系统包括监控插件管理模块、探针管理模块、公私函管理模块和配置中心模块;
所述监控插件管理模块,为已经部署在服务器的监控插件提供管理功能,包括自更新和配置管理;
所述探针管理模块,提供对探针程序的上传操作,并将已上传的探针程序安装或更新到已经部署监控插件的服务器上,并对探针程序进行运行调度及配置更新;
所述公私函管理模块,提供对公共监控函数脚本和私有监控函数脚本的新增和编辑操作,将公共监控函数脚本下发或更新到已经部署监控插件的服务器上,并对公私函脚本进行运行调度及配置更新;
所述配置中心模块,负责对普罗米修斯模块、中台网关模块、文件网关模块的配置进行集中化管理。
优选的,所述基础组件子系统在每个防火墙区域中部署;
在每个防火墙区域内,所述普罗米修斯模块基于开源的监控系统Prometheus实现,读取来自配置中心模块生成的配置文件,访问防火墙区域内的监控插件以及探针程序暴露的HTTP接口,收集并存储监控指标数据;
所述中台网关模块承担跨防火墙区域的监控插件指令和监控数据查询的网络请求转发,当某个网络请求需要跨防火墙区域传递时,网络请求发往请求发出者所在区域的中台网关,然后中台网关将请求再发送到目标所在网络区域的中台网关,目标所在网络区域的中台网关最后将请求发送到目标;
所述文件网关模块承担每个防火墙区域内的公私函脚本文件和探针程序文件的分发职责,当监控插件模块接收到更新或者安装下载某个公私函脚本及探针程序时,根据域名访问当前防火墙区域内的文件网关,获取文件介质下载到本地。
根据本发明提供的一种可扩展和可插拔式的云原生监控系统平台的监控方法,应用可扩展和可插拔式的云原生监控系统平台,包括如下步骤:
步骤S1:从配置管理数据库同步目标服务器信息至运营门户子系统;
步骤S2:运营门户子系统将步骤S1所同步的目标服务器信息转化为对目标服务器的操作指令,将请求发送到中台网关;
步骤S3:中台网关将来自运营门户子系统的操作指令转发至目标服务器;
步骤S4:若目标服务器接收到文件下载类的操作指令,向文件网关请求文件;
步骤S5:文件网关接收到文件下载请求,本地找不到此文件时,向运营门户子系统请求文件再返回;
步骤S6:运营门户子系统将步骤S1所同步的目标服务器信息转化为普罗米修斯配置,下发到各普罗米修斯模块中;
步骤S7:普罗米修斯模块根据最新的配置,对目标服务器采集监控数据。
与现有技术相比,本发明具有如下的有益效果:
1、本发明通过此方案,实现了云原生体系下,大规模计算节点的批量化监控部署、个性化监控配置;
2、本发明通过此方案,实现了通过在线编写公私函脚本,动态新增监控指标,满足定制化的监控需求;
3、本发明通过此方案,实现了对银行多防火墙网络架构的适配,通过较低的跨防火墙网络数据量,实现监控集中化监控展现。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明可扩展、可插拔式的云原生监控系统平台的实现方案图;
图2为监控插件模块细节框图;
图3为全面兼容可扩展插件式监控方法图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
本发明实施例公开了一种可扩展、可插拔式的云原生监控系统平台的实现方案,如图1所示,可分为运营门户、基础组件、实施目标三大子系统,每个子系统具体如下:
1、实施目标子系统:
该子系统包含多个模块,具体来说:(1)监控插件模块,该模块接收远程的指令,对监控探针和公私函脚本进行下载更新和运行调度,并且根据监控脚本运行后的结果,产生即时性的监控指标数据,并对外暴露接口以供采集;。该模块的细节如图2所示,可以看到,该模块根据功能还可以分为:提供指令接收接口、指令鉴权、公私函脚本和探针程序运行调度、公私函脚本结果转换、脚本和探针程序下载和更新。具体来说,监控插件模块为基于JAVA程序语言编写的WEB(World Wide Web,全球广域网)应用程序,其通过暴露一个HTTP(Hyper Text Transfer Protocol,超文本传输协议)接口的方式,供远端程序进行指令的传达。为了防止该指令接口被恶意的调用访问,本程序还设计的指令鉴权的功能,该程序设计了基于SM3(国产哈希算法)的签名算法。具体如下:
第一步,提取HTTP请求方法。
第二步,提取请求URL信息,包括域名和URI的路径部分。(URL的英文全称为uniform resource locator,中文译文为统一资源定位系统。URI的英文全称为UniformResource Identifier,中文译文为统一资源标识符。)
第三步,提取HTTP请求报文体。
第四步,拼接上述的请求方法、url信息、HTTP请求报文体及系统间协商的密钥。
第五步,将第四步拼接的字符串计算SM3(一种国产密码算法)值,即为签名的值。
签名的值将会由指令调用方,放在HTTP请求中的请求头中;监控插件模块重新根据指令HTTP请求中的信息,重新计算签名,检验请求头中的签名是否合法。
监控插件模块所接收的指令主要分为,公私函脚本和探针程序运行调度和脚本和探针程序下载和更新以及配置的更新。当指令为脚本和探针程序下载和更新时,监控插件模块会先访问与其所运行的服务器在同一网络区域内的中台网关,下载目标文件介质。一方面,公私函脚本为文本文件,因此下载后存放至指定目录即可。公私函脚本支持python(一种编程语言)语言以及shell(一种程序语言)语言,监控插件通过一定的频率访问脚本文件并执行,脚本文件中命令,会去访问和采集监控目标的运行信息,如服务器和中间件应用程序等,然后将运行信息作为结果,返回给监控插件。监控插件将这些结果收集,并转为普罗米修斯格式的即时性监控指标,提供标准的普罗米修斯抓取接口,提供普罗米修斯模块进行随时采集。另一方面,探针程序为计算机程序,因此,监控插件下载完成后,还会运行其安装脚本来完成安装。当安装完成后,监控插件会调用其运行脚本,来启动该探针程序。探针程序会自动对监控目标进行数据采集并转为普罗米修斯格式,提供标准的普罗米修斯抓取接口,提供普罗米修斯模块采集。在运行的过程中,如果需要对公私函脚本的配置进行修改,如脚本结果转换普罗米修斯格式时的标签名称,或者更改探针程序运行的端口等,此时远端会向监控插件模块发送更新配置的指令,监控插件模块会将新的配置以文件形式保存至本地,并根据新的配置,重新启动对应的公私函脚本或者探针程序。另外,为了便于远端的配置管理,监控插件模块亦提供了查看本地公私函或探针程序配置的HTTP接口。
在此系统中,监控插件模块自身是一个计算机程序,其承担了公私函脚本和探针程序的运行调度,以及与远端程序的通讯,是本监控系统的关键。为了让监控插件模块能够自动批量的部署到目标服务器中,并保证其可用性。本系统与外部系统——数据中心可用性系统联动,数据中心可用性系统会批量的将监控插件模块部署至全部的服务器中,并且加入到操作系统的定时任务中,定时判断此程序的存活,若不存活会尝试去拉起。以保证此监控插件模块会按照预期运行在每个服务器中。
2、基础组件子系统:
该子系统包含多个模块,具体来说:
(1)普罗米修斯模块,该模块通过访问监控插件和探针暴露的监控接口,汇总收集监控数据并持久化存储至本地的时序数据库中,然后对外提供时序数据库的查询接口。
(2)中台网关模块,该模块负责将监控插件的指令进行转发,以及对普罗米修斯监控查询的请求进行转发。
(3)文件网关模块,该模块为探针文件和监控插件文件以及公私函脚本文件提供中转存储,并分发到各目标服务器中。
对上述模块的关系,如图1所示,普罗米修斯模块、中台网关模块、文件网关模块是系统中的基础组件部分,这三个模块的组合作为最小单元,会在每个防火墙区域中部署,以适用于多防火墙的网络架构,降低跨防火墙之间的网络数据量。具体来说,在每个防火墙区域内,普罗米修斯模块基于开源的监控系统Prometheus(普罗米修斯)实现,其会读取来自配置中心模块生成的配置文件,访问此防火墙区域内的监控插件以及探针程序暴露的HTTP接口,收集并存储监控指标数据。中台网关模块主要承担了跨防火墙区域的监控插件指令和监控数据查询的网络请求转发作用,当某个网络请求需要跨防火墙区域传递时,该请求会发往请求发出者所在区域的中台网关,然后此中台网关会将请求再发送到目标所在网络区域的中台网关,目标所在网络区域的中台网关最后将请求发送到具体的目标。文件网关承担了每个防火墙区域内的公私函脚本文件和探针程序文件的分发职责,当监控插件模块接收到更新或者安装下载某个公私函脚本及探针程序时,会根据域名访问当前防火墙区域内的文件网关,获取文件介质下载到本地。作为文件中转站,当其接收到来自于监控插件模块的下载请求时,若发现本地没有改文件,会再向远端(图1的运营门户子系统)请求该介质,下载到本地再将该介质返回给监控插件模块的下载请求。另外,当有新的文件介质上传或者更新的时候,运营门户子系统会主动推送文件到文件网关中,达到“预热”效果。
3、运营门户子系统:
该子系统包含多个模块,具体来说:
(1)监控插件管理模块,该模块为已经部署在服务器的监控插件提供管理功能,包括自更新和配置管理。本模块可以提供用户在页面中,对已部署的监控插件进行集中化管理,包含了监控插件程序的启动和停止,监控插件程序的配置变更,以及监控插件程序的子更新。上述管理操作发生后,该模块会产生一条指令,通过HTTP请求的方式,发送到运营门户所在防火墙区域的中台网关,进而转发到目标监控插件中。
(2)探针管理模块,该模块提供对探针程序的上传操作,并将已上传的探针程序安装或更新到已经部署监控插件的服务器上,并对其进行运行调度及配置更新。本模块可以提供用户在页面上操作目标服务器中的一个或多个探针程序,包括对某个服务器节点新增安装探针程序,更新探针程序,卸载探针程序,设置探针程序的运行周期,更新探针程序的配置。上述操作发生后,该模块会产生一条指令,通过HTTP请求的方式,发送到运营门户所在防火墙区域的中台网关,进而转发到目标监控插件中,再由监控插件根据指令,完成对探针程序的运行调度或者下载更新。
(3)公私函管理模块,该模块提供对公共监控函数脚本和私有监控函数脚本的新增和编辑操作,并将该公共监控函数脚本下发或更新到已经部署监控插件的服务器上,并对其进行运行调度及配置更新。公共监控函数脚本通用性强,其可下发范围为全量的服务器。私有函数脚本只能适用于某个系统,因此其下发范围为某个系统所属的服务器。公私函可在下发时,可选择每个下发服务器的独立化配置以及运行调度配置,例如监控文件夹大小,每个公函下发时可以输入不同的路径作为参数,以及例如可以配置只在每天晚上的凌晨1点到2点执行。用户在公私函管理模块的操作发生后,该模块会产生一条指令,通过HTTP请求的方式,发送到运营门户所在防火墙区域的中台网关,进而转发到目标监控插件中,再由监控插件根据指令,成对公私函脚本文件的运行调度或者下载更新。
(4)告警管理模块,该模块提供对告警规则的配置,然后根据规则对普罗米修斯模块中已采集到的监控数据进行循环计算,达到规则阈值后会发出告警,发出的告警为HTTP请求的形式,发送到数据中心可用性系统中,再由数据中心可用性系统通过邮件、短信等形式发送到用户中。
(5)可视化监控大盘模块,该模块发出普罗米修斯格式的查询请求,然后对返回的监控数据进行图形化的展现。
(6)配置中心模块,该模块负责对普罗米修斯模块、中台网关模块、文件网关模块的配置进行集中化管理。
对于上述运营门户子系统中的各个模块,整体为一个WEB程序,构成一个运营门户子系统,运行在一个防火墙区域内。对于所有的服务器和其操作系统信息,均会由数据中心CMDB(管理企业IT架构中设备的各种配置信息数据库)收录,CMDB会定时同步到运营门户子系统中,然后由配置中心模块,将CMDB的各个服务器节点信息,转换为普罗米修斯配置,并下发到每个防火墙区域内的普罗米修斯模块中。由于普罗米修斯模块分布在各个防火墙区域内,因此可视化监控大盘模块的监控数据查询请求,会先发送到运营门户子系统所在的防火墙区域内的中台网关,再转发至目标普罗米修斯模块所在防火墙区域的中台网关,最终到达普罗米修斯模块。普罗米修斯模块请求,根据本地存储的监控数据进行计算后,将请求原路返回。CMDB的英文全称为Configuration Management Database,中文译文为配置管理数据库。
本发明通过插件形式的实施目标子系统运行在监控目标中,根据远程指令,执行脚本或探针程序收集监控目标的运行状态,产生即时性的监控指标数据,由每个防火墙区域一套的基础组件子系统收集汇总进行持久化存储。用户通过运营门户子系统可以对各个监控目标以及各监控组件进行管理。通过此方案,实现了云原生体系下,大规模计算节点的批量化监控部署、个性化监控配置;实现了通过在线编写公私函脚本,动态新增监控指标,满足定制化的监控需求;实现了对银行多防火墙网络架构的适配,通过较低的跨防火墙网络数据量,实现监控集中化监控展现。
本发明实施例还公开了一种全面兼容可扩展插件式监控系统和方法,如图3所示,包括如下步骤:
步骤S1:从CMDB同步目标服务器信息至运营门户子系统。
步骤S2:运营门户子系统中的监控插件管理、监控探针管理、公私函管理模块将S1步骤所同步的目标服务器信息转化为对目标服务器的操作指令,如文件下载、运行调度等,将请求发送到中台网关。
步骤S3:中台网关将来自运营门户子系统的操作指令转发至目标服务器。
步骤S4:若目标服务器接收到了文件下载类的操作指令,会向文件网关请求该文件。
步骤S5:文件网关接收到文件下载请求,本地找不到此文件时,会再向运营门户子系统请求此文件再返回。
步骤S6:运营门户子系统中的配置中心模块将S1步骤所同步的目标服务器信息转化为普罗米修斯配置,下发到各普罗米修斯模块中。
步骤S7:普罗米修斯模块根据最新的配置,对目标服务器采集监控数据。
本发明可扩展、可插拔式的云原生监控系统平台的实现方案,设计了运营门户、基础组件、实施目标三大子系统。实施目标子系统通过插件形式运行在监控目标中,根据远程指令,执行脚本或探针程序收集监控目标的监控指标。基础组件子系统对分落在各防火墙区域的监控目标访问收集监控指标数据,并对外提供统一的查询能力。在运营门户子系统中,可以对实施目标子系统各监控目标的监控脚本、探针程序进行编辑和调动,并且统一管理基础组件子系统的配置,以及向用户展现最终的监控效果页面。
即实施目标子系统通过插件形式运行在监控目标中,根据远程指令,执行脚本或探针程序收集监控目标的运行状态,产生即时性的监控指标数据;基础组件子系统,会在每个防火墙区域部署一套,每套子系统会收集汇总该防火墙区域内所有监控目标即时性的监控指标数据,通过普罗米修斯的时序数据库进行持久化存储,并对外提供该机房维度下监控指标数据的查询接口;运营门户子系统对实施目标子系统各监控目标的监控脚本和探针程序进行编辑调动,统一管理基础组件子系统的配置。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (10)

1.一种可扩展和可插拔式的云原生监控系统平台,其特征在于,包括运营门户子系统、基础组件子系统和实施目标子系统;
所述实施目标子系统通过插件形式运行在监控目标中,根据远程指令,执行脚本或探针程序收集监控目标的运行状态,产生即时性的监控指标数据;
所述基础组件子系统,部署在每个防火墙区域,收集汇总该防火墙区域内所有监控目标即时性的监控指标数据,并进行持久化存储,对外提供查询接口;
所述运营门户子系统对实施目标子系统各监控目标的监控脚本和探针程序进行编辑调动,统一管理基础组件子系统的配置。
2.根据权利要求1所述的可扩展和可插拔式的云原生监控系统平台,其特征在于,所述实施目标子系统包括监控插件模块;
所述监控插件模块接收远程的指令,对监控探针和公私函脚本进行下载更新和运行调度,并且根据监控脚本运行后的结果,产生即时性的监控指标数据,并对外暴露接口供采集;
所述监控插件模块提供指令接收接口、指令鉴权、公私函脚本结果转换、公私函脚本的运行调度、探针程序的运行调度、脚本的下载更新和探针程序的下载更新。
3.根据权利要求2所述的可扩展和可插拔式的云原生监控系统平台,其特征在于,所述监控插件模块基于JAVA程序语言编写的WEB应用程序,通过暴露HTTP接口的方式,供远端程序进行指令的传达;
所述监控插件模块的指令鉴权,基于国产哈希算法的签名算法,得到签名的值;
签名的值由指令调用方,放在HTTP请求中的请求头中;
所述监控插件模块重新根据指令HTTP请求中的信息,重新计算签名,检验请求头中的签名是否合法。
4.根据权利要求2所述的可扩展和可插拔式的云原生监控系统平台,其特征在于,所述基础组件子系统包括普罗米修斯模块、中台网关模块和文件网关模块;
所述普罗米修斯模块访问监控插件和探针暴露的监控接口,汇总收集监控数据并持久化存储至本地的时序数据库中,然后对外提供时序数据库的查询接口;
所述中台网关模块负责将监控插件的指令进行转发,以及对普罗米修斯监控查询的请求进行转发;
所述文件网关模块为探针文件、监控插件文件以及公私函脚本文件提供中转存储,并分发到各目标服务器中。
5.根据权利要求4所述的可扩展和可插拔式的云原生监控系统平台,其特征在于,所述监控插件模块接收的指令包括脚本和探针程序下载和更新,监控插件模块访问与所运行的服务器在同一网络区域内的中台网关,下载目标文件介质;
公私函脚本为文本文件,下载后存放至指定目录;监控插件模块通过预定频率访问脚本文件并执行脚本文件中命令,访问和采集监控目标的运行信息,然后将运行信息作为结果,返回给监控插件模块,监控插件模块将结果收集,并转为普罗米修斯格式,提供普罗米修斯抓取接口,提供普罗米修斯模块进行随时采集;
探针程序为计算机程序,下载完成后,运行安装脚本来完成安装;当安装完成后,监控插件模块调用运行脚本,来启动探针程序;探针程序对监控目标进行数据采集并转为普罗米修斯格式,提供普罗米修斯抓取接口,提供普罗米修斯模块采集。
6.根据权利要求5所述的可扩展和可插拔式的云原生监控系统平台,其特征在于,所述监控插件模块在运行的过程中,如果需要对公私函脚本的配置进行修改,此时远端向监控插件模块发送更新配置的指令,监控插件模块将新的配置以文件形式保存至本地,并根据新的配置,重新启动对应的公私函脚本或者探针程序。
7.根据权利要求2所述的可扩展和可插拔式的云原生监控系统平台,其特征在于,该云原生监控系统与数据中心可用性系统联动,数据中心可用性系统批量将监控插件模块部署至全部的服务器中,并且加入到操作系统的定时任务中,定时判断程序的存活,使监控插件模块按照预期运行在每个服务器中。
8.根据权利要求2所述的可扩展和可插拔式的云原生监控系统平台,其特征在于,所述运营门户子系统包括监控插件管理模块、探针管理模块、公私函管理模块和配置中心模块;
所述监控插件管理模块,为已经部署在服务器的监控插件提供管理功能,包括自更新和配置管理;
所述探针管理模块,提供对探针程序的上传操作,并将已上传的探针程序安装或更新到已经部署监控插件的服务器上,并对探针程序进行运行调度及配置更新;
所述公私函管理模块,提供对公共监控函数脚本和私有监控函数脚本的新增和编辑操作,将公共监控函数脚本下发或更新到已经部署监控插件的服务器上,并对公私函脚本进行运行调度及配置更新;
所述配置中心模块,负责对普罗米修斯模块、中台网关模块、文件网关模块的配置进行集中化管理。
9.根据权利要求8所述的可扩展和可插拔式的云原生监控系统平台,其特征在于,所述基础组件子系统在每个防火墙区域中部署;
在每个防火墙区域内,所述普罗米修斯模块基于开源的监控系统Prometheus实现,读取来自配置中心模块生成的配置文件,访问防火墙区域内的监控插件以及探针程序暴露的HTTP接口,收集并存储监控指标数据;
所述中台网关模块承担跨防火墙区域的监控插件指令和监控数据查询的网络请求转发,当某个网络请求需要跨防火墙区域传递时,网络请求发往请求发出者所在区域的中台网关,然后中台网关将请求再发送到目标所在网络区域的中台网关,目标所在网络区域的中台网关最后将请求发送到目标;
所述文件网关模块承担每个防火墙区域内的公私函脚本文件和探针程序文件的分发职责,当监控插件模块接收到更新或者安装下载某个公私函脚本及探针程序时,根据域名访问当前防火墙区域内的文件网关,获取文件介质下载到本地。
10.一种可扩展和可插拔式的云原生监控系统平台的监控方法,应用权利要求1-9任一所述的可扩展和可插拔式的云原生监控系统平台,包括如下步骤:
步骤S1:从配置管理数据库同步目标服务器信息至运营门户子系统;
步骤S2:运营门户子系统将步骤S1所同步的目标服务器信息转化为对目标服务器的操作指令,将请求发送到中台网关;
步骤S3:中台网关将来自运营门户子系统的操作指令转发至目标服务器;
步骤S4:若目标服务器接收到文件下载类的操作指令,向文件网关请求文件;
步骤S5:文件网关接收到文件下载请求,本地找不到此文件时,向运营门户子系统请求文件再返回;
步骤S6:运营门户子系统将步骤S1所同步的目标服务器信息转化为普罗米修斯配置,下发到各普罗米修斯模块中;
步骤S7:普罗米修斯模块根据最新的配置,对目标服务器采集监控数据。
CN202211136807.9A 2022-09-19 2022-09-19 可扩展和可插拔式的云原生监控系统平台及其监控方法 Pending CN115695465A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211136807.9A CN115695465A (zh) 2022-09-19 2022-09-19 可扩展和可插拔式的云原生监控系统平台及其监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211136807.9A CN115695465A (zh) 2022-09-19 2022-09-19 可扩展和可插拔式的云原生监控系统平台及其监控方法

Publications (1)

Publication Number Publication Date
CN115695465A true CN115695465A (zh) 2023-02-03

Family

ID=85062510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211136807.9A Pending CN115695465A (zh) 2022-09-19 2022-09-19 可扩展和可插拔式的云原生监控系统平台及其监控方法

Country Status (1)

Country Link
CN (1) CN115695465A (zh)

Similar Documents

Publication Publication Date Title
JP5288334B2 (ja) 仮想アプライアンス配備システム
CN102129378B (zh) 一种软件菜单更新方法和装置
KR100421624B1 (ko) 플랫폼 독립적인 소프트웨어 자동 검색/배포/설치 장치 및그 방법
CN102427480B (zh) 一种多应用服务平台系统中的应用访问方法
CN103051469B (zh) 云环境下集中式配置管理方法
CN102355500B (zh) 业务推送方法和装置
US20120233299A1 (en) Managing configurations of system management agents in a distributed environment
JP6164440B2 (ja) アプリケーションアップグレード方法および装置
CN103019757A (zh) 一种在多台客户端间同步软件的方法、装置及系统
CN104965726A (zh) 配置更新方法、装置及系统
US10177976B2 (en) System and method for configuring network devices
CN113778623B (zh) 资源处理方法和装置、电子设备及存储介质
CN102413022A (zh) 一种应用调试方法和系统
CN100479378C (zh) 应用软件组件参数配置方法及其系统、及终端设备
CN115576599A (zh) 软件开发的配置方法、系统和计算机设备
JP2005530258A (ja) クライアント・デバイスをサーバからリフレッシュする間に再同期化するためのシステムおよび方法
KR20090062797A (ko) 레가시 디바이스의 원격 제어를 위한 동적 ui 시스템 및그 실행 방법
JP2010518497A (ja) ソフトウェアコンポーネントをインストールする方法、システム、端末、およびデバイス管理サーバ
JP2014209365A (ja) 装置へのコンテンツの分配を管理するシステムと方法とプログラムを提供する記憶媒体
CN104951339B (zh) 一种基于Bundle依赖关系的自动搜索安装系统及方法
CN115695465A (zh) 可扩展和可插拔式的云原生监控系统平台及其监控方法
CN114637599A (zh) 云资源管理方法、装置、电子设备及可读存储介质
CN113965571B (zh) 一种分布式嵌入式设备的管理方法、装置、设备及介质
CN101790076A (zh) 功能扩展的方法和装置
CN102904742B (zh) 对可执行节点的操作方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination