CN112073252A - 一种云平台监控方法及系统、电子设备和存储介质 - Google Patents

一种云平台监控方法及系统、电子设备和存储介质 Download PDF

Info

Publication number
CN112073252A
CN112073252A CN202011259763.XA CN202011259763A CN112073252A CN 112073252 A CN112073252 A CN 112073252A CN 202011259763 A CN202011259763 A CN 202011259763A CN 112073252 A CN112073252 A CN 112073252A
Authority
CN
China
Prior art keywords
monitoring
data
server
cloud platform
tool
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011259763.XA
Other languages
English (en)
Inventor
刘宇航
位自豪
余意成
贾小杰
李阳
孙家彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Uxsino Software Co ltd
Original Assignee
Beijing Uxsino Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Uxsino Software Co ltd filed Critical Beijing Uxsino Software Co ltd
Priority to CN202011259763.XA priority Critical patent/CN112073252A/zh
Publication of CN112073252A publication Critical patent/CN112073252A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/044Network management architectures or arrangements comprising hierarchical management structures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供一种云平台监控方法及系统、电子设备和存储介质,其中,所述方法包括:通过在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集;通过所述监控中心服务器集群的监控工具接收并存储所述监控数据;通过所述监控中心服务器集群的服务层根据获取的所述监控数据进行监控,并根据所述监控数据进行分析,生成报警信息;通过展现层对所述监控数据以及报警信息进行展示,从而实现对各个监控目标服务器的监控,并进一步地通过服务层实现监控以及生成报警信息,并通过展示层进行展示,从而实现了对各个监控目标服务器的监控覆盖,兼容性好,可用性高,易于扩展。

Description

一种云平台监控方法及系统、电子设备和存储介质
技术领域
本发明涉及云监控技术领域,尤其涉及一种云平台监控方法及系统、电子设备和存储介质。
背景技术
随着计算机信息技术的快速发展和不断进步,私有云已广泛地应用于金融、医疗、电商、政务、电力、军事等重要领域,已成为影响国家发展和安全的重要基础设施。
对于应用部门来说,一方面计算机信息系统为这些部门提供了快捷、实时、安全的信息服务,实现了信息的传输、存储、处理的自动化,提高了效率,节省了大量的人力资源和其他成本;另一方面,计算机信息系统的广泛应用产生了多种多样的软/硬件资源,对相关部门的管理工作带来了巨大的挑战。
为了能实时有效的对云平台相关的软/硬件资源进行监控,为系统运维工作提供支持,为业务运行异常情况提供报警服务,现有技术一般采用孤立的监控方法,即对各个硬件资源进行监控。
此种监控方法不够灵活、性能较低、兼容性较差。
发明内容
本发明实施例提供一种云平台监控方法及系统、电子设备和存储介质,用以解决现有技术中不够灵活、性能较低、兼容性较差的缺陷。
本发明实施例提供一种云平台监控系统,包括:
监控目标服务器集群,包括多个监控目标服务器,通过在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集;
监控中心服务器集群,所述监控中心服务器集群包括:
数据汇聚层,所述数据汇聚层设置有监控工具,所述监控工具与所述数据采集工具连接,以接收并存储所述监控数据;
服务层,用于根据获取的所述监控数据进行监控,并根据所述监控数据进行分析,生成报警信息;
展现层,用于展示所述监控数据以及报警信息;
通讯层,用于实现所述服务层与所述展现层的通讯连接;
所述监控中心服务器集群包括:
数据存储服务器,用于存储所述监控数据;
用户认证服务器,用于用户登录的认证;
监控中心服务器,用于设置所述监控工具,且所述监控中心服务器与所述数据存储服务器连接,用于将获取的所述监控数据存储至所述数据存储服务器或所述监控中心服务器。
根据本发明一个实施例的云平台监控系统,所述监控中心服务器设置有第一通信服务端,所述监控目标服务器设置有第一通信监控端;
所述第一通信服务端与所述第一通信监控端通过注册中心实现连接。
根据本发明一个实施例的云平台监控系统,所述监控中心服务器集群还包括:设置有注册中心的注册服务器,所述注册服务器与所述监控中心服务器连接,用于实现所述第一通信服务端与所述第一通信监控端的注册。
根据本发明一个实施例的云平台监控系统,所述监控中心服务器与所述监控目标服务器通过网络协议实现连接,以实现所述监控工具接收所述数据采集工具采集到的所述监控数据。
根据本发明一个实施例的云平台监控系统,所述监控工具包括:服务器监控工具、云平台服务监控工具、虚拟机监控工具、容错保护工具中的至少一个;
所述报警信息包括:实时报警信息和趋势预测报警信息。
本发明实施例提供一种云平台监控方法,用于根据如上述任一种所述的云平台监控系统,包括监控中心服务器集群和监控目标服务器,所述方法包括:
通过在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集;
通过所述监控中心服务器集群的监控工具接收并存储所述监控数据;
通过所述监控中心服务器集群的服务层根据获取的所述监控数据进行监控,并根据所述监控数据进行分析,生成报警信息;
通过展现层对所述监控数据以及报警信息进行展示;
其中,所述监控中心服务器集群包括:数据存储服务器和监控中心服务器;
通过所述监控中心服务器集群的监控工具接收并存储所述监控数据,包括:
通过监控中心服务器的监控工具获取监控数据;
将获取的所述监控数据存储至所述数据存储服务器或所述监控中心服务器。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述云平台监控方法的步骤。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述所述云平台监控方法的步骤。
本发明实施例提供的云平台监控方法及系统,通过设置互相连接的监控目标服务器集群和监控中心服务器集群,在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集,并通过监控中心服务器集群的监控工具接收并存储监控数据,从而实现对各个监控目标服务器的监控,并进一步地通过服务层实现监控以及生成报警信息,并通过展示层进行展示,从而实现了对各个监控目标服务器的监控覆盖,兼容性好,可用性高,易于扩展。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种云平台监控系统的结构示意图;
图2是本发明实施例提供的一种云平台监控系统在硬件层面的结构示意图;
图3是本发明实施例提供的一种云平台监控方法的流程示意图;
图4是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明一个或多个实施例。
在本发明一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
还应当理解,本发明一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。
这些术语仅用来将同一类型的信息彼此区分开。
例如,在不脱离本发明一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本发明一个或多个实施例涉及的名词术语进行解释。
注册中心(etcd):用于实现第一通信服务端与第一通信监控端的注册。
以etcd为例,etcd是一个高可用的键值存储系统,主要用于共享配置和服务发现。
第一通信服务端server与第一通信监控端agent在启动之后均注册至etcd系统,从而实现二者的通信连接。
MySQL:MySQL是一个关系型数据库管理系统,是最流行的关系型数据库管理系统(RDBMS)之一。
在本实施例中,MySQL用于系统配置数据和监控数据的存储。
TSDB:时序数据库(TSDB)是一种特定类型的数据库,主要用来存储时序数据。
API:API就是操作系统留给应用程序的一个调用接口,应用程序通过调用操作系统的 API 而使操作系统去执行应用程序的命令。
首先,对本发明实施例的云平台监控系统进行示意性的说明。
参见图1,图1示出了一个完整的云平台监控系统,其包括:数据采集层、数据汇聚层、服务层、通讯层以及展现层。
其中,数据采集层设置于监控目标服务器集群侧,数据汇聚层、服务层、通讯层以及展现层设置于监控中心服务器集群侧。
具体地,参见图1,本发明实施例的云平台监控系统包括:
监控目标服务器集群,包括多个监控目标服务器,通过在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集;
监控中心服务器集群,所述监控中心服务器集群包括:
数据汇聚层,所述数据汇聚层设置有监控工具,所述监控工具与所述数据采集工具连接,以接收并存储所述监控数据;
服务层,用于根据获取的所述监控数据进行监控,并根据所述监控数据进行分析,生成报警信息;
展现层,用于展示所述监控数据以及报警信息;
通讯层,用于实现所述服务层与所述展现层的通讯连接。
其中,数据采集层包括各类开源的和自研的专业领域的数据采集工具,他们实现对各类监控对象的实时的数据采集。
常见的数据采集工具有node_exporter、Zabbix-agent 等等,都定位在监控数据采集层。
数据采集工具会把服务器数据采集数据、虚拟机数据采集数据、云平台服务数据采集数据、重要应用数据采集数据以及自定义监控数据采集数据上传到数据汇聚层。
数据汇聚层包含监控工具和数据存储,监控工具可以是Prometheus、zabbix、apm或者其他第三方监控工具,或者这些监控工具的组合。
数据存储可以是时序数据库TSDB或者关系型数据库MySQL等。
服务层,包含三大部分功能:一是由服务器监控工具、虚拟机监控工具、云平台服务监控工具、重要应用监控、自定义监控、容错保护工具等功能模块组成的监控管理模块;二是由对监控指标和监控数据进行分析实时报警规则引擎和趋势预测报警规则引擎,以及对应的实时报警和趋势预测报警共4个功能模块组成的报警模块;三是由etcd服务治理和config配置管理组成的治理和配置功能模块。
在服务层,还实现了和云平台内其他系统的对接以及相应的grpc接口。
通讯层,通过各种通讯协议实现服务层与展现层的数据交互。
展现层,根据不同用户的角色和场景,提供PC、大屏和手机端对监控数据的展示,以及通过微信、钉钉、短信、邮件等的工具进行报警信息的通知。
进一步地,监控中心服务器集群可以为一个服务器,将数据汇聚层、服务层、通讯层和展现层的服务部署到该服务器;也可以分开部署,分为MySQL数据存储服务器、etcd服务器、用户认证服务器,ucm-server服务器(包含了Prometheus等监控工具以及tsdb等时序数据库)等。
参见图2,图2示出了本发明实施例的云平台监控系统在硬件层面的示意图。
本发明实施例的云平台监控系统包括前端程序、后端程序,后端程序包含第一通信服务端(ucm-server)和第一通信监控端(ucm-agent)。
第一通信服务端(ucm-server)在多个服务器上部署多个服务,以实现服务端的高可用。
在每个第一通信服务端(ucm-server)的服务里实现对监控工具的管理、对系统配置的管理、对数据存储的管理、对报警规则的管理,以及对加入的第一通信监控端(ucm-agent)进行调用,最终形成一个第一通信服务端(ucm-server)和第一通信监控端(ucm-agent)多对多的集群,对面向用户的前端提供api接口,提供统一的访问服务。
ucm-agent部署在监控目标服务器上,在每个ucm-agent服务里完成对数据采集工具的启动停止管理,采集工具配置信息上报etcd,以及agent服务向etcd注册中心的注册。
具体地,参见图2,图2的云平台20中,监控中心服务器集群包括:
数据存储服务器23,用于存储所述监控数据;
用户认证服务器24,用于用户登录的认证;用户在浏览器中登录系统,经过用户认证服务器24的认证鉴权之后,就可以对云平台监控系统进行操作,例如登录的用户可以在用户终端的浏览器里对云平台监控系统的相关配置进行调整、设置合理的自定义监控项、对相关监控指标自定义设置报警规则等。
监控中心服务器22,用于设置所述监控工具,且监控中心服务器22与数据存储服务器23连接,用于将获取的所述监控数据存储至数据存储服务器23或监控中心服务器22。
每一个单一功能的服务器也可以部署多个,比如mysql-1,mysql-2,mysql-3分别布置于多个数据存储服务器组成服务器群,数据多备份,降低数据丢失、服务宕机的风险,提高服务的可用性。
进一步地,监控目标服务器集群包括多个监控目标服务器21。
监控目标服务器21分两类,是根据实际场景来区分:有些服务器可以进行部署第一通信监控端(ucm-agent)来采集监控数据;有些场景出于安全考虑或者其他原因不允许直接操作,那就不能部署第一通信监控端(ucm-agent),就在第一通信服务端(ucm-server)上设置自定义监控,通过网络协议、http接口等方式采集监控数据,即非侵入方式,以实现监控工具接收数据采集工具采集到的监控数据。
本发明实施例的云平台监控系统的优势还在于对用户自定义监控的支持,用户可以在ucm前端界面进行自定义监控设置,比如输入linux命令、shell脚本、python脚本或者上传可执行文件以获取指定的监控数据。
对于非入侵模式部署场景,可以不在监控目标服务器上部署任何第一通信监控端(ucm-agent)模块,用户在ucm前端配置监控目标服务器相关信息、输入linux命令或httpapi信息实现对指定监控数据的获取。
进一步地,监控中心服务器集群还包括:设置有注册中心的注册服务器25,所述注册服务器25与监控中心服务器22连接。
用于实现第一通信服务端与第一通信监控端的注册。
监控中心服务器22设置有第一通信服务端,所述监控目标服务器21设置有第一通信监控端。
在第一通信服务端(ucm-server)启动之后,将自身注册到注册中心(例如etcd服务);第一通信监控端(ucm-agent)启动之后,将自身注册到注册中心(例如etcd服务)。
第一通信服务端与第一通信监控端通过注册中心实现连接。
第一通信服务端在启动之后,会从注册中心读取第一通信监控端(ucm-agent)的配置信息并持久化到关系型数据库MySQL中,然后根据这些配置信息,持续不断地去相应的监控目标服务器21读取监控数据并保存到时序数据库TSDB中,并可以根据用户的配置将监控数据通过路由器24发送至显示屏26或终端25用于展示。
本发明实施例提供的云平台监控系统,通过设置互相连接的监控目标服务器集群和监控中心服务器集群,在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集,并通过监控中心服务器集群的监控工具接收并存储监控数据,从而实现对各个监控目标服务器的监控,并进一步地通过服务层实现监控以及生成报警信息,并通过展示层进行展示,从而实现了对各个监控目标服务器的监控覆盖,兼容性好,可用性高,易于扩展。
本发明实施例的云平台监控系统覆盖了从底层的机房物理服务器到虚拟机,包括上层的应用和云平台自身的系统服务,并借助多种监控工具的部署,对监控指标的实现了多种监控手段的获取。
对于关键指标,至少有两种的监控工具实现获取,从而能够确保监控策略有冗余,另外还可以确保当识别出一个新的监控数据要纳入监控时,一定有监控工具能快速实现监控部署。
下面对本发明实施例提供的云平台监控方法进行描述,下文描述的云平台监控方法运行于上述的云平台监控系统,所以有关方法的详细解释也可以参见上述监控系统的内容。
本发明实施例还公开了一种云平台监控方法,用于如上实施例实施的云平台监控系统。
参见图3,所述方法包括下述步骤301~304:
301、通过在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集。
常见的数据采集工具有Prometheus、node_exporter、Zabbix-agent 等等,都定位在监控数据采集层。
本实施例中,监控目标服务器作为被监控的对象,需要通过数据采集工具采集监控数据并上传至监控中心服务器集群。
302、通过所述监控中心服务器集群的监控工具接收并存储所述监控数据。
具体地,监控中心服务器集群包括:数据存储服务器和监控中心服务器,步骤302包括:通过监控中心服务器的监控工具获取监控数据,将获取的所述监控数据存储至数据存储服务器或监控中心服务器。
数据存储可以是时序数据库TSDB或者关系型数据库MySQL。
时序数据库TSDB设置于监控中心服务器上,关系型数据库MySQL可以设置于另外的MySQL数据存储服务器。
每一个单一功能的服务器也可以部署多个,比如mysql-1,mysql-2,mysql-3分别布置于多个数据存储服务器组成服务器群,数据多备份,降低数据丢失、服务宕机的风险,提高服务的可用性。
第一通信服务端在启动之后,会从注册中心读取第一通信监控端(ucm-agent)的配置信息并持久化到关系型数据库MySQL中,然后根据这些配置信息,持续不断地去相应的监控目标服务器读取监控数据并保存到时序数据库TSDB中,并可以根据用户的配置将监控数据通过路由器发送至显示屏或终端用于展示。
303、通过所述监控中心服务器集群的服务层根据获取的所述监控数据进行监控,并根据所述监控数据进行分析,生成报警信息。
需要解释的是,监控中心服务器集群可以为一个服务器,将数据汇聚层、服务层、通讯层和展现层的服务部署到该服务器;也可以分开部署,分为MySQL数据存储服务器、etcd服务器、用户认证服务器,监控中心服务器服务器(包含Prometheus等监控工具以及tsdb等时序数据库)等。
其中,在服务层,由服务器监控工具、虚拟机监控工具、云平台服务监控工具、重要应用监控、自定义监控、容错保护工具等功能模块组成的监控管理模块进行监控,
由对监控指标和监控数据进行分析实时报警规则引擎和趋势预测报警规则引擎,以及对应的实时报警和趋势预测报警共4个功能模块组成的报警模块,以实现实时报警信息和趋势预测报警信息的生成。
304、通过展现层对所述监控数据以及报警信息进行展示。
展现层可以根据不同用户的角色和场景,提供PC、大屏和手机端对监控数据的展示,以及通过微信、钉钉、短信、邮件等的工具进行报警信息的通知。
在用户首次登录时,用户在浏览器中登录系统,经过用户认证服务器的认证鉴权之后,就可以对云平台监控系统进行操作,例如登录的用户可以在用户终端的浏览器里对云平台监控系统的相关配置进行调整、设置合理的自定义监控项、对相关监控指标自定义设置报警规则、对指定监控数据的获取等。
本发明实施例提供的云平台监控方法,通过设置互相连接的监控目标服务器集群和监控中心服务器集群,在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集,并通过监控中心服务器集群的监控工具接收并存储监控数据,从而实现对各个监控目标服务器的监控,并进一步地通过服务层实现监控以及生成报警信息,并通过展示层进行展示,从而实现了对各个监控目标服务器的监控覆盖,兼容性好,可用性高,易于扩展。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。
处理器410可以调用存储器430中的逻辑指令,以执行云平台监控方法,用于云平台监控系统,包括监控中心服务器集群和监控目标服务器,所述方法包括:
通过在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集;
通过所述监控中心服务器集群的监控工具接收并存储所述监控数据;
通过所述监控中心服务器集群的服务层根据获取的所述监控数据进行监控,并根据所述监控数据进行分析,生成报警信息;
通过展现层对所述监控数据以及报警信息进行展示。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的云平台监控方法,所述方法包括:
通过在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集;
通过所述监控中心服务器集群的监控工具接收并存储所述监控数据;
通过所述监控中心服务器集群的服务层根据获取的所述监控数据进行监控,并根据所述监控数据进行分析,生成报警信息;
通过展现层对所述监控数据以及报警信息进行展示。
又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的云平台监控方法,所述方法包括:
通过在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集;
通过所述监控中心服务器集群的监控工具接收并存储所述监控数据;
通过所述监控中心服务器集群的服务层根据获取的所述监控数据进行监控,并根据所述监控数据进行分析,生成报警信息;
通过展现层对所述监控数据以及报警信息进行展示。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。
可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。
基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种云平台监控系统,其特征在于,包括:
监控目标服务器集群,包括多个监控目标服务器,通过在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集;
监控中心服务器集群,所述监控中心服务器集群包括:
数据汇聚层,所述数据汇聚层设置有监控工具,所述监控工具与所述数据采集工具连接,以接收并存储所述监控数据;
服务层,用于根据获取的所述监控数据进行监控,并根据所述监控数据进行分析,生成报警信息;
展现层,用于展示所述监控数据以及报警信息;
通讯层,用于实现所述服务层与所述展现层的通讯连接;
其中,所述监控中心服务器集群包括:
数据存储服务器,用于存储所述监控数据;
用户认证服务器,用于用户登录的认证;
监控中心服务器,用于设置所述监控工具,且所述监控中心服务器与所述数据存储服务器连接,用于将获取的所述监控数据存储至所述数据存储服务器或所述监控中心服务器。
2.根据权利要求1所述的云平台监控系统,其特征在于,所述监控中心服务器设置有第一通信服务端,所述监控目标服务器设置有第一通信监控端;
所述第一通信服务端与所述第一通信监控端通过注册中心实现连接。
3.根据权利要求2所述的云平台监控系统,其特征在于,所述监控中心服务器集群还包括:设置有注册中心的注册服务器,所述注册服务器与所述监控中心服务器连接,用于实现所述第一通信服务端与所述第一通信监控端的注册。
4.根据权利要求1所述的云平台监控系统,其特征在于,所述监控中心服务器与所述监控目标服务器通过网络协议实现连接,以实现所述监控工具接收所述数据采集工具采集到的所述监控数据。
5.根据权利要求1所述的云平台监控系统,其特征在于,
所述监控工具包括:服务器监控工具、云平台服务监控工具、虚拟机监控工具、容错保护工具中的至少一个;
所述报警信息包括:实时报警信息和趋势预测报警信息。
6.一种云平台监控方法,其特征在于,用于根据权利要求1-5任一项所述的云平台监控系统,包括监控中心服务器集群和监控目标服务器,所述方法包括:
通过在多个监控目标服务器上设置的多个数据采集工具进行监控数据的采集;
通过所述监控中心服务器集群的监控工具接收并存储所述监控数据;
通过所述监控中心服务器集群的服务层根据获取的所述监控数据进行监控,并根据所述监控数据进行分析,生成报警信息;
通过展现层对所述监控数据以及报警信息进行展示;
其中,所述监控中心服务器集群包括:数据存储服务器和监控中心服务器;
通过所述监控中心服务器集群的监控工具接收并存储所述监控数据,包括:
通过监控中心服务器的监控工具获取监控数据;
将获取的所述监控数据存储至所述数据存储服务器或所述监控中心服务器。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求6所述云平台监控方法的步骤。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求6所述云平台监控方法的步骤。
CN202011259763.XA 2020-11-12 2020-11-12 一种云平台监控方法及系统、电子设备和存储介质 Pending CN112073252A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011259763.XA CN112073252A (zh) 2020-11-12 2020-11-12 一种云平台监控方法及系统、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011259763.XA CN112073252A (zh) 2020-11-12 2020-11-12 一种云平台监控方法及系统、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN112073252A true CN112073252A (zh) 2020-12-11

Family

ID=73655052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011259763.XA Pending CN112073252A (zh) 2020-11-12 2020-11-12 一种云平台监控方法及系统、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN112073252A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112559296A (zh) * 2020-12-23 2021-03-26 南方电网深圳数字电网研究院有限公司 基于prometheus的虚拟机监控方法和工具、电子设备、存储介质
CN112711512A (zh) * 2020-12-29 2021-04-27 北京浪潮数据技术有限公司 一种Prometheus监控方法、装置及设备
CN112965874A (zh) * 2021-03-04 2021-06-15 浪潮云信息技术股份公司 一种可配置的监控告警方法及系统
CN113708967A (zh) * 2021-08-26 2021-11-26 中化信息技术有限公司 一种系统监测容灾预警装置及预警方法
CN113703886A (zh) * 2021-07-21 2021-11-26 青岛海尔科技有限公司 用户系统行为监控方法、系统、电子设备及存储介质
CN113867197A (zh) * 2021-09-16 2021-12-31 浪潮云信息技术股份公司 一种基于Prometheus的云数据中心实例监控方法
WO2022127234A1 (zh) * 2020-12-14 2022-06-23 广州新科佳都科技有限公司 一种基于云平台的线网综合监控方法及系统
WO2023024307A1 (zh) * 2021-08-27 2023-03-02 苏州浪潮智能科技有限公司 应用服务监控方法、装置、电子设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279830A (zh) * 2013-05-28 2013-09-04 中国南方电网有限责任公司超高压输电公司广州局 变电站或换流站事故处理云端远程支持决策的方法与系统
WO2015088702A2 (en) * 2013-12-13 2015-06-18 Palerra, Inc. Systems and methods for cloud security monitoring and threat intelligence
CN105024851A (zh) * 2015-06-25 2015-11-04 四川理工学院 一种基于云计算的监控管理系统
CN106878064A (zh) * 2017-01-16 2017-06-20 腾讯科技(深圳)有限公司 数据监控方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279830A (zh) * 2013-05-28 2013-09-04 中国南方电网有限责任公司超高压输电公司广州局 变电站或换流站事故处理云端远程支持决策的方法与系统
WO2015088702A2 (en) * 2013-12-13 2015-06-18 Palerra, Inc. Systems and methods for cloud security monitoring and threat intelligence
CN105024851A (zh) * 2015-06-25 2015-11-04 四川理工学院 一种基于云计算的监控管理系统
CN106878064A (zh) * 2017-01-16 2017-06-20 腾讯科技(深圳)有限公司 数据监控方法和装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022127234A1 (zh) * 2020-12-14 2022-06-23 广州新科佳都科技有限公司 一种基于云平台的线网综合监控方法及系统
US11753056B2 (en) 2020-12-14 2023-09-12 Pci Technology & Service Co., Ltd. Cloud platform-based comprehensive line network monitoring method and system
CN112559296A (zh) * 2020-12-23 2021-03-26 南方电网深圳数字电网研究院有限公司 基于prometheus的虚拟机监控方法和工具、电子设备、存储介质
CN112711512A (zh) * 2020-12-29 2021-04-27 北京浪潮数据技术有限公司 一种Prometheus监控方法、装置及设备
CN112965874A (zh) * 2021-03-04 2021-06-15 浪潮云信息技术股份公司 一种可配置的监控告警方法及系统
CN112965874B (zh) * 2021-03-04 2023-02-28 浪潮云信息技术股份公司 一种可配置的监控告警方法及系统
CN113703886A (zh) * 2021-07-21 2021-11-26 青岛海尔科技有限公司 用户系统行为监控方法、系统、电子设备及存储介质
CN113703886B (zh) * 2021-07-21 2023-06-20 青岛海尔科技有限公司 用户系统行为监控方法、系统、电子设备及存储介质
CN113708967A (zh) * 2021-08-26 2021-11-26 中化信息技术有限公司 一种系统监测容灾预警装置及预警方法
CN113708967B (zh) * 2021-08-26 2024-04-16 中化信息技术有限公司 一种系统监测容灾预警装置及预警方法
WO2023024307A1 (zh) * 2021-08-27 2023-03-02 苏州浪潮智能科技有限公司 应用服务监控方法、装置、电子设备及可读存储介质
CN113867197A (zh) * 2021-09-16 2021-12-31 浪潮云信息技术股份公司 一种基于Prometheus的云数据中心实例监控方法

Similar Documents

Publication Publication Date Title
CN112073252A (zh) 一种云平台监控方法及系统、电子设备和存储介质
US9872205B2 (en) Method and system for sideband communication architecture for supporting manageability over wireless LAN (WLAN)
CN108964960B (zh) 一种告警事件的处理方法及装置
CN109769261B (zh) 一种网络故障处理方法及装置
CN108430116A (zh) 断网重连方法、介质、装置和计算设备
US20160308878A1 (en) Exception prompting method, apparatus, and system using the same
CN102739802A (zh) 面向业务应用的it集中运维分析系统
CN111625419B (zh) 一种日志采集方法、系统、设备及计算机可读存储介质
CN104700024B (zh) 一种Unix类主机用户操作指令审计的方法和系统
CN110225045A (zh) 全链路数据鉴权方法、装置、设备及存储介质
CN106656985B (zh) 一种备份账号登录方法、装置及系统
CN112583898A (zh) 业务流程编排方法、装置、以及可读介质
US20210352746A1 (en) Mobile platform communication method, device, system, and storage medium
CN108540582A (zh) 一种终端标识的处理方法、服务器及终端
CN114465741A (zh) 一种异常检测方法、装置、计算机设备及存储介质
CN107645565A (zh) 服务器状态信息的处理方法、装置、系统及处理器
CN105915373A (zh) 基于云计算的企业交易管理平台的混合式监控系统
CN113051039A (zh) 一种基于云计算的虚拟云办公系统登录方法及系统
CN110198230B (zh) 应用的监控方法、装置、存储介质和电子装置
CN116192607A (zh) 故障告警方法及装置
WO2023275782A1 (en) Systems and methods for locating devices
CN108600006A (zh) 一种计算机数据安全监控系统
CN108197253A (zh) 一种云监控平台的设备查询方法、装置和设备
CN111258712B (zh) 一种虚拟平台网络隔离下保护虚拟机安全的方法及系统
CN112422480B (zh) 帐号属性的确定方法和装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201211

RJ01 Rejection of invention patent application after publication