WO2021184586A1

WO2021184586A1 - 基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质

Info

Publication number: WO2021184586A1
Application number: PCT/CN2020/099187
Authority: WO
Inventors: 梁桂明
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-03-18
Filing date: 2020-06-30
Publication date: 2021-09-23
Also published as: CN111459750A

Abstract

一种基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质，该方法应用于云监控领域，涉及大数据技术，该方法包括：若接收到云管理平台发起的监控请求，根据监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件；根据配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的第一性能数据；将拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中；根据配置文件的告警策略对从本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。该方法可实现对云管理平台的全面快速的监控，有效降低了私有云监控的运维成本。

Description

基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质

本申请要求于2020年03月18日提交中国专利局、申请号为202010189441.6，发明名称为“基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及云监控领域，尤其涉及一种基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质。

背景技术

云服务是基于互联网的相关服务的增加、使用和交互模式，通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云服务可以将企业所需的软硬件、资料都放到网络上，在任何时间、地点，使用不同的IT设备互相连接，实现数据存取、运算等目的。当前，常见的云服务有公共云(Public Cloud)与私有云(Private Cloud)两种。其中的私有云(Private Clouds)是为一个客户单独使用而构建的，因而能够提供对数据、安全性和服务质量的最有效控制。

在当前的私有云监控方案中，各个云厂商都是基于对公有云的监控方案进行裁剪，然后部署到客户的私有云中，发明人意识到此时客户很难实现对相关私有云的监控的运维，增加了各个云厂商的运维成本和时间。再者，针对私有云的监控方案是以产品的形式交付给到各个用户的，不同的用户之间所使用的网络也基本属于隔离状态；同时在现有的私有云的开源的监控方案上，基本都是基于推送的方式去做数据采集的，如基于zabbix的数据推送的方案，也有基于open-falcon的数据推送方案，并没有没有直接使用可直接进行数据拉取的监控方案，故并不能够实现对整个私有云的相关性能数据的实时可靠的监控。

发明内容

本申请实施例提供一种基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质，能够使得控服务系统对云管理平台的全面快速的监控，有效降低了私有云监控的运维成本，提高了用户的使用体验度。

第一方面，本申请实施例提供了一种基于非扁平网络的私有云监控方法，该方法包括：若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件，所述云管理平台包括若干待监控服务器，所述配置文件包括数据采集策略和告警策略；若所述监控服务系统包括一个本地磁盘，根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据；将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中；根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。

第二方面，本申请实施例还提供了一种基于非扁平网络的私有云监控装置，该装置包括：文件获取单元，用于若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件，所述云管理平台包括若干待监控服务器，所述配置文件包括数据采集策略和告警策略；第一数据拉取单元，用于若所述监控服务系统包括一个本地磁盘，根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据；第一存储单元，用于将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中；第一告警分析单元，用于根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。

第三方面，本申请实施例还提供了一种计算机设备，所述计算机设备包括存储器，以及与所述存储器相连的处理器；所述存储器用于存储计算机程序；所述处理器用于运行所述存储器中存储的计算机程序，以执行以下步骤：若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件，所述云管理平台包括若干待监控服务器，所述配置文件包括数据采集策略和告警策略；若所述监控服务系统包括一个本地磁盘，根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据；将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中；根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。

第四方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行以下操作：若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件，所述云管理平台包括若干待监控服务器，所述配置文件包括数据采集策略和告警策略；若所述监控服务系统包括一个本地磁盘，根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据；将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中；根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。

本申请实施例提供了一种基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质。本申请实施例能够通过中转服务单元以及收集数据单元的设置来实现对处于不同网络的数据的拉取，从而实现对基于私有云的云管理平台的网络资源监控、存储资源监控、中间件资源监控、弹性伸缩监控以及触发的监控等，能够实现监控服务系统对云管理平台的全面快速的监控，有效降低了私有云监控的运维成本，提高了用户的使用体验度效果。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种基于非扁平网络的私有云监控方法的流程示意图；

图1a是本申请实施例提供的一种基于非扁平网络的私有云监控方法的应用场景示意图；

图2是本申请实施例提供的一种基于非扁平网络的私有云监控方法的子流程示意图；

图3是本申请实施例提供的一种基于非扁平网络的私有云监控方法的子流程示意图；

图4是本申请另一实施例提供的一种基于非扁平网络的私有云监控方法的流程示意图；

图5是本申请实施例提供的一种基于非扁平网络的私有云监控装置的示意性框图；

图6是本申请实施例提供的一种基于非扁平网络的私有云监控装置的第一数据拉取单元的示意性框图；

图7是本申请实施例提供的一种基于非扁平网络的私有云监控装置的第一告警分析单元单元的示意性框图；

图8是本申请另一实施例提供的一种基于非扁平网络的私有云监控装置的示意性框图；

图9是本申请实施例提供的一种计算机设备结构组成示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

请参阅图1和图1a，图1是本申请实施例提供的一种基于非扁平网络的私有云监控方法的示意流程图，图1a是本申请实施例中基于非扁平网络的私有云监控方法的场景示意图。该基于非扁平网络的私有云监控方法应用于监控服务器系统中的管理服务器10中。该管理服务器10根据基于非扁平网络的私有云监控方法能够通过中转服务单元以及收集数据单元的设置来实现对处于不同网络的数据的拉取，从而实现对基于私有云的云管理平台20的网络资源监控、存储资源监控、中间件资源监控、弹性伸缩监控以及触发的监控等，能够使得监控服务系统对云管理平台20的全面快速的监控，有效降低了私有云监控的运维成本，提高了用户的使用体验度。以下将以管理服务器10的角度详细地介绍该基于非扁平网络的私有云监控方法的各个步骤。

如图1所示，其是本申请实施例提供的一种基于非扁平网络的私有云监控方法，该方法的步骤包括步骤S101～S104。

步骤S101，若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件，所述云管理平台包括若干待监控服务器，所述配置文件包括数据采集策略和告警策略。

在本实施例中，监控服务系统用于实现对云管理平台的相关数据信息的监控，当监控服务系统的监控服务器接收到用户云管理平台发起的监控请求,此时可以根据该监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件。通常，此处的云管理平台为用户的私有云的用于实现对其管理的平台，该平台可以包括提供私有云的相关服务器或者服务器群集等，此处的相关服务器或者服务器群集即为待监控服务器。而监控服务系统能够实现对私有云的相关数据信息的监控，为了实现对私有云的全面监控，避免网络隔离对于相关数据拉取的影响，此时需要区分待监控服务器是否与监控服务系统的本地磁盘是否位于同一网络中。

步骤S102，若所述监控服务系统包括一个本地磁盘，根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据。

在本实施例中，当所述监控服务系统包括一个本地磁盘的时候，监控服务器能够所述配置文件中的数据采集策略以及预设的数据中转件，直接从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据。即监控服务器能够解析所获取的配置文件，从而获取到配置文件中的数据采集策略，以便进行数据的拉取和采集。例如，对于私有云而言，为对其性能及安全等进行实时监控，此时可以通过预设的数据中转件对云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器传输的数据流量信息、数据存储信息以及服务器的CPU占比等性能数据进行监控获取，并通过后续的对比分析来实现对私有云的性能的监控和告警等。

作为可选的实施例，该数据采集策略可以是每隔预设时间即对相关数据进行一次采集更新。

作为另一可选的实施例，所述本地磁盘还可以包括一个主本地子磁盘以及一个从本地子磁盘，其中，主本地子磁盘中的相关数据可以及时备份至从本地子磁盘中，从而可以确保监控服务系统的高可用性。

如图2所示，作为进一步的的实施例，所述预设的数据中转件可以包括中转服务模块以及数据收集模块，故所述步骤S102具体可以包括步骤S201～S202。

步骤S201，根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，以使所述数据采集模块接收不位于监控服务系统的本次磁盘所在的网络中的待监控服务器通过HTTP接口推送的第一性能数据，并将所接收到的第一性能数据推送到所述中转服务模块进行缓存。

其中，所述预设的数据中转件中的中转服务模块可以是Pushgateway。Pushgateway是一个独立的服务，Pushgateway位于应用程序发送指标和Prometheus服务器之间。Pushgateway接收指标，然后将其作为目标被基于Prometheus的服务器拉取；也可以将其看作代理服务，它接收度量，而不是探测。故中转服务模块作为中间件，能够接收数据采集模块所推送的处于网络隔离中的待监控服务器的相关的性能数据，以供监控服务器进行拉取。

作为进一步的实施例，不位于监控服务系统的本地磁盘所在的网络中的待监控服务器可以是存储服务器，所述第一性能数据包括存储空间占用比，所述步骤S201具体可以是：

根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，以使所述数据采集模块接收不位于监控服务系统所在的网络中的存储服务器通过HTTP接口推送的存储空间占用比，并将所接收到的存储空间占用比推送到所述中转服务模块进行缓存。

其中，若存储服务器与监控服务器系统的本地磁盘不在同一网络中，此时的要实现本地磁盘中的Prometheus监控，需要通过监控服务器所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，当数据采集模块接收到数据采集请求后，则能够接收有存储服务器通过HTTP接口推送的存储空间占用比，同时也鞥能够通过HTTP接口推送数据的形式将相关的存储空间占用比推送至中转服务模块进行缓存。

再者，例如，所述存储服务器可以是NAS存储集群，该NAS存储集群可以包括多个存储单元，不同的存储单元之间可能存在网络隔离，且每个子存储单元之间包括多个级别的子存储单元，通常低一级的子存储单元能够向高一级的子存储单元推送跟存储相关的第一性能数据，并能够通过最高一级的子存储单元将数据直接推送至数据收集模块，数据收集模块则能够将所收集到的来自各个不同网络的第一性能数据(如存储空间占用比)推送至中转服务模块中进行缓存。

作为另一实施例，不位于监控服务系统所在的网络中的待监控服务器还可以是网络服务器，所述第一性能数据包括速率、带宽、吞吐量、时延、时延带宽积、往返时间RTT、利用率等。所述步骤S201的具体实现方式可以参见上述当不位于监控服务系统所在的网络中的待监控服务器还可以是存储服务器时的相关说明，具体在此不再赘述。

步骤S202，拉取所述中转服务模块中缓存的第一性能数据。

其中，监控服务器能够直接拉取所述中转服务模块中缓存的第一性能数据，从而减少了网络隔离对云管理平台的全面监控的影响，提高了监控的效率和用户使用体验度。

步骤S103，将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。

在本实施例中，当监控服务器采集到相应的数据后，为了便于对相关数据进行统计分析，可以将所采集到的数据都存储到监控服务系统的本地磁盘的Prometheus数据库中，当需要进行告警分析的时候，则从Prometheus数据库中进行数据调取，不仅方便数据的管理，还便于用户对数据的处理和分析。

步骤S104，根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。

在本实施例中，监控服务器还能够根据所述配置文件的告警策略，从本地磁盘中的Prometheus数据库中读取的相应的数据，并能够实现对所读取的相关数据进行告警分析处理。

作为可选的实施例，如图3所示，本申请的步骤S104具体可以包括步骤S301～S303。

步骤S301，解析所述配置文件的告警策略以得到数据分析规则以及预设告警范围。其中，配置文件中包括有告警策略，通常告警策略可以包括数据分析规则和预设告警范围，其中，数据分析规则是指对数据进行分析的方法，预设告警范围是指若会对整个云管理平台的私有云造成威胁或影响的相关数据被分析之后得到的结果范围。

步骤S302，根据所述数据分析规则对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行分析以得到相应的分析结果。其中，可以通过所述数据分析规则对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行全面地分析，从而得到一个相应的分析结果。

步骤S303，若所述分析结果位于预设告警范围内，则生成相应的告警信息以进行告警。其中，当分析结果位于预设告警范围内时，则表明私有云面临威胁或者安全性能不稳定，此时可以生成相应的告警信息进行告警提示用户进行处理。

另外，在一实施例中，本申请的步骤S104之前还可以包括以下步骤：

步骤S105，根据所述配置文件中的数据采集策略从位于监控服务系统的本地磁盘所在的网络中的待监控服务器上拉取相应的第二性能数据。其中，若待监控服务器位于监控服务系统的本地磁盘所在的网络中，此时监控服务器能够直接拉取该待监控服务器上的相关的第二性能数据。所述第二性能数据也可是存储服务器的存储空间占用比，或者还可以是网络服务器的速率、带宽、吞吐量、时延、时延带宽积、往返时间RTT、利用率等，或者还可以是服务器的CUP运行比例等数据，当然，在本实施例中，具体也不做限制，只要是满足对私有云的监控的性能数据均可，同理，第一性能数据也可以不做特别限制。

步骤S106，将所拉取的第二性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。其中，监控服务器能够将拉取的第二性能数据存储到监控服务系统的本地磁盘中的Prometheus数据库中以便于进行监控服务器进行统一分析处理，从而实现对私有云的全面的监控。

综上，本申请实施例能够通过中转服务单元以及收集数据单元的设置来实现对处于不同网络的数据的拉取，从而实现对基于私有云的云管理平台的网络资源监控、存储资源监控、中间件资源监控、弹性伸缩监控以及触发的监控等，能够实现监控服务系统对云管理平台的全面快速的监控，有效降低了私有云监控的运维成本，提高了用户的使用体验度效果。

请参阅图4，图4是本申请另一实施例提供的一种基于非扁平网络的私有云监控方法的示意流程图。如图4所示，该方法的步骤包括步骤S401～S404′。其中与上述实施例中的步骤S101-S104类似的步骤的相关解释和详细说明在此不再赘述，下面详细说明的为本实施例中所增加的步骤。

步骤S401，若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件，所述云管理平台包括若干待监控服务器，所述配置文件包括数据采集策略和告警策略。

步骤S402，若所述监控服务系统包括一个本地磁盘，根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据。

步骤S403，将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。

步骤S404，根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。

步骤S402′，若所述监控服务系统包括多个具有网络隔离的本地磁盘，分别确定每个本地磁盘所处的网络中的待监控服务器。其中，若监控服务系统包括多个具有网络隔离的本地磁盘，则每个本地磁盘都可以使用Prometheus监控进行数据监控。此时可以确定每个本地磁盘所处的网络中所包括的待监控服务器，从而分别进行相应的数据获取和分析。

步骤S402a′，获取每个本地磁盘中的Prometheus监控的配置文件中的数据采集策略。其中，为了确定每个本地磁盘的所在网络的待监控服务器额数据，可以获取每个本地磁盘中的Prometheus监控的配置文件中的数据采集策略和告警策略以分别进行相应的数据处理。

步骤S403′，分别根据不同的数据采集策略采集每个本地磁盘所处的网络中的待监控服务器的性能数据，并对应地存储至相应的本地磁盘的Prometheus数据库中。其中，根据不同的数据采集策略可以分别对应采集处于不同网络中的待监控服务器的性能数据，并将采集到的性能数据存储至相应的本地磁盘的Prometheus数据库中，以供调用。

步骤S404′，根据预设规则确定其中一个本地磁盘为主本地磁盘，以拉取其余的本地磁盘的Prometheus数据库中的性能数据，并存储至主本地磁盘的Prometheus数据库中。其中，此处的预设规则可以是指将本地磁盘所在网络中包括的待检测服务器的数量最多的本地磁盘作为主本地磁盘，该主本地磁盘的监控服务器能够拉取其余的本地磁盘中Prometheus数据库中的性能数据，并都存储至主本地磁盘的Prometheus数据库中，以便于进行相应的分析。

步骤S405′，确定主本地磁盘的Prometheus监控的配置文件中的告警策略，根据该告警策略从主本地磁盘的Prometheus数据库中读取的相应的数据进行告警分析。其中，具体可以是确定主本地磁盘的Prometheus监控的配置文件中的告警策略，根据该告警策略实现Prometheus数据库中的性能数据的全面分析。

本领域普通技术员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等。

请参阅图5，对应上述一种基于非扁平网络的私有云监控方法，本申请实施例还提出一种基于非扁平网络的私有云监控装置，该装置100包括：文件获取单元101、第一数据拉取单元102、第一存储单元103以及第一告警分析单元104。

所述文件获取单元101，用于若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件，所述云管理平台包括若干待监控服务器，所述配置文件包括数据采集策略和告警策略。

所述第一数据拉取单元102，用于若所述监控服务系统包括一个本地磁盘，根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据。

如图6所示，作为进一步的的实施例，所述预设的数据中转件可以包括中转服务模块以及数据收集模块，故所述第一数据拉取单元102具体可以包括第一数据推送单元201以及第一处理单元202。

所述第一数据推送单元201，用于根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，以使所述数据采集模块接收不位于监控服务系统的本次磁盘所在的网络中的待监控服务器通过HTTP接口推送的第一性能数据，并将所接收到的第一性能数据推送到所述中转服务模块进行缓存。

所述第一处理单元202，用于拉取所述中转服务模块中缓存的第一性能数据。

所述第一存储单元103，用于将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。

所述第一告警分析单元104，用于根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。

作为可选的实施例，如图7所示，本申请的所述第一告警分析单元104具体可以包括解析单元301、分析单元302以及告警单元303。

所述解析单元301，用于解析所述配置文件的告警策略以得到数据分析规则以及预设告警范围。其中，配置文件中包括有告警策略，通常告警策略可以包括数据分析规则和预设告警范围，其中，数据分析规则是指对数据进行分析的方法，预设告警范围是指若会对整个云管理平台的私有云造成威胁或影响的相关数据被分析之后得到的结果范围。

所述分析单元302，用于根据所述数据分析规则对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行分析以得到相应的分析结果。其中，可以通过所述数据分析规则对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行全面地分析，从而得到一个相应的分析结果。

所述告警单元303，用于若所述分析结果位于预设告警范围内，则生成相应的告警信息以进行告警。其中，当分析结果位于预设告警范围内时，则表明私有云面临威胁或者安全性能不稳定，此时可以生成相应的告警信息进行告警提示用户进行处理。

另外，在一实施例中，本申请的第一告警分析单元104之前还可以包括以下单元：

第二数据拉取单元105，用于根据所述配置文件中的数据采集策略从位于监控服务系统的本地磁盘所在的网络中的待监控服务器上拉取相应的第二性能数据。其中，若待监控服务器位于监控服务系统的本地磁盘所在的网络中，此时监控服务器能够直接拉取该待监控服务器上的相关的第二性能数据。所述第二性能数据也可是存储服务器的存储空间占用比，或者还可以是网络服务器的速率、带宽、吞吐量、时延、时延带宽积、往返时间RTT、利用率等，或者还可以是服务器的CUP运行比例等数据，当然，在本实施例中，具体也不做限制，只要是满足对私有云的监控的性能数据均可，同理，第一性能数据也可以不做特别限制。

第二存储单元106，用于将所拉取的第二性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。其中，监控服务器能够将拉取的第二性能数据存储到监控服务系统的本地磁盘中的Prometheus数据库中以便于进行监控服务器进行统一分析处理，从而实现对私有云的全面的监控。

请参阅图8，对应上述一种基于非扁平网络的私有云监控方法，本申请另一实施例还提出一种基于非扁平网络的私有云监控装置，该装置400包括：文件获取单元401、第一数据拉取单元402、第一存储单元403、第一告警分析单元404、服务器确定单元402′、策略获取单元402a′、第二存储单元403′、第三存储单元404′以及第二告警分析单元405′。

文件获取单元401，用于若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件，所述云管理平台包括若干待监控服务器，所述配置文件包括数据采集策略和告警策略。

第一数据拉取单元402，用于若所述监控服务系统包括一个本地磁盘，根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据。

第一存储单元403，用于将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。

第一告警分析单元404，用于根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。

服务器确定单元402′，用于若所述监控服务系统包括多个具有网络隔离的本地磁盘，分别确定每个本地磁盘所处的网络中的待监控服务器。其中，若监控服务系统包括多个具有网络隔离的本地磁盘，则每个本地磁盘都可以使用Prometheus监控进行数据监控。此时可以确定每个本地磁盘所处的网络中所包括的待监控服务器，从而分别进行相应的数据获取和分析。

策略获取单元402a′，用于获取每个本地磁盘中的Prometheus监控的配置文件中的数据采集策略。其中，为了确定每个本地磁盘的所在网络的待监控服务器额数据，可以获取每个本地磁盘中的Prometheus监控的配置文件中的数据采集策略和告警策略以分别进行相应的数据处理。

第二存储单元403′，用于分别根据不同的数据采集策略采集每个本地磁盘所处的网络中的待监控服务器的性能数据，并对应地存储至相应的本地磁盘的Prometheus数据库中。其中，根据不同的数据采集策略可以分别对应采集处于不同网络中的待监控服务器的性能数据，并将采集到的性能数据存储至相应的本地磁盘的Prometheus数据库中，以供调用。

第三存储单元404′，用于根据预设规则确定其中一个本地磁盘为主本地磁盘，以拉取其余的本地磁盘的Prometheus数据库中的性能数据，并存储至主本地磁盘的Prometheus数据库中。其中，此处的预设规则可以是指将本地磁盘所在网络中包括的待检测服务器的数量最多的本地磁盘作为主本地磁盘，该主本地磁盘的监控服务器能够拉取其余的本地磁盘中Prometheus数据库中的性能数据，并都存储至主本地磁盘的Prometheus数据库中，以便于进行相应的分析。

第二告警分析单元405′，用于确定主本地磁盘的Prometheus监控的配置文件中的告警策略，根据该告警策略从主本地磁盘的Prometheus数据库中读取的相应的数据进行告警分析。其中，具体可以是确定主本地磁盘的Prometheus监控的配置文件中的告警策略，根据该告警策略实现Prometheus数据库中的性能数据的全面分析。

需要说明的是，所属领域的技术人员可以清楚地了解到，上述基于非扁平网络的私有云监控装置100和各单元的具体实现过程，可以参考前述方法实施例中的相应描述，为了描述的方便和简洁，在此不再赘述。

由以上可见，在硬件实现上，以上文件获取单元101、第一数据拉取单元102、第一存储单元103以及第一告警分析单元104等可以以硬件形式内嵌于或独立于基于非扁平网络的私有云监控的装置中，也可以以软件形式存储于基于非扁平网络的私有云监控装置的存储器中，以便处理器调用执行以上各个单元对应的操作。该处理器可以为中央处理单元(CPU)、微处理器、单片机等。

上述基于非扁平网络的私有云监控装置可以实现为一种计算机程序的形式，计算机程序可以在如图9所示的计算机设备上运行。

图9为本申请一种计算机设备的结构组成示意图。该设备可以是服务器，该服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

参照图9，该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032，该计算机程序5032被执行时，可使得处理器502执行一种基于非扁平网络的私有云监控方法。

该处理器502用于提供计算和控制能力，支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行一种基于非扁平网络的私有云监控方法。

该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解，图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现上述实施例中的基于非扁平网络的私有云监控方法中的步骤。

应当理解，在本申请实施例中，处理器502可以是中央处理单元(Central Processing Unit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中，该存储介质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行，以实现上述方法的实施例的流程步骤。

因此，本申请还提供一种存储介质。该计算机可读存储介质可以是非易失性，也可以是易失性。该存储介质存储有计算机程序，该计算机程序被处理器执行时使处理器执行上述实施例中的基于非扁平网络的私有云监控方法中的步骤。

所述存储介质为实体的、非瞬时性的存储介质，例如可以是U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的实体存储介质。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的。例如，各个单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，终端，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种基于非扁平网络的私有云监控方法，其中，所述方法包括：

若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件，所述云管理平台包括若干待监控服务器，所述配置文件包括数据采集策略和告警策略；

若所述监控服务系统包括一个本地磁盘，根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据；

将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中；

根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。
如权利要求1所述的方法，其中，所述预设的数据中转件包括中转服务模块以及数据收集模块，所述根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据的步骤，包括：

根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，以使所述数据采集模块接收不位于监控服务系统的本次磁盘所在的网络中的待监控服务器通过HTTP接口推送的第一性能数据，并将所接收到的第一性能数据推送到所述中转服务模块进行缓存；

拉取所述中转服务模块中缓存的第一性能数据。
如权利要求2所述的方法，其中，所述不位于监控服务系统的本地磁盘所在的网络中的待监控服务器是存储服务器，所述第一性能数据包括存储空间占用比，所述根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，以使所述数据采集模块接收不位于监控服务系统的本次磁盘所在的网络中的待监控服务器通过HTTP接口推送的第一性能数据，并将所接收到的第一性能数据推送到所述中转服务模块进行缓存的步骤，包括：

根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，以使所述数据采集模块接收不位于监控服务系统所在的网络中的存储服务器通过HTTP接口推送的存储空间占用比，并将所接收到的存储空间占用比推送到所述中转服务模块进行缓存。
如权利要求2所述的方法，其中，不位于监控服务系统所在的网络中的待监控服务器是网络服务器，所述第一性能数据包括速率、带宽、吞吐量、时延、时延带宽积、往返时间以及利用率中的一个或者多个。
如权利要求1所述的方法，其中，所述根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析的步骤，包括：

解析所述配置文件的告警策略以得到数据分析规则以及预设告警范围；

根据所述数据分析规则对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行分析以得到相应的分析结果；

若所述分析结果位于预设告警范围内，则生成相应的告警信息以进行告警。
如权利要求1所述的方法，其中，所述根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析的步骤之前，还包括：

根据所述配置文件中的数据采集策略从位于监控服务系统的本地磁盘所在的网络中的待监控服务器上拉取相应的第二性能数据；

将所拉取的第二性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。
如权利要求1所述的方法，其中，所述若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件的步骤之后，还包括：

若所述监控服务系统包括多个具有网络隔离的本地磁盘，分别确定每个本地磁盘所处的网络中的待监控服务器；

获取每个本地磁盘中的Prometheus监控的配置文件中的数据采集策略；

分别根据不同的数据采集策略采集每个本地磁盘所处的网络中的待监控服务器的性能数据，并对应地存储至相应的本地磁盘的Prometheus数据库中；

根据预设规则确定其中一个本地磁盘为主本地磁盘，以拉取其余的本地磁盘的Prometheus数据库中的性能数据，并存储至主本地磁盘的Prometheus数据库中；

确定主本地磁盘的Prometheus监控的配置文件中的告警策略，根据该告警策略从主本地磁盘的Prometheus数据库中读取的相应的数据进行告警分析。
一种基于非扁平网络的私有云监控装置，其中，所述装置包括：

文件获取单元，用于若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件，所述云管理平台包括若干待监控服务器，所述配置文件包括数据采集策略和告警策略；

第一数据拉取单元，用于若所述监控服务系统包括一个本地磁盘，根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据；

第一存储单元，用于将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中；

第一告警分析单元，用于根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。
一种计算机设备，包括存储器以及与所述存储器相连的处理器；其中，所述存储器用于存储计算机程序；所述处理器用于运行所述存储器中存储的计算机程序，以执行以下步骤：

若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件，所述云管理平台包括若干待监控服务器，所述配置文件包括数据采集策略和告警策略；

若所述监控服务系统包括一个本地磁盘，根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据；

将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中；

根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。
如权利要求9所述的计算机设备，其中，所述预设的数据中转件包括中转服务模块以及数据收集模块，所述根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据，包括：

根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，以使所述数据采集模块接收不位于监控服务系统的本次磁盘所在的网络中的待监控服务器通过HTTP接口推送的第一性能数据，并将所接收到的第一性能数据推送到所述中转服务模块进行缓存；

拉取所述中转服务模块中缓存的第一性能数据。
如权利要求10所述的计算机设备，其中，所述不位于监控服务系统的本地磁盘所在的网络中的待监控服务器是存储服务器，所述第一性能数据包括存储空间占用比，所述根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，以使所述数据采集模块接收不位于监控服务系统的本次磁盘所在的网络中的待监控服务器通过HTTP接口推送的第一性能数据，并将所接收到的第一性能数据推送到所述中转服务模块进行缓存，包括：

根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，以使所述数据采集模块接收不位于监控服务系统所在的网络中的存储服务器通过HTTP接口推送的存储空间占用比，并将所接收到的存储空间占用比推送到所述中转服务模块进行缓存。
如权利要求9所述的计算机设备，其中，所述根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析，包括：

解析所述配置文件的告警策略以得到数据分析规则以及预设告警范围；

根据所述数据分析规则对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行分析以得到相应的分析结果；

若所述分析结果位于预设告警范围内，则生成相应的告警信息以进行告警。
如权利要求9所述的计算机设备，其中，所述根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析之前，还包括：

根据所述配置文件中的数据采集策略从位于监控服务系统的本地磁盘所在的网络中的待监控服务器上拉取相应的第二性能数据；

将所拉取的第二性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。
如权利要求9所述的计算机设备，其中，所述若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件之后，还包括：

若所述监控服务系统包括多个具有网络隔离的本地磁盘，分别确定每个本地磁盘所处的网络中的待监控服务器；

获取每个本地磁盘中的Prometheus监控的配置文件中的数据采集策略；

分别根据不同的数据采集策略采集每个本地磁盘所处的网络中的待监控服务器的性能数据，并对应地存储至相应的本地磁盘的Prometheus数据库中；

根据预设规则确定其中一个本地磁盘为主本地磁盘，以拉取其余的本地磁盘的Prometheus数据库中的性能数据，并存储至主本地磁盘的Prometheus数据库中；

确定主本地磁盘的Prometheus监控的配置文件中的告警策略，根据该告警策略从主本地磁盘的Prometheus数据库中读取的相应的数据进行告警分析。
一种计算机可读存储介质，其中，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行以下操作：

若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件，所述云管理平台包括若干待监控服务器，所述配置文件包括数据采集策略和告警策略；

若所述监控服务系统包括一个本地磁盘，根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据；

将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中；

根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。
如权利要求15所述的计算机可读存储介质，其中，所述预设的数据中转件包括中转服务模块以及数据收集模块，所述根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据，包括：

根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，以使所述数据采集模块接收不位于监控服务系统的本次磁盘所在的网络中的待监控服务器通过HTTP接口推送的第一性能数据，并将所接收到的第一性能数据推送到所述中转服务模块进行缓存；

拉取所述中转服务模块中缓存的第一性能数据。
如权利要求16所述的计算机可读存储介质，其中，所述不位于监控服务系统的本地磁盘所在的网络中的待监控服务器是存储服务器，所述第一性能数据包括存储空间占用比，所述根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，以使所述数据采集模块接收不位于监控服务系统的本次磁盘所在的网络中的待监控服务器通过HTTP接口推送的第一性能数据，并将所接收到的第一性能数据推送到所述中转服务模块进行缓存，包括：

根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求，以使所述数据采集模块接收不位于监控服务系统所在的网络中的存储服务器通过HTTP接口推送的存储空间占用比，并将所接收到的存储空间占用比推送到所述中转服务模块进行缓存。
如权利要求15所述的计算机可读存储介质，其中，所述根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析，包括：

解析所述配置文件的告警策略以得到数据分析规则以及预设告警范围；

根据所述数据分析规则对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行分析以得到相应的分析结果；

若所述分析结果位于预设告警范围内，则生成相应的告警信息以进行告警。
如权利要求15所述的计算机可读存储介质，其中，所述根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析之前，还包括：

根据所述配置文件中的数据采集策略从位于监控服务系统的本地磁盘所在的网络中的待监控服务器上拉取相应的第二性能数据；

将所拉取的第二性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。
如权利要求15所述的计算机可读存储介质，其中，所述若接收到云管理平台发起的监控请求，根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件之后，还包括：

若所述监控服务系统包括多个具有网络隔离的本地磁盘，分别确定每个本地磁盘所处的网络中的待监控服务器；

获取每个本地磁盘中的Prometheus监控的配置文件中的数据采集策略；

分别根据不同的数据采集策略采集每个本地磁盘所处的网络中的待监控服务器的性能数据，并对应地存储至相应的本地磁盘的Prometheus数据库中；

根据预设规则确定其中一个本地磁盘为主本地磁盘，以拉取其余的本地磁盘的Prometheus数据库中的性能数据，并存储至主本地磁盘的Prometheus数据库中；

确定主本地磁盘的Prometheus监控的配置文件中的告警策略，根据该告警策略从主本地磁盘的Prometheus数据库中读取的相应的数据进行告警分析。