CN111459750A - 基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质 - Google Patents

基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111459750A
CN111459750A CN202010189441.6A CN202010189441A CN111459750A CN 111459750 A CN111459750 A CN 111459750A CN 202010189441 A CN202010189441 A CN 202010189441A CN 111459750 A CN111459750 A CN 111459750A
Authority
CN
China
Prior art keywords
monitoring
data
local disk
configuration file
service system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010189441.6A
Other languages
English (en)
Inventor
梁桂明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010189441.6A priority Critical patent/CN111459750A/zh
Priority to PCT/CN2020/099187 priority patent/WO2021184586A1/zh
Publication of CN111459750A publication Critical patent/CN111459750A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质,其中所述方法包括若接收到云管理平台发起的监控请求,根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件;根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据;将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中;根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。本发明可实现对云管理平台的全面快速的监控,有效降低了私有云监控的运维成本,提高了用户的使用体验度。

Description

基于非扁平网络的私有云监控方法、装置、计算机设备及存储 介质
技术领域
本发明涉及云监控领域,尤其涉及一种基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质。
背景技术
云服务是基于互联网的相关服务的增加、使用和交互模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云服务可以将企业所需的软硬件、资料都放到网络上,在任何时间、地点,使用不同的IT设备互相连接,实现数据存取、运算等目的。当前,常见的云服务有公共云(Public Cloud)与私有云(Private Cloud)两种。其中的私有云(Private Clouds)是为一个客户单独使用而构建的,因而能够提供对数据、安全性和服务质量的最有效控制。
在当前的私有云监控方案中,各个云厂商都是基于对公有云的监控方案进行裁剪,然后部署到客户的私有云中,但是此时客户很难实现对相关私有云的监控的运维,增加了各个云厂商的运维成本和时间。再者,针对私有云的监控方案是以产品的形式交付给到各个用户的,不同的用户之间所使用的网络也基本属于隔离状态;同时在现有的私有云的开源的监控方案上,基本都是基于推送的方式去做数据采集的,如基于zabbix的数据推送的方案,也有基于open-falcon的数据推送方案,并没有没有直接使用可直接进行数据拉取的监控方案,故并不能够实现对整个私有云的相关性能数据的实时可靠的监控。
发明内容
本发明实施例提供一种基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质,能够使得控服务系统对云管理平台的全面快速的监控,有效降低了私有云监控的运维成本,提高了用户的使用体验度。
第一方面,本发明实施例提供了一种基于非扁平网络的私有云监控方法,该方法包括:
若接收到云管理平台发起的监控请求,根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件,所述云管理平台包括若干待监控服务器,所述配置文件包括数据采集策略和告警策略;
若所述监控服务系统包括一个本地磁盘,根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据;
将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中;
根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。
第二方面,本发明实施例还提供了一种基于非扁平网络的私有云监控装置,该装置包括:
文件获取单元,用于若接收到云管理平台发起的监控请求,根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件,所述云管理平台包括若干待监控服务器,所述配置文件包括数据采集策略和告警策略;
第一数据拉取单元,用于若所述监控服务系统包括一个本地磁盘,根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据;
第一存储单元,用于将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中;
第一告警分析单元,用于根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。
第三方面,本发明实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现上述方法。
本发明实施例提供了一种基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质。其中,所述方法包括:若接收到云管理平台发起的监控请求,根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件;若所述监控服务系统包括一个本地磁盘,根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据;将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中;根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。本发明实施例能够通过中转服务单元以及收集数据单元的设置来实现对处于不同网络的数据的拉取,从而实现对基于私有云的云管理平台的网络资源监控、存储资源监控、中间件资源监控、弹性伸缩监控以及触发的监控等,能够实现监控服务系统对云管理平台的全面快速的监控,有效降低了私有云监控的运维成本,提高了用户的使用体验度效果。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于非扁平网络的私有云监控方法的流程示意图;
图1a是本发明实施例提供的一种基于非扁平网络的私有云监控方法的应用场景示意图;
图2是本发明实施例提供的一种基于非扁平网络的私有云监控方法的子流程示意图;
图3是本发明实施例提供的一种基于非扁平网络的私有云监控方法的子流程示意图;
图4是本发明另一实施例提供的一种基于非扁平网络的私有云监控方法的流程示意图;
图5是本发明实施例提供的一种基于非扁平网络的私有云监控装置的示意性框图;
图6是本发明实施例提供的一种基于非扁平网络的私有云监控装置的单元的示意性框图;
图7是本发明实施例提供的一种基于非扁平网络的私有云监控装置的单元的示意性框图;
图8是本发明另一实施例提供的一种基于非扁平网络的私有云监控装置的示意性框图;
图9是本发明实施例提供的一种计算机设备结构组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
请参阅图1和图1a,图1是本申请实施例提供的一种基于非扁平网络的私有云监控方法的示意流程图,图1a是本申请实施例中基于非扁平网络的私有云监控方法的场景示意图。该基于非扁平网络的私有云监控方法应用于监控服务器系统中的管理服务器10中。该管理服务器10根据基于非扁平网络的私有云监控方法能够通过中转服务单元以及收集数据单元的设置来实现对处于不同网络的数据的拉取,从而实现对基于私有云的云管理平台20的网络资源监控、存储资源监控、中间件资源监控、弹性伸缩监控以及触发的监控等,能够使得监控服务系统对云管理平台20的全面快速的监控,有效降低了私有云监控的运维成本,提高了用户的使用体验度。以下将以管理服务器10的角度详细地介绍该基于非扁平网络的私有云监控方法的各个步骤。
如图1所示,其是本申请实施例提供的一种基于非扁平网络的私有云监控方法,该方法的步骤包括步骤S101~S104。
步骤S101,若接收到云管理平台发起的监控请求,根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件,所述云管理平台包括若干待监控服务器,所述配置文件包括数据采集策略和告警策略。
在本实施例中,监控服务系统用于实现对云管理平台的相关数据信息的监控,当监控服务系统的监控服务器接收到用户云管理平台发起的监控请求,此时可以根据该监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件。通常,此处的云管理平台为用户的私有云的用于实现对其管理的平台,该平台可以包括提供私有云的相关服务器或者服务器群集等,此处的相关服务器或者服务器群集即为待监控服务器。而监控服务系统能够实现对私有云的相关数据信息的监控,为了实现对私有云的全面监控,避免网络隔离对于相关数据拉取的影响,此时需要区分待监控服务器是否与监控服务系统的本地磁盘是否位于同一网络中。
步骤S102,若所述监控服务系统包括一个本地磁盘,根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据。
在本实施例中,当所述监控服务系统包括一个本地磁盘的时候,监控服务器能够所述配置文件中的数据采集策略以及预设的数据中转件,直接从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据。即监控服务器能够解析所获取的配置文件,从而获取到配置文件中的数据采集策略,以便进行数据的拉取和采集。例如,对于私有云而言,为对其性能及安全等进行实时监控,此时可以通过预设的数据中转件对云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器传输的数据流量信息、数据存储信息以及服务器的CPU占比等性能数据进行监控获取,并通过后续的对比分析来实现对私有云的性能的监控和告警等。
作为可选的实施例,该数据采集策略可以是每隔预设时间即对相关数据进行一次采集更新。
作为另一可选的实施例,所述本地磁盘还可以包括一个主本地子磁盘以及一个从本地子磁盘,其中,主本地子磁盘中的相关数据可以及时备份至从本地子磁盘中,从而可以确保监控服务系统的高可用性。
如图2所示,作为进一步的的实施例,所述预设的数据中转件可以包括中转服务模块以及数据收集模块,故所述步骤S102具体可以包括步骤S201~S202。
步骤S201,根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求,以使所述数据采集模块接收不位于监控服务系统的本次磁盘所在的网络中的待监控服务器通过HTTP接口推送的第一性能数据,并将所接收到的第一性能数据推送到所述中转服务模块进行缓存。
其中,所述预设的数据中转件中的中转服务模块可以是Pushgateway。Pushgateway是一个独立的服务,Pushgateway位于应用程序发送指标和Prometheus服务器之间。Pushgateway接收指标,然后将其作为目标被基于Prometheus的服务器拉取;也可以将其看作代理服务,它接收度量,而不是探测。故中转服务模块作为中间件,能够接收数据采集模块所推送的处于网络隔离中的待监控服务器的相关的性能数据,以供监控服务器进行拉取。
作为进一步的实施例,不位于监控服务系统的本地磁盘所在的网络中的待监控服务器可以是存储服务器,所述第一性能数据包括存储空间占用比,所述步骤S201具体可以是:
根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求,以使所述数据采集模块接收不位于监控服务系统所在的网络中的存储服务器通过HTTP接口推送的存储空间占用比,并将所接收到的存储空间占用比推送到所述中转服务模块进行缓存。
其中,若存储服务器与监控服务器系统的本地磁盘不在同一网络中,此时的要实现本地磁盘中的Prometheus监控,需要通过监控服务器所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求,当数据采集模块接收到数据采集请求后,则能够接收有存储服务器通过HTTP接口推送的存储空间占用比,同时也鞥能够通过HTTP接口推送数据的形式将相关的存储空间占用比推送至中转服务模块进行缓存。
再者,例如,所述存储服务器可以是NAS存储集群,该NAS存储集群可以包括多个存储单元,不同的存储单元之间可能存在网络隔离,且每个子存储单元之间包括多个级别的子存储单元,通常低一级的子存储单元能够向高一级的子存储单元推送跟存储相关的第一性能数据,并能够通过最高一级的子存储单元将数据直接推送至数据收集模块,数据收集模块则能够将所收集到的来自各个不同网络的第一性能数据(如存储空间占用比)推送至中转服务模块中进行缓存。
作为另一实施例,不位于监控服务系统所在的网络中的待监控服务器还可以是网络服务器,所述第一性能数据包括速率、带宽、吞吐量、时延、时延带宽积、往返时间RTT、利用率等。所述步骤S201的具体实现方式可以参见上述当不位于监控服务系统所在的网络中的待监控服务器还可以是存储服务器时的相关说明,具体在此不再赘述。
步骤S202,拉取所述中转服务模块中缓存的第一性能数据。
其中,监控服务器能够直接拉取所述中转服务模块中缓存的第一性能数据,从而减少了网络隔离对云管理平台的全面监控的影响,提高了监控的效率和用户使用体验度。
步骤S103,将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。
在本实施例中,当监控服务器采集到相应的数据后,为了便于对相关数据进行统计分析,可以将所采集到的数据都存储到监控服务系统的本地磁盘的Prometheus数据库中,当需要进行告警分析的时候,则从Prometheus数据库中进行数据调取,不仅方便数据的管理,还便于用户对数据的处理和分析。
步骤S104,根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。
在本实施例中,监控服务器还能够根据所述配置文件的告警策略,从本地磁盘中的Prometheus数据库中读取的相应的数据,并能够实现对所读取的相关数据进行告警分析处理。
作为可选的实施例,如图3所示,本申请的步骤S104具体可以包括步骤S301~S303。
步骤S301,解析所述配置文件的告警策略以得到数据分析规则以及预设告警范围。其中,配置文件中包括有告警策略,通常告警策略可以包括数据分析规则和预设告警范围,其中,数据分析规则是指对数据进行分析的方法,预设告警范围是指若会对整个云管理平台的私有云造成威胁或影响的相关数据被分析之后得到的结果范围。
步骤S302,根据所述数据分析规则对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行分析以得到相应的分析结果。其中,可以通过所述数据分析规则对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行全面地分析,从而得到一个相应的分析结果。
步骤S303,若所述分析结果位于预设告警范围内,则生成相应的告警信息以进行告警。其中,当分析结果位于预设告警范围内时,则表明私有云面临威胁或者安全性能不稳定,此时可以生成相应的告警信息进行告警提示用户进行处理。
另外,在一实施例中,本申请的步骤S104之前还可以包括以下步骤:
步骤S105,根据所述配置文件中的数据采集策略从位于监控服务系统的本地磁盘所在的网络中的待监控服务器上拉取相应的第二性能数据。其中,若待监控服务器位于监控服务系统的本地磁盘所在的网络中,此时监控服务器能够直接拉取该待监控服务器上的相关的第二性能数据。所述第二性能数据也可是存储服务器的存储空间占用比,或者还可以是网络服务器的速率、带宽、吞吐量、时延、时延带宽积、往返时间RTT、利用率等,或者还可以是服务器的CUP运行比例等数据,当然,在本实施例中,具体也不做限制,只要是满足对私有云的监控的性能数据均可,同理,第一性能数据也可以不做特别限制。
步骤S106,将所拉取的第二性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。其中,监控服务器能够将拉取的第二性能数据存储到监控服务系统的本地磁盘中的Prometheus数据库中以便于进行监控服务器进行统一分析处理,从而实现对私有云的全面的监控。
综上,本发明实施例能够通过中转服务单元以及收集数据单元的设置来实现对处于不同网络的数据的拉取,从而实现对基于私有云的云管理平台的网络资源监控、存储资源监控、中间件资源监控、弹性伸缩监控以及触发的监控等,能够实现监控服务系统对云管理平台的全面快速的监控,有效降低了私有云监控的运维成本,提高了用户的使用体验度效果。
请参阅图4,图4是本发明另一实施例提供的一种基于非扁平网络的私有云监控方法的示意流程图。如图4所示,该方法的步骤包括步骤S401~S404′。其中与上述实施例中的步骤S101-S104类似的步骤的相关解释和详细说明在此不再赘述,下面详细说明的为本实施例中所增加的步骤。
步骤S401,若接收到云管理平台发起的监控请求,根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件,所述云管理平台包括若干待监控服务器,所述配置文件包括数据采集策略和告警策略。
步骤S402,若所述监控服务系统包括一个本地磁盘,根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据。
步骤S403,将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。
步骤S404,根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。
步骤S402′,若所述监控服务系统包括多个具有网络隔离的本地磁盘,分别确定每个本地磁盘所处的网络中的待监控服务器。其中,若监控服务系统包括多个具有网络隔离的本地磁盘,则每个本地磁盘都可以使用Prometheus监控进行数据监控。此时可以确定每个本地磁盘所处的网络中所包括的待监控服务器,从而分别进行相应的数据获取和分析。
步骤S402a′,获取每个本地磁盘中的Prometheus监控的配置文件中的数据采集策略。其中,为了确定每个本地磁盘的所在网络的待监控服务器额数据,可以获取每个本地磁盘中的Prometheus监控的配置文件中的数据采集策略和告警策略以分别进行相应的数据处理。
步骤S403′,分别根据不同的数据采集策略采集每个本地磁盘所处的网络中的待监控服务器的性能数据,并对应地存储至相应的本地磁盘的Prometheus数据库中。其中,根据不同的数据采集策略可以分别对应采集处于不同网络中的待监控服务器的性能数据,并将采集到的性能数据存储至相应的本地磁盘的Prometheus数据库中,以供调用。
步骤S404′,根据预设规则确定其中一个本地磁盘为主本地磁盘,以拉取其余的本地磁盘的Prometheus数据库中的性能数据,并存储至主本地磁盘的Prometheus数据库中。其中,此处的预设规则可以是指将本地磁盘所在网络中包括的待检测服务器的数量最多的本地磁盘作为主本地磁盘,该主本地磁盘的监控服务器能够拉取其余的本地磁盘中Prometheus数据库中的性能数据,并都存储至主本地磁盘的Prometheus数据库中,以便于进行相应的分析。
步骤S405′,确定主本地磁盘的Prometheus监控的配置文件中的告警策略,根据该告警策略从主本地磁盘的Prometheus数据库中读取的相应的数据进行告警分析。其中,具体可以是确定主本地磁盘的Prometheus监控的配置文件中的告警策略,根据该告警策略实现Prometheus数据库中的性能数据的全面分析。
本领域普通技术员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等。
请参阅图5,对应上述一种基于非扁平网络的私有云监控方法,本发明实施例还提出一种基于非扁平网络的私有云监控装置,该装置100包括:文件获取单元101、第一数据拉取单元102、第一存储单元103以及第一告警分析单元104。
所述文件获取单元101,用于若接收到云管理平台发起的监控请求,根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件,所述云管理平台包括若干待监控服务器,所述配置文件包括数据采集策略和告警策略。
在本实施例中,监控服务系统用于实现对云管理平台的相关数据信息的监控,当监控服务系统的监控服务器接收到用户云管理平台发起的监控请求,此时可以根据该监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件。通常,此处的云管理平台为用户的私有云的用于实现对其管理的平台,该平台可以包括提供私有云的相关服务器或者服务器群集等,此处的相关服务器或者服务器群集即为待监控服务器。而监控服务系统能够实现对私有云的相关数据信息的监控,为了实现对私有云的全面监控,避免网络隔离对于相关数据拉取的影响,此时需要区分待监控服务器是否与监控服务系统的本地磁盘是否位于同一网络中。
所述第一数据拉取单102,用于若所述监控服务系统包括一个本地磁盘,根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据。
在本实施例中,当所述监控服务系统包括一个本地磁盘的时候,监控服务器能够所述配置文件中的数据采集策略以及预设的数据中转件,直接从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据。即监控服务器能够解析所获取的配置文件,从而获取到配置文件中的数据采集策略,以便进行数据的拉取和采集。例如,对于私有云而言,为对其性能及安全等进行实时监控,此时可以通过预设的数据中转件对云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器传输的数据流量信息、数据存储信息以及服务器的CPU占比等性能数据进行监控获取,并通过后续的对比分析来实现对私有云的性能的监控和告警等。
作为可选的实施例,该数据采集策略可以是每隔预设时间即对相关数据进行一次采集更新。
作为另一可选的实施例,所述本地磁盘还可以包括一个主本地子磁盘以及一个从本地子磁盘,其中,主本地子磁盘中的相关数据可以及时备份至从本地子磁盘中,从而可以确保监控服务系统的高可用性。
如图6所示,作为进一步的的实施例,所述预设的数据中转件可以包括中转服务模块以及数据收集模块,故所述第一数据拉取单元102具体可以包括第一数据推送单元201以及第一处理单元202。
所述第一数据推送单元201,用于根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求,以使所述数据采集模块接收不位于监控服务系统的本次磁盘所在的网络中的待监控服务器通过HTTP接口推送的第一性能数据,并将所接收到的第一性能数据推送到所述中转服务模块进行缓存。
其中,所述预设的数据中转件中的中转服务模块可以是Pushgateway。Pushgateway是一个独立的服务,Pushgateway位于应用程序发送指标和Prometheus服务器之间。Pushgateway接收指标,然后将其作为目标被基于Prometheus的服务器拉取;也可以将其看作代理服务,它接收度量,而不是探测。故中转服务模块作为中间件,能够接收数据采集模块所推送的处于网络隔离中的待监控服务器的相关的性能数据,以供监控服务器进行拉取。
作为进一步的实施例,不位于监控服务系统的本地磁盘所在的网络中的待监控服务器可以是存储服务器,所述第一性能数据包括存储空间占用比,所述第一数据推送单元201具体可以是用于根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求,以使所述数据采集模块接收不位于监控服务系统所在的网络中的存储服务器通过HTTP接口推送的存储空间占用比,并将所接收到的存储空间占用比推送到所述中转服务模块进行缓存。
其中,若存储服务器与监控服务器系统的本地磁盘不在同一网络中,此时的要实现本地磁盘中的Prometheus监控,需要通过监控服务器所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求,当数据采集模块接收到数据采集请求后,则能够接收有存储服务器通过HTTP接口推送的存储空间占用比,同时也鞥能够通过HTTP接口推送数据的形式将相关的存储空间占用比推送至中转服务模块进行缓存。
再者,例如,所述存储服务器可以是NAS存储集群,该NAS存储集群可以包括多个存储单元,不同的存储单元之间可能存在网络隔离,且每个子存储单元之间包括多个级别的子存储单元,通常低一级的子存储单元能够向高一级的子存储单元推送跟存储相关的第一性能数据,并能够通过最高一级的子存储单元将数据直接推送至数据收集模块,数据收集模块则能够将所收集到的来自各个不同网络的第一性能数据(如存储空间占用比)推送至中转服务模块中进行缓存。
作为另一实施例,不位于监控服务系统所在的网络中的待监控服务器还可以是网络服务器,所述第一性能数据包括速率、带宽、吞吐量、时延、时延带宽积、往返时间RTT、利用率等。所述第一数据推送单元201的具体实现方式可以参见上述当不位于监控服务系统所在的网络中的待监控服务器还可以是存储服务器时的相关说明,具体在此不再赘述。
所述第一处理单元202,用于拉取所述中转服务模块中缓存的第一性能数据。
其中,监控服务器能够直接拉取所述中转服务模块中缓存的第一性能数据,从而减少了网络隔离对云管理平台的全面监控的影响,提高了监控的效率和用户使用体验度。
所述第一存储单元103,用于将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。
在本实施例中,当监控服务器采集到相应的数据后,为了便于对相关数据进行统计分析,可以将所采集到的数据都存储到监控服务系统的本地磁盘的Prometheus数据库中,当需要进行告警分析的时候,则从Prometheus数据库中进行数据调取,不仅方便数据的管理,还便于用户对数据的处理和分析。
所述第一告警分析单元104,用于根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。
在本实施例中,监控服务器还能够根据所述配置文件的告警策略,从本地磁盘中的Prometheus数据库中读取的相应的数据,并能够实现对所读取的相关数据进行告警分析处理。
作为可选的实施例,如图7所示,本申请的所述第一告警分析单元104具体可以包括解析单元301、分析单元302以及告警单元303。
所述解析单元301,用于解析所述配置文件的告警策略以得到数据分析规则以及预设告警范围。其中,配置文件中包括有告警策略,通常告警策略可以包括数据分析规则和预设告警范围,其中,数据分析规则是指对数据进行分析的方法,预设告警范围是指若会对整个云管理平台的私有云造成威胁或影响的相关数据被分析之后得到的结果范围。
所述分析单元302,用于根据所述数据分析规则对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行分析以得到相应的分析结果。其中,可以通过所述数据分析规则对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行全面地分析,从而得到一个相应的分析结果。
所述告警单元303,用于若所述分析结果位于预设告警范围内,则生成相应的告警信息以进行告警。其中,当分析结果位于预设告警范围内时,则表明私有云面临威胁或者安全性能不稳定,此时可以生成相应的告警信息进行告警提示用户进行处理。
另外,在一实施例中,本申请的第一告警分析单元104之前还可以包括以下单元:
第二数据拉取单元105,用于根据所述配置文件中的数据采集策略从位于监控服务系统的本地磁盘所在的网络中的待监控服务器上拉取相应的第二性能数据。其中,若待监控服务器位于监控服务系统的本地磁盘所在的网络中,此时监控服务器能够直接拉取该待监控服务器上的相关的第二性能数据。所述第二性能数据也可是存储服务器的存储空间占用比,或者还可以是网络服务器的速率、带宽、吞吐量、时延、时延带宽积、往返时间RTT、利用率等,或者还可以是服务器的CUP运行比例等数据,当然,在本实施例中,具体也不做限制,只要是满足对私有云的监控的性能数据均可,同理,第一性能数据也可以不做特别限制。
第二存储单元106,用于将所拉取的第二性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。其中,监控服务器能够将拉取的第二性能数据存储到监控服务系统的本地磁盘中的Prometheus数据库中以便于进行监控服务器进行统一分析处理,从而实现对私有云的全面的监控。
请参阅图8,对应上述一种基于非扁平网络的私有云监控方法,本发明另一实施例还提出一种基于非扁平网络的私有云监控装置,该装置400包括:文件获取单元401、第一数据拉取单元402、第一存储单元403、第一告警分析单元404、服务器确定单元402′、策略获取单元402a′、第二存储单元403′、第三存储单元404′以及第二告警分析单元405′。
文件获取单元401,用于若接收到云管理平台发起的监控请求,根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件,所述云管理平台包括若干待监控服务器,所述配置文件包括数据采集策略和告警策略。
第一数据拉取单元402,用于若所述监控服务系统包括一个本地磁盘,根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据。
第一存储单元403,用于将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。
第一告警分析单元404,用于根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。
服务器确定单元402′,用于若所述监控服务系统包括多个具有网络隔离的本地磁盘,分别确定每个本地磁盘所处的网络中的待监控服务器。其中,若监控服务系统包括多个具有网络隔离的本地磁盘,则每个本地磁盘都可以使用Prometheus监控进行数据监控。此时可以确定每个本地磁盘所处的网络中所包括的待监控服务器,从而分别进行相应的数据获取和分析。
策略获取单元402a′,用于获取每个本地磁盘中的Prometheus监控的配置文件中的数据采集策略。其中,为了确定每个本地磁盘的所在网络的待监控服务器额数据,可以获取每个本地磁盘中的Prometheus监控的配置文件中的数据采集策略和告警策略以分别进行相应的数据处理。
第二存储单元403′,用于分别根据不同的数据采集策略采集每个本地磁盘所处的网络中的待监控服务器的性能数据,并对应地存储至相应的本地磁盘的Prometheus数据库中。其中,根据不同的数据采集策略可以分别对应采集处于不同网络中的待监控服务器的性能数据,并将采集到的性能数据存储至相应的本地磁盘的Prometheus数据库中,以供调用。
第三存储单元404′,用于根据预设规则确定其中一个本地磁盘为主本地磁盘,以拉取其余的本地磁盘的Prometheus数据库中的性能数据,并存储至主本地磁盘的Prometheus数据库中。其中,此处的预设规则可以是指将本地磁盘所在网络中包括的待检测服务器的数量最多的本地磁盘作为主本地磁盘,该主本地磁盘的监控服务器能够拉取其余的本地磁盘中Prometheus数据库中的性能数据,并都存储至主本地磁盘的Prometheus数据库中,以便于进行相应的分析。
第二告警分析单元405′,用于确定主本地磁盘的Prometheus监控的配置文件中的告警策略,根据该告警策略从主本地磁盘的Prometheus数据库中读取的相应的数据进行告警分析。其中,具体可以是确定主本地磁盘的Prometheus监控的配置文件中的告警策略,根据该告警策略实现Prometheus数据库中的性能数据的全面分析。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述基于非扁平网络的私有云监控装置100和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
由以上可见,在硬件实现上,以上文件获取单元101、第一数据拉取单元102、第一存储单元103以及第一告警分析单元104等可以以硬件形式内嵌于或独立于基于非扁平网络的私有云监控的装置中,也可以以软件形式存储于基于非扁平网络的私有云监控装置的存储器中,以便处理器调用执行以上各个单元对应的操作。该处理器可以为中央处理单元(CPU)、微处理器、单片机等。
上述基于非扁平网络的私有云监控装置可以实现为一种计算机程序的形式,计算机程序可以在如图9所示的计算机设备上运行。
图9为本发明一种计算机设备的结构组成示意图。该设备可以是服务器,该服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参照图9,该计算机设备500包括通过系统总线501连接的处理器502、存储器、内存储器504和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032,该计算机程序5032被执行时,可使得处理器502执行一种基于非扁平网络的私有云监控方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种基于非扁平网络的私有云监控方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现上述实施例中的基于非扁平网络的私有云监控方法中的步骤。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,该计算机程序被处理器执行时使处理器执行上述实施例中的基于非扁平网络的私有云监控方法中的步骤。
所述存储介质为实体的、非瞬时性的存储介质,例如可以是U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、磁碟或者光盘等各种可以存储程序代码的实体存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于非扁平网络的私有云监控方法,其特征在于,所述方法包括:
若接收到云管理平台发起的监控请求,根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件,所述云管理平台包括若干待监控服务器,所述配置文件包括数据采集策略和告警策略;
若所述监控服务系统包括一个本地磁盘,根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据;
将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中;
根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。
2.如权利要求1所述的方法,其特征在于,所述预设的数据中转件包括中转服务模块以及数据收集模块,所述根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据的步骤,包括:
根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求,以使所述数据采集模块接收不位于监控服务系统的本次磁盘所在的网络中的待监控服务器通过HTTP接口推送的第一性能数据,并将所接收到的第一性能数据推送到所述中转服务模块进行缓存;
拉取所述中转服务模块中缓存的第一性能数据。
3.如权利要求2所述的方法,其特征在于,所述不位于监控服务系统的本地磁盘所在的网络中的待监控服务器是存储服务器,所述第一性能数据包括存储空间占用比,所述根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求,以使所述数据采集模块接收不位于监控服务系统的本次磁盘所在的网络中的待监控服务器通过HTTP接口推送的第一性能数据,并将所接收到的第一性能数据推送到所述中转服务模块进行缓存的步骤,包括:
根据所述配置文件中的数据采集策略控制所述中转服务模块向所述数据收集模块发送数据采集请求,以使所述数据采集模块接收不位于监控服务系统所在的网络中的存储服务器通过HTTP接口推送的存储空间占用比,并将所接收到的存储空间占用比推送到所述中转服务模块进行缓存。
4.如权利要求2所述的方法,其特征在于,不位于监控服务系统所在的网络中的待监控服务器是网络服务器,所述第一性能数据包括速率、带宽、吞吐量、时延、时延带宽积、往返时间以及利用率中的一个或者多个。
5.如权利要求1所述的方法,其特征在于,所述根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析的步骤,包括:
解析所述配置文件的告警策略以得到数据分析规则以及预设告警范围;
根据所述数据分析规则对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行分析以得到相应的分析结果;
若所述分析结果位于预设告警范围内,则生成相应的告警信息以进行告警。
6.如权利要求1所述的方法,其特征在于,所述根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析的步骤之前,还包括:
根据所述配置文件中的数据采集策略从位于监控服务系统的本地磁盘所在的网络中的待监控服务器上拉取相应的第二性能数据;
将所拉取的第二性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中。
7.如权利要求1所述的方法,其特征在于,所述若接收到云管理平台发起的监控请求,根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件的步骤之后,还包括:
若所述监控服务系统包括多个具有网络隔离的本地磁盘,分别确定每个本地磁盘所处的网络中的待监控服务器;
获取每个本地磁盘中的Prometheus监控的配置文件中的数据采集策略;
分别根据不同的数据采集策略采集每个本地磁盘所处的网络中的待监控服务器的性能数据,并对应地存储至相应的本地磁盘的Prometheus数据库中;
根据预设规则确定其中一个本地磁盘为主本地磁盘,以拉取其余的本地磁盘的Prometheus数据库中的性能数据,并存储至主本地磁盘的Prometheus数据库中;
确定主本地磁盘的Prometheus监控的配置文件中的告警策略,根据该告警策略从主本地磁盘的Prometheus数据库中读取的相应的数据进行告警分析。
8.一种基于非扁平网络的私有云监控装置,其特征在于,所述装置包括:
文件获取单元,用于若接收到云管理平台发起的监控请求,根据所述监控请求获取监控服务系统的本地磁盘中的Prometheus监控的配置文件,所述云管理平台包括若干待监控服务器,所述配置文件包括数据采集策略和告警策略;
第一数据拉取单元,用于若所述监控服务系统包括一个本地磁盘,根据所述配置文件中的数据采集策略以及预设的数据中转件从云管理平台中的不位于监控服务系统的本地磁盘的网络中的待监控服务器上拉取相应的的第一性能数据;
第一存储单元,用于将所拉取的第一性能数据存储至监控服务系统的本地磁盘中的Prometheus数据库中;
第一告警分析单元,用于根据所述配置文件的告警策略对从所述本地磁盘中的Prometheus数据库中读取的相应的数据进行告警分析。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器执行如权利要求1-7中任一项所述的方法。
CN202010189441.6A 2020-03-18 2020-03-18 基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质 Pending CN111459750A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010189441.6A CN111459750A (zh) 2020-03-18 2020-03-18 基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质
PCT/CN2020/099187 WO2021184586A1 (zh) 2020-03-18 2020-06-30 基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010189441.6A CN111459750A (zh) 2020-03-18 2020-03-18 基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN111459750A true CN111459750A (zh) 2020-07-28

Family

ID=71683209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010189441.6A Pending CN111459750A (zh) 2020-03-18 2020-03-18 基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN111459750A (zh)
WO (1) WO2021184586A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084098A (zh) * 2020-10-21 2020-12-15 中国银行股份有限公司 资源监控系统及工作方法
CN112162912A (zh) * 2020-10-23 2021-01-01 新华三大数据技术有限公司 一种云资源监控方法及系统
CN112751726A (zh) * 2020-12-17 2021-05-04 北京达佳互联信息技术有限公司 一种数据处理方法、装置、电子设备和存储介质
CN113704063A (zh) * 2021-08-26 2021-11-26 北京百度网讯科技有限公司 一种云手机的性能监控方法、装置、设备及存储介质
CN113867197A (zh) * 2021-09-16 2021-12-31 浪潮云信息技术股份公司 一种基于Prometheus的云数据中心实例监控方法
CN115314403A (zh) * 2022-07-29 2022-11-08 济南浪潮数据技术有限公司 一种混沌工程平台集成私有云的方法、系统及装置
CN116737498A (zh) * 2023-06-15 2023-09-12 中科驭数(北京)科技有限公司 遥测数据采集方法、系统、装置、设备及介质

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113778001A (zh) * 2021-09-28 2021-12-10 上海市大数据股份有限公司 一种适用于应用系统的实时数据监控系统
CN114443435B (zh) * 2022-01-27 2023-09-08 中远海运科技股份有限公司 一种面向容器微服务的性能监控告警方法及告警系统
CN114553740B (zh) * 2022-03-11 2023-11-10 以萨技术股份有限公司 一种跨网监控的方法、系统、可读存储介质及设备
CN114422339B (zh) * 2022-03-29 2022-07-01 西安塔力科技有限公司 一种自动调度的分布式数据监控系统及方法
CN114978860A (zh) * 2022-03-31 2022-08-30 亿玛创新网络(天津)有限公司 故障监控方法、装置、电子设备及存储介质
CN114945020B (zh) * 2022-05-17 2023-08-08 宝信软件(武汉)有限公司 一种基于云平台的云边协同数据接入方法以及系统
CN115174256A (zh) * 2022-07-27 2022-10-11 上海宏时数据系统有限公司 Zabbix应用的处理方法、装置、设备及介质
CN115695180B (zh) * 2022-10-28 2024-04-30 北京大学 一种私有云平台及其搭建和管理方法
CN115904879B (zh) * 2023-01-06 2023-06-06 天津卓朗昆仑云软件技术有限公司 用于Prometheus集群的实例分配系统、方法及设备
CN117376417B (zh) * 2023-12-08 2024-03-05 中铁四局集团有限公司 数据采集方法、系统、装置、计算设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190342160A1 (en) * 2018-05-01 2019-11-07 YugaByte Inc Orchestration of data services in multiple cloud infrastructures
CN110515702A (zh) * 2019-08-29 2019-11-29 浪潮云信息技术有限公司 一种计算节点故障虚拟机的自动疏散方法及装置
CN110688281A (zh) * 2019-09-25 2020-01-14 凡普数字技术有限公司 监控系统中的告警方法、装置以及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107544837B (zh) * 2016-06-24 2020-12-22 腾讯科技(深圳)有限公司 云服务设备性能数据采集系统、方法和装置
CN107844399B (zh) * 2017-10-10 2020-06-16 武汉斗鱼网络科技有限公司 自动监控数据库服务的方法、存储介质、电子设备及系统
KR102062576B1 (ko) * 2018-10-10 2020-01-06 숭실대학교산학협력단 Vm 기반의 vnf 및 컨테이너 기반의 vnf를 모두 모니터링하기 위한 vnf 모니터링 시스템
CN110262944A (zh) * 2019-06-21 2019-09-20 四川长虹电器股份有限公司 一种对K8s集群容器资源进行监控并进行告警的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190342160A1 (en) * 2018-05-01 2019-11-07 YugaByte Inc Orchestration of data services in multiple cloud infrastructures
CN110515702A (zh) * 2019-08-29 2019-11-29 浪潮云信息技术有限公司 一种计算节点故障虚拟机的自动疏散方法及装置
CN110688281A (zh) * 2019-09-25 2020-01-14 凡普数字技术有限公司 监控系统中的告警方法、装置以及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴雷: "基于私有云的云监控系统的设计与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 2019, 15 June 2019 (2019-06-15), pages 140 - 304 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084098A (zh) * 2020-10-21 2020-12-15 中国银行股份有限公司 资源监控系统及工作方法
CN112162912A (zh) * 2020-10-23 2021-01-01 新华三大数据技术有限公司 一种云资源监控方法及系统
CN112751726A (zh) * 2020-12-17 2021-05-04 北京达佳互联信息技术有限公司 一种数据处理方法、装置、电子设备和存储介质
CN112751726B (zh) * 2020-12-17 2022-09-09 北京达佳互联信息技术有限公司 一种数据处理方法、装置、电子设备和存储介质
CN113704063A (zh) * 2021-08-26 2021-11-26 北京百度网讯科技有限公司 一种云手机的性能监控方法、装置、设备及存储介质
CN113704063B (zh) * 2021-08-26 2024-05-14 北京百度网讯科技有限公司 一种云手机的性能监控方法、装置、设备及存储介质
CN113867197A (zh) * 2021-09-16 2021-12-31 浪潮云信息技术股份公司 一种基于Prometheus的云数据中心实例监控方法
CN115314403A (zh) * 2022-07-29 2022-11-08 济南浪潮数据技术有限公司 一种混沌工程平台集成私有云的方法、系统及装置
CN115314403B (zh) * 2022-07-29 2024-05-28 郑州浪潮数据技术有限公司 一种混沌工程平台集成私有云的方法、系统及装置
CN116737498A (zh) * 2023-06-15 2023-09-12 中科驭数(北京)科技有限公司 遥测数据采集方法、系统、装置、设备及介质

Also Published As

Publication number Publication date
WO2021184586A1 (zh) 2021-09-23

Similar Documents

Publication Publication Date Title
CN111459750A (zh) 基于非扁平网络的私有云监控方法、装置、计算机设备及存储介质
US10505818B1 (en) Methods for analyzing and load balancing based on server health and devices thereof
CN111124819B (zh) 全链路监控的方法和装置
EP2563062B1 (en) Long connection management apparatus and link resource management method for long connection communication
WO2021184587A1 (zh) 基于Prometheus的私有云监控方法、装置、计算机设备及存储介质
US8305911B2 (en) System and method for identifying and managing service disruptions using network and systems data
US20150100962A1 (en) Computer-readable medium, apparatus, and method
US9197687B2 (en) Prioritized blocking of on-demand requests
JP2015510201A (ja) クラウドネットワークにおける迅速な災害回復準備のための方法および装置
US20060287738A1 (en) Optimized performance counter monitoring
US10931548B1 (en) Collecting health monitoring data pertaining to an application from a selected set of service engines
US11582154B2 (en) Method, apparatus, and system for adjusting routing of network traffic or utilization of network nodes
US20140337471A1 (en) Migration assist system and migration assist method
CN111769997A (zh) 网络监测的方法、服务器、设备和计算机可读介质
CN108093036B (zh) 一种获取资源的方法及装置
CN110661673B (zh) 一种心跳检测的方法及装置
CN112261133A (zh) Cdn节点控制方法、装置、服务器及存储介质
US11943284B2 (en) Overload protection for edge cluster using two tier reinforcement learning models
CN112131198B (zh) 一种日志分析方法、装置及电子设备
CN114553778A (zh) 心跳控制方法及装置、存储介质、电子设备
US9172596B2 (en) Cross-network listening agent for network entity monitoring
US12093709B1 (en) Network performance driven compute workload placement
US11405261B1 (en) Optimizing bandwidth utilization when exporting telemetry data from a network device
CN112637340B (zh) 域名解析系统、监测方法、缓存清理方法、设备及介质
KR20190051117A (ko) 상호 작용하는 IoT 어플리케이션을 위한 클라우드-포그-클라이언트 삼각 컴퓨팅 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40032037

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination