CN106817233A - 一种云计算管理平台告警方法及计量监控平台 - Google Patents

一种云计算管理平台告警方法及计量监控平台 Download PDF

Info

Publication number
CN106817233A
CN106817233A CN201510854582.4A CN201510854582A CN106817233A CN 106817233 A CN106817233 A CN 106817233A CN 201510854582 A CN201510854582 A CN 201510854582A CN 106817233 A CN106817233 A CN 106817233A
Authority
CN
China
Prior art keywords
alarm
measurement data
module
measurement
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510854582.4A
Other languages
English (en)
Inventor
李媛祯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201510854582.4A priority Critical patent/CN106817233A/zh
Publication of CN106817233A publication Critical patent/CN106817233A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

本发明公开了一种云计算管理平台告警方法及计量监控平台。在计量监控平台上设置数据获取模块和告警评估模块,数据获取模块获取到采集模块采集的测量数据后直接将该测量数据发送给告警评估模块,告警评估模块对该测量数据进行告警评估。可见,接收到测量数据之后就直接对其执行告警评估,不需要先将其存入数据库中,然后周期性地轮询来检测告警,不仅节省打开关闭数据库的时间,也节省了等待轮询周期到达的时间,从而达到减少等待告警产生的时延的效果。

Description

一种云计算管理平台告警方法及计量监控平台
技术领域
本发明涉及云计算领域,尤其涉及一种云计算管理平台告警方法及计量监控平台。
背景技术
云计算是一种商业计算模型,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算资源、存储空间和信息服务,随着云计算服务行业的发展,集成在云计算平台上的业务越来越多,例如,在云计算管理平台上实现对用户端的管理。由于用户端运行或工作时,会产生大量的数据,而考虑到为保持用户端正常、高效率地运行或工作,通常,对于这些产生的数据都会预先设定一些告警规则,根据这些预设告警规则以及数据的值可以判断用户终端的状态。由于这整个过程,可能涉及到用户端多个部件,且数据繁多复杂,处理起来也比较繁琐,所以将上述过程在云计算管理平台上来实现无疑是比较好的选择。
在现有技术中,实现上述过程的具体步骤包括,首先获取用户端产生的数据,获取到该数据后先将其转化为符合某种标准格式的数据采样,以便于后续处理,然后将该数据采样存储在数据库中,然后周期性地轮询存储在数据库中的这些数据,评估判断是否需要告警。
由于现有技术中采取先将获取到的数据存储到数据库中,然后周期性地轮询数据库来检测告警,于是经常会存在收到一个数据,满足了告警条件,但是轮询周期还没有到达的情况,从而造成的该告警的产生会有较长的时延的问题,与用户所期望的解决方式不符。
发明内容
本发明要解决的主要技术问题是,提供一种云计算管理平台告警方法及计量监控平台,解决现有技术中存在的从接收到数据到对该数据进行评估产生告警会经历较长时延的问题。
为解决上述技术问题,本发明提供一种云计算管理平台告警方法,所述云计算管理平台包括计量监控平台,其特征在于,所述方法包括:
在所述计量监控平台上设置数据获取模块和告警评估模块;
所述数据获取模块获取到计量监控平台的采集模块采集到的测量数据后,将所述测量数据发送给所述告警评估模块,所述测量数据为表示用户端状态属性的数据;
所述告警评估模块对所述测量数据执行告警评估。
在本发明一种实施例中,所述告警评估模块对所述测量数据执行告警评估包括:
所述告警评估模块获取所述测量数据的值,以及所述测量数据对应的预设告警规则;
所述告警评估模块根据所述测量数据的值以及所述预设告警规则判断是否需要产生告警。
在本发明一种实施例中,还包括:在所述计量监控平台上设置告警信息发送模块,当所述告警评估模块的判断结果为需要产生告警时,所述告警信息发送模块向用户端发送告警信息。
在本发明一种实施例中,在判断结果为产生告警信息,所述告警评估模块向用户端发送告警信息。
在本发明一种实施例中,还包括:在所述计量监控平台上设置写入模块,所述数据获取模块还用于将所述测量数据发送给所述写入模块,所述写入模块按照预设写入规则将所述测量数据存入数据库。
本发明还提供计量监控平台,用于云计算管理平台,包括数据获取模块和告警评估模块;
所述数据获取模块用于在获取到计量监控平台的采集模块采集到的测量数据后,将所述测量数据直接发送给告警评估模块,所述测量数据为实时采集到的表示用户端状态属性的数据;
所述告警评估模块用于对所述测量数据执行告警评估。
在本发明一种实施例中,所述告警评估模块包括信息获取子模块和判断子模块;
所述信息获取子模块用于获取所述测量数据的值,以及所述测量数据对应的预设告警规则;
所述判断子模块用于根据所述测量数据的值以及所述预设告警规则判断是否需要产生告警。
在本发明一种实施例中,还包括:告警信息发送模块,用于当所述判断子模块判断的结果为需要产生告警时,向用户端发送告警信息。
在本发明一种实施例中,所述告警评估模块还包括告警信息发送子模块,用于当所述判断子模块判断结果为需要产生告警时,向用户端发送告警信息。
在本发明一种实施例中,还包写入模块,所述数据获取模块还用于将所述测量数据发送给所述写入模块;所述写入模块按照预设写入规则将所述测量数据存入数据库。
本发明的有益效果是:本发明提供了一种云计算管理平台告警方法及计量监控平台,在计量监控平台上设置数据获取模块和告警评估模块;数据获取模块获取计量监控平台的采集单元采集到的表示用户端状态属性的测量数据,在获取到该测量数据后告警评估模块直接对其进行告警评估。可见,本发明在对获取到的测量数据进行告警评估之前不需要将其存储到数据库中,再从数据库中来轮询,而是获取到测量数据后,直接执行告警评估。采用这种方式,首先,不存储到数据库,节省了打开关闭数据库的时间;其次,不需要周期性地轮询,获取到测量数据便执行告警评估,减少等待轮询的时间,从而达到减少等待告警产生的时延的效果。
附图说明
图1为本发明实施例一中云计算管理平台告警方法流程图;
图2为本发明实施例一中云计算管理平台告警方法执行告警评估的流程图;
图3为本发明实施例一中云计算管理平台告警方法执行告警评估的另一流程图;
图4为本发明实施例二中计量监控平台的结构示意图;
图5为本发明实施例二中计量监控平台的另一结构示意图;
图6为本发明实施例二中计量监控平台的告警评估模块的结构示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。
实施例一:
本实施例提供一种云计算管理平台告警方法,云计算管理平台包括计量监控平台,该计量监控平台主要用来采集各用户数据,并对用户状态进行监控等其他功能,例如,OpenStack云计算平台上的测量组件(Ceilometer),请参考图1,该告警方法包括:
S101:在计量监控平台上设置数据获取模块和告警评估模块;
S102:数据获取模块获取测量数据,并将该测量数据直接发送给告警评估模块;
S103:告警评估模块对该测量数据执行告警评估。
在S102中,数据获取模块会先获取从计量监控平台的采集模块采集的测量数据,再将该测量数据直接发送给告警评估模块,采集模块采集的测量数据可以是来自与云计算管理平台相互配合的其他平台,也可以是云计算管理平台自身的其他组件接收到的来自用户端的数据,或者直接是由用户发送来的数据,采集到的这些数据都是表示用户端状态属性的数据。例如,用户的磁盘使用信息、CPU(Central Processing Unit,中央处理器)使用状况等。并且数据采集模块会将获取到的测量数据根据设置转换成某种标准格式,以方便后续步骤的操作,对于标准格式的具体类型可以根据具体需求灵活设置。
数据获取模块获取到测量数据之后,执行S102,告警评估模块直接对获取到的该测量数据执行告警评估,请参考图2,包括:
S201:告警评估模块获取测量数据的值,以及测量数据对应的预设告警规则;
S202:告警评估模块根据测量数据的值以及预设告警规则判断是否需要产生告警。
在用户端,对于不同的测量数据通常会设置不同的预设告警条件,并且将这些预设的告警规则上传到计量监控平台,计量监控平台会将这些预设告警规则保存在本地,每当告警评估模块收到数据获取模块发送的测量数据,就会先获取该测量数据的值,以及在本地保存的该测量数据对应的预设告警规则。获取到该测量数据的值以及该测量数据对应的预设告警规则就可以判断是否需要产生告警。
此时,云计算管理平台告警方法还包括:在计量监控平台上设置告警信息发送模块,当上述告警评估模块的判断结果为需要产生告警时,向用户端发送告警信息。该告警信息可以根据相应需求灵活设置,例如,可以是包含故障具体内容、故障数据、相对应测量数据产生告警原因等具体信息,并将其保存在例如XML文件发送给相应用户,当然也可以保存在其他形式的文件以其他方式发送给用户例如,网页,日志等。
另外,对于上述向用户端发送告警信息也可以由告警评估模块来完成,请参考图3:
S301:告警评估模块获取测量数据的值,以及测量数据对应的预设告警规则;
S302:告警评估模块根据测量数据的值以及预设告警规则判断是否需要产生告警。
S303:当该告警评估模块的判断结果为需要产生告警时,告警评估模块向用户端发送告警信息。
在本实施例中的一种实施例中,云计算管理平台告警方法还包括:
在所述计量监控平台上设置写入模块,此时,数据获取模块不仅会将测量数据直接发送给告警评估模块,还会将测量数据发送给写入模块,写入模块具有暂时存储数据以及将数据写入数据库的功能,会根据预设写入规则将所述测量数据存入数据库。该预设写入规则可以包括一下几种之一:当写入模块接收到测量数据立即写入数据库;预先设定写入周期,周期性地写入数据库;预先设定写入时间,时间到达写入数据库。但是考虑到打开和关闭数据库需要消耗时间,优选地可以周期性地对收到的测量数据执行写入数据库的动作。
实施例二:
本实施例提供一种计量监控平台,用于云计算管理平台,请参考图4:
计量监控平台4包括数据获取模块41、告警评估模块42、采集模块43,
采集模块43用于采集测量数据,该测量数据可以是来自与云计算管理平台相互配合的其他平台,也可以是云计算管理平台自身的其他组件接收到的来自用户端的数据,或者直接是由用户发送来的数据,采集到的这些数据都是表示用户端状态属性的数据。并且数据采集模43块会将获取到的测量数据根据设置转换成某种标准格式,以方便后续步骤的操作,对于标准格式的具体类型可以根据具体需求灵活设置。
该数据获取模块41用于在获取到采集模块43采集到的测量数据后,将该测量数据直接发送给告警评估模块。
对于告警评估模块的具体设置,请参考图5,告警评估模块52包括信息获取子模块521和判断子模块522。
信息获取子模块521用于接收数据获取模块发送的额量数据,并获取所述测量数据的值,以及查询该测量数据对应的预设告警规则。
在用户端,对于不同的测量数据通常会设置不同的预设告警条件,计量监控平台会获取这些预设告警规则,并将这些预设告警规则保存在本地,当收到数据获取模块发送的测量数据,会先获取该测量数据的值,以及在本地保存的该测量数据对应的预设告警规则。获取到该测量数据的值以及该测量数据对应的预设告警规则就可以判断是否需要产生告警。
判断子模块522用于根据测量数据的值以及预设告警规则判断是否需要产生告警。
计量监控平台还包括告警信息发送模块54,用于当判断子模块判断的结果为需要产生告警时,向用户端发送告警信息。该告警信息可以根据相应需求灵活设置,例如,可以是包含故障具体内容、故障数据、相对应测量数据产生告警原因等具体信息,并将其以某种方式发送给用户。
另外,在本实施例中的另一种示例中,执行告警信息发送的也可以由告警评估模块执行;请参考图6,本实施例中的告警评估模块62包括信息获取子模块621、判断子模块622和告警信息发送子模块623。
信息获取子模块621用于接收数据获取模块发送的额量数据,并获取所述测量数据的值,以及查询该测量数据对应的预设告警规则。在用户端,对于不同的测量数据通常会设置不同的预设告警条件,计量监控平台会获取这些预设告警规则,并将这些预设告警规则保存在本地,当收到数据获取模块发送的测量数据,会先获取该测量数据的值,以及在本地保存的该测量数据对应的预设告警规则。获取到该测量数据的值以及该测量数据对应的预设告警规则就可以判断是否需要产生告警。
判断子模块622用于根据测量数据的值以及预设告警规则判断是否需要产生告警。
告警信息发送子模块623用于当判断子模块判断的结果为需要产生告警时,向用户端发送告警信息。
在本实施例中的一种示例中,计量监控平台还包括写入模块,
在所述计量监控平台上设置写入模块,此时,数据获取模块还需要将测量数据发送给写入模块,写入模块具有暂时存储数据以及将数据写入数据库的功能,会根据预设写入规则将所述测量数据存入数据库。该预设写入规则可以包括一下几种之一:当写入模块接收到测量数据立即写入数据库;预先设定写入周期,周期性地写入数据库;预先设定写入时间,时间到达写入数据库。但是考虑到打开和关闭数据库需要消耗时间,优选地可以周期性地对收到的测量数据执行写入数据库的动作。
实施例三:
本实施例将以“OpenStack”云计算管理平台为例,来对本发明的内容进行进一步说明:
OpenStack是一个开源的云计算管理平台项目,由几个主要的组件组合起来完成具体工作。主要包括:计算组件,网络组件,存储组件,UI组件,其中测量组件(Ceilometer)能把OpenStack内部发生的几乎所有的事件都收集起来,然后为计费和监控以及其它服务提供数据支撑。在测量组件中,主要由以下三个组件来负责数据采集:“ceilometer-agent-central”、“ceilometer-agent-compute”和“ceilometer-agent-notification”,三个不同的组件分别采集不同类型的信息,通常,测量组件可以接收来自与云计算管理平台相互配合的其他平台的测量数据,接收云计算管理平台自身的其他组件的测量数据,以及用户发送来的测量数据,采集到数据后用管道(Pipeline)对数据进行转换为符合某种标准格式,后续对数据的操作都采用转换后的格式。
采用告警发布机制,例如增加一个“Alarm Publisher”事件,用来获取接收到的各个测量数据。
采用基于驱动的告警通告机制,例如增加一个可替换的组件“AlarmNotification-driven”,接收“Alarm Publisher”发送的通告。在“AlarmNotification-driven”接收到“Alarm Publisher”发送的通告后,查询对该测量数据设置的预设告警条件;然后判断所述测量数据的值是否达到所述预设告警条件,并在测量数据的值达到相应的预设告警条件时,向用户终端发送告警信息。对于测量数据的预设告警条件全都保存在OpenStack的配置文件中。另外“AlarmNotification-driven”也可以只查询对该测量数据设置的预设告警条件;然后判断所述测量数据的值是否达到所述预设告警条件;向用户终端发送告警信息由另外的事件来完成,例如测量组件中本身存在的组件“Alarm Notifier”。
采用中介机制,增加一个中间组件,例如“Middle Ware”,它接收来自“AlarmPublisher”的所有测量数据,为了节省打开和关闭数据库的事件,“Middle Ware”暂时存储这些测量数据,并周期性地将这些测量数据写入到数据库,保持数据持久化。
显然,本领域的技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储介质(ROM/RAM、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种云计算管理平台告警方法,所述云计算管理平台包括计量监控平台,其特征在于,所述方法包括:
在所述计量监控平台上设置数据获取模块和告警评估模块;
所述数据获取模块获取到计量监控平台的采集模块采集到的测量数据后,将所述测量数据发送给所述告警评估模块,所述测量数据为表示用户端状态属性的数据;
所述告警评估模块对所述测量数据执行告警评估。
2.如权利要求1所述的云计算管理平台告警方法,其特征在于,所述告警评估模块对所述测量数据执行告警评估包括:
所述告警评估模块获取所述测量数据的值,以及所述测量数据对应的预设告警规则;
所述告警评估模块根据所述测量数据的值以及所述预设告警规则判断是否需要产生告警。
3.如权利要求2所述的云计算管理平台告警方法,其特征在于,还包括:在所述计量监控平台上设置告警信息发送模块,当所述告警评估模块的判断结果为需要产生告警时,所述告警信息发送模块向用户端发送告警信息。
4.如权利要求2所述的云计算管理平台告警方法,其特征在于,在判断结果为产生告警信息,所述告警评估模块向用户端发送告警信息。
5.如权利要求1-4任一项所述的云计算管理平台告警方法,其特征在于,还包括:在所述计量监控平台上设置写入模块,所述数据获取模块将所述测量数据发送给所述写入模块,所述写入模块按照预设写入规则将所述测量数据存入数据库。
6.一种计量监控平台,用于云计算管理平台,其特征在于,包括数据获取模块和告警评估模块;
所述数据获取模块用于在获取到计量监控平台的采集模块采集到的测量数据后,将所述测量数据直接发送给告警评估模块,所述测量数据为实时采集到的表示用户端状态属性的数据;
所述告警评估模块用于对所述测量数据执行告警评估。
7.如权利要求6所述的计量监控平台,其特征在于,所述告警评估模块包括信息获取子模块和判断子模块;
所述信息获取子模块用于获取所述测量数据的值,以及所述测量数据对应的预设告警规则;
所述判断子模块用于根据所述测量数据的值以及所述预设告警规则判断是否需要产生告警。
8.如权利要求7所述的计量监控平台,其特征在于,还包括:告警信息发送模块,用于当所述判断子模块判断的结果为需要产生告警时,向用户端发送告警信息。
9.如权利要求7所述的计量监控平台,其特征在于,所述告警评估模块还包括告警信息发送子模块,用于当所述判断子模块判断结果为需要产生告警时,向用户端发送告警信息。
10.如权利要求6-9任一项所述的计量监控平台,其特征在于,还包写入模块,所述数据获取模块还用于将所述测量数据发送给所述写入模块;所述写入模块按照预设写入规则将所述测量数据存入数据库。
CN201510854582.4A 2015-11-30 2015-11-30 一种云计算管理平台告警方法及计量监控平台 Pending CN106817233A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510854582.4A CN106817233A (zh) 2015-11-30 2015-11-30 一种云计算管理平台告警方法及计量监控平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510854582.4A CN106817233A (zh) 2015-11-30 2015-11-30 一种云计算管理平台告警方法及计量监控平台

Publications (1)

Publication Number Publication Date
CN106817233A true CN106817233A (zh) 2017-06-09

Family

ID=59157049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510854582.4A Pending CN106817233A (zh) 2015-11-30 2015-11-30 一种云计算管理平台告警方法及计量监控平台

Country Status (1)

Country Link
CN (1) CN106817233A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109245927A (zh) * 2018-09-06 2019-01-18 郑州云海信息技术有限公司 云数据系统中的告警系统和方法
CN109981402A (zh) * 2019-03-05 2019-07-05 山东浪潮云信息技术有限公司 一种数据采集效果的实时检测和评估方法及系统
CN111431733A (zh) * 2020-02-20 2020-07-17 拉扎斯网络科技(上海)有限公司 服务告警覆盖信息的评估方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109245927A (zh) * 2018-09-06 2019-01-18 郑州云海信息技术有限公司 云数据系统中的告警系统和方法
CN109981402A (zh) * 2019-03-05 2019-07-05 山东浪潮云信息技术有限公司 一种数据采集效果的实时检测和评估方法及系统
CN111431733A (zh) * 2020-02-20 2020-07-17 拉扎斯网络科技(上海)有限公司 服务告警覆盖信息的评估方法及装置

Similar Documents

Publication Publication Date Title
CN107577805B (zh) 一种面向日志大数据分析的业务服务系统
CN109345377B (zh) 一种数据实时处理系统及数据实时处理方法
CN104407964B (zh) 一种基于数据中心的集中监控系统及方法
US20200366564A1 (en) Continuous data sensing of functional states of networked computing devices to determine efficiency metrics for servicing electronic messages asynchronously
CN110351150A (zh) 故障根源确定方法及装置、电子设备和可读存储介质
CN107070692A (zh) 一种基于大数据分析的云平台监控服务系统及方法
CN109831478A (zh) 基于规则及模型的分布式实时处理智能决策系统及方法
CN108335075A (zh) 一种面向物流大数据的处理系统及方法
CN105071969A (zh) 基于jmx的定制化实时监控及自动化异常处理的系统及方法
CN110532152A (zh) 一种基于Kapacitor计算引擎的监控告警处理方法及系统
CN108809701A (zh) 一种数据中心智慧数据平台及其实现方法
CN107370806A (zh) Http状态码监控方法、装置、存储介质和电子设备
CA2948700A1 (en) Systems and methods for websphere mq performance metrics analysis
CN107733712A (zh) 云计算系统中服务资源的监控方法和装置
CN106487612A (zh) 一种服务器节点监控方法、监控服务器及系统
CN111143167B (zh) 用于多平台的告警归并方法及装置、设备、存储介质
CN103295155A (zh) 证券核心业务系统监控方法
CN105516293A (zh) 一种智能变电站云资源监控系统
CN106254137A (zh) 监管系统的告警根源分析系统及方法
CN106817233A (zh) 一种云计算管理平台告警方法及计量监控平台
CN107094086A (zh) 一种信息获取方法和装置
CN109359019A (zh) 应用程序性能监控方法、装置、电子设备及存储介质
CN114070718B (zh) 一种告警方法、装置和存储介质
CN109558299A (zh) 业务监控与预警的方法、装置、设备及存储介质
CN108491213A (zh) 软件持续集成方法、软件持续集成装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170609