CN102354296B - 一种可扩展监控资源的监控系统和方法 - Google Patents
一种可扩展监控资源的监控系统和方法 Download PDFInfo
- Publication number
- CN102354296B CN102354296B CN201110353830.9A CN201110353830A CN102354296B CN 102354296 B CN102354296 B CN 102354296B CN 201110353830 A CN201110353830 A CN 201110353830A CN 102354296 B CN102354296 B CN 102354296B
- Authority
- CN
- China
- Prior art keywords
- resource
- monitoring
- information
- index
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Debugging And Monitoring (AREA)
Abstract
一种可扩展监控资源的监控方法,其特征在于包括如下步骤:步骤一、对被监控的不同类型资源所能监控的信息以及获取这些信息的方式抽象为不同的资源模型;步骤二、监控服务器分配单独的目录用于存放所有的资源模型;步骤三、监控服务器启动时读取所述目录,遍历目录下的每一个资源模型文件夹,然后解析每一个资源模型文件,将所有定义的信息映射为资源对象;步骤四、监控服务器启动成功后,通过管理平台调用监控服务器的发现模块发现资源实例;步骤五、比较根据资源模型中所定义的信息所映射的资源对象与所发现的资源实例是否匹配,如果匹配则根据资源模型对该资源实例进行监控。
Description
技术领域
本发明属于计算机系统监控领域,尤其涉及一种可扩展监控资源的监控方法和系统。
背景技术
随着计算机技术的飞速发展,一些高端设备层出不穷,这就需要我们的监控系统能够快速的支持对新设备的监控。然而传统的监控系统只专注于如何对现有设备做很好的监控和展现而没有对支持新设备做很好的设计或者没有一个成形的架构。这就导致对于传统监控系统来言,要支持对一个新设备的监控需要花费很大的力气来实现,并且后期的维护成本也很高。
发明内容
鉴于现有技术的缺陷,本发明提供一种可扩展监控资源的监控系统,包括监控服务器、展现平台、数据库,其中:所述监控服务器,其是资源模型的运行平台,用于部署、卸载资源模型以及接收管理指令;所述展现平台,其是用户和监控平台进行交互的平台,并通过访问数据库展现被监控资源信息;所述数据库,用于存储被监控的不同类型资源的信息以及监控数据;其特征在于还包括:资源模型,用于对被监控的不同类型资源所能监控的信息以及获取这些信息的方式进行抽象并分别定义在不同的文件中,监控服务器分配单独的目录用于存放所有的资源模型,把被监控的不同类型资源作为监控系统可以随意的安装卸载的插件。
本发明进一步提供一种可扩展监控资源的监控方法,其特征在于包括如下步骤:步骤一、对被监控的不同类型资源所能监控的信息以及获取这些信息的方式分别定义在不同的文件中,共同抽象为不同的资源模型定;步骤二、监控服务器分配单独的目录用于存放所有的资源模型;步骤三、监控服务器启动时读取所述目录,遍历目录下的每一个资源模型文件夹,然后解析每一个资源模型文件,将所有定义的信息映射为资源对象;步骤四、监控服务器启动成功后,通过管理平台调用监控服务器的发现模块发现资源实例;步骤五、比较根据资源模型中所定义的信息所映射的资源对象与所发现的资源实例是否匹配,如果匹配则根据资源模型对该资源实例进行监控。
此外本发明还提供一种可扩展监控资源的监控系统,其特征在于包括如下装置:用于对被监控的不同类型资源所能监控的信息以及获取这些信息的方式分别定义在不同的文件中,共同抽象为不同的资源模型定义的装置;用于使得监控服务器分配单独的目录用于存放所有的资源模型的装置;用于在监控服务器启动时读取所述目录,遍历目录下的每一个资源模型文件夹,然后解析每一个资源模型文件,将所有定义的信息映射为资源对象的装置;用于在监控服务器启动成功后,通过管理平台调用监控服务器的发现模块发现资源实例的装置;用于比较根据资源模型中所定义的信息所映射的资源对象与所发现的资源实例是否匹配,如果匹配则根据资源模型对该资源实例进行监控的装置。
由于本发明用资源模型来描述对某类资源如何进行监控,并且有支持动态部署和卸载模型的监控平台,因此通过资源模型可以实现设备监控的插件化。使得一个监控系统对新类型设备的支持变得简单,同时也降低监控系统的维护成本。
附图说明
图1是本发明将监控资源抽象为资源模型的资源模型结构图;
图2是本发明监控服务器Server结构图;
图3是本发明可扩展监控资源的监控系统的架构图;
图4是本发明可扩展监控资源的监控方法的实现流程图。
具体实施方式
为使本发明的上述目的、特征和优点更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
为了实现可扩展的监控架构,我们需要对各种类型的设备进行抽象,把不同类型设备作为监控系统的一个插件可以随意的安装卸载。
为了实现不同类型设备的插件化,本发明提出了资源模型的概念。资源模型抽象了不同类型设备所能监控的信息以及获取这些信息方法。
1、资源模型是对被监控设备的抽象,资源模型的定义包含以下几部分:
该类资源的名称以及该类资源具有哪些属性
该类资源具有哪些可用性和性能的指标
用什么方式获取这些指标的信息
当获取到指标的信息后如何自动分析这些指标的状态是否正常
当发现资源指标状态异常时触发什么样的事件来通知
2、资源模型的实现可以用XML的格式来实现,把资源的定义分在不同的文件中,这些文件共同组成一个完整的资源模型定义。图1是本发明将监控资源抽象为资源模型的资源模型结构图,其中:
1)资源具有的属性和具有哪些指标定义在资源基本信息文件中;
2)资源指标的详细信息,包括名称,描述,单位等定义在指标的基本信息文件中;
3)指标状态的自动匹配信息定义在指标状态定义的文件中;
4)指标状态异常时触发事件的信息定义在指标事件定义的文件中;
5)指标如何获信息的方式定义在指标取值的文件中。
有了资源模型的支持,可扩展的监控架构实现起来就会变得简单,图2是本发明监控服务器Server结构图;监控Server是模型的运行平台,由以下模块组成:
1)资源模型的管理模块:负责动态部署和卸载资源模型.
2)资源发现模块:负责发现资源的实例对象
3)监控设置模块:负责设置如何对资源的实例进行监控,包括监控频度等的设置。
4)调度模块:负责按照策略模块设置的监控频度定时调度指标的取值
5)取值模块:按照模型定义的指标取值方式来获取指标的信息
6)状态模块:按照模型定义的状态匹配规则计算指标当前的状态
7)事件模块:按照模型定义的事件生成规则生成相应的事件通知
8)汇总模块:对定时采集的指标信息作定时的汇总,以提供给展现模块
监控Server的工作原理如下:
1).监控Server分配单独的目录用于存放所有的模型
2).Server启动时会读取这个目录,遍历目录下的每一个模型文件夹,然后解析每一个模型的XML文件,将所有定义的信息映射为资源对象。
3).Server启动成功后,用户通过管理平台来调用Server的发现模块来发现具体的设备实例。
4).资源实例发现成功后,用户通过管理平台调用Server的监控设置模块来对实例进行监控频度,状态匹配规则,事件产生规则等信息的设置。
5).资源实例一旦被设置为监控后,调度模块就会按照设置的监控频度来定时调用取值模块来获取指标的信息
6).取值模块接收的取值请求后,会按照模型中定义的取值方式来获取指标的信息
7).取值模块获取到指标信息后会把信息同时交给状态模块和数据汇总模块进行处理
8).状态模块按用户定义的状态匹配规则来计算指标当前的状态,同时更新数据库以提供展现平台展现。计算好状态后通知事件模块来进行下一步处理。
9).事件处理模块按照用户定义的事件产生规则来决定是否产生事件,以及产生什么样的事件。
图3是本发明可扩展监控资源的监控系统的架构图。如图所示,本发明的可扩展监控资源的监控系统,包括监控服务器、展现平台、数据库、资源模型,其中:
所述资源模型,用于对被监控的不同类型资源所能监控的信息以及获取这些信息的方式进行抽象,并把被监控的不同类型资源作为监控系统可以随意的安装卸载的插件;
所述监控平台,其是资源模型的运行平台,用于部署、卸载资源模型以及接收管理指令;
所述展现平台,其是用户和监控平台进行交互的平台,并通过访问数据库展现被监控资源信息;
所述数据库,用于存储被监控的不同类型资源的信息以及监控数据。
图4是本发明可扩展监控资源的监控方法的实现流程图;其中包括如下步骤:
步骤一、对被监控的不同类型资源所能监控的信息以及获取这些信息的方式抽象为不同的资源模型;
步骤二、监控服务器分配单独的目录用于存放所有的资源模型;
步骤三、监控服务器启动时读取所述目录,遍历目录下的每一个资源模型文件夹,然后解析每一个资源模型文件,将所有定义的信息映射为资源对象;
步骤四、监控服务器启动成功后,通过管理平台调用监控服务器的发现模块发现资源实例;
步骤五、比较根据资源模型中所定义的信息所映射的资源对象与所发现的资源实例是否匹配,如果匹配则根据资源模型对该资源实例进行监控。
下面以一个监控系统要实现对Windows主机以SNMP的方式进行监控来描述下具体的实施过程。
1.首先要对Windows主机按照资源模型的概念进行抽象,简单抽象的Windows的资源模型如下:
1)资源名称为WindowsSNMP
2)指标以及取值信息:包含的可用性指标为设备可用性,取值方式为Ping;性能指标为CPU利用率取值方式为SNMP
3)状态定义信息:对于可用性指标当返回数据为1时认为状态为绿,数据为0时状态为红;对于CPU利用率返回数据小于80%时状态为绿,大于80%小于90%为黄,大于90%时状态为红
4)事件定义信息:当可用性指标状态从绿变为红时产生设备宕机的事件,当CPU利用率从绿变为黄时产生轻微超标的事件,当CPU利用率从绿变为红或从黄变为红时产生严重超标的事件
2.模型定义好之后通过展现平台调用Server的模型管理模块部署该模型
3.模型部署完成之后就可以通过展现平台调用Server的发现模块用Snmp的方式发现一个Windows主机
4.主机发现成功后,通过展现平台调用Server的监控设置模块对该主机进行监控设置,一旦监控后Server就会按照设置自动运行监控的流程。产生相应的状态数据,事件数据以及汇总数据。
5.监控后,展现平台就可以对该Windows主机的数据进行展现。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。
Claims (16)
1.一种可扩展监控资源的监控方法,其特征在于包括如下步骤:
步骤一、对被监控的不同类型资源所能监控的信息以及获取这些信息的方式分别定义在不同的文件中,共同抽象为不同的资源模型定义,具体的采用XML格式的多个文件来实现,其中上述多个文件至少包括:用于记录资源属性和指标的资源基本信息文件、用于记录所述资源指标详细信息的指标基本信息文件、用于记录指标状态的自动匹配信息的指标状态定义文件、用于记录指标状态异常时触发事件的信息的指标事件定义文件、用于记录指标如何获取信息的指标取值文件;
步骤二、监控服务器分配单独的目录用于存放所有的资源模型;
步骤三、监控服务器启动时读取所述目录,遍历目录下的每一个资源模型文件夹,然后解析每一个资源模型文件,将所有定义的信息映射为资源对象;
步骤四、监控服务器启动成功后,通过管理平台调用监控服务器的发现模块发现资源实例;
步骤五、比较根据资源模型中所定义的信息所映射的资源对象与所发现的资源实例是否匹配,如果匹配则根据资源模型对该资源实例进行监控。
2.根据权利要求1所述的可扩展监控资源的监控方法,其特征在于所述资源实例发现成功后,用户通过管理平台调用监控服务器的监控设置模块来对该资源实例设置监控频度、状态匹配规则、事件产生规则。
3.根据权利要求2所述的可扩展监控资源的监控方法,其特征在于所述资源实例一旦设置为被监控后,监控服务器的调度模块就按照设置的监控频度来定时调用取值模块来获取指标信息。
4.根据权利要求3所述的可扩展监控资源的监控方法,其特征在于所述取值模块接收到取值请求后,按照资源模型中定义的获取信息的方式来获取指标信息。
5.根据权利要求4所述的可扩展监控资源的监控方法,其特征在于所述取值模块获取到指标信息后把指标信息同时交给状态模块和数据汇总模块进行处理。
6.根据权利要求5所述的可扩展监控资源的监控方法,其特征在于所述状态模块按用户定义的状态匹配规则来计算指标当前的状态,并将计算好状态后通知事件模块。
7.根据权利要求6所述的可扩展监控资源的监控方法,其特征在于所述事件处理模块按照用户定义的事件产生规则来决定是否产生事件,以及产生什么样的事件。
8.根据权利要求1所述的可扩展监控资源的监控方法,其特征在于所述资源模型是对被监控设备的抽象,资源模型的定义包含:
(1)所述资源的名称以及所述资源的属性;
(2)所述资源的可用性和性能指标,以及获取这些指标信息的方式;
(3)获取到指标的信息后如何自动分析这些指标的状态是否正常;
(4)当发现资源指标状态异常时如何触发事件来通知。
9.一种可扩展监控资源的监控系统,其特征在于包括如下装置:
用于对被监控的不同类型资源所能监控的信息以及获取这些信息的方式分别定义在不同的文件中,共同抽象为不同的资源模型的装置,其中不同的资源模型具体的采用XML格式的多个文件来实现,其中上述多个文件至少包括:用于记录资源属性和指标的资源基本信息文件、用于记录所述资源指标详细信息的指标基本信息文件、用于记录指标状态的自动匹配信息的指标状态定义文件、用于记录指标状态异常时触发事件的信息的指标事件定义文件、用于记录指标如何获取信息的指标取值文件;
用于使得监控服务器分配单独的目录用于存放所有的资源模型的装置;
用于在监控服务器启动时读取所述目录,遍历目录下的每一个资源模型文件夹,然后解析每一个资源模型文件,将所有定义的信息映射为资源对象的装置;
用于在监控服务器启动成功后,通过管理平台调用监控服务器的发现模块发现资源实例的装置;
用于比较根据资源模型中所定义的信息所映射的资源对象与所发现的资源实例是否匹配,如果匹配则根据资源模型对该资源实例进行监控的装置。
10.根据权利要求9所述的可扩展监控资源的监控系统,其特征在于所述资源实例发现成功后,用户通过管理平台调用监控服务器的监控设置模块来对该资源实例设置监控频度、状态匹配规则、事件产生规则。
11.根据权利要求10所述的可扩展监控资源的监控系统,其特征在于所述资源实例一旦设置为被监控后,监控服务器的调度模块就按照设置的监控频度来定时调用取值模块来获取指标信息。
12.根据权利要求11所述的可扩展监控资源的监控系统,其特征在于所述取值模块接收到取值请求后,按照资源模型中定义的获取信息的方式来获取指标信息。
13.根据权利要求12所述的可扩展监控资源的监控系统,其特征在于所述取值模块获取到指标信息后把指标信息同时交给状态模块和数据汇总模块进行处理。
14.根据权利要求13所述的可扩展监控资源的监控系统,其特征在于所述状态模块按用户定义的状态匹配规则来计算指标当前的状态,并将计算好状态后通知事件模块。
15.根据权利要求14所述的可扩展监控资源的监控系统,其特征在于所述事件处理模块按照用户定义的事件产生规则来决定是否产生事件,以及产生什么样的事件。
16.根据权利要求9所述的可扩展监控资源的监控系统,其特征在于所述资源模型是对被监控设备的抽象,资源模型的定义包含:
(1)所述资源的名称以及所述资源的属性;
(2)所述资源的可用性和性能指标,以及获取这些指标信息的方式;
(3)获取到指标的信息后如何自动分析这些指标的状态是否正常;
(4)当发现资源指标状态异常时如何触发事件来通知。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110353830.9A CN102354296B (zh) | 2011-11-10 | 2011-11-10 | 一种可扩展监控资源的监控系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110353830.9A CN102354296B (zh) | 2011-11-10 | 2011-11-10 | 一种可扩展监控资源的监控系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102354296A CN102354296A (zh) | 2012-02-15 |
CN102354296B true CN102354296B (zh) | 2016-05-04 |
Family
ID=45577863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110353830.9A Active CN102354296B (zh) | 2011-11-10 | 2011-11-10 | 一种可扩展监控资源的监控系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102354296B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150207703A1 (en) * | 2012-07-31 | 2015-07-23 | Phyllis Gallagher | Abstraction models for monitoring of cloud resources |
CN103532739B (zh) * | 2013-09-25 | 2017-09-29 | 上海斐讯数据通信技术有限公司 | 一种基于网络服务与应用的监控分析系统 |
CN105573224B (zh) * | 2014-10-08 | 2019-11-19 | 深圳力维智联技术有限公司 | 基于抽象模型的监控方法、装置及系统 |
TWI651605B (zh) * | 2017-08-02 | 2019-02-21 | 中華電信股份有限公司 | 虛實資源通用式監控系統 |
CN107566165B (zh) * | 2017-08-18 | 2021-02-02 | 国网山东省电力公司信息通信公司 | 一种发现及部署电力云数据中心可用资源的方法及系统 |
CN110941637B (zh) * | 2018-09-21 | 2023-06-02 | 北京神州泰岳软件股份有限公司 | 一种数据处理方法和装置 |
CN112422308A (zh) * | 2019-08-23 | 2021-02-26 | 中兴通讯股份有限公司 | 一种实现运维监控的方法及装置 |
CN111666189B (zh) * | 2020-06-12 | 2023-03-31 | 中信银行股份有限公司 | 一种声明式可视化配置Prometheus监控告警的方法和系统 |
CN113157267B (zh) * | 2021-04-24 | 2024-06-21 | 中国海洋大学 | 一种开放式资源管理模型及其构建方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101051962A (zh) * | 2007-05-22 | 2007-10-10 | 网御神州科技(北京)有限公司 | 一种可扩展动态网络监控系统及其监控方法 |
CN101478445A (zh) * | 2008-10-09 | 2009-07-08 | 卞旭东 | 用于信息系统监控的通用监控模型技术 |
CN101515864A (zh) * | 2008-04-16 | 2009-08-26 | 蒋洪迅 | 告警信息配制系统及其配制方法 |
CN101667124A (zh) * | 2009-10-15 | 2010-03-10 | 上海宝信软件股份有限公司 | 基于对象模型对监控设备进行配置的系统及其方法 |
CN101867494A (zh) * | 2010-06-18 | 2010-10-20 | 北京神州泰岳软件股份有限公司 | 基于监控模板的软硬件性能监控方法及系统 |
-
2011
- 2011-11-10 CN CN201110353830.9A patent/CN102354296B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101051962A (zh) * | 2007-05-22 | 2007-10-10 | 网御神州科技(北京)有限公司 | 一种可扩展动态网络监控系统及其监控方法 |
CN101515864A (zh) * | 2008-04-16 | 2009-08-26 | 蒋洪迅 | 告警信息配制系统及其配制方法 |
CN101478445A (zh) * | 2008-10-09 | 2009-07-08 | 卞旭东 | 用于信息系统监控的通用监控模型技术 |
CN101667124A (zh) * | 2009-10-15 | 2010-03-10 | 上海宝信软件股份有限公司 | 基于对象模型对监控设备进行配置的系统及其方法 |
CN101867494A (zh) * | 2010-06-18 | 2010-10-20 | 北京神州泰岳软件股份有限公司 | 基于监控模板的软硬件性能监控方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102354296A (zh) | 2012-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102354296B (zh) | 一种可扩展监控资源的监控系统和方法 | |
CN106713487B (zh) | 数据的同步方法和装置 | |
CN103383689A (zh) | 一种服务进程故障检测方法、装置及服务节点 | |
WO2021057514A1 (zh) | 任务调度方法、装置、计算机设备和计算机可读介质 | |
CN106933843A (zh) | 数据库心跳检测方法以及装置 | |
CN105760240A (zh) | 分布式任务处理方法及装置 | |
CN101976885A (zh) | 远程智能网管电源管理系统 | |
CN101099398B (zh) | 用于在管理网络中在管理器和代理之间匹配信息的方法和装置 | |
CN103166773A (zh) | 监测服务器运行状态的方法与系统 | |
CN109379238A (zh) | 一种分布式集群的ctdb主节点选举方法、装置及系统 | |
CN102664747A (zh) | 一种云计算平台系统 | |
WO2014056345A1 (zh) | 监控任务的管理方法及装置 | |
CN110457334A (zh) | 信息推送方法、装置、电子设备及可读存储介质 | |
CN111737353A (zh) | 一种元数据同步方法及装置 | |
CN102855319A (zh) | Oracle数据库操作监控系统 | |
CN103248522B (zh) | 一种性能数据的上报方法及装置 | |
CN106372160A (zh) | 一种分布式数据库及管理方法 | |
CN107229425A (zh) | 一种数据存储方法及装置 | |
CN117130730A (zh) | 面向联邦Kubernetes集群的元数据管理方法 | |
CN106844694B (zh) | 用于同步数据的方法及设备 | |
CN103823743B (zh) | 软件系统的监控方法和设备 | |
CN107770030B (zh) | 基于vpn技术的舞台设备控制系统、控制方法及控制装置 | |
WO2014044112A1 (zh) | 一种基站电源监控及告警的装置和方法 | |
CN110225077A (zh) | 变更供应数据的同步方法、装置、计算机设备及计算机存储介质 | |
CN106357425A (zh) | 一种网络管理代理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20170412 Address after: 310012 room 619-628, building, building 6, International Building, No. two, Wen Road, Hangzhou, Zhejiang, Xihu District 6, China Patentee after: Zhejiang Rand network technology Limited by Share Ltd Address before: 1 section A, Xinmao software building 300384 Huayuan Industry Development Area in Tianjin New Technology Industrial Zone Rong Yuan Road 1810-1811 room Patentee before: Mocha Software (Tianjin) Co., Ltd. |
|
TR01 | Transfer of patent right |