CN111209162A - 分层建模的系统监控方法及装置 - Google Patents

分层建模的系统监控方法及装置 Download PDF

Info

Publication number
CN111209162A
CN111209162A CN202010004861.2A CN202010004861A CN111209162A CN 111209162 A CN111209162 A CN 111209162A CN 202010004861 A CN202010004861 A CN 202010004861A CN 111209162 A CN111209162 A CN 111209162A
Authority
CN
China
Prior art keywords
model
monitoring
data center
equipment
modeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010004861.2A
Other languages
English (en)
Other versions
CN111209162B (zh
Inventor
袁鹏飞
宣旭迎
杨恒
周天睿
杨宏兵
周泽湘
罗华
仇悦
文中领
王爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Toyou Feiji Electronics Co ltd
Original Assignee
Beijing Toyou Feiji Electronics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Toyou Feiji Electronics Co ltd filed Critical Beijing Toyou Feiji Electronics Co ltd
Priority to CN202010004861.2A priority Critical patent/CN111209162B/zh
Publication of CN111209162A publication Critical patent/CN111209162A/zh
Application granted granted Critical
Publication of CN111209162B publication Critical patent/CN111209162B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Abstract

本发明提供了一种分层建模的系统监控方法及装置。所述方法包括:生成表示被监控系统架构的三层模型,三层模型包括:跨中心数据中心级、数据中心级以及数据中心设备级;根据面向对象的建模方式,分别生成三层模型中的各个设备实体的子模型;根据完成设备实体的子模型生成后的系统模型,对系统实施监控。本发明提供的分层建模的系统监控方法及装置以面向对象思想,分层分级,对数据中心设备进行建模,能把所有的运维需求给支撑起来,规范起来,操作思想统一,监控对象统一、呈现统一、视图统一、监控方式统一等,构筑规范,形成生态。

Description

分层建模的系统监控方法及装置
技术领域
本发明涉及计算系统运维技术领域,特别是涉及一种分层建模的系统监控方法及装置。
背景技术
随着数据中心的日新月异快速发展,数据中心机房里的设备成千上万,对这些设备的运行情况进行监控非常必要,比如服务器运行的CPU内存参数,网络设备的端口流量,业务层面的监控等等。在数据中心硬件需求、安全性和数据收集方面,实施、操作、故障排除和更新混合IT设置带来了许多新问题,并要求具备更多的数据中心技能。因开发人员缺乏全局观,传统的碎片化运维方式形成信息孤岛,难以产生关联,导致缺乏数据中心级高效自动化运维平台。
碎片化运维:开发人的能力本身不足,缺乏全局观,或者各个系统本身的属性特质就导致他们难以关联。每个系统就像一个碎片,所以我们说这是碎片化,信息孤岛,无法站在全局角度对数据中心整体运维。
非标准化运维:因为无法标准化,难以复制,每家公司各自开发自己的,无法形成社区和规范,互操作运维难度大。
轮询监控:对数据中心整体进行监控,保证中心内设备能够长时间正常运行,减少系统故障引发的损失是非常必要的。然而,如何在最短的时间内获取到设备的告警,又不占用网络太多资源,成为了亟待解决的问题。
发明内容
本发明要解决的技术问题是提供一种分层建模的系统监控方法及系统,以面向对象思想,分层分级,对数据中心设备进行建模,能把所有的运维需求给支撑起来,规范起来,操作思想统一,监控对象统一、呈现统一、视图统一、监控方式统一等,构筑规范,形成生态。
为解决上述技术问题,本发明提供了一种分层建模的系统监控方法,所述系统包括:生成表示被监控系统架构的三层模型,三层模型包括:跨中心数据中心级、数据中心级以及数据中心设备级;根据面向对象的建模方式,分别生成三层模型中的各个设备实体的子模型;根据完成设备实体的子模型生成后的系统模型,对系统实施监控。
在一些实施方式中,子模型包括:通用信息模型、核心模型、公共模型、扩展模型、监控模型。
在一些实施方式中,通用信息模型按照面向对象的方式把管理信息抽象为对象,定义对象及其在对象管理器中的命名和组织方式。
在一些实施方式中,核心模型包含的类定义对于所有管理领域都是共同的,它应用于所有的管理域。
在一些实施方式中,公共模型包含的类定义对于特定的管理领域来说是公共的,公共模型描述了特定类概念的管理领域、系统、网络、数据库、应用程序和设备的共同信息。
在一些实施方式中,监控模型是数据中心按监控需求统一定义所需监控属性,各个公司可以按数据中心要求进行填充这些监控属性。
在一些实施方式中,根据完成设备实体的子模型生成后的系统模型,对系统实施监控,包括:对被监控对象进行阈值定义;数据中心级向跨数据中心级获取该数字中心对象的设置阈值;数据中心设备向数据中心级获取该设备对象的设置阈值;客户端自行检测自身对象属性值是否超过阈值,以确定是否进行告警推送。
此外,本发明还提供了一种分层建模的系统监控系统,所述系统包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据前文所述的分层建模的系统监控方法。
采用这样的设计后,本发明至少具有以下优点:
1.站在跨数据中心角度,共计三级部署模式,为数据中心级用户提供高效便利监控方案,提升数据中心自动化运维效率;
2.面向对象思想,分层分级,对数据中心设备进行建模,对profile、类、属性和方法信息定义,实现监控对象、监控内容、监控接口的统一和规范化定义,提升各大厂设备在数据中心集成、管理、运维效率,构筑有序、良好的生态环境。
附图说明
上述仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,以下结合附图与具体实施方式对本发明作进一步的详细说明。
图1是本发明实施例提供的监控系统的部署结构图;
图2是本发明实施例提供的告警推送的流程图;
图3是本发明实施例提供的通用信息模型的类继承关系图;
图4是本发明实施例提供的分层建模的系统监控装置的结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
参见图1,本发明站在跨数据中心级角度,形成管理者+服务端1[跨数据中心]+服务端2[数据中心级]+客户端[数据中心设备],共计三级部署模式。
本发明在数据中心设备和数据中心级监控平台之间提供标准化的数据建模及通信方式,从而使设备监控实现厂商无关性,使得设备监控系统能够实现鉴别、分类、监控和控制物理及逻辑资源的能力,提高管理效率、降低管理成本。本发明以面向对象思想进行统一的数据建模,制定公共信息模型规范,通过基于HTTP的xml传输机制,实现对各种设备和组件直接进行带内或带外的管理,甚至两者并用。
通用信息模型:按照面向对象的方式把管理信息抽象为对象,定义对象及其在对象管理器中的命名和组织方式。模型是现实中存在事物的抽象,是一些类的集合在通用信息模型中,模型被用于管理和命名通用信息模型类,一个类必须至少属于一个模型。一个模型中类不得重名.通用信息模型分四个层次:
核心模型:包含的类定义对于所有管理领域都是共同的,它应用于所有的管理域。
公共模型:包含的类定义对于特定的管理领域来说是公共的。它们描述了特定类概念的管理领域、系统、网络、数据库、应用程序和设备的共同信息。公共模型也是用类的形式给出,这些类都是从核心模型的类中派生出来的,能够满足对于这些领域进行管理的要求。
扩展模型:扩展模型实际上给出的是一些可供扩展的基类,各个公司可以在此基础上来扩展这些模型。
监控模型:监控模型实际上给出的是一些可供扩展的基类,数据中心按监控需求统一定义所需监控属性,各个公司可以按数据中心要求进行填充这些监控属性。
本发明通过如上建模方式,构建一个专属于数据中心的、统一定义的、对数据中心所有设备监控的轮廓图表,用户站在数据中心角度可根据自身需求进行监控属性扩展,各厂商依照数据中心要求对属性进行封装实现。
参见图2,告警推送的过程如下:依照跨数据中心面向对象定义思想,实现对数据中心-设备-管理领域(系统、网络、硬件、应用等)逐级定义,并在服务端1【跨数据中心级】对被监控对象进行阈值定义。服务端2【数据中心级】向服务端1【跨数据中心级】获取该数字中心对象的设置阈值,客户端【数据中心设备】向服务端2【数据中心级】获取该设备对象的设置阈值。客户端自行检测自身对象属性值是否超过阈值,如超过的话会向服务端2【数据中心级】进行告警推送,服务端2【数据中心级】收到告警信息后会向服务端1【跨数据中心级】进行告警推送,服务端1【跨数据中心级】根据异常信息进行告警。
考虑到服务端2【数据中心级】或客户端【数据中心设备】因宕机导致无法向上一级反馈告警信息,服务端1【跨数据中心级】会定期进行巡检,确保服务端2【数据中心级】在线;同样,服务端2【数据中心级】会对客户端【数据中心设备】进行定期巡检,确保所有客户端【数据中心设备】在线,识别到某一客户端不在线的话,会向服务端1【跨数据中心级】反馈告警信息。
通用信息模型以通用信息对象的形式体现。通用信息对象是通用信息类实例化的对象。并且,还可以有其他的子类继承自通用信息类。通用信息类的子类继承关系如图3所示。
服务端对设备agent请求和返回格式为基于http的xml格式。该示例如下:
<?xml version=”1.0”encoding=”utf-8”?>
<Example EXAMPLEVERSION=”2.0”DTDVERSION=”2.0”>
<MESSAGE ID=”66609”>
<SIMPLERSP>
<IMETHODRESPONSE NAME=”GetProperty”>
<ITETURNVALUE>
<VALUE>88</VALUE>
</ITETURNVALUE>
</IMETHODRESPONSE>
</SIMPLERSP>
</MESSAGE>
</Example>
图4示出了分层建模的系统监控装置的典型结构。例如,所述分层建模的系统监控装置400可以用于充当存储设备等的存储设备。如本文所述,分层建模的系统监控装置400可以用于在进行跨数据中心监控时提升数据中心自动化运维效率。分层建模的系统监控装置400可以在单个节点中实现,或者分层建模的系统监控装置400的功能可以在网络中的多个节点中实现。本领域的技术人员应意识到,术语分层建模的系统监控装置包括广泛意义上的设备,图4中示出的分层建模的系统监控装置400仅是其中一个示例。包括分层建模的系统监控装置400是为了表述清楚,并不旨在将本发明的应用限制为特定的分层建模的系统监控装置实施例或某一类分层建模的系统监控装置实施例。本发明所述的至少部分特征/方法可以在网络装置或组件,例如,分层建模的系统监控装置400,中实现。例如,本发明中的特征/方法可以采用硬件、固件和/或在硬件上安装运行的软件实现。分层建模的系统监控装置400可以是任何通过网络处理,存储和/或转发数据帧的设备,例如,服务器,客户端,数据源等。如图4所示,分层建模的系统监控装置400可以包括收发器(Tx/Rx)410,其可以是发射器,接收器,或其组合。Tx/Rx 410可以耦合到多个端口450(例如上行接口和/或下行接口),用于从其他节点发送和/或接收帧。处理器430可耦合至Tx/Rx410,以处理帧和/或确定向哪些节点发送帧。处理器430可以包括一个或多个多核处理器和/或存储器设备432,其可以用作数据存储器,缓冲区等。处理器430可以被实现为通用处理器,或者可以是一个或多个专用集成电路(application specific integrated circuit,简称ASIC)和/或数字信号处理器(digital signal processor,简称DSP)的一部分。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,本领域技术人员利用上述揭示的技术内容做出些许简单修改、等同变化或修饰,均落在本发明的保护范围内。

Claims (8)

1.一种分层建模的系统监控方法,其特征在于,包括:
生成表示被监控系统架构的三层模型,三层模型包括:跨中心数据中心级、数据中心级以及数据中心设备级;
根据面向对象的建模方式,分别生成三层模型中的各个设备实体的子模型;
根据完成设备实体的子模型生成后的系统模型,对系统实施监控。
2.根据权利要求1所述的分层建模的系统监控方法,其特征在于,子模型包括:通用信息模型、核心模型、公共模型、扩展模型、监控模型。
3.根据权利要求2所述的分层建模的系统监控方法,其特征在于,通用信息模型按照面向对象的方式把管理信息抽象为对象,定义对象及其在对象管理器中的命名和组织方式。
4.根据权利要求2所述的分层建模的系统监控方法,其特征在于,核心模型包含的类定义对于所有管理领域都是共同的,它应用于所有的管理域。
5.根据权利要求2所述的分层建模的系统监控方法,其特征在于,公共模型包含的类定义对于特定的管理领域来说是公共的,公共模型描述了特定类概念的管理领域、系统、网络、数据库、应用程序和设备的共同信息。
6.根据权利要求2所述的分层建模的系统监控方法,其特征在于,监控模型是数据中心按监控需求统一定义所需监控属性,各个公司可以按数据中心要求进行填充这些监控属性。
7.根据权利要求1所述的分层建模的系统监控方法,其特征在于,根据完成设备实体的子模型生成后的系统模型,对系统实施监控,包括:
对被监控对象进行阈值定义;
数据中心级向跨数据中心级获取该数字中心对象的设置阈值;
数据中心设备向数据中心级获取该设备对象的设置阈值;
客户端自行检测自身对象属性值是否超过阈值,以确定是否进行告警推送。
8.一种分层建模的系统监控装置,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据权利要求1至7任意一项所述的分层建模的系统监控方法。
CN202010004861.2A 2020-01-03 2020-01-03 分层建模的系统监控方法及装置 Active CN111209162B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010004861.2A CN111209162B (zh) 2020-01-03 2020-01-03 分层建模的系统监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010004861.2A CN111209162B (zh) 2020-01-03 2020-01-03 分层建模的系统监控方法及装置

Publications (2)

Publication Number Publication Date
CN111209162A true CN111209162A (zh) 2020-05-29
CN111209162B CN111209162B (zh) 2023-07-04

Family

ID=70785537

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010004861.2A Active CN111209162B (zh) 2020-01-03 2020-01-03 分层建模的系统监控方法及装置

Country Status (1)

Country Link
CN (1) CN111209162B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165278A (ja) * 2000-11-22 2002-06-07 Ntt Docomo Inc データセンタおよびその管理方法
US20100306272A1 (en) * 2009-05-29 2010-12-02 Eric Williamson Systems and methods for object-based modeling using hierarchical model objects
CN102651699A (zh) * 2011-02-25 2012-08-29 华平信息技术股份有限公司 一种树状分层结构监控系统及监控方法
CN103795575A (zh) * 2014-02-12 2014-05-14 浪潮电子信息产业股份有限公司 一种面向多数据中心的系统监控方法
CN103973815A (zh) * 2014-05-27 2014-08-06 浪潮电子信息产业股份有限公司 一种跨数据中心存储环境统一监控方法
CN104486147A (zh) * 2014-12-04 2015-04-01 北京同有飞骥科技股份有限公司 一种设备监控系统更新监控数据的方法和装置
CN110502641A (zh) * 2019-08-13 2019-11-26 杭州师范大学 一种实现数据中心监控系统的知识建模方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165278A (ja) * 2000-11-22 2002-06-07 Ntt Docomo Inc データセンタおよびその管理方法
US20100306272A1 (en) * 2009-05-29 2010-12-02 Eric Williamson Systems and methods for object-based modeling using hierarchical model objects
CN102651699A (zh) * 2011-02-25 2012-08-29 华平信息技术股份有限公司 一种树状分层结构监控系统及监控方法
CN103795575A (zh) * 2014-02-12 2014-05-14 浪潮电子信息产业股份有限公司 一种面向多数据中心的系统监控方法
CN103973815A (zh) * 2014-05-27 2014-08-06 浪潮电子信息产业股份有限公司 一种跨数据中心存储环境统一监控方法
CN104486147A (zh) * 2014-12-04 2015-04-01 北京同有飞骥科技股份有限公司 一种设备监控系统更新监控数据的方法和装置
CN110502641A (zh) * 2019-08-13 2019-11-26 杭州师范大学 一种实现数据中心监控系统的知识建模方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DAVID MEISNER 等: "BigHouse: A simulation infrastructure for data center systems" *
赵炯 等: "工程机械远程监控及维护系统的数据中心设计" *
马勇 等: "数据中心IT设备可视化建模与监控平台技术研究" *
高强 等: "输变电设备集中监控辅助决策系统建设综述" *

Also Published As

Publication number Publication date
CN111209162B (zh) 2023-07-04

Similar Documents

Publication Publication Date Title
WO2020253347A1 (zh) 一种容器集群管理方法、装置及系统
CN110832808B (zh) 用于消息传递服务的方法、存储介质和计算系统
US10819556B1 (en) Data center agent for data center infrastructure monitoring data access and translation
US6792456B1 (en) Systems and methods for authoring and executing operational policies that use event rates
US7225250B1 (en) Method and system for predictive enterprise resource management
EP1361761A1 (en) Telecommunications network management system and method for service monitoring
CN101617501B (zh) 对通信网络进行操作的方法、产品和系统
US20130212257A1 (en) Computer program and monitoring apparatus
CN105556499A (zh) 智能自动缩放
Ramesh et al. The smart network management automation algorithm for administration of reliable 5G communication networks
CN114244676A (zh) 一种智能it综合网关系统
CN113377626A (zh) 基于服务树的可视化统一报警方法、装置、设备和介质
CN111885439A (zh) 一种光网络综合管理和值勤管理系统
CN115280741A (zh) 混合能量管理中的自主监测和恢复的系统和方法
CN109150583A (zh) 一种北向接口的管理方法及装置
CN111209162B (zh) 分层建模的系统监控方法及装置
JP2022546131A (ja) 複数の管理領域のための通信方法及び装置
CN115102730B (zh) 多种设备的一体化监控方法、装置及电子设备
CN102904739A (zh) 一种实现事件转发的方法及通用信息模型cim服务器
CN114281905A (zh) 一种实现物联网设备连接管理的方法及系统
CN115499432A (zh) 家庭终端算力资源管理系统及算力资源调度方法
CN109245927A (zh) 云数据系统中的告警系统和方法
CN114756301A (zh) 日志处理方法、装置和系统
KR100358156B1 (ko) 통합망 환경에서 서비스 관리시스템의 관리명령을 교환기 명령어로 변환하는 방법
CN114567568A (zh) 基于边缘计算的电力物联网数据处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant