CN105407011B - 一种it基础平台监控指标采集系统及采集方法 - Google Patents

一种it基础平台监控指标采集系统及采集方法 Download PDF

Info

Publication number
CN105407011B
CN105407011B CN201510699164.2A CN201510699164A CN105407011B CN 105407011 B CN105407011 B CN 105407011B CN 201510699164 A CN201510699164 A CN 201510699164A CN 105407011 B CN105407011 B CN 105407011B
Authority
CN
China
Prior art keywords
monitor control
control index
monitoring module
warning information
processing module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510699164.2A
Other languages
English (en)
Other versions
CN105407011A (zh
Inventor
廖凌立
罗念华
龙玉江
汪浩
王杰峰
钟掖
朱颖琪
朱彬
徐敬峰
杨盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information & Communication Branch Of Guizhou Grid Co
Original Assignee
Information & Communication Branch Of Guizhou Grid Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information & Communication Branch Of Guizhou Grid Co filed Critical Information & Communication Branch Of Guizhou Grid Co
Priority to CN201510699164.2A priority Critical patent/CN105407011B/zh
Publication of CN105407011A publication Critical patent/CN105407011A/zh
Application granted granted Critical
Publication of CN105407011B publication Critical patent/CN105407011B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明一种IT基础平台监控指标采集系统及采集方法,它包括:监控指标处理模块,机房基础环境监控模块与监控指标处理模块电连接;网络设备监控模块与监控指标处理模块电连接;安全设备监控模块与监控指标处理模块电连接;安全设备监控模块与监控指标处理模块电连接;存储设备监控模块与监控指标处理模块电连接;主机硬件监控模块与监控指标处理模块电连接;现有技术监控监控指标覆盖面小,不能有效对信息系统进行全方位监控,而且监控系统的无效告警数据过多,严重增加了监控工作人员的工作量,而且使工作人员人员的工作效率降低,不能实时发现信息系统的故障,整个监控系统存在效率低实时性差等问题。

Description

一种IT基础平台监控指标采集系统及采集方法
技术领域
本发明属于IT监控指标采集与计算机应用相结合的技术领域,尤其涉及一种IT基础平台监控指标采集系统及采集方法。
背景技术
随着信息化的不断深入发展,各信息系统已成为支撑企业生产、营销、服务、管理各环节正常运转的重要支撑手段。信息系统的正常运行,离不开繁复的日常运维工作和功能强大的监控系统。而监控指标系统是整个监控系统的基础,没有良好的监控指标体系及系统,监控系统的告警信息就不能有效反应整个信息系统的工作状态,更不能引导系统管理员去有效处理这些故障,而现有技术中,对信息系统的监控,其监控指标覆盖面小,不能有效对信息系统进行全方位监控,而且监控系统的无效告警数据过多,严重增加了监控工作人员的工作量,而且使工作人员人员的工作效率降低,不能实时发现信息系统的故障,整个监控系统存在效率低实时性差等问题。
发明内容
本发明要解决的技术问题:提供一种IT基础平台监控指标采集系统及采集方法,以解决现有技术监控系统对信息系统的监控,其监控指标覆盖面小,不能有效对信息系统进行全方位监控,而且监控系统的无效告警数据过多,严重增加了监控工作人员的工作量,而且使工作人员人员的工作效率降低,不能实时发现信息系统的故障,整个监控系统存在效率低实时性差等问题。
本发明技术方案:
一种IT基础平台监控指标采集系统,它包括:
监控指标处理模块:将机房基础环境监控模块、网络设备监控模块、安全设备监控模块、存储设备监控模块、主机硬件监控模块、操作系统监控模块、平台软件监控模块的告警数据进行汇总并发送至告警信息处理平台;
机房基础环境监控模块:采集UPS和空调设备告警信息并发送至监控指标处理模块,与监控指标处理模块电连接;
网络设备监控模块:采集交换机、路由器、负载均衡器的告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接;
安全设备监控模块,采集防火墙设备监控指标,并发送至监控指标处理模块,与监控指标处理模块电连接;
安全设备监控模块,采集防火墙设备监控指标,并发送至监控指标处理模块,与监控指标处理模块电连接;
存储设备监控模块:采集存储设备、光纤交换机、虚拟带库、物理带库设备告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接;
主机硬件监控模块:采集主机硬件告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接。
所述的一种IT基础平台监控指标采集系统,它还包括:
操作系统监控模块,它采集Windows、Unix、Linux、虚拟化EXSi系统告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接;
平台软件监控模块:它采集数据库Oracle、postgreSQL、SQLServer、中间件WebLogic、IIS、Tomcat软件告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接。
机房基础环境监控模块、网络设备监控模块、安全设备监控模块、存储设备监控模块、主机硬件监控模块、操作系统监控模块、平台软件监控模块位于同一台服务器上,监控指标处理模块位于另一台服务器上,二个服务器之间通过网络连接实现二个服务器之间的数据交互。
一种IT基础平台监控指标采集系统的采集方法,它包括:
UPS监控指标的采集方法为:机房基础环境监控模块通过UPS的RS232C端口采集系统负载、输出电压、电池后备时间、系统报警和旁路电压超限告警信息;
空调监控指标的采集方法为:机房基础环境监控模块通过空调的RS485端口采集空调运行状态、温湿度信息、压缩机压力和主风扇过载告警信息;
交换机监控指标采集方法为:网络设备监控模块向交换机发起SNMP请求,获取CPU使用率、内存空闲率、端口流量利用率和端口错包率告警信息,通过ping交换机获取交换机可达性告警信息,通过接收交换机Trap,获取端口down、交换机发生切换、生成树协议状态异常和部件状态异常告警信息;
路由器监控指标采集方法为:网络设备监控模块向路由器发起SNMP请求,获取CPU使用率、内存空闲率、端口流量利用率、端口错包率、远端网络节点的平均延时、路由器的网络可达性告警信息;通过ping路由器获取路由器可达性告警信息,通过接收路由器Trap,获取端口失效、路由邻居down和部件状态异常告警信息;
负载均衡器监控指标采集的采集方法为:网络设备监控模块向路由器发起SNMP请求,获取CPU使用率、内存空闲率、全局client并发连接数、全局SSL并发卸载连接数、特定虚拟服务VSclient并发连接数、特定虚拟服务VS并发SSL卸载连接数告警信息;通过ping负载均衡器获取负载均衡器可达性告警信息;通过接收负载均衡器Trap,获取网关冗余协议状态异常、集群成员RS探测状态异常、虚拟服务状态、关键守护进程状态和部件状态告警信息;
防火墙监控指标采集方法为:安全设备监控模块向防火墙发起SNMP请求,获取CPU使用率、内存空闲率、全局并发连接数告警信息;通过ping防火墙,获取防火墙可达性告警信息;通过接收防火墙Trap,获取网关冗余协议状态、关键守护进程状态和部件状态告警信息;
存储设备监控指标采集方法为:存储设备监控模块通过接收存储设备Trap,获取磁盘柜FA端口状态、磁盘故障、缓存错误、磁盘柜温度、RAID设备损坏、磁盘柜电池故障、磁盘柜电源故障和控制器故障告警信息;
光纤交换机监控指标采集方法为:存储设备监控模块通过接收光纤交换机Trap,获取端口状态、CP板状态、端口物理状态、端口GBIC、SFP状态、槽位卡状态、风扇、电源、温度状态告警信息;
虚拟带库监控指标采集为:存储设备监控模块通过接收虚拟带库Trap,获取带库机头故障、磁盘故障、缓存错误、温度故障、RAID设备故障、电池故障和电源故障告警信息;
物理带库监控指标采集方法为:存储设备监控模块通过接收物理带库Trap,获取机械手故障、机械臂故障、电源故障、磁带机没有加电、带仓没有磁带和磁头需要清洗告警信息;
主机硬件监控指标采集方法为:主机硬件监控模块通过程序每10分钟向设备发送IPMI接口命令获取硬件日志信息,在输出结果中通过过滤关键字,获取CPU故障、主板故障、电源故障、IO卡故障、内存故障和磁盘故障告警信息。
所述的一种IT基础平台监控指标采集系统的采集方法,其特征在于它还包括:
Windows监控指标采集方法:操作系统监控模块通过从Windows系统中获取CPU利用率、物理内存利用率、系统连续运行时间、系统重启和逻辑磁盘利用率告警信息;
Unix或Linux监控指标采集方法:操作系统监控模块获取CPU利用率、指定进程占用的内存、文件系统利用率、系统IO、交换空间、i节点利用率、系统连续运行时间和系统重启告警信息;
虚拟化ESXi监控指标采集方法:操作系统监控模块通过ESXi系统的API接口获取物理机CPU使用率、物理机内存使用率、主机集群切换信息、存储磁盘使用率、虚拟交换机网络上行链路冗余状态、虚拟机迁移信息、虚拟机与存储设备连接状态和vCenter与虚拟机连接状态告警信息;
Oracle监控指标采集方法:平台软件监控模块获取会话占用的PGA空间、Oracle会话比例、打开的游标比例、后台关键进程是丢失、表空间利用率、Undo表空间利用率、监听端口状态、等待告警的等待时间、PGA内存使用率、数据库连通性、数据库告警日志、CRS健康状态、CRS资源在线、OCR状态、RAC进程状态、归档日志目录大小、数据文件目录大小告警信息;
PostgreSQL监控指标采集方法:平台软件监控模块通过PLSQL登录数据库获取数据库连通性告警信息;通过获取会话数量告警信息;通过程序过滤日志文件获取数据库Shut Down、Failed告警信息;
SQL Server 2008监控指标采集采集方法:平台软件监控模块获取用户连接数、SQL Server关闭、锁等待时间、数据库连通性、有失败的数据库任务、数据库空间利用率、日志空间利用率告警信息;
WebLogic监控指标采集方法:平台软件监控模块获取端口连接数和端口状态告警信息;
IIS监控指标采集方法:平台软件监控模块获取端口连接数、端口状态、IIS进程存在告警信息;
Tomcat监控指标采集方法:平台软件监控模块获取端口连接数和端口状态告警信息。
本发明的有益效果:
本发明优化了IT基础平台监控指标采集体系,并发明了一套完整的指标采集系统,将IT基础平台的机房基础环境、网络设备、安全设备、存储设备、主机硬件、操作系统、平台软件的告警信息进行集中采集,集中处理,解决了现有监控系统无效告警数据过多,监控指标采集覆盖面窄等问题。本发明优化了监控系统的指标采集与处理效率,使IT基础平台的告警可以及时、准确的传递至各系统管理员,减少IT基础平台的故障时间,增加信息系统的可用率,保证企业生产、营销、服务、管理等活动的正常进行。
附图说明:
图1 为本发明系统结构框图。
具体实施方式:
一种IT基础平台监控指标采集系统,它包括(见图1):
监控指标处理模块:将机房基础环境监控模块、网络设备监控模块、安全设备监控模块、存储设备监控模块、主机硬件监控模块、操作系统监控模块、平台软件监控模块的告警数据进行汇总并发送至告警信息处理平台;
机房基础环境监控模块:采集UPS不间断电源系统和空调设备告警信息并发送至监控指标处理模块,与监控指标处理模块电连接;
网络设备监控模块:采集交换机、路由器、负载均衡器的告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接;
安全设备监控模块,采集防火墙设备监控指标,并发送至监控指标处理模块,与监控指标处理模块电连接;
安全设备监控模块,采集防火墙设备监控指标,并发送至监控指标处理模块,与监控指标处理模块电连接;
存储设备监控模块:采集存储设备、光纤交换机、虚拟带库、物理带库设备告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接;
主机硬件监控模块:采集主机硬件告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接。
所述的一种IT基础平台监控指标采集系统,它还包括:
操作系统监控模块,它采集Windows、Unix、Linux、虚拟化EXSi系统告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接;
平台软件监控模块:它采集数据库Oracle、postgreSQL、SQLServer、中间件WebLogic、IIS、Tomcat软件告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接。
机房基础环境监控模块、网络设备监控模块、安全设备监控模块、存储设备监控模块、主机硬件监控模块、操作系统监控模块、平台软件监控模块位于同一台服务器上,监控指标处理模块位于另一台服务器上,二个服务器之间通过网络连接实现二个服务器之间的数据交互。
一种IT基础平台监控指标采集系统的采集方法,它包括:
UPS监控指标的采集方法为:机房基础环境监控模块通过UPS的RS232C端口采集系统负载、输出电压、电池后备时间、系统报警和旁路电压超限告警信息;
空调监控指标的采集方法为:机房基础环境监控模块通过空调的RS485端口采集空调运行状态、温湿度信息、压缩机压力和主风扇过载告警信息;
交换机监控指标采集方法为:网络设备监控模块向交换机发起SNMP简单网络管理协议请求,获取CPU使用率、内存空闲率、端口流量利用率和端口错包率告警信息,通过ping网络诊断工具交换机获取交换机可达性告警信息,通过接收交换机网络状况警告Trap,获取端口down、交换机发生切换、生成树协议状态异常和部件状态异常告警信息;
路由器监控指标采集方法为:网络设备监控模块向路由器发起SNMP请求,获取CPU使用率、内存空闲率、端口流量利用率、端口错包率、远端网络节点的平均延时、路由器的网络可达性告警信息;通过ping路由器获取路由器可达性告警信息,通过接收路由器Trap,获取端口失效、路由邻居down和部件状态异常告警信息;
负载均衡器监控指标采集的采集方法为:网络设备监控模块向路由器发起SNMP请求,获取CPU使用率、内存空闲率、全局client客户端并发连接数、全局SSL并发卸载连接数、特定虚拟服务VSclient虚拟客户端并发连接数、特定虚拟服务VS并发安全套接层SSL卸载连接数告警信息;通过ping负载均衡器获取负载均衡器可达性告警信息;通过接收负载均衡器Trap,获取网关冗余协议状态异常、集群成员RS探测状态异常、虚拟服务状态、关键守护进程状态和部件状态告警信息;
防火墙监控指标采集方法为:安全设备监控模块向防火墙发起SNMP请求,获取CPU使用率、内存空闲率、全局并发连接数告警信息;通过ping防火墙,获取防火墙可达性告警信息;通过接收防火墙Trap,获取网关冗余协议状态、关键守护进程状态和部件状态告警信息;
存储设备监控指标采集方法为:存储设备监控模块通过接收存储设备Trap,获取磁盘柜FA端口状态、磁盘故障、缓存错误、磁盘柜温度、磁盘阵列RAID设备损坏、磁盘柜电池故障、磁盘柜电源故障和控制器故障告警信息;
光纤交换机监控指标采集方法为:存储设备监控模块通过接收光纤交换机Trap,获取端口状态、CP板状态、端口物理状态、端口千兆位接口转换器GBIC、小型可插拔接口SFP状态、槽位卡状态、风扇、电源、温度状态告警信息;
虚拟带库监控指标采集为:存储设备监控模块通过接收虚拟带库Trap,获取带库机头故障、磁盘故障、缓存错误、温度故障、RAID设备故障、电池故障和电源故障告警信息;
物理带库监控指标采集方法为:存储设备监控模块通过接收物理带库Trap,获取机械手故障、机械臂故障、电源故障、磁带机没有加电、带仓没有磁带和磁头需要清洗告警信息;
主机硬件监控指标采集方法为:主机硬件监控模块通过程序每10分钟向设备发送智能平台管理接口IPMI接口命令获取硬件日志信息,在输出结果中通过过滤关键字,获取CPU故障、主板故障、电源故障、IO卡故障、内存故障和磁盘故障告警信息。
所述的一种IT基础平台监控指标采集系统的采集方法,其特征在于它还包括:
Windows监控指标采集方法:操作系统监控模块通过从Windows系统中获取CPU利用率、物理内存利用率、系统连续运行时间、系统重启和逻辑磁盘利用率告警信息;
Unix或Linux监控指标采集方法:操作系统监控模块获取CPU利用率、指定进程占用的内存、文件系统利用率、系统IO、交换空间、i节点利用率、系统连续运行时间和系统重启告警信息;
虚拟化ESXi监控指标采集方法:操作系统监控模块通过ESXi系统的API接口获取物理机CPU使用率、物理机内存使用率、主机集群切换信息、存储磁盘使用率、虚拟交换机网络上行链路冗余状态、虚拟机迁移信息、虚拟机与存储设备连接状态和vCenter与虚拟机连接状态告警信息;
Oracle监控指标采集方法:平台软件监控模块获取会话占用的PGA空间、Oracle会话比例、打开的游标比例、后台关键进程是丢失、表空间利用率、Undo表空间利用率、监听端口状态、等待告警的等待时间、PGA内存使用率、数据库连通性、数据库告警日志、CRS健康状态、CRS资源在线、OCR状态、RAC进程状态、归档日志目录大小、数据文件目录大小告警信息;
PostgreSQL监控指标采集方法:平台软件监控模块通过PLSQL登录数据库获取数据库连通性告警信息;通过获取会话数量告警信息;通过程序过滤日志文件获取数据库关闭Shut Down、错误失败Failed告警信息;
SQL Server 2008监控指标采集采集方法:平台软件监控模块获取用户连接数、SQL Server关闭、锁等待时间、数据库连通性、有失败的数据库任务、数据库空间利用率、日志空间利用率告警信息;
WebLogic监控指标采集方法:平台软件监控模块获取端口连接数和端口状态告警信息;
IIS监控指标采集方法:平台软件监控模块获取端口连接数、端口状态和IIS进程存在告警信息;
Tomcat监控指标采集方法:平台软件监控模块获取端口连接数和端口状态告警信息。
告警信息的生成采用设置相应的告警阀值,通过检测到的实时值与各个告警阀值比较,从而发出各种告警信息。

Claims (4)

1.一种IT基础平台监控指标采集系统,它包括:
监控指标处理模块:将机房基础环境监控模块、网络设备监控模块、安全设备监控模块、存储设备监控模块、主机硬件监控模块、操作系统监控模块、平台软件监控模块的告警数据进行汇总并发送至告警信息处理平台;
机房基础环境监控模块:采集UPS和空调设备告警信息并发送至监控指标处理模块,与监控指标处理模块电连接;
网络设备监控模块:采集交换机、路由器、负载均衡器的告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接;
安全设备监控模块,采集防火墙设备监控指标,并发送至监控指标处理模块,与监控指标处理模块电连接;
存储设备监控模块:采集存储设备、光纤交换机、虚拟带库、物理带库设备告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接;
主机硬件监控模块:采集主机硬件告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接;
机房基础环境监控模块、网络设备监控模块、安全设备监控模块、存储设备监控模块、主机硬件监控模块、操作系统监控模块、平台软件监控模块位于同一台服务器上,监控指标处理模块位于另一台服务器上,二个服务器之间通过网络连接实现二个服务器之间的数据交互。
2.根据权利要求1所述的一种IT基础平台监控指标采集系统,其特征在于:它还包括:
操作系统监控模块,它采集Windows、Unix、Linux、虚拟化EXSi系统告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接;
平台软件监控模块:它采集数据库Oracle、postgreSQL、SQLServer、中间件WebLogic、IIS、Tomcat软件告警信息,并发送至监控指标处理模块,与监控指标处理模块电连接。
3.一种IT基础平台监控指标采集系统的采集方法,它包括:
UPS监控指标的采集方法为:机房基础环境监控模块通过UPS的RS232C端口采集系统负载、输出电压、电池后备时间、系统报警和旁路电压超限告警信息;
空调监控指标的采集方法为:机房基础环境监控模块通过空调的RS485端口采集空调运行状态、温湿度信息、压缩机压力和主风扇过载告警信息;
交换机监控指标采集方法为:网络设备监控模块向交换机发起SNMP请求,获取CPU使用率、内存空闲率、端口流量利用率和端口错包率告警信息,通过ping交换机获取交换机可达性告警信息,通过接收交换机Trap,获取端口down、交换机发生切换、生成树协议状态异常和部件状态异常告警信息;
路由器监控指标采集方法为:网络设备监控模块向路由器发起SNMP请求,获取CPU使用率、内存空闲率、端口流量利用率、端口错包率、远端网络节点的平均延时、路由器的网络可达性告警信息;通过ping路由器获取路由器可达性告警信息,通过接收路由器Trap,获取端口失效、路由邻居down和部件状态异常告警信息;
负载均衡器监控指标采集的采集方法为:网络设备监控模块向路由器发起SNMP请求,获取CPU使用率、内存空闲率、全局client并发连接数、全局SSL并发卸载连接数、特定虚拟服务VSclient并发连接数、特定虚拟服务VS并发SSL卸载连接数告警信息;通过ping负载均衡器获取负载均衡器可达性告警信息;通过接收负载均衡器Trap,获取网关冗余协议状态异常、集群成员RS探测状态异常、虚拟服务状态、关键守护进程状态和部件状态告警信息;
防火墙监控指标采集方法为:安全设备监控模块向防火墙发起SNMP请求,获取CPU使用率、内存空闲率、全局并发连接数告警信息;通过ping防火墙,获取防火墙可达性告警信息;通过接收防火墙Trap,获取网关冗余协议状态、关键守护进程状态和部件状态告警信息;
存储设备监控指标采集方法为:存储设备监控模块通过接收存储设备Trap,获取磁盘柜FA端口状态、磁盘故障、缓存错误、磁盘柜温度、RAID设备损坏、磁盘柜电池故障、磁盘柜电源故障和控制器故障告警信息;
光纤交换机监控指标采集方法为:存储设备监控模块通过接收光纤交换机Trap,获取端口状态、CP板状态、端口物理状态、端口GBIC、SFP状态、槽位卡状态、风扇、电源、温度状态告警信息;
虚拟带库监控指标采集为:存储设备监控模块通过接收虚拟带库Trap,获取带库机头故障、磁盘故障、缓存错误、温度故障、RAID设备故障、电池故障和电源故障告警信息;
物理带库监控指标采集方法为:存储设备监控模块通过接收物理带库Trap,获取机械手故障、机械臂故障、电源故障、磁带机没有加电、带仓没有磁带和磁头需要清洗告警信息;
主机硬件监控指标采集方法为:主机硬件监控模块通过程序每10分钟向设备发送IPMI接口命令获取硬件日志信息,在输出结果中通过过滤关键字,获取CPU故障、主板故障、电源故障、IO卡故障、内存故障和磁盘故障告警信息。
4.根据权利要求3所述的一种IT基础平台监控指标采集系统的采集方法,其特征在于它还包括:
Windows监控指标采集方法:操作系统监控模块通过从Windows系统中获取CPU利用率、物理内存利用率、系统连续运行时间、系统重启和逻辑磁盘利用率告警信息;
Unix或Linux监控指标采集方法:操作系统监控模块获取CPU利用率、指定进程占用的内存、文件系统利用率、系统IO、交换空间、i节点利用率、系统连续运行时间和系统重启告警信息;
虚拟化ESXi监控指标采集方法:操作系统监控模块通过ESXi系统的API接口获取物理机CPU使用率、物理机内存使用率、主机集群切换信息、存储磁盘使用率、虚拟交换机网络上行链路冗余状态、虚拟机迁移信息、虚拟机与存储设备连接状态和vCenter与虚拟机连接状态告警信息;
Oracle监控指标采集方法:平台软件监控模块获取会话占用的PGA空间、Oracle会话比例、打开的游标比例、后台关键进程是丢失、表空间利用率、Undo表空间利用率、监听端口状态、等待告警的等待时间、PGA内存使用率、数据库连通性、数据库告警日志、CRS健康状态、CRS资源在线、OCR状态、RAC进程状态、归档日志目录大小、数据文件目录大小告警信息;
PostgreSQL监控指标采集方法:平台软件监控模块通过PLSQL登录数据库获取数据库连通性告警信息;通过获取会话数量告警信息;通过程序过滤日志文件获取数据库ShutDown、Failed告警信息;
SQL Server 2008监控指标采集采集方法:平台软件监控模块获取用户连接数、SQLServer关闭、锁等待时间、数据库连通性、有失败的数据库任务、数据库空间利用率、日志空间利用率告警信息;
WebLogic监控指标采集方法:平台软件监控模块获取端口连接数和端口状态告警信息;
IIS监控指标采集方法:平台软件监控模块获取端口连接数、端口状态、IIS进程存在告警信息;
Tomcat监控指标采集方法:平台软件监控模块获取端口连接数和端口状态告警信息。
CN201510699164.2A 2015-10-26 2015-10-26 一种it基础平台监控指标采集系统及采集方法 Active CN105407011B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510699164.2A CN105407011B (zh) 2015-10-26 2015-10-26 一种it基础平台监控指标采集系统及采集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510699164.2A CN105407011B (zh) 2015-10-26 2015-10-26 一种it基础平台监控指标采集系统及采集方法

Publications (2)

Publication Number Publication Date
CN105407011A CN105407011A (zh) 2016-03-16
CN105407011B true CN105407011B (zh) 2018-10-19

Family

ID=55472274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510699164.2A Active CN105407011B (zh) 2015-10-26 2015-10-26 一种it基础平台监控指标采集系统及采集方法

Country Status (1)

Country Link
CN (1) CN105407011B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106230636A (zh) * 2016-08-05 2016-12-14 成都酉辰科技有限公司 无线电监测网全网设备监控系统
CN106656632A (zh) * 2017-02-03 2017-05-10 上海中信信息发展股份有限公司 融合以太网和物联网协议的机房监控系统及信息处理、控制方法
CN107026767B (zh) * 2017-03-30 2019-10-18 上海七牛信息技术有限公司 业务协议指标数据收集方法及系统
CN107070726A (zh) * 2017-05-22 2017-08-18 郑州云海信息技术有限公司 一种基于mdc的综合管理方法
CN107942796A (zh) * 2017-11-29 2018-04-20 苏州天华信息科技股份有限公司 一种智能化监控前端设备运维管控系统及方法
CN109446043A (zh) * 2018-10-16 2019-03-08 中国南方电网有限责任公司 一种应用日志实时分析以及数据库实时监控系统
CN109510720B (zh) * 2018-10-23 2021-08-17 长飞光纤光缆股份有限公司 基于工业互联网平台的光纤测试数据采集方法
CN109547255A (zh) * 2018-12-05 2019-03-29 合肥卓瑞信息技术有限公司 一种it运维管理设备故障预警提醒系统
CN109657815A (zh) * 2018-12-14 2019-04-19 河南飙风信息科技有限公司 一种自动化运维企业主机管理系统
CN110190992A (zh) * 2019-05-21 2019-08-30 上海连尚网络科技有限公司 一种故障的监测方法及路由设备
CN110161930B (zh) * 2019-06-05 2021-11-09 安徽三实信息技术服务有限公司 一种数据监控系统及其数据监控方法
CN110456779B (zh) * 2019-08-26 2021-07-06 鄂尔多斯市君正能源化工有限公司热电分公司 一种dcs系统异常监控装置
CN111698199A (zh) * 2020-04-13 2020-09-22 国网浙江省电力有限公司杭州供电公司 防火墙监控方法及装置
CN111698168B (zh) * 2020-05-20 2022-06-28 北京吉安金芯信息技术有限公司 消息处理方法、装置、存储介质及处理器
CN112235147A (zh) * 2020-10-20 2021-01-15 珠海格力电器股份有限公司 获取设备能耗数据的方法、网关和系统
CN112731906B (zh) * 2020-12-24 2022-04-08 烽台科技(北京)有限公司 一种信息采集装置
CN113032212B (zh) * 2021-03-22 2022-07-26 广东省气象探测数据中心(广东省气象技术装备中心、广东省气象科技培训中心) 气象数据的全网监视方法、系统、计算机设备及存储介质
CN113783724A (zh) * 2021-08-27 2021-12-10 国网江苏省电力有限公司南通供电分公司 一种终端准入监控预警平台
CN114513334B (zh) * 2022-01-13 2023-11-28 卡奥斯工业智能研究院(青岛)有限公司 风险管理方法和风险管理装置
CN115396291B (zh) * 2022-08-23 2024-06-18 度小满科技(北京)有限公司 一种基于kubernetes托管的redis集群故障自愈方法
CN116303373B (zh) * 2023-05-22 2023-07-25 湖南三湘银行股份有限公司 一种全自动监控诊断数据库的装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101296115A (zh) * 2007-11-22 2008-10-29 中国移动通信集团山东有限公司 电信网络多维监控方法
CN101364905A (zh) * 2008-09-10 2009-02-11 俞惟铨 有线网络监控系统
CN102004476A (zh) * 2010-10-29 2011-04-06 胡友彬 气象装备运行环境安全监测及预警系统
CN102354198A (zh) * 2011-10-10 2012-02-15 曙光信息产业(北京)有限公司 机房监控方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101296115A (zh) * 2007-11-22 2008-10-29 中国移动通信集团山东有限公司 电信网络多维监控方法
CN101364905A (zh) * 2008-09-10 2009-02-11 俞惟铨 有线网络监控系统
CN102004476A (zh) * 2010-10-29 2011-04-06 胡友彬 气象装备运行环境安全监测及预警系统
CN102354198A (zh) * 2011-10-10 2012-02-15 曙光信息产业(北京)有限公司 机房监控方法和装置

Also Published As

Publication number Publication date
CN105407011A (zh) 2016-03-16

Similar Documents

Publication Publication Date Title
CN105407011B (zh) 一种it基础平台监控指标采集系统及采集方法
US11106388B2 (en) Monitoring storage cluster elements
CN107070726A (zh) 一种基于mdc的综合管理方法
US6928589B1 (en) Node management in high-availability cluster
US20030158933A1 (en) Failover clustering based on input/output processors
WO2021208017A1 (zh) 一种基于5g的工业远程控制系统
CN108388497B (zh) 多节点高密度服务器的监控及管理系统和方法
CN114500250A (zh) 一种云模式下体系联动的综合运维系统及方法
CN103139248B (zh) 机架系统
CN103281208B (zh) 一种数据灾备服务及综合监控系统
CN103490919A (zh) 故障管理系统和故障管理方法
CN111193643A (zh) 一种云服务器状态监控系统及方法
CN114090184A (zh) 一种虚拟化集群高可用性的实现方法和设备
CN110912755A (zh) 一种云环境下网卡故障监控与自动恢复的系统及方法
CN106209444A (zh) 一种基于统一视图的it资产协同监测系统
WO2023125702A1 (zh) 换电站的云管理方法、系统、服务器及存储介质
CN111880999A (zh) 用于高密度刀片服务器的高可用监控管理装置及冗余切换方法
US8565067B2 (en) Apparatus, system, and method for link maintenance
CN201750426U (zh) 智能刀片服务器
CN108471452A (zh) 一种单机柜数据中心监控方法、系统及装置
Guijarro et al. Experience and lessons learnt from running high availability databases on network attached storage
CN114510391A (zh) 一种融合基础架构监控管理系统
CN107423167A (zh) 一种基于双控存储的ISCSI target冗余控制方法和系统
CN112202594A (zh) 一种核电站服务器故障应急处理系统及方法
Kitamura Configuration of a Power-saving High-availability Server System Incorporating a Hybrid Operation Method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant