CN109901969A - 一种集中监控管理平台的设计方法及装置 - Google Patents

一种集中监控管理平台的设计方法及装置 Download PDF

Info

Publication number
CN109901969A
CN109901969A CN201910106838.1A CN201910106838A CN109901969A CN 109901969 A CN109901969 A CN 109901969A CN 201910106838 A CN201910106838 A CN 201910106838A CN 109901969 A CN109901969 A CN 109901969A
Authority
CN
China
Prior art keywords
monitoring
data
management tool
monitoring management
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910106838.1A
Other languages
English (en)
Other versions
CN109901969B (zh
Inventor
林立磐
潘仲毅
刘智国
彭子非
严伟雄
陈朝晖
邓斌庆
陈瑞翔
王镇彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Ankeyun Technology Co Ltd
Original Assignee
Guangdong Ankeyun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Ankeyun Technology Co Ltd filed Critical Guangdong Ankeyun Technology Co Ltd
Priority to CN201910106838.1A priority Critical patent/CN109901969B/zh
Publication of CN109901969A publication Critical patent/CN109901969A/zh
Application granted granted Critical
Publication of CN109901969B publication Critical patent/CN109901969B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种集中监控管理平台的设计方法及装置,所述方法包括:设定监控管理对象,包括基础软件、虚拟机数据资源、http请求监控、JDBC执行情况、用户并发和用户操作;根据所述监控管理对象,设置相应的监控管理工具,包括基础软件监控管理工具、虚拟机数据资源监控管理工具、http请求监控管理工具、JDBC执行情况监控管理工具、用户并发监控管理工具和用户操作监控管理工具;设计所述监控管理工具的执行方案;将设计好的监控管理工具进行图形化。本发明能够实现对运行对象进行集中统一管理,降低管理维护的复杂性,确保业务系统持续稳定可靠运行,以及减少运维人员的工作量和降低维护成本。

Description

一种集中监控管理平台的设计方法及装置
技术领域
本发明涉及平台监控管理技术领域,尤其涉及一种集中监控管理平台的设计方法及装置。
背景技术
运行支撑平台作为支撑安全可靠基础软硬件运行关键平台,包括业务应用及用户、数据资源、主流安全可靠基础软硬件使用者等,如安全可靠芯片及安全可靠操作系统构建而成的服务器应用环境,运行监管对象的稳定性和安全性对国产软硬件平台的应用成败至关重要。因此需要一种整体性能监控技术能实时监测各个运行监管对象,并且进行相应的调优以及安全防护措施。
为实现对运行对象进行集中统一管理,降低管理维护的复杂性,从而达到“集中监控、集中管理、集中维护”的目的,如何确保业务系统持续稳定可靠运行,以及减少运维人员的工作量和降低维护成本,成为运行支撑平台亟待解决的问题。
发明内容
本发明所要解决的技术问题在于,提供一种集中监控管理平台的设计方法及装置,能够实现对运行对象进行集中统一管理,降低管理维护的复杂性,确保业务系统持续稳定可靠运行,以及减少运维人员的工作量和降低维护成本。。
为解决上述问题,本发明的一个实施例提供一种集中监控管理平台的设计方法,包括:
设定监控管理对象,包括基础软件、虚拟机数据资源、http请求监控、JDBC执行情况、用户并发和用户操作;
根据所述监控管理对象,设置相应的监控管理工具,包括基础软件监控管理工具、虚拟机数据资源监控管理工具、http请求监控管理工具、JDBC执行情况监控管理工具、用户并发监控管理工具和用户操作监控管理工具;
设计所述监控管理工具的执行方案;
将设计好的监控管理工具进行图形化。
所述根据所述监控管理对象,设置相应的监控管理工具,具体的:
根据所述监控管理对象的监管事件,设定监管规则,并根据所述监管规则设置相应的监控管理工具。
所述根据所述监控管理对象的监管事件,设定监管规则,具体的:
监控服务器上的所有基础软件,包括:
操作系统的监控,对系统日志中出现的错误予以及时的修复;
中间件运行状态的监控,对中间件的日志报错予以相应的处理;
业务系统运行端口监控,对无法正常访问的端口予以开通;
业务系统的监控,对业务系统进行智能备份,当出现问题时,进行自动恢复;
监控服务器上的虚拟机数据资源,包括:
虚拟机内存监控,定时回收系统中无效的内存,保证虚拟机占用内存不会超过最大使用内存;
CPU内存监控,定时清理虚拟机内无效的内存,保证CPU的占用率不会因为过高而导致业务系统无法运行;
虚拟机线程监控,当虚拟机内的线程超过服务器所能负荷的最大线程时,进行服务器调优,保证系统正常运行;
监控业务系统所有的http请求,包括:
请求的命中数、中断数,当请求中断过多时对服务器环境,网络环境进行检查及修复;
请求的响应时间,定位业务系统中响应时间过长的请求进行处理;
请求功能,监控系统重要功能的业务请求,保证这些业务请求的命中数和响应时间;
监控数据库的所有JDBC操作,包括:
定时统计数据库的提交数、回滚数、等待数、空闲数,在系统随着业务处理增加的同时,保证数据库的处理能力;
实时监控数据库的所有事务处理,对未正确处理或者处理时间过长的事务操作予以修复;
数据库健康监控,对数据库进行定时只能备份操作,当数据库出现数据不完整时,执行恢复操作;
监控业务系统的用户并发问题,包括:
会话监控,实时统计业务系统的会话总数,会话创建数,会话销毁数,及时对服务器做出调整,避免业务系统用户并发量过大而导致访问过慢或者无法访问的现象;
调整连接池,对连接池的初始连接数,最大连接数,调整连接数等参数做出调整,节约服务器内存开销,保证业务系统的并发访问量满足实际需求;
监控所有的用户操作,记录系统用户的操作日志;用户为超级管理员时,对用户进行操作,包括增加用户和赋予权限;用户为普通管理员时,对系统模块进行操作,包括增加模块和修改模块;用户为普通用户时,对所有业务进行操作。
设计所述监控管理工具的执行方案,具体的:
虚拟机数据资源监控管理工具的执行方案,为监控虚拟机内存、CPU和线程,当监控中出现问题时,判断虚拟机是否崩溃,若是,则调用负载均衡,启动新的虚拟机;若否,则内存回收,并继续当前虚拟机;
http请求监控管理工具的执行方案,为监控http请求,当监控中出现问题时,若为数据库中断,则重启数据库;若为内存溢出,则重启中间件;若为请求执行过慢,则进行代码优化;
JDBC执行情况监控管理工具的执行方案,为监控JDBC操作,当监控中出现问题时,若为事务处理不完整或执行过慢,则进行代码优化;若为等待数据过多、空闲数过少,则增加数据库的最大连接数;若为无法提交,则重启数据库;若为无法运行,则重装、恢复数据;
用户并发监控管理工具的执行方案,为监控会话数,判断当前并发量不足够时,调整连接池参数;若连接池参数超过服务负载,则增加负载。
在将设计好的监控管理工具进行图形化之后,还包括:
设计图形化的关键数据监控工具;所述关键数据监控工具由监控驱动容器、关键数据适配器、关键数据分析器、监控数据展现器、异常报警分析器和监控报告生成分析器构成。
所述监控驱动容器,用于提供统一接口规范,驱动以插件的形式加载入容器的关键数据适配器,以获取监控的数据;
所述关键数据适配器,用于按照统一接口规范,结合监控的目标关键数据的特点,实现关键数据获取适配器,以完成对关键数据的监控;
所述关键数据分析器,用于将适配器监控获取的数据,按特定的格式对监控数据进行分析;
所述监控数据展现器,用于将监控数据的分析结果按匹配的图形类型进行图形化,并展现;
所述异常报警分析器,用于将监控数据的分析结果结合预先设定的关键数据项的阀值进行比较,并进行异常报警;
所述监控报告生成分析器,用于将监控数据的分析结果按预先设定的格式生成分析报告,并按设定的规则给出改进建议。
本发明的另一实施例还提供了一种集中监控管理平台的设计装置,包括:
对象设计模块,用于设定监控管理对象,包括基础软件、虚拟机数据资源、http请求监控、JDBC执行情况、用户并发和用户操作;
工具设计模块,用于根据所述监控管理对象,设置相应的监控管理工具,包括基础软件监控管理工具、虚拟机数据资源监控管理工具、http请求监控管理工具、JDBC执行情况监控管理工具、用户并发监控管理工具和用户操作监控管理工具;
执行方案设计模块,用于设计所述监控管理工具的执行方案;
图形化模块,用于将设计好的监控管理工具进行图形化。
所述执行方案设计模块,具体用于:
设计虚拟机数据资源监控管理工具的执行方案,为监控虚拟机内存、CPU和线程,当监控中出现问题时,判断虚拟机是否崩溃,若是,则调用负载均衡,启动新的虚拟机;若否,则内存回收,并继续当前虚拟机;
设计http请求监控管理工具的执行方案,为监控http请求,当监控中出现问题时,若为数据库中断,则重启数据库;若为内存溢出,则重启中间件;若为请求执行过慢,则进行代码优化;
设计JDBC执行情况监控管理工具的执行方案,为监控JDBC操作,当监控中出现问题时,若为事务处理不完整或执行过慢,则进行代码优化;若为等待数据过多、空闲数过少,则增加数据库的最大连接数;若为无法提交,则重启数据库;若为无法运行,则重装、恢复数据;
设计用户并发监控管理工具的执行方案,为监控会话数,判断当前并发量不足够时,调整连接池参数;若连接池参数超过服务负载,则增加负载。
所述工具设计模块,还用于设定图形化的关键数据监控工具;所述关键数据监控工具由监控驱动容器、关键数据适配器、关键数据分析器、监控数据展现器、异常报警分析器和监控报告生成分析器构成。
所述监控驱动容器,用于提供统一接口规范,驱动以插件的形式加载入容器的关键数据适配器,以获取监控的数据;
所述关键数据适配器,用于按照统一接口规范,结合监控的目标关键数据的特点,实现关键数据获取适配器,以完成对关键数据的监控;
所述关键数据分析器,用于将适配器监控获取的数据,按特定的格式对监控数据进行分析;
所述监控数据展现器,用于将监控数据的分析结果按匹配的图形类型进行图形化,并展现;
所述异常报警分析器,用于将监控数据的分析结果结合预先设定的关键数据项的阀值进行比较,并进行异常报警;
所述监控报告生成分析器,用于将监控数据的分析结果按预先设定的格式生成分析报告,并按设定的规则给出改进建议。
实施本发明实施例具有如下有益效果:
通过实施上述技术方案设计的监控管理平台,能够降低管理维护的复杂性,确保业务系统持续稳定可靠运行,以及减少运维人员的工作量和降低维护成本,具体解决如下两个方面的问题:
1、对运行对象进行集中监控
监控管理平台拥有7*24小时不间断可靠运行的能力。在运行期能够实时对安全可靠基础软硬件上的监管对象(服务器、终端、应用系统)进行多角度的监控(包括线程、内存、数据库性能、HTTP请求、会话等),并对异常情况做出快速反应,以保证业务系统持续稳定可靠运行;
2、对运行对象的集中管理
复杂业务办公系统包括基础设施平台、系统软件、应用服务器、应用程序池等,为了保证业务系统的稳定运行,对运行监管对象的监控管理更严格。智能监测管控工具可以对所有的运行监管对象进行集中的监控和管理,从而可以大大减低运维人员的工作量和降低维护成本。
附图说明
图1是本发明的一个实施例提供的一种集中监控管理平台的设计方法的流程示意图;
图2是本发明的一个实施例中监控管理平台的结构示意图;
图3是本发明的另一个实施例提供的一种集中监控管理平台的设计方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
集中监控管理平台主要作用是用来监测系统中的大量安全可靠基础软硬件和核心区应用系统服务器的性能。大量安全可靠基础软硬件分别分布在核心区内网、省政企单位、地市政企单位、县政企单位和省、地市、县服务大厅。集中监控管理平台监控核心服务器区中安装在服务器上的操作系统、数据库、中间件等软件运行状况。集中监控管理平台的采集数据主要是使用网络协议中的SNMP协议,集中监控管理平台通过采集各终端反馈的数据来分析终端运行状态,从而筛选出有运行状态有问题设备。集中监控管理平台处理流程主要分为四个部分:终端和服务器数据采集,数据分析,故障告警和告警处理。终端和服务器数据采集是通过终端上的SNMP进行数据采集工作,在集中管理平台上设置每隔一定时间向系统所有终端和服务器采集一次数据。系统采集完所有数据后会对数据进行分析,根据监控管理平台设置的各项阀值来分析终端和服务器部分运行是否正常,如CPU占用率超过设定阀值将会告警,从而达到“集中监控、集中管理、集中维护”的目标。
具体的,请参阅图1-2,本发明的一个实施例提供的一种集中监控管理平台的设计方法,包括:
S1、设定监控管理对象,包括基础软件、虚拟机数据资源、http请求监控、JDBC执行情况、用户并发和用户操作。
通过对运行对象进行集中统一管理,能够降低管理维护的复杂性。具体的,通过Snmp协议,Agent等多种数据采集方式,对运行监管对象(服务器、终端、应用系统)进行多角度的监控(包括线程、内存、数据库性能、HTTP请求、会话等),监控管理平台将被监控对象的监控数据(性能数据、告警数据、部分配置数据)统一展现给监控和维护人员。
S2、根据所述监控管理对象,设置相应的监控管理工具,包括基础软件监控管理工具、虚拟机数据资源监控管理工具、http请求监控管理工具、JDBC执行情况监控管理工具、用户并发监控管理工具和用户操作监控管理工具。
具体的,根据所述监控管理对象的监管事件,设定监管规则,并根据所述监管规则设置相应的监控管理工具。
设定监管规则(运营对象检测管控策略)如下:
监控服务器上的所有基础软件,包括:
操作系统的监控,对系统日志中出现的错误予以及时的修复;
中间件运行状态的监控,对中间件的日志报错予以相应的处理;
业务系统运行端口监控,对无法正常访问的端口予以开通;
业务系统的监控,对业务系统进行智能备份,当出现问题时,进行自动恢复。
监控服务器上的虚拟机数据资源,包括:
虚拟机内存监控,定时回收系统中无效的内存,保证虚拟机占用内存不会超过最大使用内存;
CPU内存监控,定时清理虚拟机内无效的内存,保证CPU的占用率不会因为过高而导致业务系统无法运行;
虚拟机线程监控,当虚拟机内的线程超过服务器所能负荷的最大线程时,进行服务器调优,保证系统正常运行。
监控业务系统所有的http请求,包括:
请求的命中数、中断数,当请求中断过多时对服务器环境,网络环境进行检查及修复;
请求的响应时间,定位业务系统中响应时间过长的请求进行处理;
请求功能,监控系统重要功能的业务请求,保证这些业务请求的命中数和响应时间。
监控数据库的所有JDBC操作,包括:
定时统计数据库的提交数、回滚数、等待数、空闲数,在系统随着业务处理增加的同时,保证数据库的处理能力;
实时监控数据库的所有事务处理,对未正确处理或者处理时间过长的事务操作予以修复;
数据库健康监控,对数据库进行定时只能备份操作,当数据库出现数据不完整时,执行恢复操作。
监控业务系统的用户并发问题,包括:
会话监控,实时统计业务系统的会话总数,会话创建数,会话销毁数,及时对服务器做出调整,避免业务系统用户并发量过大而导致访问过慢或者无法访问的现象;
调整连接池,对连接池的初始连接数,最大连接数,调整连接数等参数做出调整,节约服务器内存开销,保证业务系统的并发访问量满足实际需求。
监控所有的用户操作,记录系统用户的操作日志;用户为超级管理员时,对用户进行操作,包括增加用户和赋予权限;用户为普通管理员时,对系统模块进行操作,包括增加模块和修改模块;用户为普通用户时,对所有业务进行操作。
S3、设计所述监控管理工具的执行方案。
虚拟机数据资源监控管理工具的执行方案,为监控虚拟机内存、CPU和线程,当监控中出现问题时,判断虚拟机是否崩溃,若是,则调用负载均衡,启动新的虚拟机;若否,则内存回收,并继续当前虚拟机。
在具体实施例当中,复杂办公系统是以虚拟机为容器来运行的,为了保障系统的稳定运行,必须对虚拟机进行状态监管,对运行中出现的问题进行优化调试,并且执行安全防护方面的措施。
对虚拟机的数据资源进行实时的监控,包括虚拟内存的占用,CPU的占用率,虚拟机线程数,提供图形化的监控界面,实时的对虚拟机的运行状态进行监控,及时反馈监控中出现的错误,智能的执行相关修复操作。
当监控出现问题时,例如虚拟机出现内存占用超过最大内存的70%,CPU占用率超过80%或者虚拟机线程数超过最大线程数的85%等情况时,智能的执行无效内存回收操作,降低内存的占用,CPU的占用率,回收无效的线程,继续运行当前的虚拟机。当出现内存溢出的现象时,利用应用服务器的负载均衡功能,智能的切换节点,启动一个新的虚拟机,保证政府复杂办公系统的正常运行。系统运维人员也可以根据反馈的错误信息进行相关处理。
http请求监控管理工具的执行方案,为监控http请求,当监控中出现问题时,若为数据库中断,则重启数据库;若为内存溢出,则重启中间件;若为请求执行过慢,则进行代码优化。
在具体实施例当中,复杂办公系统所执行的所有业务操作都是以用户发送http请求,服务器响应的形式来完成的,对http请求进行状态监控、优化调试、安全防护,保证请求用更短的时间完整的响应,是政府复杂办公系统稳定高效运行的重要保障。
实时的对政府复杂办公系统处理的所有http请求进行监控,包括:请求命中数,请求中断数,请求响应时间,请求功能描述,提供图形化的监控界面,及时反馈监控中出现的错误,智能的执行相关修复操作。
当监控中出现错误信息时,根据错误信息和监控信息执行相关的修复操作,如:错误信息为“数据库连接中断时”,可以智能的执行数据库重启操作,错误信息为“内存溢出时”,可以智能的执行中间件的重启操作。统计响应过慢和错误的请求,系统运维人员可以根据统计信息和错误信息对政府复杂办公系统的业务代码进行相关优化和修复,保证系统的稳定运行。
JDBC执行情况监控管理工具的执行方案,为监控JDBC操作,当监控中出现问题时,若为事务处理不完整或执行过慢,则进行代码优化;若为等待数据过多、空闲数过少,则增加数据库的最大连接数;若为无法提交,则重启数据库;若为无法运行,则重装、恢复数据。
在具体实施例当中,复杂办公系统对用户请求的响应操作都是在数据库中以数据库语句包装的事务来完成的,确保数据库操作执行的正确和效率是系统稳定高效运行的重要保障。
对数据库的所有JDBC操作进行监控,包括:提交数、回滚数、等待数、空闲数、事务处理的完整性、事务处理的时间,提供图形化的监控界面,实时的监控数据库的执行情况,及时反馈监控中出现的错误,智能的执行相关修复操作。
当监控到错误信息时,根据错误信息和监控信息执行相关的修复操作,如:当事务处理不完整而回滚,或者事务处理时间过慢时,优化业务代码的事务处理;当监控到空闲数没有,等待数过多时,增加数据库的最大连接数;当监控到某段时间数据库没有提交数时,重启数据库;当监控信息出现“数据库无法正常运行”时,必须重新安装数据库并恢复数据。运维人员也可以根据监控信息和反馈的错误信息做出相关处理,确保数据库操的稳定的运行。
用户并发监控管理工具的执行方案,为监控会话数,判断当前并发量不足够时,调整连接池参数;若连接池参数超过服务负载,则增加负载。
在具体实施例当中,复杂办公系统的长期运行必然伴随用户量的增加,必须对系统的并发用户进行监控,并且做出相关的处理才能保证系统不会因为并发用户过多导致访问过慢或者系统崩溃。
监控政府复杂办公系统的会话情况,包括:会话总数、会话创建数,会话销毁数,由此可以判断业务系统当前的并发用户是否对业务系统的访问效率造成影响,提供图形化的监控界面,实时的监控当前的用户并发量,及时反馈监控时出现的错误,智能的执行相关修复操作。
根据监控的信息,当会话总数过高,会话创建数过多,会话销毁数很少的时候,表示当前业务系统的用户并发比较大,提供智能的连接池调控功能,提升初始连接数、最大连接数、调整连接数,提升系统的并发用户量。当连接池参数调整到服务器的最大负载依旧无法支撑当前的并发用户时,就必须通过服务器负载等措施来提升并发用户量。运维人员也可以根据错误反馈信息和监控信息来做出相关处理,保证政府复杂办公系统的长期稳定运行。
另外,复杂办公系统长期稳定的运行,必须对服务器上的基础软硬件进行状态监管,对运行中出现的问题进行优化调试,并且进行安全防护方面的措施,为政府复杂办公系统提供可靠的软硬件保障。
对操作系统、中间件、数据库、CPU、内存、硬盘等基础软硬件进行实时监控,提供可视化的监控界面,实时的显示出各种软硬件当前的运行状态,及时反馈监控时出现的错误,智能的执行相关修复操作。
当监控到错误时,根据反馈的错误信息,智能的执行数据库、中间件和操作系统的修复及重启等操作,这些操作可以设定在政府复杂办公系统无访问量或者访问量最少的时候执行,如凌晨12点到3点之间。系统运维人员也可以根据监控信息和错误反馈信息进行相应的处理,保证基础软硬件环境的稳定性。
另外,复杂办公系统要求有不同种类的系统用户,用户之间的数据也是不能互相公开的,用户操作的安全性是系统安全性的一个重要标志。
记录所有用户的操作,当用户的业务数据遭到损坏时,可以通过操作日志跟踪定位到是哪个用户何时进行的操作。
S4、将设计好的监控管理工具进行图形化。
所有工具的成果形式均为图形化。
根据上述描述,本实施例能够实现对运行对象进行集中统一管理,降低管理维护的复杂性,确保业务系统持续稳定可靠运行,以及减少运维人员的工作量和降低维护成本。
请参阅图3。
优选的,在上述实施例的基础上,在将设计好的监控管理工具进行图形化之后,还包括:
S5、设计图形化的关键数据监控工具;所述关键数据监控工具由监控驱动容器、关键数据适配器、关键数据分析器、监控数据展现器、异常报警分析器和监控报告生成分析器构成。
所述监控驱动容器,用于提供统一接口规范,驱动以插件的形式加载入容器的关键数据适配器,以获取监控的数据。
所述关键数据适配器,用于按照统一接口规范,结合监控的目标关键数据的特点,实现关键数据获取适配器,以完成对关键数据的监控。
所述关键数据分析器,用于将适配器监控获取的数据,按特定的格式对监控数据进行分析。
所述监控数据展现器,用于将监控数据的分析结果按匹配的图形类型进行图形化,并展现。
所述异常报警分析器,用于将监控数据的分析结果结合预先设定的关键数据项的阀值进行比较,并进行异常报警。
所述监控报告生成分析器,用于将监控数据的分析结果按预先设定的格式生成分析报告,并按设定的规则给出改进建议。
该工具的实现功能如下:
对关键数据进行实时监控;
支持图形化的展示界面;
支持数据异常报警;
生成监控信息报告并支持监控信息分析。
作为本发明的一个优选实施例,一种集中监控管理平台的设计装置,包括:
对象设计模块,用于设定监控管理对象,包括基础软件、虚拟机数据资源、http请求监控、JDBC执行情况、用户并发和用户操作。
通过对运行对象进行集中统一管理,能够降低管理维护的复杂性。具体的,通过Snmp协议,Agent等多种数据采集方式,对运行监管对象(服务器、终端、应用系统)进行多角度的监控(包括线程、内存、数据库性能、HTTP请求、会话等),监控管理平台将被监控对象的监控数据(性能数据、告警数据、部分配置数据)统一展现给监控和维护人员。
工具设计模块,用于根据所述监控管理对象,设置相应的监控管理工具,包括基础软件监控管理工具、虚拟机数据资源监控管理工具、http请求监控管理工具、JDBC执行情况监控管理工具、用户并发监控管理工具和用户操作监控管理工具。
具体的,根据所述监控管理对象的监管事件,设定监管规则,并根据所述监管规则设置相应的监控管理工具。
设定监管规则(运营对象检测管控策略)如下:
监控服务器上的所有基础软件,包括:
操作系统的监控,对系统日志中出现的错误予以及时的修复;
中间件运行状态的监控,对中间件的日志报错予以相应的处理;
业务系统运行端口监控,对无法正常访问的端口予以开通;
业务系统的监控,对业务系统进行智能备份,当出现问题时,进行自动恢复。
监控服务器上的虚拟机数据资源,包括:
虚拟机内存监控,定时回收系统中无效的内存,保证虚拟机占用内存不会超过最大使用内存;
CPU内存监控,定时清理虚拟机内无效的内存,保证CPU的占用率不会因为过高而导致业务系统无法运行;
虚拟机线程监控,当虚拟机内的线程超过服务器所能负荷的最大线程时,进行服务器调优,保证系统正常运行。
监控业务系统所有的http请求,包括:
请求的命中数、中断数,当请求中断过多时对服务器环境,网络环境进行检查及修复;
请求的响应时间,定位业务系统中响应时间过长的请求进行处理;
请求功能,监控系统重要功能的业务请求,保证这些业务请求的命中数和响应时间。
监控数据库的所有JDBC操作,包括:
定时统计数据库的提交数、回滚数、等待数、空闲数,在系统随着业务处理增加的同时,保证数据库的处理能力;
实时监控数据库的所有事务处理,对未正确处理或者处理时间过长的事务操作予以修复;
数据库健康监控,对数据库进行定时只能备份操作,当数据库出现数据不完整时,执行恢复操作。
监控业务系统的用户并发问题,包括:
会话监控,实时统计业务系统的会话总数,会话创建数,会话销毁数,及时对服务器做出调整,避免业务系统用户并发量过大而导致访问过慢或者无法访问的现象;
调整连接池,对连接池的初始连接数,最大连接数,调整连接数等参数做出调整,节约服务器内存开销,保证业务系统的并发访问量满足实际需求。
监控所有的用户操作,记录系统用户的操作日志;用户为超级管理员时,对用户进行操作,包括增加用户和赋予权限;用户为普通管理员时,对系统模块进行操作,包括增加模块和修改模块;用户为普通用户时,对所有业务进行操作。
执行方案设计模块,用于设计所述监控管理工具的执行方案。
设计虚拟机数据资源监控管理工具的执行方案,为监控虚拟机内存、CPU和线程,当监控中出现问题时,判断虚拟机是否崩溃,若是,则调用负载均衡,启动新的虚拟机;若否,则内存回收,并继续当前虚拟机。
在具体实施例当中,复杂办公系统是以虚拟机为容器来运行的,为了保障系统的稳定运行,必须对虚拟机进行状态监管,对运行中出现的问题进行优化调试,并且执行安全防护方面的措施。
对虚拟机的数据资源进行实时的监控,包括虚拟内存的占用,CPU的占用率,虚拟机线程数,提供图形化的监控界面,实时的对虚拟机的运行状态进行监控,及时反馈监控中出现的错误,智能的执行相关修复操作。
当监控出现问题时,例如虚拟机出现内存占用超过最大内存的70%,CPU占用率超过80%或者虚拟机线程数超过最大线程数的85%等情况时,智能的执行无效内存回收操作,降低内存的占用,CPU的占用率,回收无效的线程,继续运行当前的虚拟机。当出现内存溢出的现象时,利用应用服务器的负载均衡功能,智能的切换节点,启动一个新的虚拟机,保证政府复杂办公系统的正常运行。系统运维人员也可以根据反馈的错误信息进行相关处理。
设计http请求监控管理工具的执行方案,为监控http请求,当监控中出现问题时,若为数据库中断,则重启数据库;若为内存溢出,则重启中间件;若为请求执行过慢,则进行代码优化。
在具体实施例当中,复杂办公系统所执行的所有业务操作都是以用户发送http请求,服务器响应的形式来完成的,对http请求进行状态监控、优化调试、安全防护,保证请求用更短的时间完整的响应,是政府复杂办公系统稳定高效运行的重要保障。
实时的对政府复杂办公系统处理的所有http请求进行监控,包括:请求命中数,请求中断数,请求响应时间,请求功能描述,提供图形化的监控界面,及时反馈监控中出现的错误,智能的执行相关修复操作。
当监控中出现错误信息时,根据错误信息和监控信息执行相关的修复操作,如:错误信息为“数据库连接中断时”,可以智能的执行数据库重启操作,错误信息为“内存溢出时”,可以智能的执行中间件的重启操作。统计响应过慢和错误的请求,系统运维人员可以根据统计信息和错误信息对政府复杂办公系统的业务代码进行相关优化和修复,保证系统的稳定运行。
设计JDBC执行情况监控管理工具的执行方案,为监控JDBC操作,当监控中出现问题时,若为事务处理不完整或执行过慢,则进行代码优化;若为等待数据过多、空闲数过少,则增加数据库的最大连接数;若为无法提交,则重启数据库;若为无法运行,则重装、恢复数据。
在具体实施例当中,复杂办公系统对用户请求的响应操作都是在数据库中以数据库语句包装的事务来完成的,确保数据库操作执行的正确和效率是系统稳定高效运行的重要保障。
对数据库的所有JDBC操作进行监控,包括:提交数、回滚数、等待数、空闲数、事务处理的完整性、事务处理的时间,提供图形化的监控界面,实时的监控数据库的执行情况,及时反馈监控中出现的错误,智能的执行相关修复操作。
当监控到错误信息时,根据错误信息和监控信息执行相关的修复操作,如:当事务处理不完整而回滚,或者事务处理时间过慢时,优化业务代码的事务处理;当监控到空闲数没有,等待数过多时,增加数据库的最大连接数;当监控到某段时间数据库没有提交数时,重启数据库;当监控信息出现“数据库无法正常运行”时,必须重新安装数据库并恢复数据。运维人员也可以根据监控信息和反馈的错误信息做出相关处理,确保数据库操的稳定的运行。
设计用户并发监控管理工具的执行方案,为监控会话数,判断当前并发量不足够时,调整连接池参数;若连接池参数超过服务负载,则增加负载。
在具体实施例当中,复杂办公系统的长期运行必然伴随用户量的增加,必须对系统的并发用户进行监控,并且做出相关的处理才能保证系统不会因为并发用户过多导致访问过慢或者系统崩溃。
监控政府复杂办公系统的会话情况,包括:会话总数、会话创建数,会话销毁数,由此可以判断业务系统当前的并发用户是否对业务系统的访问效率造成影响,提供图形化的监控界面,实时的监控当前的用户并发量,及时反馈监控时出现的错误,智能的执行相关修复操作。
根据监控的信息,当会话总数过高,会话创建数过多,会话销毁数很少的时候,表示当前业务系统的用户并发比较大,提供智能的连接池调控功能,提升初始连接数、最大连接数、调整连接数,提升系统的并发用户量。当连接池参数调整到服务器的最大负载依旧无法支撑当前的并发用户时,就必须通过服务器负载等措施来提升并发用户量。运维人员也可以根据错误反馈信息和监控信息来做出相关处理,保证政府复杂办公系统的长期稳定运行。
另外,复杂办公系统长期稳定的运行,必须对服务器上的基础软硬件进行状态监管,对运行中出现的问题进行优化调试,并且进行安全防护方面的措施,为政府复杂办公系统提供可靠的软硬件保障。
对操作系统、中间件、数据库、CPU、内存、硬盘等基础软硬件进行实时监控,提供可视化的监控界面,实时的显示出各种软硬件当前的运行状态,及时反馈监控时出现的错误,智能的执行相关修复操作。
当监控到错误时,根据反馈的错误信息,智能的执行数据库、中间件和操作系统的修复及重启等操作,这些操作可以设定在政府复杂办公系统无访问量或者访问量最少的时候执行,如凌晨12点到3点之间。系统运维人员也可以根据监控信息和错误反馈信息进行相应的处理,保证基础软硬件环境的稳定性。
另外,复杂办公系统要求有不同种类的系统用户,用户之间的数据也是不能互相公开的,用户操作的安全性是系统安全性的一个重要标志。
记录所有用户的操作,当用户的业务数据遭到损坏时,可以通过操作日志跟踪定位到是哪个用户何时进行的操作。
图形化模块,用于将设计好的监控管理工具进行图形化。
所有工具的成果形式均为图形化。
优选的,所述工具设计模块,还用于设定图形化的关键数据监控工具;所述关键数据监控工具由监控驱动容器、关键数据适配器、关键数据分析器、监控数据展现器、异常报警分析器和监控报告生成分析器构成。
所述监控驱动容器,用于提供统一接口规范,驱动以插件的形式加载入容器的关键数据适配器,以获取监控的数据;
所述关键数据适配器,用于按照统一接口规范,结合监控的目标关键数据的特点,实现关键数据获取适配器,以完成对关键数据的监控;
所述关键数据分析器,用于将适配器监控获取的数据,按特定的格式对监控数据进行分析;
所述监控数据展现器,用于将监控数据的分析结果按匹配的图形类型进行图形化,并展现;
所述异常报警分析器,用于将监控数据的分析结果结合预先设定的关键数据项的阀值进行比较,并进行异常报警;
所述监控报告生成分析器,用于将监控数据的分析结果按预先设定的格式生成分析报告,并按设定的规则给出改进建议。
该工具的实现功能如下:
对关键数据进行实时监控;
支持图形化的展示界面;
支持数据异常报警;
生成监控信息报告并支持监控信息分析。
通过实施上述技术方案设计的监控管理平台,能够降低管理维护的复杂性,确保业务系统持续稳定可靠运行,以及减少运维人员的工作量和降低维护成本,具体解决如下两个方面的问题:
1、对运行对象进行集中监控
监控管理平台拥有7*24小时不间断可靠运行的能力。在运行期能够实时对安全可靠基础软硬件的监管对象(服务器、终端、应用系统)进行多角度的监控(包括线程、内存、数据库性能、HTTP请求、会话等),并对异常情况做出快速反应,以保证业务系统持续稳定可靠运行;
2、对运行对象的集中管理
复杂业务办公系统包括基础设施平台、系统软件、应用服务器、应用程序池等,为了保证业务系统的稳定运行,对运行监管对象的监控管理更严格。智能监测管控工具可以对所有的运行监管对象进行集中的监控和管理,从而可以大大减低运维人员的工作量和降低维护成本。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和变形,这些改进和变形也视为本发明的保护范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。

Claims (10)

1.一种集中监控管理平台的设计方法,其特征在于,包括:
设定监控管理对象,包括基础软件、虚拟机数据资源、http请求监控、JDBC执行情况、用户并发和用户操作;
根据所述监控管理对象,设置相应的监控管理工具,包括基础软件监控管理工具、虚拟机数据资源监控管理工具、http请求监控管理工具、JDBC执行情况监控管理工具、用户并发监控管理工具和用户操作监控管理工具;
设计所述监控管理工具的执行方案;
将设计好的监控管理工具进行图形化。
2.根据权利要求1所述的集中监控管理平台的设计方法,其特征在于,所述根据所述监控管理对象,设置相应的监控管理工具,具体的:
根据所述监控管理对象的监管事件,设定监管规则,并根据所述监管规则设置相应的监控管理工具。
3.根据权利要求2所述的集中监控管理平台的设计方法,其特征在于,所述根据所述监控管理对象的监管事件,设定监管规则,具体的:
监控服务器上的所有基础软件,包括:
操作系统的监控,对系统日志中出现的错误予以及时的修复;
中间件运行状态的监控,对中间件的日志报错予以相应的处理;
业务系统运行端口监控,对无法正常访问的端口予以开通;
业务系统的监控,对业务系统进行智能备份,当出现问题时,进行自动恢复;
监控服务器上的虚拟机数据资源,包括:
虚拟机内存监控,定时回收系统中无效的内存,保证虚拟机占用内存不会超过最大使用内存;
CPU内存监控,定时清理虚拟机内无效的内存,保证CPU的占用率不会因为过高而导致业务系统无法运行;
虚拟机线程监控,当虚拟机内的线程超过服务器所能负荷的最大线程时,进行服务器调优,保证系统正常运行;
监控业务系统所有的http请求,包括:
请求的命中数、中断数,当请求中断过多时对服务器环境,网络环境进行检查及修复;
请求的响应时间,定位业务系统中响应时间过长的请求进行处理;
请求功能,监控系统重要功能的业务请求,保证这些业务请求的命中数和响应时间;
监控数据库的所有JDBC操作,包括:
定时统计数据库的提交数、回滚数、等待数、空闲数,在系统随着业务处理增加的同时,保证数据库的处理能力;
实时监控数据库的所有事务处理,对未正确处理或者处理时间过长的事务操作予以修复;
数据库健康监控,对数据库进行定时只能备份操作,当数据库出现数据不完整时,执行恢复操作;
监控业务系统的用户并发问题,包括:
会话监控,实时统计业务系统的会话总数,会话创建数,会话销毁数,及时对服务器做出调整,避免业务系统用户并发量过大而导致访问过慢或者无法访问的现象;
调整连接池,对连接池的初始连接数,最大连接数,调整连接数等参数做出调整,节约服务器内存开销,保证业务系统的并发访问量满足实际需求;
监控所有的用户操作,记录系统用户的操作日志;用户为超级管理员时,对用户进行操作,包括增加用户和赋予权限;用户为普通管理员时,对系统模块进行操作,包括增加模块和修改模块;用户为普通用户时,对所有业务进行操作。
4.根据权利要求1所述的集中监控管理平台的设计方法,其特征在于,设计所述监控管理工具的执行方案,具体的:
虚拟机数据资源监控管理工具的执行方案,为监控虚拟机内存、CPU和线程,当监控中出现问题时,判断虚拟机是否崩溃,若是,则调用负载均衡,启动新的虚拟机;若否,则内存回收,并继续当前虚拟机;
http请求监控管理工具的执行方案,为监控http请求,当监控中出现问题时,若为数据库中断,则重启数据库;若为内存溢出,则重启中间件;若为请求执行过慢,则进行代码优化;
JDBC执行情况监控管理工具的执行方案,为监控JDBC操作,当监控中出现问题时,若为事务处理不完整或执行过慢,则进行代码优化;若为等待数据过多、空闲数过少,则增加数据库的最大连接数;若为无法提交,则重启数据库;若为无法运行,则重装、恢复数据;
用户并发监控管理工具的执行方案,为监控会话数,判断当前并发量不足够时,调整连接池参数;若连接池参数超过服务负载,则增加负载。
5.根据权利要求1所述的集中监控管理平台的设计方法,其特征在于,在将设计好的监控管理工具进行图形化之后,还包括:
设计图形化的关键数据监控工具;所述关键数据监控工具由监控驱动容器、关键数据适配器、关键数据分析器、监控数据展现器、异常报警分析器和监控报告生成分析器构成。
6.根据权利要求5所述的集中监控管理平台的设计方法,其特征在于,
所述监控驱动容器,用于提供统一接口规范,驱动以插件的形式加载入容器的关键数据适配器,以获取监控的数据;
所述关键数据适配器,用于按照统一接口规范,结合监控的目标关键数据的特点,实现关键数据获取适配器,以完成对关键数据的监控;
所述关键数据分析器,用于将适配器监控获取的数据,按特定的格式对监控数据进行分析;
所述监控数据展现器,用于将监控数据的分析结果按匹配的图形类型进行图形化,并展现;
所述异常报警分析器,用于将监控数据的分析结果结合预先设定的关键数据项的阀值进行比较,并进行异常报警;
所述监控报告生成分析器,用于将监控数据的分析结果按预先设定的格式生成分析报告,并按设定的规则给出改进建议。
7.一种集中监控管理平台的设计装置,其特征在于,包括:
对象设计模块,用于设定监控管理对象,包括基础软件、虚拟机数据资源、http请求监控、JDBC执行情况、用户并发和用户操作;
工具设计模块,用于根据所述监控管理对象,设置相应的监控管理工具,包括基础软件监控管理工具、虚拟机数据资源监控管理工具、http请求监控管理工具、JDBC执行情况监控管理工具、用户并发监控管理工具和用户操作监控管理工具;
执行方案设计模块,用于设计所述监控管理工具的执行方案;
图形化模块,用于将设计好的监控管理工具进行图形化。
8.根据权利要求7所述的集中监控管理平台的设计装置,其特征在于,所述执行方案设计模块,具体用于:
设计虚拟机数据资源监控管理工具的执行方案,为监控虚拟机内存、CPU和线程,当监控中出现问题时,判断虚拟机是否崩溃,若是,则调用负载均衡,启动新的虚拟机;若否,则内存回收,并继续当前虚拟机;
设计http请求监控管理工具的执行方案,为监控http请求,当监控中出现问题时,若为数据库中断,则重启数据库;若为内存溢出,则重启中间件;若为请求执行过慢,则进行代码优化;
设计JDBC执行情况监控管理工具的执行方案,为监控JDBC操作,当监控中出现问题时,若为事务处理不完整或执行过慢,则进行代码优化;若为等待数据过多、空闲数过少,则增加数据库的最大连接数;若为无法提交,则重启数据库;若为无法运行,则重装、恢复数据;
设计用户并发监控管理工具的执行方案,为监控会话数,判断当前并发量不足够时,调整连接池参数;若连接池参数超过服务负载,则增加负载。
9.根据权利要求7所述的集中监控管理平台的设计装置,其特征在于,所述工具设计模块,还用于设定图形化的关键数据监控工具;所述关键数据监控工具由监控驱动容器、关键数据适配器、关键数据分析器、监控数据展现器、异常报警分析器和监控报告生成分析器构成。
10.根据权利要求9所述的集中监控管理平台的设计装置,其特征在于,
所述监控驱动容器,用于提供统一接口规范,驱动以插件的形式加载入容器的关键数据适配器,以获取监控的数据;
所述关键数据适配器,用于按照统一接口规范,结合监控的目标关键数据的特点,实现关键数据获取适配器,以完成对关键数据的监控;
所述关键数据分析器,用于将适配器监控获取的数据,按特定的格式对监控数据进行分析;
所述监控数据展现器,用于将监控数据的分析结果按匹配的图形类型进行图形化,并展现;
所述异常报警分析器,用于将监控数据的分析结果结合预先设定的关键数据项的阀值进行比较,并进行异常报警;
所述监控报告生成分析器,用于将监控数据的分析结果按预先设定的格式生成分析报告,并按设定的规则给出改进建议。
CN201910106838.1A 2019-02-01 2019-02-01 一种集中监控管理平台的设计方法及装置 Active CN109901969B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910106838.1A CN109901969B (zh) 2019-02-01 2019-02-01 一种集中监控管理平台的设计方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910106838.1A CN109901969B (zh) 2019-02-01 2019-02-01 一种集中监控管理平台的设计方法及装置

Publications (2)

Publication Number Publication Date
CN109901969A true CN109901969A (zh) 2019-06-18
CN109901969B CN109901969B (zh) 2022-10-14

Family

ID=66944642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910106838.1A Active CN109901969B (zh) 2019-02-01 2019-02-01 一种集中监控管理平台的设计方法及装置

Country Status (1)

Country Link
CN (1) CN109901969B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110908873A (zh) * 2019-11-01 2020-03-24 广东省信息工程有限公司 一种基于国产化设备的关键运行数据监控方法
CN111240795A (zh) * 2019-12-29 2020-06-05 的卢技术有限公司 一种虚拟化办公平台的构建方法及系统
CN113138893A (zh) * 2021-03-26 2021-07-20 河北航天信息技术有限公司 一种解决Java Web应用报500 Internal Error的问题方法
CN113641468A (zh) * 2021-06-23 2021-11-12 河北中兴冀能电力发展有限公司 一种应用于电力仪器设备的板间多运算芯片算力平衡系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012163217A1 (zh) * 2011-05-27 2012-12-06 运软网络科技(上海)有限公司 一种基于硬件基础工具监视虚拟化系统性能的架构及方法
CN103024060A (zh) * 2012-12-20 2013-04-03 中国科学院深圳先进技术研究院 一种开放式云计算大规模集群监控系统及方法
CN104009883A (zh) * 2014-05-09 2014-08-27 烽火通信科技股份有限公司 计算机资源集中式远程实时监控的系统及方法
CN106054787A (zh) * 2016-08-17 2016-10-26 深圳飞思安诺网络技术有限公司 一种基于硬件的机房网管和动力环境统一监控报警系统
CN106254428A (zh) * 2016-07-25 2016-12-21 南京从容信息科技有限公司 基于云计算的全移动化监管控系统
CN106961352A (zh) * 2017-03-29 2017-07-18 努比亚技术有限公司 监控系统及监控方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012163217A1 (zh) * 2011-05-27 2012-12-06 运软网络科技(上海)有限公司 一种基于硬件基础工具监视虚拟化系统性能的架构及方法
CN103024060A (zh) * 2012-12-20 2013-04-03 中国科学院深圳先进技术研究院 一种开放式云计算大规模集群监控系统及方法
CN104009883A (zh) * 2014-05-09 2014-08-27 烽火通信科技股份有限公司 计算机资源集中式远程实时监控的系统及方法
CN106254428A (zh) * 2016-07-25 2016-12-21 南京从容信息科技有限公司 基于云计算的全移动化监管控系统
CN106054787A (zh) * 2016-08-17 2016-10-26 深圳飞思安诺网络技术有限公司 一种基于硬件的机房网管和动力环境统一监控报警系统
CN106961352A (zh) * 2017-03-29 2017-07-18 努比亚技术有限公司 监控系统及监控方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110908873A (zh) * 2019-11-01 2020-03-24 广东省信息工程有限公司 一种基于国产化设备的关键运行数据监控方法
CN111240795A (zh) * 2019-12-29 2020-06-05 的卢技术有限公司 一种虚拟化办公平台的构建方法及系统
CN113138893A (zh) * 2021-03-26 2021-07-20 河北航天信息技术有限公司 一种解决Java Web应用报500 Internal Error的问题方法
CN113641468A (zh) * 2021-06-23 2021-11-12 河北中兴冀能电力发展有限公司 一种应用于电力仪器设备的板间多运算芯片算力平衡系统
CN113641468B (zh) * 2021-06-23 2023-09-22 河北中兴冀能电力发展有限公司 一种应用于电力仪器设备的板间多运算芯片算力平衡系统

Also Published As

Publication number Publication date
CN109901969B (zh) 2022-10-14

Similar Documents

Publication Publication Date Title
CN109901969A (zh) 一种集中监控管理平台的设计方法及装置
TWI746512B (zh) 實體機器故障分類處理方法、裝置和虛擬機器恢復方法、系統
KR101888029B1 (ko) 가상 머신 클러스터 모니터링 방법 및 모니터링 시스템
CN103548009B (zh) 用于跨云管理和故障查找的方法和系统
CN114500250B (zh) 一种云模式下体系联动的综合运维系统及方法
CN110175451A (zh) 一种基于电力云的安全监控方法和系统
US20100318836A1 (en) Monitoring and healing a computing system
CN104780220B (zh) 面向证券期货行业大型分布式系统的智能监控系统及监控方法
CN112162907A (zh) 基于监控指标数据的健康度评估方法
CN101848477A (zh) 一种故障诊断方法及系统
JPH08328880A (ja) 複数のアプリケーションプログラムを同時に実行できるオペレーティングシステムにおける計算機運転管理システム
CN101321084A (zh) 在计算机环境中利用关联规则挖掘为计算实体产生配置规则的方法和装置
CN101632093A (zh) 用于使用统计学分析来管理性能故障的系统和方法
CN108199901B (zh) 硬件报修方法、系统、设备、硬件管理服务器与存储介质
CN102857371A (zh) 一种面向集群系统的动态配置管理方法
CN110727508A (zh) 一种任务调度系统和调度方法
US20170199800A1 (en) System and method for comprehensive performance and availability tracking using passive monitoring and intelligent synthetic transaction generation in a transaction processing system
JP2007249373A (ja) 分散型プログラムの監視システム
CN112783792A (zh) 分布式数据库系统的故障检测方法、装置及电子设备
CN112749060A (zh) 一种电力系统服务总线监视方法
CN108632086A (zh) 一种并行作业运行故障定位方法
CN110798339A (zh) 一种基于分布式任务调度框架的任务容灾方法
CN103326880B (zh) Genesys呼叫系统高可用性云计算监控系统及方法
CN112149975A (zh) 一种基于人工智能的apm监控系统及监控方法
TWI292091B (en) Computer performance evaluator and application method thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant