CN105490833A - 一种信息系统的巡检系统与方法 - Google Patents

一种信息系统的巡检系统与方法 Download PDF

Info

Publication number
CN105490833A
CN105490833A CN201510801233.6A CN201510801233A CN105490833A CN 105490833 A CN105490833 A CN 105490833A CN 201510801233 A CN201510801233 A CN 201510801233A CN 105490833 A CN105490833 A CN 105490833A
Authority
CN
China
Prior art keywords
index
patrolled
examined
hardware
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510801233.6A
Other languages
English (en)
Inventor
闫龙川
杨猛
张晓亮
崔硕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Information and Telecommunication Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Information and Telecommunication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Information and Telecommunication Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201510801233.6A priority Critical patent/CN105490833A/zh
Publication of CN105490833A publication Critical patent/CN105490833A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种信息系统的巡检系统和方法,系统包括软件巡检模块、硬件巡检模块、管理服务器模块和移动巡检模块,软件巡检模块对操作系统、数据库和中间件根据预设的软件巡检指标进行软件巡检,采集软件巡检数据并进行记录,硬件巡检模块对主机设备和存储设备根据预设的硬件巡检指标进行硬件巡检,采集硬件巡检数据并进行记录,移动巡检模块通过移动终端与管理服务器模块进行巡检数据的交互,记录信息系统运行环境数据情况,管理服务器模块对软件巡检模块和硬件巡检模块的巡检任务进行管理和分析,与移动终端进行巡检数据的交互,具备数据存储和分析功能,并且可以实现高密度的检查,可以高效地进行信息系统的巡检,及时发现和消除故障隐患,实现预防性维护。

Description

一种信息系统的巡检系统与方法
技术领域
本发明涉及系统运维领域,特别是涉及一种信息系统的巡检系统与方法。
背景技术
云计算数据中心部署的信息设备运行着各类信息系统,为满足用户需要,提供着基础设施服务、平台服务和软件服务等云计算服务,数量常常可达几百台甚至几千台上万台,随着数据中心规模的增加,各类设备和相关的软件不断增加,数据中心信息系统呈现出设备数量众多、品牌复杂多样、软件关联复杂的特点。由于这些特点,信息系统日常运行维护过程中,需要对全部系统的软硬件状态进行定期巡检和检查,及时发现系统存在的隐患与问题,提高系统服务能力和运行水平。现在缺少一种高效巡检信息系统的方法,数据中心稳定运行存在隐患。
发明内容
有鉴于此,本发明的主要目的在于提供一种信息系统的巡检系统与方法,可以高效地进行信息系统的巡检。
为实现上述目的,本发明提供了一种信息系统的巡检系统,包括:
软件巡检模块、硬件巡检模块、管理服务器模块和移动巡检模块;
所述软件巡检模块用于对操作系统、数据库和中间件根据预设的软件巡检指标进行软件巡检,采集所述软件巡检数据并进行记录;
所述硬件巡检模块用于对主机设备和存储设备根据预设的硬件巡检指标进行硬件巡检,采集所述硬件巡检数据并进行记录;
所述移动巡检模块用于通过移动终端与所述管理服务器模块进行巡检数据的交互,记录信息系统运行环境数据情况;
所述管理服务器模块与所述软件巡检模块、所述硬件巡检模块和所述移动巡检模块均相连接,用于对所述软件巡检模块和所述硬件巡检模块的巡检任务进行管理和分析,以及与所述移动终端进行巡检数据的交互。
优选地,所述管理服务器模块包括:
巡检任务管理子模块,用于为所述软件巡检模块和所述硬件巡检模块指定巡检任务;
巡检记录管理子模块,用于对巡检任务的执行结果数据进行记录,并存储至预设数据库中;
巡检数据分析子模块,用于根据巡检任务的执行结果数据分别进行巡检频率、巡检质量、隐患问题和运行特性的分析;
巡检移动终端管理子模块,用于对与所述管理服务器模块相连接的移动终端进行移动终端的设备身份验证、管理和数据交互;
账号权限日志管理子模块,用于管理登录所述管理服务器的账号和鉴权信息。
优选地,所述硬件巡检模块包括:
主机设备巡检子模块,用于采用无代理方式利用第一类型预设协议对目标主机设备进行管理监控,采集所述目标主机设备的主机状态信息,通过设备管理接口对所述目标主机设备进行巡检并记录;
存储设备巡检子模块,用于采用有代理方式利用第二类型预设协议对目标存储设备进行管理监控,采集所述目标存储设备的存储状态信息,对所述目标存储设备进行巡检并记录。
优选地,所述软件巡检指标包括:
操作系统巡检指标、数据库巡检指标、中间件巡检指标和业务应用巡检指标;
所述操作系统巡检指标包括:OS版本、OS位数、主机名、运行时长、CPU型号数量、内存总大小、磁盘/分区使用率、磁盘/分区总空间、剩余空间、CPU使用率、内存使用率、虚拟内存使用率、磁盘I/O和系统日志;
所述数据库巡检指标包括:Rman备份状态、ASM组已使用百分比、表空间使用率、表空间及磁盘组大小、连接数、死锁数、日志、数据库版本和实例信息;
所述中间件巡检指标包括:JDBC连接百分比、JDBC连接数、连接池容量、最大连接数、活动与等待连接数、JVM堆栈利用率、JVM堆栈大小、Weblogic版本、JVM版本和日志;
所述业务应用巡检指标包括:服务状态、响应时间和接口状态。
优选地,所述硬件巡检指标包括:
主机巡检指标和存储巡检指标;
所述主机巡检指标包括:CPU、内存、硬盘、电源、HBA卡、网卡数量、主机系统路径、文件系统、物理卷、风扇转速、主板SN号和机箱温度;
所述存储巡检指标包括:序列号、微码版本、设备型号、IP地址、设备状态、已使用空间百分比、未使用空间百分比、控制器、端口、存储卷、磁盘、热备盘、Raid级别,磁盘数量、卷数量、使用百分比、运行状态、IOPS、缓存命中率和KBPS。
本发明还提供了一种信息系统的巡检方法,包括:
软件巡检模块对操作系统、数据库和中间件根据预设的软件巡检指标进行软件巡检,采集所述软件巡检数据并进行记录;
硬件巡检模块对主机设备和存储设备根据预设的硬件巡检指标进行硬件巡检,采集所述硬件巡检数据并进行记录;
移动巡检模块通过移动终端与所述管理服务器模块进行巡检数据的交互,记录信息系统运行环境数据情况;
管理服务器模块对所述软件巡检模块和所述硬件巡检模块的巡检任务进行管理和分析,与所述移动终端进行巡检数据的交互。
优选地,对所述软件巡检模块和所述硬件巡检模块的巡检任务进行管理和分析,与所述移动终端进行巡检数据的交互包括:
所述软件巡检模块和所述硬件巡检模块指定巡检任务;
对巡检任务的执行结果数据进行记录,并存储至预设数据库中;
根据巡检任务的执行结果数据分别进行巡检频率、巡检质量、隐患问题和运行特性的分析;
对与所述管理服务器模块相连接的移动终端进行移动终端的设备身份验证、管理和数据交互;
管理登录所述管理服务器的账号和鉴权信息。
优选地,对主机设备和存储设备根据预设的硬件巡检指标进行硬件巡检,采集所述硬件巡检数据并进行记录包括:
采用无代理方式利用第一类型预设协议对目标主机设备进行管理监控,采集所述目标主机设备的主机状态信息,通过设备管理接口对所述目标主机设备进行巡检并记录;
采用有代理方式利用第二类型预设协议对目标存储设备进行管理监控,采集所述目标存储设备的存储状态信息,对所述目标存储设备进行巡检并记录。
优选地,所述软件巡检指标包括:
操作系统巡检指标、数据库巡检指标、中间件巡检指标和业务应用巡检指标;
所述操作系统巡检指标包括:OS版本、OS位数、主机名、运行时长、CPU型号数量、内存总大小、磁盘/分区使用率、磁盘/分区总空间、剩余空间、CPU使用率、内存使用率、虚拟内存使用率、磁盘I/O和系统日志;
所述数据库巡检指标包括:Rman备份状态、ASM组已使用百分比、表空间使用率、表空间及磁盘组大小、连接数、死锁数、日志、数据库版本和实例信息;
所述中间件巡检指标包括:JDBC连接百分比、JDBC连接数、连接池容量、最大连接数、活动与等待连接数、JVM堆栈利用率、JVM堆栈大小、Weblogic版本、JVM版本和日志;
所述业务应用巡检指标包括:服务状态、响应时间和接口状态。
优选地,所述硬件巡检指标包括:
主机巡检指标和存储巡检指标;
所述主机巡检指标包括:CPU、内存、硬盘、电源、HBA卡、网卡数量、主机系统路径、文件系统、物理卷、风扇转速、主板SN号和机箱温度;
所述存储巡检指标包括:序列号、微码版本、设备型号、IP地址、设备状态、已使用空间百分比、未使用空间百分比、控制器、端口、存储卷、磁盘、热备盘、Raid级别,磁盘数量、卷数量、使用百分比、运行状态、IOPS、缓存命中率和KBPS。
应用本发明提供的一种信息系统的巡检系统和方法,系统包括软件巡检模块、硬件巡检模块、管理服务器模块和移动巡检模块,软件巡检模块对操作系统、数据库和中间件根据预设的软件巡检指标进行软件巡检,采集软件巡检数据并进行记录,硬件巡检模块对主机设备和存储设备根据预设的硬件巡检指标进行硬件巡检,采集硬件巡检数据并进行记录,移动巡检模块通过移动终端与管理服务器模块进行巡检数据的交互,管理服务器模块对软件巡检模块和硬件巡检模块的巡检任务进行管理和分析,与移动终端进行巡检数据的交互,具备数据存储和分析功能,并且可以实现高密度的检查,可以高效地进行信息系统的巡检,及时发现和消除故障隐患,实现预防性维护。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为信息系统的结构示意图;
图2为本发明一种信息系统的巡检系统实施例的结构示意图;
图3为本发明一种信息系统的巡检系统实施例的模块结构示意图;
图4为本发明一种信息系统的巡检系统实施例的又一模块结构示意图;
图5为本发明一种信息系统的巡检系统实施例的详细结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,信息系统是由主机、存储、网络、安全设备,以及操作系统、数据库、中间件和业务软件组成的有机整体。本发明提供了一种信息系统的巡检系统,图2示出了本发明信息系统的巡检系统的实施例结构示意图,包括:
软件巡检模块101、硬件巡检模块102、管理服务器模块103和移动巡检模块104;
所述软件巡检模块101用于对操作系统、数据库和中间件根据预设的软件巡检指标进行软件巡检,采集所述软件巡检数据并进行记录;
软件巡检模块通过WMI、SSH、JDBC连接等对各类软件资源进行采集,不需要代理。自动化巡检系统采集的对象覆盖主流的操作系统、数据库、中间件,包括:Windows、Linux、AIX、Oracle、Mysql、sqlserver、Weblogic、Tomcat等。从容量、性能和架构三个维度,分别梳理出磁盘空间、表空间、响应时间、日志报错、负载情况等34余项核心指标,指导自动化巡检工作,做到有的放矢。
所述软件巡检指标包括:操作系统巡检指标、数据库巡检指标、中间件巡检指标和业务应用巡检指标;
所述操作系统巡检指标包括:OS版本、OS位数、主机名、运行时长、CPU型号数量、内存总大小、磁盘/分区使用率、磁盘/分区总空间、剩余空间、CPU使用率、内存使用率、虚拟内存使用率、磁盘I/O和系统日志等;
所述数据库巡检指标包括:Rman备份状态、ASM组已使用百分比、表空间使用率、表空间及磁盘组大小、连接数、死锁数、日志、数据库版本和实例信息等;
所述中间件巡检指标包括:JDBC连接百分比、JDBC连接数、连接池容量、最大连接数、活动与等待连接数、JVM堆栈利用率、JVM堆栈大小、Weblogic版本、JVM版本和日志;
所述业务应用巡检指标包括:服务状态、响应时间和接口状态。
所述硬件巡检模块102用于对主机设备和存储设备根据预设的硬件巡检指标进行硬件巡检,采集所述硬件巡检数据并进行记录;
硬件巡检模块分为主机设备和存储设备巡检两部分,分别实现主机和存储设备的自动化巡检。
主机设备巡检单独组网,搭建设备管理网,采用无代理方式,通过设备管理口进行巡检,利用IPMI,SNMP,Syslog等协议进行主机管理监控,采集主机风扇转速、机箱温度、CPU温度等主机状态信息。
存储设备巡检模块(包括SAN设备)采用有代理方式,通过信息内网,利用SMI-S和SNMP协议进行存储设备管理监控,实现存储磁盘阵列、背板端口状态等的信息采集。
如图3所示,所述硬件巡检模块102包括:
主机设备巡检子模块301,用于采用无代理方式利用第一类型预设协议对目标主机设备进行管理监控,采集所述目标主机设备的主机状态信息,通过设备管理接口对所述目标主机设备进行巡检并记录;
主机设备包括PC服务器、小型机、刀片服务器等。
存储设备巡检子模块302,用于采用有代理方式利用第二类型预设协议对目标存储设备进行管理监控,采集所述目标存储设备的存储状态信息,对所述目标存储设备进行巡检并记录。
所述移动巡检模块104用于通过移动终端与所述管理服务器模块103进行巡检数据的交互,记录信息系统运行环境数据情况;
移动巡检模块充分利用移动终端和无线网络的便捷优势,通过手机、平板电脑上的巡检应用程序进行巡检记录和管理,通过无线网络进行数据通信和管理。系统包括移动终端和服务器,以及移动应用程序和服务器管理应用程序组成,通过无线网络进行现场巡检数据的交互和通信,主要包括:巡检任务管理、巡检过程记录、设备故障处理、历史数据分析、用户管理。
所述管理服务器模块103与所述软件巡检模块101、所述硬件巡检模块102和所述移动巡检模块104均相连接,用于对所述软件巡检模块101和所述硬件巡检模块102的巡检任务进行管理和分析,以及与所述移动终端进行巡检数据的交互。
其中,如图4所示,所述管理服务器模块103包括:
巡检任务管理子模块401,用于为所述软件巡检模块和所述硬件巡检模块指定巡检任务;
巡检任务管理子模块主要根据巡检设备的范围、工作频率、特殊巡检要求的内容,制定巡检工作计划,并下发巡检计划任务到每台巡检服务器。记录和评价巡检任务执行的有效性、及时性和规范性
巡检记录管理子模块402,用于对巡检任务的执行结果数据进行记录,并存储至预设数据库中;
巡检记录管理子模块主要对巡检工作的数据结果进行记录,并与设备台账进行关联,记录数据的采集时间、数值、辅助图片信息等。并为历史数据查询分析提供依据。
巡检数据分析子模块403,用于根据巡检任务的执行结果数据分别进行巡检频率、巡检质量、隐患问题和运行特性的分析;
巡检数据分析子模块包括巡检频率、巡检质量、隐患问题、运行特性进行分类统计分析,为提供数据中心整体运行提供趋势判断。
巡检移动终端管理子模块404,用于对与所述管理服务器模块相连接的移动终端进行移动终端的设备身份验证、管理和数据交互;
巡检移动终端管理子模块管理纳入巡检体系的移动终端,进行设备身份认证和验证,记录移动终端设备的型号、配置、证书、使用人、使用期限等信息。
账号权限日志管理子模块405,用于管理登录所述管理服务器的账号和鉴权信息。
账号权限日志管理子模块主要是实现对登陆服务器的人员进行管理,包括账号建立、密码设置、日志记录等功能。
本实施例的详细结构示意图如图5所示。
应用本实施例提供的一种信息系统的巡检系统,系统包括软件巡检模块、硬件巡检模块、管理服务器模块和移动巡检模块,软件巡检模块对操作系统、数据库和中间件根据预设的软件巡检指标进行软件巡检,采集软件巡检数据并进行记录,硬件巡检模块对主机设备和存储设备根据预设的硬件巡检指标进行硬件巡检,采集硬件巡检数据并进行记录,移动巡检模块通过移动终端与管理服务器模块进行巡检数据的交互,管理服务器模块对软件巡检模块和硬件巡检模块的巡检任务进行管理和分析,与移动终端进行巡检数据的交互,具备数据存储和分析功能,并且可以实现高密度的检查,可以高效地进行信息系统的巡检,及时发现和消除故障隐患,实现预防性维护,实现了数据中心信息系统软硬件健康状态的全覆盖性和定期检查,为数据中心稳定运行提供了有力保障。
本发明还提供了一种信息系统的巡检方法,本发明方法的实施例包括:
软件巡检模块对操作系统、数据库和中间件根据预设的软件巡检指标进行软件巡检,采集所述软件巡检数据并进行记录;
硬件巡检模块对主机设备和存储设备根据预设的硬件巡检指标进行硬件巡检,采集所述硬件巡检数据并进行记录;
移动巡检模块通过移动终端与所述管理服务器模块进行巡检数据的交互,记录信息系统运行环境数据情况;
管理服务器模块对所述软件巡检模块和所述硬件巡检模块的巡检任务进行管理和分析,与所述移动终端进行巡检数据的交互。
本发明方法中各模块的步骤之间为异步进行,可以根据指令进行巡检或者定期巡检。
应用本实施例提供的一种信息系统的巡检方法,系统包括软件巡检模块、硬件巡检模块、管理服务器模块和移动巡检模块,软件巡检模块对操作系统、数据库和中间件根据预设的软件巡检指标进行软件巡检,采集软件巡检数据并进行记录,硬件巡检模块对主机设备和存储设备根据预设的硬件巡检指标进行硬件巡检,采集硬件巡检数据并进行记录,移动巡检模块通过移动终端与管理服务器模块进行巡检数据的交互,管理服务器模块对软件巡检模块和硬件巡检模块的巡检任务进行管理和分析,与移动终端进行巡检数据的交互,具备数据存储和分析功能,并且可以实现高密度的检查,可以高效地进行信息系统的巡检,及时发现和消除故障隐患,实现预防性维护,实现了数据中心信息系统软硬件健康状态的全覆盖性和定期检查,为数据中心稳定运行提供了有力保障。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于方法类实施例而言,由于其与系统实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的方法和系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种信息系统的巡检系统,其特征在于,包括:
软件巡检模块、硬件巡检模块、管理服务器模块和移动巡检模块;
所述软件巡检模块用于对操作系统、数据库和中间件根据预设的软件巡检指标进行软件巡检,采集所述软件巡检数据并进行记录;
所述硬件巡检模块用于对主机设备和存储设备根据预设的硬件巡检指标进行硬件巡检,采集所述硬件巡检数据并进行记录;
所述移动巡检模块用于通过移动终端与所述管理服务器模块进行巡检数据的交互,记录信息系统运行环境数据情况;
所述管理服务器模块与所述软件巡检模块、所述硬件巡检模块和所述移动巡检模块均相连接,用于对所述软件巡检模块和所述硬件巡检模块的巡检任务进行管理和分析,以及与所述移动终端进行巡检数据的交互。
2.根据权利要求1所述的信息系统的巡检系统,其特征在于,所述管理服务器模块包括:
巡检任务管理子模块,用于为所述软件巡检模块和所述硬件巡检模块指定巡检任务;
巡检记录管理子模块,用于对巡检任务的执行结果数据进行记录,并存储至预设数据库中;
巡检数据分析子模块,用于根据巡检任务的执行结果数据分别进行巡检频率、巡检质量、隐患问题和运行特性的分析;
巡检移动终端管理子模块,用于对与所述管理服务器模块相连接的移动终端进行移动终端的设备身份验证、管理和数据交互;
账号权限日志管理子模块,用于管理登录所述管理服务器的账号和鉴权信息。
3.根据权利要求1所述的信息系统的巡检系统,其特征在于,所述硬件巡检模块包括:
主机设备巡检子模块,用于采用无代理方式利用第一类型预设协议对目标主机设备进行管理监控,采集所述目标主机设备的主机状态信息,通过设备管理接口对所述目标主机设备进行巡检并记录;
存储设备巡检子模块,用于采用有代理方式利用第二类型预设协议对目标存储设备进行管理监控,采集所述目标存储设备的存储状态信息,对所述目标存储设备进行巡检并记录。
4.根据权利要求1所述的信息系统的巡检系统,其特征在于,所述软件巡检指标包括:
操作系统巡检指标、数据库巡检指标、中间件巡检指标和业务应用巡检指标;
所述操作系统巡检指标包括:OS版本、OS位数、主机名、运行时长、CPU型号数量、内存总大小、磁盘/分区使用率、磁盘/分区总空间、剩余空间、CPU使用率、内存使用率、虚拟内存使用率、磁盘I/O和系统日志;
所述数据库巡检指标包括:Rman备份状态、ASM组已使用百分比、表空间使用率、表空间及磁盘组大小、连接数、死锁数、日志、数据库版本和实例信息;
所述中间件巡检指标包括:JDBC连接百分比、JDBC连接数、连接池容量、最大连接数、活动与等待连接数、JVM堆栈利用率、JVM堆栈大小、Weblogic版本、JVM版本和日志;
所述业务应用巡检指标包括:服务状态、响应时间和接口状态。
5.根据权利要求1所述的信息系统的巡检系统,其特征在于,所述硬件巡检指标包括:
主机巡检指标和存储巡检指标;
所述主机巡检指标包括:CPU、内存、硬盘、电源、HBA卡、网卡数量、主机系统路径、文件系统、物理卷、风扇转速、主板SN号和机箱温度;
所述存储巡检指标包括:序列号、微码版本、设备型号、IP地址、设备状态、已使用空间百分比、未使用空间百分比、控制器、端口、存储卷、磁盘、热备盘、Raid级别,磁盘数量、卷数量、使用百分比、运行状态、IOPS、缓存命中率和KBPS。
6.一种信息系统的巡检方法,其特征在于,包括:
软件巡检模块对操作系统、数据库和中间件根据预设的软件巡检指标进行软件巡检,采集所述软件巡检数据并进行记录;
硬件巡检模块对主机设备和存储设备根据预设的硬件巡检指标进行硬件巡检,采集所述硬件巡检数据并进行记录;
移动巡检模块通过移动终端与所述管理服务器模块进行巡检数据的交互,记录信息系统运行环境数据情况;
管理服务器模块对所述软件巡检模块和所述硬件巡检模块的巡检任务进行管理和分析,与所述移动终端进行巡检数据的交互。
7.根据权利要求6所述的信息系统的巡检方法,其特征在于,对所述软件巡检模块和所述硬件巡检模块的巡检任务进行管理和分析,与所述移动终端进行巡检数据的交互包括:
所述软件巡检模块和所述硬件巡检模块指定巡检任务;
对巡检任务的执行结果数据进行记录,并存储至预设数据库中;
根据巡检任务的执行结果数据分别进行巡检频率、巡检质量、隐患问题和运行特性的分析;
对与所述管理服务器模块相连接的移动终端进行移动终端的设备身份验证、管理和数据交互;
管理登录所述管理服务器的账号和鉴权信息。
8.根据权利要求6所述的信息系统的巡检方法,其特征在于,对主机设备和存储设备根据预设的硬件巡检指标进行硬件巡检,采集所述硬件巡检数据并进行记录包括:
采用无代理方式利用第一类型预设协议对目标主机设备进行管理监控,采集所述目标主机设备的主机状态信息,通过设备管理接口对所述目标主机设备进行巡检并记录;
采用有代理方式利用第二类型预设协议对目标存储设备进行管理监控,采集所述目标存储设备的存储状态信息,对所述目标存储设备进行巡检并记录。
9.根据权利要求6所述的信息系统的巡检方法,其特征在于,所述软件巡检指标包括:
操作系统巡检指标、数据库巡检指标、中间件巡检指标和业务应用巡检指标;
所述操作系统巡检指标包括:OS版本、OS位数、主机名、运行时长、CPU型号数量、内存总大小、磁盘/分区使用率、磁盘/分区总空间、剩余空间、CPU使用率、内存使用率、虚拟内存使用率、磁盘I/O和系统日志;
所述数据库巡检指标包括:Rman备份状态、ASM组已使用百分比、表空间使用率、表空间及磁盘组大小、连接数、死锁数、日志、数据库版本和实例信息;
所述中间件巡检指标包括:JDBC连接百分比、JDBC连接数、连接池容量、最大连接数、活动与等待连接数、JVM堆栈利用率、JVM堆栈大小、Weblogic版本、JVM版本和日志;
所述业务应用巡检指标包括:服务状态、响应时间和接口状态。
10.根据权利要求6所述的信息系统的巡检方法,其特征在于,所述硬件巡检指标包括:
主机巡检指标和存储巡检指标;
所述主机巡检指标包括:CPU、内存、硬盘、电源、HBA卡、网卡数量、主机系统路径、文件系统、物理卷、风扇转速、主板SN号和机箱温度;
所述存储巡检指标包括:序列号、微码版本、设备型号、IP地址、设备状态、已使用空间百分比、未使用空间百分比、控制器、端口、存储卷、磁盘、热备盘、Raid级别,磁盘数量、卷数量、使用百分比、运行状态、IOPS、缓存命中率和KBPS。
CN201510801233.6A 2015-11-19 2015-11-19 一种信息系统的巡检系统与方法 Pending CN105490833A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510801233.6A CN105490833A (zh) 2015-11-19 2015-11-19 一种信息系统的巡检系统与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510801233.6A CN105490833A (zh) 2015-11-19 2015-11-19 一种信息系统的巡检系统与方法

Publications (1)

Publication Number Publication Date
CN105490833A true CN105490833A (zh) 2016-04-13

Family

ID=55677577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510801233.6A Pending CN105490833A (zh) 2015-11-19 2015-11-19 一种信息系统的巡检系统与方法

Country Status (1)

Country Link
CN (1) CN105490833A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294067A (zh) * 2016-08-01 2017-01-04 北京天云融创软件技术有限公司 一种基于p2p技术的虚拟化系统自管理巡检方法
CN107562536A (zh) * 2017-08-07 2018-01-09 华迪计算机集团有限公司 一种确定电子公文系统性能的系统和方法
CN109039785A (zh) * 2018-09-27 2018-12-18 郑州云海信息技术有限公司 基于SNMP的Trap告警恢复方法和装置
CN109783315A (zh) * 2018-12-27 2019-05-21 远光软件股份有限公司 一种数据库平台自动化巡检方法及系统
CN109857613A (zh) * 2018-12-25 2019-06-07 南京南瑞信息通信科技有限公司 一种基于采集集群的自动化运维系统
CN110716847A (zh) * 2019-10-10 2020-01-21 云南电网有限责任公司信息中心 业务系统运维缺陷处理方法
CN110727586A (zh) * 2019-09-16 2020-01-24 平安科技(深圳)有限公司 一种主机异常监控方法、装置、存储介质和服务器
CN110995525A (zh) * 2019-10-31 2020-04-10 北京直真科技股份有限公司 一种基于维护矩阵的路由器检测方法
CN111488258A (zh) * 2020-03-16 2020-08-04 国网辽宁省电力有限公司信息通信分公司 一种用于软硬件运行状态分析与预警的系统
CN111932706A (zh) * 2020-08-10 2020-11-13 北京道迩科技有限公司 信息化巡检方法、装置、存储介质及电子设备
CN112731906A (zh) * 2020-12-24 2021-04-30 烽台科技(北京)有限公司 一种信息采集装置
CN112950804A (zh) * 2021-02-26 2021-06-11 国电南瑞南京控制系统有限公司 一种配网系统的巡检方法及装置
CN114490385A (zh) * 2022-01-26 2022-05-13 北京致远互联软件股份有限公司 一种针对软件运行环境的自动化检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050237947A1 (en) * 2004-04-22 2005-10-27 Tsutomu Ando Information management system and a method thereof
CN103778513A (zh) * 2014-02-11 2014-05-07 云南电力调度控制中心 一种基于二维码的it设备运维监控方法
CN103871121A (zh) * 2012-12-18 2014-06-18 河南省电力公司郑州供电公司 基于模拟登陆的信息系统电子巡检方法
CN103973815A (zh) * 2014-05-27 2014-08-06 浪潮电子信息产业股份有限公司 一种跨数据中心存储环境统一监控方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050237947A1 (en) * 2004-04-22 2005-10-27 Tsutomu Ando Information management system and a method thereof
CN103871121A (zh) * 2012-12-18 2014-06-18 河南省电力公司郑州供电公司 基于模拟登陆的信息系统电子巡检方法
CN103778513A (zh) * 2014-02-11 2014-05-07 云南电力调度控制中心 一种基于二维码的it设备运维监控方法
CN103973815A (zh) * 2014-05-27 2014-08-06 浪潮电子信息产业股份有限公司 一种跨数据中心存储环境统一监控方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
闫龙川,刘军: "企业信息系统自动化运维工具研究与应用", 《供用电》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294067B (zh) * 2016-08-01 2018-11-30 北京天云融创软件技术有限公司 一种基于p2p技术的虚拟化系统自管理巡检方法
CN106294067A (zh) * 2016-08-01 2017-01-04 北京天云融创软件技术有限公司 一种基于p2p技术的虚拟化系统自管理巡检方法
CN107562536A (zh) * 2017-08-07 2018-01-09 华迪计算机集团有限公司 一种确定电子公文系统性能的系统和方法
CN109039785B (zh) * 2018-09-27 2021-05-04 郑州云海信息技术有限公司 基于SNMP的Trap告警恢复方法和装置
CN109039785A (zh) * 2018-09-27 2018-12-18 郑州云海信息技术有限公司 基于SNMP的Trap告警恢复方法和装置
CN109857613A (zh) * 2018-12-25 2019-06-07 南京南瑞信息通信科技有限公司 一种基于采集集群的自动化运维系统
CN109783315A (zh) * 2018-12-27 2019-05-21 远光软件股份有限公司 一种数据库平台自动化巡检方法及系统
CN110727586A (zh) * 2019-09-16 2020-01-24 平安科技(深圳)有限公司 一种主机异常监控方法、装置、存储介质和服务器
CN110727586B (zh) * 2019-09-16 2024-05-31 平安科技(深圳)有限公司 一种主机异常监控方法、装置、存储介质和服务器
CN110716847A (zh) * 2019-10-10 2020-01-21 云南电网有限责任公司信息中心 业务系统运维缺陷处理方法
CN110995525A (zh) * 2019-10-31 2020-04-10 北京直真科技股份有限公司 一种基于维护矩阵的路由器检测方法
CN111488258A (zh) * 2020-03-16 2020-08-04 国网辽宁省电力有限公司信息通信分公司 一种用于软硬件运行状态分析与预警的系统
CN111932706A (zh) * 2020-08-10 2020-11-13 北京道迩科技有限公司 信息化巡检方法、装置、存储介质及电子设备
CN112731906A (zh) * 2020-12-24 2021-04-30 烽台科技(北京)有限公司 一种信息采集装置
CN112950804A (zh) * 2021-02-26 2021-06-11 国电南瑞南京控制系统有限公司 一种配网系统的巡检方法及装置
CN114490385A (zh) * 2022-01-26 2022-05-13 北京致远互联软件股份有限公司 一种针对软件运行环境的自动化检测方法

Similar Documents

Publication Publication Date Title
CN105490833A (zh) 一种信息系统的巡检系统与方法
Aceto et al. Cloud monitoring: A survey
US8041807B2 (en) Method, system and program product for determining a number of concurrent users accessing a system
CN103905253B (zh) 一种基于Nagios和BMC的服务器监控管理方法
US11632320B2 (en) Centralized analytical monitoring of IP connected devices
WO2018119068A1 (en) System and method for cloud-based operating system event and data access monitoring
US20070112870A1 (en) System and method for proactive impact analysis of policy-based storage systems
US10067704B2 (en) Method for optimizing storage configuration for future demand and system thereof
US10230649B2 (en) Storage area network workload balancing
US8549048B2 (en) Workflow database for scalable storage service
JP2006331392A (ja) ストレージシステムを遠隔的に監査するためのシステムと方法
US10225158B1 (en) Policy based system management
CN104536860A (zh) 一种实时监测jbod模式下硬盘排列顺序的方法
CN112688806A (zh) 一种网络资产呈现的方法及系统
US9465684B1 (en) Managing logs of storage systems
US20230362250A1 (en) Performance-Driven Storage Provisioning
US20170324802A1 (en) System and Method to Access Aggregated Metric Data in a Computer Network
US20030097445A1 (en) Pluggable devices services and events for a scalable storage service architecture
Joukov et al. Application-storage discovery
US11599404B2 (en) Correlation-based multi-source problem diagnosis
US9307015B1 (en) Cloud black box for cloud infrastructure
CN111104313B (zh) 一种rest api接口的自动化测试方法、系统及设备
US10365998B2 (en) Modifying monitoring configurations that support analytics programs
CN116170275A (zh) 一种云网络运维管理方法和装置
US8743712B1 (en) Systems and methods for aggregating data for resources in a target group of resources

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160413