CN106789270A - 一种信息系统集中运维管理的实现方法及系统 - Google Patents

一种信息系统集中运维管理的实现方法及系统 Download PDF

Info

Publication number
CN106789270A
CN106789270A CN201611227266.5A CN201611227266A CN106789270A CN 106789270 A CN106789270 A CN 106789270A CN 201611227266 A CN201611227266 A CN 201611227266A CN 106789270 A CN106789270 A CN 106789270A
Authority
CN
China
Prior art keywords
data
monitoring
management system
operation management
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611227266.5A
Other languages
English (en)
Inventor
宋智强
杨海勇
宋明明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Software Group Co Ltd
Original Assignee
Inspur Software Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Software Group Co Ltd filed Critical Inspur Software Group Co Ltd
Priority to CN201611227266.5A priority Critical patent/CN106789270A/zh
Publication of CN106789270A publication Critical patent/CN106789270A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/044Network management architectures or arrangements comprising hierarchical management structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种信息系统集中运维管理的实现方法及系统,属于网络实时传输、数据一致性验证和数据隔离等技术领域,本发明通过信息系统的本地的运维监控系统监控各自上的信息系统,并将监控数据、预警数据以及添加的监控资源实时推送到集中运维管理系统;集中运维管理系统接收这些数据,持久化到数据库作为历史数据,并将最新的数据展现到页面。可以为运维人员提供一个明确的运维目标和方向,减少运维成本。

Description

一种信息系统集中运维管理的实现方法及系统
技术领域
本发明涉及网络实时传输、数据一致性验证和数据隔离等技术,尤其涉及一种信息系统集中运维管理的实现方法及系统。
背景技术
对于行业内的信息系统而言,全国各地的系统都会面临大量的硬件和业务的运维工作,造成大量运维成本的开销,并且缺乏对全国信息系统整体运维工作情况的整体评估。
当前信息系统的集中运维管理系统较少,且大部分仅关注基础环境数据,或者只关注业务数据,缺少数据库和中间件的运行数据,而对于一个系统的运维而言都是必不可少的
该行业全国有30多个省级单位都使用的是同一套销售系统,每天每个省级单位的订单数量都在十万笔以上,交易量庞大,系统的稳定性显得特别重要。而从运维的角度考虑采用全国统一的运维方式无论从成本、人员投入、服务支持、产品提升等方面都是一个比较好的选择。
发明内容
为了解决该问题,本发明提出了一种信息系统集中运维管理的实现方法。集中的运维主要是统计全国各地信息系统的运行环境数据以及业务数据并分析,为信息系统的统一运维管理提供数据依据和参考。
本发明的技术方案如下:
一种信息系统集中运维管理的实现方法,通过信息系统的本地的运维监控系统监控各自上的信息系统,并将监控数据、预警数据以及添加的监控资源实时推送到集中运维管理系统;集中运维管理系统接收这些数据,持久化到数据库作为历史数据,并将最新的数据展现到页面。
各地运维监控系统采集监控数据、预警数据,包括:主机、数据库、中间件、URL、业务系统等信息。
集中运维管理系统接收来自全国各地运维监控系统的数据,根据运维监控系统所在服务器IP实现数据隔离;通过统计一段时间内预警的数量以及严重程度,分析评估各地在该时间段内的运维工作;通过统计一段时间内数据库SQL的平均执行时间,分析各地数据库的性能;通过中间件应用程序的会话数,分析信息系统在各地的使用情况;通过主机的计算内存使用率、CPU使用率,评估各地的硬件资源的利用率。
本发明还公开了一种信息系统集中运维管理系统,主要包括:
主要包括如下几个部分:
(1) 部署集中运维管理系统,对全国各地信息系统数据进行统一管理分析;
(2) 部署运维监控系统,采集本地信息系统数据;
(3) 建立运维监控系统与集中运维管理系统之间的网络通道,进行数据传输;
(4) 数据接收;
(5) 数据统计分析。
其中
(1) 部署集中运维管理系统
部署集中运维管理系统,该系统实现的是对全国各地运维监控系统的基础数据和监控数据的接收、统计、分析;集中运维管理系统对外开放数据接收RESTful服务,包括资源配置、运行时、预警、预警规则、TOP SQL、运维监控系统环境数据接收服务。
(2) 部署运维监控系统
部署运维监控系统,该系统实现的是对各地信息系统的监控,以及对基础数据和监控数据向集中运维管理系统的实时推送;
信息系统的监控包括:业务数据监控、主机监控、数据库监控、中间件监控、URL监控;基础数据包括:监控资源、预警规则、运维监控系统部署环境信息,监控数据包括:预警数据、业务数据、主机监控数据、数据库监控数据、中间件监控数据、URL监控数据;
启动运维监控系统后,当检测到资源配置、预警规则、预警数据、实时运行数据的更新时,运维监控系统会自动调用集中运维管理系统的对应的RESTful数据接收服务,实现监控数据的传输;当没有数据更新时,运维监控系统不会调用数据传输接口,以此来实现运维监控系统和集中运维管理系统的数据一致性。
(3) 建立数据传输网络通道
运维监控系统与集中运维管理系统之间的数据传输采用RESTful服务,因此需要确保两个系统之间的网络是连通的。
(4) 数据接收系统
运维监控系统与集中运维管理系统的网络连通后,集中运维管理系统就可以接收到来自运维监控系统的数据,并对接收的数据持久化,根据运维监控系统的部署环境IP地址来实现全国各地信息系统的数据隔离。
(5) 数据统计分析系统
集中展现:对各地的业务系统、数据库、中间件、主机、URL类型资源的运行状态、响应时间、内存使用率指标分类,以及每种类型资源对应的预警数进行统计,并整体展现到集中运维管理平台的统计分析,向运维人员直观地、有比较地展现全国各地信息系统的当前运行情况;
SQL分析:通过接收的平均执行时间TOP SQL,计算出各地数据库的平均执行时间进行比较,分析出数据库的性能;针对性能较差的信息系统,通过SQL调优等手段提升数据库性能。
通过对各地信息系统监控数据的集中统计分析,可以为运维人员提供一个明确的运维目标和方向,减少运维成本。
本发明的有益效果是 。
数据传输采用实时推送,及时反映出全国各地信息系统的运行状况和预警信息,方便运维人员快速跟踪问题。
各地信息系统监控数据统一展现,体现全国各地信息系统间的差异化,直观地展现各地信息系统的运行状况。
附图说明
图1是信息系统集中运维管理架构图。
具体实施方式
下面对本发明的内容进行更加详细的阐述:
本实现方法通过信息系统的本地的运维监控系统监控各自上的信息系统,并将监控数据、预警数据以及添加的监控资源实时推送到集中运维管理系统;集中运维管理系统接收这些数据,持久化到数据库作为历史数据,并将最新的数据展现到页面。
各地运维监控系统采集监控数据、预警数据,包括:主机(Ping状态、CPU使用率、计算内存使用率、文件系统信息、网络吞吐流量)、数据库(参数配置、运行状态、运行时长、表空间信息、缓冲池信息、当前活动连接、锁等待、死锁数、最新备份信息、正在执行SQL、平均执行时间最慢TOP 50 SQL、平均CPU时间最慢TOP 50 SQL、执行次数最多TOP 50 SQL、排序次数最多TOP50 SQL等)、中间件(应用服务器的运行状态、JVM、线程池,数据源的当前连接数、JNDI、超时时间、隔离级别等,应用程序的路径、二进制配置、运行状态、Cookie路径、当前会话数等)、URL(访问状态、响应时间)、业务系统(首页访问状态、响应时间、TPS等)等信息。
集中运维管理系统接收来自全国各地运维监控系统的数据,根据运维监控系统所在服务器IP实现数据隔离;通过统计一段时间内预警的数量以及严重程度,分析评估各地在该时间段内的运维工作;通过统计一段时间内数据库SQL的平均执行时间,分析各地数据库的性能;通过中间件应用程序的会话数,分析信息系统在各地的使用情况;通过主机的计算内存使用率、CPU使用率,评估各地的硬件资源的利用率,减少设备冗余,降低成本等等。
本系统主要包括:
(1) 部署集中运维管理系统
部署集中运维管理系统,该系统实现的是对全国各地运维监控系统的基础数据和监控数据的接收、统计、分析。集中运维管理系统对外开放数据接收RESTful服务,包括资源配置、运行时、预警、预警规则、TOP SQL、运维监控系统环境等数据接收服务。
(2) 部署运维监控系统
部署运维监控系统,该系统实现的是对各地信息系统的监控,以及对基础数据和监控数据向集中运维管理系统的实时推送;信息系统的监控包括:业务数据监控、主机监控、数据库监控、中间件监控、URL监控;基础数据包括:监控资源、预警规则、运维监控系统部署环境信息,监控数据包括:预警数据、业务数据、主机监控数据、数据库监控数据、中间件监控数据、URL监控数据等。
启动运维监控系统后,当检测到资源配置、预警规则、预警数据、实时运行数据的更新时,运维监控系统会自动调用集中运维管理系统的对应的RESTful数据接收服务,实现监控数据的传输;当没有数据更新时,运维监控系统不会调用数据传输接口,以此来实现运维监控系统和集中运维管理系统的数据一致性。
(3) 建立数据传输网络通道
运维监控系统与集中运维管理系统之间的数据传输采用RESTful服务,因此需要确保两个系统之间的网络是连通的。
(4) 数据接收
系统与集中运维管理系统的网络连通后,集中运维管理系统就可以接收到来自运维监控系统的数据,并对接收的数据持久化,根据运维监控系统的部署环境IP地址来实现全国各地信息系统的数据隔离;
(5) 数据统计分析
集中展现:对各地的业务系统、数据库、中间件、主机、URL等类型资源的运行状态、响应时间、内存使用率等指标分类,以及每种类型资源对应的预警数进行统计,并整体展现到集中运维管理平台的统计分析,向运维人员直观地、有比较地展现全国各地信息系统的当前运行情况;
SQL分析:通过接收的平均执行时间TOP SQL,计算出各地数据库的平均执行时间进行比较,分析出数据库的性能;针对性能较差的信息系统,通过SQL调优等手段提升数据库性能。

Claims (9)

1.一种信息系统集中运维管理的实现方法,其特征在于,
通过信息系统的本地的运维监控系统监控各自上的信息系统,并将监控数据、预警数据以及添加的监控资源实时推送到集中运维管理系统;集中运维管理系统接收这些数据,持久化到数据库作为历史数据,并将最新的数据展现到页面。
2.根据权利要求1所述的方法,其特征在于:
各地运维监控系统采集监控数据、预警数据,包括:主机、数据库、中间件、URL信息。
3.根据权利要求1所述的方法,其特征在于,
集中运维管理系统接收来自全国各地运维监控系统的数据,根据运维监控系统所在服务器IP实现数据隔离;通过统计一段时间内预警的数量以及严重程度,分析评估各地在该时间段内的运维工作;通过统计一段时间内数据库SQL的平均执行时间,分析各地数据库的性能;通过中间件应用程序的会话数,分析信息系统在各地的使用情况;通过主机的计算内存使用率、CPU使用率,评估各地的硬件资源的利用率。
4.一种信息系统集中运维管理系统,其特征在于,
主要包括如下几个部分:
(1) 部署集中运维管理系统,对全国各地信息系统数据进行统一管理分析;
(2) 部署运维监控系统,采集本地信息系统数据;
(3) 建立运维监控系统与集中运维管理系统之间的网络通道,进行数据传输;
(4) 数据接收系统;
(5) 数据统计分析系统。
5.根据权利要求4所述的管理系统,其特征在于,
(1) 部署集中运维管理系统
部署集中运维管理系统,该系统实现的是对全国各地运维监控系统的基础数据和监控数据的接收、统计、分析;集中运维管理系统对外开放数据接收RESTful服务,包括资源配置、运行时、预警、预警规则、TOP SQL、运维监控系统环境数据接收服务。
6.根据权利要求4所述的管理系统,其特征在于,
(2) 部署运维监控系统
部署运维监控系统,该系统实现的是对各地信息系统的监控,以及对基础数据和监控数据向集中运维管理系统的实时推送;
信息系统的监控包括:业务数据监控、主机监控、数据库监控、中间件监控、URL监控;基础数据包括:监控资源、预警规则、运维监控系统部署环境信息,监控数据包括:预警数据、业务数据、主机监控数据、数据库监控数据、中间件监控数据、URL监控数据;
启动运维监控系统后,当检测到资源配置、预警规则、预警数据、实时运行数据的更新时,运维监控系统会自动调用集中运维管理系统的对应的RESTful数据接收服务,实现监控数据的传输;当没有数据更新时,运维监控系统不会调用数据传输接口,以此来实现运维监控系统和集中运维管理系统的数据一致性。
7.根据权利要求4所述的管理系统,其特征在于,
(3) 建立数据传输网络通道
运维监控系统与集中运维管理系统之间的数据传输采用RESTful服务,因此需要确保两个系统之间的网络是连通的。
8.根据权利要求4所述的管理系统,其特征在于,
(4) 数据接收系统
运维监控系统与集中运维管理系统的网络连通后,集中运维管理系统就可以接收到来自运维监控系统的数据,并对接收的数据持久化,根据运维监控系统的部署环境IP地址来实现全国各地信息系统的数据隔离。
9.根据权利要求4所述的管理系统,其特征在于,
(5) 数据统计分析系统
集中展现:对各地的业务系统、数据库、中间件、主机、URL类型资源的运行状态、响应时间、内存使用率指标分类,以及每种类型资源对应的预警数进行统计,并整体展现到集中运维管理平台的统计分析,向运维人员直观地、有比较地展现全国各地信息系统的当前运行情况;
SQL分析:通过接收的平均执行时间TOP SQL,计算出各地数据库的平均执行时间进行比较,分析出数据库的性能;针对性能较差的信息系统,通过SQL调优等手段提升数据库性能。
CN201611227266.5A 2016-12-27 2016-12-27 一种信息系统集中运维管理的实现方法及系统 Pending CN106789270A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611227266.5A CN106789270A (zh) 2016-12-27 2016-12-27 一种信息系统集中运维管理的实现方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611227266.5A CN106789270A (zh) 2016-12-27 2016-12-27 一种信息系统集中运维管理的实现方法及系统

Publications (1)

Publication Number Publication Date
CN106789270A true CN106789270A (zh) 2017-05-31

Family

ID=58922730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611227266.5A Pending CN106789270A (zh) 2016-12-27 2016-12-27 一种信息系统集中运维管理的实现方法及系统

Country Status (1)

Country Link
CN (1) CN106789270A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108280013A (zh) * 2018-02-05 2018-07-13 中国银行股份有限公司 一种环境资源监测页面的展示方法及装置
CN108345529A (zh) * 2018-01-04 2018-07-31 浪潮软件股份有限公司 一种系统性能检测方法和检测装置
CN110611597A (zh) * 2019-10-14 2019-12-24 中国电子科技集团公司第二十八研究所 一种基于单向网闸环境的跨域运维系统
CN110798660A (zh) * 2019-09-30 2020-02-14 武汉兴图新科电子股份有限公司 基于云联邦音视频融合平台的一体化运维系统
CN110808967A (zh) * 2019-10-24 2020-02-18 新华三信息安全技术有限公司 挑战黑洞攻击的检测方法及相关装置
CN113177676A (zh) * 2020-08-26 2021-07-27 北京合众伟奇科技有限公司 一种基于自然对数函数的运维健康评估系统和评估方法
CN114492877A (zh) * 2022-04-13 2022-05-13 北京蒙帕信创科技有限公司 一种业务系统的运维分析方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101562541A (zh) * 2009-05-19 2009-10-21 杭州华三通信技术有限公司 一种统一管理方法和装置
CN101854269A (zh) * 2010-04-06 2010-10-06 珠海市鸿瑞信息技术有限公司 电力二次系统信息安全运维监管平台
CN103888287A (zh) * 2013-12-18 2014-06-25 北京首都国际机场股份有限公司 信息系统一体化运维监控服务预警平台及其实现方法
CN104407964A (zh) * 2014-12-08 2015-03-11 国家电网公司 一种基于数据中心的集中监控系统及方法
CN106202444A (zh) * 2016-07-14 2016-12-07 浪潮软件股份有限公司 一种数据库运维监控的实现方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101562541A (zh) * 2009-05-19 2009-10-21 杭州华三通信技术有限公司 一种统一管理方法和装置
CN101854269A (zh) * 2010-04-06 2010-10-06 珠海市鸿瑞信息技术有限公司 电力二次系统信息安全运维监管平台
CN103888287A (zh) * 2013-12-18 2014-06-25 北京首都国际机场股份有限公司 信息系统一体化运维监控服务预警平台及其实现方法
CN104407964A (zh) * 2014-12-08 2015-03-11 国家电网公司 一种基于数据中心的集中监控系统及方法
CN106202444A (zh) * 2016-07-14 2016-12-07 浪潮软件股份有限公司 一种数据库运维监控的实现方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孙波: ""华夏银行沈阳分行一体化运维管理系统设计研究"", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
彭琳: ""基于医疗行业的IT智能运维平台的设计与实现"", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345529A (zh) * 2018-01-04 2018-07-31 浪潮软件股份有限公司 一种系统性能检测方法和检测装置
CN108280013A (zh) * 2018-02-05 2018-07-13 中国银行股份有限公司 一种环境资源监测页面的展示方法及装置
CN110798660A (zh) * 2019-09-30 2020-02-14 武汉兴图新科电子股份有限公司 基于云联邦音视频融合平台的一体化运维系统
CN110611597A (zh) * 2019-10-14 2019-12-24 中国电子科技集团公司第二十八研究所 一种基于单向网闸环境的跨域运维系统
CN110808967A (zh) * 2019-10-24 2020-02-18 新华三信息安全技术有限公司 挑战黑洞攻击的检测方法及相关装置
CN113177676A (zh) * 2020-08-26 2021-07-27 北京合众伟奇科技有限公司 一种基于自然对数函数的运维健康评估系统和评估方法
CN113177676B (zh) * 2020-08-26 2024-02-06 北京合众伟奇科技股份有限公司 一种基于自然对数函数的运维健康评估系统和评估方法
CN114492877A (zh) * 2022-04-13 2022-05-13 北京蒙帕信创科技有限公司 一种业务系统的运维分析方法及装置
CN114492877B (zh) * 2022-04-13 2022-07-05 北京蒙帕信创科技有限公司 一种业务系统的运维分析方法及装置

Similar Documents

Publication Publication Date Title
CN106789270A (zh) 一种信息系统集中运维管理的实现方法及系统
CN100568193C (zh) 多层计算环境中用于性能管理的系统和方法
CN105718351B (zh) 一种面向Hadoop集群的分布式监控管理系统
US9413597B2 (en) Method and system for providing aggregated network alarms
US10747592B2 (en) Router management by an event stream processing cluster manager
CN107707376B (zh) 一种监控和告警的方法和系统
CN108874640A (zh) 一种集群性能的评估方法和装置
CN106027328A (zh) 一种基于应用容器部署的集群监控的方法及系统
CN103761309A (zh) 一种运营数据处理方法及系统
CN110213125A (zh) 一种云环境下基于时序数据的异常检测系统
CN106940677A (zh) 一种应用日志数据告警方法及装置
CN110581773A (zh) 一种自动化服务监控与报警管理系统
US20190004837A1 (en) Optimizing allocation of virtual machines in cloud computing environment
CN110493065A (zh) 一种云中心运维的告警关联度分析方法及系统
CN101297536A (zh) 用于准备在端点上执行系统管理任务的方法和系统
CN101902497A (zh) 基于云计算的互联网信息监测系统及方法
US20210303532A1 (en) Streamlined transaction and dimension data collection
CN110383245A (zh) 具有动态反馈的安全智能联网架构
CN105959233A (zh) 基于流式计算的移动终端流量分发系统及方法
CN108809760A (zh) 数据采样系统中采样周期的控制方法和装置
CN109800133A (zh) 一种统一监控告警的方法、一站式监控告警平台及系统
CN106034047B (zh) 数据处理方法及装置
GB2516357A (en) Methods and apparatus for monitoring conditions prevailing in a distributed system
CN109460829A (zh) 基于大数据处理及云传输下的智能监测方法及平台
CN201726426U (zh) 基于云计算的互联网信息监测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531