CN103840955A - 分布式it系统的运营维护系统及运营维护管理方法 - Google Patents

分布式it系统的运营维护系统及运营维护管理方法 Download PDF

Info

Publication number
CN103840955A
CN103840955A CN201210477652.5A CN201210477652A CN103840955A CN 103840955 A CN103840955 A CN 103840955A CN 201210477652 A CN201210477652 A CN 201210477652A CN 103840955 A CN103840955 A CN 103840955A
Authority
CN
China
Prior art keywords
data
operation maintenance
index
distributed
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210477652.5A
Other languages
English (en)
Other versions
CN103840955B (zh
Inventor
戚跃民
郝建明
马平清
宋泽锋
张弛
覃非
韩智东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Co Ltd
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Priority to CN201210477652.5A priority Critical patent/CN103840955B/zh
Publication of CN103840955A publication Critical patent/CN103840955A/zh
Application granted granted Critical
Publication of CN103840955B publication Critical patent/CN103840955B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种分布式IT系统的运营维护系统及运营维护管理方法,IT系统运营维护技术领域。该运营维护系统包括指标体系生成模块、数据采集模块、数据分析处理模块、业务展示模块以及以上模块所连接的子数据库,子数据库通过数据访问接口与分布式IT系统的数据库耦接。

Description

分布式IT系统的运营维护系统及运营维护管理方法
技术领域
本发明属于IT(Information Technology,信息技术)系统运营维护技术领域,涉及分布式IT系统的运营维护系统以及该系统所使用的运营维护管理方法。
背景技术
近年来,企业信息化建设不断深入发展并且不断推广,众多企业或组织的核心业务与IT系统的联系越来越紧密,而且,投入越来越多的资源来开发并支持企业或组织核心业务运作的IT系统。随着企业的组织生产以及经营规模的不断扩大,其IT系统相应随之变得更加庞大、复杂。因此,IT系统运营维护(或者简称为“运维”)变得越来越重要,同时也变得越来越繁重,并且,随之出现了诸如以下的一些问题:
一、技术维护难度比较大;
二、系统复杂程度高,以致难以有效运行;
三、业务开发需求多,但相关技术人员很多时候处于运营维护的“救援”状态、因此服务响应不及时。
面对出现的各种问题,企业或组织的IT服务部门需要思考如何建立完善高效的IT运营维护系统平台,提升运维水平,进而提高服务水平,确保为企业或组织核心业务正常稳定运营提供强有力的保障。同时通过IT系统运营维护的提高,可以为企业或组织取得良好的IT系统投入产出效益,最终通过有效规范的IT 服务取得优良的客户满意度,使得组织或企业的一系列战略、战术目标得以实现。
目前,国内外各大组织或机构为解决上述问题普遍采用ITIL (Information Technology Infrastructure Library,信息技术基础架构库)实践,ITIL为企业提供了一个严谨、客观、可量化的标准和规范,使企业能在IT服务管理实践中加以应用。企业所需的服务水平,可由企业的最终用户和IT部门根据自己的需求及能力来定义。参考ITIL来制定及规划其服务管理及IT基础架构,从而发挥为企业的IT服务管理能力,并更好地支持业务运作。从企业角度出发,实施ITIL的最大意义是使IT系统与业务能够紧密地结合,从而最大化企业的IT投资回报。
但是,基于ITIL本身也存在着一些问题,而当今各企业或组织的IT系统运营维护平台主要是基于ITIL来构建的,由于ITIL存在缺陷,与之相适的IT系统的运营维护系统的可用性与稳定性也存在问题,其主要表现在以下方面:
(1)容易缺失对IT系统的运营维护系统的监控,特别对于大型分布式IT系统运维事件很难及时发现,实时性很难保证;
(2)对IT系统的监控主要是集中在业务层面和技术层面,缺少定位监控,一旦出现人为故障等、很难直接定位问题根源;
(3)缺乏对于IT运营管理工作人员解决故障的处理效率和处理质量的监督,仅仅规定一系列的问题处理要求和处理流程,其科学性和规范性有待进一步提高;
(4)IT系统平台数据源单一,有些系统甚至数据采集甚至需要手动进行,不够灵活,从而导致工作人员劳动量大、易出错的问题。
有鉴于此,有必要提出一种新型的分布式IT系统的运营维护系统。
发明内容
为解决以上技术问题或者其他问题,提高分布式IT系统的运营维护水平,本发明提供以下技术方案。
按照本发明的一方面,提供一种分布式IT系统的运营维护系统(10),其包括:
数据访问接口(160),其与分布式IT系统的数据库(200)耦接,可操作地用于将数据库(200)中存储的数据进行数据类型的转换;
指标体系生成模块(11),其用于根据运营维护目标、方针策略和/或服务流程构建所述运营维护系统(10)的指标体系,所述指标体系包括多个用作第一层级指标的活动、对应各个活动的用作第二层级指标的活动节点、以及与相应活动节点相关联的控制点;
数据采集模块(130),其基于所述指标体系以及自身配置的数据采集规则从所述数据库(200)进行数据采集;
数据分析处理模块(140),其用于将所采集的数据中与选定的所述控制点相关联的数据进行数据分析处理;
业务展示模块(170),其用于将分析处理后的数据以直观、可视化的方式展示;以及
子数据库(150),其至少用于存储从所述数据库(200)采集的数据。
按照本发明一实施例的分布式IT系统的运营维护系统(10),其中,所述指标体系生成模块(11)包括:
指标体系策划模块(110),其用于根据运营维护目标、方针策略和/或服务流程策划所述指标系统的活动指标;以及
指标配置管理模块(120),其用于对相应的活动配置所述活动节点并进行管理,同时对所述活动节点策划并配置相应的控制点。
在之前所述实施例的分布式IT系统的运营维护系统(10)中,所述指标体系策划模块(110)可操作地用于进行活动创建、活动删除、活动修改、关联活动节点、活动审批和/或活动查询。
进一步地,指标配置管理模块(120)可操作地用于进行创建活动节点、修改活动节点、删除活动节点、审批活动节点和/或关联控制点。
进一步地,指标配置管理模块(120)可操作地用于进行新增控制点、配置控制点、修改控制点、删除控制点和/或审批控制点。
在之前所述实施例的分布式IT系统的运营维护系统(10)中,所述指标体系生成模块(11)进一步可以用于动态调整所述指标体系。
在之前所述实施例的分布式IT系统的运营维护系统(10)中,所述指标体系生成模块(11)进一步还可以用于提供指标检索以及所述指标体系的展示功能。
在之前所述实施例的分布式IT系统的运营维护系统(10)中,所述指标体系生成模块(11)进一步还可以用于对所述指标体系进行初始化。
按照本发明又一实施例的分布式IT系统的运营维护系统(10),其中,所述数据采集模块(130)基于所选择的所述指标体系的控制点形成相应的采集任务表,并进一步基于该采集任务表进行所述数据采集。
按照本发明还一实施例的分布式IT系统的运营维护系统(10),其中,所述数据采集模块(130)包括:采集规则配置子模块(131)、采集规则显示子模块(132)、采集规则执行子模块(133)和采集过程记录子模块(134)。
在之前所述任一实施例的分布式IT系统的运营维护系统(10)中,所述采集规则配置子模块(131)用于配置抽取规则名称、抽取数据源的类型、抽取后数据的具体格式、抽取规则描述信息、抽取规则关联的监控项、抽取字段及字段组合、抽取行和抽取列、抽取条件、抽取时所采用的计算公式和/或抽取执行方式。
进一步地,所述采集规则显示子模块(132)用于按照不同条件检索所述采集规则配置子模块(131)配置的采集规则、并显示该检索结果。
进一步地,所述采集规则执行子模块(133)用于至少按照所述采集规则中定义的采集方式进行数据采集并采集过程和采集结果保存到相应的数据表中。
进一步地,所述采集过程记录子模块(134)用于记录采集过程的日志、记录各时间点或时间段所执行的数据采集方式、并记录数据采集执行是否成功,以使所述数据采集模块(130)能够实现对数据过程的检索和显示功能。
在之前所述任一实施例的分布式IT系统的运营维护系统(10)中,所述分析处理后的数据包括流程数据、指标数据和结果数据,所述流程数据、指标数据和/或结果数据被直观、可视化的方式展示。
按照本发明再一实施例的分布式IT系统的运营维护系统(10),其中,所述数据分析处模块(140)至少包括:
监控主题配置子模块(141),其用于选择监控的主题所对应的活动并通过所述指标体系查询该活动所对应的指标对象,对应的指标对象被配置在所述监控主题中并被进行权重设置;以及
基线设置子模块(142),其用于对所设置的监控主题对应的指标对象选择控制点、并对该控制点计算设置基线以展现数据偏离。 
按照本发明还又一实施例的分布式IT系统的运营维护系统(10),其中,所述业务展示模块(170)包括数据链展示子模块(171)、目标动态展示子模块(172)、趋势图展示子模块(173)、数据分析展示子模块(174)和/或红绿灯展示子模块(175)。
在之前所述任一实施例的分布式IT系统的运营维护系统(10)中,,所述分布式IT系统为大型分布式IT系统。
按照本发明的又一方面,一种使用以上所述及的任一运营维护系统(10)的运营维护方法,其包括步骤:
根据运营维护目标、方针策略和/或服务流程构建指标体系,所述指标体系包括多个用作第一层级指标的活动、对应各个活动的用作第二层级指标的活动节点、以及与相应活动节点相关联的控制点;
基于所述指标体系以及数据采集规则从所述分布式IT系统的数据库(200)进行数据采集;
将所采集的数据中与选定的所述控制点相关联的数据进行数据分析处理;以及
将分析处理后的数据以直观、可视化的方式展示。
按照本发明一实施例的运营维护方法,其中,所述构建指标体系步骤包括:
根据运营维护目标、方针策略和/或服务流程策划所述指标系统的活动指标;或者
对相应的活动配置所述活动节点并进行管理,同时对所述活动节点策划并配置相应的控制点。
进一步地,所述构建指标体系步骤可以包括:动态调整所述指标体系。
进一步地,所述构建指标体系步骤可以包括:对所述指标体系进行初始化。
按照本发明又一实施例的运营维护方法,其中,所述数据采集步骤中,基于所选择的所述指标体系的控制点形成相应的采集任务表,并进一步基于该采集任务表进行所述数据采集。
按照本发明还一实施例的运营维护方法,其中,所述数据采集步骤包括:采集规则配置、采集规则显示、采集规则执行和采集过程记录。
按照本发明再一实施例的运营维护方法,其中,所述数据分析处理步骤包括:
配置监控主题步骤:选择监控的主题所对应的活动并通过所述指标体系查询该活动所对应的指标对象,对应的指标对象被配置在所述监控主题中并被进行权重设置;以及
基线设置步骤:对所设置的监控主题对应的指标对象选择控制点、并对该控制点计算设置基线以展现数据偏离。
按照本发明还又一实施例的运营维护方法,其中,所述业务展示步骤包括数据链展示、目标动态展示、趋势图展示、数据分析展示和/或红绿灯展示。
本发明的技术效果是,该运营维护系统易于对分布式IT系统的运营维护进行量化,运营维护及时性好,保持IT系统具有较高的可用性和稳定性。特别是通过业务展示模块可以实现对指标体系的立体展示,能够实现从运维统计量到系统准实时状态的层级展开,最大限度的为IT系统的运维决策提供依据,也能为发现系统潜在问题进而持续优化提供依据。
附图说明
从结合附图的以下详细说明中,将会使本发明的上述和其他目的及优点更加完全清楚,其中,相同或相似的要素采用相同的标号表示。
图1是按照本发明一实施例的运营维护系统的模块结构示意图。
图2是指标体系策划模块的功能模块示意图。
图3是指标体系的控制点的策划及配置的功能模块示意图。
图4是按照本发明一实施例的数据采集模块的数据采集过程示意图。
图5是按照本发明一实施例的数据采集模块的模块结构示意图。
图6是按照本发明一实施例的数据分析模块模块结构示意图。
图7是按照本发明一实施例的业务展示模块的模块结构示意图。
图8是按照本发明一实施例的运营维护方法流程示意图。
图9是按照本发明一实施例的生成指标体系步骤具体流程示意图。
具体实施方式
下面介绍的是本发明的多个可能实施例中的一些,旨在提供对本发明的基本了解,并不旨在确认本发明的关键或决定性的要素或限定所要保护的范围。容易理解,根据本发明的技术方案,在不变更本发明的实质精神下,本领域的一般技术人员可以提出可相互替换的其他实现方式。因此,以下具体实施方式以及附图仅是对本发明的技术方案的示例性说明,而不应当视为本发明的全部或者视为对本发明技术方案的限定或限制。
图1所示为按照本发明一实施例的运营维护系统的模块结构示意图。该实施例的运营维护系统10用于对分布式IT系统进行运营维护,形成运营维护管理平台。分布式IT系统具体应用领域不是限制性的,其可以是各种领域的企业或组织中应用的IT系统。
具体如图1所示,该运营维护系统10包括指标体系生成模块11、指标管理模块120、数据采集模块130、数据分析处理模块140、业务展示模块170和子数据库150,该运营维护系统10通过数据库访问接口160与其所运营维护的分布式IT系统的数据库200连接,分布式IT系统的数据库160能对分布式IT系统中的数据按照数据的不同分类进行有效存储,通过设置数据访问接口160,可以将数据库200中存储的数据进行数据类型的转换。数据访问接口160转换输出的数据被存储在子数据库150中,子数据库150用作运营维护系统10的数据库,其与指标体系生成模块11、指标管理模块120、数据采集模块130、数据分析处理模块140、业务展示模块170均耦接,并且与数据访问接口160耦接,数据访问接口160的具体数据类型转换方式不是限制性的。
指标体系生成模块11主要用于构建运营维护系统10的指标体系,其根据使用该分布式IT系统的机构组织机构的运营维护目标、方针策略和/或服务流程构建指标体系,该指标体系包括第一层级指标的“活动”,在本发明中,活动是指分布式IT系统的软件维护活动,其包括支撑运营维护功能的各种流程(例如,服务流程、事件流程、问题流程、变更流程等)以及工作任务(例如,TCG评审管理、文档发布管理、项目管理、审计管理、培训及演练等);在策划活动时,组织机构的运营维护目标或方针策略,可以分解成若干个关键要素,每个要素对应若干个活动指标。
针对每个活动指标,需要有活动节点按照任务目标或流程体现出各阶段执行关系,因此,该指标体系还包括有用作第二层级指标的活动节点,每个第一层级指标下对应设置一个或多个活动节点;在本发明中,活动节点可以表现活动的内部依赖关系,其以运营维护的工作任务的角度,对活动所包含的工作进行设计,以便于相应的运营维护工作人员理解和管理活动。活动的类型、活动的个数以及活动节点的类型及具体个数均不是限制性的。
针对每个活动节点,相应活动的活动负责人可以为其配置相应的一个或多个控制点,从而形成指标体系中的一系列控制点。控制点与相应的活动节点相关联,在本发明中,将能够反映分布式IT系统的每个模块运行状态的最小数据单元称为控制点,其可以代表任何形式疑义的数据。通过控制点可以提供实时数据,实时体现分布式IT系统的流程活动和工作任务的运行状态。
活动、活动节点以及控制点主要地构成了运营维护系统10的指标体系,根据运营维护目标、方针策略和/或服务流程的差异,不同的组织机构可以生成不同结构类型的指标体系。对于确定的指标体系,指标体系生成模块11还可以对其进行初始化;需要理解的是,指标体系生成模块11还可以根据实际情况变化动态调整指标体系。
指标体系生成模块11还可以具有指标体系的展示功能;其中,已经生成的指标体系中,指标体系生成模块11能够为工作人员提供指标检索功能,检索人员输入检索条件能够查新相关指标的信息,以便于工作人员在指标体系生成模块11上进行相应的修改或删除等操作,并对已经生成或者初始化的指标体系进行显示。
在一实施例中,如图1所示,指标体系生成模块11包括指标体系策划模块110和指标配置管理模块120,其中,指标体系策划模块110主要用于根据运营维护目标、方针策略和/或服务流程来策划活动,以生成第一层级指标。
图2所示为指标体系策划模块的功能模块示意图。在活动策划过程中,相关活动负责人员可以进入运营维护系统10的指标体系策划模块110,依据运营维护目标、方针策略和/或服务流程能够创建可以执行的活动,当运营维护目标、方针策略和/或服务流程发生变化时,可以对活动进行添加、修改、删除以及活动配置信息的维护。在该运营维护系统10中,活动的属性包含名称、活动类型、活动状态、归属系统、关联科室、制定人、审核人。活动制定人使用该功能创建新的活动,并提交给相应第二级用户进行审核。当审核人通过审批后,该活动开始生效,可以对该活动进行配置。
指标体系策划模块110中的活动策划主要包括但不限于以下几方面功能。
创建(或称为增加、制定):活动负责人通过选择运营维护目标或缺省(表示该活动不关联到任何运维目标),进入活动创建页面。建立的活动包含如下属性:名称、编号、活动说明、起草人、状态(草稿、待审)、创建时间、关联的运营维护目标(系统填写,如选择缺省时,活动不关联具体的运维目标);创建时包含选择活动关联的业务系统、关联的业务科室、活动类型(流程、任务)等。
删除:活动负责人可删除处于草稿状态的活动;也可以对不再使用的活动设置为失效状态,实现逻辑删除。
修改:活动负责人可以修改待审和拒绝状态的活动,相应的字段同创建操作;也可以增加修改人、修改时间。
关联活动节点:活动负责人可以配置活动节点,使其与相应活动相关联,表现活动的内部依赖关系。
审批:第二级用户可以完成对处于待审状态的活动记录进行审批,可以是通过、拒绝;相应的填写属性字段为:状态(生效、拒绝)、审核人、审核时间。
查询:活动负责人可以按照业务系统分类、科室、活动类型、时间、起草人、审核人等条件进行查询,也可以查询到活动关联到的控制点列表。
继续如图1所示实施例,指标配置管理模块120用于对相应的活动配置活动节点并进行管理,同时对活动节点策划并配置相应的控制点。
指标配置管理模块120中,活动负责人可以根据活动的定义范围进行活动节点的拆分,可以自由配置该活动包含的活动节点,活动节点包含名称、所属活动、节点顺序、状态(草稿、待审)、时间,当活动节点创建后提交审批,当审批通过后活动节点正式生效,活动负责人不可以对生效后的活动控制节点进行修改。指标配置管理模块120针对指标体系的活动节点主要具有但不限于以下几方面功能。
列表查询功能:活动负责人可以按照活动节点属性约束为查询条件的列表查询、展示。
创建:活动负责人选择活动,为活动创建活动节点,调整活动节点的顺序。活动节点的属性主要包括:节点名称、所属活动、状态(草稿、待审)、创建时间。
修改:活动负责人可以修改待审和拒绝状态的活动节点,相应的字段同新增操作,也可以增加修改人、修改时间。
删除:活动负责人可删除处于草稿状态的活动节点;也可以对不再使用的活动节点设置失效状态,实现逻辑删除。
审批:活动负责人对应的管理人员将负责将待审核状态的活动节点设置为生效或拒绝。
关联控制点:活动负责人可以为活动节点设置相应的控制点,在显示活动节点时,可以查询相关联的控制点集合。
图3所示为指标体系的控制点的策划及配置的功能模块示意图。
活动节点配置完成后,需要在活动节点上策划并配置控制点,控制点是为了使指标体系具有足够的开放性和灵活性。通过控制点可以提供实时数据,实时体现流程活动和工作任务的运行状态。指标配置管理模块120针对指标体系的控制点主要具有但不限于以下几方面功能。
新增:活动负责人可以新增加控制点,控制点提供设计和管理数据采集任务时使用,主要属性为:控制点名称、数据类型、数据来源方式、采集周期、控制点任务执行方式、控制点的组合计算关系。还包括策划人、策划时间、状态(草稿、待审)。
配置:活动负责人可以对控制点配置来源方式、测试开通状态、配置采集周期、配置控制点组合关系并测试计算公式;由于控制点负责外部系统数据的采集、负责科室人工表单的设置等,属于易调整的工作范围;因此,配置功能相对独立于新增功能,可以进行单独维护。
修改:活动负责人可以修改待审和拒绝状态的控制点,相应的字段同新增操作,也可以增加修改人、修改时间。
删除:活动负责人可删除处于草稿、拒绝状态的控制点;也可以对不再使用的控制点设置失效状态,实现逻辑删除。
审批:活动负责人的相应管理人员将待审状态的控制点设置为生效或拒绝;生效的控制点立即实现业务开通,在数据采集过程中,可以由任务引擎调度采集任务(如图4所示)。
继续如图1所示,指标体系策划模块110和指标配置管理模块120均与子数据库150耦接,指标体系生成模块11生成的指标体系可以存储于子数据库150中,并可以被其他模块调用。
图4所示为按照本发明一实施例的数据采集模块的数据采集过程示意图。运营维护系统10的数据采集模块130基于选择的指标体系的控制点形成相应地的采集任务表,并且可以基于该采集任务表采集数据库200的数据;其中,分布式IT系统的数据库200用于存储生产数据,其不同于用于存储运营维护数据的子数据库150,运营维护系统10与子数据库150之间通过数据访问接口160耦接,在数据采集的过程中,从数据库200中采集的数据在数据访问接口160中进行数据类型转换,并存储至子数据库150,从而完成数据采集过程。数据访问接口160所转换后输出的数据,可以但不限于为相同类型的数据。
图5所示为按照本发明一实施例的数据采集模块的模块结构示意图。在该实施例中,数据采集模块130包括采集规则配置子模块131、采集规则显示子模块132、采集规则执行子模块133和采集过程记录子模块134。
具体地,采集规则配置子模块131可以具有但不限于以下功能:配置抽取规则名称,配置抽取数据源的类型(比如SQL数据、EXCEL数据、文本数据、DB2数据),配置抽取后数据的具体格式,配置抽取规则描述信息,配置抽取规则关联的监控项,配置抽取字段及字段组合,配置抽取行和抽取列,配置抽取条件(例如where,in,between,order by,group by),配置抽取时所采用的计算公式(例如sum,count,average),配置抽取执行方式,例如采用自动方式(诸如自动配置抽取时间点、自动配置抽取范围、自动配置抽取周期)还是手动方式(诸如手动配置抽取时间点、手动配置抽取范围、手动配置抽取时间跨度)。
采集规则显示子模块132可以具有但不限于以下功能:能够按照不同条件检索采集规则,并合理显示检索结果,对检索结果进行选择,从而,采集规则配置子模块131能对选中的采集规则执行修改、删除等操作。
采集规则执行子模块133可以具有但不限于以下功能:按照采集规则中定义的采集方式自动或手动执行数据采集,将采集过程和采集结果保存到相应的数据表中。需要理解的是,指标体系中的控制点不但包含名称、数据类型等信息,通过其还可以反映数据来源方式,即可以基于该控制点的信息,从数据库200中自动定位需要采集的数据范围,也即按照控制点的配置信息,生成采集任务表,自动定位数据源在数据库200的位置并建立连接。采集规则执行子模块133进一步根据采集规则配置子模块131中采集规则,对以上基于指标体系定位的数据源进行具体地采集加工,例如,配置数据抽取规则描述。
采集过程记录子模块134可以具有但不限于以下功能:实现对自动采集和手动采集过程的日志记录,记录各时间点或时间段所执行的数据采集方式、数据采集执行是否成功等,从而可以实现对数据采集过程的检索和显示的功能。
继续如图1所示,运营维护系统10的数据分析处模块140可以将所采集的数据进行分析处理,从而可以相对直观、可视化地将相应的流程数据、指标数据和/或结果数据展示出来;运营维护系统10的数据分析处模块140的业务展示模块170用于将流程数据、指标数据和结果数据可视化地呈现给用户,这样,负责相应活动或活动节点的工作人员可以非常直观方便地获知分布式IT系统的运营状态信息。
图6所示为按照本发明一实施例的数据分析模块模块结构示意图。在该实施例中,数据分析处模块140一方面包括监控主题配置子模块141,其可以选择监控的主题所对应的活动,并通过指标体系查询该活动所对应的指标对象,相应的指标对象被配置在该监控主题中,进一步可以对这些指标对象进行权重设置,例如,利用AHP算法实现指标对象(活动或活动节点)之间的权重计算,从而可以实现配置监控主题;监控主题配置子模块还可以发起对该监控主题的审核。主题配置子模块可以使数据分析准确定位每个主题对应的数据,工作人员的运营维护变得直观化、简单化。
数据分析处模块140的另一方面还包括基线设置子模块142,基线设置子模块142可以根据所设置的监控主题选择相应的控制点(基于其指标对象从指标体系中选择控制点),对每个控制点(其对应的相关数据)计算设置基线,通过该基线,从而可以展现数据偏离,也即可以直观反映监控主题的指标(或者指标体系的控制点)偏离情况。在本文中,基线是指一定周期内被监控的主题的活动对象的某一稳定状态的反映。
继续如图1所示,在业务展示模块170中输入“展示”相关指令后,数据分析处模块140将生成可视化的数据分析图。图7所示为按照本发明一实施例的业务展示模块的模块结构示意图。在该实施例中,业务展示模块170的外部展示功能包括但不限于数据链展示、目标动态展示、趋势图展示、数据分析展示和/或红绿灯展示,其相应地包括数据链展示子模块171、目标动态展示子模块172、趋势图展示子模块173、数据分析展示子模块174和/或红绿灯展示子模块175。
其中,数据链展示是将各模块的有层级关系的数据,以树的形式展现,并表达数据间的状态关系、数值关系;将一组关联的控制点、监控主题活动,在一个图形中展现,表现数据之间的稽核关系。为实现数据链展示,其主要步骤是:首先选择监控主题活动,选择展现的树的层级,基于指标体系生成层次树图,然后选择关联对象,生成数据链图。
其中,目标动态展示是为了提供使用者动态组装监控桌面的功能。在目标展示过程中用户可以选择关注的控制点、监控主题活动、展示层次、模式(仪表样式),采样起始时间、采样终止时间等。目标动态展示中可以实现以下几个功能:
设置监控桌面:用户可以依据自配系统的实际情况输入窗口水平数量X、垂直数量Y,系统生成X乘Y的网格,以最适合的大小显示。
增加管理目标:用户可以选择控制点、监控主题活动、展示层次、模式(仪表样式),采样起始时间、采样终止时间,选择监控桌面位置,生成动态展示窗口,添加到控制桌面。
其中,趋势图展示是指工作人员可以按照时间纬度、计算周期性控制点采集数据,形成趋势图展现。趋势图展示可以实现以下几个功能:
生成图:用户输入查询条件,可以生成柱状图或线图;查询条件主要参数为主题名称、控制点名称、起始时间、终止时间等。
输出:屏幕拷贝,即用户可以将趋势图展示结果进行拷贝存储,并将结果在屏幕上展示。
其中,在数据分析展现中,用户可以输入起始时间,终止统计时间,点击展示按钮,可以生成数据分析图。数据分析展现可以实现以下几个功能:
生成图:用户可以选择监控主题活动或控制点,选择参与分析的基线,输入起始时间、终止时间,生成数据分析图,以柱图、线图等形式表现。
输出:屏幕拷贝,即用户可以把分析图展示结果拷贝存储,并将结果在屏幕上展示。
其中,所述红绿灯展现是指系统平台按照基线设置,监控数据状态,并根据用户的指示体系各项活动安全稳定或者进行报警。
在红绿灯展现过程中,用户可以选择选择控制点或监控主题,点击展示按钮,生成红绿灯状态图。其中红灯表示系统活动存在问题,绿灯表示系统平台运行稳定安全。
红绿灯展现过程中主要展现以下几个功能:
实时监控:用户可以选择控制点或监控主题,选择基线,选择采样周期(周、月、年等),生成滚动的状态图,红绿灯表现当前采样的状态。
输出:屏幕拷贝,即用户可以把状态图展示结果拷贝存储,并将结果在屏幕上展示。
继续如图1所示,该运营维护系统10易于对IT系统的运营维护进行量化,运营维护及时性好,保持IT系统具有较高的可用性和稳定性。同时,通过该运营维护系统10,特别是通过业务展示模块170可以实现对指标体系的立体展示,能够实现从运维统计量到系统准实时状态的层级展开,最大限度的为IT系统的运维决策提供依据,也能为发现系统潜在问题进而持续优化提供依据。
图8所示为按照本发明一实施例的运营维护方法流程示意图。在该实施例中,其使用以上描述的运营维护系统10来实现以下步骤:
S310,生成指标体系步骤:根据运营维护目标、方针策略和/或服务流程构建指标体系,该指标体系包括多个用作第一层级指标的活动、对应各个活动的用作第二层级指标的活动节点、以及与相应活动节点相关联的控制点。该步骤通过图1所示的运营维护系统10的指标体系生成模块11完成。
S320,数据采集步骤:基于指标体系以及数据采集规则从分布式IT系统的数据库200进行数据采集。该步骤通过图1所示的运营维护系统10的数据采集模块130完成。
S330,数据分析处理步骤:将所采集的数据中与选定的控制点相关联的数据进行数据分析处理。该步骤通过图1所示的运营维护系统10的数据分析处理模块140完成。
S340,业务展示步骤:将分析处理后的数据以直观、可视化的方式展示。该步骤通过图1所示的运营维护系统10的业务展示模块170完成。
图9所示为按照本发明一实施例的生成指标体系步骤具体流程示意图。在该实施例中,步骤S310可以包括:
S311,根据运营维护目标、方针策略和/或服务流程策划指标系统的活动指标。该活动指标为指标体系的第一层级指标;步骤S311具体可以通过图1所示的指标体系策划模块110完成。
S312:对相应的活动配置活动节点并进行管理,同时对活动节点策划并配置相应的控制点。活动节点为指标体系的第二层级指标。步骤S312具体可以通过图1所示的指标配置管理模块120完成。
以上实施例的运营维护系统以及运营维护方法优选地适用于对大型分布式IT系统进行运营维护。
在本文中,将理解到,当据称将某一部件“连接”或“耦合”到另一个部件时,它可以直接连接或耦合到另一个部件或可以存在中间部件。相反,当据称将部件“直接耦合”或“直接连接”到另一个部件时,则不存在中间部件。而且,如本文使用的“连接”或“耦合”可以包括以无线方式连接或耦合。正如本文所使用的,术语“和/或”包括一个或多个相关列出的项目的任何和所有组合,并且可以缩写为“/”。
以上例子主要说明了本发明的适用于分布式IT系统的运营维护系统以及运营维护方法。尽管只对其中一些本发明的实施方式进行了描述,但是本领域普通技术人员应当了解,本发明可以在不偏离其主旨与范围内以许多其他的形式实施。因此,所展示的例子与实施方式被视为示意性的而非限制性的,在不脱离如所附各权利要求所定义的本发明精神及范围的情况下,本发明可能涵盖各种的修改与替换。

Claims (26)

1.一种分布式IT系统的运营维护系统,其特征在于,包括:
数据访问接口,其与分布式IT系统的数据库耦接,可操作地用于将数据库中存储的数据进行数据类型的转换;
指标体系生成模块,其用于根据运营维护目标、方针策略和/或服务流程构建所述运营维护系统的指标体系,所述指标体系包括多个用作第一层级指标的活动、对应各个活动的用作第二层级指标的活动节点、以及与相应活动节点相关联的控制点;
数据采集模块,其基于所述指标体系以及自身配置的数据采集规则从所述数据库进行数据采集;
数据分析处理模块,其用于将所采集的数据中与选定的所述控制点相关联的数据进行数据分析处理;
业务展示模块,其用于将分析处理后的数据以直观、可视化的方式展示;以及
子数据库,其至少用于存储从所述数据库采集的数据。
2. 如权利要求1所述的分布式IT系统的运营维护系统,其特征在于,所述指标体系生成模块包括:
指标体系策划模块,其用于根据运营维护目标、方针策略和/或服务流程策划所述指标系统的活动指标;以及
指标配置管理模块,其用于对相应的活动配置所述活动节点并进行管理,同时对所述活动节点策划并配置相应的控制点。
3. 如权利要求2所述的分布式IT系统的运营维护系统,其特征在于,所述指标体系策划模块可操作地用于进行活动创建、活动删除、活动修改、关联活动节点、活动审批和/或活动查询。
4. 如权利要求2所述的分布式IT系统的运营维护系统,其特征在于,指标配置管理模块可操作地用于进行创建活动节点、修改活动节点、删除活动节点、审批活动节点和/或关联控制点。
5. 如权利要求2所述的分布式IT系统的运营维护系统,其特征在于,指标配置管理模块可操作地用于进行新增控制点、配置控制点、修改控制点、删除控制点和/或审批控制点。
6. 如权利要求1或2所述的分布式IT系统的运营维护系统,其特征在于,所述指标体系生成模块进一步用于动态调整所述指标体系。
7. 如权利要求1或2所述的分布式IT系统的运营维护系统,其特征在于,所述指标体系生成模块进一步用于提供指标检索以及所述指标体系的展示功能。
8. 如权利要求1或2所述的分布式IT系统的运营维护系统,其特征在于,所述指标体系生成模块进一步用于对所述指标体系进行初始化。
9. 如权利要求1所述的分布式IT系统的运营维护系统,其特征在于,所述数据采集模块基于所选择的所述指标体系的控制点形成相应的采集任务表,并进一步基于该采集任务表进行所述数据采集。
10. 如权利要求1或9所述的分布式IT系统的运营维护系统,其特征在于,所述数据采集模块包括:采集规则配置子模块、采集规则显示子模块、采集规则执行子模块和采集过程记录子模块。
11. 如权利要求10所述的分布式IT系统的运营维护系统,其特征在于,所述采集规则配置子模块用于配置抽取规则名称、抽取数据源的类型、抽取后数据的具体格式、抽取规则描述信息、抽取规则关联的监控项、抽取字段及字段组合、抽取行和抽取列、抽取条件、抽取时所采用的计算公式和/或抽取执行方式。
12. 如权利要求10所述的分布式IT系统的运营维护系统,其特征在于,所述采集规则显示子模块用于按照不同条件检索所述采集规则配置子模块配置的采集规则、并显示该检索结果。
13. 如权利要求10所述的分布式IT系统的运营维护系统,其特征在于,所述采集规则执行子模块用于至少按照所述采集规则中定义的采集方式进行数据采集并采集过程和采集结果保存到相应的数据表中。
14. 如权利要求10所述的分布式IT系统的运营维护系统,其特征在于,所述采集过程记录子模块用于记录采集过程的日志、记录各时间点或时间段所执行的数据采集方式、并记录数据采集执行是否成功,以使所述数据采集模块能够实现对数据过程的检索和显示功能。
15. 如权利要求1所述的分布式IT系统的运营维护系统,其特征在于,所述分析处理后的数据包括流程数据、指标数据和结果数据,所述流程数据、指标数据和/或结果数据被直观、可视化的方式展示。
16. 如权利要求1所述的分布式IT系统的运营维护系统,其特征在于,所述数据分析处模块至少包括:
监控主题配置子模块,其用于选择监控的主题所对应的活动并通过所述指标体系查询该活动所对应的指标对象,对应的指标对象被配置在所述监控主题中并被进行权重设置;以及
基线设置子模块,其用于对所设置的监控主题对应的指标对象选择控制点、并对该控制点计算设置基线以展现数据偏离。
17. 如权利要求1所述的分布式IT系统的运营维护系统,其特征在于,所述业务展示模块包括数据链展示子模块、目标动态展示子模块、趋势图展示子模块、数据分析展示子模块和/或红绿灯展示子模块。
18. 如权利要求1所述的分布式IT系统的运营维护系统(10),其特征在于,所述分布式IT系统为大型分布式IT系统。
19. 一种使用如权利要求1所述的运营维护系统的运营维护方法,其特征在于,包括步骤:
根据运营维护目标、方针策略和/或服务流程构建指标体系,所述指标体系包括多个用作第一层级指标的活动、对应各个活动的用作第二层级指标的活动节点、以及与相应活动节点相关联的控制点;
基于所述指标体系以及数据采集规则从所述分布式IT系统的数据库进行数据采集;
将所采集的数据中与选定的所述控制点相关联的数据进行数据分析处理;以及
将分析处理后的数据以直观、可视化的方式展示。
20. 如权利要求19所述的运营维护方法,其特征在于,所述构建指标体系步骤包括:
根据运营维护目标、方针策略和/或服务流程策划所述指标系统的活动指标;或者
对相应的活动配置所述活动节点并进行管理,同时对所述活动节点策划并配置相应的控制点。
21. 如权利要求19或20所述的运营维护方法,其特征在于,所述构建指标体系步骤进一步包括:动态调整所述指标体系。
22. 如权利要求19或20所述的运营维护方法,其特征在于,所述构建指标体系步骤进一步包括:对所述指标体系进行初始化。
23. 如权利要求19所述的运营维护方法,其特征在于,所述数据采集步骤中,基于所选择的所述指标体系的控制点形成相应的采集任务表,并进一步基于该采集任务表进行所述数据采集。
24. 如权利要求19或23所述的运营维护方法,其特征在于,所述数据采集步骤包括:采集规则配置、采集规则显示、采集规则执行和采集过程记录。
25. 如权利要求19所述的运营维护方法,其特征在于,所述数据分析处理步骤包括:
配置监控主题步骤:选择监控的主题所对应的活动并通过所述指标体系查询该活动所对应的指标对象,对应的指标对象被配置在所述监控主题中并被进行权重设置;以及
基线设置步骤:对所设置的监控主题对应的指标对象选择控制点、并对该控制点计算设置基线以展现数据偏离。
26. 如权利要求19所述的运营维护方法,其特征在于,所述业务展示步骤包括数据链展示、目标动态展示、趋势图展示、数据分析展示和/或红绿灯展示。
CN201210477652.5A 2012-11-22 2012-11-22 分布式it系统的运营维护系统及运营维护管理方法 Active CN103840955B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210477652.5A CN103840955B (zh) 2012-11-22 2012-11-22 分布式it系统的运营维护系统及运营维护管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210477652.5A CN103840955B (zh) 2012-11-22 2012-11-22 分布式it系统的运营维护系统及运营维护管理方法

Publications (2)

Publication Number Publication Date
CN103840955A true CN103840955A (zh) 2014-06-04
CN103840955B CN103840955B (zh) 2017-10-03

Family

ID=50804122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210477652.5A Active CN103840955B (zh) 2012-11-22 2012-11-22 分布式it系统的运营维护系统及运营维护管理方法

Country Status (1)

Country Link
CN (1) CN103840955B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504505A (zh) * 2014-12-12 2015-04-08 北京航天新风机械设备有限责任公司 一种基于流程的数据采集系统
CN104715348A (zh) * 2015-03-18 2015-06-17 北京殷塞信息技术有限公司 综合商业智能分析方法及系统
CN105824741A (zh) * 2015-01-06 2016-08-03 上海宝信软件股份有限公司 可灵活扩展的it系统运行数据采集方法及系统
CN105988886A (zh) * 2015-04-21 2016-10-05 中国银联股份有限公司 一种运维过程中的故障处理方法及装置
CN106547848A (zh) * 2016-10-18 2017-03-29 广州酷狗计算机科技有限公司 数据存储方法及装置
CN107291565A (zh) * 2017-06-09 2017-10-24 千寻位置网络有限公司 运维可视化自动化作业平台及实现方法
CN107908691A (zh) * 2017-11-01 2018-04-13 南京欣网互联网络科技有限公司 一种大数据运营分析系统
CN108365977A (zh) * 2018-01-31 2018-08-03 佛山市聚成知识产权服务有限公司 一种互联网安全防护系统
CN108595625A (zh) * 2018-04-23 2018-09-28 平安科技(深圳)有限公司 Bi工具的运维方法、装置、计算机装置及存储介质
CN110912782A (zh) * 2019-12-17 2020-03-24 锐捷网络股份有限公司 一种数据采集方法、装置及存储介质
CN111190399A (zh) * 2019-12-30 2020-05-22 航天信息股份有限公司 一种基于关键控制点的监控系统及方法
CN112306664A (zh) * 2020-11-13 2021-02-02 苏州浪潮智能科技有限公司 一种服务重启方法、系统、设备以及介质
CN113032235A (zh) * 2021-03-31 2021-06-25 上海天旦网络科技发展有限公司 基于系统指标与命令调用日志的运维措施推荐方法及系统
CN113127556A (zh) * 2021-05-08 2021-07-16 德微电技术(深圳)有限公司 一种运营数据处理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008171057A (ja) * 2007-01-09 2008-07-24 Mitsubishi Electric Corp システム総合管理システム
CN101436274A (zh) * 2008-11-14 2009-05-20 山东浪潮齐鲁软件产业股份有限公司 跨平台监控企业应用系统性能的方法
CN101710306A (zh) * 2009-12-15 2010-05-19 中国科学院软件研究所 一种软件可信性检测方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008171057A (ja) * 2007-01-09 2008-07-24 Mitsubishi Electric Corp システム総合管理システム
CN101436274A (zh) * 2008-11-14 2009-05-20 山东浪潮齐鲁软件产业股份有限公司 跨平台监控企业应用系统性能的方法
CN101710306A (zh) * 2009-12-15 2010-05-19 中国科学院软件研究所 一种软件可信性检测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
伍福生等: "基于ITIL变更管理的系统维护流程", 《金融电子化》 *
叶飞等: "基于GRASP的软件维护过程仿真研究", 《计算机仿真》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504505A (zh) * 2014-12-12 2015-04-08 北京航天新风机械设备有限责任公司 一种基于流程的数据采集系统
CN105824741A (zh) * 2015-01-06 2016-08-03 上海宝信软件股份有限公司 可灵活扩展的it系统运行数据采集方法及系统
CN104715348A (zh) * 2015-03-18 2015-06-17 北京殷塞信息技术有限公司 综合商业智能分析方法及系统
CN104715348B (zh) * 2015-03-18 2017-11-28 北京殷塞信息技术有限公司 综合商业智能分析方法及系统
CN105988886A (zh) * 2015-04-21 2016-10-05 中国银联股份有限公司 一种运维过程中的故障处理方法及装置
CN105988886B (zh) * 2015-04-21 2018-03-16 中国银联股份有限公司 一种运维过程中的故障处理方法及装置
CN106547848A (zh) * 2016-10-18 2017-03-29 广州酷狗计算机科技有限公司 数据存储方法及装置
CN107291565A (zh) * 2017-06-09 2017-10-24 千寻位置网络有限公司 运维可视化自动化作业平台及实现方法
CN107908691A (zh) * 2017-11-01 2018-04-13 南京欣网互联网络科技有限公司 一种大数据运营分析系统
CN108365977A (zh) * 2018-01-31 2018-08-03 佛山市聚成知识产权服务有限公司 一种互联网安全防护系统
CN108595625A (zh) * 2018-04-23 2018-09-28 平安科技(深圳)有限公司 Bi工具的运维方法、装置、计算机装置及存储介质
CN110912782A (zh) * 2019-12-17 2020-03-24 锐捷网络股份有限公司 一种数据采集方法、装置及存储介质
CN111190399A (zh) * 2019-12-30 2020-05-22 航天信息股份有限公司 一种基于关键控制点的监控系统及方法
CN112306664A (zh) * 2020-11-13 2021-02-02 苏州浪潮智能科技有限公司 一种服务重启方法、系统、设备以及介质
CN112306664B (zh) * 2020-11-13 2022-07-08 苏州浪潮智能科技有限公司 一种服务重启方法、系统、设备以及介质
CN113032235A (zh) * 2021-03-31 2021-06-25 上海天旦网络科技发展有限公司 基于系统指标与命令调用日志的运维措施推荐方法及系统
CN113032235B (zh) * 2021-03-31 2022-11-04 上海天旦网络科技发展有限公司 基于系统指标与命令调用日志的运维措施推荐方法及系统
CN113127556A (zh) * 2021-05-08 2021-07-16 德微电技术(深圳)有限公司 一种运营数据处理方法及系统

Also Published As

Publication number Publication date
CN103840955B (zh) 2017-10-03

Similar Documents

Publication Publication Date Title
CN103840955A (zh) 分布式it系统的运营维护系统及运营维护管理方法
CN103888287B (zh) 信息系统一体化运维监控服务预警平台
Zeng et al. An empirical examination of benefits from implementing integrated management systems (IMS)
Seely et al. The application of a hierarchical, decision-support system to evaluate multi-objective forest management strategies: a case study in northeastern British Columbia, Canada
CN110163621A (zh) 一种电力客服大数据决策支持系统
CN110007913A (zh) 可视化的数据处理流程设置方法、装置、设备及存储介质
CN109784721B (zh) 一种就业数据分析与数据挖掘分析的平台系统
CN106021274A (zh) 一种基于大数据的人才能力评价模型系统及方法
CN106294887A (zh) 基于四维空间的对客观世界存在的物体和事件的描述方法
CN104700227A (zh) 一种县级供电企业供电所所务管理系统平台
CN106407469A (zh) 一种描述事物时间属性并基于所述描述进行查找的方法
CN103425778A (zh) 一种数据库应用系统的智能化开发平台
CN102855546A (zh) 一种综合性项目管理系统
Yang et al. The impact of organisational resilience on construction project success: Evidence from large-scale construction in China
CN102354387A (zh) 电网离散供电信息的多维平台数据挖掘方法及系统
CN113269513A (zh) 一种目标管理方法和系统
Pandey et al. GIS: scope and benefits
CN110348607A (zh) 多电力业务系统数据融合的业扩全过程一张图监控方法及系统
CN112929404A (zh) 一种校园楼宇自动化物联网系统
Tsoukanara et al. TempoGRAPHer: A Tool for Aggregating and Exploring Evolving Graphs.
To et al. Tree MIS: Caring for ecological assets in smart cities
Bets et al. Information system to support the achievements assessment of future engineers in the learning process
KR20060012572A (ko) 분산 설계 체인관리를 위한 장치 및 방법
Brandmeier et al. Development of an ontology-based competence management system
CN111625616A (zh) 一种能够海量存储的企业级的数据管理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant