CN103455865A - 一种集成运维的实现方法 - Google Patents

一种集成运维的实现方法 Download PDF

Info

Publication number
CN103455865A
CN103455865A CN2012101781292A CN201210178129A CN103455865A CN 103455865 A CN103455865 A CN 103455865A CN 2012101781292 A CN2012101781292 A CN 2012101781292A CN 201210178129 A CN201210178129 A CN 201210178129A CN 103455865 A CN103455865 A CN 103455865A
Authority
CN
China
Prior art keywords
event
services request
integrated
scheme
implementation method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101781292A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Qinzhi Digital Technology Co Ltd
Original Assignee
Chengdu Qinzhi Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Qinzhi Digital Technology Co Ltd filed Critical Chengdu Qinzhi Digital Technology Co Ltd
Priority to CN2012101781292A priority Critical patent/CN103455865A/zh
Publication of CN103455865A publication Critical patent/CN103455865A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种集成运维的实现方法,该方法基于统一的配置关系管理和统一的知识库管理,通过对事件和服务请求的初始化将请求映射到配置记录,基于配置记录将事件管理、配置管理、知识管理、值班管理、中断管理及其它ITIL核心过程集成为一体,提高了运维自动化程度和处理效率、各系统模块之间的匹配和协调性好、避免了各核心过程间的矛盾和错误,为更加丰富和全面的运维管理提供了技术支持的基础和可能。

Description

一种集成运维的实现方法
技术领域
本发明涉及IT运维领域,特别是一种集成化的运维方法。
背景技术
随着信息化建设的深入发展,IT系统日益成为支撑核心业务的关键基础设施,而IT系统的规模和精密度的不断提升,又对IT系统的运维管理活动提出了更高的要求,信息基础设施图书馆(ITIL),作为最成熟和优秀的IT系统运维管理的实践方法论之一,越发受到各类组织的重视和管理遵从,为了更好的贯彻、执行符合ITIL的管理设计,各种运维管理工具被开发出来,这些工具旨在辅助ITIL过程、提高工作流的无缝与自动化,从而利于组织对ITIL过程的接纳与融合,提高ITIL过程的效率。
然而,现有的运维管理工具的集成度低,单个管理工具只能对ITIL核心过程中的一个或几个过程进行管理,这将对整个运维活动带来诸多问题,比如在配置管理数据库的实现上,因为没有考虑集成需要,而更关注于服务器而非应用,而且基于同一管理的不同工具采用各自的简单配置数据库,这将导致配置数据不够充分和完整的问题,以及因为配置库的更新不同步而导致不同管理过程间的矛盾;又比如现有技术将知识库管理作为一个单独的管理活动,这将大大增加系统开销;又比如现有技术中,值班管理与事件管理的集成度不高,常导致关键问题出现后,领域专家无法知晓所出现的问题和解决的方案;在比如监控管理与事件管理之间的集成度不高、缺乏服务层级协议指示等导致管理者难以监督运维表现等等。
发明内容
为解决前述各方面的问题,本发明的目的在于提供一种集成运维的实现方法,可以实现基于统一的配置关系管理和统一的知识库管理而将所有ITIL核心过程的集成一体,这不仅可以实现ITIL全工作流的无缝化、自动化实现,而且操作和请求的自动化程度和处理效率进一步提高、各系统模块之间的匹配和协调性好、避免了各核心过程间的矛盾和错误,为更加丰富和全面的运维管理提供了技术支持的基础和可能。
为实现本发明的目的,本集成运维的实现方法包括如下步骤:
a. 对事件和服务请求进行初始化;
b. 对与事件和服务请求相关联的中断进行检查;
c. 将事件和服务请求分配给值班表中可用的运维人员;
d. 执行事件和服务请求所匹配的解决方案。
进一步的,本集成运维的实现方法所述的对事件和服务请求进行初始化包括如下步骤:
a. 选择事件和服务请求相匹配的关键参数;具体包括:应用名称、版本号、部署ID号、工单类型;
b. 基于所选择的事件和服务请求的关键参数在配置数据库中映射出若干配置记录;所述配置记录包含如下数据:队列、SLA协议、工单类型映射、领域专家。
该初始化过程将建立与该事件和请求相适应的相符的工单。
进一步的,本集成运维的实现方法所述对事件和服务请求相关联的中断进行检查包括:
a. 当事件和服务请求有关联中断被指示的时候,显示该中断;
b. 当事件和服务请求没有关联中断被指示的时候,根据需要创建若干中断;
c. 将中断与事件和服务请求相映射。
当根据需要创建了若干中断时,还包括将中断通知发送给应用用户的步骤。
所述对与事件和服务请求相关联的中断进行检查还包括:对事件和服务请求计算SLA值的步骤,对事件和服务请求计算SLA值后,将基于该SLA值生成一系列报告。
进一步的,本集成运维的实现方法所述将事件和服务请求分配给值班表中可用的运维人员包括如下步骤:
a. 将可用的运维人员定位到值班表中;
b. 基于配置记录将值班人员进行显示,该配置记录是在事件和服务请求初始化过程中基于事件和服务请求的匹配参数在配置关系数据库中所映射的若干配置记录。
进一步的,本集成运维的实现方法所述执行事件和服务请求所匹配的解决方案包括如下步骤:
a.如果知识库中有相应的方案,则根据对事件和服务请求进行初始化时所选择的与事件和服务请求相匹配的参数将该方案检索出来;
b.对检索所得方案进行显示;
c.对所显示的方案进行选择,确定最合适的方案;
d.如果知识库里没有现成的方案,则由为该事件和服务请求分配的运维人员创建一系列方案。
所述对知识库中的既有方案进行检索包含有自动检索步骤,根据配置记录自动检索相关方案。
所述对知识库中的既有方案进行检索包含由应用用户基于关键词手动检索既有方案的步骤。
所述用户创建新方案包括如下步骤:
a. 领域专家对新方案进行审查;
b. 当领域专家批准该新方案时,对该方案进行发布;
c. 当领域专家驳回该新方案时,仅对该方案进行标注。
当新方案中存在一系列脚本的时候,无需通过服务器上的代理而执行该脚本。
进一步的,本集成运维的实现方法还包括步骤:基于检查列表,执行一系列检查以关闭事件和服务请求。
该关闭步骤还可以包括对知识库进行升级更新。
本发明中所述配置数据库基于应用而非基于服务器,该配置数据库是元数据数据库。配置数据库存储配置记录CI从而将其它ITIL核心过程紧密集成在一起,配置记录CI分为应用、版本和部署的三层,应用层将关于应用和应用内容的信息按字段进行存储;版本层存放版本信息,如版本号、部署提供商、依赖关系、技术等;部署层存放部署信息,如服务器信息、数据库信息、维护窗口等。
值班人员创设的解决方案均需通过领域专家审查,如果专家批准,则发布该解决方案,否则,对该方案进行标注。
本发明所述知识库依据KCS过程的原则建立,关注于解决问题的知识。作为技术支持组织的核心,KCS是一种方法和一组关注于知识的过程。在使用过程中,如果方案已经在知识库中,则直接检索出来,否则,将运维人员创建的方案更新入知识库,这将提高今后的方案提供效率。
 采用本发明所述一种集成运维的实现方法,可实现基于统一的配置关系管理和统一的知识库管理而将所有ITIL核心过程的集成一体,事件管理、值班管理、中断管理及其它管理过程均被集成在知识管理和配置管理之上,提高了ITIL管理过程的可用性及效率,克服了传统分离ITIL管理工具在使用过程中的各种局限。
附图说明
 图1为本发明的总体流程示意图;
图2为本发明的请求初始化流程图;
图3为本发明的中断检查流程图;
图4为本发明对请求进行分配的流程图;
图5为本发明的请求解决流程图。
具体实施方式
依据本发明提供的集成运维实现方法,所述配置数据库基于应用而非基于服务器,采用元数据数据库。配置数据库存储配置记录从而将其它ITIL核心过程紧密集成在一起,配置记录分别应用、版本和部署的三层,应用层将关于应用和应用内容的信息按字段进行存储;版本层存放版本信息,如版本号、开发提供商、依赖关系、技术特点等;部署层存放部署信息,如服务器信息、数据库信息、维护窗口等。所述知识库集成在采用本发明方法的系统当中,该知识库依据KCS过程的原则建立,关注于解决问题的知识。作为技术支持组织的核心,KCS是一种方法和一组关注于知识的过程。在使用过程中,如果方案已经在知识库中,则直接检索出来,否则,将运维人员创建的方案更新入知识库,这将提高今后的方案提供效率。整个工作流程为:首先对请求进行初始化,并对与事件和服务请求相关联的中断进行检查;然后将请求分配给值班表中的运维人员,由其寻找合适的解决方案;如果适于该请求的方案在知识库中已经存在,则由运维人员实施之,如果知识库中没有合适的解决方案,则运维人员创建新的解决方案;该新方案随后被领域专家审查,进而发布或标注;在依据检查列表进行一系列检查之后关闭该请求。
 如图1和图2所示,在步骤101中,事件和服务请求被初始化,在步骤201中,与请求相关的关键参数被选择出来,该关键参数包括应用名称、版本号、部署ID号、工单种类,用户必须对前述参数进行选择,从而对事件和服务请求按照系统的预定规则进行清楚、全面的描述,这是与系统进行交互、由系统组织提供全套运维指导的基础,在步骤202中,根据所选择的关键参数在配置关系数据中映射出相应的配置记录CI,配置记录CI中包含但不限于队列、服务层级协议、工单类型映射、领域专家。在后续的关键过程中,事件和服务请求将通过配置记录CI中的队列与值班表中的可用值班人员进行关联,实现轮班制的人员管理;与服务和应用相应的中断也通过配置记录CI进行管理,事件和服务请求通过与配置记录CI的映射,而实现与中断的关联管理;服务请求的优先级排序将根据配置记录CI中的服务层级协议计算所得的SLA值进行,且相应的报告生成也依据该SLA值;对应某事件和服务请求的工单生成也更具配置记录CI进行;新建方案的审批人员也依据配置记录CI自动确定;针对请求的建议解决方案也通过配置记录CI确定并提供;为关闭请求而在基本操作和处理之外的配套运维活动也根据配置记录CI得以确认和安排。由此可见在初始化过程中、根据用户所选择的关键参数所映射的基于应用的配置记录,是围绕事件和服务请求进行各项ITIL关键步骤的核心。
如图1和图3所示,在步骤102中,一旦请求被初始化之后,将在步骤301中检查与该请求相关的中断是否已经被引起,当服务或应用未能完成其主要功能的时候,中断被自动引起,当用户试图初始化一个该中断所对应的应用的事件和服务请求的时候,该中断被追踪以提醒用户,如果该中断存在,则在步骤302中进行显示,如果不存在,则根据步骤303的判断,如需要,则在步骤304中进行创建,如果创建了中断,还应该向所有用户进行通知,当中断被创建、更新、关闭的时候,均发送中断通知,随后,在步骤305中,被显示或创建的中断将被映射,进而关联到到事件和服务请求上。此外,在中断检查环节,在步骤306中,将根据事件和服务请求的配置记录CI计算SLA值,并在步骤307基于该计算值产生一些列报告,包括但不限于SLA报告、表现报告、值班报告、可用性报告、脚本报告等,这些报告常供给主管审阅。
如图1和图4所示,在步骤103中,事件和服务请求被分配给值班表中可用的运维人员,值班表按时间段对可用人员进行管理,以保证随时有运维人员待命,后续针对请求的解决方案需要由所分配的运维人员进行确定,在步骤401中,可用的运维人员被分配到值班表中,在步骤402中,值班表中的运维人员将通过事件和服务请求初始化时候所映射的配置记录得以分配和显示,例如,与事件和服务请求相映射的每一条配置记录CI在配置数据库中与队列相映射,而运维人员通过值班表也映射到队列,从而,只要请求未关闭,轮班的运维人员可以基于该配置记录自动分配到各条请求,而请求的管理和处理将不受运维人员轮班活动的影响。
如图1和图5所示,在步骤104中,与请求匹配的解决方案得到确认或创建、并得以实施,该解决方案可以是从知识库中检索出来的既有方案,也可以是由运维人员创建的新方案,在步骤501中根据配置记录CI对知识库中的方案进行过滤和汇集,如果知识库中存在既有方案,则将解决方案检索出来,该检索可以是自动检索,也可以是用户通过关键词进行的手动检索。不仅知识库中获得的解决方案基于与请求相对应的配置记录产生,而且在后续的环节中将新增方案更新至知识库,这将帮助减少对于相似问题的重复工作、加快处理过程。检索所得的解决方案在步骤502中得到显示,运维人员在步骤503中选择最合适的一个加以执行。在步骤501中,如果知识库中没有既有方案,则由运维人员在步骤504中创建新方案,所有新增方案必须经过领域专家的审批,步骤505中,由领域专家对新方案进行审查,专家和技术列表保存在配置数据库中,它们基于配置记录与事件和服务请求相映射,在步骤506中,检查新方案的审批情况,被批准的方案在步骤508中被发布,被驳回的方案在步骤507中被标注,对方案进行标注的方案将便于从知识库中过滤无关信息。在步骤509中,将检查方案中是否存在可执行的脚本,这些包括但不限于如SHELL脚本、批处理脚本等。方案基于配置记录CI与事件和服务请求相映射,而脚本将与方案相映射,甲苯在服务器的远端得以执行,并不需要在服务器上安装代理。
如图1所示,在步骤105中,基于配置记录对事件和服务请求的处理情况进行检查,从而关闭请求,在检查环节需要进行的操作和处理根据配置记录CI得以确定,当运维系统集成到监控系统的时候,可以实现对事件请求的自动关闭,例如,当一个服务器宕机的时候,一个事件请求根据监控系统的告警而创建,该事件请求基于配置记录与解决方案相映射,该配置记录是由监控系统的告警得以关联的,解决方案包括一个服务器的远端启动脚本,在该脚本执行之后,该事件即可自动关闭。
综上,本方法基于统一的配置关系管理和统一的知识库管理,通过对事件和服务请求的初始化而将请求映射到配置记录,基于该配置记录将事件管理、配置管理、知识管理、值班管理、中断管理及其它ITIL核心过程集成为一体,提高了运维自动化程度和处理效率、各系统模块之间的匹配和协调性好、避免了各核心过程间的矛盾和错误,为更加丰富和全面的运维管理提供了技术支持的基础和可能。

Claims (10)

1.一种集成运维的实现方法,其特征在于:该方法包括如下步骤:
a. 对事件和服务请求进行初始化;选择事件和服务请求相匹配的关键参数;基于所选择的事件和服务请求的关键参数在配置数据库中映射出若干配置记录;
b. 对与事件和服务请求相关联的中断进行检查;当事件和服务请求有关联中断被指示的时候,显示该中断;当事件和服务请求没有关联中断被指示的时候,根据需要创建若干中断;将中断与事件和服务请求相映射;
c. 将事件和服务请求分配给值班表中可用的运维人员;将可用的运维人员定位到值班表中;基于配置记录将值班人员进行显示,该配置记录是在事件和服务请求初始化过程中基于事件和服务请求的匹配参数在配置关系数据库中所映射的若干配置记录;
d. 执行事件和服务请求所匹配的解决方案。
2. 根据权利要求1所述集成运维的实现方法,其特征在于:所述选择与事件与服务请求相匹配的关键参数,具体包括:应用名称、版本号、部署ID号、工单类型。
3. 根据权利要求1所述集成运维的实现方法,其特征在于:所述配置记录包含如下数据:队列、SLA协议、工单类型映射、领域专家。
4. 根据权利要求1所述集成运维的实现方法,其特征在于:当根据需要创建了若干中断时,还包括将中断通知发送给应用用户的步骤。
5. 根据权利要求1所述集成运维的实现方法,其特征在于:在对中断进行检查的过程中,还包括:对事件和服务请求计算SLA值的步骤。
6.根据权利要求1所述集成运维的实现方法,其特征在于:所述执行事件和服务请求所匹配的解决方案包括如下步骤:
a.如果知识库中有相应的方案,则根据对事件和服务请求进行初始化时所选择的与事件和服务请求相匹配的参数将该方案检索出来;
b.对检索所得方案进行显示;
c.对所显示的方案进行选择,确定最合适的方案;
d.如果知识库里没有现成的方案,则由为该事件和服务请求分配的运维人员创建一系列方案。
7.根据权利要求6所述集成运维的实现方法,其特征在于:所述对知识库中的既有方案进行检索包含有自动检索步骤,根据配置记录自动检索相关方案。
8.根据权利要求6所述集成运维的实现方法,其特征在于:所述对知识库中的既有方案进行检索包含由应用用户基于关键词手动检索既有方案的步骤。
9.根据权利要求6所述集成运维的实现方法,其特征在于:所述用户创建新方案包括如下步骤:
a. 领域专家对新方案进行审查;
b. 当领域专家批准该新方案时,对该方案进行发布;
c. 当领域专家驳回该新方案时,仅对该方案进行标注。
10. 根据权利要求1所述集成运维的实现方法,其特征在于:该集成运维的实现方法还包括步骤:基于检查列表,执行一系列检查以关闭事件和服务请求。
CN2012101781292A 2012-06-01 2012-06-01 一种集成运维的实现方法 Pending CN103455865A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101781292A CN103455865A (zh) 2012-06-01 2012-06-01 一种集成运维的实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101781292A CN103455865A (zh) 2012-06-01 2012-06-01 一种集成运维的实现方法

Publications (1)

Publication Number Publication Date
CN103455865A true CN103455865A (zh) 2013-12-18

Family

ID=49738203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101781292A Pending CN103455865A (zh) 2012-06-01 2012-06-01 一种集成运维的实现方法

Country Status (1)

Country Link
CN (1) CN103455865A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105988886A (zh) * 2015-04-21 2016-10-05 中国银联股份有限公司 一种运维过程中的故障处理方法及装置
CN110968598A (zh) * 2018-09-29 2020-04-07 北京京东尚科信息技术有限公司 数据请求管理方法、系统及装置
CN111027837A (zh) * 2019-12-03 2020-04-17 携程旅游信息技术(上海)有限公司 预新增国际航线的参考航线确定方法、系统、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002259511A (ja) * 2001-03-06 2002-09-13 Toshiba Corp 上下水道運転管理システム
CN101901399A (zh) * 2009-05-27 2010-12-01 北京正辰科技发展有限责任公司 运维管理平台
CN101964081A (zh) * 2010-09-13 2011-02-02 中国恩菲工程技术有限公司 基于工厂管理基础架构平台的生产信息系统
CN102222278A (zh) * 2011-06-10 2011-10-19 成都勤智数码科技有限公司 一种运维流程定制的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002259511A (ja) * 2001-03-06 2002-09-13 Toshiba Corp 上下水道運転管理システム
CN101901399A (zh) * 2009-05-27 2010-12-01 北京正辰科技发展有限责任公司 运维管理平台
CN101964081A (zh) * 2010-09-13 2011-02-02 中国恩菲工程技术有限公司 基于工厂管理基础架构平台的生产信息系统
CN102222278A (zh) * 2011-06-10 2011-10-19 成都勤智数码科技有限公司 一种运维流程定制的方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105988886A (zh) * 2015-04-21 2016-10-05 中国银联股份有限公司 一种运维过程中的故障处理方法及装置
CN105988886B (zh) * 2015-04-21 2018-03-16 中国银联股份有限公司 一种运维过程中的故障处理方法及装置
CN110968598A (zh) * 2018-09-29 2020-04-07 北京京东尚科信息技术有限公司 数据请求管理方法、系统及装置
CN111027837A (zh) * 2019-12-03 2020-04-17 携程旅游信息技术(上海)有限公司 预新增国际航线的参考航线确定方法、系统、设备及介质
CN111027837B (zh) * 2019-12-03 2024-02-13 携程旅游信息技术(上海)有限公司 预新增国际航线的参考航线确定方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
CN110245035A (zh) 一种链路跟踪方法及装置
CN108512689A (zh) 微服务业务监控方法及服务器
CN107810500A (zh) 数据质量分析
US8112657B2 (en) Method, computer, and computer program product for hardware mapping
US20080215389A1 (en) Model oriented business process monitoring
CN108039959A (zh) 一种数据的态势感知方法、系统及相关装置
CN104036365A (zh) 一种企业级数据服务平台建设方法
CN110990391A (zh) 多源异构数据的整合方法、系统、计算机设备及存储介质
US20120259865A1 (en) Automated correlation discovery for semi-structured processes
US9400637B1 (en) Solution modeling and analysis toolset for enterprise software architecture
CN110688538B (zh) 基于大数据的跨域业务全程路由贯穿方法以及装置
CN104216948A (zh) 一种数据模型的差异控制方法
CN102609789A (zh) 图书馆信息监控与异常预测系统
CN113179173A (zh) 一种用于高速公路系统的运维监控系统
Bhowmick et al. Ibm intelligent operations center for smarter cities administration guide
CN113094385A (zh) 一种基于软件定义开放工具集的数据共享融合平台及方法
CN106874114A (zh) 快递业务管理软件系统
CN103455864A (zh) 基于统一配置库和知识库的集成化运维管理平台
CN114756563A (zh) 一种互联网多种复杂业务线并存的数据治理系统
CN103455865A (zh) 一种集成运维的实现方法
CN111538720A (zh) 电力行业基础数据清理的方法及系统
CN114066217A (zh) 构建面向业务的企业it运营与服务体系方法、系统及设备
CN116136801B (zh) 云平台的数据处理方法、装置、电子设备及存储介质
CN113706101B (zh) 电网项目管理智能系统架构及方法
CN115048413B (zh) 一种业务域数据的管理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20131218

WD01 Invention patent application deemed withdrawn after publication