CN108847953A - 一种运维服务系统及方法 - Google Patents

一种运维服务系统及方法 Download PDF

Info

Publication number
CN108847953A
CN108847953A CN201810381647.1A CN201810381647A CN108847953A CN 108847953 A CN108847953 A CN 108847953A CN 201810381647 A CN201810381647 A CN 201810381647A CN 108847953 A CN108847953 A CN 108847953A
Authority
CN
China
Prior art keywords
module
service
event
line
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810381647.1A
Other languages
English (en)
Inventor
王培鑫
梁进中
许克浩
朱杭烽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Zhisheng New Information Technology Co Ltd
Original Assignee
Hefei Zhisheng New Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Zhisheng New Information Technology Co Ltd filed Critical Hefei Zhisheng New Information Technology Co Ltd
Priority to CN201810381647.1A priority Critical patent/CN108847953A/zh
Publication of CN108847953A publication Critical patent/CN108847953A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance or administration or management of packet switching networks
    • H04L41/06Arrangements for maintenance or administration or management of packet switching networks involving management of faults or events or alarms
    • H04L41/0631Alarm or event or notifications correlation; Root cause analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance or administration or management of packet switching networks
    • H04L41/06Arrangements for maintenance or administration or management of packet switching networks involving management of faults or events or alarms
    • H04L41/0654Network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance or administration or management of packet switching networks
    • H04L41/06Arrangements for maintenance or administration or management of packet switching networks involving management of faults or events or alarms
    • H04L41/069Arrangements for maintenance or administration or management of packet switching networks involving management of faults or events or alarms involving storage or log of alarms or notifications or post-processing thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance or administration or management of packet switching networks
    • H04L41/50Network service management, i.e. ensuring proper service fulfillment according to an agreement or contract between two parties, e.g. between an IT-provider and a customer
    • H04L41/5003Managing service level agreement [SLA] or interaction between SLA and quality of service [QoS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance or administration or management of packet switching networks
    • H04L41/50Network service management, i.e. ensuring proper service fulfillment according to an agreement or contract between two parties, e.g. between an IT-provider and a customer
    • H04L41/5003Managing service level agreement [SLA] or interaction between SLA and quality of service [QoS]
    • H04L41/5009Determining service level performance, e.g. measuring SLA quality parameters, determining contract or guarantee violations, response time or mean time between failure [MTBF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00Arrangements for user-to-user messaging in packet-switching networks, e.g. e-mail or instant messages
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Real-time or near real-time messaging, e.g. instant messaging [IM] interacting with other applications or services

Abstract

本发明公开了一种运维服务系统及方法,属于运维管理技术领域,包括与一线驻点客户端连接的综合管理系统;一线驻点客户端布置在用户办公现场,一线驻点客户端根据综合管理系统发送的运维服务内容及响应时间对现场运维事件进行处理;在一线驻点客户端无法解决现场运维事件时,综合管理系统指派二线技术支持团队至现场对运维任务进行处理;综合管理系统包括存储器,以及分别与所述存储器连接的运维模块、运维指标可视化模块、运维监控模块和云服务平台。通过采用一线驻点+二线技术支持的运维团队,可快速响应并解决问题。

Description

一种运维服务系统及方法
技术领域
[0001] 本发明涉及运维管理技术领域,特别涉及一种运维服务系统及方法。
背景技术
[0002] 随着信息化的快速发展,信息化项目越来越多,各种应用系统急速增长,给系统维 护人员带来了巨大的挑战,主要挑战表现为:维护人员数量少与需要维护的系统日益增多 的矛盾;维护人员的专业性不强,已不能满足系统维护的需要;系统种类繁多,经常是发生 故障后再进行处理,缺乏统一监管,提前发现故障问题的机制。因此,客户对运维服务的需 求越来越迫切。
发明内容
[0003] 本发明的目的在于提供一种运维服务系统及方法,以满足快速发展的应用系统的 运维需求。
[0004] 为实现以上目的,本发明采用的技术方案为: 采用一种运维服务系统,包括:一线驻点客户端以及综合管理系统,一线驻点客户端通 过服务器分别与综合管理系统连接; 所述一线驻点客户端布置在用户办公现场,一线驻点客户端根据综合管理系统发送的 运维服务内容及响应时间对现场运维事件进行处理; 在一线驻点客户端无法解决现场运维事件时,综合管理系统指派二线技术支持团队至 现场对运维任务进行处理; 其中,综合管理系统包括存储器,以及分别与所述存储器连接的运维模块、运维指标可 视化模块、运维监控模块和云服务平台; 存储器存储有若干运维指令,该若干运维指令适用于运维模块、运维指标可视化模块、 运维预警模块和云服务平台加载并执行; 运维模块与所述一线驻点客户端连接,并接收一线驻点客户端的请求产生运维服务内 容及响应时间; 运维指标可视化模块与所述一线驻点客户端连接,以对一线驻点客户端对运维事件的 处理进度进行追踪记录,得到处理结果; 运维监控模块与所述运维模块连接,运维监控模块将Zabbix中的报警事件自动同步至 运维模块中生成运维事件,发送至一线驻点客户端进行跟踪处理; 云服务平台与所述运维指标可视化模块连接,对售后服务进行跟踪记录。
[0005] 优选地,所述运维指标可视化模块包括进度跟踪单元、整理单元以及显示单元; 进度跟踪单元与所述运维模块连接,以对所述运维模块对于屋内事件的处理进度、过 程以及结果进行跟进,并进行回访; 整理单元与所述进度跟踪单元连接,整理单元根据设定的时间节点对某时间段内的运 维事件处理结果进行统计汇总; 显不单元与所述整理单元连接,以将运维事件处理结果的统计汇总结果进行显示。 [0006]优选地,所述运维监控模块包括监控单元和预警单元; 监控单元与预警单元连接,监控单元用于对运维对象进行监控并在运维对象发生故障 时生成预警事件发送至预警单元; 预警单元与所述运维模块连接,预警单元将预警事件同步至所述运维模块,生成运维 事件。
[0007]优选地,所述云服务平台售后跟踪单元和线上服务单元; 跟踪单元用于对用户的售后服务进行跟踪; 线上服务单元用于供用户及运维工程师进行注册,并支持线上问题咨询、技术支持、线 上交易、线下网络割接。
[0008]优选地,所述综合管理系统还包括知识库体系; 所述知识库体系用于对运维事件的常见故障、典型故障进行收集归类,并对每类故障 提供相应的解决方案以供用户查找。
[0009]优选地,所述系统还包括即时通讯设备,该即时通讯设备包括事件管理模块、请求 管理模块、知识问答模块以及售后反馈模块; 事件管理模块用于对用户提交的运维事件的进展进行跟踪管理; 请求管理模块用于提交运维事件处理请求以及对运维事件的处理进程进行查询; 知识问答模块用于根据用户请求,提供常见故障类型及对应的解决策略; 售后反馈模块用于将用户提交的售后反馈意见发送至所述综合管理系统。
[0010]优选地,所述综合管理系统还包括定期巡检模块,该定期巡检模块用于定期对核 心设备及业务系统进行巡检。 优选地,所述运维模块按照设定的安全运维规范进行运维; 所述安全运维规范包括网络设备配置规范、安全设备配置规范、服务器安全配置规范、 数据备份规范、密码保存规范以及协议保密。
[0012] 优选地,所述运维模块包括基础环境运维模块、硬件运维服务模块、软件运维服务 模块以及特色运维服务模块; 基础环境运维服务程序模块用于进行系统基础环境的运维; 硬件运维服务模块用于进行系统中硬件运维服务; 软件运维服务模块用于进行系统中软件运维服务; 特色运维服务模块用于进行系统中特色运维服务。
[0013] 另一方面,采用一种运维服务方法,包括: 通过一线驻点客户端向综合管理系统发送运维事件信息; 一线驻点客户端根据综合管理系统返回的运维内容及响应时间对运维事件进行处理; 在一线驻点客户端无法解决一线驻点处提出的技术问题时,向综合管理系统发送二线 技术支持请求; 所述综合管理系统用于: 根据接收的二线技术支持请求,指派二线技术支持团队进行运维事件处理; 实时跟踪记录运维事件的处理进度,并对运维过程及结果进行考核; 对运维对象进行监控,并将预警事件生成运维事件进行运维处理; 定期对核心设备及业务系统进行巡检; 对用户发出的处理请求进行在线解答。
[0014]与现有技术相比,本发明存在以下技术效果:本发明采用的运维服务系统采用二 级架构:一线驻点团队和二线技术支持。其中一线驻点团队根据运维服务的内容以及响应 时间,在客户现场办公,快速进行故障处理;同时提供具有较高水平的故障分析能力以及丰 富的实践经验的二线服务团队,做为流动技术支持,当进行重大问题处理或网络改造割接 时,二线服务团队在现场为用户提供技术协助和人员协助,可快速响应问题并及时解决。该 运维服务范围包括基础环境运维、硬件运维服务、软件运维服务、机房搬迁、备品备件服务, 运维范围和内容覆盖全面。通过ITSS运维系统进行运维考核,实现运维结果的可视化。通过 一线驻点团队客户现场办公,贴心服务,能够第一时间发现潜在需求或项目信息,反推公司 集成类项目快速增长。
附图说明
[0015] 下面结合附图,对本发明的具体实施方式进行详细描述: 图1是一种运维服务系统的结构示意图; 图2是运维模块的结构示意图; 图3—种运维服务流程图。
具体实施方式
[0016] 为了更进一步说明本发明的特征,请参阅以下有关本发明的详细说明与附图。所 附图仅供参考与说明之用,并非用来对本发明的保护范围加以限制。
[0017]如图1所示,本实施例公开了一种运维服务系统,包括:一线驻点客户端20以及综 合管理系统10,一线驻点客户端20与综合管理系统10连接; 所述一线驻点客户端20布置在用户办公现场,一线驻点客户端20根据综合管理系统10 发送的运维服务内容及响应时间对现场运维事件进行处理; 在一线驻点客户端20无法解决现场运维事件时,综合管理系统指派二线技术支持团队 至现场对运维任务进行处理; 其中,综合管理系统10包括存储器11,以及分别与所述存储器11连接的运维模块12、运 维指标可视化模块13、运维监控模块14和云服务平台15; 存储器11存储有若干运维指令,该若干运维指令适用于运维模块12、运维指标可视化 模块13、运维预警模块和云服务平台加载并执行; 运维模块12与所述一线驻点客户端20连接,并接收一线驻点客户端2〇的请求产生运维 服务内容及响应时间; 运维指标可视化模块13与所述一线驻点客户端连接,以对一线驻点客户端对运维事件 的处理进度进行追踪记录,得到处理结果; 运维监控模块14与所述运维模块12连接,运维监控模块14将Zabbix中的报警事件自动 同步至运维模块12中生成运维事件,发送至一线驻点客户端2〇进行跟踪处理; 云服务平台15与所述运维指标可视化模块13连接,对售后服务进行跟踪记录。
[0018]需要说明的是,本方案采用一线驻点团队和二线技术支持结合,其中一线驻点团 队根据运维服务的内容以及响应时间,在客户现场办公,快速进行故障处理;同时提供具有 较高水平的故障分析能力以及丰富的实践经验的二线服务团队,做为流动技术支持,当进 行重大问题处理或网络改造割接时,二线服务团队在现场为用户提供技术协助和人员协 助。
[0019] 在实际操作中,也可制定完善的培训课程,对服务单位人员进行二次培训,项目实 战后,从服务单位人员中选出一些人员作为运维的一线驻点或二线技术支持。
[0020] 作为进一步优选的方案,运维指标可视化模块13包括进度跟踪单元、整理单元以 及显示单元; 进度跟踪单元与所述运维模块12连接,以对所述运维模块12对于屋内事件的处理进 度、过程以及结果进行跟进,并进行回访; 整理单元与所述进度跟踪单元连接,整理单元根据设定的时间节点对某时间段内的运 维事件处理结果进行统计汇总; 显不单兀与所述整理单元连接,以将运维事件处理结果的统计汇总结果进行显示。
[0021 ]需要说明的是,该运维指标可视化模块13能够持跟进运维事件的处理进度、过程、 结果、回访,可以周、月、季度、年为单位,对单位时间内整体故障处理的及时率、解决率、满 意率等SLA考核项进行统计汇总,直观展示的单位时间内运维工作整体情况。
[0022]作为进一步优选的方案,运维监控模块14包括监控单元和预警单元; 监控单元与预警单元连接,监控单元用于对运维对象进行监控并在运维对象发生故障 时生成预警事件发送至预警单元; 预警单元与所述运维模块12连接,预警单元将预警事件同步至所述运维模块12,生成 运维事件。
[0023]需要说明的是,本方案在自动化运维监控软件Zabbix的基础上进行二次开发,利 用Zfbbix强大的监控功能对运维对象进行监控,同时将报警机制与综合运维服务管理系统 进行对接,将Zabbix中的报警事件自动同步综合运维服务管理系统中生成事件,以进行跟 踪和处理。
[0024]作为进一步优选的方案,云服务平台15售后跟踪单元和线上服务单元; 跟踪单元用于对用户的售后服务进行跟踪; 线上服务单元用于供用户及运维工程师进行注册,并支持线上问题咨询、技术支持、线 上交易、线下网络割接。
[0025]需要说明的是,前期利用该云服务平台15对客户的售后服务进行跟踪,保证售后 的及时可靠。后期可将该云服务平台15对外开放,业界工程师进行注册,对服务单位的运维 故障问题进行解答,该云服务平台15可支持线上问题咨询、技术支持、线上交易、线下网络 割接等,以充分整合资源,实现资源共享最大化。
[0026]作为进一步优选的方案,综合管理系统10还包括知识库体系; 所述知识库体系用于对运维事件的常见故障、典型故障进行收集归类,并对每类故障 提供相应的解决方案以供用户查找。
[0027]需要说明的是,本实施例中在综合运维管理系统中设置知识库模板,对日常运维 中遇到的常见故障、典型故障等进行收集归类,形成丰富的知识库,加快故障问题处理以及 后备员工的学习参考。
[0028]作为进一步优选的方案,所述系统还包括即时通讯设备,该即时通讯设备包括事 件管理模块、请求管理模块、知识问答模块以及售后反馈模块; 事件管理模块用于对用户提交的运维事件的进展进行跟踪管理; 请求管理模块用于提交运维事件处理请求以及对运维事件的处理进程进行查询; 知识问答模块用于根据用户请求,提供常见故障类型及对应的解决策略; 售后反馈模块用于将用户提交的售后反馈意见发送至所述综合管理系统10。
[0029]需要说明的是,本实施例中的即时通讯设备包括电话、微信、综合运维系统、QQ群 等多样化的故障报修方式,通过充分利用当下流行的即时通讯工具,最大限度的降低客户 报修难的问题。
[0030]作为进一步优选的方案,综合管理系统10还包括定期巡检模块,该定期巡检模块 用于定期对核心设备及业务系统进行巡检。本实施例中除使用监控系统对设备进行监控 夕卜,还引入了日检、周报、月报、年报等巡检制度,对核心设备和业务系统实现全面的“人工+ 系统”的双重巡检,解决人工和系统单一巡检的弊端。
[0031] 作为进一步优选的方案,运维模块12按照设定的安全运维规范进行运维; 所述安全运维规范包括网络设备配置规范、安全设备配置规范、服务器安全配置规范、 数据备份规范、密码保存规范以及协议保密。
[0032] 本实施例中的安全运维规范包括:保密协议:与客户签订保密协议,保障客户信息 安全,消除客户顾虑;网络设备配置规范:制定了八大配置规范,充分保护网络设备安全;安 全设备配置规范:制定了七大安全设备配置规范,进一步保护安全设备;服务器安全配置规 范:制定了六大服务器安全配置规范,保护服务器安全;数据备份规范:制定了数据备份规 范,对重要业务系统数据进行备份;密码保存规范:制定了密码保存规范,防止密码泄露带 来的隐患。
[0033]作为进一步优选的方案,如图2所示,运维模块12包括基础环境运维模块121、硬件 运维服务模块122、软件运维服务模块123以及特色运维服务模块124; 基础环境运维模块121用于进行系统基础环境的运维; 硬件运维服务模块122用于进行系统中硬件运维服务; 软件运维服务模块123用于进行系统中软件运维服务; 特色运维服务模块124用于进行系统中特色运维服务。
[0034] 其中: 特色运维服务模块124包括机房搬迁服务程序单元和备品备件服务程序单元;所述机 房搬迁服务程序单元和备品备件服务程序单元分别与所述存储器11连接。其中: 所述机房搬迀服务程序单元用于加载所述存储器11中与机房搬迁相关程序以对机房 搬迁方案进行设计、搭建机房环境、部署线路线缆、数据备份、正常关闭业务系统;以及拆 卸、运输、安装设备或系统,开启业务系统,检查业务系统正常,机房搬迁报告。
[0035] 所述备品备件服务程序单元用于加载所述存储器11中与备品备份服务相关程序 以提供网络设备、安全设备、主机设备、存储设备等硬件备品备件,并提供备品备件的安装 替换服务;提供网络设备、安全设备、主机设备、存储设备等硬件原厂维保。
[0036] 进一步地,基础环境运维模块121包括分别与所述存储器11连接的电力系统运维 服务程序单元、消防系统运维服务程序单元、空调系统运维服务程序单元以及基础环境专 项运维服务程序单元。其中: _ 电力系统运维服务程序单元用于加载所述存储器11中电力系统运维服务相关程序指 令以按约定周期定期对机房的电力系统的状态进行检查、监控以及故障处理。具体为: 日常检查:电力系统运行参数检查;电力系统各部件健康检查;检查并记录电力负载; 电力系统卫生检查;检查记录、数据的备份。
[0037] 日常故障处理:电力系统故障分析;电力系统故障的排除与恢复;故障硬件设备报 修、送修(联络第三方厂商)。
[0038] 定期巡检服务:测量并记录输入输出电压电流;线缆及接头牢固检查;线缆及接头 老化情况检查;电池放电检查。
[0039] 实时监控:机房电力系统监控。
[0040]优化服务:机房动力配电优化;UPS负载优化;机柜供电系统优化等服务内容。
[0041]消防系统运维服务程序单元用于加载所述存储器11中消防系统运维服务相关程 序指令以按约定周期定期对机房的消防系统运行状态进行检查、监控以及故障处理。具体 为: 曰常检查:消防系统的灭火剂瓶组、泄压口、烟感探测器、温感探测器、消防主机、消防 报警系统、紧急启停按钮、气密性的日常状态检查,运行状态记录。
[0042]日常故障处理:消防系统的灭火剂瓶组、泄压口、烟感探测器、温感探测器、消防主 机、消防报警系统、紧急启停按钮、气密性的故障分析;故障的排除与恢复;故障硬件设备报 修、送修(联络第三方厂商)。
[0043]实时监控:实时观察消防主机的状态信息。
[0044]空调系统运维服务程序单元用于加载所述存储器11中空调系统运维服务相关程 序指令以按约定周期定期对机房的空调系统运行状态进行检查、监控以及故障处理。具体 为: 日常检查:空调运行环境检查;空调温湿度显示准确性检查,运行状态记录,空调报警 检查记录; 定期巡检:过滤网检查;室外机散热器检查;控制面板参数设置检查;进出风口温度检 查;内、外机牢固检查。
[0045]故障处理:故障排除、恢复结果确认;故障硬件设备报修、报修(联络第三方厂商)。 [0046]实时监控:空调运行状态监控;温湿度实时监控。
[0047]系统优化:制冷及加湿系统优化方案设计,温湿度设置参数调整优化。
[0048]基础环境专项运维服务程序单元用于加载所述存储器11中基础环境专项运维服 务相关程序以对系统原有光缆、设备以及网线和/或电话线进行处理,分别对应生成基础光 缆信息、设备基础资产信息库以及基础的综合布线信息库。具体为: 对原有的网线、电话线缆进行统计整理,重新编码并完成标签、标识牌的打印粘贴,记 录房间号与配线架、交换机的端口信息,形成基础的综合布线信息库。
[0049]对原有光缆进行统计,重新编码并完成标签、标识牌的打印与粘贴,绘制光缆走向 图,记录光缆配线架对应关系表,形成基础光缆信息库。
[0050]对设备进行统计整理,记录设备型号、设备使用地点、设备序列号、设备管理地址、 设备购买时间、设备质保时间等设备资产信息,形成设备基础资产信息库,生成二维码贴在 设备上。
[0051]进一步地,所述硬件运维服务模块122包括网络运维服务程序单元、桌面运维服务 程序单元以及其它硬件运维服务程序单元; 网络运维服务程序单元包括分别与所述存储器11连接的有线网络设备运维服务程序 子单元、无线网络设备运维服务程序子单元、安全设备运维服务程序子单元、服务器运维服 务程序子单元、所述存储器11运维服务程序子单元、光纤交换机运维服务程序子单元以及 备份设备运维服务程序子单元; 所述有线网络设备运维服务程序子单元用于加载所述存储器11中有线网络运维服务 程序以对有线网络设备进行日常检查、故障处理、实时监控以及系统优化。具体为: 日常检查:有线网络设备除尘;有线网络设备运行状态巡查;线路连接状态巡查;设备 标签制作、粘贴检查;线路整理;设备日志记录检查;配置文件备份与检查;端口、IP地址分 配及调整;设备权限分配与维护(账号、密码、权限); 故障处理:网络故障的排查、分析、恢复; 实时监控:设备状态(供电、指示灯、CPU、内存等)监控;网络延时及丢包监控;网络连通 性监控;有线网络设备端口 /链路流量监控;。
[0052]系统优化:评估网络运行状况;网络性能瓶颈原因分析;有线网络设备策略/配置 优化方案;有线网络设备软件版本升级;用户现场调研、需求分析、制作网络架构规划方案。 [0053]所述无线网络设备运维服务程序子单元加载所述存储器1111中无线网络设备运 维服务相关程序以对无线网络设备进行日常维护、故障处理、实时监控以系统优化。具体 为: 曰常运维:无线设备除尘;无线设备运行状态巡查;各区域无线信号的覆盖范围及强度 巡查;无线设备标签制作、粘贴检查;无线设备日志记录检查;配置文件备份与检查;无线设 备版本升级; 故障处理:无线网络故障的排查、分析、恢复;无线设备硬件报修及跟踪处理(需联络厂 商处理);故障处理报告;故障硬件或模块更换(需联络厂商处理); 实时监控:无线设备状态(供电、指示灯、CPU、内存等)监控;无线网络延时及丢包监控; 无线网络连通性监控;无线AP流量监控。
[0054]系统优化:每半年评估无线网络运行状况;无线网络性能瓶颈原因分析;无线的优 化方案(信道、功率、覆盖范围、漫游、频谱导航等);无线设备软件版本升级。
[0055]所述安全设备运维服务程序子单元用于加载所述存储器11中安全设备运维服务 相关程序以对安全设备进行日常运维、状态巡检、故障处理以及性能优化。具体为: 曰常运维:安全策略调整与备份;用户上网日志保存;设备日志的检查与记录;安全设 备运行状态巡查与监控;设备版本升级;安全设备除尘;线路连接 状态巡查;设备标签制作、粘贴;线路整理;配置文件备份及检查;端口、IP地址分配及 调整;权限分配与维护(账号、密码、权限) 故障处理:安全设备故障的排查、分析、恢复; 性能优化:评估安全设备运行状况,系统版本升级;系统升级方案规划,网络安全体系 规划。
[0056]所述服务器运维服务程序子单元用于加载所述存储器11中服务器运维服务相关 程序以对服务器进行日常维护、故障处理、监视监控、设备升级以及性能优化。具体为: 日常维护:设备除尘;标签制作、粘贴;线路整理;磁盘检查;磁盘空间调整;设备日志检 查、分析 故障处理:故障的排查、分析、恢复; 监视监控:设备状态(电源、风扇、状态灯、CPU、内存)检查;服务器连通性状况监控;设 备硬件检测; 升级:主板BIOS版本检查与更新;设备驱动检查与更新;设备硬件升级改造方案制定; 设备硬件升级改造方案执行; 性能优化:分析性能瓶颈;优化措施制定;优化措施执行。
[0057] 所述存储器11运维服务程序子单元用于加载所述存储器11中存储器11运维服务 相关程序以对存储器进行日常维护、定期巡检、故障处理、监视监控、存储器升级以及数据 迁移。具体为: 曰常维护:存储设备灰尘清除;设备告警检查;存储介质可用性检查;存储设备线路整 理; 定期巡检:设备可用性检查;性能检查; 故障处理:故障的排查、分析、恢复;设备硬件报修及跟踪处理(联络第三方厂商);故障 处理报告;故障硬件或模块更换(联络第三方厂商); 监视监控:存储设备状态灯检查;硬盘物理状态;硬盘逻辑状态;热备盘接管状态;存储 CACHE状态;电源模块状态;双活存储的HA状态 升级:存储设备固件版本升级;存储设备管理软件升级; 数据迁移:存储设备数据迁移方案制定;存储规划调整跨数据分区数据迁移;不同存储 设备之间的数据迁移。
[0058]所述光纤交换机运维服务程序子单元用于加载所述存储器11中与光纤交换机运 维服务相关程序以对光纤交换机进行日常维护、定期巡检、故障处理、监视监控以及光纤交 换机升级。具体为: < 日常维护及巡检:光纤交换机灰尘清除;设备告警检查;光纤交换机设备线路整理; 故障处理:故障的排查、分析、恢复;设备硬件报修及跟踪处理(联络第三方厂商);故障 处理报告;故障硬件或模块更换(联络第三方厂商); ’ 监视监控:光纤交换机状态(CPU、内存)监控;电源模块状态监控; 升级:光纤交换机软件升级。
[0059]所述备份设备运维服务程序子单元用于加载所述存储器11中与备份设备运维服 务相关程序以对备份设备进行日常维护、故障处理、监视监控以及备份设备升级。具体为: 日常维护及巡检:备份设备灰尘清除;设备告警检查; 、• 故障处理:故障的排查、分析、恢复;设备硬件报修及跟踪处理(联络第三方厂商).故障 处理报告;故障硬件或模块更换(联络第三方厂商); ° 监视监控:备份策略执行情况;备份空间使用情况; 升级:备份设备的版本升级。
[0060]所述桌面运维服务程序单元包括终端外设运维服务程序子单元和个人电脑 服务程序子单兀,其中: 所述终端外设运维服务程序子单元用于加载所述存储器11中与终端外设设备运维服 务程序以对终端用户申报的桌面应用软件故障提供技术支持,提供驱动程序安装、升级;以 及 打印、复印、传真设置,打印机共享,设备故障诊断及联系送修、保修期内报修; 所述个人电脑运维服务程序子单元用于对终端用户申报的个人电脑故障提技术支持; 所述其它硬件运维服务程序单元包括视频监控设备运维服务程序子单元、一卡通设备 运维服务程序子单元以及多媒体、视频会议、广播系统设备运维服务程序子单元,其中: 所述视频监控设备运维服务程序子单元用于加载所述存储器11中视频监控设备相关 运维服务程序指令以对视频监控设备进行定期巡检、日常检查以及故障处理。具体为: 定期巡检:门禁系统巡检;摄像头巡检;设备清洁除尘 日常检查:摄像机信号及显示检查;摄像机外罩、镜头卫生检查;视频服务器检查;硬盘 录像机存储空间检查;硬盘录像机视频源信息检查;硬盘录像机工作状态检查;机房门禁状 态; 故障处理:安防系统故障的检测、分析、排除与恢复;安防系统事件、故障排除、恢复结 果确认;故障处理报告;故障硬件设备报修、送修(联络第三方厂商)。
[0061] 所述一卡通设备运维服务程序子单元用于加载所述存储器11中与一卡通设备相 关运维服务程序指令以对一卡通设备进行定期巡检、日常检查以及故障处理。具体为: 定期巡检: 通系统巡检; ^通设备巡检;设备清洁除尘 日常检查:圈存机运行状态检查;p〇s机运行状态检查;自助补卡机运行状态检查;水控 管理机运行状态检查;商务网关运行状态检查;控水器运行状态检查;门禁设备运行状态检 查; 故障处理:一卡通系统故障的检测、分析、排除与恢复;一卡通系统事件、故障排除、恢 复结果确认;故障处理报告;故障硬件设备报修、送修(联络第三方厂商)。
[0062] 所述多媒体、视频会议、广播系统设备运维服务程序子单元用于加载所述存储器 11中多媒体相关运维程序指令以对多媒体、视频会议、广播系统进行定期巡检、日常检查以 及故障处理。具体为: 日常检查:投影仪运行状态检查;投影幕检查;广播主机、终端控制器、广播播放终端、 数字调谐器、MP3/CD播放器等设备状态检查;视频会议终端、多点控制单元MCU、视频会议服 务器等设备运行状态检查 故障处理:多媒体系统、视频会议系统、广播系统设备故障的检测、分析、排除与恢复; 故障处理报告;故障硬件设备报修、送修(联络第二方厂商)。 ^
[0063] 进一步地,所述软件运维服务模块123包括基础软件运维服务程序单元、应用软件 运维服务程序单元以及其它软件运维服务程序单元,其中: 基础软件运维服务程序单元包括分别与所述存储器11连接的数据库运维服务程序子 单元和操作系统运维服务程序子单元; 数据库运维服务程序子单元用于加载所述存储器11中与数据库运维服务相关程序以 对数据库进行日常维护、故障处理以及数据库监控。具体为: 日常维护:数据库备份;数据库日志检查;数据库运行情况检查 故障处理:故障的排除、恢复(联络第三方厂商)日志分析、跟踪处理(联络第三方厂 商);故障处理报告; 数据库监控:数据文件磁盘占用情况检查;数据库事务日志备份;数据库控制文件备 份;数据库参数文件备份;数据库账户权限管理(联络第三方厂商);检查实例的进程(联络 第三方厂商);检查有无资源死锁(联络第三方厂商)。
[0064] 操作系统运维服务程序子单元用于加载所述存储器11中与数据库运维服务相关 程序以对操作系统进行日常维护、故障处理、操作系统监控以及从操作系统升级。具体为: 日常维护:操作系统用户管理;操作系统用户权限管理;系统账号检查;操作系统漏洞 检查;操作系统日志清理; 故障处理:故障的排除、恢复;日志分析、跟踪处理;故障处理报告; 操作系统监控:CPU、内存检查;性能分析; 优化升级:补丁安装。
[0065] 所述应用软件运维服务程序单元用于按约定周期定期对应用业务系统运行状态 进行检查,完成巡检报告;对出现的应用业务系统故障联系厂商进行解决处理,跟踪处理的 进展及结果反馈 所述其它软件运维服务程序单元包括虚拟化软件运维服务程序子单元、校园综合保修 管理系统运维服务程序子单元、校园微信服务系统运维服务程序子单元、校园微信管理系 统运维服务程序子单元以及桌面应用软件运维服务程序子单元,其中: 虚拟化软件运维服务程序子单元用于加载所述存储器11中与虚拟化软件运维相关程 序以对虚拟化软件进行日常维护、系统巡检、故障处理、软件升级、数据迁移以及数据保护。 具体为: 日常维护:虚拟机的架设;虚拟机的回收;虚拟机相关资源配置; 系统巡检:虚拟化平台软件运行状态进行检查和分析;虚拟化平台逻辑链路进行检查 和分析;对虚拟机运行过程中产生的临时文件进行处理; 故障处理:虚拟化平台故障和问题进行分析和排除; 升级:虚拟机化平台版本升级; 数据迁移:基于虚拟机应用数据迁移;虚拟资源规划调整跨数据分区数据迁移;基于虚 拟化平台不同设备之间的数据迀移; 数据保护:基于系统级的数据备份与;基于文件级的数据备份。
[0066] 校园综合保修管理系统运维服务程序子单元用于加载所述存储器11中与校园综 合保修给管理系统运维相关程序以按约定周期定期对智圣校园综合报修管理系统运行状 态进行检查和分析,完成巡检报告;对客户申报的智圣校园综合报修管理系统故障提供远 程支持,尽快修复故障,提供报告;针对客户智圣校园综合报修管理系统运行情况,给出优 化建议并实施,提升性能;根据客户业务发展趋势,评估应用当前及应有性能,提出性能建 议。
[0067] 校园微信服务系统运维服务程序子单元用于加载所述存储器11中与校园微信服 务系统运维相关程序以按约定周期定期对智圣掌上校园微信服务系统运行状态进行检查 和分析,完成巡检报告;对客户申报的智圣掌上校园微信服务系统故障提供远程支持,尽快 修复故障,提供报告;针对客户智圣掌上校园微信服务系统运行情况,给出优化建议并实 施,提升性能;根据客户业务发展趋势,评估应用当前及应有性能,提出性能建议。
[0068]校园微信管理系统运维服务程序子单元用于加载所述存储器11中与校园微信管 理系统运维相关程序以按约定周期定期对智圣掌上校园微信管理系统运行状态进行检查 和分析,完成巡检报告;对客户申报的智圣掌上校园微信管理系统故障提供远程支持,尽快 修复故障,提供报告;针对客户智圣掌上校园微信管理系统运行情况,给出优化建议并实 施,提升性能;根据客户业务发展趋势,评估应用当前及应有性能,提出性能建议。
[0069]桌面应用软件运维服务程序子单元用于加载所述存储器11中与桌面应用软件运 维相关程序以对终端用户申报的办公软件故障提供技术支持。提供软件故障原因分析、软 件故障解决;提供办公软件、工具软件(如:〇ffice等)、专用系统、防毒软件、驱动程序等的 安装及设置;提供软件版本变更的风险评估、软件版本变更的实施;提供防毒软件版本检 查、防毒软件更新、补丁安装、杀毒处理等。
[0070] 如图3所示,本实施例还公开了一种运维服务方法,包括如下步骤: 通过一线驻点客户端20向综合管理系统10发送运维事件信息; 一线驻点客户端20根据综合管理系统10返回的运维内容及响应时间对运维事件进行 处理; 在一线驻点客户端20无法解决一线驻点处提出的技术问题时,向综合管理系统10发送 二线技术支持请求; 所述综合管理系统10用于: 根据接收的二线技术支持请求,指派二线技术支持团队进行运维事件处理; 实时跟踪记录运维事件的处理进度,并对运维过程及结果进行考核; 对运维对象进行监控,并将预警事件生成运维事件进行运维处理; 定期对核心设备及业务系统进行巡检; 对用户发出的处理请求进行在线解答。
[0071] 对运维事件的管理包括事件登记、事件指派、事件处理、事件关闭以及事件回访; 所述问答管理包括问题跟踪、趋势分析、问题解答、问题回顾以及问题录入。
[0072] 需要说明的是,通过跟踪分析能够持跟进故障事件的处理进度,过程、结果、回访, 以月为单位,对本月整体故障处理的及时率、解决率、满意率等SLA考核项进行统计汇总,直 观展示当月运维工作整体情况。
[0073]变更管理包括变更方案、回退计划、用户确认、变更执行、变更测试以及变更录入。 [0074]发布管理包括发布计划、更新内容、发布授权、发布退回以及发布录入。
[0075]资产管理包括设备统计、机柜统计、光缆统计、端口统计以及信息录入。
[0076] 考核管理包括满意率、及时率以及完成率的考核。
[0077] 进一步地,本实施例中还通过设置知识库,事件管理以及问答管理的信息均从知 识库中调取,该知识库中存储知识库模板,对日常运维中遇到的常见故障、典型故障等进行 收集归类,形成丰富的知识库,加快故障问题处理以及后备员工的学习参考。
[0078]需要说明的是,本发明的运维模块I2运维范围和内容覆盖全面,从从基础线路到 中间件到上层应用。采用一线驻点+二线技术支持的运维团队快速响应并解决问题,通过一 线驻点团队客户现场办公,贴心服务,能够第一时间发现潜在需求或项目信息,反推公司集 成类项目快速增长。通过ITSS运维系统进行运维考核,实现运维结果的可视化。
[0079]以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1. 一种运维服务系统,其特征在于,包括:一线驻点客户端以及综合管理系统,一线驻 点客户端与综合管理系统连接; 所述一线驻点客户端布置在用户办公现场,一线驻点客户端根据综合管理系统发送的 运维服务内容及响应时间对现场运维事件进行处理; 在一线驻点客户端无法解决现场运维事件时,综合管理系统指派二线技术支持团队至 现场对运维任务进行处理; 其中,综合管理系统包括存储器,以及分别与所述存储器连接的运维模块、运维指标可 视化模块、运维监控模块和云服务平台; 存储器存储有若干运维指令,该若干运维指令适用于运维模块、运维指标可视化模块、 运维预警模块和云服务平台加载并执行; 运维模块与所述一线驻点客户端连接,并接收一线驻点客户端的请求产生运维服务内 容及响应时间; 运维指标可视化模块与所述一线驻点客户端连接,以对一线驻点客户端对运维事件的 处理进度进行追踪记录,得到处理结果; 运维监控模块与所述运维模块连接,运维监控模块将Zabbix中的报警事件自动同步至 运维模块中生成运维事件,发送至一线驻点客户端进行跟踪处理; 云服务平台与所述运维指标可视化模块连接,对售后服务进行跟踪记录。
2.如权利要求1所述的运维服务系统,其特征在于,所述运维指标可视化模块包括进度 跟踪单元、整理单元以及显示单元; 进度跟踪单元与所述运维模块连接,以对所述运维模块对于屋内事件的处理进度、过 程以及结果进行跟进,并进行回访; 整理单元与所述进度跟踪单元连接,整理单元根据设定的时间节点对某时间段内的运 维事件处理结果进行统计汇总; 显示单元与所述整理单元连接,以将运维事件处理结果的统计汇总结果进行显示。
3.如权利要求1所述的运维服务系统,其特征在于,所述运维监控模块包括监控单元和 预警单元; 监控单元与预警单元连接,监控单元用于对运维对象进行监控并在运维对象发生故障 时生成预警事件发送至预警单元; 预警单元与所述运维模块连接,预警单元将预警事件同步至所述运维模块,生成运维 事件。
4.如权利要求1所述的运维服务系统,其特征在于,所述云服务平台售后跟踪单元和线 上服务单元; 跟踪单元用于对用户的售后服务进行跟踪; 线上服务单元用于供用户及运维工程师进行注册,并支持线上问题咨询、技术支持、线 上交易、线下网络割接。
5.如权利要求1所述的运维服务系统,其特征在于,所述综合管理系统还包括知识库体 系; 所述知识库体系用于对运维事件的常见故障、典型故障进行收集归类,并对每类故障 提供相应的解决方案以供用户查找。
6.如权利要求1所述的运维服务系统,其特征在于,所述系统还包括即时通讯设备,该 即时通讯设备包括事件管理模块、请求管理模块、知识问答模块以及售后反馈模块; 事件管理模块用于对用户提交的运维事件的进展进行跟踪管理; 请求管理模块用于提交运维事件处理请求以及对运维事件的处理进程进行查询; 知识问答模块用于根据用户请求,提供常见故障类型及对应的解决策略; 售后反馈模块用于将用户提交的售后反馈意见发送至所述综合管理系统。
7.如权利要求3所述的运维服务系统,其特征在于,所述综合管理系统还包括定期巡检 模块,该定期巡检模块用于定期对核心设备及业务系统进行巡检。
8.如权利要求1所述的运维服务系统,其特征在于,所述运维模块按照设定的安全运维 规范进行运维; 所述安全运维规范包括网络设备配置规范、安全设备配置规范、服务器安全配置规范、 数据备份规范、密码保存规范以及协议保密。
9.如权利要求8所述的运维服务系统,其特征在于,所述运维模块包括基础环境运维模 块、硬件运维服务模块、软件运维服务模块以及特色运维服务模块; 基础环境运维服务程序模块用于进行系统基础环境的运维; 硬件运维服务模块用于进行系统中硬件运维服务; 软件运维服务模块用于进行系统中软件运维服务; 特色运维服务模块用于进行系统中特色运维服务。
10. —种运维服务方法,其特征在于,包括: 通过一线驻点客户端向综合管理系统发送运维事件信息; 一线驻点客户端根据综合管理系统返回的运维内容及响应时间对运维事件进行处理; 在一线驻点客户端无法解决一线驻点处提出的技术问题时,向综合管理系统发送二线 技术支持请求; 所述综合管理系统用于: 根据接收的二线技术支持请求,指派二线技术支持团队进行运维事件处理; 实时跟踪记录运维事件的处理进度,并对运维过程及结果进行考核; 对运维对象进行监控,并将预警事件生成运维事件进行运维处理; 定期对核心设备及业务系统进行巡检; 对用户发出的处理请求进行在线解答。
CN201810381647.1A 2018-04-25 2018-04-25 一种运维服务系统及方法 Pending CN108847953A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810381647.1A CN108847953A (zh) 2018-04-25 2018-04-25 一种运维服务系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810381647.1A CN108847953A (zh) 2018-04-25 2018-04-25 一种运维服务系统及方法

Publications (1)

Publication Number Publication Date
CN108847953A true CN108847953A (zh) 2018-11-20

Family

ID=64212288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810381647.1A Pending CN108847953A (zh) 2018-04-25 2018-04-25 一种运维服务系统及方法

Country Status (1)

Country Link
CN (1) CN108847953A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110113206A (zh) * 2019-05-05 2019-08-09 黑龙江亿林网络股份有限公司 一种通信网络用维护系统
CN110414774A (zh) * 2019-06-11 2019-11-05 华迪计算机集团有限公司 一种运维监控系统及方法
CN110515864A (zh) * 2019-08-14 2019-11-29 中国建设银行股份有限公司 基于运维终端向大型主机自动提交作业的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106452829A (zh) * 2016-01-21 2017-02-22 华南师范大学 一种基于bcc‑knn的云计算中心智能运维方法及系统
CN106936648A (zh) * 2017-05-05 2017-07-07 合肥智圣系统集成有限公司 一种it系统的故障监控方法及系统
US20170206483A1 (en) * 2016-01-15 2017-07-20 Level 3 Communications, Llc Workflow storage, processing, management, and task creation system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170206483A1 (en) * 2016-01-15 2017-07-20 Level 3 Communications, Llc Workflow storage, processing, management, and task creation system
CN106452829A (zh) * 2016-01-21 2017-02-22 华南师范大学 一种基于bcc‑knn的云计算中心智能运维方法及系统
CN106936648A (zh) * 2017-05-05 2017-07-07 合肥智圣系统集成有限公司 一种it系统的故障监控方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刁倩等: ""电力信息系统三线运维管控平台研究与建设"", 《电力信息与通信技术》 *
李玉琳等: ""物业小区泵站监控管云服务平台"", 《数码设计》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110113206A (zh) * 2019-05-05 2019-08-09 黑龙江亿林网络股份有限公司 一种通信网络用维护系统
CN110414774A (zh) * 2019-06-11 2019-11-05 华迪计算机集团有限公司 一种运维监控系统及方法
CN110515864A (zh) * 2019-08-14 2019-11-29 中国建设银行股份有限公司 基于运维终端向大型主机自动提交作业的方法及装置

Similar Documents

Publication Publication Date Title
CN108847953A (zh) 一种运维服务系统及方法
US10019822B2 (en) Integrated infrastructure graphs
US7694189B2 (en) Method and system for remote monitoring subscription service
CN102035855B (zh) 网络安全事件关联分析系统
CN103473626A (zh) 一种基于调度数据网集中运维系统的安全防护方法
US8578337B2 (en) Method and system for quality assurance subscription service
US8214483B2 (en) Method and system for continuous availability subscription service
CN101652999A (zh) 用于管理实况视频数据的系统和方法
CN108667666A (zh) 一种基于可视化技术的智能运维方法及其系统
CN105262210A (zh) 一种变电站网络安全性分析预警系统和方法
Bauer et al. Beyond redundancy: how geographic redundancy can improve service availability and reliability of computer-based systems
CN109768889A (zh) 一种可视化安全管理智慧运维平台
CN107155089A (zh) 一种电力统一视频监控平台设备故障诊断预警方法
Endo et al. Minimizing and managing cloud failures
CN105991771A (zh) 物联网消防系统
CN103295155B (zh) 证券核心业务系统监控方法
CN109242245A (zh) 基于位置信息的现场维护人员管理系统及其管理方法
Rocha et al. Analyzing the impact of power infrastructure failures on cloud application availability
CN109347205A (zh) 一种智能控制供电设备及其实现系统
CN109801416A (zh) 一种基于大数据分析的共建共维机房管理方法
JP2020141353A (ja) 装置管理方法、管理装置及びプログラム
Al–shammari et al. Disaster Recovery and Business Continuity for Database Services in Multi-Cloud
CN110134053B (zh) 一种配变故障停电快速响应的监控配置方法、装置及设备
KR102231648B1 (ko) 소방시설의 점검 이력 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록 매체
CN207704483U (zh) 基于cim标准的电网运行安全风险管控系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination