CN108847953A - 一种运维服务系统及方法 - Google Patents

一种运维服务系统及方法 Download PDF

Info

Publication number
CN108847953A
CN108847953A CN201810381647.1A CN201810381647A CN108847953A CN 108847953 A CN108847953 A CN 108847953A CN 201810381647 A CN201810381647 A CN 201810381647A CN 108847953 A CN108847953 A CN 108847953A
Authority
CN
China
Prior art keywords
module
service
event
line
stationary point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810381647.1A
Other languages
English (en)
Inventor
王培鑫
梁进中
许克浩
朱杭烽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Zhisheng New Information Technology Co Ltd
Original Assignee
Hefei Zhisheng New Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Zhisheng New Information Technology Co Ltd filed Critical Hefei Zhisheng New Information Technology Co Ltd
Priority to CN201810381647.1A priority Critical patent/CN108847953A/zh
Publication of CN108847953A publication Critical patent/CN108847953A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5009Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种运维服务系统及方法,属于运维管理技术领域,包括与一线驻点客户端连接的综合管理系统;一线驻点客户端布置在用户办公现场,一线驻点客户端根据综合管理系统发送的运维服务内容及响应时间对现场运维事件进行处理;在一线驻点客户端无法解决现场运维事件时,综合管理系统指派二线技术支持团队至现场对运维任务进行处理;综合管理系统包括存储器,以及分别与所述存储器连接的运维模块、运维指标可视化模块、运维监控模块和云服务平台。通过采用一线驻点+二线技术支持的运维团队,可快速响应并解决问题。

Description

一种运维服务系统及方法
技术领域
本发明涉及运维管理技术领域,特别涉及一种运维服务系统及方法。
背景技术
随着信息化的快速发展,信息化项目越来越多,各种应用系统急速增长,给系统维护人员带来了巨大的挑战,主要挑战表现为:维护人员数量少与需要维护的系统日益增多的矛盾;维护人员的专业性不强,已不能满足系统维护的需要;系统种类繁多,经常是发生故障后再进行处理,缺乏统一监管,提前发现故障问题的机制。因此,客户对运维服务的需求越来越迫切。
发明内容
本发明的目的在于提供一种运维服务系统及方法,以满足快速发展的应用系统的运维需求。
为实现以上目的,本发明采用的技术方案为:
采用一种运维服务系统,包括:一线驻点客户端以及综合管理系统,一线驻点客户端通过服务器分别与综合管理系统连接;
所述一线驻点客户端布置在用户办公现场,一线驻点客户端根据综合管理系统发送的运维服务内容及响应时间对现场运维事件进行处理;
在一线驻点客户端无法解决现场运维事件时,综合管理系统指派二线技术支持团队至现场对运维任务进行处理;
其中,综合管理系统包括存储器,以及分别与所述存储器连接的运维模块、运维指标可视化模块、运维监控模块和云服务平台;
存储器存储有若干运维指令,该若干运维指令适用于运维模块、运维指标可视化模块、运维预警模块和云服务平台加载并执行;
运维模块与所述一线驻点客户端连接,并接收一线驻点客户端的请求产生运维服务内容及响应时间;
运维指标可视化模块与所述一线驻点客户端连接,以对一线驻点客户端对运维事件的处理进度进行追踪记录,得到处理结果;
运维监控模块与所述运维模块连接,运维监控模块将Zabbix中的报警事件自动同步至运维模块中生成运维事件,发送至一线驻点客户端进行跟踪处理;
云服务平台与所述运维指标可视化模块连接,对售后服务进行跟踪记录。
优选地,所述运维指标可视化模块包括进度跟踪单元、整理单元以及显示单元;
进度跟踪单元与所述运维模块连接,以对所述运维模块对于屋内事件的处理进度、过程以及结果进行跟进,并进行回访;
整理单元与所述进度跟踪单元连接,整理单元根据设定的时间节点对某时间段内的运维事件处理结果进行统计汇总;
显示单元与所述整理单元连接,以将运维事件处理结果的统计汇总结果进行显示。
优选地,所述运维监控模块包括监控单元和预警单元;
监控单元与预警单元连接,监控单元用于对运维对象进行监控并在运维对象发生故障时生成预警事件发送至预警单元;
预警单元与所述运维模块连接,预警单元将预警事件同步至所述运维模块,生成运维事件。
优选地,所述云服务平台售后跟踪单元和线上服务单元;
跟踪单元用于对用户的售后服务进行跟踪;
线上服务单元用于供用户及运维工程师进行注册,并支持线上问题咨询、技术支持、线上交易、线下网络割接。
优选地,所述综合管理系统还包括知识库体系;
所述知识库体系用于对运维事件的常见故障、典型故障进行收集归类,并对每类故障提供相应的解决方案以供用户查找。
优选地,所述系统还包括即时通讯设备,该即时通讯设备包括事件管理模块、请求管理模块、知识问答模块以及售后反馈模块;
事件管理模块用于对用户提交的运维事件的进展进行跟踪管理;
请求管理模块用于提交运维事件处理请求以及对运维事件的处理进程进行查询;
知识问答模块用于根据用户请求,提供常见故障类型及对应的解决策略;
售后反馈模块用于将用户提交的售后反馈意见发送至所述综合管理系统。
优选地,所述综合管理系统还包括定期巡检模块,该定期巡检模块用于定期对核心设备及业务系统进行巡检。
优选地,所述运维模块按照设定的安全运维规范进行运维;
所述安全运维规范包括网络设备配置规范、安全设备配置规范、服务器安全配置规范、数据备份规范、密码保存规范以及协议保密。
优选地,所述运维模块包括基础环境运维模块、硬件运维服务模块、软件运维服务模块以及特色运维服务模块;
基础环境运维服务程序模块用于进行系统基础环境的运维;
硬件运维服务模块用于进行系统中硬件运维服务;
软件运维服务模块用于进行系统中软件运维服务;
特色运维服务模块用于进行系统中特色运维服务。
另一方面,采用一种运维服务方法,包括:
通过一线驻点客户端向综合管理系统发送运维事件信息;
一线驻点客户端根据综合管理系统返回的运维内容及响应时间对运维事件进行处理;
在一线驻点客户端无法解决一线驻点处提出的技术问题时,向综合管理系统发送二线技术支持请求;
所述综合管理系统用于:
根据接收的二线技术支持请求,指派二线技术支持团队进行运维事件处理;
实时跟踪记录运维事件的处理进度,并对运维过程及结果进行考核;
对运维对象进行监控,并将预警事件生成运维事件进行运维处理;
定期对核心设备及业务系统进行巡检;
对用户发出的处理请求进行在线解答。
与现有技术相比,本发明存在以下技术效果:本发明采用的运维服务系统采用二级架构:一线驻点团队和二线技术支持。其中一线驻点团队根据运维服务的内容以及响应时间,在客户现场办公,快速进行故障处理;同时提供具有较高水平的故障分析能力以及丰富的实践经验的二线服务团队,做为流动技术支持,当进行重大问题处理或网络改造割接时,二线服务团队在现场为用户提供技术协助和人员协助,可快速响应问题并及时解决。该运维服务范围包括基础环境运维、硬件运维服务、软件运维服务、机房搬迁、备品备件服务,运维范围和内容覆盖全面。通过ITSS运维系统进行运维考核,实现运维结果的可视化。通过一线驻点团队客户现场办公,贴心服务,能够第一时间发现潜在需求或项目信息,反推公司集成类项目快速增长。
附图说明
下面结合附图,对本发明的具体实施方式进行详细描述:
图1是一种运维服务系统的结构示意图;
图2是运维模块的结构示意图;
图3一种运维服务流程图。
具体实施方式
为了更进一步说明本发明的特征,请参阅以下有关本发明的详细说明与附图。所附图仅供参考与说明之用,并非用来对本发明的保护范围加以限制。
如图1所示,本实施例公开了一种运维服务系统,包括:一线驻点客户端20以及综合管理系统10,一线驻点客户端20与综合管理系统10连接;
所述一线驻点客户端20布置在用户办公现场,一线驻点客户端20根据综合管理系统10发送的运维服务内容及响应时间对现场运维事件进行处理;
在一线驻点客户端20无法解决现场运维事件时,综合管理系统指派二线技术支持团队至现场对运维任务进行处理;
其中,综合管理系统10包括存储器11,以及分别与所述存储器11连接的运维模块12、运维指标可视化模块13、运维监控模块14和云服务平台15;
存储器11存储有若干运维指令,该若干运维指令适用于运维模块12、运维指标可视化模块13、运维预警模块和云服务平台加载并执行;
运维模块12与所述一线驻点客户端20连接,并接收一线驻点客户端20的请求产生运维服务内容及响应时间;
运维指标可视化模块13与所述一线驻点客户端连接,以对一线驻点客户端对运维事件的处理进度进行追踪记录,得到处理结果;
运维监控模块14与所述运维模块12连接,运维监控模块14将Zabbix中的报警事件自动同步至运维模块12中生成运维事件,发送至一线驻点客户端20进行跟踪处理;
云服务平台15与所述运维指标可视化模块13连接,对售后服务进行跟踪记录。
需要说明的是,本方案采用一线驻点团队和二线技术支持结合,其中一线驻点团队根据运维服务的内容以及响应时间,在客户现场办公,快速进行故障处理;同时提供具有较高水平的故障分析能力以及丰富的实践经验的二线服务团队,做为流动技术支持,当进行重大问题处理或网络改造割接时,二线服务团队在现场为用户提供技术协助和人员协助。
在实际操作中,也可制定完善的培训课程,对服务单位人员进行二次培训,项目实战后,从服务单位人员中选出一些人员作为运维的一线驻点或二线技术支持。
作为进一步优选的方案,运维指标可视化模块13包括进度跟踪单元、整理单元以及显示单元;
进度跟踪单元与所述运维模块12连接,以对所述运维模块12对于屋内事件的处理进度、过程以及结果进行跟进,并进行回访;
整理单元与所述进度跟踪单元连接,整理单元根据设定的时间节点对某时间段内的运维事件处理结果进行统计汇总;
显示单元与所述整理单元连接,以将运维事件处理结果的统计汇总结果进行显示。
需要说明的是,该运维指标可视化模块13能够持跟进运维事件的处理进度、过程、结果、回访,可以周、月、季度、年为单位,对单位时间内整体故障处理的及时率、解决率、满意率等SLA考核项进行统计汇总,直观展示的单位时间内运维工作整体情况。
作为进一步优选的方案,运维监控模块14包括监控单元和预警单元;
监控单元与预警单元连接,监控单元用于对运维对象进行监控并在运维对象发生故障时生成预警事件发送至预警单元;
预警单元与所述运维模块12连接,预警单元将预警事件同步至所述运维模块12,生成运维事件。
需要说明的是,本方案在自动化运维监控软件Zabbix的基础上进行二次开发,利用Zabbix强大的监控功能对运维对象进行监控,同时将报警机制与综合运维服务管理系统进行对接,将Zabbix中的报警事件自动同步综合运维服务管理系统中生成事件,以进行跟踪和处理。
作为进一步优选的方案,云服务平台15售后跟踪单元和线上服务单元;
跟踪单元用于对用户的售后服务进行跟踪;
线上服务单元用于供用户及运维工程师进行注册,并支持线上问题咨询、技术支持、线上交易、线下网络割接。
需要说明的是,前期利用该云服务平台15对客户的售后服务进行跟踪,保证售后的及时可靠。后期可将该云服务平台15对外开放,业界工程师进行注册,对服务单位的运维故障问题进行解答,该云服务平台15可支持线上问题咨询、技术支持、线上交易、线下网络割接等,以充分整合资源,实现资源共享最大化。
作为进一步优选的方案,综合管理系统10还包括知识库体系;
所述知识库体系用于对运维事件的常见故障、典型故障进行收集归类,并对每类故障提供相应的解决方案以供用户查找。
需要说明的是,本实施例中在综合运维管理系统中设置知识库模板,对日常运维中遇到的常见故障、典型故障等进行收集归类,形成丰富的知识库,加快故障问题处理以及后备员工的学习参考。
作为进一步优选的方案,所述系统还包括即时通讯设备,该即时通讯设备包括事件管理模块、请求管理模块、知识问答模块以及售后反馈模块;
事件管理模块用于对用户提交的运维事件的进展进行跟踪管理;
请求管理模块用于提交运维事件处理请求以及对运维事件的处理进程进行查询;
知识问答模块用于根据用户请求,提供常见故障类型及对应的解决策略;
售后反馈模块用于将用户提交的售后反馈意见发送至所述综合管理系统10。
需要说明的是,本实施例中的即时通讯设备包括电话、微信、综合运维系统、QQ群等多样化的故障报修方式,通过充分利用当下流行的即时通讯工具,最大限度的降低客户报修难的问题。
作为进一步优选的方案,综合管理系统10还包括定期巡检模块,该定期巡检模块用于定期对核心设备及业务系统进行巡检。本实施例中除使用监控系统对设备进行监控外,还引入了日检、周报、月报、年报等巡检制度,对核心设备和业务系统实现全面的“人工+系统”的双重巡检,解决人工和系统单一巡检的弊端。
作为进一步优选的方案,运维模块12按照设定的安全运维规范进行运维;
所述安全运维规范包括网络设备配置规范、安全设备配置规范、服务器安全配置规范、数据备份规范、密码保存规范以及协议保密。
本实施例中的安全运维规范包括:保密协议:与客户签订保密协议,保障客户信息安全,消除客户顾虑;网络设备配置规范:制定了八大配置规范,充分保护网络设备安全;安全设备配置规范:制定了七大安全设备配置规范,进一步保护安全设备;服务器安全配置规范:制定了六大服务器安全配置规范,保护服务器安全;数据备份规范:制定了数据备份规范,对重要业务系统数据进行备份;密码保存规范:制定了密码保存规范,防止密码泄露带来的隐患。
作为进一步优选的方案,如图2所示,运维模块12包括基础环境运维模块121、硬件运维服务模块122、软件运维服务模块123以及特色运维服务模块124;
基础环境运维模块121用于进行系统基础环境的运维;
硬件运维服务模块122用于进行系统中硬件运维服务;
软件运维服务模块123用于进行系统中软件运维服务;
特色运维服务模块124用于进行系统中特色运维服务。
其中:
特色运维服务模块124包括机房搬迁服务程序单元和备品备件服务程序单元;所述机房搬迁服务程序单元和备品备件服务程序单元分别与所述存储器11连接。其中:
所述机房搬迁服务程序单元用于加载所述存储器11中与机房搬迁相关程序以对机房搬迁方案进行设计、搭建机房环境、部署线路线缆、数据备份、正常关闭业务系统;以及拆卸、运输、安装设备或系统,开启业务系统,检查业务系统正常,机房搬迁报告。
所述备品备件服务程序单元用于加载所述存储器11中与备品备份服务相关程序以提供网络设备、安全设备、主机设备、存储设备等硬件备品备件,并提供备品备件的安装替换服务;提供网络设备、安全设备、主机设备、存储设备等硬件原厂维保。
进一步地,基础环境运维模块121包括分别与所述存储器11连接的电力系统运维服务程序单元、消防系统运维服务程序单元、空调系统运维服务程序单元以及基础环境专项运维服务程序单元。其中:
电力系统运维服务程序单元用于加载所述存储器11中电力系统运维服务相关程序指令以按约定周期定期对机房的电力系统的状态进行检查、监控以及故障处理。具体为:
日常检查:电力系统运行参数检查;电力系统各部件健康检查;检查并记录电力负载;电力系统卫生检查;检查记录、数据的备份。
日常故障处理:电力系统故障分析;电力系统故障的排除与恢复;故障硬件设备报修、送修(联络第三方厂商)。
定期巡检服务:测量并记录输入输出电压电流;线缆及接头牢固检查;线缆及接头老化情况检查;电池放电检查。
实时监控:机房电力系统监控。
优化服务:机房动力配电优化;UPS负载优化;机柜供电系统优化等服务内容。
消防系统运维服务程序单元用于加载所述存储器11中消防系统运维服务相关程序指令以按约定周期定期对机房的消防系统运行状态进行检查、监控以及故障处理。具体为:
日常检查:消防系统的灭火剂瓶组、泄压口、烟感探测器、温感探测器、消防主机、消防报警系统、紧急启停按钮、气密性的日常状态检查,运行状态记录。
日常故障处理:消防系统的灭火剂瓶组、泄压口、烟感探测器、温感探测器、消防主机、消防报警系统、紧急启停按钮、气密性的故障分析;故障的排除与恢复;故障硬件设备报修、送修(联络第三方厂商)。
实时监控:实时观察消防主机的状态信息。
空调系统运维服务程序单元用于加载所述存储器11中空调系统运维服务相关程序指令以按约定周期定期对机房的空调系统运行状态进行检查、监控以及故障处理。具体为:
日常检查:空调运行环境检查;空调温湿度显示准确性检查,运行状态记录,空调报警检查记录;
定期巡检:过滤网检查;室外机散热器检查;控制面板参数设置检查;进出风口温度检查;内、外机牢固检查。
故障处理:故障排除、恢复结果确认;故障硬件设备报修、报修(联络第三方厂商)。
实时监控:空调运行状态监控;温湿度实时监控。
系统优化:制冷及加湿系统优化方案设计,温湿度设置参数调整优化。
基础环境专项运维服务程序单元用于加载所述存储器11中基础环境专项运维服务相关程序以对系统原有光缆、设备以及网线和/或电话线进行处理,分别对应生成基础光缆信息、设备基础资产信息库以及基础的综合布线信息库。具体为:
对原有的网线、电话线缆进行统计整理,重新编码并完成标签、标识牌的打印粘贴,记录房间号与配线架、交换机的端口信息,形成基础的综合布线信息库。
对原有光缆进行统计,重新编码并完成标签、标识牌的打印与粘贴,绘制光缆走向图,记录光缆配线架对应关系表,形成基础光缆信息库。
对设备进行统计整理,记录设备型号、设备使用地点、设备序列号、设备管理地址、设备购买时间、设备质保时间等设备资产信息,形成设备基础资产信息库,生成二维码贴在设备上。
进一步地,所述硬件运维服务模块122包括网络运维服务程序单元、桌面运维服务程序单元以及其它硬件运维服务程序单元;
网络运维服务程序单元包括分别与所述存储器11连接的有线网络设备运维服务程序子单元、无线网络设备运维服务程序子单元、安全设备运维服务程序子单元、服务器运维服务程序子单元、所述存储器11运维服务程序子单元、光纤交换机运维服务程序子单元以及备份设备运维服务程序子单元;
所述有线网络设备运维服务程序子单元用于加载所述存储器11中有线网络运维服务程序以对有线网络设备进行日常检查、故障处理、实时监控以及系统优化。具体为:
日常检查:有线网络设备除尘;有线网络设备运行状态巡查;线路连接状态巡查;设备标签制作、粘贴检查;线路整理;设备日志记录检查;配置文件备份与检查;端口、IP地址分配及调整;设备权限分配与维护(账号、密码、权限);
故障处理:网络故障的排查、分析、恢复;
实时监控:设备状态(供电、指示灯、CPU、内存等)监控;网络延时及丢包监控;网络连通性监控;有线网络设备端口/链路流量监控;。
系统优化:评估网络运行状况;网络性能瓶颈原因分析;有线网络设备策略/配置优化方案;有线网络设备软件版本升级;用户现场调研、需求分析、制作网络架构规划方案。
所述无线网络设备运维服务程序子单元加载所述存储器1111中无线网络设备运维服务相关程序以对无线网络设备进行日常维护、故障处理、实时监控以系统优化。具体为:
日常运维:无线设备除尘;无线设备运行状态巡查;各区域无线信号的覆盖范围及强度巡查;无线设备标签制作、粘贴检查;无线设备日志记录检查;配置文件备份与检查;无线设备版本升级;
故障处理:无线网络故障的排查、分析、恢复;无线设备硬件报修及跟踪处理(需联络厂商处理);故障处理报告;故障硬件或模块更换(需联络厂商处理);
实时监控:无线设备状态(供电、指示灯、CPU、内存等)监控;无线网络延时及丢包监控;无线网络连通性监控;无线AP流量监控。
系统优化:每半年评估无线网络运行状况;无线网络性能瓶颈原因分析;无线的优化方案(信道、功率、覆盖范围、漫游、频谱导航等);无线设备软件版本升级。
所述安全设备运维服务程序子单元用于加载所述存储器11中安全设备运维服务相关程序以对安全设备进行日常运维、状态巡检、故障处理以及性能优化。具体为:
日常运维:安全策略调整与备份;用户上网日志保存;设备日志的检查与记录;安全设备运行状态巡查与监控;设备版本升级;安全设备除尘;线路连接
状态巡查;设备标签制作、粘贴;线路整理;配置文件备份及检查;端口、IP地址分配及调整;权限分配与维护(账号、密码、权限)
故障处理:安全设备故障的排查、分析、恢复;
性能优化:评估安全设备运行状况,系统版本升级;系统升级方案规划,网络安全体系规划。
所述服务器运维服务程序子单元用于加载所述存储器11中服务器运维服务相关程序以对服务器进行日常维护、故障处理、监视监控、设备升级以及性能优化。具体为:
日常维护:设备除尘;标签制作、粘贴;线路整理;磁盘检查;磁盘空间调整;设备日志检查、分析
故障处理:故障的排查、分析、恢复;
监视监控:设备状态(电源、风扇、状态灯、CPU、内存)检查;服务器连通性状况监控;设备硬件检测;
升级:主板BIOS版本检查与更新;设备驱动检查与更新;设备硬件升级改造方案制定;设备硬件升级改造方案执行;
性能优化:分析性能瓶颈;优化措施制定;优化措施执行。
所述存储器11运维服务程序子单元用于加载所述存储器11中存储器11运维服务相关程序以对存储器进行日常维护、定期巡检、故障处理、监视监控、存储器升级以及数据迁移。具体为:
日常维护:存储设备灰尘清除;设备告警检查;存储介质可用性检查;存储设备线路整理;
定期巡检:设备可用性检查;性能检查;
故障处理:故障的排查、分析、恢复;设备硬件报修及跟踪处理(联络第三方厂商);故障处理报告;故障硬件或模块更换(联络第三方厂商);
监视监控:存储设备状态灯检查;硬盘物理状态;硬盘逻辑状态;热备盘接管状态;存储CACHE状态;电源模块状态;双活存储的HA状态
升级:存储设备固件版本升级;存储设备管理软件升级;
数据迁移:存储设备数据迁移方案制定;存储规划调整跨数据分区数据迁移;不同存储设备之间的数据迁移。
所述光纤交换机运维服务程序子单元用于加载所述存储器11中与光纤交换机运维服务相关程序以对光纤交换机进行日常维护、定期巡检、故障处理、监视监控以及光纤交换机升级。具体为:
日常维护及巡检:光纤交换机灰尘清除;设备告警检查;光纤交换机设备线路整理;
故障处理:故障的排查、分析、恢复;设备硬件报修及跟踪处理(联络第三方厂商);故障处理报告;故障硬件或模块更换(联络第三方厂商);
监视监控:光纤交换机状态(CPU、内存)监控;电源模块状态监控;
升级:光纤交换机软件升级。
所述备份设备运维服务程序子单元用于加载所述存储器11中与备份设备运维服务相关程序以对备份设备进行日常维护、故障处理、监视监控以及备份设备升级。具体为:
日常维护及巡检:备份设备灰尘清除;设备告警检查;
故障处理:故障的排查、分析、恢复;设备硬件报修及跟踪处理(联络第三方厂商);故障处理报告;故障硬件或模块更换(联络第三方厂商);
监视监控:备份策略执行情况;备份空间使用情况;
升级:备份设备的版本升级。
所述桌面运维服务程序单元包括终端外设运维服务程序子单元和个人电脑运维服务程序子单元,其中:
所述终端外设运维服务程序子单元用于加载所述存储器11中与终端外设设备运维服务程序以对终端用户申报的桌面应用软件故障提供技术支持,提供驱动程序安装、升级;以及
打印、复印、传真设置,打印机共享,设备故障诊断及联系送修、保修期内报修;
所述个人电脑运维服务程序子单元用于对终端用户申报的个人电脑故障提技术支持;
所述其它硬件运维服务程序单元包括视频监控设备运维服务程序子单元、一卡通设备运维服务程序子单元以及多媒体、视频会议、广播系统设备运维服务程序子单元,其中:
所述视频监控设备运维服务程序子单元用于加载所述存储器11中视频监控设备相关运维服务程序指令以对视频监控设备进行定期巡检、日常检查以及故障处理。具体为:
定期巡检:门禁系统巡检;摄像头巡检;设备清洁除尘
日常检查:摄像机信号及显示检查;摄像机外罩、镜头卫生检查;视频服务器检查;硬盘录像机存储空间检查;硬盘录像机视频源信息检查;硬盘录像机工作状态检查;机房门禁状态;
故障处理:安防系统故障的检测、分析、排除与恢复;安防系统事件、故障排除、恢复结果确认;故障处理报告;故障硬件设备报修、送修(联络第三方厂商)。
所述一卡通设备运维服务程序子单元用于加载所述存储器11中与一卡通设备相关运维服务程序指令以对一卡通设备进行定期巡检、日常检查以及故障处理。具体为:
定期巡检:一卡通系统巡检;一卡通设备巡检;设备清洁除尘
日常检查:圈存机运行状态检查;POS机运行状态检查;自助补卡机运行状态检查;水控管理机运行状态检查;商务网关运行状态检查;控水器运行状态检查;门禁设备运行状态检查;
故障处理:一卡通系统故障的检测、分析、排除与恢复;一卡通系统事件、故障排除、恢复结果确认;故障处理报告;故障硬件设备报修、送修(联络第三方厂商)。
所述多媒体、视频会议、广播系统设备运维服务程序子单元用于加载所述存储器11中多媒体相关运维程序指令以对多媒体、视频会议、广播系统进行定期巡检、日常检查以及故障处理。具体为:
日常检查:投影仪运行状态检查;投影幕检查;广播主机、终端控制器、广播播放终端、数字调谐器、MP3/CD播放器等设备状态检查;视频会议终端、多点控制单元MCU、视频会议服务器等设备运行状态检查
故障处理:多媒体系统、视频会议系统、广播系统设备故障的检测、分析、排除与恢复;故障处理报告;故障硬件设备报修、送修(联络第三方厂商)。
进一步地,所述软件运维服务模块123包括基础软件运维服务程序单元、应用软件运维服务程序单元以及其它软件运维服务程序单元,其中:
基础软件运维服务程序单元包括分别与所述存储器11连接的数据库运维服务程序子单元和操作系统运维服务程序子单元;
数据库运维服务程序子单元用于加载所述存储器11中与数据库运维服务相关程序以对数据库进行日常维护、故障处理以及数据库监控。具体为:
日常维护:数据库备份;数据库日志检查;数据库运行情况检查
故障处理:故障的排除、恢复(联络第三方厂商)日志分析、跟踪处理(联络第三方厂商);故障处理报告;
数据库监控:数据文件磁盘占用情况检查;数据库事务日志备份;数据库控制文件备份;数据库参数文件备份;数据库账户权限管理(联络第三方厂商);检查实例的进程(联络第三方厂商);检查有无资源死锁(联络第三方厂商)。
操作系统运维服务程序子单元用于加载所述存储器11中与数据库运维服务相关程序以对操作系统进行日常维护、故障处理、操作系统监控以及从操作系统升级。具体为:
日常维护:操作系统用户管理;操作系统用户权限管理;系统账号检查;操作系统漏洞检查;操作系统日志清理;
故障处理:故障的排除、恢复;日志分析、跟踪处理;故障处理报告;
操作系统监控:CPU、内存检查;性能分析;
优化升级:补丁安装。
所述应用软件运维服务程序单元用于按约定周期定期对应用业务系统运行状态进行检查,完成巡检报告;对出现的应用业务系统故障联系厂商进行解决处理,跟踪处理的进展及结果反馈
所述其它软件运维服务程序单元包括虚拟化软件运维服务程序子单元、校园综合保修管理系统运维服务程序子单元、校园微信服务系统运维服务程序子单元、校园微信管理系统运维服务程序子单元以及桌面应用软件运维服务程序子单元,其中:
虚拟化软件运维服务程序子单元用于加载所述存储器11中与虚拟化软件运维相关程序以对虚拟化软件进行日常维护、系统巡检、故障处理、软件升级、数据迁移以及数据保护。具体为:
日常维护:虚拟机的架设;虚拟机的回收;虚拟机相关资源配置;
系统巡检:虚拟化平台软件运行状态进行检查和分析;虚拟化平台逻辑链路进行检查和分析;对虚拟机运行过程中产生的临时文件进行处理;
故障处理:虚拟化平台故障和问题进行分析和排除;
升级:虚拟机化平台版本升级;
数据迁移:基于虚拟机应用数据迁移;虚拟资源规划调整跨数据分区数据迁移;基于虚拟化平台不同设备之间的数据迁移;
数据保护:基于系统级的数据备份与;基于文件级的数据备份。
校园综合保修管理系统运维服务程序子单元用于加载所述存储器11中与校园综合保修给管理系统运维相关程序以按约定周期定期对智圣校园综合报修管理系统运行状态进行检查和分析,完成巡检报告;对客户申报的智圣校园综合报修管理系统故障提供远程支持,尽快修复故障,提供报告;针对客户智圣校园综合报修管理系统运行情况,给出优化建议并实施,提升性能;根据客户业务发展趋势,评估应用当前及应有性能,提出性能建议。
校园微信服务系统运维服务程序子单元用于加载所述存储器11中与校园微信服务系统运维相关程序以按约定周期定期对智圣掌上校园微信服务系统运行状态进行检查和分析,完成巡检报告;对客户申报的智圣掌上校园微信服务系统故障提供远程支持,尽快修复故障,提供报告;针对客户智圣掌上校园微信服务系统运行情况,给出优化建议并实施,提升性能;根据客户业务发展趋势,评估应用当前及应有性能,提出性能建议。
校园微信管理系统运维服务程序子单元用于加载所述存储器11中与校园微信管理系统运维相关程序以按约定周期定期对智圣掌上校园微信管理系统运行状态进行检查和分析,完成巡检报告;对客户申报的智圣掌上校园微信管理系统故障提供远程支持,尽快修复故障,提供报告;针对客户智圣掌上校园微信管理系统运行情况,给出优化建议并实施,提升性能;根据客户业务发展趋势,评估应用当前及应有性能,提出性能建议。
桌面应用软件运维服务程序子单元用于加载所述存储器11中与桌面应用软件运维相关程序以对终端用户申报的办公软件故障提供技术支持。提供软件故障原因分析、软件故障解决;提供办公软件、工具软件(如:office等)、专用系统、防毒软件、驱动程序等的安装及设置;提供软件版本变更的风险评估、软件版本变更的实施;提供防毒软件版本检查、防毒软件更新、补丁安装、杀毒处理等。
如图3所示,本实施例还公开了一种运维服务方法,包括如下步骤:
通过一线驻点客户端20向综合管理系统10发送运维事件信息;
一线驻点客户端20根据综合管理系统10返回的运维内容及响应时间对运维事件进行处理;
在一线驻点客户端20无法解决一线驻点处提出的技术问题时,向综合管理系统10发送二线技术支持请求;
所述综合管理系统10用于:
根据接收的二线技术支持请求,指派二线技术支持团队进行运维事件处理;
实时跟踪记录运维事件的处理进度,并对运维过程及结果进行考核;
对运维对象进行监控,并将预警事件生成运维事件进行运维处理;
定期对核心设备及业务系统进行巡检;
对用户发出的处理请求进行在线解答。
对运维事件的管理包括事件登记、事件指派、事件处理、事件关闭以及事件回访;
所述问答管理包括问题跟踪、趋势分析、问题解答、问题回顾以及问题录入。
需要说明的是,通过跟踪分析能够持跟进故障事件的处理进度,过程、结果、回访,以月为单位,对本月整体故障处理的及时率、解决率、满意率等SLA考核项进行统计汇总,直观展示当月运维工作整体情况。
变更管理包括变更方案、回退计划、用户确认、变更执行、变更测试以及变更录入。
发布管理包括发布计划、更新内容、发布授权、发布退回以及发布录入。
资产管理包括设备统计、机柜统计、光缆统计、端口统计以及信息录入。
考核管理包括满意率、及时率以及完成率的考核。
进一步地,本实施例中还通过设置知识库,事件管理以及问答管理的信息均从知识库中调取,该知识库中存储知识库模板,对日常运维中遇到的常见故障、典型故障等进行收集归类,形成丰富的知识库,加快故障问题处理以及后备员工的学习参考。
需要说明的是,本发明的运维模块12运维范围和内容覆盖全面,从从基础线路到中间件到上层应用。采用一线驻点+二线技术支持的运维团队快速响应并解决问题,通过一线驻点团队客户现场办公,贴心服务,能够第一时间发现潜在需求或项目信息,反推公司集成类项目快速增长。通过ITSS运维系统进行运维考核,实现运维结果的可视化。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种运维服务系统,其特征在于,包括:一线驻点客户端以及综合管理系统,一线驻点客户端与综合管理系统连接;
所述一线驻点客户端布置在用户办公现场,一线驻点客户端根据综合管理系统发送的运维服务内容及响应时间对现场运维事件进行处理;
在一线驻点客户端无法解决现场运维事件时,综合管理系统指派二线技术支持团队至现场对运维任务进行处理;
其中,综合管理系统包括存储器,以及分别与所述存储器连接的运维模块、运维指标可视化模块、运维监控模块和云服务平台;
存储器存储有若干运维指令,该若干运维指令适用于运维模块、运维指标可视化模块、运维预警模块和云服务平台加载并执行;
运维模块与所述一线驻点客户端连接,并接收一线驻点客户端的请求产生运维服务内容及响应时间;
运维指标可视化模块与所述一线驻点客户端连接,以对一线驻点客户端对运维事件的处理进度进行追踪记录,得到处理结果;
运维监控模块与所述运维模块连接,运维监控模块将Zabbix中的报警事件自动同步至运维模块中生成运维事件,发送至一线驻点客户端进行跟踪处理;
云服务平台与所述运维指标可视化模块连接,对售后服务进行跟踪记录。
2.如权利要求1所述的运维服务系统,其特征在于,所述运维指标可视化模块包括进度跟踪单元、整理单元以及显示单元;
进度跟踪单元与所述运维模块连接,以对所述运维模块对于屋内事件的处理进度、过程以及结果进行跟进,并进行回访;
整理单元与所述进度跟踪单元连接,整理单元根据设定的时间节点对某时间段内的运维事件处理结果进行统计汇总;
显示单元与所述整理单元连接,以将运维事件处理结果的统计汇总结果进行显示。
3.如权利要求1所述的运维服务系统,其特征在于,所述运维监控模块包括监控单元和预警单元;
监控单元与预警单元连接,监控单元用于对运维对象进行监控并在运维对象发生故障时生成预警事件发送至预警单元;
预警单元与所述运维模块连接,预警单元将预警事件同步至所述运维模块,生成运维事件。
4.如权利要求1所述的运维服务系统,其特征在于,所述云服务平台售后跟踪单元和线上服务单元;
跟踪单元用于对用户的售后服务进行跟踪;
线上服务单元用于供用户及运维工程师进行注册,并支持线上问题咨询、技术支持、线上交易、线下网络割接。
5.如权利要求1所述的运维服务系统,其特征在于,所述综合管理系统还包括知识库体系;
所述知识库体系用于对运维事件的常见故障、典型故障进行收集归类,并对每类故障提供相应的解决方案以供用户查找。
6.如权利要求1所述的运维服务系统,其特征在于,所述系统还包括即时通讯设备,该即时通讯设备包括事件管理模块、请求管理模块、知识问答模块以及售后反馈模块;
事件管理模块用于对用户提交的运维事件的进展进行跟踪管理;
请求管理模块用于提交运维事件处理请求以及对运维事件的处理进程进行查询;
知识问答模块用于根据用户请求,提供常见故障类型及对应的解决策略;
售后反馈模块用于将用户提交的售后反馈意见发送至所述综合管理系统。
7.如权利要求3所述的运维服务系统,其特征在于,所述综合管理系统还包括定期巡检模块,该定期巡检模块用于定期对核心设备及业务系统进行巡检。
8.如权利要求1所述的运维服务系统,其特征在于,所述运维模块按照设定的安全运维规范进行运维;
所述安全运维规范包括网络设备配置规范、安全设备配置规范、服务器安全配置规范、数据备份规范、密码保存规范以及协议保密。
9.如权利要求8所述的运维服务系统,其特征在于,所述运维模块包括基础环境运维模块、硬件运维服务模块、软件运维服务模块以及特色运维服务模块;
基础环境运维服务程序模块用于进行系统基础环境的运维;
硬件运维服务模块用于进行系统中硬件运维服务;
软件运维服务模块用于进行系统中软件运维服务;
特色运维服务模块用于进行系统中特色运维服务。
10.一种运维服务方法,其特征在于,包括:
通过一线驻点客户端向综合管理系统发送运维事件信息;
一线驻点客户端根据综合管理系统返回的运维内容及响应时间对运维事件进行处理;
在一线驻点客户端无法解决一线驻点处提出的技术问题时,向综合管理系统发送二线技术支持请求;
所述综合管理系统用于:
根据接收的二线技术支持请求,指派二线技术支持团队进行运维事件处理;
实时跟踪记录运维事件的处理进度,并对运维过程及结果进行考核;
对运维对象进行监控,并将预警事件生成运维事件进行运维处理;
定期对核心设备及业务系统进行巡检;
对用户发出的处理请求进行在线解答。
CN201810381647.1A 2018-04-25 2018-04-25 一种运维服务系统及方法 Pending CN108847953A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810381647.1A CN108847953A (zh) 2018-04-25 2018-04-25 一种运维服务系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810381647.1A CN108847953A (zh) 2018-04-25 2018-04-25 一种运维服务系统及方法

Publications (1)

Publication Number Publication Date
CN108847953A true CN108847953A (zh) 2018-11-20

Family

ID=64212288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810381647.1A Pending CN108847953A (zh) 2018-04-25 2018-04-25 一种运维服务系统及方法

Country Status (1)

Country Link
CN (1) CN108847953A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657815A (zh) * 2018-12-14 2019-04-19 河南飙风信息科技有限公司 一种自动化运维企业主机管理系统
CN110113206A (zh) * 2019-05-05 2019-08-09 黑龙江亿林网络股份有限公司 一种通信网络用维护系统
CN110414774A (zh) * 2019-06-11 2019-11-05 华迪计算机集团有限公司 一种运维监控系统及方法
CN110515864A (zh) * 2019-08-14 2019-11-29 中国建设银行股份有限公司 基于运维终端向大型主机自动提交作业的方法及装置
CN110716847A (zh) * 2019-10-10 2020-01-21 云南电网有限责任公司信息中心 业务系统运维缺陷处理方法
CN111027722A (zh) * 2019-11-26 2020-04-17 常州工业职业技术学院 一种企业标签化运维方法
CN111147293A (zh) * 2019-12-19 2020-05-12 深圳市光联世纪信息科技有限公司 一种自助网络管理系统
CN111461573A (zh) * 2020-04-23 2020-07-28 杭州弧聚科技有限公司 一种高效低成本的复合型网络运维服务系统及方法
CN113032235A (zh) * 2021-03-31 2021-06-25 上海天旦网络科技发展有限公司 基于系统指标与命令调用日志的运维措施推荐方法及系统
CN116070866A (zh) * 2023-02-03 2023-05-05 国任财产保险股份有限公司 一种用于业务系统的报障管理系统
CN118227596A (zh) * 2024-05-24 2024-06-21 山西能源学院 一种机房实验室监管控制方法、装置、电子设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106452829A (zh) * 2016-01-21 2017-02-22 华南师范大学 一种基于bcc‑knn的云计算中心智能运维方法及系统
CN106936648A (zh) * 2017-05-05 2017-07-07 合肥智圣系统集成有限公司 一种it系统的故障监控方法及系统
US20170206483A1 (en) * 2016-01-15 2017-07-20 Level 3 Communications, Llc Workflow storage, processing, management, and task creation system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170206483A1 (en) * 2016-01-15 2017-07-20 Level 3 Communications, Llc Workflow storage, processing, management, and task creation system
CN106452829A (zh) * 2016-01-21 2017-02-22 华南师范大学 一种基于bcc‑knn的云计算中心智能运维方法及系统
CN106936648A (zh) * 2017-05-05 2017-07-07 合肥智圣系统集成有限公司 一种it系统的故障监控方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刁倩等: ""电力信息系统三线运维管控平台研究与建设"", 《电力信息与通信技术》 *
李玉琳等: ""物业小区泵站监控管云服务平台"", 《数码设计》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657815A (zh) * 2018-12-14 2019-04-19 河南飙风信息科技有限公司 一种自动化运维企业主机管理系统
CN110113206A (zh) * 2019-05-05 2019-08-09 黑龙江亿林网络股份有限公司 一种通信网络用维护系统
CN110414774A (zh) * 2019-06-11 2019-11-05 华迪计算机集团有限公司 一种运维监控系统及方法
CN110515864A (zh) * 2019-08-14 2019-11-29 中国建设银行股份有限公司 基于运维终端向大型主机自动提交作业的方法及装置
CN110716847A (zh) * 2019-10-10 2020-01-21 云南电网有限责任公司信息中心 业务系统运维缺陷处理方法
CN111027722B (zh) * 2019-11-26 2023-08-01 常州工业职业技术学院 一种企业标签化运维系统
CN111027722A (zh) * 2019-11-26 2020-04-17 常州工业职业技术学院 一种企业标签化运维方法
CN111147293A (zh) * 2019-12-19 2020-05-12 深圳市光联世纪信息科技有限公司 一种自助网络管理系统
CN111461573A (zh) * 2020-04-23 2020-07-28 杭州弧聚科技有限公司 一种高效低成本的复合型网络运维服务系统及方法
CN113032235A (zh) * 2021-03-31 2021-06-25 上海天旦网络科技发展有限公司 基于系统指标与命令调用日志的运维措施推荐方法及系统
CN113032235B (zh) * 2021-03-31 2022-11-04 上海天旦网络科技发展有限公司 基于系统指标与命令调用日志的运维措施推荐方法及系统
CN116070866A (zh) * 2023-02-03 2023-05-05 国任财产保险股份有限公司 一种用于业务系统的报障管理系统
CN118227596A (zh) * 2024-05-24 2024-06-21 山西能源学院 一种机房实验室监管控制方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
CN108847953A (zh) 一种运维服务系统及方法
CN108667666A (zh) 一种基于可视化技术的智能运维方法及其系统
US7694189B2 (en) Method and system for remote monitoring subscription service
US10019822B2 (en) Integrated infrastructure graphs
CN103473626A (zh) 一种基于调度数据网集中运维系统的安全防护方法
CN110505102B (zh) 电力信息通信融合监控与服务标准化管理平台系统及方法
Endo et al. Minimizing and managing cloud failures
US8214483B2 (en) Method and system for continuous availability subscription service
CN105262210A (zh) 一种变电站网络安全性分析预警系统和方法
CN101652999A (zh) 用于管理实况视频数据的系统和方法
US7739554B2 (en) Method and system for automatic resolution and dispatching subscription service
JP2022551978A (ja) データセンタオペレーションまたはクラウドインフラストラクチャで仮想現実または拡張現実を使用するためのシステムおよび方法
CN105991771A (zh) 物联网消防系统
WO2022007299A1 (zh) 一种基于微服务架构的电网故障诊断方法及存储介质
CN109801416A (zh) 一种基于大数据分析的共建共维机房管理方法
CN116187774A (zh) 一种数据中心人工智能运维管理系统
CN111509840A (zh) 一种基于电网安全运维的无线集群可视化系统及方法
Jayaswal Administering data centers: servers, storage, and voice over IP
CN111082998A (zh) 一种运维监控校园汇聚层的架构系统
Rocha et al. Analyzing the impact of power infrastructure failures on cloud application availability
CN109347205A (zh) 一种智能控制供电设备及其实现系统
CN109598641A (zh) 一种保供电工作管控系统
CN116991678A (zh) 一种数据中心智能运维系统
KR102231648B1 (ko) 소방시설의 점검 이력 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록 매체
CN116843168A (zh) 一种公司级监控系统及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181120

RJ01 Rejection of invention patent application after publication