CN103473710A - 一种集中运维系统的故障分级处理方法 - Google Patents

一种集中运维系统的故障分级处理方法 Download PDF

Info

Publication number
CN103473710A
CN103473710A CN2013103646143A CN201310364614A CN103473710A CN 103473710 A CN103473710 A CN 103473710A CN 2013103646143 A CN2013103646143 A CN 2013103646143A CN 201310364614 A CN201310364614 A CN 201310364614A CN 103473710 A CN103473710 A CN 103473710A
Authority
CN
China
Prior art keywords
fault
failure
alarm
data
maintenance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013103646143A
Other languages
English (en)
Other versions
CN103473710B (zh
Inventor
郎燕生
邢颖
张印
白洋
刘升
王少芳
邹昱
窦成龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Original Assignee
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI filed Critical State Grid Corp of China SGCC
Priority to CN201310364614.3A priority Critical patent/CN103473710B/zh
Publication of CN103473710A publication Critical patent/CN103473710A/zh
Application granted granted Critical
Publication of CN103473710B publication Critical patent/CN103473710B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及电力系统领域的处理方法,具体涉及一种集中运维系统的故障分级处理方法。集中运维系统监视国调、分调和省调的智能电网调度技术支持系统运行工况类、电网基本数据类、安全防护系统类和环境及辅助设备类数据。针对各级网省调度中心监视的大量数据,运维中心为提高故障处理效率,通过对故障进行分级,定义不同级别的故障解除所需的响应时间,启动相应级别的故障处理预案,在运维中心实现即时开展各级故障的处理工作,减轻各级网省调度中心的运维压力,提高系统运行的可靠性和安全性。

Description

一种集中运维系统的故障分级处理方法
技术领域
本发明涉及电力系统领域的处理方法,具体涉及一种集中运维系统的故障分级处理方法。
背景技术
智能电网调度技术支持系统在一体化基础平台的基础上对大电网运行进行全景监控,提供在线综合预警及智能决策,提升了驾驭大电网能力,因此智能电网调度技术支持系统的正常运行事关重大。各级调度中心都对本地智能电网调度技术支持系统的运行状态进行实时监控,但是各地维护人员对系统故障的诊断和定位问题往往缺乏专业经验,一旦出现问题就需要及时联系各方厂家进行定位,对人力资源造成浪费;在维护过程中运维人员也经常遇到同一故障在不同地区发生,需要奔波各地,重复处理,大大提高了运维的成本,降低了维护工作的效率。因此通过集中运维中心对各地系统进行统一监控和故障处理和备案的工作就会减轻各级网省调度中心的维护工作压力,并且能够提高运维工作的效率。
集中运维中心监控了国调、分调和省调智能电网调度技术支持系统各功能是否正常运行,无论是维护的工作量还是监视的数据量都是复杂和庞大的。如果按照常规维护方法,哪里出现问题,就到哪里解决的方式,无论从人力和物力的投入都将是网省公司投入的倍数关系,因此对当前各网省在线运行系统的集中监控和维护方式就提出了更高的要求。
发明内容
针对现有技术的不足,本发明的目的是提供一种集中运维系统的故障分级处理方法,在调度数据网信息量不断增加的环境下做出事故判断和应急启动解决方案是极为重要的工作。对事故进行有效地判断,能够帮助运维值班人员在繁杂的系统运行信息处理工作中变得快捷,提高系统故障处理的能力和效率,从而保障各级网省智能电网调度技术支持系统的安全可靠运行。
本发明的目的是采用下述技术方案实现的:
本发明提供一种集中运维系统的故障分级处理方法,其改进之处在于,所述方法用于实现对国调、分调及省调智能电网调度技术支持系统的软、硬件集中监视、集中维护和集中管理;所述方法包括下述步骤:
(1)明确日常故障监视对象;
(2)定义调度技术支持系统的故障分级和响应时间;
(3)定义不同级别的故障对应的告警级别;
(4)对不同级别的故障按照对应的处理预案进行处理;
(5)集中运维系统故障分级处理,包括系统故障监控环节和故障分级处理环节两个步骤;
(6)记录故障处理内容和结果,对故障处理进行备案并通告。
优选的,所述步骤(1)中,集中运维中心日常故障监视对象包括:
集中运维系统采集国调、分调和省调的智能电网调度技术支持系统中的数据;所述数据包括系统运行工况类、电网基本数据类、安全防护系统类和环境及辅助设备类数据;对这四类数据进行日常轮询监视,若发现异常状况,依据故障级别分别提供分级告警服务,并进入处理流程。
优选的,所述步骤(2)中,调度技术支持系统监视的故障分级和响应时间包括:
1)I级故障:系统崩溃导致业务停止、数据丢失;响应时间为10分钟内提交故障处理方案;
2)II级故障:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作;响应时间为1小时内提交故障处理方案;
3)III级故障:出现系统报错或警告,但业务系统能继续运行且性能不受影响;响应时间为6小时内提交故障处理方案。
优选的,所述步骤(3)中,对应于故障级别定义的告警级别包括:
A、I级告警:连续提示告警,并通过值班手机转发告警给当地值班员,直到故障消除后,告警消除;
B、II级告警:周期弹出告警窗,直到故障消除后,告警消除;
C、III级告警:告警记录,告警灯闪烁,直到故障消除后,告警消除。
优选的,所述步骤(4)中,不同级别的故障对应的处理预案包括:
①常规维护:若获取的异常信息达不到故障级别,则依照厂家提供的维护预案进行常规维护,若该异常仍然存在,则联系相关厂家进一步处理;
②故障处理:通过日常监视和故障告警发现系统故障,或接到各系统当地值班人员的系统故障处理请求时,对故障进行及时处理,若该故障存在将影响系统稳定运行及生产安全,则判定为重大故障,转入紧急响应处理流程;对于不影响系统稳定运行及生产安全的故障,进入普通故障处理流程进行处理,在规定的故障处理响应时间之内给出解决方案;
③紧急响应:发现重大故障后,对故障进行记录并上报值班负责人和故障现场负责人,依照预案组织人员进行故障定位及排除工作,问题解决后协调各功能开发人员分析故障原因,形成故障报告;若不能规定的故障处理响应时间之内解决故障,则根据预案采取临时措施用于防止故障影响扩大,并协调厂家到运维中心或事故现场进行处理;
④临时措施:如果运维中心在监视过程中遇到特殊情况,根据维护预案不能在故障处理响应时间内解决故障问题时,特制定了临时措施;此临时措施由各功能的开发厂商提供。制定的原则如下:
第一、在不影响系统其它功能正常运行的情况下,如能防止故障影响扩大化,可先停止导致故障出现的功能;及时通知该功能的开发厂商,并向上级主管部门汇报情况,由主管部门、开发厂商和运维中心三方协作处理;
第二、如果导致该故障出现的原因一时难以确定,而故障所产生的影响只限于该应用自身,则可以先不停止该功能的运行,备份故障断面;及时通知该功能的开发厂商,并向上级主管部门汇报情况,由主管部门、开发厂商和运维中心三方协作处理;
第三、如果在解决故障的过程中,由于复杂原因,导致处理时出现新的故障问题,则及时通知该功能的开发厂商,并向上级主管部门汇报情况,由主管部门、开发厂商和运维中心三方协作处理。
优选的,所述步骤(5)中,运维系统故障监控环节包括下述步骤:
<1>集中运维系统采集和监视国调、分调和省级调度中心的系统统运行工况、电网基本数据、安全防护系统的运行状态和环境及辅助设备参数;
<2>对以上四类数据的监视提供故障分类告警服务,系统分别对接收的数据进行状态诊断,正常情况下不发出告警消息,当系统判断出数据异常时,根据故障定义的故障级别,发送不同的告警服务;
<3>集中运维系统提供智能电网调度技术支持系统运行状态诊断工具,通过三种方式对监测的数据进行分类汇总:
a、定时扫描系统接收的各类数据,如果数据有异常会提示运维人员,同时监控系统会进行故障识别;
b、如果接收到的数据和运行状态有异常,集中运维系统运行状态诊断工具会进行故障识别,同时自动进行故障分级告警;
c、运维人员对各级智能电网调度技术支持系统运行状态进行人工监视,根据集中运维系统对故障识别的结果做出相应的判断,并进入故障分级处理环节;
<4>客户通过电话请求加急处理,直接启动应急预案。
优选的,所述步骤(5)中,运维系统的故障分级处理环节,包括下述步骤:
I、当集中运维系统发出告警消息时,和发生系统故障的当地负责人员确认告警消息;
II、一经确认告警没有误报时后,按照故障级别,启动故障处理的处理预案;并且向上级领导汇报事故处理进展;
III、向当地故障的智能电网调度技术支持系统在规定的故障处理响应时间及时提供解决方案,并随时提供远程技术支持;
IV、如果确认为告警误报,关闭告警消息,检查告警误报的原因,进行技术处理和备案,并通告各级调度部门;
V、跟进故障处理的过程,当故障解决后关闭告警消息;
VI、对故障原因进行分析,并记录故障处理方案和结果,对故障记录进行备案,并发送给各级调度自动化部门保存;
VII、故障记录备案定时导出,提供给软件检测中心和系统仿真中心。
优选的,所述步骤(5)中系统故障监控环节采用集中运维系统三级智能告警监视方法实现,步骤(5)中故障分级处理环节为运维人员根据具体的告警级别进行人工维护方式。
优选的,所述步骤(6)中,根据事件类型将事件进行分类,并制定不同的问题记录模板,事件分为硬件问题、系统软件类和系统缺陷类问题;
对于硬件问题、系统软件类一般问题(例如硬件故障、软件在线计算程序非正常退出等)的处理流程为问题记录、问题提交或处理,使该类问题问题解决具备直接、快速和实时的特点;
系统功能缺陷类问题(例如人机界面响应时间过长,或在软件测试过程中出现的各种未能按设计规范进行实现的功能)需要经过逐级提交、诊断、确认、处理和回复等环节,处理解决需要有专门项目组的分析确认,问题有解决方案后,将解决方案反馈给用户,该类问题的处理需严谨、规范、标准,保证系统的安全稳定运行。
对于出现频率较高或影响比较大或争论比较多的问题及时提交统计分析报告,便于发现系统的共性问题及缺陷,提高协助运维中心的工作效率。统计分析报告的编写要求主题突出,结构严谨,条理清晰,文字简洁,且具备准确性、时效性、针对性、逻辑性的标准。
与现有技术比,本发明达到的有益效果是:
1、本发明的提供的集中运维系统的故障分级处理方法,实现对国调、分调及省调智能电网调度技术支持系统的软、硬件集中监视、集中维护、集中管理;提供高效的远程维护技术手段,协助各地调度自动化部门快速诊断、处理系统应用软件的异常和故障;建立与生产厂家、科研机构和检测中心的联动接口,为科研开发、仿真试验及系统检测提供了技术支撑;建立厂家横向联动机制,大大突显了集中运维系统应急响应的优越性,与国调、分调和省调智能电网调度技术支持系统的维护工作形成联动、互备的关系;
2、定义了调度技术支持系统的故障分级、响应时间和分级告警;
3、制定不同级别的故障对应的处理预案,规范了故障处理的流程;
4、记录故障处理内容和结果,为仿真试验和软件检测提供了依据;
5、为各级调度自动化部门及时提供远程技术服务,加强了调度自动化支持系统在线运行的稳定性;
6、规范了调度自动化支持系统技术服务,提高了技术服务的效率。
附图说明
图1是本发明提供的集中运维系统的故障分级处理方法的流程图;
图2是本发明提供的系统故障监控环节流程图;
图3是本发明提供的故障分级处理环节流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的详细说明。
本方法针对省网调度中心同时送发的大量数据进行统一监控,为了满足集中运维故障处理迅速响应的要求,需要对各种故障进行分类、分级、报警,制定不同的故障处理应急预案。当故障出现的时候,监控软件发出告警信息,运维人员可以针对故障级别和告警级别即时启动相应的预案进行统一处理,大大提高故障处理的效率。同时对各级网省调度技术支持系统是同时监控的,多地系统(两地以上)同时出现一级故障的机率非常小,因此应急预案可以不做顺序考虑,根据告警的时间顺序和级别运维人员分别进行处理,因此即使多地系统同时出现故障,启动预案解决故障的时间也不会有延误,可以满足集中运维系统的要求。
集中运维系统的功能包括:
硬件部署:包括调度数据网介入和集中运维业务;
软件应用:包括系统运行监视、维护信息管理、工作站常用软件的安装和可视化综合展示;
人员组织:包括运维工作人员组织和厂家维护人员组织,其中运维工作人员包括管理人员、值班人员和维护人员;
运维流程:包括日常监视、常规维护、故障处理、紧急响应以及统计分析报告;
安全保障:包括安全管理制度和安全技术措施,其中安全管理制度包括人员管理制度和设备管理制度;其中设备安全措施和操作安全措施。
本发明提供的集中运维系统的故障分级处理方法的流程图如图1所示,包括下述步骤:
(1)明确日常故障监视对象:
集中运维系统采集国调、分调和省调的智能电网调度技术支持系统中的数据主要包括系统运行工况类、电网基本数据类、安全防护系统类和环境及辅助设备类。对这四类数据采用的监视过程分为系统故障监控环节和,系统故障监控环节主要依靠智能告警的方法实现,依据故障级别分别提供分级告警服务,若发现需要处理的异常状况,进入故障分级处理环节,并进入相应人工处理流程。
(2)定义调度技术支持系统的故障分级和响应时间:
1)I级故障:其具体现象为:系统崩溃导致业务停止、数据丢失。
2)II级故障:其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。
3)III级故障:其具体现象为:出现系统报错或警告,但业务系统能继续运行且性能不受影响。故障分级和响应时间如表1所示。
表1  故障分级和响应时间表
故障级别 响应时间 告警级别 故障预案级
I级 10分钟内提交故障处理方案 I级 紧急响应
II级 1小时内提交故障处理方案 II级 故障处理
III级 6小时内提交故障处理方案 III级 常规维护
(3)定义对应于故障级别定义的告警级别,包括:
A、I级告警:连续提示告警,并通过值班手机转发告警给当地值班员,直到故障消除后,告警消除。
B、II级告警:周期弹出告警窗,直到故障消除后,告警消除。
C、III级告警:告警记录,告警灯闪烁,直到故障消除后,告警消除。
(4)制定不同级别的故障对应的处理预案:
①常规维护:
若获取的异常信息达不到故障级别,则依照厂家提供的维护预案进行常规维护,若该异常仍然存在,则联系相关厂家进一步处理。
对各渠道获取的异常信息进行记录、跟踪、统计和分析,找出问题发生的根源。定期向国调中心、各级调度部门和相关厂家发布各项问题的处理记录及分析报告,供各单位参考,以杜绝同样的问题反复发生。
对运维中心的系统进行常规维护,保障运维中心网络通畅、信息安全及运维功能正常,并做好相关数据的备份工作。
②故障处理:
值班人员通过日常监视和故障告警发现系统故障,或接到各系统当地值班人员的系统故障处理请求时,对故障进行及时处理,若该故障存在将影响系统稳定运行及生产安全,则判定为重大故障,转入紧急响应处理流程;对于不影响系统稳定运行及生产安全的故障,进入普通故障处理流程进行处理,在规定的响应时间之内给出解决方案。
针对普通故障处理措施,根据厂家提供的故障快速定位工具和维护手册,对故障进行快速定位和排除,并填写处理记录;若无法解决该故障则联系厂家的技术支持人员协同解决。
③紧急响应:
尽管针对系统日常监视和维护制定了详细的方案,但在系统实际运行中,意外情况将难以完全避免。系统运维紧急响应机制是应对严重影响系统稳定运行或危害生产安全的故障,如数据丢失、系统网络中断、服务器断电等,进行快速响应和处理,在最短时间内恢复系统稳定运行,将损失降到最低。下面,针对紧急情况制定基本响应及处理措施。
值班人员发现重大故障后,立即对故障进行记录并上报值班负责人和故障现场的负责人,集中运维中心值班负责人依照预案组织人员立即进行故障定位及排除工作,问题解决后协调各功能开发人员分析故障原因,形成故障报告;若不能规定的故障处理响应时间之内解决故障,则根据预案采取临时措施用于防止故障影响扩大,立即协调厂家到运维中心或事故现场进行处理。
④临时措施:如果运维中心在监视过程中遇到特殊情况,根据维护预案不能在故障处理响应时间内解决故障问题时,特制定了临时措施。此临时措施由各功能的开发厂商提供,制定的原则如下:
第一、在不影响系统其它功能正常运行的情况下,如能防止故障影响扩大化,可先停止导致故障出现的功能;及时通知该功能的开发厂商,并向上级主管部门汇报情况,由主管部门、开发厂商和运维中心三方协作处理;
第二、如果导致该故障出现的原因一时难以确定,而故障所产生的影响只限于该应用自身,则可以先不停止该功能的运行,备份故障断面;及时通知该功能的开发厂商,并向上级主管部门汇报情况,由主管部门、开发厂商和运维中心三方协作处理;
第三、如果在解决故障的过程中,由于复杂原因,导致处理时出现新的故障问题,则及时通知该功能的开发厂商,并向上级主管部门汇报情况,由主管部门、开发厂商和运维中心三方协作处理。
(5)集中运维系统故障分级处理具体实施步骤:
故障监控环节:采用集中运维系统三级智能告警监视方法实现。
<1>集中运维系统采集和监视国调、分调和省级调度中心的系统运行工况、电网基本数据、安全防护系统的运行状态和环境及辅助设备参数;
<2>对以上四类数据的监视提供故障分类告警服务,系统分别对接收的数据进行状态诊断,正常情况下不发出告警消息,一旦系统判断出数据异常,根据故障定义的故障级别,发送不同的告警服务。
<3>集中运维系统提供系统运行状态诊断工具,通过三种方式对监测的数据进行分类汇总:
a、定时扫描系统接收的各类数据,如果数据有异常会提示运维人员,同时监控系统会进行故障识别;
b、如果接收到的数据和运行状态有异常,系统运行状态诊断工具会进行故障识别,同时自动进行故障分级告警;
c、运维人员对各级系统运行状态进行人工监视,根据系统对故障识别的结果做出相应的判断,并进入故障分级处理环节;
<4>为了提供快速解决方案,提高运维的效率,如果各级调度中心遇到影响重大的紧急情况,可以随时通过电话请求加急处理,直接启动应急预案。本发明提供的系统故障监控环节流程图如图2所示,从图中可以看出,系统状态监控-运行状态诊断监控工具-监控系统进行故障识别依次进行,如客户打电话请求紧急事件时,直接启动应急响应;与系统状态监控-运行状态诊断监控工具-监控系统进行故障识别为并行关系。
本发明提供的故障分级处理环节流程图如图3所示,故障分级处理环节用于对不同级别的故障按照对应的处理预案进行处理,包括下述步骤:
系统在进行完故障识别同时会发出故障分级告警信息,此时进入故障分级处理环节,这一部分工作需要专业运维人员控制。
I、当集中运维系统发出告警消息时,要立即和发生系统故障的当地负责人员确认告警消息;
II、一经确认后,按照故障级别,立即启动故障处理的解决预案;并且向上级领导汇报事故处理进展;
III、智能电网调度技术支持系统,在规定的故障处理响应时间及时提供解决方案,并随时提供远程技术支持;
IV、如果确认为告警误报,关闭告警消息,检查告警误报的原因,进行技术处理和备案,并通告各级调度部门;
V、跟进故障处理的过程,当故障解决后关闭告警消息;
VI、对故障原因进行分析,并记录故障处理方案和结果,对故障记录进行备案,并发送给各级调度自动化部门保存;
VII、故障记录备案定时导出,提供给软件检测中心和系统仿真中心。
(6)记录故障处理内容和结果,对故障处理进行备案并通告:
根据事件类型将事件进行分类,并制定不同的问题记录模板,总体可分为硬件问题、系统软件类一般问题、系统缺陷类问题。对于硬件问题、系统软件类一般问题的处理流程为问题记录、问题提交或处理,使该类问题问题解决具备直接、快速和实时的特点;系统缺陷类问题是指涉及到系统相应环节的确认修改,需要经过逐级提交、诊断、确认、处理和回复等环节,处理解决需要有专门项目组的分析确认,问题有解决方案后,将解决方案反馈给用户,该类问题的处理需严谨、规范、标准,保证系统的安全稳定运行。
对于出现频率较高或影响比较大或争论比较多的问题及时提交统计分析报告,便于发现系统的共性问题及缺陷,提高协助运维中心的工作效率。统计分析报告的编写要求主题突出,结构严谨,条理清晰,文字简洁,且具备准确性、时效性、针对性、逻辑性的标准。
本发明提供的一种集中运维系统的故障分级处理方法,集中运维系统监视国调、分调和省调的智能电网调度技术支持系统软件、硬件设备和通信信道的工作状态。针对各级网省调度中心监视的大量数据,运维中心为提高故障处理效率,通过对故障进行分级,定义不同级别的故障解除所需的响应时间,启动相应级别的故障处理预案,在运维中心实现即时开展各级故障的处理工作,减轻各级网省调度中心的运维压力,提高系统运行的可靠性和安全性。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。

Claims (9)

1.一种集中运维系统的故障分级处理方法,其特征在于,所述方法用于实现对国调、分调及省调智能电网调度技术支持系统的软、硬件集中监视、集中维护和集中管理;所述方法包括下述步骤:
(1)明确日常故障监视对象;
(2)定义调度技术支持系统的故障分级和响应时间;
(3)定义不同级别的故障对应的告警级别;
(4)对不同级别的故障按照对应的处理预案进行处理;
(5)集中运维系统故障分级处理,包括系统故障监控环节和故障分级处理环节两个步骤;
(6)记录故障处理内容和结果,对故障处理进行备案并通告。
2.如权利要求1所述的故障分级处理方法,其特征在于,所述步骤(1)中,集中运维中心日常故障监视对象包括:
集中运维系统采集国调、分调和省调的智能电网调度技术支持系统中的数据;所述数据包括系统运行工况类、电网基本数据类、安全防护系统类和环境及辅助设备类数据;对这四类数据进行日常轮询监视,若发现异常状况,依据故障级别分别提供分级告警服务,并进入处理流程。
3.如权利要求1所述的故障分级处理方法,其特征在于,所述步骤(2)中,调度技术支持系统监视的故障分级和响应时间包括:
1)I级故障:系统崩溃导致业务停止、数据丢失;响应时间为10分钟内提交故障处理方案;
2)II级故障:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作;响应时间为1小时内提交故障处理方案;
3)III级故障:出现系统报错或警告,但业务系统能继续运行且性能不受影响;响应时间为6小时内提交故障处理方案。
4.如权利要求1所述的故障分级处理方法,其特征在于,所述步骤(3)中,对应于故障级别定义的告警级别包括:
A、I级告警:连续提示告警,并通过值班手机转发告警给当地值班员,直到故障消除后,告警消除;
B、II级告警:周期弹出告警窗,直到故障消除后,告警消除;
C、III级告警:告警记录,告警灯闪烁,直到故障消除后,告警消除。
5.如权利要求1所述的故障分级处理方法,其特征在于,所述步骤(4)中,不同级别的故障对应的处理预案包括:
①常规维护:若获取的异常信息达不到故障级别,则依照厂家提供的维护预案进行常规维护,若该异常仍然存在,则联系相关厂家进一步处理;
②故障处理:通过日常监视和故障告警发现系统故障,或接到各系统当地值班人员的系统故障处理请求时,对故障进行及时处理,若该故障存在将影响系统稳定运行及生产安全,则判定为重大故障,转入紧急响应处理流程;对于不影响系统稳定运行及生产安全的故障,进入普通故障处理流程进行处理,在规定的故障处理响应时间之内给出解决方案;
③紧急响应:发现重大故障后,对故障进行记录并上报值班负责人和故障现场负责人,依照预案组织人员进行故障定位及排除工作,问题解决后协调各功能开发人员分析故障原因,形成故障报告;若不能规定的故障处理响应时间之内解决故障,则根据预案采取临时措施用于防止故障影响扩大,并协调厂家到运维中心或事故现场进行处理;
④临时措施:如果运维中心在监视过程中遇到特殊情况,根据维护预案不能在故障处理响应时间内解决故障问题时,特制定了临时措施;此临时措施由各功能的开发厂商提供。
6.如权利要求1所述的故障分级处理方法,其特征在于,所述步骤(5)中,运维系统故障监控环节包括下述步骤:
<1>集中运维系统采集和监视国调、分调和省级调度中心的系统统运行工况、电网基本数据、安全防护系统的运行状态和环境及辅助设备参数;
<2>对以上四类数据的监视提供故障分类告警服务,系统分别对接收的数据进行状态诊断,正常情况下不发出告警消息,当系统判断出数据异常时,根据故障定义的故障级别,发送不同的告警服务;
<3>集中运维系统提供智能电网调度技术支持系统运行状态诊断工具,通过三种方式对监测的数据进行分类汇总:
a、定时扫描系统接收的各类数据,如果数据有异常会提示运维人员,同时监控系统会进行故障识别;
b、如果接收到的数据和运行状态有异常,集中运维系统运行状态诊断工具会进行故障识别,同时自动进行故障分级告警;
c、运维人员对各级智能电网调度技术支持系统运行状态进行人工监视,根据集中运维系统对故障识别的结果做出相应的判断,并进入故障分级处理环节;
<4>客户通过电话请求加急处理,直接启动应急预案。
7.如权利要求1所述的故障分级处理方法,其特征在于,所述步骤(5)中,运维系统的故障分级处理环节,包括下述步骤:
I、当集中运维系统发出告警消息时,和发生系统故障的当地负责人员确认告警消息;
II、一经确认告警没有误报时后,按照故障级别,启动故障处理的处理预案;并且向上级领导汇报事故处理进展;
III、向当地故障的智能电网调度技术支持系统在规定的故障处理响应时间及时提供解决方案,并随时提供远程技术支持;
IV、如果确认为告警误报,关闭告警消息,检查告警误报的原因,进行技术处理和备案,并通告各级调度部门;
V、跟进故障处理的过程,当故障解决后关闭告警消息;
VI、对故障原因进行分析,并记录故障处理方案和结果,对故障记录进行备案,并发送给各级调度自动化部门保存;
VII、故障记录备案定时导出,提供给软件检测中心和系统仿真中心。
8.如权利要求1所述的故障分级处理方法,其特征在于,所述步骤(5)中系统故障监控环节采用集中运维系统三级智能告警监视方法实现,步骤(5)中故障分级处理环节为运维人员根据具体的告警级别进行人工维护方式。
9.如权利要求1所述的故障分级处理方法,其特征在于,所述步骤(6)中,根据事件类型将事件进行分类,并制定不同的问题记录模板,事件分为硬件问题、系统软件类和系统缺陷类问题。
CN201310364614.3A 2013-08-20 2013-08-20 一种集中运维系统的故障分级处理方法 Active CN103473710B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310364614.3A CN103473710B (zh) 2013-08-20 2013-08-20 一种集中运维系统的故障分级处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310364614.3A CN103473710B (zh) 2013-08-20 2013-08-20 一种集中运维系统的故障分级处理方法

Publications (2)

Publication Number Publication Date
CN103473710A true CN103473710A (zh) 2013-12-25
CN103473710B CN103473710B (zh) 2016-08-31

Family

ID=49798547

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310364614.3A Active CN103473710B (zh) 2013-08-20 2013-08-20 一种集中运维系统的故障分级处理方法

Country Status (1)

Country Link
CN (1) CN103473710B (zh)

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729444A (zh) * 2013-12-30 2014-04-16 清华大学 一种基于设备监测数据间潜在关系的异常数据检测方法
CN104486106A (zh) * 2014-12-04 2015-04-01 珠海金山网络游戏科技有限公司 一种分级告警服务系统
CN104503423A (zh) * 2014-11-21 2015-04-08 河南中烟工业有限责任公司 基于profinet的工业以太网控制系统故障诊断方法
CN104573962A (zh) * 2015-01-14 2015-04-29 国家电网公司 电网调度scada系统的信息分层共享处理方法
CN104680329A (zh) * 2015-03-17 2015-06-03 中国农业银行股份有限公司 一种运维问题发生原因确定方法及装置
CN104993970A (zh) * 2014-12-22 2015-10-21 国家电网公司 一种面向分布式系统关键运行指标数据的集中监视方法
CN105868876A (zh) * 2015-01-21 2016-08-17 国家电网公司 一种基于过程监视的集中运维故障闭环处理方法
CN106066824A (zh) * 2016-05-26 2016-11-02 湖南洋达信息科技有限公司 故障维护管理系统及方法
CN106096741A (zh) * 2016-06-14 2016-11-09 国电南瑞科技股份有限公司 一种智能化故障运维决策支持系统的实现方法
CN106295698A (zh) * 2016-08-11 2017-01-04 南京国电南自电网自动化有限公司 一种基于分层kpi相似度的智能光伏电站故障诊断方法
CN106506628A (zh) * 2016-11-02 2017-03-15 国网重庆市电力公司电力科学研究院 一种电网调度自动化系统的综合运维管理系统信息处理方法
CN106549423A (zh) * 2016-10-11 2017-03-29 国家电网公司 电网故障多级调度协同处理方法及装置
CN106646332A (zh) * 2016-12-08 2017-05-10 国网浙江杭州市富阳区供电公司 一种基于距离抄表日天数的采集异常紧急程度计算方法
CN107171436A (zh) * 2017-05-08 2017-09-15 国网山东省电力公司烟台供电公司 一种可自动筛选信息并进行事故分析的监控装置及其监控方法
CN107239987A (zh) * 2017-04-24 2017-10-10 北京小度信息科技有限公司 订单处理方法及装置
CN107633670A (zh) * 2017-07-21 2018-01-26 国网浙江省电力公司 一种采用采集运维知识库的采集异常诊断方法
CN108090639A (zh) * 2016-11-22 2018-05-29 上海安锐盟企业服务有限公司 基于设备服务的质量管理系统及方法
CN108255832A (zh) * 2016-12-28 2018-07-06 航天信息股份有限公司 舆情处理系统及方法
CN108737199A (zh) * 2018-06-27 2018-11-02 国网福建省电力有限公司 基于即时通讯系统的自动化运维系统及方法
CN108896910A (zh) * 2018-04-13 2018-11-27 湖南小步科技有限公司 一种动力锂电池的故障处理方法、装置及电池管理系统
CN109389524A (zh) * 2018-11-20 2019-02-26 国网山西省电力公司 基于电网数据的一体化运维协同管理方法、存储设备、终端和系统
CN109559064A (zh) * 2019-01-18 2019-04-02 江苏明伟万盛科技有限公司 基于物联网的站台门的运行维护方法
CN109933049A (zh) * 2019-03-29 2019-06-25 国网山东省电力公司费县供电公司 一种电力调度日志故障分类方法及系统
CN110198224A (zh) * 2018-02-27 2019-09-03 贵州白山云科技股份有限公司 一种报警处理方法、装置及系统
CN110569990A (zh) * 2019-08-02 2019-12-13 中国船舶重工集团公司第七一九研究所 一种适用于海洋核动力平台的运维系统及运维方法
CN110650036A (zh) * 2019-08-30 2020-01-03 中国人民财产保险股份有限公司 告警处理方法、装置及电子设备
CN111158848A (zh) * 2019-12-05 2020-05-15 深圳市智象科技有限公司 基于ai技术的运维监控、分析处理平台
CN111367970A (zh) * 2020-03-27 2020-07-03 安徽数升数据科技有限公司 一种基于智能电表实采数据的低电压诊断系统
CN107196804B (zh) * 2017-06-01 2020-07-10 国网山东省电力公司信息通信公司 电力系统终端通信接入网告警集中监控系统及方法
CN111681006A (zh) * 2020-05-25 2020-09-18 武汉默联股份有限公司 一种医院信息化系统的支付安全保障方法
CN112203965A (zh) * 2018-05-31 2021-01-08 三菱电机大楼技术服务株式会社 电梯的维护作业辅助装置
CN112346415A (zh) * 2020-09-29 2021-02-09 江苏南高智能装备创新中心有限公司 一种车间信息物理监控管理系统
CN112671102A (zh) * 2020-12-16 2021-04-16 广东电网有限责任公司惠州供电局 一种电网数据平台的智能运维方法
CN112763960A (zh) * 2021-01-04 2021-05-07 山东电工电气集团有限公司 一种就地模块的自运维方法
CN112804093A (zh) * 2020-12-31 2021-05-14 杭州东方通信软件技术有限公司 一种基于故障能力中心的集中调度支撑方法和系统
CN113610431A (zh) * 2021-08-23 2021-11-05 南京南瑞继保电气有限公司 一种调度自动化值班辅助系统及辅助控制方法
CN115314362A (zh) * 2022-08-08 2022-11-08 中国南方电网有限责任公司 一种基于遥测网络的远端调度终端故障检测方法及系统
CN117691749A (zh) * 2024-01-26 2024-03-12 国网湖北省电力有限公司 一种电网故障响应平台及其使用方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1916949A (zh) * 2006-09-06 2007-02-21 曾德华 电力设备状态评估及维修策略支撑系统
CN201623722U (zh) * 2010-04-06 2010-11-03 珠海市鸿瑞信息技术有限公司 电力二次系统信息安全运维监管平台
CN102739802A (zh) * 2012-07-06 2012-10-17 广东电网公司汕头供电局 面向业务应用的it集中运维分析系统
EP2535994A2 (en) * 2011-06-14 2012-12-19 General Electric Company Fault processing system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1916949A (zh) * 2006-09-06 2007-02-21 曾德华 电力设备状态评估及维修策略支撑系统
CN201623722U (zh) * 2010-04-06 2010-11-03 珠海市鸿瑞信息技术有限公司 电力二次系统信息安全运维监管平台
EP2535994A2 (en) * 2011-06-14 2012-12-19 General Electric Company Fault processing system
CN102739802A (zh) * 2012-07-06 2012-10-17 广东电网公司汕头供电局 面向业务应用的it集中运维分析系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
宁强: "陕西电力通信网综合网管系统的研究和设计", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
徐红泉: "电力调度自动化系统综合运维平台设计方案", 《中国优秀硕士学位论文全文数据库工程科技II辑》 *
王歆波等: "集中化运维模式下的告警标准化管理分析", 《电信技术》 *

Cited By (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729444B (zh) * 2013-12-30 2017-07-18 清华大学 一种基于设备监测数据间潜在关系的异常数据检测方法
CN103729444A (zh) * 2013-12-30 2014-04-16 清华大学 一种基于设备监测数据间潜在关系的异常数据检测方法
CN104503423A (zh) * 2014-11-21 2015-04-08 河南中烟工业有限责任公司 基于profinet的工业以太网控制系统故障诊断方法
CN104486106A (zh) * 2014-12-04 2015-04-01 珠海金山网络游戏科技有限公司 一种分级告警服务系统
CN104993970A (zh) * 2014-12-22 2015-10-21 国家电网公司 一种面向分布式系统关键运行指标数据的集中监视方法
CN104573962A (zh) * 2015-01-14 2015-04-29 国家电网公司 电网调度scada系统的信息分层共享处理方法
CN105868876A (zh) * 2015-01-21 2016-08-17 国家电网公司 一种基于过程监视的集中运维故障闭环处理方法
CN104680329A (zh) * 2015-03-17 2015-06-03 中国农业银行股份有限公司 一种运维问题发生原因确定方法及装置
CN106066824A (zh) * 2016-05-26 2016-11-02 湖南洋达信息科技有限公司 故障维护管理系统及方法
CN106096741A (zh) * 2016-06-14 2016-11-09 国电南瑞科技股份有限公司 一种智能化故障运维决策支持系统的实现方法
CN106295698A (zh) * 2016-08-11 2017-01-04 南京国电南自电网自动化有限公司 一种基于分层kpi相似度的智能光伏电站故障诊断方法
CN106295698B (zh) * 2016-08-11 2019-04-16 南京国电南自电网自动化有限公司 一种基于分层kpi相似度的智能光伏电站故障诊断方法
CN106549423A (zh) * 2016-10-11 2017-03-29 国家电网公司 电网故障多级调度协同处理方法及装置
CN106506628A (zh) * 2016-11-02 2017-03-15 国网重庆市电力公司电力科学研究院 一种电网调度自动化系统的综合运维管理系统信息处理方法
CN108090639A (zh) * 2016-11-22 2018-05-29 上海安锐盟企业服务有限公司 基于设备服务的质量管理系统及方法
CN106646332A (zh) * 2016-12-08 2017-05-10 国网浙江杭州市富阳区供电公司 一种基于距离抄表日天数的采集异常紧急程度计算方法
CN106646332B (zh) * 2016-12-08 2019-12-13 国网浙江杭州市富阳区供电有限公司 一种基于距离抄表日天数的采集异常紧急程度计算方法
CN108255832A (zh) * 2016-12-28 2018-07-06 航天信息股份有限公司 舆情处理系统及方法
CN107239987A (zh) * 2017-04-24 2017-10-10 北京小度信息科技有限公司 订单处理方法及装置
CN107171436A (zh) * 2017-05-08 2017-09-15 国网山东省电力公司烟台供电公司 一种可自动筛选信息并进行事故分析的监控装置及其监控方法
CN107171436B (zh) * 2017-05-08 2020-02-28 国网山东省电力公司烟台供电公司 一种可自动筛选信息并进行事故分析的监控装置及其监控方法
CN107196804B (zh) * 2017-06-01 2020-07-10 国网山东省电力公司信息通信公司 电力系统终端通信接入网告警集中监控系统及方法
CN107633670A (zh) * 2017-07-21 2018-01-26 国网浙江省电力公司 一种采用采集运维知识库的采集异常诊断方法
CN110198224A (zh) * 2018-02-27 2019-09-03 贵州白山云科技股份有限公司 一种报警处理方法、装置及系统
CN108896910A (zh) * 2018-04-13 2018-11-27 湖南小步科技有限公司 一种动力锂电池的故障处理方法、装置及电池管理系统
CN112203965B (zh) * 2018-05-31 2021-10-26 三菱电机大楼技术服务株式会社 电梯的维护作业辅助装置
CN112203965A (zh) * 2018-05-31 2021-01-08 三菱电机大楼技术服务株式会社 电梯的维护作业辅助装置
CN108737199A (zh) * 2018-06-27 2018-11-02 国网福建省电力有限公司 基于即时通讯系统的自动化运维系统及方法
CN109389524A (zh) * 2018-11-20 2019-02-26 国网山西省电力公司 基于电网数据的一体化运维协同管理方法、存储设备、终端和系统
CN109559064A (zh) * 2019-01-18 2019-04-02 江苏明伟万盛科技有限公司 基于物联网的站台门的运行维护方法
CN109933049A (zh) * 2019-03-29 2019-06-25 国网山东省电力公司费县供电公司 一种电力调度日志故障分类方法及系统
CN110569990A (zh) * 2019-08-02 2019-12-13 中国船舶重工集团公司第七一九研究所 一种适用于海洋核动力平台的运维系统及运维方法
CN110650036A (zh) * 2019-08-30 2020-01-03 中国人民财产保险股份有限公司 告警处理方法、装置及电子设备
CN111158848A (zh) * 2019-12-05 2020-05-15 深圳市智象科技有限公司 基于ai技术的运维监控、分析处理平台
CN111367970A (zh) * 2020-03-27 2020-07-03 安徽数升数据科技有限公司 一种基于智能电表实采数据的低电压诊断系统
CN111681006A (zh) * 2020-05-25 2020-09-18 武汉默联股份有限公司 一种医院信息化系统的支付安全保障方法
CN111681006B (zh) * 2020-05-25 2023-07-25 武汉默联股份有限公司 一种医院信息化系统的支付安全保障方法
CN112346415B (zh) * 2020-09-29 2021-10-15 江苏南高智能装备创新中心有限公司 一种车间信息物理监控管理系统
CN112346415A (zh) * 2020-09-29 2021-02-09 江苏南高智能装备创新中心有限公司 一种车间信息物理监控管理系统
CN112671102A (zh) * 2020-12-16 2021-04-16 广东电网有限责任公司惠州供电局 一种电网数据平台的智能运维方法
CN112671102B (zh) * 2020-12-16 2023-05-26 广东电网有限责任公司惠州供电局 一种电网数据平台的智能运维方法
CN112804093A (zh) * 2020-12-31 2021-05-14 杭州东方通信软件技术有限公司 一种基于故障能力中心的集中调度支撑方法和系统
CN112804093B (zh) * 2020-12-31 2022-08-12 杭州东方通信软件技术有限公司 一种基于故障能力中心的集中调度支撑方法和系统
CN112763960A (zh) * 2021-01-04 2021-05-07 山东电工电气集团有限公司 一种就地模块的自运维方法
CN113610431A (zh) * 2021-08-23 2021-11-05 南京南瑞继保电气有限公司 一种调度自动化值班辅助系统及辅助控制方法
CN115314362A (zh) * 2022-08-08 2022-11-08 中国南方电网有限责任公司 一种基于遥测网络的远端调度终端故障检测方法及系统
CN115314362B (zh) * 2022-08-08 2023-11-03 中国南方电网有限责任公司 一种基于遥测网络的远端调度终端故障检测方法及系统
CN117691749A (zh) * 2024-01-26 2024-03-12 国网湖北省电力有限公司 一种电网故障响应平台及其使用方法

Also Published As

Publication number Publication date
CN103473710B (zh) 2016-08-31

Similar Documents

Publication Publication Date Title
CN103473710A (zh) 一种集中运维系统的故障分级处理方法
CN110782370B (zh) 一种电力调度数据网综合运维管理平台
CN106655522B (zh) 一种适用于电网二次设备运维管理的主站系统
CN105868876A (zh) 一种基于过程监视的集中运维故障闭环处理方法
CN104331042B (zh) 水电厂计算机监控系统的状态评价方法
CN110941918B (zh) 智能化变电站故障分析系统
CN105245185A (zh) 一种接入配电网的区域分布式光伏故障诊断系统及方法
CN103078403B (zh) 一种智能变电站二次系统的在线状态评估方法
CN103606024A (zh) 一种基于调度数据网的集中运维系统及其方法
CN109240126A (zh) 一种具有模拟操作功能的分布式应用服务监测系统及方法
CN103325019A (zh) 基于事件驱动的电网故障信息判断方法
CN109117526A (zh) 一种适用于机械系统设备维修指引数据记录及分析系统
CN108107292B (zh) 电能质量在线监测系统的业务数据监测系统及方法
CN111612337A (zh) 热网调度自动发令方法及自动发令系统
CN111882110A (zh) 一种基于大数据技术的电力信息通信故障预测系统
CN109245300B (zh) 一种500kV智能变电站压板自动校核方法
CN100544476C (zh) Gprs业务智能控制方法
CN107966943B (zh) 一种多级变电站集中总控监控智能数据分析系统
CN207748684U (zh) 一种基于物联网智能远程监控故障诊断管理系统
CN111915205A (zh) 基于智能调度的复杂装备健康自动巡检方法及系统
CN110988584A (zh) 一种电力系统智能监控和自动控制系统
CN115313662A (zh) 配电自动化智能巡检辅助工具
CN215871460U (zh) 电力通信网络应急预案生成装置
CN115441581A (zh) 基于大数据的大规模电网安全及智能调度系统
CN115208059A (zh) 一种变电站动力与环境监控告警处理系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant