CN103761157A - 一种基于多任务巡检策略实现系统容错机制的方法 - Google Patents

一种基于多任务巡检策略实现系统容错机制的方法 Download PDF

Info

Publication number
CN103761157A
CN103761157A CN201410026348.8A CN201410026348A CN103761157A CN 103761157 A CN103761157 A CN 103761157A CN 201410026348 A CN201410026348 A CN 201410026348A CN 103761157 A CN103761157 A CN 103761157A
Authority
CN
China
Prior art keywords
task
data
module
patrol
pool
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410026348.8A
Other languages
English (en)
Inventor
胡扬波
葛伟
吴鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
Jiangsu Electric Power Information Technology Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
Jiangsu Electric Power Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Jiangsu Electric Power Co Ltd, Jiangsu Electric Power Information Technology Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201410026348.8A priority Critical patent/CN103761157A/zh
Publication of CN103761157A publication Critical patent/CN103761157A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种基于多任务巡检策略实现系统容错机制的方法,在采集系统中设置巡检任务模块、执行任务模块、销毁任务模块和任务池;在业务系统数据上报过程中,业务系统将数据上报到采集系统,首先由巡检任务模块采用多线程方式对数据进行扫描,如果数据接收是正常,直接进行数据转发或进入任务池,设定为待执行任务;执行任务模块发现有待执行任务,则立即采用多线程执行,对数据进行转发;转发成功,标志任务状态为待销毁;销毁任务模块立即销毁该任务,避免重复执行。本发明实现上报的及时补救并实现告警,从而提高业务系统数据上报稳定性,保证数据上报健康运行,有效提升了系统健壮性。

Description

一种基于多任务巡检策略实现系统容错机制的方法
 
技术领域
本发明涉及一种容错机制方法,具体地说是一种基于多任务巡检策略实现系统容错机制的方法。
背景技术
目前信息化系统的使用成为企业有效、规范的进行业务操作,为了实现系统长时间的稳定性,一般系统需要定时上报或者同步部分数据到其他系统进行监测,考虑到业务系统繁多,采用将所有业务系统的数据先上报到数据采集器,由采集器定时将数据发送到监控系统。
在现代数据交上报过程中,由于部分数据未能及时上报而导致上报过程异常,影响后续监控。由于业务系统在上报的部分数据失败或者是未按照事先约定的周期上报时导致数据中转站未能实现容错机制,从而影响了中转站数据二次上报服务的健康运行,连锁影响后续操作。
发明内容
为了能够有效解决上述问题,本发明的目的是提供一种基于多任务巡检策略实现系统容错机制的方法,通过该方法实现上报的及时补救并实现告警,从而提高业务系统数据上报稳定性,保证数据上报健康运行,有效提升了系统健壮性。
本发明的目的是通过以下技术方案来实现的:
一种基于多任务巡检策略实现系统容错机制的方法,其特征在于该方法具体步骤如下:
1)在采集系统中设置巡检任务模块、执行任务模块、销毁任务模块和任务池;
2)在业务系统数据上报过程中,业务系统将数据上报到采集系统,由采集系统对数据进行实时转发;
3)在数据采集入库进入采集系统后,首先由巡检任务模块采用多线程方式对数据进行扫描,如果数据接收是正常,直接进行数据转发;如果数据异常或者没有及时接收到数据,则进入任务池,设定为待执行任务;
4)执行任务模块定时扫描任务池,发现有待执行任务,则立即采用多线程执行,对数据进行转发;执行过程中如果出现执行失败,则从新放入任务池,等待下一次执行;对数据进行转发执行成功,标志任务状态为待销毁;
5)销毁任务模块定时扫描任务池,发现有执行完成的待销毁任务,则立即销毁该任务,避免重复执行。
本发明中,巡检任务模块、执行任务模块、销毁任务模块均为周期性运行。巡检任务模块对进入任务池的数据实时记录并报警。
本发明是为了解决数据上报中部分数据问题导致整体上报异常而采用的一种容错机制。通过该方法实现上报的及时补救并实现告警,从而提高业务系统数据上报稳定性,保证数据上报健康运行,有效提升了系统健壮性。
附图说明
图 1是本发明的实施流程示意图。
具体实施方式
一种基于多任务巡检策略实现系统容错机制的方法,该方法首先在采集系统中设置巡检任务模块、执行任务模块、销毁任务模块和任务池;在业务系统数据上报过程中,业务系统将数据上报到采集系统,由采集系统对数据进行实时转发;在数据采集入库进入采集系统后,首先由巡检任务模块采用多线程方式对数据进行扫描,如果数据接收是正常,直接进行数据转发;如果数据异常或者没有及时接收到数据,则进入任务池,设定为待执行任务;执行任务模块定时扫描任务池,发现有待执行任务,则立即采用多线程执行,对数据进行转发;执行过程中如果出现执行失败,则从新放入任务池,等待下一次执行;对数据进行转发执行成功,标志任务状态为待销毁;销毁任务模块定时扫描任务池,发现有执行完成的待销毁任务,则立即销毁该任务,避免重复执行。
以A系统定时将数据发送到B系统,B系统最终发送到C系统为例,在B系统中采用基于多任务巡检策略实现系统容错机制方法保证在A系统未及时发送数据或异常时C系统正常接收数据,见图1,具体步骤如下:
1、在B系统中设置巡检任务模块、执行任务模块、销毁任务模块和任务池。
2、A系统发送数据到B系统,发送了10条数据,由于A所在服务器响应超时,导致实际发送了8条数据。
3、B系统中的数据巡检任务模块扫描发现只接收到8条数据,立即将8条数据实时转发给C系统,在规定的时间内一直未接收到剩余数据,则立即在任务池中创建2条新任务,将后面收到的2条数据转入任务池内标记为待办任务,同时提供告警功能,方便后期查阅。
4、B系统中执行任务模块通过周期扫描任务池,发现有2个待办任务,则根据数据业务规则发送2条数据到C系统,并标识2个任务状态为完成;如果发送给C系统的过程失败,则创建新任务放到任务池,等待下一次执行
5、B系统的销毁任务模块周期扫描任务池,发现有2个任务已经执行完成,销毁任务,避免重复执行。
任务池中任务数量较多时,加快任务周期,及时响应。本发明实现上报的及时补救并实现告警,从而提高业务系统数据上报稳定性,保证数据上报健康运行,有效提升了系统健壮性。

Claims (3)

1.一种基于多任务巡检策略实现系统容错机制的方法,其特征在于该方法具体步骤如下:
1)在采集系统中设置巡检任务模块、执行任务模块、销毁任务模块和任务池;
在业务系统数据上报过程中,业务系统将数据上报到采集系统,由采集系统对数据进行实时转发;
3)在数据采集入库进入采集系统后,首先由巡检任务模块采用多线程方式对数据进行扫描,如果数据接收是正常,直接进行数据转发;如果数据异常或者没有及时接收到数据,则进入任务池,设定为待执行任务;
执行任务模块定时扫描任务池,发现有待执行任务,则立即采用多线程执行,对数据进行转发;执行过程中如果出现执行失败,则从新放入任务池,等待下一次执行;对数据进行转发执行成功,标志任务状态为待销毁;
销毁任务模块定时扫描任务池,发现有执行完成的待销毁任务,则立即销毁该任务,避免重复执行。
2.根据权利要求1所述的基于多任务巡检策略实现系统容错机制的方法,其特征在于:步骤1)中,巡检任务模块、执行任务模块、销毁任务模块均为周期性运行。
3.根据权利要求1所述的基于多任务巡检策略实现系统容错机制的方法,其特征在于:步骤3)中,巡检任务模块对进入任务池的数据实时记录并报警。
CN201410026348.8A 2014-01-21 2014-01-21 一种基于多任务巡检策略实现系统容错机制的方法 Pending CN103761157A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410026348.8A CN103761157A (zh) 2014-01-21 2014-01-21 一种基于多任务巡检策略实现系统容错机制的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410026348.8A CN103761157A (zh) 2014-01-21 2014-01-21 一种基于多任务巡检策略实现系统容错机制的方法

Publications (1)

Publication Number Publication Date
CN103761157A true CN103761157A (zh) 2014-04-30

Family

ID=50528400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410026348.8A Pending CN103761157A (zh) 2014-01-21 2014-01-21 一种基于多任务巡检策略实现系统容错机制的方法

Country Status (1)

Country Link
CN (1) CN103761157A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104660992A (zh) * 2015-02-04 2015-05-27 江苏物联网研究发展中心 视频掉线重连系统和方法
CN105117430A (zh) * 2015-08-06 2015-12-02 中山大学 一种基于等价类的重复任务过程发现方法
CN106161088A (zh) * 2016-07-01 2016-11-23 成都视达科信息技术有限公司 一种基于多线程的服务器自动巡检方法及系统
CN107256180A (zh) * 2017-05-19 2017-10-17 腾讯科技(深圳)有限公司 数据处理方法、装置及终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001022599A (ja) * 1999-07-06 2001-01-26 Fujitsu Ltd フォールトトレラント・システム,フォールトトレラント処理方法およびフォールトトレラント制御用プログラム記録媒体
CN103440279A (zh) * 2013-08-13 2013-12-11 江苏华大天益电力科技有限公司 一种数据采集过程中的数据适配器及其数据适配方法
CN103473138A (zh) * 2013-09-18 2013-12-25 柳州市博源环科科技有限公司 基于线程池的多任务队列调度方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001022599A (ja) * 1999-07-06 2001-01-26 Fujitsu Ltd フォールトトレラント・システム,フォールトトレラント処理方法およびフォールトトレラント制御用プログラム記録媒体
CN103440279A (zh) * 2013-08-13 2013-12-11 江苏华大天益电力科技有限公司 一种数据采集过程中的数据适配器及其数据适配方法
CN103473138A (zh) * 2013-09-18 2013-12-25 柳州市博源环科科技有限公司 基于线程池的多任务队列调度方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104660992A (zh) * 2015-02-04 2015-05-27 江苏物联网研究发展中心 视频掉线重连系统和方法
CN104660992B (zh) * 2015-02-04 2018-01-19 江苏中科羿链通信技术有限公司 视频掉线重连系统和方法
CN105117430A (zh) * 2015-08-06 2015-12-02 中山大学 一种基于等价类的重复任务过程发现方法
CN105117430B (zh) * 2015-08-06 2018-07-31 中山大学 一种基于等价类的重复任务过程发现方法
CN106161088A (zh) * 2016-07-01 2016-11-23 成都视达科信息技术有限公司 一种基于多线程的服务器自动巡检方法及系统
CN107256180A (zh) * 2017-05-19 2017-10-17 腾讯科技(深圳)有限公司 数据处理方法、装置及终端

Similar Documents

Publication Publication Date Title
CN110581852A (zh) 一种高效型拟态防御系统及方法
CN104268061B (zh) 一种适用于虚拟机的存储状态监控方法
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
EP3142011A1 (en) Anomaly recovery method for virtual machine in distributed environment
CN110688280B (zh) 一种告警事件的管理系统、方法、设备和存储介质
CN102045204B (zh) 一种故障处理系统及方法
CN103761157A (zh) 一种基于多任务巡检策略实现系统容错机制的方法
CN104065526B (zh) 一种服务器故障报警的方法和装置
CN103491102A (zh) 互联网音视频稳定性监控方法、系统及装置
CN101631048A (zh) 一种监视被管理对象的方法、装置及系统
CN102609350A (zh) 一种服务器内存故障报警方法
CN102404141A (zh) 一种告警抑制的方法及装置
CN104601668A (zh) 基于状态管理的数据推送方法、装置和系统
CN104104542A (zh) 一种基于rs485的实时智能排障方法
CN103605592A (zh) 一种分布式计算机系统故障检测机制
CN108762118B (zh) 一种通讯设备间的故障处理方法及装置
CN110809262A (zh) 一种基于coap协议的物联网设备运维管理方法
CN104486106A (zh) 一种分级告警服务系统
CA2920430A1 (en) Managing data feeds
CN106201753A (zh) 一种基于linux中PCIE错误的处理方法及系统
KR100943213B1 (ko) 홈네트워크에서의 오류 모델과 규칙 기반의 오류 관리 장치및 그 방법
CN113268318A (zh) 一种任务调度的方法和分布式系统
CN104486122A (zh) 基于看门狗的路由器异常恢复系统及方法
US9565583B2 (en) Monitoring device and monitoring system
CN110572315A (zh) 一种信息交互的方法及装置、机器人、存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140430