CN103605602A - 一种分布式计算机系统故障过滤方法 - Google Patents

一种分布式计算机系统故障过滤方法 Download PDF

Info

Publication number
CN103605602A
CN103605602A CN201310635331.8A CN201310635331A CN103605602A CN 103605602 A CN103605602 A CN 103605602A CN 201310635331 A CN201310635331 A CN 201310635331A CN 103605602 A CN103605602 A CN 103605602A
Authority
CN
China
Prior art keywords
malfunctions
fault
malfunction
value
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310635331.8A
Other languages
English (en)
Inventor
李成文
王建生
杨军祥
解文涛
王明
高杨
湛文韬
何小亚
刘宇
陈国�
俞大磊
王博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AVIC No 631 Research Institute
Original Assignee
AVIC No 631 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AVIC No 631 Research Institute filed Critical AVIC No 631 Research Institute
Priority to CN201310635331.8A priority Critical patent/CN103605602A/zh
Publication of CN103605602A publication Critical patent/CN103605602A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种分布式计算机系统故障过滤方法,对分布计算机系统中产生的各种各样的故障进行确认,滤除瞬时故障或间歇故障,保证系统故障处理的有效性,提高系统运行可靠性。该分布式计算机系统故障过滤方法包括:1)创建至少一组故障计数器,并设置故障计数器的计数增加值、减少值、门限值;2)同一故障在一个检测周期内每出现一次,故障计数器即进行一次计数,当故障计数器的累积值达到门限值时,确认故障并记录;3)若故障确认后的下一个故障检测周期内不再继续出现故障,则进行周期过滤,故障计数器累积值衰减,经衰减后若故障累积值小于等于零时,清除故障记录并滤除故障;若故障确认后故障累积值继续增加并大于门限值,则上报故障。

Description

一种分布式计算机系统故障过滤方法
技术领域
本发明涉及一种分布式计算机系统故障过滤方法,属于嵌入式计算机系统设计技术领域。
背景技术
分布式计算机系统是采用统一标准模块、统一数据通讯网络、多层次的软硬件结构,是综合化航电任务系统的中央核心处理系统,具备数据、信号、图形图像视频的综合处理能力。分布式计算机系统承担着大量飞行任务的执行、控制和飞机安全性保障等工作,是一种十分重要的系统,可靠性要求非常高。分布式计算机系统应用在飞行器等恶劣环境中,由于器件老化、错误输入、外部环境影响和原始设计错误等因素产生各种各样的故障,有些故障如瞬时故障或间歇故障对系统正常服务不会产生影响,需要滤除掉以减轻系统处理故障的负荷。
发明内容
本发明提供一种分布式计算机系统故障过滤方法,对分布计算机系统中产生的各种各样的故障进行确认,滤除瞬时故障或间歇故障,保证系统故障处理的有效性,提高系统运行可靠性。
本发明的具体技术解决方案如下:
该分布式计算机系统故障过滤方法,包括以下步骤:
1]创建至少一组故障计数器,并设置故障计数器的计数增加值、减少值、门限值;
2]同一故障在一个检测周期内每出现一次,故障计数器即进行一次计数,当故障计数器的累积值达到门限值时,确认故障并记录;
3]若故障确认后的下一个故障检测周期内不再继续出现故障,则进行周期过滤,故障计数器累积值衰减,经衰减后若故障累积值小于等于零时,清除故障记录并滤除故障;若故障确认后故障累积值继续增加并大于门限值,则上报故障。
本发明的优点是:
1)通过主动过滤确认故障;
2)通过周期过滤虑除瞬时故障;
3)故障检测增量、减量、门限值和周期值可设置。
附图说明
图1分布式计算机系统故障过滤方法原理图,
具体实施方式
本发明分布式计算机系统故障过滤方法的原理是:故障过滤通过一组或多组过滤器完成。过滤器对故障的过滤分为主动过滤和周期过滤两种,主动过滤用来确认故障,周期过滤用来虑除瞬时故障。过滤器的过滤算法中,设定一个门限值,一个周期内每出现一次故障(同一故障),故障累积值就增加一个值,当累积值超过门限时,故障得到确认。当紧随出现故障周期的第二个周期没有再出现故障时,开始进行周期过滤,当故障累积值小于等于零时,清除故障记录,故障被滤除。
如图1所示,分布式计算机系统故障过滤方法具体实现方式如下:
a.创建一个故障计数器,其计数增加值、减少值、门限值可设置;
b.设计故障检测程序,故障检测周期可设置;
c.运行故障检测程序,在一个故障检测周期内每出现一次故障(同一故障),故障计数器累积值就增加一个值;
d.当故障计数器累积值达到门限值时,故障得到确认。并记录故障;
e.故障得到确认后,如果故障检测周期内没有再出现故障时,则开始进行周期过滤,故障计数器累积值就减少一个值;
f.故障得到确认后,如果故障计数器累积值大于门限值则上报该故障。如果故障累积值小于等于零时,清除故障记录,故障被滤除掉。

Claims (1)

1.一种分布式计算机系统故障过滤方法,其特征在于,包括以下步骤:
1]创建至少一组故障计数器,并设置故障计数器的计数增加值、减少值、门限值;
2]同一故障在一个检测周期内每出现一次,故障计数器即进行一次计数,当故障计数器的累积值达到门限值时,确认故障并记录;
3]若故障确认后的下一个故障检测周期内不再继续出现故障,则进行周期过滤,故障计数器累积值衰减,经衰减后若故障累积值小于等于零时,清除故障记录并滤除故障;若故障确认后故障累积值继续增加并大于门限值,则上报故障。
CN201310635331.8A 2013-11-29 2013-11-29 一种分布式计算机系统故障过滤方法 Pending CN103605602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310635331.8A CN103605602A (zh) 2013-11-29 2013-11-29 一种分布式计算机系统故障过滤方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310635331.8A CN103605602A (zh) 2013-11-29 2013-11-29 一种分布式计算机系统故障过滤方法

Publications (1)

Publication Number Publication Date
CN103605602A true CN103605602A (zh) 2014-02-26

Family

ID=50123831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310635331.8A Pending CN103605602A (zh) 2013-11-29 2013-11-29 一种分布式计算机系统故障过滤方法

Country Status (1)

Country Link
CN (1) CN103605602A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105117301A (zh) * 2015-08-14 2015-12-02 杭州华为数字技术有限公司 一种内存预警的方法及装置
CN108387342A (zh) * 2018-01-08 2018-08-10 联创汽车电子有限公司 Eps非接触式扭矩传感器故障识别系统及其识别方法
CN108833170A (zh) * 2018-06-20 2018-11-16 长春工业大学 一种网络级自适应can总线故障诊断方法
CN111830932A (zh) * 2020-07-16 2020-10-27 江铃汽车股份有限公司 一种传感器软件的控制方法
CN112373559A (zh) * 2020-11-29 2021-02-19 同济大学 一种具备失效回正功能的汽车后转向桥系统及其控制方法
CN114088408A (zh) * 2021-11-19 2022-02-25 一汽解放汽车有限公司 一种冷却液温度诊断方法、装置、车辆及存储介质
CN114718709A (zh) * 2022-05-19 2022-07-08 江铃汽车股份有限公司 一种汽车尿素品质传感器输出信号的控制方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101394314A (zh) * 2008-10-20 2009-03-25 北京邮电大学 一种Web应用系统的故障定位方法
US8290364B2 (en) * 2007-01-26 2012-10-16 Huawei Technologies Co., Ltd Method, optical network and network device for locating fiber events

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8290364B2 (en) * 2007-01-26 2012-10-16 Huawei Technologies Co., Ltd Method, optical network and network device for locating fiber events
CN101394314A (zh) * 2008-10-20 2009-03-25 北京邮电大学 一种Web应用系统的故障定位方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王和平: "分布式系统中的故障处理", 《计算机工程与设计》, vol. 26, no. 11, 30 November 2005 (2005-11-30), pages 2879 - 2883 *
魏建军等: "紧耦合分布式系统中的故障过滤算法", 《计算机应用研究》, vol. 24, no. 10, 31 October 2007 (2007-10-31), pages 48 - 50 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105117301A (zh) * 2015-08-14 2015-12-02 杭州华为数字技术有限公司 一种内存预警的方法及装置
CN105117301B (zh) * 2015-08-14 2018-08-14 杭州华为数字技术有限公司 一种内存预警的方法及装置
CN108387342A (zh) * 2018-01-08 2018-08-10 联创汽车电子有限公司 Eps非接触式扭矩传感器故障识别系统及其识别方法
CN108833170A (zh) * 2018-06-20 2018-11-16 长春工业大学 一种网络级自适应can总线故障诊断方法
CN108833170B (zh) * 2018-06-20 2021-09-28 长春工业大学 一种网络级自适应can总线故障诊断方法
CN111830932A (zh) * 2020-07-16 2020-10-27 江铃汽车股份有限公司 一种传感器软件的控制方法
CN111830932B (zh) * 2020-07-16 2023-07-07 江铃汽车股份有限公司 一种传感器软件的控制方法
CN112373559A (zh) * 2020-11-29 2021-02-19 同济大学 一种具备失效回正功能的汽车后转向桥系统及其控制方法
CN114088408A (zh) * 2021-11-19 2022-02-25 一汽解放汽车有限公司 一种冷却液温度诊断方法、装置、车辆及存储介质
CN114718709A (zh) * 2022-05-19 2022-07-08 江铃汽车股份有限公司 一种汽车尿素品质传感器输出信号的控制方法

Similar Documents

Publication Publication Date Title
CN103605602A (zh) 一种分布式计算机系统故障过滤方法
CN102681907B (zh) 一种多功能看门狗电路
CN109976932B (zh) 故障注入测试设备和方法
US8756462B2 (en) Configurable alert delivery for reducing the amount of alerts transmitted in a distributed processing system
US8880943B2 (en) Restarting event and alert analysis after a shutdown in a distributed processing system
US9419650B2 (en) Flexible event data content management for relevant event and alert analysis within a distributed processing system
US8473789B2 (en) Memory leak monitoring system and associated methods
CN100359481C (zh) 多任务系统的异常监控装置及其方法
CN103023984B (zh) 终端应用服务器及其应用日志过滤方法
CN104639380A (zh) 服务器监控方法
WO2012076380A1 (en) Dynamic administration of event pools for relevent event and alert analysis during event storms
CN103268277A (zh) 一种输出日志信息的方法及系统
CN105677497A (zh) 一种高可用性看门狗电路
CN106682162A (zh) 日志管理方法及装置
CN107193680A (zh) 一种心跳检测方法、设备及系统
CN109992448A (zh) 文件变化增量备份方法、装置、设备及介质
CN102792278B (zh) 用于计算环境中的诊断数据捕获的方法和设备
CN103995759B (zh) 基于核内外协同的高可用计算机系统故障处理方法及装置
CN111159051B (zh) 死锁检测方法、装置、电子设备及可读存储介质
CN109213130B (zh) 一种对故障信号中的毛刺信号进行滤波的方法
US20100162269A1 (en) Controllable interaction between multiple event monitoring subsystems for computing environments
CN108563530A (zh) 看门狗及其实现方法
WO2013104964A1 (en) Thread based dynamic data collection
JP2017043166A (ja) 車両制御装置
CN2599652Y (zh) 一种看门狗清狗电路

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140226