CN103605602A - 一种分布式计算机系统故障过滤方法 - Google Patents
一种分布式计算机系统故障过滤方法 Download PDFInfo
- Publication number
- CN103605602A CN103605602A CN201310635331.8A CN201310635331A CN103605602A CN 103605602 A CN103605602 A CN 103605602A CN 201310635331 A CN201310635331 A CN 201310635331A CN 103605602 A CN103605602 A CN 103605602A
- Authority
- CN
- China
- Prior art keywords
- malfunctions
- fault
- malfunction
- value
- computer system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明提供一种分布式计算机系统故障过滤方法,对分布计算机系统中产生的各种各样的故障进行确认,滤除瞬时故障或间歇故障,保证系统故障处理的有效性,提高系统运行可靠性。该分布式计算机系统故障过滤方法包括:1)创建至少一组故障计数器,并设置故障计数器的计数增加值、减少值、门限值;2)同一故障在一个检测周期内每出现一次,故障计数器即进行一次计数,当故障计数器的累积值达到门限值时,确认故障并记录;3)若故障确认后的下一个故障检测周期内不再继续出现故障,则进行周期过滤,故障计数器累积值衰减,经衰减后若故障累积值小于等于零时,清除故障记录并滤除故障;若故障确认后故障累积值继续增加并大于门限值,则上报故障。
Description
技术领域
本发明涉及一种分布式计算机系统故障过滤方法,属于嵌入式计算机系统设计技术领域。
背景技术
分布式计算机系统是采用统一标准模块、统一数据通讯网络、多层次的软硬件结构,是综合化航电任务系统的中央核心处理系统,具备数据、信号、图形图像视频的综合处理能力。分布式计算机系统承担着大量飞行任务的执行、控制和飞机安全性保障等工作,是一种十分重要的系统,可靠性要求非常高。分布式计算机系统应用在飞行器等恶劣环境中,由于器件老化、错误输入、外部环境影响和原始设计错误等因素产生各种各样的故障,有些故障如瞬时故障或间歇故障对系统正常服务不会产生影响,需要滤除掉以减轻系统处理故障的负荷。
发明内容
本发明提供一种分布式计算机系统故障过滤方法,对分布计算机系统中产生的各种各样的故障进行确认,滤除瞬时故障或间歇故障,保证系统故障处理的有效性,提高系统运行可靠性。
本发明的具体技术解决方案如下:
该分布式计算机系统故障过滤方法,包括以下步骤:
1]创建至少一组故障计数器,并设置故障计数器的计数增加值、减少值、门限值;
2]同一故障在一个检测周期内每出现一次,故障计数器即进行一次计数,当故障计数器的累积值达到门限值时,确认故障并记录;
3]若故障确认后的下一个故障检测周期内不再继续出现故障,则进行周期过滤,故障计数器累积值衰减,经衰减后若故障累积值小于等于零时,清除故障记录并滤除故障;若故障确认后故障累积值继续增加并大于门限值,则上报故障。
本发明的优点是:
1)通过主动过滤确认故障;
2)通过周期过滤虑除瞬时故障;
3)故障检测增量、减量、门限值和周期值可设置。
附图说明
图1分布式计算机系统故障过滤方法原理图,
具体实施方式
本发明分布式计算机系统故障过滤方法的原理是:故障过滤通过一组或多组过滤器完成。过滤器对故障的过滤分为主动过滤和周期过滤两种,主动过滤用来确认故障,周期过滤用来虑除瞬时故障。过滤器的过滤算法中,设定一个门限值,一个周期内每出现一次故障(同一故障),故障累积值就增加一个值,当累积值超过门限时,故障得到确认。当紧随出现故障周期的第二个周期没有再出现故障时,开始进行周期过滤,当故障累积值小于等于零时,清除故障记录,故障被滤除。
如图1所示,分布式计算机系统故障过滤方法具体实现方式如下:
a.创建一个故障计数器,其计数增加值、减少值、门限值可设置;
b.设计故障检测程序,故障检测周期可设置;
c.运行故障检测程序,在一个故障检测周期内每出现一次故障(同一故障),故障计数器累积值就增加一个值;
d.当故障计数器累积值达到门限值时,故障得到确认。并记录故障;
e.故障得到确认后,如果故障检测周期内没有再出现故障时,则开始进行周期过滤,故障计数器累积值就减少一个值;
f.故障得到确认后,如果故障计数器累积值大于门限值则上报该故障。如果故障累积值小于等于零时,清除故障记录,故障被滤除掉。
Claims (1)
1.一种分布式计算机系统故障过滤方法,其特征在于,包括以下步骤:
1]创建至少一组故障计数器,并设置故障计数器的计数增加值、减少值、门限值;
2]同一故障在一个检测周期内每出现一次,故障计数器即进行一次计数,当故障计数器的累积值达到门限值时,确认故障并记录;
3]若故障确认后的下一个故障检测周期内不再继续出现故障,则进行周期过滤,故障计数器累积值衰减,经衰减后若故障累积值小于等于零时,清除故障记录并滤除故障;若故障确认后故障累积值继续增加并大于门限值,则上报故障。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310635331.8A CN103605602A (zh) | 2013-11-29 | 2013-11-29 | 一种分布式计算机系统故障过滤方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310635331.8A CN103605602A (zh) | 2013-11-29 | 2013-11-29 | 一种分布式计算机系统故障过滤方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103605602A true CN103605602A (zh) | 2014-02-26 |
Family
ID=50123831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310635331.8A Pending CN103605602A (zh) | 2013-11-29 | 2013-11-29 | 一种分布式计算机系统故障过滤方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103605602A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105117301A (zh) * | 2015-08-14 | 2015-12-02 | 杭州华为数字技术有限公司 | 一种内存预警的方法及装置 |
CN108387342A (zh) * | 2018-01-08 | 2018-08-10 | 联创汽车电子有限公司 | Eps非接触式扭矩传感器故障识别系统及其识别方法 |
CN108833170A (zh) * | 2018-06-20 | 2018-11-16 | 长春工业大学 | 一种网络级自适应can总线故障诊断方法 |
CN111830932A (zh) * | 2020-07-16 | 2020-10-27 | 江铃汽车股份有限公司 | 一种传感器软件的控制方法 |
CN112373559A (zh) * | 2020-11-29 | 2021-02-19 | 同济大学 | 一种具备失效回正功能的汽车后转向桥系统及其控制方法 |
CN114088408A (zh) * | 2021-11-19 | 2022-02-25 | 一汽解放汽车有限公司 | 一种冷却液温度诊断方法、装置、车辆及存储介质 |
CN114718709A (zh) * | 2022-05-19 | 2022-07-08 | 江铃汽车股份有限公司 | 一种汽车尿素品质传感器输出信号的控制方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101394314A (zh) * | 2008-10-20 | 2009-03-25 | 北京邮电大学 | 一种Web应用系统的故障定位方法 |
US8290364B2 (en) * | 2007-01-26 | 2012-10-16 | Huawei Technologies Co., Ltd | Method, optical network and network device for locating fiber events |
-
2013
- 2013-11-29 CN CN201310635331.8A patent/CN103605602A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8290364B2 (en) * | 2007-01-26 | 2012-10-16 | Huawei Technologies Co., Ltd | Method, optical network and network device for locating fiber events |
CN101394314A (zh) * | 2008-10-20 | 2009-03-25 | 北京邮电大学 | 一种Web应用系统的故障定位方法 |
Non-Patent Citations (2)
Title |
---|
王和平: "分布式系统中的故障处理", 《计算机工程与设计》, vol. 26, no. 11, 30 November 2005 (2005-11-30), pages 2879 - 2883 * |
魏建军等: "紧耦合分布式系统中的故障过滤算法", 《计算机应用研究》, vol. 24, no. 10, 31 October 2007 (2007-10-31), pages 48 - 50 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105117301A (zh) * | 2015-08-14 | 2015-12-02 | 杭州华为数字技术有限公司 | 一种内存预警的方法及装置 |
CN105117301B (zh) * | 2015-08-14 | 2018-08-14 | 杭州华为数字技术有限公司 | 一种内存预警的方法及装置 |
CN108387342A (zh) * | 2018-01-08 | 2018-08-10 | 联创汽车电子有限公司 | Eps非接触式扭矩传感器故障识别系统及其识别方法 |
CN108833170A (zh) * | 2018-06-20 | 2018-11-16 | 长春工业大学 | 一种网络级自适应can总线故障诊断方法 |
CN108833170B (zh) * | 2018-06-20 | 2021-09-28 | 长春工业大学 | 一种网络级自适应can总线故障诊断方法 |
CN111830932A (zh) * | 2020-07-16 | 2020-10-27 | 江铃汽车股份有限公司 | 一种传感器软件的控制方法 |
CN111830932B (zh) * | 2020-07-16 | 2023-07-07 | 江铃汽车股份有限公司 | 一种传感器软件的控制方法 |
CN112373559A (zh) * | 2020-11-29 | 2021-02-19 | 同济大学 | 一种具备失效回正功能的汽车后转向桥系统及其控制方法 |
CN114088408A (zh) * | 2021-11-19 | 2022-02-25 | 一汽解放汽车有限公司 | 一种冷却液温度诊断方法、装置、车辆及存储介质 |
CN114718709A (zh) * | 2022-05-19 | 2022-07-08 | 江铃汽车股份有限公司 | 一种汽车尿素品质传感器输出信号的控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103605602A (zh) | 一种分布式计算机系统故障过滤方法 | |
CN102681907B (zh) | 一种多功能看门狗电路 | |
CN109976932B (zh) | 故障注入测试设备和方法 | |
US8756462B2 (en) | Configurable alert delivery for reducing the amount of alerts transmitted in a distributed processing system | |
US8880943B2 (en) | Restarting event and alert analysis after a shutdown in a distributed processing system | |
US9419650B2 (en) | Flexible event data content management for relevant event and alert analysis within a distributed processing system | |
US8473789B2 (en) | Memory leak monitoring system and associated methods | |
CN100359481C (zh) | 多任务系统的异常监控装置及其方法 | |
CN103023984B (zh) | 终端应用服务器及其应用日志过滤方法 | |
CN104639380A (zh) | 服务器监控方法 | |
WO2012076380A1 (en) | Dynamic administration of event pools for relevent event and alert analysis during event storms | |
CN103268277A (zh) | 一种输出日志信息的方法及系统 | |
CN105677497A (zh) | 一种高可用性看门狗电路 | |
CN106682162A (zh) | 日志管理方法及装置 | |
CN107193680A (zh) | 一种心跳检测方法、设备及系统 | |
CN109992448A (zh) | 文件变化增量备份方法、装置、设备及介质 | |
CN102792278B (zh) | 用于计算环境中的诊断数据捕获的方法和设备 | |
CN103995759B (zh) | 基于核内外协同的高可用计算机系统故障处理方法及装置 | |
CN111159051B (zh) | 死锁检测方法、装置、电子设备及可读存储介质 | |
CN109213130B (zh) | 一种对故障信号中的毛刺信号进行滤波的方法 | |
US20100162269A1 (en) | Controllable interaction between multiple event monitoring subsystems for computing environments | |
CN108563530A (zh) | 看门狗及其实现方法 | |
WO2013104964A1 (en) | Thread based dynamic data collection | |
JP2017043166A (ja) | 車両制御装置 | |
CN2599652Y (zh) | 一种看门狗清狗电路 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140226 |