CN103514071A - 非破坏性的内存在线测试方法 - Google Patents

非破坏性的内存在线测试方法 Download PDF

Info

Publication number
CN103514071A
CN103514071A CN201310473227.3A CN201310473227A CN103514071A CN 103514071 A CN103514071 A CN 103514071A CN 201310473227 A CN201310473227 A CN 201310473227A CN 103514071 A CN103514071 A CN 103514071A
Authority
CN
China
Prior art keywords
internal storage
internal memory
memory
testing method
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310473227.3A
Other languages
English (en)
Other versions
CN103514071B (zh
Inventor
袁跃峰
张小林
林先贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI FITSCO INTELLIGENT TRAFFIC CONTROL CO Ltd
Original Assignee
SHANGHAI FITSCO INTELLIGENT TRAFFIC CONTROL CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI FITSCO INTELLIGENT TRAFFIC CONTROL CO Ltd filed Critical SHANGHAI FITSCO INTELLIGENT TRAFFIC CONTROL CO Ltd
Priority to CN201310473227.3A priority Critical patent/CN103514071B/zh
Publication of CN103514071A publication Critical patent/CN103514071A/zh
Application granted granted Critical
Publication of CN103514071B publication Critical patent/CN103514071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明公开了一种非破坏性的内存在线测试方法;包括以下步骤:确定对一个内存做一次完整检测所需要的时间上限;把内存检测分布到任务主程序每个周期运行的空闲时间去执行,每个周期会检测内存的一部分,这些周期累计检测完内存的时间不能超过上述规定的时间;把单个周期内内存检测的部分再细化颗粒度,分成多个时间片执行,保证对中断或生命信号的响应时间;备份所测的内存片,再对该内存片采用破坏性测试方法,然后恢复被校验的内存片。本发明的有益效果在于实现了对大容量内存的安全检测问题,解决了在高实时性安全系统中,处于内存检查情况下,对中断响应的延时问题;使用本身属于破坏性的方法应用于非破坏性的内存在线检测中,既提高了内存故障检测覆盖率又不破坏内存的关键静态数据。

Description

非破坏性的内存在线测试方法
技术领域
本发明属于软件算法领域,用于在线检测内存执行功能的正确性。
背景技术
在工业控制系统和安全信号系统(应用于航空电子、铁路信号、核电等行业)中,易失性存储器功能安全是所有安全组件中非常关键的一个,由于这类存储器可以随意存储和修改,灵活性很高,极大地改善了程序的执行效率,但同时给系统带来很大的安全隐患,在安全领域常常需要对内存做周期性检查,确保及时发现内存错误,启动故障管理机制,及时采取安全措施以避免更为严重的事故发生。
内存故障模式比较明确,可以分为三类(固定故障,耦合故障,保持信息故障)安全领域对于内存在线检测一直是业界的难点,通常的做法如下:
1.破坏性测试方法
简单测试法:交替写入0x55和0xAA,并把数据读回,确认内存区是否正常。这种方法测试速度快,但对于耦合故障较难检测到。
走步测试法:遍历每个单元,判断每一个单元能否写入0和1,并确认任一单元写入0或1时是否造成其它任意单元的状态改变,以及检查译码器寻址是否正确.这种方法测试效率较低,对于大容量内存,测试时间非常长。
2.非破坏性测试方法
快速取反校验法:首先从存储字节单元i中读出一个字节,将其取反,然后将该反码写回到存储单元i之中,并同时存入CPU的一个寄存器中.此后再从存储单元i中读出这个反码数据,并同存于寄存器中的反码作比较.最后重复上面的过程,以恢复原来的数据.这种方法对于检查取数速率故障和存储位固定型故障有效,但查找耦合故障无效。
错误检查和纠正ECC(Error Check Correction)方法:如果所选择CPU上的内存控制器带有ECC功能,可利用ECC算法来检测内存的错误。该方法优点是检测速度极快,不影响正常的程序运行。缺点一在于需要额外的内存做支持,缺点二在于只能检测双比特错误,超过2个比特无法检出。
发明内容
本发明所要解决的技术问题是提供一种非破坏性的内存在线测试方法,它可以实现对大容量内存的安全检测,解决在高实时性安全系统中,处于内存检查情况下,对中断响应的延时问题;既提高内存故障检测覆盖率又不破坏内存的关键静态数据。
为了解决以上技术问题,本发明提供了一种非破坏性的内存在线测试方法;包括以下步骤:确定对一个内存做一次完整检测所需要的时间上限;把内存检测分布到任务主程序每个周期运行的空闲时间去执行,每个周期会检测内存的一部分,这些周期累计检测完内存的时间不能超过上述规定的时间;把单个周期内内存检测的部分再细化颗粒度,分成多个时间片执行,保证对中断或生命信号的响应时间;备份所测的内存片,再对该内存片采用破坏性测试方法,然后恢复被校验的内存片。
本发明的有益效果在于:实现了对大容量内存的安全检测问题,解决了在高实时性安全系统中,处于内存检查情况下,对中断响应的延时问题;使用本身属于破坏性的方法应用于非破坏性的内存在线检测中,既提高了内存故障检测覆盖率又不破坏内存的关键静态数据。
依次执行上述步骤,直到所有内存片轮流执行完毕。
备份所测的内存片,再对该内存片采用破坏性测试方法March进行测试。
结合内存失效率,确定对一个内存做一次完整检测所需要的时间上限,在这个规定的时间内必须完成内存的完整检测;
把单个周期内内存检测的部分再细化颗粒度,分成多个时间片执行,该时间片根据实际的内存大小确定。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细说明。
图1是本发明所述方法的示意图。
具体实施方式
本发明公开了一种在安全关键系统中检测内存RAM工作状况的方法。本算法可被任务主程序每周期空闲时间调度一次,或分散到多个周期的空闲时间完整执行一次,用于检测RAM是否发生了硬件故障。本发明针对RAM的功能故障模式,采用非破坏数据的方式对内存做了完整在线测试,此方法特别适合安全关键系统中对于RAM的功能监控,具有良好的安全性和实践性。可应用于铁路电子,航空航天,核电系统等安全关键领域中对于内存功能的状态监控。基于以上几点,本发明对上述算法做了更高层次的算法改进,克服了以上方法一些缺点,达到在线覆盖内存功能故障的目的。
本发明提供一种非破坏性的内存在线测试方法,该算法能够应用于包括但并不局限于安全信号系统、工业控制系统等领域。
如图1所示,本发明整个算法可以分四个阶段:
第一阶段是确定对一个RAM做一次完整检测所需要的时间上限,比如24小时,这是根据安全系统的需要,结合RAM的内存失效率(内存制造商提供数据),计算所得的时间,在这个规定的时间内必须完成RAM的完整检测;
第二阶段是把内存检测分布到任务主程序每个周期运行的空闲时间去执行,每个周期会检测内存的一部分,这些周期累计检测完内存的时间不能超过阶段一所规定的时间。
阶段三:把单个周期内内存检测的部分再细化颗粒度,分成多个时间片执行,保证对中断或生命信号的响应时间。
阶段四:备份所测的内存片,再对该内存片采用覆盖率高的破坏性测试方法,比如March等。然后恢复被校验的内存片。依次执行,直到所有内存片轮流执行完毕。
这个片段可大可小,可根据实际的内存大小来确定。颗粒度不宜过小,否者影响破坏性方法对于耦合故障检测的效果。
本发明的优点是:
1.实现了对大容量内存的安全检测问题,解决了在高实时性安全系统中,处于内存检查情况下,对中断响应的延时问题。
2.使用本身属于破坏性的March方法应用于非破坏性的内存在线检测中。既提高了内存故障检测覆盖率又不破坏内存的关键静态数据。
本发明并不限于上文讨论的实施方式。以上对具体实施方式的描述旨在于为了描述和说明本发明涉及的技术方案。基于本发明启示的显而易见的变换或替代也应当被认为落入本发明的保护范围。以上的具体实施方式用来揭示本发明的最佳实施方法,以使得本领域的普通技术人员能够应用本发明的多种实施方式以及多种替代方式来达到本发明的目的。

Claims (5)

1.一种非破坏性的内存在线测试方法;其特征在于,包括以下步骤:确定对一个内存做一次完整检测所需要的时间上限; 
把内存检测分布到任务主程序每个周期运行的空闲时间去执行,每个周期会检测内存的一部分,这些周期累计检测完内存的时间不能超过上述规定的时间; 
把单个周期内内存检测的部分再细化颗粒度,分成多个时间片执行,保证对中断或生命信号的响应时间; 
备份所测的内存片,再对该内存片采用破坏性测试方法,然后恢复被校验的内存片。 
2.如权利要求1所述的非破坏性的内存在线测试方法;其特征在于,依次执行上述步骤,直到所有内存片轮流执行完毕。 
3.如权利要求2所述的非破坏性的内存在线测试方法;其特征在于,备份所测的内存片,再对该内存片采用破坏性测试方法March进行测试。 
4.如权利要求3所述的非破坏性的内存在线测试方法;其特征在于,结合内存失效率,确定对一个内存做一次完整检测所需要的时间上限,在这个规定的时间内必须完成内存的完整检测。
5.如权利要求4所述的非破坏性的内存在线测试方法;其特征在于,把单个周期内内存检测的部分再细化颗粒度,分成多个时间片执行,该时间片根据实际的内存大小确定。 
CN201310473227.3A 2013-10-11 2013-10-11 非破坏性的内存在线测试方法 Active CN103514071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310473227.3A CN103514071B (zh) 2013-10-11 2013-10-11 非破坏性的内存在线测试方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310473227.3A CN103514071B (zh) 2013-10-11 2013-10-11 非破坏性的内存在线测试方法

Publications (2)

Publication Number Publication Date
CN103514071A true CN103514071A (zh) 2014-01-15
CN103514071B CN103514071B (zh) 2017-01-18

Family

ID=49896834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310473227.3A Active CN103514071B (zh) 2013-10-11 2013-10-11 非破坏性的内存在线测试方法

Country Status (1)

Country Link
CN (1) CN103514071B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108205484A (zh) * 2016-12-19 2018-06-26 比亚迪股份有限公司 基于轨道交通的内存检测方法和装置
CN112685241A (zh) * 2021-01-27 2021-04-20 中国科学院微电子研究所 一种多粒度的内存检测方法、内存设备以及电子设备
CN113918393A (zh) * 2021-09-16 2022-01-11 盾构及掘进技术国家重点实验室 一种功能安全系统内存检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6474636A (en) * 1987-09-17 1989-03-20 Fujitsu Ltd Dummy online test method for terminal equipment
CN102999409A (zh) * 2012-12-20 2013-03-27 迈普通信技术股份有限公司 一种内存测试方法及嵌入式设备
CN103176876A (zh) * 2013-03-19 2013-06-26 卡斯柯信号有限公司 一种高效安全的计算机在线自检方法及自检装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6474636A (en) * 1987-09-17 1989-03-20 Fujitsu Ltd Dummy online test method for terminal equipment
CN102999409A (zh) * 2012-12-20 2013-03-27 迈普通信技术股份有限公司 一种内存测试方法及嵌入式设备
CN103176876A (zh) * 2013-03-19 2013-06-26 卡斯柯信号有限公司 一种高效安全的计算机在线自检方法及自检装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
AMANDEEP SINGH 等: "A Software Based Online Memory Test For Highly Available Systems", 《PROCEEDINGS OF THE 11TH IEEE INTERNATIONAL ON-LINE TESTING SYMPOSIUM》 *
DIMITRIS GIZOPOULOS: "Online Periodic Self-Test Scheduling for Real-Time Processor-Based Systems Dependability Enhancement", 《IEEE TRANSACTIONS ON DEPENDABLE AND SECURE COMPUTING》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108205484A (zh) * 2016-12-19 2018-06-26 比亚迪股份有限公司 基于轨道交通的内存检测方法和装置
CN112685241A (zh) * 2021-01-27 2021-04-20 中国科学院微电子研究所 一种多粒度的内存检测方法、内存设备以及电子设备
CN113918393A (zh) * 2021-09-16 2022-01-11 盾构及掘进技术国家重点实验室 一种功能安全系统内存检测方法
CN113918393B (zh) * 2021-09-16 2024-04-23 盾构及掘进技术国家重点实验室 一种功能安全系统内存检测方法

Also Published As

Publication number Publication date
CN103514071B (zh) 2017-01-18

Similar Documents

Publication Publication Date Title
CN101833497B (zh) 一种基于专家系统方法的计算机故障管理系统
US8732523B2 (en) Data processing apparatus and method for analysing transient faults occurring within storage elements of the data processing apparatus
Oliveira et al. Modern GPUs radiation sensitivity evaluation and mitigation through duplication with comparison
CN103176876A (zh) 一种高效安全的计算机在线自检方法及自检装置
CN104579313B (zh) 一种基于配置帧的在轨sram型fpga故障检测与修复方法
US9275757B2 (en) Apparatus and method for non-intrusive random memory failure emulation within an integrated circuit
CN103984630A (zh) 一种基于at697处理器的单粒子翻转故障处理方法
CN103473162A (zh) 一种基于软件故障注入的可靠性评测系统设计方法
US10095570B2 (en) Programmable device, error storage system, and electronic system device
CN103150228A (zh) 面向高速缓冲存储器的可综合伪随机验证方法及装置
CN102915260B (zh) 固态硬盘容错的方法及其固态硬盘
CN103514071A (zh) 非破坏性的内存在线测试方法
US10303566B2 (en) Apparatus and method for checking output data during redundant execution of instructions
Ebrahimi et al. ScTMR: A scan chain-based error recovery technique for TMR systems in safety-critical applications
CN104750577B (zh) 面向片上大容量缓冲存储器的任意多位容错方法及装置
CN101681287A (zh) 处理器动作检查系统及动作检查电路
CN105068969B (zh) 用于数字信号处理平台架构的单粒子效应防护系统及方法
Lee et al. Evaluation of error detection coverage and fault-tolerance of digital plant protection system in nuclear power plants
Ryabtsev et al. Implementation of memory in a system on a chip with built-in self-testing and self-healing
CN113917385A (zh) 一种面向电能表的自检测方法及系统
Lee et al. Hardware-based online self-diagnosis for faulty device identification in large-scale IoT systems
CN205193787U (zh) 一种双模冗余流水线的故障检测及回退装置
CN114461436A (zh) 一种内存故障处理方法、装置及计算机可读存储介质
Cui et al. Mitigating single event upset method for Zynq MPSoC
Zhang et al. Research of CPU Functional Safety Based on IEC 61508

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant