CN105653411A - 支持局部永久故障恢复的多核处理器芯片可重构系统 - Google Patents

支持局部永久故障恢复的多核处理器芯片可重构系统 Download PDF

Info

Publication number
CN105653411A
CN105653411A CN201511005348.0A CN201511005348A CN105653411A CN 105653411 A CN105653411 A CN 105653411A CN 201511005348 A CN201511005348 A CN 201511005348A CN 105653411 A CN105653411 A CN 105653411A
Authority
CN
China
Prior art keywords
fault
core
reconstruct
configuration file
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201511005348.0A
Other languages
English (en)
Other versions
CN105653411B (zh
Inventor
季振洲
刘君
吴倩倩
张源悍
王楷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201511005348.0A priority Critical patent/CN105653411B/zh
Publication of CN105653411A publication Critical patent/CN105653411A/zh
Application granted granted Critical
Publication of CN105653411B publication Critical patent/CN105653411B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2236Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test CPU or processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2252Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using fault dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Logic Circuits (AREA)
  • Hardware Redundancy (AREA)
  • Design And Manufacture Of Integrated Circuits (AREA)

Abstract

支持局部永久故障恢复的多核处理器芯片可重构系统,属于计算机技术领域。为了解决现有多核处理器芯片的局部故障恢复存在可用性差的问题。所述系统包括:故障检测模块,用于检测多核处理器芯片的故障,并将故障核隔离;故障定位模块,用于获取故障的位置,地址和类型等信息,实现对故障的准确定位;根据故障点的定位分析,确定重构布线的约束条件和需要重构的最小电路模块;故障恢复模块,避开故障点所在位置,采用硬件演化算法生成与需要重构的最小电路模块功能一致的等效模块,获得新的配置码流,基于局部重配置方法将配置文件的差异码流重新下载,实现对故障核的重构,恢复其正常功能。用于多核处理器局部永久故障恢复。

Description

支持局部永久故障恢复的多核处理器芯片可重构系统
技术领域
本发明属于属于计算机技术领域。
背景技术
局部永久故障导致多核处理器芯片功能失效,软件恢复方法难以修复故障区域硬件电路,往往浪费大量的冗余资源进行故障迁移。可重构多核处理器利用片上可重构资源,在故障区域约束条件下通过硬件演化,以最小计算代价和资源开销重构与故障区域功能等效的硬件电路,实现多核处理器局部永久故障的片上恢复,可满足环境苛刻、高可靠性要求的恶劣环境计算、工业控制、移动计算领域的需求,有效提升处理器的可靠性,延长多核处理器的使用寿命。
多核处理器硬件故障恢复是并行体系结构、容错计算、系统可靠性设计等领域的研究热点。但对于支持局部永久故障恢复的多核处理器芯片可重构,已提出的基于软件和硬件恢复的技术方法性能和可靠性难以满足实际需求,还不能真正有效解决多核处理器的故障修复问题,缺少高可用性的支持局部永久故障恢复的多核处理器芯片可重构方法。
发明内容
本发明的目的是为了解决现有多核处理器芯片的局部故障恢复存在可用性差的问题,本发明提供一种支持局部永久故障恢复的多核处理器芯片可重构系统。
本发明的支持局部永久故障恢复的多核处理器芯片可重构系统,所述系统包括故障检测模块、故障定位模块和故障恢复模块;
故障检测模块,用于确定多核处理器中发生局部永久故障的故障核,并对该核进行隔离;
故障定位模块,采用回读方法,从故障核的配置存储器中读取隔离的临时配置文件,与故障核的全局配置文件进行差异比对,并根据配置文件码流与故障核的资源映射关系获取故障的位置、地址和类型信息,实现对故障点的定位;通过对故障点的定位分析,确定重构布线的约束条件和需要重构的最小电路模块;
故障恢复模块,用于避开故障点所在位置,采用硬件演化算法生成与需要重构的最小电路模块功能一致的等效模块,获得新的配置码流,基于局部重配置方法将配置文件的差异码流重新下载,实现对故障核的重构,恢复其正常功能,完成多核处理器芯片的局部永久故障恢复。
所述故障检测模块包括校验器和多核处理器瞬时故障恢复系统;
校验器,用于根据多核处理器每个核的运算结果,输出诊断故障发生在哪一个核上,确定故障核;
所述多核处理器以锁步模式运行程序;
多核处理器故障恢复系统,用于对故障核进行瞬时故障恢复,当恢复不成功,则对该故障核进行隔离,进行局部永久故障恢复。
所述故障定位模块包括外部微控制器、故障定位器、配置文件存储器和配置数据总线;
外部微控制器,用于控制回读操作,从故障核的配置文件寄存器中读取隔离的临时配置文件;
故障定位器,用于将故障核的临时配置文件与全局配置文件进行差异比对,并根据配置文件码流与故障核的资源映射关系获取故障的位置、地址和类型信息;通过对故障点的定位分析,确定重构布线的约束条件和需要重构的最小电路模块;
配置文件存储器,用于存储故障核的全局配置文件和局部配置文件;
配置数据总线,用于读写内部配置寄存器。
所述故障恢复模块包括故障恢复器、功能单元库、期间特征库和技术库和参数库;
功能单元库,用于识别资源使用量和各个功能单元的特征;
器件特征库,用于存储确定的重构布线的约束条件和需要重构的最小电路模块;
技术特征库,用于存储硬件演化算法中的功能模型;
参数库,用于存储硬件演化算法中的参数;
故障恢复器,用于避开故障点所在位置,采用硬件演化算法生成与需要重构的最小电路模块功能一致的等效模块,获得新的配置码流,基于局部重配置方法将配置文件的差异码流重新下载,注入故障核的配置文件寄存器器中,实现对故障核的重构,恢复其正常功能,完成多核处理器芯片的局部永久故障恢复。
一种支持局部永久故障恢复的多核处理器芯片可重构方法,所述方法包括如下步骤:
步骤1:四个处理器核以锁步模式运行程序,当校验器发现比对结果不匹配时,认为检测到故障发生,通过校验器输出诊断故障发生在哪一个核上,确定故障核;
步骤2:首先对故障核进行瞬时故障恢复;若恢复不成功,转步骤3;
步骤3:将故障核进行隔离,其余三个核工作在TMR模式下,可保障在故障修复期内处理器扔具有较高的可靠性;
步骤4:采用回读方法,从可重构硬件的配置存储器中读取隔离的故障核的配置文件,与初始配置文件进行差异比对,并根据配置文件码流与可重构硬件的资源映射关系获取故障的位置、地址和类型信息,实现对故障点的定位;
步骤5:根据故障点的定位分析,确定重构布线的约束条件和需要重构的最小电路模块,将其存储到器件特征库中;
步骤6:采用硬件演化算法生成与需要重构的最小电路模块功能一直的等效模块,从而生成新的配置码流;
步骤7:将新的配置码流重新下载,存入配置文件存储器中,再注入到故障核的配置文件寄存器中,实现对故障核的重构,实现其正常功能。
所述步骤6中,硬件演化算法包括如下步骤:
步骤一:确定布局评价方法;
步骤二:确定算法中的各个参数:编码串长度、群体规模、交叉概率、变异概率和自适应度函数;并将各个参数存入参数库;
步骤三:确定功能模型,将其存入技术特征库;
步骤四:在重构布线的约束条件下,对需要重构的最小电路模块进行布局,产生初始布局种群;
步骤五:计算现有种群的适应度,若满足退出条件,则算法结束,否则,转步骤六;
步骤六:通过适应度选择种群中适应度高的个体;
步骤七:使用赌轮盘法选取适应度较高的个体以相应概率进行交叉和变异操作,转步骤五。
本发明的有益效果在于,实现了多核处理器芯片的局部永久故障的检测,多核处理器芯片的局部永久故障的定位,多核处理器芯片的局部永久故障的恢复,提高了高可用性。
附图说明
图1为具体实施方式中可重构系统的原理示意图。
具体实施方式
具体实施方式一:结合图1说明本实施方式,本实施方式所述的支持局部永久故障恢复的多核处理器芯片可重构系统,所述系统包括故障检测模块、故障定位模块和故障恢复模块;
故障检测模块,用于确定多核处理器中发生局部永久故障的故障核,并对该核进行隔离;
故障定位模块,采用回读方法,从故障核的配置存储器中读取隔离的临时配置文件,与故障核的全局配置文件进行差异比对,并根据配置文件码流与故障核的资源映射关系获取故障的位置、地址和类型信息,实现对故障点的定位;通过对故障点的定位分析,确定重构布线的约束条件和需要重构的最小电路模块;
故障恢复模块,用于避开故障点所在位置,采用硬件演化算法生成与需要重构的最小电路模块功能一致的等效模块,获得新的配置码流,基于局部重配置方法将配置文件的差异码流重新下载,实现对故障核的重构,恢复其正常功能,完成多核处理器芯片的局部永久故障恢复。
本具体实施方式以四核处理器芯片为例说明,提供的局部永久故障可重构方法,在处理器核中添加故障检测模块,通过配置总线连接故障定位模块和故障恢复模块,利用最小代价的冗余硬件逻辑细粒度重构发生局部永久故障的处理器,并在故障恢复期内保障多核处理器扔具有较高可靠性,实现片上可重构处理器的局部永久故障的定位、隔离与恢复。
所述故障检测模块包括校验器和多核处理器瞬时故障恢复系统,原理如图1中所示;
所述四个处理器核以锁步模式运行程序;
校验器,用于根据四核处理器每个核的运算结果,输出诊断故障发生在哪一个核上,确定故障核;
多核处理器故障恢复系统,用于对故障核进行瞬时故障恢复,当恢复不成功,则对该故障核进行隔离,进行局部永久故障恢复。
所述故障定位模块包括外部微控制器、故障定位器、配置文件存储器和配置数据总线;原理如图1所示。
外部微控制器,用于控制回读操作,利用交互接口从故障核的配置文件寄存器中读取隔离的临时配置文件;
故障定位器,用于将故障核的临时配置文件与全局配置文件进行差异比对,并根据配置文件码流与故障核的资源映射关系获取故障的位置、地址和类型信息;通过对故障点的定位分析,确定重构布线的约束条件和需要重构的最小电路模块;
配置文件存储器,用于存储故障核的全局配置文件和局部配置文件;
配置数据总线,用于读写内部配置寄存器,从而实现故障核的配置数据回读和部分重构等功能;
配置文件寄存器,位于故障核内部,用于存储故障核的临时配置文件;
所述故障恢复模块包括故障恢复器、功能单元库、期间特征库和技术库和参数库;
功能单元库,用于识别资源使用量和各个功能单元的特征;
器件特征库,存储对故障核特征的描述,用于存储确定的重构布线的约束条件和需要重构的最小电路模块;
技术特征库,用于存储硬件演化算法中的功能模型;
参数库,用于存储硬件演化算法中的参数;
故障恢复器,用于避开故障点所在位置,采用硬件演化算法生成与需要重构的最小电路模块功能一致的等效模块,获得新的配置码流,基于局部重配置方法将配置文件的差异码流重新下载,实现对故障核的重构,恢复其正常功能,完成多核处理器芯片的局部永久故障恢复。
具体实施方式二:本实施方式具体为一种支持局部永久故障恢复的多核处理器芯片可重构方法,所述方法包括如下步骤:
步骤1:四个处理器核以锁步模式运行程序,当校验器发现比对结果不匹配时,认为检测到故障发生,通过校验器输出诊断故障发生在哪一个核上,确定故障核;
步骤2:首先对故障核进行瞬时故障恢复;若恢复不成功,转步骤3;
步骤3:将故障核进行隔离,其余三个核工作在TMR模式下,可保障在故障修复期内处理器扔具有较高的可靠性;
步骤4:采用回读方法,从可重构硬件的配置存储器中读取隔离的故障核的配置文件,与初始配置文件进行差异比对,并根据配置文件码流与可重构硬件的资源映射关系获取故障的位置、地址和类型信息,实现对故障点的定位;
步骤5:根据故障点的定位分析,确定重构布线的约束条件和需要重构的最小电路模块,将其存储到器件特征库中;
步骤6:采用硬件演化算法生成与需要重构的最小电路模块功能一直的等效模块,从而生成新的配置码流;
步骤7:将新的配置码流重新下载,存入配置文件存储器中,再注入到配置文件寄存器中,实现对故障核的重构,实现其正常功能。
所述步骤6中,硬件演化算法包括如下步骤:
步骤一:确定布局评价方法,此处采用半周长法;即代价函数为:L=q(i)*[max(xi)-min(xi)+max(yi)-max(yi)],将其存入参数库中;
步骤二:确定算法中的各个参数:编码串长度l;群体规模n;交叉概率pc,此处使用部分匹配交叉法;变异概率pm,此处使用随机翻转配置信息位的方法;自适应度函数F(i),此处F(i)=1-Cost(i)/n-Sum[Cost(i)/cost_sum)],其中,Sum(F(i))=1,Cost=q(i)*[max(xi)-min(xi)+max(yi)-max(yi)],将各参数存入参数库;
步骤三:确定功能模型,将其存入技术特征库,功能模型为:以FPGA芯片的基本功能单元4-LUT为例,其分布逻辑输出由输入信号和配置信息决定,其功能模型为:
F0=(C0∧~I0∧~I1∧~I2∧~I3)∨(C1∧~I0∧~I1∧~I2∧~I3)
......
(C14∧~I0∧~I1∧~I2∧~I3)∨(C15∧~I0∧~I1∧~I2∧~I3)
其中Ii为输入信息,Ci为配置码流中控制改4-LUT功能的相关位,i=0,1,2,3。
对于其他4-LUT、连线资源等可建立类似的功能模型,并构成硬件模块功能模型为:
Fout=f(F0,F1,......Fn)
如果存在一个新的配置码流C'=C0'C1'C2'...Cm',n表示C与C'的差异位数,令
M=(Fout(C',0)⊕Fout(C,0))∧(Fout(C',1)⊕Fout(C,1))
∧......
(Fout(C',2^n-1)⊕Fout(C,2^n-1))
满足M=1的解C'就是满足条件的故障核中重构部分的配置码流;
步骤四:在重构布线的约束条件下,对需要重构的最小电路模块进行布局,产生初始布局种群;
步骤五:计算现有种群的适应度,若满足退出条件,则算法结束,否则,转步骤六;
步骤六:通过适应度选择种群中适应度高的个体;
步骤七:使用赌轮盘法选取适应度较高的个体以相应概率进行交叉和变异操作,转步骤五。
得到最终解,下载新的配置码流,存入配置文件存储器中,且将新的配置码流注入到FPGA内部的配置文件寄存器中,实现对故障核部分重构,恢复其正常功能。
以上所述,仅为本发明较佳的具体实施方式,这些具体实施方式都是基于本发明整体构思下的不同实现方式,而且本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种支持局部永久故障恢复的多核处理器芯片可重构系统,其特征在于,所述系统包括故障检测模块、故障定位模块和故障恢复模块;
故障检测模块,用于确定多核处理器中发生局部永久故障的故障核,并对该核进行隔离;
故障定位模块,采用回读方法,从故障核的配置存储器中读取隔离的临时配置文件,与故障核的全局配置文件进行差异比对,并根据配置文件码流与故障核的资源映射关系获取故障的位置、地址和类型信息,实现对故障点的定位;通过对故障点的定位分析,确定重构布线的约束条件和需要重构的最小电路模块;
故障恢复模块,用于避开故障点所在位置,采用硬件演化算法生成与需要重构的最小电路模块功能一致的等效模块,获得新的配置码流,基于局部重配置方法将配置文件的差异码流重新下载,实现对故障核的重构,恢复其正常功能,完成多核处理器芯片的局部永久故障恢复。
2.根据权利要求1所述的支持局部永久故障恢复的多核处理器芯片可重构系统,其特征在于,所述故障检测模块包括校验器和多核处理器瞬时故障恢复系统;
校验器,用于根据多核处理器每个核的运算结果,输出诊断故障发生在哪一个核上,确定故障核;
所述多核处理器以锁步模式运行程序;
多核处理器故障恢复系统,用于对故障核进行瞬时故障恢复,当恢复不成功,则对该故障核进行隔离,进行局部永久故障恢复。
3.根据权利要求1所述的支持局部永久故障恢复的多核处理器芯片可重构系统,其特征在于,所述故障定位模块包括外部微控制器、故障定位器、配置文件存储器和配置数据总线;
外部微控制器,用于控制回读操作,从故障核的配置文件寄存器中读取隔离的临时配置文件;
故障定位器,用于将故障核的临时配置文件与全局配置文件进行差异比对,并根据配置文件码流与故障核的资源映射关系获取故障的位置、地址和类型信息;通过对故障点的定位分析,确定重构布线的约束条件和需要重构的最小电路模块;
配置文件存储器,用于存储故障核的全局配置文件和局部配置文件;
配置数据总线,用于读写内部配置寄存器。
4.根据权利要求3所述的支持局部永久故障恢复的多核处理器芯片可重构系统,其特征在于,所述故障恢复模块包括故障恢复器、功能单元库、期间特征库和技术库和参数库;
功能单元库,用于识别资源使用量和各个功能单元的特征;
器件特征库,用于存储确定的重构布线的约束条件和需要重构的最小电路模块;
技术特征库,用于存储硬件演化算法中的功能模型;
参数库,用于存储硬件演化算法中的参数;
故障恢复器,用于避开故障点所在位置,采用硬件演化算法生成与需要重构的最小电路模块功能一致的等效模块,获得新的配置码流,基于局部重配置方法将配置文件的差异码流重新下载,注入故障核的配置文件寄存器器中,实现对故障核的重构,恢复其正常功能,完成多核处理器芯片的局部永久故障恢复。
5.一种支持局部永久故障恢复的多核处理器芯片可重构方法,其特征在于,所述方法包括如下步骤:
步骤1:四个处理器核以锁步模式运行程序,当校验器发现比对结果不匹配时,认为检测到故障发生,通过校验器输出诊断故障发生在哪一个核上,确定故障核;
步骤2:首先对故障核进行瞬时故障恢复;若恢复不成功,转步骤3;
步骤3:将故障核进行隔离,其余三个核工作在TMR模式下,可保障在故障修复期内处理器扔具有较高的可靠性;
步骤4:采用回读方法,从可重构硬件的配置存储器中读取隔离的故障核的配置文件,与初始配置文件进行差异比对,并根据配置文件码流与可重构硬件的资源映射关系获取故障的位置、地址和类型信息,实现对故障点的定位;
步骤5:根据故障点的定位分析,确定重构布线的约束条件和需要重构的最小电路模块,将其存储到器件特征库中;
步骤6:采用硬件演化算法生成与需要重构的最小电路模块功能一直的等效模块,从而生成新的配置码流;
步骤7:将新的配置码流重新下载,存入配置文件存储器中,再注入到故障核的配置文件寄存器中,实现对故障核的重构,实现其正常功能。
6.根据权利要求1所述的支持局部永久故障恢复的多核处理器芯片可重构方法,其特征在于:所述步骤6中,硬件演化算法包括如下步骤:
步骤一:确定布局评价方法;
步骤二:确定算法中的各个参数:编码串长度、群体规模、交叉概率、变异概率和自适应度函数;并将各个参数存入参数库;
步骤三:确定功能模型,将其存入技术特征库;
步骤四:在重构布线的约束条件下,对需要重构的最小电路模块进行布局,产生初始布局种群;
步骤五:计算现有种群的适应度,若满足退出条件,则算法结束,否则,转步骤六;
步骤六:通过适应度选择种群中适应度高的个体;
步骤七:使用赌轮盘法选取适应度较高的个体以相应概率进行交叉和变异操作,转步骤五。
CN201511005348.0A 2015-12-28 2015-12-28 支持局部永久故障恢复的多核处理器芯片可重构系统 Expired - Fee Related CN105653411B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511005348.0A CN105653411B (zh) 2015-12-28 2015-12-28 支持局部永久故障恢复的多核处理器芯片可重构系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511005348.0A CN105653411B (zh) 2015-12-28 2015-12-28 支持局部永久故障恢复的多核处理器芯片可重构系统

Publications (2)

Publication Number Publication Date
CN105653411A true CN105653411A (zh) 2016-06-08
CN105653411B CN105653411B (zh) 2019-01-18

Family

ID=56478019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511005348.0A Expired - Fee Related CN105653411B (zh) 2015-12-28 2015-12-28 支持局部永久故障恢复的多核处理器芯片可重构系统

Country Status (1)

Country Link
CN (1) CN105653411B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106341281A (zh) * 2016-11-10 2017-01-18 福州智永信息科技有限公司 linux服务器分布式故障检测和恢复方法
CN107291591A (zh) * 2017-06-14 2017-10-24 郑州云海信息技术有限公司 一种存储故障修复方法及装置
CN109557453A (zh) * 2018-11-28 2019-04-02 郑州云海信息技术有限公司 一种多主控芯片识别处理方法及系统
CN110489167A (zh) * 2019-07-26 2019-11-22 广东高云半导体科技股份有限公司 双内核码流下载方法、装置、计算机设备及存储介质
CN111581003A (zh) * 2020-04-29 2020-08-25 浙江大学 一种全硬件双核锁步处理器容错系统
CN113010353A (zh) * 2021-03-22 2021-06-22 北京灵汐科技有限公司 核地址更新方法、映射方法、数据传输方法及装置、芯片
CN113568790A (zh) * 2020-04-28 2021-10-29 北京比特大陆科技有限公司 芯片的检测方法、检测装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090144678A1 (en) * 2007-11-30 2009-06-04 International Business Machines Corporation Method and on-chip control apparatus for enhancing process reliability and process variability through 3d integration
CN103744961A (zh) * 2014-01-06 2014-04-23 清华大学 用可重构的文件系统目录树提高非易失性存储寿命的方法
CN103870353A (zh) * 2014-03-18 2014-06-18 北京控制工程研究所 一种面向多核的可重构容错系统及方法
CN104572326A (zh) * 2014-12-18 2015-04-29 北京时代民芯科技有限公司 一种基于回读自重构的SoPC芯片容错方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090144678A1 (en) * 2007-11-30 2009-06-04 International Business Machines Corporation Method and on-chip control apparatus for enhancing process reliability and process variability through 3d integration
CN103744961A (zh) * 2014-01-06 2014-04-23 清华大学 用可重构的文件系统目录树提高非易失性存储寿命的方法
CN103870353A (zh) * 2014-03-18 2014-06-18 北京控制工程研究所 一种面向多核的可重构容错系统及方法
CN104572326A (zh) * 2014-12-18 2015-04-29 北京时代民芯科技有限公司 一种基于回读自重构的SoPC芯片容错方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106341281A (zh) * 2016-11-10 2017-01-18 福州智永信息科技有限公司 linux服务器分布式故障检测和恢复方法
CN107291591A (zh) * 2017-06-14 2017-10-24 郑州云海信息技术有限公司 一种存储故障修复方法及装置
CN109557453A (zh) * 2018-11-28 2019-04-02 郑州云海信息技术有限公司 一种多主控芯片识别处理方法及系统
CN109557453B (zh) * 2018-11-28 2021-04-27 郑州云海信息技术有限公司 一种多主控芯片识别处理方法及系统
CN110489167A (zh) * 2019-07-26 2019-11-22 广东高云半导体科技股份有限公司 双内核码流下载方法、装置、计算机设备及存储介质
CN113568790A (zh) * 2020-04-28 2021-10-29 北京比特大陆科技有限公司 芯片的检测方法、检测装置和电子设备
CN113568790B (zh) * 2020-04-28 2023-11-21 北京比特大陆科技有限公司 芯片的检测方法、检测装置和电子设备
CN111581003A (zh) * 2020-04-29 2020-08-25 浙江大学 一种全硬件双核锁步处理器容错系统
CN111581003B (zh) * 2020-04-29 2021-12-28 浙江大学 一种全硬件双核锁步处理器容错系统
CN113010353A (zh) * 2021-03-22 2021-06-22 北京灵汐科技有限公司 核地址更新方法、映射方法、数据传输方法及装置、芯片
CN113010353B (zh) * 2021-03-22 2024-05-28 北京灵汐科技有限公司 核地址更新方法、映射方法、数据传输方法及装置、芯片

Also Published As

Publication number Publication date
CN105653411B (zh) 2019-01-18

Similar Documents

Publication Publication Date Title
CN105653411A (zh) 支持局部永久故障恢复的多核处理器芯片可重构系统
CN101276298B (zh) 一种fpga电路故障检测装置
CN102160030B (zh) 对于数据存储的写通信的聚集
CN102521062B (zh) 可全面在线自检测单粒子翻转的软件容错方法
US11726899B2 (en) Waveform based reconstruction for emulation
US11307049B2 (en) Methods, apparatuses, systems, and storage media for storing and loading visual localization maps
CN104699577B (zh) 用于在分布式码字存储系统中定位故障管芯的计数器
CN105279049A (zh) 一种故障自主恢复三模冗余容错计算机ip核的设计方法
CN102521128B (zh) 面向云平台的软件故障容忍方法
US10248497B2 (en) Error detection and correction utilizing locally stored parity information
CN104156357A (zh) 电子地图数据的检验方法及装置
US8554727B2 (en) Method and system of tiered quiescing
CN103218272A (zh) 一种星载数字信号处理器翻转加固方法
US10324782B1 (en) Hiccup management in a storage array
CN112785736A (zh) 高速公路车辆通行费漏费稽核判断方法、装置、介质及设备
CN104572326A (zh) 一种基于回读自重构的SoPC芯片容错方法
CN104268253B (zh) 一种基于查找表配置位统计的部分三模冗余方法
Li et al. Self-repair of uncore components in robust system-on-chips: An opensparc t2 case study
CN105631062A (zh) 一种检查集成电路线网连通关系的方法
Yu et al. Permanent fault repair for FPGAs with limited redundant area
CN103942119A (zh) 一种存储器错误的处理方法和装置
Wang et al. Fault-tolerant strategy for real-time system based on evolvable hardware
CN105320575A (zh) 一种双模冗余流水线的自校验及恢复装置与方法
CN110990197B (zh) 一种基于超级计算机的应用级多层检查点的优化方法
CN105302679A (zh) 一种智能终端存储稳定性的检测方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190118