CN113608911B - 面向SoC中ScratchPad存储器的自愈方法 - Google Patents

面向SoC中ScratchPad存储器的自愈方法 Download PDF

Info

Publication number
CN113608911B
CN113608911B CN202110894184.0A CN202110894184A CN113608911B CN 113608911 B CN113608911 B CN 113608911B CN 202110894184 A CN202110894184 A CN 202110894184A CN 113608911 B CN113608911 B CN 113608911B
Authority
CN
China
Prior art keywords
memory block
fault
self
system number
healing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110894184.0A
Other languages
English (en)
Other versions
CN113608911A (zh
Inventor
黄乐天
王梓任
姜书艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangtze River Delta Research Institute of UESTC Huzhou
Original Assignee
Yangtze River Delta Research Institute of UESTC Huzhou
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangtze River Delta Research Institute of UESTC Huzhou filed Critical Yangtze River Delta Research Institute of UESTC Huzhou
Priority to CN202110894184.0A priority Critical patent/CN113608911B/zh
Publication of CN113608911A publication Critical patent/CN113608911A/zh
Application granted granted Critical
Publication of CN113608911B publication Critical patent/CN113608911B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明公开了面向SoC中ScratchPad存储器的自愈方法,包括获取备份存储器块的故障类型,故障类型为瞬时故障时不作处理,将故障类型为间歇性故障或永久性故障的备份存储器块进行自愈;判断是否完成所有基础存储器块的自愈,若是则其数据备份到备份存储器块,再进行自愈,直到完成一轮自愈;完成两轮自愈后对备份存储器块进行内容翻转缓解以存储器老化。本发明在故障实际发生前将其测试出来以进行修复,保证了系统操作的正确性;采用一种软件无感知的在线测试方法,测试过程几乎不影响系统的正常运行,保证了对实时性要求较高的系统的可靠性;且有效减缓存储器老化。

Description

面向SoC中ScratchPad存储器的自愈方法
技术领域
本发明涉及集成电路领域,具体涉及一种面向SoC中ScratchPad存储器的自愈方法。
背景技术
在集成电路中,随着晶体管工艺尺寸的不断降低,系统的可靠性问题变得日益突出,老化是影响集成电路可靠性的主要因素之一。很多老化机理,例如负偏置温度不稳定性(NBTI)、热载流子注入效应(HCI)和时间相关电介质击穿(TDDB)使集成电路在服役期内失效率随时间的推移而快速升高,对电路的使用寿命造成了严重影响,甚至会导致整个电路系统失效。
随着集成电路集成度的提高,越来越多的IP核被集成到片上系统(SoC)中,使得集成电路能够高效并行地处理任务。现在的SoC中,占有最大片上空间的IP核就是嵌入式存储器,其通常采用极限的设计规则因此容易受到工艺偏差的影响,并且受晶体管的老化问题严重。因此嵌入式存储器的可靠性和稳定性对整个系统的可靠性和稳定性尤为重要。
ScratchPad存储器作为SoC中一种常用的片上存储器,其基于SRAM存储阵列、地址译码电路以及输出电路组成,通过片上高速总线与处理器直接相连,在编址上将ScratchPad存储器的地址空间映射到内存空间,常用于保存数据。
自愈技术是解决系统可靠性问题的常用方法,其主要包括故障检测、故障定位、故障修复等多个步骤,目前针对ScratchPad存储器的自愈方法中主要存在以下问题:
a、电路级老化或故障测试方法,针对SRAM中存储阵列、译码电路和灵敏放大器等结构在电路级上设计老化传感器或故障检测电路,其粒度较细,伴随着较大的面积开销、侵入性较大、测量不精准和设计复杂度高等问题;
b、传统的存储器内建自测试是离线测试,测试过程会破坏原有的存储数据,并且当检测到故障时,系统已经带有故障运行了一段时间,这种故障发生后的检测方法可能造成之前一段时间的系统功能错误;
c、基于降低电压的存储器虚拟老化测试需要在测试过程中调节电压,电压控制具有一定的复杂性;
d、传统的存储器内建自修复是利用存储器阵列的冗余资源来替换故障单元,这需要一定的额外资源开销。
发明内容
针对现有技术中的上述不足,本发明提供的面向SoC中ScratchPad存储器的自愈方法解决了传统自愈过程中系统带故障运行以及占用资源大的问题。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种面向SoC中ScratchPad存储器的自愈方法,其包括以下步骤:
S1、将存储器中的存储器块分别系统编号为A、B、C和D的基础存储器块,以及Copy的备份存储器块;
S2、获取当前系统编号为Copy的备份存储器块的故障类型,若故障类型为间歇性故障或永久性故障则进入步骤S3;若故障类型为瞬时故障则进入步骤S6;
S3、在系统编号为D的基础存储器块中自下而上寻找未被使用的可缩减地址空间;
S4、判断该可缩减地址空间是否故障;若是则返回步骤S3;否则进入步骤S5;
S5、将当前存储器块中的故障单元重新映射到系统编号为D的基础存储器块中的无故障可缩减地址空间中,以缩减ScratchPad存储器中的可利用地址空间,完成当前存储器块的自愈;
S6、判断基础存储器块是否都完成自愈,若是则判定完成一轮自愈并进入步骤S9;否则进入步骤S7;
S7、寻找当前需要完成自愈的基础存储器块,并将其存储的数据备份到系统编号为Copy的备份存储器块中;
S8、将当前需要完成自愈的基础存储器块的系统编号与系统编号为Copy的备份存储器块的系统编号进行互换,并返回步骤S2;
S9、在非自愈阶段周期性对系统编号为Copy的备份存储器块进行内容翻转。
进一步地,步骤S1中系统编号为A的基础存储器块的地址范围为0x0到0x3FF,系统编号为B的基础存储器块的地址范围为0x400到0x7FF,系统编号为C的基础存储器块的地址范围为0x800到0xBFF,系统编号为D的基础存储器块的地址范围为0xC00到0xFFF,系统编号为Copy的备份存储器块不分配地址。
进一步地,步骤S2中获取当前系统编号为Copy的备份存储器块的故障类型的具体方法包括以下子步骤:
S2-1、将当前ScratchPad存储器工作的时钟频率提高到超过其正常工作情况下的时钟频率,并通过内建自测试进行m次故障判定;
S2-2、判断完成m次故障判定后记录的故障次数是否小于等于1次,若是则判定该备份存储器块的故障类型为瞬时故障;否则进入步骤S2-3;
S2-3、判断完成m次故障判定后记录的故障次数是否大于2次且小于m次,若是则判定该备份存储器块的故障类型为间歇性故障;否则判定该备份存储器块的故障类型为永久性故障。
进一步地,步骤S9中的翻转周期设置为两轮自愈时间。
本发明的有益效果为:采用一种设计简单、控制灵活的基于超频虚拟老化的内建自测试方法,在故障实际发生前将其测试出来以进行修复,保证了系统操作的正确性。采用一种软件无感知的在线测试方法,测试过程几乎不影响系统的正常运行,保证了对实时性要求较高的系统的可靠性。采用缩减部分可分配地址空间的方法来修复故障,无需额外的冗余存储资源。采用一种将永久性故障与间歇性故障分类的测试方法,基于此进行故障预测,可以提高测量精准度。在空闲期间对备份存储器块的内容进行翻转进行老化缓解,降低了存储器的老化速度。本发明的方法能够减小面积开销、侵入性和设计复杂度,能够在在线自愈时不破坏存储数据。
附图说明
图1为本发明的流程图;
图2为本发明存储器块的结构图;
图3为本发明自愈过程中存储器块的编号映射变化图;
图4为本发明的故障地址重映射关系图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,该面向SoC中ScratchPad存储器的自愈方法包括以下步骤:
S1、将存储器中的存储器块分别系统编号为A、B、C和D的基础存储器块,以及Copy的备份存储器块;
S2、获取当前系统编号为Copy的备份存储器块的故障类型,若故障类型为间歇性故障或永久性故障则进入步骤S3;若故障类型为瞬时故障则进入步骤S6;
S3、在系统编号为D的基础存储器块中自下而上寻找未被使用的可缩减地址空间;
S4、判断该可缩减地址空间是否故障;若是则返回步骤S3;否则进入步骤S5;
S5、将当前存储器块中的故障单元重新映射到系统编号为D的基础存储器块中的无故障可缩减地址空间中,以缩减ScratchPad存储器中的可利用地址空间,完成当前存储器块的自愈;
S6、判断基础存储器块是否都完成自愈,若是则判定完成一轮自愈并进入步骤S9;否则进入步骤S7;
S7、寻找当前需要完成自愈的基础存储器块,并将其存储的数据备份到系统编号为Copy的备份存储器块中;
S8、将当前需要完成自愈的基础存储器块的系统编号与系统编号为Copy的备份存储器块的系统编号进行互换,并返回步骤S2;
S9、在非自愈阶段周期性对系统编号为Copy的备份存储器块进行内容翻转。
步骤S1中系统编号为A的基础存储器块的地址范围为0x0到0x3FF,系统编号为B的基础存储器块的地址范围为0x400到0x7FF,系统编号为C的基础存储器块的地址范围为0x800到0xBFF,系统编号为D的基础存储器块的地址范围为0xC00到0xFFF,系统编号为Copy的备份存储器块不分配地址。
步骤S2中获取当前系统编号为Copy的备份存储器块的故障类型的具体方法包括以下子步骤:
S2-1、将当前ScratchPad存储器工作的时钟频率提高到超过其正常工作情况下的时钟频率,并通过内建自测试进行m次故障判定;
S2-2、判断完成m次故障判定后记录的故障次数是否小于等于1次,若是则判定该备份存储器块的故障类型为瞬时故障;否则进入步骤S2-3;
S2-3、判断完成m次故障判定后记录的故障次数是否大于2次且小于m次,若是则判定该备份存储器块的故障类型为间歇性故障;否则判定该备份存储器块的故障类型为永久性故障。
步骤S9中的翻转周期设置为两轮自愈时间。
如图2所示,初始状态下,物理编号为0、1、2、3和4的存储器块分别对应系统编号为A、B、C和D的基础存储器块,以及系统编号为Copy的备份存储器块,其中物理编号表示的是存储器块的物理位置,在系统自愈过程中其编号不会发生改变,而存储器块对应的系统编号会发生改变。
如图3所示,系统编号为A的基础存储器块发生自愈前,其数据备份到系统编号为Copy的备份存储器块中,且两个存储器块对应的物理编号发生交换,即物理编号为0存储器块对应系统编号为Copy的备份存储器块,物理编号为4存储器块对应系统编号为A的基础存储器块,备份过后进行自愈。以此类推,当所有存储器块均完成自愈,即完成一轮自愈后,物理编号为0、1、2、3和4的存储器块分别对应系统编号为B的基础存储器块、系统编号为C的基础存储器块、系统编号为D的基础存储器块、系统编号为Copy的备份存储器块,以及系统编号为A的基础存储器块。
如图4所示,自愈过程中,如果检测到某个基础存储块的块内地址P存在故障,而当前系统编号为D的基础存储器块对应的块内地址P已经被已有故障单元映射,那么不再将该系统编号为D的基础存储器块对应的块内地址P作为重映射地址,而是在该系统编号为D的基础存储器块中选择新的重映射地址。
图中深色区块表示故障单元,浅色区块表示正常单元,白色区块表示空区块,条纹阴影区块表示该区块存有数据。
本发明采用一种设计简单、控制灵活的基于超频虚拟老化的内建自测试方法,在故障实际发生前将其测试出来以进行修复,保证了系统操作的正确性。采用一种软件无感知的在线测试方法,测试过程几乎不影响系统的正常运行,保证了对实时性要求较高的系统的可靠性。采用缩减部分可分配地址空间的方法来修复故障,无需额外的冗余存储资源。采用一种将永久性故障与间歇性故障分类的测试方法,基于此进行故障预测,可以提高测量精准度。在空闲期间对备份存储器块的内容进行翻转进行老化缓解,降低了存储器的老化速度。本发明的方法能够减小面积开销、侵入性和设计复杂度,能够在在线自愈时不破坏存储数据。

Claims (4)

1.一种面向SoC中ScratchPad存储器的自愈方法,其特征在于,包括以下步骤:
S1、将存储器中的存储器块分别系统编号为A、B、C和D的基础存储器块,以及Copy的备份存储器块;
S2、获取当前系统编号为Copy的备份存储器块的故障类型,若故障类型为间歇性故障或永久性故障则进入步骤S3;若故障类型为瞬时故障则进入步骤S6;
S3、在系统编号为D的基础存储器块中自下而上寻找未被使用的可缩减地址空间;
S4、判断该可缩减地址空间是否故障;若是则返回步骤S3;否则进入步骤S5;
S5、将当前存储器块中的故障单元重新映射到系统编号为D的基础存储器块中的无故障可缩减地址空间中,以缩减ScratchPad存储器中的可利用地址空间,完成当前存储器块的自愈;
S6、判断基础存储器块是否都完成自愈,若是则判定完成一轮自愈并进入步骤S9;否则进入步骤S7;
S7、寻找当前需要完成自愈的基础存储器块,并将其存储的数据备份到系统编号为Copy的备份存储器块中;
S8、将当前需要完成自愈的基础存储器块的系统编号与系统编号为Copy的备份存储器块的系统编号进行互换,并返回步骤S2;
S9、在非自愈阶段周期性对系统编号为Copy的备份存储器块进行内容翻转。
2.根据权利要求1所述的面向SoC中ScratchPad存储器的自愈方法,其特征在于,步骤S1中系统编号为A的基础存储器块的地址范围为0x0到0x3FF,系统编号为B的基础存储器块的地址范围为0x400到0x7FF,系统编号为C的基础存储器块的地址范围为0x800到0xBFF,系统编号为D的基础存储器块的地址范围为0xC00到0xFFF,系统编号为Copy的备份存储器块不分配地址。
3.根据权利要求1所述的面向SoC中ScratchPad存储器的自愈方法,其特征在于,步骤S2中获取当前系统编号为Copy的备份存储器块的故障类型的具体方法包括以下子步骤:
S2-1、将当前ScratchPad存储器工作的时钟频率提高到超过其正常工作情况下的时钟频率,并通过内建自测试进行m次故障判定;
S2-2、判断完成m次故障判定后记录的故障次数是否小于等于1次,若是则判定该备份存储器块的故障类型为瞬时故障;否则进入步骤S2-3;
S2-3、判断完成m次故障判定后记录的故障次数是否大于2次且小于m次,若是则判定该备份存储器块的故障类型为间歇性故障;否则判定该备份存储器块的故障类型为永久性故障。
4.根据权利要求1所述的面向SoC中ScratchPad存储器的自愈方法,其特征在于,步骤S9中的翻转周期设置为两轮自愈时间。
CN202110894184.0A 2021-08-05 2021-08-05 面向SoC中ScratchPad存储器的自愈方法 Active CN113608911B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110894184.0A CN113608911B (zh) 2021-08-05 2021-08-05 面向SoC中ScratchPad存储器的自愈方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110894184.0A CN113608911B (zh) 2021-08-05 2021-08-05 面向SoC中ScratchPad存储器的自愈方法

Publications (2)

Publication Number Publication Date
CN113608911A CN113608911A (zh) 2021-11-05
CN113608911B true CN113608911B (zh) 2023-06-27

Family

ID=78306893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110894184.0A Active CN113608911B (zh) 2021-08-05 2021-08-05 面向SoC中ScratchPad存储器的自愈方法

Country Status (1)

Country Link
CN (1) CN113608911B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103390430A (zh) * 2012-05-07 2013-11-13 中国科学院微电子研究所 基于哈希表的存储器内建自修复系统及方法
CN110990201A (zh) * 2019-11-29 2020-04-10 中国电子科技集团公司第五十四研究所 一种自愈管理控制器、SoC及自愈方法
CN111312321A (zh) * 2020-03-02 2020-06-19 电子科技大学 一种存储器装置及其故障修复方法
CN112466386A (zh) * 2020-12-07 2021-03-09 电子科技大学 一种面向故障分类的存储器测试系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7107501B2 (en) * 2002-05-31 2006-09-12 Infineon Technologies Ag Test device, test system and method for testing a memory circuit
US20140372805A1 (en) * 2012-10-31 2014-12-18 Verizon Patent And Licensing Inc. Self-healing managed customer premises equipment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103390430A (zh) * 2012-05-07 2013-11-13 中国科学院微电子研究所 基于哈希表的存储器内建自修复系统及方法
CN110990201A (zh) * 2019-11-29 2020-04-10 中国电子科技集团公司第五十四研究所 一种自愈管理控制器、SoC及自愈方法
CN111312321A (zh) * 2020-03-02 2020-06-19 电子科技大学 一种存储器装置及其故障修复方法
CN112466386A (zh) * 2020-12-07 2021-03-09 电子科技大学 一种面向故障分类的存储器测试系统及方法

Also Published As

Publication number Publication date
CN113608911A (zh) 2021-11-05

Similar Documents

Publication Publication Date Title
CN101996689B (zh) 存储器错误处理方法
US7269765B1 (en) Method and apparatus for storing failing part locations in a module
KR102125350B1 (ko) 오류 정정 코드를 이용한 적층형 메모리 장치 및 그 수리 방법
US11119857B2 (en) Substitute redundant memory
US7401270B2 (en) Repair of semiconductor memory device via external command
CN108511029B (zh) 一种fpga中双端口sram阵列的内建自测和修复系统及其方法
CN104361909A (zh) 一种片上ram内建自测试方法及电路
US8356212B2 (en) Memory repair
US20160155514A1 (en) System and method of testing and identifying memory devices
US4912710A (en) Self-checking random access memory
WO2014047225A1 (en) Substitute redundant memory
TW202001917A (zh) 記憶體裝置
WO2019184612A1 (zh) 一种终端及电子设备
CN113608911B (zh) 面向SoC中ScratchPad存储器的自愈方法
CN114116355A (zh) 内存测试方法、装置及电子设备
US20150227461A1 (en) Repairing a memory device
WO2021179213A1 (zh) 修复存储芯片的方法和装置
CN109215724B (zh) 存储器自动检测和修复的方法及装置
CN109390029B (zh) 自动修复nor型存储阵列字线故障的方法及装置
CN110739021A (zh) 半导体存储器的测试方法
JP3162689B2 (ja) メモリ・システム
US20230230649A1 (en) Method and device for testing memory chip
JPH01269299A (ja) 半導体メモリ装置
EP3913634A1 (en) Memory testing by reading and verifying again memory locations after read access
US20220223222A1 (en) Post package repairing method and apparatus for memory, storage medium, and electronic device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant