CN110471802A - 存储设备健康度检测方法、装置及存储介质 - Google Patents

存储设备健康度检测方法、装置及存储介质 Download PDF

Info

Publication number
CN110471802A
CN110471802A CN201910599312.1A CN201910599312A CN110471802A CN 110471802 A CN110471802 A CN 110471802A CN 201910599312 A CN201910599312 A CN 201910599312A CN 110471802 A CN110471802 A CN 110471802A
Authority
CN
China
Prior art keywords
characteristic parameter
health degree
detected
storage equipment
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910599312.1A
Other languages
English (en)
Inventor
周亚雄
罗雁云
陈武
吴非
王顺卓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201910599312.1A priority Critical patent/CN110471802A/zh
Publication of CN110471802A publication Critical patent/CN110471802A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test buses, lines or interfaces, e.g. stuck-at or open line faults
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供一种存储设备健康度检测方法、装置及存储介质。该方法包括:获取待检测存储设备的特征参数,待检测存储设备包括总线接口、存储单元和控制单元,特征参数包括总线接口、存储单元和控制单元中至少两部分的特征参数,特征参数用于表征导致对应部分失效的原因;根据特征参数及健康度衡量模型,确定待检测存储设备的健康度,该健康度衡量模型为根据特征参数预先建立的模型。通过本申请实施例可以提高存储设备的健康度的评估准确度。

Description

存储设备健康度检测方法、装置及存储介质
技术领域
本申请实施例涉及闪存技术,尤其涉及一种存储设备健康度检测方法、装置及存储介质。
背景技术
随着闪存技术的不断发展,嵌入式多媒体卡(embeded multi media card,eMMC)和通用闪存存储器(universal flash storage,UFS)等存储设备应用而生,并因其速度快、延迟小、功耗低和良好的多任务处理能力等优点在嵌入式智能终端中得到了广泛的应用。在实际应用中,为了保证如上所述存储设备的良品率,需要寻找一种检测其健康度的方案,以保证存储设备的高度可用性。
现有方案虽可基于存储设备中存储单元的写入量来评估其健康度,但准确度较低。
发明内容
本申请实施例提供一种存储设备健康度检测方法、装置及存储介质,以提高存储设备的健康度的评估准确度。
为了实现上述目的,本申请实施例提供如下技术方案:
第一方面,本申请实施例提供一种存储设备健康度检测方法,包括:获取待检测存储设备的特征参数,其中待检测存储设备包括总线接口、存储单元和控制单元,该特征参数包括总线接口、存储单元和控制单元中至少两部分的特征参数,特征参数用于表征导致对应部分失效的原因;根据特征参数及健康度衡量模型,确定待检测存储设备的健康度,该健康度衡量模型为根据上述特征参数预先建立的模型。
由于待检测存储设备的健康度的确定综合了包括总线接口、存储单元和控制单元中至少两部分的特征参数,因此通过本申请实施例可以提高存储设备的健康度的评估准确度。
一种可能的实施方式中,如上所述根据特征参数及健康度衡量模型,确定待检测存储设备的健康度,可以包括:根据特征参数,确定待检测存储设备中对应部分的磨损指标,该磨损指标用于表征磨损程度;并根据磨损指标和健康度衡量模型,确定待检测存储设备的健康度。
一种可能的实施方式中,如上所述根据特征参数,确定待检测存储设备中对应部分的磨损指标,可包括以下至少两项:
根据总线接口的特征参数,确定总线接口的磨损指标R1
根据控制单元的特征参数,确定控制单元的磨损指标R2
根据存储单元的特征参数,确定存储单元的磨损指标R3
其中,a1、b1和c1的值是由训练模型R=aebt+c基于总线接口的特征参数训练得到;a2、b2和c2的值是由训练模型R=aebt+c基于控制单元的特征参数训练得到,t表示时间;RBER表示原始比特错误数,Numab表示总比特读出数。
一种可能的实施方式中,如上所述根据磨损指标和健康度衡量模型,确定待检测存储设备的健康度,可以包括:根据总线接口的磨损指标、控制单元的磨损指标和存储单元的磨损指标中至少两项,以及健康度衡量模型,确定待检测存储设备的健康度。
一种可能的实施方式中,如上所述根据特征参数及健康度衡量模型,确定待检测存储设备的健康度之后,该方法还可以包括:根据待检测存储设备的健康度,对待检测存储设备进行筛选。即在生产阶段,基于待检测存储设备的健康度对其进行筛选,验证其是否为合格产品。
或者,如上所述根据特征参数及健康度衡量模型,确定待检测存储设备的健康度之后,该方法还可以包括:根据待检测存储设备的健康度,提醒用户进行数据迁移或备份。即在使用阶段,基于待检测存储设备的健康度对其进行评估,验证其中存储的数据是否需要备份或迁移,从而保证数据的安全。
第二方面,本申请实施例提供一种存储设备健康度检测装置,包括:
获取模块,用于获取待检测存储设备的特征参数,待检测存储设备包括总线接口、存储单元和控制单元,特征参数包括总线接口、存储单元和控制单元中至少两部分的特征参数,特征参数用于表征导致对应部分失效的原因;
确定模块,用于根据特征参数及健康度衡量模型,确定待检测存储设备的健康度,该健康度衡量模型为根据所述特征参数预先建立的模型。
进一步地,确定模块可以包括:
第一确定子模块,用于根据特征参数,确定待检测存储设备中对应部分的磨损指标,该磨损指标用于表征磨损程度;
第二确定子模块,用于根据磨损指标和健康度衡量模型,确定待检测存储设备的健康度。
一种可能的实施方式中,第一确定子模块可具体用于以下至少两项:
根据总线接口的特征参数,确定总线接口的磨损指标R1
根据控制单元的特征参数,确定控制单元的磨损指标R2
根据存储单元的特征参数,确定存储单元的磨损指标R3
其中,a1、b1和c1的值是由训练模型R=aebt+c基于总线接口的特征参数训练得到;a2、b2和c2的值是由训练模型R=aebt+c基于控制单元的特征参数训练得到,t表示时间;RBER表示原始比特错误数,Numab表示总比特读出数。
一种可能的实施方式中,第二确定子模块可以具体用于:根据总线接口的磨损指标、控制单元的磨损指标和存储单元的磨损指标中至少两项,以及健康度衡量模型,确定待检测存储设备的健康度。
进一步地,存储设备健康度检测装置还可以包括:处理模块,用于在确定模块根据特征参数及健康度衡量模型,确定待检测存储设备的健康度之后,根据待检测存储设备的健康度,对待检测存储设备进行筛选。即在生产阶段,基于待检测存储设备的健康度,对其进行筛选,以保证出厂产品的合格。
或者,在确定模块根据特征参数及健康度衡量模型,确定待检测存储设备的健康度之后,根据待检测存储设备的健康度,提醒用户进行数据迁移或备份。即在使用阶段,基于待检测存储设备的健康度,提醒用户进行数据迁移或备份,以保证存储设备中所存储数据的安全,避免数据丢失。
在上述第一方面或第二方面任一可能的实施方式的基础上,还存在以下可能的实施方式:
可选地,存储单元的特征参数可以包括以下参数中的至少一个:运行坏块数、出厂坏块数、RBER和UBER,等等。
可选地,控制单元的特征参数可以包括以下参数中的至少一个:温度预警时间和、控制单元处理失败次数和异常状态处理次数,等等。
可选地,总线接口的特征参数可以包括以下参数中的至少一个:数据传输错误次数和数据校验失败次数等。
第三方面,本申请实施例提供一种存储设备健康度检测装置,包括:存储器和处理器。
其中,所述存储器上存储有可供所述处理器执行的计算机程序;
当所述处理器读取并执行所述计算机程序时,使得所述处理器执行如第一方面中任一项所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,所述计算机程序包含至少一段代码,所述至少一段代码可由处理器执行,实现如第一方面中任一项所述的方法。
第五方面,本申请实施例提供一种芯片,所述芯片上存储有计算机程序,在所述计算机程序被处理器执行时,执行如第一方面中任一项所述的方法。
本申请的这些和其它方面在以下(多个)实施例的描述中会更加简明易懂。
附图说明
图1为本申请实施例提供的存储设备的结构示意图;
图2为本申请一实施例提供的存储设备健康度检测方法的流程图;
图3为本申请一实施例提供的建模过程示意图;
图4为UFS的结构示意图;
图5为本申请一实施例提供的健康度衡量模型的类电路图;
图6为本申请另一实施例提供的存储设备健康度检测方法的流程图;
图7为本申请一实施例提供的存储设备健康度检测装置的结构示意图;
图8为本申请另一实施例提供的存储设备健康度检测装置的结构示意图。
具体实施方式
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
以下,对本申请实施例中的部分术语及应用场景进行解释说明,以便于理解:
eMMC/UFS,均是面向移动端闪存的设备,两者的区别仅在于接口协议不一样,其中,eMMC采用MMC协议,UFS采用UFS协议。eMMC/UFS等存储设备均是由总线接口,控制单元和存储单元三个主要部分组成,如图1所示。具体地,总线接口负责和主机交互;控制单元建立了主机和存储设备之间的数据交换方法,且提供设备管理能力;存储单元由NAND闪存颗粒组成,是负责存放数据的物理设备。
健康度,即健康等级。
实际应用中,由于产线筛选存储设备的不准确性,存储设备在后面使用过程中经常出现故障,从而导致用户的一些较为重要的数据会因为存储设备的损坏而丢失,这种情况对于用户来说是一个重大的损失。因此,为了解决上面出现的问题,需要寻找一种能够准确检测eMMC或UFS等存储设备的健康度方法。
现有方案可基于存储设备中存储单元的写入量来评估其健康度。以eMMC为例,存储单元包括多个存储块,在存储块中尚未存储数据时,称之为空闲存储块。当空闲存储块足够写入数据时,将数据写入eMMC;上层应用程序通过对eMMC写入不同大小的文件来获取底层反馈的实际写入大小,求出各种大小文件的数据缓冲率,再通过统计安卓(android)系统中所有应用程序在单位时间内对eMMC存储的使用、每个应用写入文件大小及次数计算出eMMC的寿命,以评估eMMC的健康度。
发明人研究发现,通过上述现有方案虽可以评估存储设备的健康度,但准确度较低。具体原因在于:
1、参数选取不全面。
存储设备包括总线接口,控制单元以及存储单元,三者中任一部件损坏,存储设备均会故障,不能正常工作。现有方案只选取了存储单元的相关参数,但可用的控制单元和总线接口也是数据有效存储的必要条件,因此现有方案不足以度量整个存储设备的健康度,无法准确有效地筛选出劣质的存储设备,导致存储设备在后面的使用中出现数据丢失的严重后果。
2、参数选取不准确。
考虑到存储块之间耐磨损力存在差异,用统一的耐久力度量存储设备中所有存储块的寿命是不准确的。
基于上述,本申请实施例提供一种存储设备健康度检测方法、装置及存储介质,较全面地选取总线接口、控制单元和存储单元中至少两个组成部分的特征参数,根据所选取的特征参数的数值来综合度量存储设备的健康度,以提高存储设备的健康度的评估准确度。
图2为本申请一实施例提供的存储设备健康度检测方法的流程图。本申请实施例提供一种存储设备健康度检测方法,该方法可以由存储设备健康度检测装置执行,该装置可以通过软件和/或硬件的方式实现,对此本申请实施例不予限制。
如图2所示,该存储设备健康度检测方法包括以下步骤:
S201、获取待检测存储设备的特征参数。
其中,待检测存储设备包括总线接口、存储单元和控制单元。特征参数包括总线接口、存储单元和控制单元中至少两部分的特征参数。特征参数用于表征导致对应部分失效的原因。
可选地,存储单元的特征参数,可以包括以下参数中的至少一个:
运行坏块数,为存储设备运行过程中产生的坏块数;
出厂坏块数,为存储设备出厂时的坏块数目;
原始比特错误率(raw bit error rate,RBER),为未纠错前的读出错误率;
不可修复的错误比特率(uncorrectable bit error rate,UBER),为纠错后无法修复数。
可选地,控制单元的特征参数,可以包括以下参数中的至少一个:
温度预警时间,即控制单元温度达到预警值的时间长度;
控制单元处理失败次数;
异常状态处理次数。
可选地,总线接口的特征参数,可以包括以下参数中的至少一个:
数据传输错误次数;
数据校验失败次数。
S202、根据特征参数及健康度衡量模型,确定待检测存储设备的健康度。
其中,健康度衡量模型为根据上述特征参数预先建立的模型。健康度衡量模型的训练应涵盖涉及总线接口,控制单元以及存储单元的特征参数。然而,由于存储设备中各个组成部分的失效机理和特点并不相同,因此,本申请实施例通过机器学习算法对各个特征参数进行学习,从而建立健康度衡量模型。
在eMMC或UFS等存储设备使用的整个生命期内,检测相关特征参数,实时度量存储设备的健康度,指导存储设备的管理,避免不必要的数据丢失,并且利用健康度提高存储设备产线筛选效率。
参考图3,具体的建模过程为:首先,通过规模化试验产生一定数量的数据集,该数据集包括总线接口的特征参数、控制单元的特征参数和存储单元的特征参数,并对该数据集进行预处理,针对各个不同的特征参数对数据集中数据进行相应的标注。然后,按照一定的比例将数据集随机的划分为训练集、验证集和测试集,运用相应的机器学习算法对数据集进行训练。其中,训练集用于建立健康度衡量模型,通过训练集的训练可以拟合出各个特征与健康度之间的关系曲线,建立健康度衡量模型,验证集用于对建立的健康度衡量模型进行选择,当通过训练集训练出多个健康度衡量模型时,通过验证集的验证可以确定出多个健康度衡量模型中的最优模型。测试集用于对健康度衡量模型的性能进行测试。当通过训练集训练出一个健康度衡量模型时,将验证集并入测试集,对得到的健康度衡量模型进行测试。当健康度衡量模型的性能满足要求时则可以使用该健康度衡量模型对存储设备的健康度进行检测,当健康度衡量模型的性能不满足要求时则需要重新训练健康度衡量模型或者重新试验以获得新的充足的数据集。
本申请实施例,通过获取待检测存储设备的特征参数,其中待检测存储设备包括总线接口、存储单元和控制单元,该特征参数包括总线接口、存储单元和控制单元中至少两部分的特征参数,特征参数用于表征导致对应部分失效的原因,并根据特征参数及健康度衡量模型,确定待检测存储设备的健康度,该健康度衡量模型为预先建立的模型。由于待检测存储设备的健康度的确定综合了包括总线接口、存储单元和控制单元中至少两部分的特征参数,因此通过本申请实施例可以提高存储设备的健康度的评估准确度。
在上述实施例的基础上,进一步地,S202、根据特征参数及健康度衡量模型,确定待检测存储设备的健康度,可以包括:根据特征参数,确定待检测存储设备中对应部分的磨损指标,该磨损指标用于表征磨损程度;根据磨损指标和健康度衡量模型,确定待检测存储设备的健康度。
可选地,根据特征参数,确定待检测存储设备中对应部分的磨损指标,可以包括以下至少两项:
根据总线接口的特征参数,确定总线接口的磨损指标R1
根据控制单元的特征参数,确定控制单元的磨损指标R2
根据存储单元的特征参数,确定存储单元的磨损指标R3RBER表示原始比特错误数,Numab表示总比特读出数。
需说明的是,在上述关于磨损指标R1和磨损指标R2的公式中,参数a1、b1和c1的值是由训练模型R=aebt+c基于总线接口的特征参数(例如,数据传输错误次数和数据校验失败次数)训练得到,参数a2、b2和c2的值是由训练模型R=aebt+c基于控制单元的特征参数(例如,温度预警次数和所述控制单元处理失败次数)训练得到,其中,t表示时间。
相应地,根据磨损指标和健康度衡量模型,确定待检测存储设备的健康度,可以包括:根据总线接口的磨损指标、控制单元的磨损指标和存储单元的磨损指标中至少两项,以及健康度衡量模型,确定待检测存储设备的健康度。这里,可以理解,该步骤与S201相关,例如,若S201中获取的待检测存储设备的特征参数为总线接口特征参数和控制单元的特征参数,则根据总线接口的磨损指标和控制单元的磨损指标,以及健康度衡量模型,确定待检测存储设备的健康度;又例如,若S201中获取的待检测存储设备的特征参数为总线接口特征参数、控制单元的特征参数和存储单元的特征参数,则根据总线接口的磨损指标、控制单元的磨损指标和存储单元的磨损指标,以及健康度衡量模型,确定待检测存储设备的健康度,其它类似,此处不再一一赘述。
接下来,以UFS为例,对上述原理进行解释说明:
1.1获取特征参数。
UFS是一种复杂的电子器件,主要包括总线接口、控制单元以及存储单元,如图4所示。特征参数包括了总线接口的数据传输错误次数,控制单元的温度预警时间,存储单元的运行坏块数、出厂坏块数以及RBER。
1.2UFS健康度建模
UFS的健康度可以认为是采集、处理和管理数据来获得UFS当前状态并决定它执行一项给定任务能力的指标。UFS本身是一个比较复杂的系统,系统内各个子系统健康度的指标因素很多,且各不相同,各指标因素之间的联系非常复杂,这无形中增加了UFS健康状态评价的难度。基于此,该健康度衡量模型的建立首先将UFS按照功能模块分成3个子系统,对每一个子系统的指标因素进行详细的分析和归类,逐个子系统进行健康度评价,最后综合得出UFS的健康度。
UFS整个系统能否良好运行需要总线接口、控制单元以及存储单元三部分共同决定。上层应用和UFS之间通过总线接口进行命令传递和数据交互;控制单元对上层发过来的读写请求进行响应,并通过地址映射将上层写入的逻辑地址转换成闪存阵列中相应的物理地址,加上错误校验信息后将数据写入到闪存阵列中;闪存存储介质本身物理上存在一些缺陷,会造成某些数据位发生翻转。当UFS使用一段时间之后,这三部分将会不同程度的造成一些磨损,使得UFS的可靠性下降。
从UFS的工作逻辑上分析,三部分中任一部分严重受损,UFS就会出现故障,导致当前执行的任务失败。所以,UFS整体的健康度评测需要综合三部分的健康度。假定开始UFS的健康度值为常数H,使用一段时间后各个部分可能产生一定程度的磨损。而且,各部分的磨损程度越大,最后整体的UFS健康度就会下降,并且其中任一部分磨损程度较大时,将会导致整个UFS功能失效,无法正常工作。
根据上面UFS健康度的逻辑关系可以看出,UFS的健康度衡量模型类似于图5中R部分的电压值。刚投入使用的UFS的健康度H可以类似图5中电压恒为U的电源,R1,R2,R3可以分别代表总线接口、控制单元以及存储单元的磨损指标,是包含了相关参数为变量的磨损度函数。其中,总线接口的磨损指标R1可以是一健康度随时间指数衰减的函数控制单元的磨损指标R2可以是一健康度随时间指数衰减的函数存储单元的磨损指标R3可以是一随时间分段式增长的函数R1,R2,R3的值是动态变化的,R的值是常数。电路开始通电时,R1,R2和R3的初始值很小,可以忽略,电源的电压值基本都分给了电阻R,这个时候代表UFS的健康度为H,随着不断的使用,R1,R2和R3的阻值会不同程度的增大,当其中的某一个电阻值增加到很大的时候,整个电路中的电流小到接近0,分到R的电压值V接近0,代表UFS的健康度变为0,UFS完全不能使用。
根据上面的描述,可以得到UFS的健康度衡量模型的数学表达式如下:
其中,R分得的电压为UFS的健康度f。
本申请实施例提供的健康度衡量模型将UFS的健康度度量转为了UFS中各部分磨损的度量,简化了健康度衡量模型的建立,为以后准确度量UFS的健康度提供了指导。
本申请实施例将存储设备的健康度的判断具体化,并且结合对eMMC/UFS理论分析的基础上,选取较为全面的特征参数,利用机器学习的方法建立eMMC/UFS的健康度衡量模型,并利用真实的平台进行测试,根据测试结果选取精确模型得到eMMC/UFS的健康度衡量模型,具备理论依据和真实的实验基础环节,系统地得到eMMC/UFS的健康度衡量模型,该健康度衡量模型能实时、准确度量存储设备的健康度。
另外,考虑到在使用过程中,存储设备的磨损会不断增加,直至失效。然而,在存储设备失效之前缺少预警机制,导致数据因为无法提前迁移而丢失的问题。因此,在上述实施例的基础上,本申请实施例建立存储设备的失效预警机制。
图6为本申请另一实施例提供的存储设备健康度检测方法的流程图。参考图6,该存储设备健康度检测方法可以包括以下步骤:
S601、获取待检测存储设备的特征参数。
该步骤与S201类似,此处不再赘述。
S602、根据特征参数及健康度衡量模型,确定待检测存储设备的健康度。
该步骤与S202类似,此处不再赘述。
S603、根据待检测存储设备的健康度,提醒用户进行数据迁移或备份。
通过实时获取存储设备的相关特征参数,通过这些特征参数得到例如eMMC/UFS等存储设备的健康度,并通知给用户,提醒用户将eMMC/UFS等存储设备上的数据是否需要备份或移动到其他存储器里。即在使用阶段,基于待检测存储设备的健康度,提醒用户进行数据迁移或备份,以保证存储设备中所存储数据的安全,避免数据丢失。
该实施例,基于健康度建立存储设备的失效预警机制,减小数据丢失的风险。
可替换地,S603、根据待检测存储设备的健康度,提醒用户进行数据迁移或备份,可以替换为:根据待检测存储设备的健康度,对待检测存储设备进行筛选。
通过本申请实施例提供的存储设备健康度检测方法,存储设备厂商可以根据处理相同请求后的eMMC/UFS等存储设备的健康度确定eMMC/UFS等存储设备的优劣,剔除同等请求量下,健康度低的产品,提高产线筛选的效率。即在生产阶段,基于待检测存储设备的健康度,对其进行筛选,以保证出厂产品的合格。
图7为本申请一实施例提供的存储设备健康度检测装置的结构示意图。如图7所示,存储设备健康度检测装置70包括:获取模块71和确定模块72。其中:
获取模块71,用于获取待检测存储设备的特征参数.
其中,待检测存储设备包括总线接口、存储单元和控制单元。上述特征参数包括总线接口、存储单元和控制单元中至少两部分的特征参数。该特征参数用于表征导致对应部分失效的原因。
确定模块72,用于根据特征参数及健康度衡量模型,确定待检测存储设备的健康度。
其中,该健康度衡量模型为根据所述特征参数预先建立的模型。
本申请实施例,通过获取待检测存储设备的特征参数,其中待检测存储设备包括总线接口、存储单元和控制单元,该特征参数包括总线接口、存储单元和控制单元中至少两部分的特征参数,特征参数用于表征导致对应部分失效的原因,并根据特征参数及健康度衡量模型,确定待检测存储设备的健康度,该健康度衡量模型为预先建立的模型。由于待检测存储设备的健康度的确定综合了包括总线接口、存储单元和控制单元中至少两部分的特征参数,因此通过本申请实施例可以提高存储设备的健康度的评估准确度。
可选地,存储单元的特征参数可以包括以下参数中的至少一个:
运行坏块数、出厂坏块数、RBER和UBER,等等。
可选地,控制单元的特征参数可以包括以下参数中的至少一个:
温度预警时间和、所述控制单元处理失败次数和异常状态处理次数,等等。
可选地,总线接口的特征参数可以包括以下参数中的至少一个:
数据传输错误次数和数据校验失败次数等。
图8为本申请另一实施例提供的存储设备健康度检测装置的结构示意图。参考图8,在图7所示结构的基础上,进一步地,在存储设备健康度检测装置80中,确定模块72可以包括:
第一确定子模块721,用于根据特征参数,确定待检测存储设备中对应部分的磨损指标。该磨损指标用于表征磨损程度。
第二确定子模块722,用于根据磨损指标和健康度衡量模型,确定待检测存储设备的健康度。
一些实施例中,第一确定子模块721可具体用于以下至少两项:
根据所述总线接口的特征参数,确定所述总线接口的磨损指标R1
根据所述控制单元的特征参数,确定所述控制单元的磨损指标R2
根据所述存储单元的特征参数,确定所述存储单元的磨损指标R3
其中,a1、b1和c1的值是由训练模型R=aebt+c基于总线接口的特征参数训练得到;a2、b2和c2的值是由训练模型R=aebt+c基于控制单元的特征参数训练得到,t表示时间;RBER表示原始比特错误数,Numab表示总比特读出数。
一些实施例中,第二确定子模块722可以具体用于:
根据总线接口的磨损指标、控制单元的磨损指标和存储单元的磨损指标中至少两项,以及健康度衡量模型,确定待检测存储设备的健康度。
进一步地,存储设备健康度检测装置80还可以包括:处理模块81,用于在确定模块72根据特征参数及健康度衡量模型,确定待检测存储设备的健康度之后,根据待检测存储设备的健康度,对待检测存储设备进行筛选;或者,在确定模块72根据特征参数及健康度衡量模型,确定待检测存储设备的健康度之后,根据待检测存储设备的健康度,提醒用户进行数据迁移或备份。
本实施例以上所述的存储设备健康度检测装置,可以用于执行上述各对应方法实施例中的技术方案,其实现原理和技术效果类似,其中各个模块的功能可以参考方法实施例中相应的描述,此处不再赘述。
在一些实施例中,在硬件实现上,上述的获取模块71和确定模块72,或者,获取模块71和确定模块72和处理模块81,可以以硬件形式内嵌于处理器中。
相应地,本实施例的存储设备健康度检测装置还可以包括存储器,存储器用于存储可供处理器执行的计算机程序;当处理器读取并执行计算机程序时,使得处理器执行如上任一方法实施例所述的方法。
所述计算机程序可以以软件功能单元的形式实现并能够作为独立的产品销售或使用,所述存储器可以是任意形式的计算机可读取存储介质。基于这样的理解,本申请的技术方案的全部或部分可以以软件产品的形式体现出来,包括若干指令用以使得一台计算机设备,具体可以是处理器,来执行本申请各个实施例中终端设备的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。在本申请的实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

Claims (18)

1.一种存储设备健康度检测方法,其特征在于,包括:
获取待检测存储设备的特征参数,所述待检测存储设备包括总线接口、存储单元和控制单元,所述特征参数包括所述总线接口、所述存储单元和所述控制单元中至少两部分的特征参数,所述特征参数用于表征导致对应部分失效的原因;
根据所述特征参数及健康度衡量模型,确定所述待检测存储设备的健康度,所述健康度衡量模型为根据所述特征参数预先建立的模型。
2.根据权利要求1所述的方法,其特征在于,所述存储单元的特征参数包括以下参数中的至少一个:
运行坏块数、出厂坏块数、原始比特错误率RBER和不可修复的错误比特率UBER。
3.根据权利要求1或2所述的方法,其特征在于,所述控制单元的特征参数包括以下参数中的至少一个:
温度预警时间、所述控制单元处理失败次数和异常状态处理次数。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述总线接口的特征参数包括以下参数中的至少一个:
数据传输错误次数和数据校验失败次数。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述特征参数及健康度衡量模型,确定所述待检测存储设备的健康度,包括:
根据所述特征参数,确定所述待检测存储设备中对应部分的磨损指标,所述磨损指标用于表征磨损程度;
根据所述磨损指标和所述健康度衡量模型,确定所述待检测存储设备的健康度。
6.根据权利要求5所述的方法,其特征在于,所述根据所述特征参数,确定所述待检测存储设备中对应部分的磨损指标,包括以下至少两项:
根据所述总线接口的特征参数,确定所述总线接口的磨损指标R1
根据所述控制单元的特征参数,确定所述控制单元的磨损指标R2
根据所述存储单元的特征参数,确定所述存储单元的磨损指标R3
其中,a1、b1和c1的值是由训练模型R=aebt+c基于总线接口的特征参数训练得到;a2、b2和c2的值是由训练模型R=aebt+c基于控制单元的特征参数训练得到,t表示时间;RBER表示原始比特错误数,Numab表示总比特读出数。
7.根据权利要求5或6所述的方法,其特征在于,所述根据所述磨损指标和所述健康度衡量模型,确定所述待检测存储设备的健康度,包括:
根据所述总线接口的磨损指标、所述控制单元的磨损指标和所述存储单元的磨损指标中至少两项,以及所述健康度衡量模型,确定所述待检测存储设备的健康度。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述根据所述特征参数及健康度衡量模型,确定所述待检测存储设备的健康度之后,还包括:
根据所述待检测存储设备的健康度,对所述待检测存储设备进行筛选;
或者,根据所述待检测存储设备的健康度,提醒用户进行数据迁移或备份。
9.一种存储设备健康度检测装置,其特征在于,包括:
获取模块,用于获取待检测存储设备的特征参数,所述待检测存储设备包括总线接口、存储单元和控制单元,所述特征参数包括所述总线接口、所述存储单元和所述控制单元中至少两部分的特征参数,所述特征参数用于表征导致对应部分失效的原因;
确定模块,用于根据所述特征参数及健康度衡量模型,确定所述待检测存储设备的健康度,所述健康度衡量模型为根据所述特征参数预先建立的模型。
10.根据权利要求9所述的装置,其特征在于,所述存储单元的特征参数包括以下参数中的至少一个:
运行坏块数、出厂坏块数、原始比特错误率RBER和不可修复的错误比特率UBER。
11.根据权利要求9或10所述的装置,其特征在于,所述控制单元的特征参数包括以下参数中的至少一个:
温度预警时间和、所述控制单元处理失败次数和异常状态处理次数。
12.根据权利要求9至11中任一项所述的装置,其特征在于,所述总线接口的特征参数包括以下参数中的至少一个:
数据传输错误次数和数据校验失败次数。
13.根据权利要求9至12中任一项所述的装置,其特征在于,所述确定模块包括:
第一确定子模块,用于根据所述特征参数,确定所述待检测存储设备中对应部分的磨损指标,所述磨损指标用于表征磨损程度;
第二确定子模块,用于根据所述磨损指标和所述健康度衡量模型,确定所述待检测存储设备的健康度。
14.根据权利要求13所述的装置,其特征在于,所述第一确定子模块具体用于以下至少两项:
根据所述总线接口的特征参数,确定所述总线接口的磨损指标R1
根据所述控制单元的特征参数,确定所述控制单元的磨损指标R2
根据所述存储单元的特征参数,确定所述存储单元的磨损指标R3
其中,a1、b1和c1的值是由训练模型R=aebt+c基于总线接口的特征参数训练得到;a2、b2和c2的值是由训练模型R=aebt+c基于控制单元的特征参数训练得到,t表示时间;RBER表示原始比特错误数,Numab表示总比特读出数。
15.根据权利要求13或14所述的装置,其特征在于,所述第二确定子模块具体用于:
根据所述总线接口的磨损指标、所述控制单元的磨损指标和所述存储单元的磨损指标中至少两项,以及所述健康度衡量模型,确定所述待检测存储设备的健康度。
16.根据权利要求9至15中任一项所述的装置,其特征在于,还包括:
处理模块,用于在所述确定模块根据所述特征参数及健康度衡量模型,确定所述待检测存储设备的健康度之后,根据所述待检测存储设备的健康度,对所述待检测存储设备进行筛选;或者,在所述确定模块根据所述特征参数及健康度衡量模型,确定所述待检测存储设备的健康度之后,根据所述待检测存储设备的健康度,提醒用户进行数据迁移或备份。
17.一种存储设备健康度检测装置,其特征在于,包括:
存储器和处理器;其中,所述存储器上存储有可供所述处理器执行的计算机程序;
当所述处理器读取并执行所述计算机程序时,使得所述处理器执行如权利要求1至8中任一项所述的方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包含至少一段代码,所述至少一段代码可由处理器执行,实现如权利要求1至8中任一项所述的方法。
CN201910599312.1A 2019-07-04 2019-07-04 存储设备健康度检测方法、装置及存储介质 Pending CN110471802A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910599312.1A CN110471802A (zh) 2019-07-04 2019-07-04 存储设备健康度检测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910599312.1A CN110471802A (zh) 2019-07-04 2019-07-04 存储设备健康度检测方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN110471802A true CN110471802A (zh) 2019-11-19

Family

ID=68506878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910599312.1A Pending CN110471802A (zh) 2019-07-04 2019-07-04 存储设备健康度检测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110471802A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112363880A (zh) * 2020-11-26 2021-02-12 广东小天才科技有限公司 一种监控存储介质健康状态的方法、系统和移动终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105893231A (zh) * 2016-05-06 2016-08-24 思创数码科技股份有限公司 一种基于smart的预测硬盘亚健康指标的方法及装置
CN108986869A (zh) * 2018-07-26 2018-12-11 南京群顶科技有限公司 一种使用多模型预测的磁盘故障检测方法
US20190128964A1 (en) * 2017-11-01 2019-05-02 Nvidia Corp. Method and apparatus to access high volume test data over high speed interfaces

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105893231A (zh) * 2016-05-06 2016-08-24 思创数码科技股份有限公司 一种基于smart的预测硬盘亚健康指标的方法及装置
US20190128964A1 (en) * 2017-11-01 2019-05-02 Nvidia Corp. Method and apparatus to access high volume test data over high speed interfaces
CN108986869A (zh) * 2018-07-26 2018-12-11 南京群顶科技有限公司 一种使用多模型预测的磁盘故障检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HENWEIMEI: "《https://blog.csdn.net/henweimei/article/details/54913776》", 7 February 2017 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112363880A (zh) * 2020-11-26 2021-02-12 广东小天才科技有限公司 一种监控存储介质健康状态的方法、系统和移动终端

Similar Documents

Publication Publication Date Title
US8806106B2 (en) Estimating wear of non-volatile, solid state memory
US11099743B2 (en) Determining when to replace a storage device using a machine learning module
CN102568522B (zh) 硬盘性能的测试方法和装置
JP5535481B2 (ja) 多コア・プロセッサによる信頼できるコンピューティング
CN104518924B (zh) 自动化测试及结果比对方法及系统
US8880779B2 (en) Debugging a memory subsystem
US20180081571A1 (en) System and method for predicting disk failure
JPH08241227A (ja) 記憶システムのパフォーマンス向上特定方法
CN108682442A (zh) 一种不同封装闪存芯片在线测试和分类方法及测试系统
CN105389250A (zh) 追踪软件质量的方法和系统
CN108269606B (zh) 一种用于eMMC芯片存储参数测试的方法及系统
US20130036255A1 (en) Testing memory subsystem connectivity
CN116719675B (zh) 硬盘磨损测试方法、装置及介质
US20200301800A1 (en) Holdup self-tests for power loss operations on memory systems
CN115248757A (zh) 一种硬盘健康评估方法和存储设备
CN108170366A (zh) 存储设备中的存储介质管理方法、装置和存储设备
CN113568798B (zh) 服务器故障定位方法、装置、电子设备及存储介质
CN110471802A (zh) 存储设备健康度检测方法、装置及存储介质
US10847245B2 (en) Failure indicator predictor (FIP)
CN103065687B (zh) 并行检测集成电路中ram生产缺陷的方法
CN116775436A (zh) 芯片故障预测方法、装置、计算机设备和存储介质
CN110532139A (zh) 预警方法及装置
CN105204967B (zh) 一种检测硬盘的方法及装置
CN111552582A (zh) 筛选闪存弱块的方法、装置和固态硬盘
CN106776173B (zh) 一种内存检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191119