CN114791868A - 故障类型检测方法、装置、计算机设备及可读存储介质 - Google Patents

故障类型检测方法、装置、计算机设备及可读存储介质 Download PDF

Info

Publication number
CN114791868A
CN114791868A CN202210709159.5A CN202210709159A CN114791868A CN 114791868 A CN114791868 A CN 114791868A CN 202210709159 A CN202210709159 A CN 202210709159A CN 114791868 A CN114791868 A CN 114791868A
Authority
CN
China
Prior art keywords
data
solid state
state disk
fault type
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210709159.5A
Other languages
English (en)
Other versions
CN114791868B (zh
Inventor
孙博兴
陈金凌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dera Technology Co Ltd
Original Assignee
Beijing Dera Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dera Technology Co Ltd filed Critical Beijing Dera Technology Co Ltd
Priority to CN202210709159.5A priority Critical patent/CN114791868B/zh
Publication of CN114791868A publication Critical patent/CN114791868A/zh
Application granted granted Critical
Publication of CN114791868B publication Critical patent/CN114791868B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2268Logging of test results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种故障类型检测方法、装置、计算机设备及可读存储介质,涉及SSD测试技术领域,通过对目标数据和指定数据进行一致性检测,确定固态硬盘的故障类型并返回结果,实现验证固态硬盘的意外掉电功能对数据完整性的保护能力,给出定性或定量的评估结果,提高了对数据一致性错误类型的检测覆盖能力。所述方法包括:根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据;设置固态硬盘断电,并重新为固态硬盘供电;若主机检测到固态硬盘接入,则依据预设记录格式,对固态硬盘中存储的数据进行记录,得到目标数据;将目标数据与指定数据进行比对,确定故障类型检测结果,并将故障类型检测结果发送至展示终端进行展示。

Description

故障类型检测方法、装置、计算机设备及可读存储介质
技术领域
本申请涉及SSD测试技术领域,特别是涉及一种故障类型检测方法、装置、计算机设备及可读存储介质。
背景技术
随着SSD(Solid State Drive,固态硬盘)在数据中心、高性能计算、高端存储、边缘计算等各种企业级应用场景的逐步普及,近年来企业级SSD产品的发货量逐年快速上升,而随着实际在网运行数量的逐步增加,与人员操作、机器故障、机房断电等运维活动相关的盘意外掉电几率也随之升高, 因此SSD在意外掉电时对数据完整性的保护能力是企业级用户重点关注的问题。
相关技术中,对SSD的掉电数据保护的可靠性验证,都是对于包含后备电容在内的硬件电路的掉电反应处理能力做验证。
在实现本申请的过程中,申请人发现相关技术至少存在以下问题:
在现有的技术方案中,仅仅用于评估验证在意外掉电发生时SSD对数据完整性的保护能力,在错误发生时,缺乏定位错误发生原因的测试方法,因此,亟需一种在SSD掉电后检测故障类型的方法。
发明内容
有鉴于此,本申请提供了一种故障类型检测方法、装置、计算机设备及计算机可读存储介质,主要目的在于解决目前现有的技术方案中,仅仅用于评估验证在意外掉电发生时SSD对数据完整性的保护能力,在错误发生时,缺乏定位错误发生原因的测试方法的问题。
依据本申请第一方面,提供了一种故障类型检测方法,该方法包括:
根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据;
设置所述固态硬盘断电,并重新为所述固态硬盘供电;
若主机检测到所述固态硬盘接入,则依据所述预设记录格式,对所述固态硬盘中存储的数据进行记录,得到目标数据;
将所述目标数据与所述指定数据进行比对,确定故障类型检测结果,并将所述故障类型检测结果发送至展示终端进行展示。
可选地,所述根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据之前,所述方法还包括:
将所述固态硬盘设置于主机中,对所述固态硬盘设置带有所述预设记录格式的预设工作负载,以使所述固态硬盘按照所述预设工作负载指示的写入方式写入数据,并以所述预设记录格式存储所述写入数据。
可选地,所述设置所述固态硬盘断电,并重新为所述固态硬盘供电之后,所述方法还包括:
若所述主机未检测到所述固态硬盘,则设置所述固态硬盘的故障类型为设备失效,返回用于指示设备失效的故障类型检测结果。
可选地,所述将所述目标数据与所述指定数据进行比对,确定故障类型检测结果,包括:
将所述目标数据与所述指定数据进行比对;
当所述目标数据与所述指定数据不一致时,分别提取所述目标数据对应的目标格式数据和所述指定数据对应的指定格式数据,并将所述目标格式数据和所述指定格式数据进行比对,得到所述故障类型检测结果。
可选地,所述分别提取所述目标数据对应的目标格式数据和所述指定数据对应的指定格式数据,并将所述目标格式数据和所述指定格式数据进行比对,得到所述故障类型检测结果,包括:
将所述目标数据中存储的全部数据与所述指定数据中存储的全部数据分别作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示乱序写的故障类型检测结果;
分别提取所述目标数据和所述指定数据中存储的记录校验码作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示比特损坏或删减写的故障类型检测结果;
分别提取所述目标数据和所述指定数据中存储的写入数据量作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示写飞的故障类型检测结果。
可选地,所述将所述目标数据与所述指定数据进行比对之后,所述方法还包括:
当所述比对结果指示所述目标数据与所述指定数据一致时,返回用于指示不存在故障的检测结果。
依据本申请第二方面,提供了一种故障类型检测装置,该装置包括:
第一记录模块,用于根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据;
设置模块,用于设置所述固态硬盘断电,并重新为所述固态硬盘供电;
第二记录模块,用于若主机检测到所述固态硬盘接入,则依据所述预设记录格式,对所述固态硬盘中存储的数据进行记录,得到目标数据;
比对模块,用于将所述目标数据与所述指定数据进行比对,确定故障类型检测结果,并将所述故障类型检测结果发送至展示终端进行展示。
可选地,所述装置还包括:
设置模块,用于设置模块,用于将所述固态硬盘设置于主机中,对所述固态硬盘设置带有所述预设记录格式的预设工作负载,以使所述固态硬盘按照所述预设工作负载指示的写入方式写入数据,并以所述预设记录格式存储所述写入数据。
可选地,所述装置还包括:
回传模块,用于若所述主机未检测到所述固态硬盘,则设置所述固态硬盘的故障类型为设备失效,返回用于指示设备失效的故障类型检测结果。
可选地,所述比对模块,用于将所述目标数据与所述指定数据进行比对;当所述目标数据与所述指定数据不一致时,分别提取所述目标数据对应的目标格式数据和所述指定数据对应的指定格式数据,并将所述目标格式数据和所述指定格式数据进行比对,得到所述故障类型检测结果。
可选地,所述比对模块,用于将所述目标数据中存储的全部数据与所述指定数据中存储的全部数据分别作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示乱序写的故障类型检测结果;分别提取所述目标数据和所述指定数据中存储的记录校验码作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示比特损坏或删减写的故障类型检测结果;分别提取所述目标数据和所述指定数据中存储的写入数据量作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示写飞的故障类型检测结果。
可选地,所述比对模块,还用于当所述比对结果指示所述目标数据与所述指定数据一致时,返回用于指示不存在故障的检测结果。
依据本申请第三方面,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面中任一项所述方法的步骤。
依据本申请第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一项所述的方法的步骤。
借由上述技术方案,本申请提供的一种故障类型检测方法、装置、计算机设备及可读存储介质,本申请首先根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据。随后设置固态硬盘断电,并重新为固态硬盘供电。若主机检测到固态硬盘接入,则依据预设记录格式,对固态硬盘中存储的数据进行记录,得到目标数据。接下来,将目标数据与指定数据进行比对,确定故障类型检测结果。最后,将故障类型检测结果发送至展示终端进行展示。本申请在对固态硬盘执行断电操作前,获取断电前一时刻写入的预设记录格式的指定数据,在重新供电后读取固态硬盘存储的预设记录格式的目标数据,通过对目标数据和指定数据进行一致性检测,确定固态硬盘的故障类型并返回结果,实现验证固态硬盘的意外掉电功能对数据完整性的保护能力,给出定性或定量的评估结果,提高了对数据一致性错误类型的检测覆盖能力。通过本申请提提供的方法可以在不了解固态硬盘内部设计的前提下(黑盒模型),对市场上各类固态硬盘进行数据完整性保护能力的验证,为固态硬盘开发者、使用者提供有意义的错误类型和故障模型反馈,用以改进固态硬盘设计或系统设计,规避或者降低由于意外断电导致数据丢失的风险。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1A示出了本申请实施例提供的一种故障类型检测方法流程示意图;
图1B示出了本申请实施例提供的一种故障类型检测方法流程示意图;
图2示出了本申请实施例提供的一种故障类型检测方法流程示意图;
图3示出了本申请实施例提供的一种故障类型检测装置的结构示意图;
图4示出了本申请实施例提供的一种计算机设备的装置结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
本申请实施例提供了一种故障类型检测方法,本方法可以应用于SSD故障类型检测系统,通过SSD故障类型检测系统对SSD进行掉电测试,生成故障类型检测结果,如图1A所示,该方法包括:
101、根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据。
在本申请实施例中,为了能够进行写入数据的一致性检测,确定SSD(Solid StateDrive,固态硬盘)的故障类型,本申请在预设工作负载中加入可以检查一致性检测的字段的标题作为预设记录格式。具体地,预设记录格式包含checksum(校验码)、Block Number(写入的数据量)、Timestamp(时间戳) 、Worker ID(工作线程号)、Operation Count(工作线程操作的数量)、Marker(数据表头记录)等,本申请对字段标题的数量以及内容不进行具体限定。随后,根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据。
102、设置固态硬盘断电,并重新为固态硬盘供电。
在本申请实施例中,系统通过设置固态硬盘断电,以使固态硬盘在意外断电发生时在内部存储写入数据。随后,重新为固态硬盘供电,以使固态硬盘重新接入进行数据存储。最后,由主机检测SSD,判断SSD是否能够正常工作。
103、若主机检测到固态硬盘接入,则依据预设记录格式,对固态硬盘中存储的数据进行记录,得到目标数据。
在本申请实施例中,在SSD重新上电后,若主机检测到SSD成功接入,则说明SSD并未出现设备失效的故障。进而依据预设记录格式,获取固态硬盘在意外掉电时存储的数据内容,对固态硬盘中存储的数据进行记录,得到目标数据,以便后续进行一致性检测,确定SSD故障类型。
104、将目标数据与指定数据进行比对,确定故障类型检测结果,并将故障类型检测结果发送至展示终端进行展示。
在本申请实施例中,系统将目标数据与指定数据进行比对,基于比对结果,确定SSD的故障类型检测结果,最后,将故障类型检测结果发送至展示终端进行展示。具体地,本申请设计多个需要检查的错误类型,例如,比特损坏、删减写、写飞、乱序写、设备失效等。另外,展示终端可以是电脑、手机、平板等智能设备,本申请对展示终端的型号不进行具体限定。
综上所述,如图1B所示,本申请实施例提供的方法在SSD重新上电之后,判断SSD是否被主机检测到,若SSD不能被主机检测到,则返回用于指示设备失效的故障类型检测结果。若SSD能够被主机检测到,则检测SSD数据错误类型,进而返回相应的故障类型检测结果。
本申请实施例提供的方法,首先根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据。随后设置固态硬盘断电,并重新为固态硬盘供电。若主机检测到固态硬盘接入,则依据预设记录格式,对固态硬盘中存储的数据进行记录,得到目标数据。接下来,将目标数据与指定数据进行比对,确定故障类型检测结果。最后,将故障类型检测结果发送至展示终端进行展示。本申请在对固态硬盘执行断电操作前,获取断电前一时刻写入的预设记录格式的指定数据,在重新供电后读取固态硬盘存储的预设记录格式的目标数据,通过对目标数据和指定数据进行一致性检测,确定固态硬盘的故障类型并返回结果,实现验证固态硬盘的意外掉电功能对数据完整性的保护能力,给出定性或定量的评估结果,提高了对数据一致性错误类型的检测覆盖能力。通过本申请提提供的方法可以在不了解固态硬盘内部设计的前提下(黑盒模型),对市场上各类固态硬盘进行数据完整性保护能力的验证,为固态硬盘开发者、使用者提供有意义的错误类型和故障模型反馈,用以改进固态硬盘设计或系统设计,规避或者降低由于意外断电导致数据丢失的风险。
本申请实施例提供了一种故障类型检测方法,如图2所示,该方法包括:
201、将固态硬盘设置于主机中,对固态硬盘设置带有预设记录格式的预设工作负载,以使固态硬盘按照预设工作负载指示的写入方式写入数据,并以预设记录格式存储写入数据。
在可选的实施过程中,为了探索设备的块级行为并最大限度地减少主机系统的干扰,将SSD作为裸设备,即在设备上不创建文件系统。同时,为了确保主机的每个写操作完成指令在数据刷新到SSD之前不会被返回,在实际应用过程中被测SSD设备采用同步写模式,也就是说在施加工作负载时,指定写入的每一笔数据均不经过主机的缓存,直接写入SSD。为了结合实际应用场景,本申请设计特别的工作负载,即预设工作负载,包括但不限于以下三种工作负载场景:并发运行随机写、并发运行顺序写、单线程运行顺序写,其中,并发随机写的工作负载对SSD的压力最大,能够更高效的激发错误。
进一步地,本申请将被测SSD置于主机中,通过直接将主机的电源断掉,实现对SSD断电。需要说明的是,将SSD置于主机中可以让操作系统,设备驱动程序,总线控制器或被测SSD本身都没有机会去执行相对安全的关闭操作。
另外,本申请在预设工作负载中加入能够进行一致性检测的字段的标题,也就是预设记录格式。具体地,预设记录格式包含checksum(校验码)、Block Number(写入的数据量)、Timestamp(时间戳) 、Worker ID(工作线程号)、Operation Count(工作线程操作的数量)、Marker(数据表头记录)等。具体如表1所示:
表1 预设记录格式
Checksum Block number Timestamp Worker ID Operation Count Marker
上述步骤通过软件施加工作负载,使工作负载应用到SSD上,实现尽可能多的触发SSD的内部操作,并采用预设的特殊记录格式对SSD写入数据进行记录,便于后续测试SSD意外掉电发生时基于预设记录格式中的数据判断是否存在一致性错误,进而确定错误类型,得到故障类型检测结果。
202、根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据。
在本申请实施例中,为了能够进行数据的一致性检测,本申请获取SSD意外掉电发生前写入数据的数据记录作为指定数据。具体地,按照预设记录格式对发生意外掉电前,SSD写入数据进行记录,得到指定数据。进而实现后续通过与供电后获取的目标数据进行比对,来检测SSD在意外掉电发生时能否有效保护正在存储的数据。
203、设置固态硬盘断电,并重新为固态硬盘供电。
在本申请实施例中,在对被测SSD施加预设工作负载的过程中,对SSD进行断电操作,使SSD发生意外掉电。以使固态硬盘在意外断电发生时,在内部存储写入数据,并重新为固态硬盘供电。在实际应用过程中,为了测试电源故障前已写入的记录数量对电源失效时SSD数据保护的能力,本申请覆盖多个不同时间点切断电源,来模拟意外掉电的方式及方法。
进一步地,判断主机能否检测到固态硬盘接入,若主机检测到固态硬盘接入,则说明SSD能够正常运行,此时执行下述步骤204。若主机未检测到固态硬盘,则说明SSD处于设备失效故障类型,此时执行下述步骤206。
204、若主机检测到固态硬盘接入,则依据预设记录格式,对固态硬盘中存储的数据进行记录,得到目标数据。
在本申请实施例中,为了能够进行数据的一致性检测,本申请获取SSD在意外掉电发生时实际写入数据的数据记录作为目标数据。具体地,在排除电源故障对SSD重新供电之后,若SSD能够正常运行,则依据预设记录格式,对固态硬盘中存储的数据进行记录,得到目标数据。也就是说,目标数据用于指示SSD在意外掉电发生时,按照预设记录格式,对实际写入数据的数据记录。
205、将目标数据与指定数据进行比对,基于比对结果,返回故障类型检测结果。
进一步地,系统基于目标数据与指定数据进行一致性检测。具体地,将目标数据与指定数据进行比对,当比对结果指示目标数据与指定数据一致时,说明SSD的意外掉电保护功能正常,此时返回用于指示不存在故障的检测结果。
当目标数据与指定数据不一致时,说明SSD的数据存储出现错误,此时需要判断数据存储的错误类型,进而得到故障类型检测结果。本申请设计需要检测的错误类型,包括:比特损坏Bit Corruption,例如闪存单元发生比特错误;删减写Shorten Writes,例如,写入一个8k的数据但是映射表只更新了4k;写飞Flying Writes,例如,SSD映射表中的数据损坏和数据更新丢失;乱序写De-serialization,例如,给定存储位置保存的是旧数据,新写入的数据丢失;设备失效Dead Device,例如,掉电发生后,设备自身功能故障,无法正常执行数据读写。
由于乱序写是一个更复杂的属性,工作负载的的结果是否序列化不仅取决于单个记录,还取决于它们所有操作的总顺序。一些SSD通过利用不同级别的内部并行性来提高性能。本申请考虑到有些SSD可能会无序地提交写操作,也就是说一个写操作“完成”并在早期返回给用户,可能会在稍后完成写操作后写入闪存。因此,本申请采用目标数据中存储的全部数据与指定数据中存储的全部数据来进行判断,具体包括校验码、写入的数据量、时间戳、工作线程号、工作线程操作的数量、数据表头记录。具体地,将目标数据中存储的全部数据与指定数据中存储的全部数据分别作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示乱序写的故障类型检测结果。
进一步地,分别提取目标数据和指定数据中存储的记录校验码作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示比特损坏或删减写的故障类型检测结果。分别提取目标数据和指定数据中存储的写入数据量作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示写飞的故障类型检测结果。
206、若主机未检测到固态硬盘,则设置固态硬盘的故障类型为设备失效,返回用于指示设备失效的故障类型检测结果。
207、将故障类型检测结果发送至展示终端进行展示。
在本申请实施例中,将步骤205及步骤206返回的故障类型检测结果进行分类标记,将故障类型检测结果发送至展示终端,展示给相关人员,以使相关人员确定SSD的故障类型。实现判断被测SSD在意外掉电发生时,SSD保存的数据是否正确,若不正确,判断其错误类型。
综上所述,在可选的实施过程中,系统首先对被测SSD施加工作负载,随后,对被测SSD在意外掉电前写入的数据进行记录。再使处于工作负载中的被测SSD意外断电。接下来,恢复供电使被测SSD正常工作,并判断故障类型。若SSD无法正常工作,则返回设备失效的故障类型检测结果。若SSD能够正常工作,则进行数据一致性检测,获取SSD的故障类型检测结果。最后,记录故障类型检测结果,将故障类型检测结果发送至展示终端进行展示。
本申请实施例提供的方法,首先根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据。随后设置固态硬盘断电,并重新为固态硬盘供电。若主机检测到固态硬盘接入,则依据预设记录格式,对固态硬盘中存储的数据进行记录,得到目标数据。接下来,将目标数据与指定数据进行比对,确定故障类型检测结果。最后,将故障类型检测结果发送至展示终端进行展示。本申请在对固态硬盘执行断电操作前,获取断电前一时刻写入的预设记录格式的指定数据,在重新供电后读取固态硬盘存储的预设记录格式的目标数据,通过对目标数据和指定数据进行一致性检测,确定固态硬盘的故障类型并返回结果,实现验证固态硬盘的意外掉电功能对数据完整性的保护能力,给出定性或定量的评估结果,提高了对数据一致性错误类型的检测覆盖能力。通过本申请提提供的方法可以在不了解固态硬盘内部设计的前提下(黑盒模型),对市场上各类固态硬盘进行数据完整性保护能力的验证,为固态硬盘开发者、使用者提供有意义的错误类型和故障模型反馈,用以改进固态硬盘设计或系统设计,规避或者降低由于意外断电导致数据丢失的风险。
进一步地,作为图1所述方法的具体实现,本申请实施例提供了一种故障类型检测装置,如图3所示,所述装置包括:第一记录模块301、设置模块302、第二记录模块303、比对模块304。
该第一记录模块301,用于根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据;
该设置模块302,用于设置所述固态硬盘断电,并重新为所述固态硬盘供电;
该第二记录模块303,用于若主机检测到所述固态硬盘接入,则依据所述预设记录格式,对所述固态硬盘中存储的数据进行记录,得到目标数据;
该比对模块304,用于将所述目标数据与所述指定数据进行比对,确定故障类型检测结果,并将所述故障类型检测结果发送至展示终端进行展示。
在具体的应用场景中,所述装置还包括:设置模块305。
该设置模块305,用于将所述固态硬盘设置于主机中,对所述固态硬盘设置带有所述预设记录格式的预设工作负载,以使所述固态硬盘按照所述所述预设工作负载指示的写入方式写入数据,并以所述预设记录格式存储所述写入数据。
在具体的应用场景中,所述装置还包括:回传模块306
该回传模块306,用于若所述主机未检测到所述固态硬盘,则设置所述固态硬盘的故障类型为设备失效,返回用于指示设备失效的故障类型检测结果。
在具体的应用场景中,该比对模块304,用于将所述目标数据与所述指定数据进行比对;当所述目标数据与所述指定数据不一致时,分别提取所述目标数据对应的目标格式数据和所述指定数据对应的指定格式数据,并将所述目标格式数据和所述指定格式数据进行比对,得到所述故障类型检测结果。
在具体的应用场景中,该比对模块304,用于将所述目标数据中存储的全部数据与所述指定数据中存储的全部数据分别作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示乱序写的故障类型检测结果;分别提取所述目标数据和所述指定数据中存储的记录校验码作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示比特损坏或删减写的故障类型检测结果;分别提取所述目标数据和所述指定数据中存储的写入数据量作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示写飞的故障类型检测结果。
在具体的应用场景中,该比对模块304,还用于当所述比对结果指示所述目标数据与所述指定数据一致时,返回用于指示不存在故障的检测结果。
本申请实施例提供的装置,首先根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据。随后设置固态硬盘断电,并重新为固态硬盘供电。若主机检测到固态硬盘接入,则依据预设记录格式,对固态硬盘中存储的数据进行记录,得到目标数据。接下来,将目标数据与指定数据进行比对,确定故障类型检测结果。最后,将故障类型检测结果发送至展示终端进行展示。本申请在对固态硬盘执行断电操作前,获取断电前一时刻写入的预设记录格式的指定数据,在重新供电后读取固态硬盘存储的预设记录格式的目标数据,通过对目标数据和指定数据进行一致性检测,确定固态硬盘的故障类型并返回结果,实现验证固态硬盘的意外掉电功能对数据完整性的保护能力,给出定性或定量的评估结果,提高了对数据一致性错误类型的检测覆盖能力。通过本申请提提供的方法可以在不了解固态硬盘内部设计的前提下(黑盒模型),对市场上各类固态硬盘进行数据完整性保护能力的验证,为固态硬盘开发者、使用者提供有意义的错误类型和故障模型反馈,用以改进固态硬盘设计或系统设计,规避或者降低由于意外断电导致数据丢失的风险。
需要说明的是,本申请实施例提供的一种故障类型检测装置所涉及各功能单元的其他相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
在示例性实施例中,参见图4,还提供了一种计算机设备,该设备包括通信总线、处理器、存储器和通信接口,还可以包括输入输出接口和显示设备,其中,各个功能单元之间可以通过总线完成相互间的通信。该存储器存储有计算机程序,处理器,用于执行存储器上所存放的程序,执行上述实施例中的故障类型检测方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的故障类型检测方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。
本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。
以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种故障类型检测方法,其特征在于,包括:
根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据;
设置所述固态硬盘断电,并重新为所述固态硬盘供电;
若主机检测到所述固态硬盘接入,则依据所述预设记录格式,对所述固态硬盘中存储的数据进行记录,得到目标数据;
将所述目标数据与所述指定数据进行比对,确定故障类型检测结果,并将所述故障类型检测结果发送至展示终端进行展示。
2.根据权利要求1所述的方法,其特征在于,所述根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据之前,所述方法还包括:
将所述固态硬盘设置于主机中,对所述固态硬盘设置带有所述预设记录格式的预设工作负载,以使所述固态硬盘按照所述预设工作负载指示的写入方式写入数据,并以所述预设记录格式存储所述写入数据。
3.根据权利要求1所述的方法,其特征在于,所述设置所述固态硬盘断电,并重新为所述固态硬盘供电之后,所述方法还包括:
若所述主机未检测到所述固态硬盘,则设置所述固态硬盘的故障类型为设备失效,返回用于指示设备失效的故障类型检测结果。
4.根据权利要求1所述的方法,其特征在于,所述将所述目标数据与所述指定数据进行比对,确定故障类型检测结果,包括:
将所述目标数据与所述指定数据进行比对;
当所述目标数据与所述指定数据不一致时,分别提取所述目标数据对应的目标格式数据和所述指定数据对应的指定格式数据,并将所述目标格式数据和所述指定格式数据进行比对,得到所述故障类型检测结果。
5.根据权利要求4所述的方法,其特征在于,所述分别提取所述目标数据对应的目标格式数据和所述指定数据对应的指定格式数据,并将所述目标格式数据和所述指定格式数据进行比对,得到所述故障类型检测结果,包括:
将所述目标数据中存储的全部数据与所述指定数据中存储的全部数据分别作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示乱序写的故障类型检测结果;
分别提取所述目标数据和所述指定数据中存储的记录校验码作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示比特损坏或删减写的故障类型检测结果;
分别提取所述目标数据和所述指定数据中存储的写入数据量作为目标格式数据和指定格式数据进行比对,根据比对结果返回用于指示写飞的故障类型检测结果。
6.根据权利要求4所述的方法,其特征在于,所述将所述目标数据与所述指定数据进行比对之后,所述方法还包括:
当所述比对结果指示所述目标数据与所述指定数据一致时,返回用于指示不存在故障的检测结果。
7.一种故障类型检测装置,其特征在于,包括:
第一记录模块,用于根据预设记录格式,对固态硬盘写入数据进行记录,得到指定数据;
设置模块,用于设置所述固态硬盘断电,并重新为所述固态硬盘供电;
第二记录模块,用于若主机检测到所述固态硬盘接入,则依据所述预设记录格式,对所述固态硬盘中存储的数据进行记录,得到目标数据;
比对模块,用于将所述目标数据与所述指定数据进行比对,确定故障类型检测结果,并将所述故障类型检测结果发送至展示终端进行展示。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
设置模块,用于将所述固态硬盘设置于主机中,对所述固态硬盘设置带有所述预设记录格式的预设工作负载,以使所述固态硬盘按照所述预设工作负载指示的写入方式写入数据,并以所述预设记录格式存储所述写入数据。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202210709159.5A 2022-06-22 2022-06-22 故障类型检测方法、装置、计算机设备及可读存储介质 Active CN114791868B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210709159.5A CN114791868B (zh) 2022-06-22 2022-06-22 故障类型检测方法、装置、计算机设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210709159.5A CN114791868B (zh) 2022-06-22 2022-06-22 故障类型检测方法、装置、计算机设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN114791868A true CN114791868A (zh) 2022-07-26
CN114791868B CN114791868B (zh) 2022-09-23

Family

ID=82462951

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210709159.5A Active CN114791868B (zh) 2022-06-22 2022-06-22 故障类型检测方法、装置、计算机设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN114791868B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102591748A (zh) * 2011-12-29 2012-07-18 记忆科技(深圳)有限公司 固态硬盘及其掉电保护方法、系统
CN109086222A (zh) * 2018-07-24 2018-12-25 浪潮电子信息产业股份有限公司 固态硬盘的数据恢复方法以及固态硬盘
US10223224B1 (en) * 2016-06-27 2019-03-05 EMC IP Holding Company LLC Method and system for automatic disk failure isolation, diagnosis, and remediation
CN111653307A (zh) * 2020-05-22 2020-09-11 深圳佰维存储科技股份有限公司 固态硬盘的数据完整性检测方法、系统、设备及存储介质
CN113901530A (zh) * 2021-09-10 2022-01-07 苏州浪潮智能科技有限公司 一种硬盘防御性预警保护的方法、装置、设备及可读介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102591748A (zh) * 2011-12-29 2012-07-18 记忆科技(深圳)有限公司 固态硬盘及其掉电保护方法、系统
US10223224B1 (en) * 2016-06-27 2019-03-05 EMC IP Holding Company LLC Method and system for automatic disk failure isolation, diagnosis, and remediation
CN109086222A (zh) * 2018-07-24 2018-12-25 浪潮电子信息产业股份有限公司 固态硬盘的数据恢复方法以及固态硬盘
CN111653307A (zh) * 2020-05-22 2020-09-11 深圳佰维存储科技股份有限公司 固态硬盘的数据完整性检测方法、系统、设备及存储介质
CN113901530A (zh) * 2021-09-10 2022-01-07 苏州浪潮智能科技有限公司 一种硬盘防御性预警保护的方法、装置、设备及可读介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DONGWOOK KIM, ETC.: "Exploiting Compression-Induced Internal Fragmentation for Power-Off Recovery in SSD", 《IEEE TRANSACTIONS ON COMPUTERS》 *
李鹏等: "工况和电压对商用固态硬盘性能特性影响研究", 《环境技术》 *

Also Published As

Publication number Publication date
CN114791868B (zh) 2022-09-23

Similar Documents

Publication Publication Date Title
CN112017723B (zh) 存储器的掉电测试方法、装置、可读存储介质及电子设备
US8904244B2 (en) Heuristic approach for faster consistency check in a redundant storage system
US7356744B2 (en) Method and system for optimizing testing of memory stores
CN110008129B (zh) 一种存储定时快照的可靠性测试方法、装置及设备
CN102968353B (zh) 一种失效地址处理方法及装置
CN110399247A (zh) 一种数据恢复方法、装置、设备及计算机可读存储介质
CN114446381B (zh) eMMC故障分析方法、装置、可读存储介质及电子设备
CN114791868B (zh) 故障类型检测方法、装置、计算机设备及可读存储介质
CN117827554A (zh) 测试方法、装置、计算机设备和存储介质
CN116166485B (zh) 服务器测试方法、装置、设备、存储介质和程序产品
CN111522679A (zh) 基于主机内存的ssd日志记录方法、系统和计算机设备
US10922023B2 (en) Method for accessing code SRAM and electronic device
CN114764596A (zh) 延长硬盘寿命方法、装置、计算机设备和存储介质
US6229743B1 (en) Method of a reassign block processing time determination test for storage device
CN111209146B (zh) 一种raid卡老化测试方法及系统
CN112346919A (zh) 一种ssd测试方法、系统及存储介质
CN112486717A (zh) 一种磁盘数据一致性校验方法、系统、终端及存储介质
CN102541668A (zh) 闪存文件系统可靠性分析方法
CN116665758B (zh) 硬盘数据测试方法、装置、系统及介质
US20080209259A1 (en) Method and system for testing reliability of data stored in raid
CN115934395A (zh) 固态硬盘的故障注入方法、装置、计算机设备及存储介质
CN118035102A (zh) 加速ssd测试的方法、装置、设备及介质
CN109584943A (zh) 一种评估存储介质的方法及装置
CN117539697A (zh) 存储控制器测试方法、装置、计算机设备和存储介质
CN117992294A (zh) 基于Emulator仿真平台的固态硬盘预埋测试方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant