CN117457059A - 一种ssd的故障检测方法、装置及电子设备 - Google Patents
一种ssd的故障检测方法、装置及电子设备 Download PDFInfo
- Publication number
- CN117457059A CN117457059A CN202311497022.9A CN202311497022A CN117457059A CN 117457059 A CN117457059 A CN 117457059A CN 202311497022 A CN202311497022 A CN 202311497022A CN 117457059 A CN117457059 A CN 117457059A
- Authority
- CN
- China
- Prior art keywords
- preset
- ssd
- output result
- fault
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 217
- 238000000034 method Methods 0.000 claims abstract description 37
- 230000002159 abnormal effect Effects 0.000 claims abstract description 35
- 238000012549 training Methods 0.000 claims description 90
- 238000012545 processing Methods 0.000 claims description 59
- 230000004927 fusion Effects 0.000 claims description 15
- 238000007781 pre-processing Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 7
- 238000007477 logistic regression Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 8
- 230000005856 abnormality Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000013403 standard screening design Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/56—External testing equipment for static stores, e.g. automatic test equipment [ATE]; Interfaces therefor
- G11C29/56008—Error analysis, representation of errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/56—External testing equipment for static stores, e.g. automatic test equipment [ATE]; Interfaces therefor
- G11C29/56004—Pattern generation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请提供一种SSD的故障检测方法、装置及电子设备,涉及检测技术的技术领域。在该方法中,应用于服务器,方法包括:获取SSD的检测数据包;将检测数据包输入至预设故障检测模型中,得到输出结果;对输出结果进行分析,若输出结果指示检测数据包异常,则生成报警信息,报警信息用于表示SSD存在潜在故障。实施本申请提供的技术方案,便于提高对SSD的故障检测准确性。
Description
技术领域
本申请涉及检测技术的技术领域,具体涉及一种SSD的故障检测方法、装置及电子设备。
背景技术
SSD(Solid State Drive,固态硬盘)是一种以半导体闪存为介质的存储设备。它主要由控制器和存储芯片组成,没有机械部件。
目前,SSD的使用寿命在不断增加,但在SSD长时间使用后,对SSD进行故障检测是十分重要的。相关技术中,通常仅凭借人工经验对SSD的故障情况进行检测,由于人工判断本身存在不可控的检测风险,使得检测结果容易发生偏差,从而导致对SSD的故障检测准确性较低。
因此,急需一种SSD的故障检测方法、装置及电子设备。
发明内容
本申请提供了一种SSD的故障检测方法、装置及电子设备,便于提高对SSD的故障检测准确性。
在本申请的第一方面提供了一种SSD的故障检测方法,应用于服务器,所述方法包括:获取SSD的检测数据包;将所述检测数据包输入至预设故障检测模型中,得到输出结果;对所述输出结果进行分析,若所述输出结果指示所述检测数据包异常,则生成报警信息,所述报警信息用于表示所述SSD存在潜在故障。
通过采用上述技术方案,服务器首先将获取SSD的检测数据包,再将检测数据包输入至预设故障检测模型中,从而得到输出结果。最后,服务器对输出结果进行分析,当服务器确认检测数据包异常,则生成报警信息。由此,服务器能够根据预设故障检测模型的输出结果,自动完成对SSD的故障检测,并生成报警信息。相比于相关技术,不再需要人工进行检测,从而提高了对SSD的故障检测准确性。
可选地,所述获取SSD的检测数据包,具体包括:接收检测设备发送的多种检测数据,所述检测设备用于对所述SSD进行检测;对多种所述检测数据进行预处理,生成所述检测数据包,所述预处理包括数据清洗、数据分类以及归一化处理。
通过采用上述技术方案,服务器通过接收多种检测数据,可以获取SSD的更全面的信息,从而更准确地评估SSD的状态。服务器对检测数据进行预处理,例如数据清洗、数据分类和归一化处理,可以去除噪声和异常值,提高数据的可靠性和准确性。经过预处理生成检测数据包,可以为后续的故障检测模型提供标准化的输入数据,从而避免因数据格式不一致或数据质量差而导致模型预测不准的问题。该过程可以实现数据的质量控制和规范化处理,从而提高故障检测的准确性和稳定性,有助于及时发现SSD的潜在故障并采取相应的措施。
可选地,所述检测数据包包括读写速度,所述将所述检测数据包输入至预设故障检测模型中,得到输出结果,具体包括:判断所述读写速度是否超出预设读写速度范围内,所述预设读写速度范围预先存储于所述预设故障检测模型中;若所述读写速度超出所述预设读写速度范围,则生成第一输出结果,所述第一输出结果用于表示所述SSD的读写速度异常。
通过采用上述技术方案,服务器通过判断读写速度是否超出预设读写速度范围,可以快速准确地检测SSD的读写速度是否异常,可以为检测模型提供参考标准,从而提高检测的准确性和稳定性。若读写速度超出预设读写速度范围,生成第一输出结果,可以及时发现SSD的读写速度异常,并生成相应的输出结果,从而采取相应的措施,避免故障的发生。该过程可以实现快速准确的故障检测,保护了数据的安全性,提高了检测准确性和检测效率。
可选地,所述检测数据包还包括温度数据,所述将所述检测数据包输入至预设故障检测模型中,得到输出结果,具体还包括:根据温度数据,确定第一温度值;将所述第一温度值与预设温度阈值进行比较;若所述第一温度值大于或等于所述预设温度阈值,则生成第三输出结果,所述第三输出结果用于表示所述SSD的温度数据异常。
通过采用上述技术方案,服务器通过根据温度数据确定第一温度值,可以获取SSD的实时温度信息,从而更全面地评估SSD的状态。服务器将第一温度值与预设温度阈值进行比较,可以快速准确地检测SSD的温度是否异常。若第一温度值大于或等于预设温度阈值,生成第三输出结果,可以及时发现SSD的温度数据异常,并生成相应的输出结果,从而采取相应的措施,避免故障的发生。该过程可以实现全面准确的故障检测,提高了故障检测的准确性和效率。
可选地,所述检测数据包还包括噪声数据,所述将所述检测数据包输入至预设故障检测模型中,得到输出结果,具体还包括:根据所述噪声数据,得到噪声值,所述噪声值包括电流噪声值和机械噪声值;将所述电流噪声值和机械噪声值与各自对应的预设噪声阈值进行比较,所述电流噪声值对应一个预设噪声阈值,所述机械噪声值对应一个预设噪声阈值;若所述电流噪声值和机械噪声值中的任意一种噪声值大于或等于对应的预设噪声阈值,则生成第三输出结果,所述第三输出结果用于表示所述噪声数据异常。
通过采用上述技术方案,服务器通过根据噪声数据得到噪声值,可以获取SSD的电流噪声值和机械噪声值,从而更全面地评估SSD的性能和状态。服务器将电流噪声值和机械噪声值与各自对应的预设噪声阈值进行比较,可以快速准确地检测SSD的噪声是否异常。若电流噪声值和机械噪声值中的任意一种噪声值大于或等于对应的预设噪声阈值,生成第三输出结果,可以及时发现SSD的噪声数据异常,并生成相应的输出结果,从而采取相应的措施,避免故障的发生。
可选地,在所述将所述检测数据包输入至预设故障检测模型中,得到输出结果之前,训练所述预设故障检测模型;所述训练所述预设故障检测模型,具体包括:获取训练信息,所述训练信息包括检测数据包和所述输出结果;将所述训练信息输入至自适应特征融合网络中进行训练,得到第一训练结果;将所述第一训练结果与所述训练信息进行叠加与标准化处理后,得到第二训练结果;将所述第二训练结果输入至所述自适应特征融合网络中进行处理,得到第三训练结果;将所述第三训练结果与所述第二训练结果进行叠加与标准化处理,直至输出所述训练信息相似度矩阵,所述训练信息相似度矩阵满足预设逻辑回归条件。
通过采用上述技术方案,服务器通过获取训练信息,包括检测数据包和输出结果,可以获取更全面的训练数据,从而更好地训练故障检测模型。将训练信息输入至自适应特征融合网络中进行训练,可以得到更准确的第一训练结果。将第一训练结果与训练信息进行叠加与标准化处理后,可以得到更可靠的第二训练结果。将第二训练结果输入至自适应特征融合网络中进行处理,可以得到更精确的第三训练结果。将第三训练结果与第二训练结果进行叠加与标准化处理,直至输出训练信息相似度矩阵,可以获得更符合预设逻辑回归条件的训练模型,从而提高故障检测的准确性和稳定性。该过程可以通过多次训练和调整,得到更优秀的故障检测模型,从而提高故障检测的可靠性和效率。
可选地,在所述生成报警信息之后,所述方法还包括:根据所述报警信息,确定故障类型,所述故障类型包括读写故障、温度故障以及噪声故障中的一种或多种;在预设数据库中查找所述故障类型,若所述预设数据库中存在所述故障类型,则获取所述故障类型对应的解决方案,所述预设数据库中预先存储有所述故障类型与所述解决方案之间的对应关系;将所述报警信息与所述解决方案均发送至用户设备,以供所述用户设备对应的用户参考。
通过采用上述技术方案,服务器根据报警信息确定故障类型,可以快速准确地识别故障的类型,为后续的解决方案提供准确的信息。在预设数据库中查找故障类型,可以获取预设的对应关系,从而获取相应的解决方案,提高了故障处理的效率。将报警信息与解决方案均发送至用户设备,可以及时通知用户设备对应的用户,并提供相应的解决方案,从而帮助用户快速处理故障,提高了检测友好性和用户满意度。该过程可以实现快速准确的故障识别和处理,提高了故障检测的可靠性和效率,为用户提供了更好的服务体验。
在本申请的第二方面提供了一种SSD的故障检测装置,所述故障检测装置为服务器,所述服务器包括获取模块和处理模块,其中,所述获取模块,用于获取SSD的检测数据包;所述处理模块,用于将所述检测数据包输入至预设故障检测模型中,得到输出结果;所述处理模块,还用于对所述输出结果进行分析,若所述输出结果指示所述检测数据包异常,则生成报警信息,所述报警信息用于表示所述SSD存在潜在故障。
在本申请的第三方面提供了一种电子设备,所述电子设备包括处理器、存储器、用户接口以及网络接口,所述存储器用于存储指令,所述用户接口和所述网络接口均用于给其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如上所述的方法。
在本申请的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有指令,当所述指令被执行时,执行如上所述的方法。
综上所述,本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
1.服务器首先将获取SSD的检测数据包,再将检测数据包输入至预设故障检测模型中,从而得到输出结果。最后,服务器对输出结果进行分析,当服务器确认检测数据包异常,则生成报警信息。由此,服务器能够根据预设故障检测模型的输出结果,自动完成对SSD的故障检测,并生成报警信息。相比于相关技术,不再需要人工进行检测,从而提高了对SSD的故障检测准确性;
2.服务器通过对读写速度、温度数据以及噪声数据进行检测,能够全面地考量SSD的故障情况,实现全面准确的故障检测,提高了故障检测的准确性和效率;
3.服务器通过自适应特征融合网络对预设故障检测模型进行训练,该过程包含多次训练和调整,能够得到更优秀的故障检测模型,从而提高故障检测的可靠性和效率。
附图说明
图1为本申请实施例提供的一种SSD的故障检测方法的流程示意图。
图2为本申请实施例提供的一种SSD的故障检测装置的模块示意图。
图3为本申请实施例提供的一种电子设备的结构示意图。
附图标记说明:21、获取模块;22、处理模块;31、处理器;32、通信总线;33、用户接口;34、网络接口;35、存储器。
具体实施方式
为了使本领域的技术人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。
在本申请实施例的描述中,“例如”或者“举例来说”等词用于表示作例子、例证或说明。本申请实施例中被描述为“例如”或者“举例来说”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“例如”或者“举例来说”等词旨在以具体方式呈现相关概念。
在本申请实施例的描述中,术语“多个”的含义是指两个或两个以上。例如,多个系统是指两个或两个以上的系统,多个屏幕终端是指两个或两个以上的屏幕终端。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
SSD,又称固态硬盘,是一种以半导体闪存为存储介质的设备。它主要由控制器和存储芯片组成,不同于传统的机械硬盘,SSD没有可移动的机械部件。尽管SSD的使用寿命正在不断提高,但在长时间使用后,对SSD进行故障检测仍然至关重要。
然而,当前的相关技术主要依赖人工经验进行SSD的故障检测。这种方法存在一定的局限性,因为人工判断具有不可控的风险,容易导致检测结果出现偏差。这使得SSD的故障检测准确性较低,难以满足日益增长的数据存储需求。
为了解决上述技术问题,本申请提供了一种SSD的故障检测方法,参照图1,图1为本申请实施例提供的一种SSD的故障检测方法的流程示意图。该故障检测方法应用于服务器,包括步骤S110至步骤S130,上述步骤如下:
S110、获取SSD的检测数据包。
具体地,当需要对SSD进行故障检测时,服务器将会获取SSD的检测数据包。其中,服务器SSD的故障检测可以实时进行,检测数据包中包括多种检测数据,举例来说,SSD内部有一组与健康状态相关的指标,服务器通过接收自监测分析与报告技术数据,可以获取关于SSD的各种信息,例如温度、读写错误率以及剩余寿命等。根据这些指标的数值和变化趋势,可以初步判断SSD是否存在故障迹象。
其次,服务器还可以使用专门的工具或软件扫描SSD,查找并标记出坏块。坏块是指由于硬件故障或其他原因导致无法正常读取或写入数据的存储块,坏块数量的增加可能意味着SSD存在问题。另外,服务器还可以使用校验工具对SSD上存储的数据进行完整性校验,确保数据没有损坏或丢失。若校验结果显示数据损坏,可能意味着存在故障。除此之外,服务器还可以实时检测SSD的温度、噪声以及读写速度等。其中,服务器获取检测数据包的方式不作限定,这里不再赘述。
在本申请实施例中,服务器为管理SSD和检测数据包的服务器,用于提供后台服务,服务器可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。
在一种可能的实施方式中,获取SSD的检测数据包,具体包括:接收检测设备发送的多种检测数据,检测设备用于对SSD进行检测;对多种检测数据进行预处理,生成检测数据包,预处理包括数据清洗、数据分类以及归一化处理。
具体地,上述过程为本申请实施例提供的一种服务器获取SSD的检测数据包的具体过程。服务首先将接收检测设备发送的多种检测数据,通过对多种检测数据进行预处理,能够得到标准的检测数据包。其中,检测设备指的是用于对SSD进行故障检测的设备,检测设备可以为各种传感器,例如温度传感器和噪声传感器,还可以为第三方检测工具,例如Windows操作系统中的Performance Monitor工具,以及Linux系统中的iostat和sar工具等。
其中,预处理包括数据清洗、数据分类以及归一化处理。数据清洗主要是去除噪声和异常值,例如,去除由于干扰或设备故障导致的不合理的检测数据。比如使用统计方法或根据经验设置阈值来识别和去除异常值。数据分类是将检测数据按照不同的类别进行划分,例如,将检测数据分为读写速度、温度、噪声等不同的类别。这有助于后续的故障检测和分析,因为不同类型的故障对应着不同的数据类别。归一化处理是将检测数据转换到一个标准化的范围,例如将数据缩放到0到1之间或将其转换为百分比。归一化可以消除不同数据之间的量纲对分析的影响,使得不同类型的数据之间可以进行比较和分析。由此,通过去除噪声和异常值,以及将不同类型的数据进行分类和归一化处理,可以提高数据的准确性和可靠性,从而更好地反映SSD的真实状态,便于提高后续预设故障检测模型的处理效率。
S120、将检测数据包输入至预设故障检测模型中,得到输出结果。
具体地,服务器在获取到检测数据包之后,将把检测数据包输入至预设故障检测模型中,从而得到输出结果。其中,预设故障检测模型为预先构建和训练的,通过存储检测数据包与输出结果之间的对应关系,来对SSD的潜在异常和故障进行检测和分析。输出结果可以反映检测数据包中的任意一项检测数据正常或者异常,从而便于分析异常检测数据对SSD的影响,从而有利于预设故障检测模型对SSD进行实时故障检测。
在一种可能的实施方式中,检测数据包包括读写速度,将检测数据包输入至预设故障检测模型中,得到输出结果,具体包括:判断读写速度是否超出预设读写速度范围内,预设读写速度范围预先存储于预设故障检测模型中;若读写速度超出预设读写速度范围,则生成第一输出结果,第一输出结果用于表示SSD的读写速度异常。
具体地,SSD的读写速度对于所在电子系统的整体性能有很大的影响。如果读写速度太低,可能会导致系统的响应时间变长,影响用户体验。另外,如果SSD的读写速度异常,可能是出现故障的迹象。服务器通过比较读写速度与预设读写速度范围之间的关系,当读写速度未在预设读写速度范围内时,服务器将生成用于表示读写速度异常的第一输出结果。由此,可以及时发现这种异常,并进行相应的处理或维修,避免因故障导的数据损失或系统崩溃。当读写速度在预设读写速度范围内时,服务器将生成用于表示读写速度正常的输出结果,并对读写速度进行定时或者持续检测。
举例来说,服务器检测的某个SSD读写速度数据,比如500MB/s输入到预设故障检测模型中,该读写速度超出了预设故障检测模型中预设的读写速度范围,比如300-400MB/s,那么模型就会生成一个输出结果,这个结果可能会以文本、图表或某种报警形式呈现,用于提醒用户该SSD的读写速度异常。
在一种可能的实施方式中,检测数据包还包括温度数据,将检测数据包输入至预设故障检测模型中,得到输出结果,具体还包括:根据温度数据,确定第一温度值;将第一温度值与预设温度阈值进行比较;若第一温度值大于或等于预设温度阈值,则生成第三输出结果,第三输出结果用于表示SSD的温度数据异常。
具体地,SSD属于精密器件,SSD的温度过高可能会导致硬件故障或缩短寿命。服务器通过检测温度数据,可以预防潜在的故障,并提前采取措施,避免系统崩溃或数据损失。服务器通过比较第一温度值和预设温度阈值之间的大小关系,当第一温度值大于或等于预设温度阈值时,表明SSD温度过高,服务器将生成第二输出结果,以此来表示SSD的温度异常。当第一温度值小于预设温度阈值时,服务器将生成用于表示温度正常的输出结果,并持续对温度数据进行检测,进一步保障了SSD的正常使用。进一步地,服务器检测的温度数据包括内部温度和外部温度,内部温度为SSD的内部温度,外部温度为SSD所在工作环境的温度,具体检测情况根据实际确定,这里不再赘述。
举例来说,服务器检测的某个SSD温度数据,比如50摄氏度输入到预设的故障检测模型中。该温度超过了预设故障检测模型中预设温度阈值,比如45摄氏度,那么模型就会生成一个输出结果,这个结果同样可能会以文本、图表或某种报警形式呈现,用于提醒用户这个SSD的温度异常。
在一种可能的实施方式中,检测数据包还包括噪声数据,将检测数据包输入至预设故障检测模型中,得到输出结果,具体还包括:根据噪声数据,得到噪声值,噪声值包括电流噪声值和机械噪声值;将电流噪声值和机械噪声值与各自对应的预设噪声阈值进行比较,电流噪声值对应一个预设噪声阈值,机械噪声值对应一个预设噪声阈值;若电流噪声值和机械噪声值中的任意一种噪声值大于或等于对应的预设噪声阈值,则生成第三输出结果,第三输出结果用于表示噪声数据异常。
具体地,SSD的噪声过高可能会导致信号干扰和数据错误,通过检测噪声数据,可以及时发现潜在的故障,并提前采取措施,避免系统崩溃或数据损失。服务器通过比较电流噪声值和对应的预设电流噪声阈值之间的大小关系,同时比较机械噪声值和对应的预设机械噪声阈值之间的大小关系,当任意一个噪声值大于或等于预设噪声阈值,则服务器生成第三输出结果,用于表明对应的电流噪声值和/或机械噪声值异常。当电流噪声值和机械噪声值均小于对应的预设噪声阈值时,服务器将生成用于表示噪声数据正常的输出结果,并对噪声数据继续检测。
S130、对输出结果进行分析,若输出结果指示检测数据包异常,则生成报警信息,报警信息用于表示SSD存在潜在故障。
具体地,服务器在生成输出结果之后,将会对输出结果进行分析,当输出结果指示检测数据包中的任意一种检测数据异常时,将会触发服务器的报警机制,此时,服务器将会生成报警信息。其中,对输出结果进行再次分析能够校验数据的准确性,进一步提高故障检测的准确性。举例来说,当温度数据发生异常时,服务器生成的报警信息可以为“请注意,SSD温度数据异常”。由此,服务器能够根据预设故障检测模型的输出结果,自动完成对SSD的故障检测,并生成报警信息。相比于相关技术,不再需要人工进行检测,从而提高了对SSD的故障检测准确性。
在一种可能的实施方式中,在将检测数据包输入至预设故障检测模型中,得到输出结果之前,训练预设故障检测模型;训练预设故障检测模型,具体包括:获取训练信息,训练信息包括检测数据包和输出结果;将训练信息输入至自适应特征融合网络中进行训练,得到第一训练结果;将第一训练结果与训练信息进行叠加与标准化处理后,得到第二训练结果;将第二训练结果输入至自适应特征融合网络中进行处理,得到第三训练结果;将第三训练结果与第二训练结果进行叠加与标准化处理,直至输出训练信息相似度矩阵,训练信息相似度矩阵满足预设逻辑回归条件。
具体地,服务器将会获取训练信息,再将训练信息输入至自适应特征融合网络中进行训练,从而得到第一训练结果。接下来,服务器将第一训练结果与训练信息进行叠加与标准化处理后,得到第二训练结果。其次,服务器再将第二训练结果输入至自适应特征融合网络中进行处理,从而得到第三训练结果。最后,服务器将第三训练结果和第二训练结果进行叠加与标准化处理,直至输出训练信息相似度矩阵。
其中,预设逻辑回归条件由服务器的管理人员预先设置。传统的各层特征级联或特征融合方法,通常基于服务器管理人员经验或手工设计的权重和规则进行特征加权、选择和融合。在本申请实施例中,训练信息包括检测数据包和输出结果,采用自适应特征融合网络则可通过数据自适应学习和优化模型架构及参数,进而提高模型对于复杂、变异场景的适应能力。由此,通过不断地训练和处理的过程,可以提高模型的准确性和稳定性,使其能够更好地适应不同的数据情况并进行有效的检测和分析,进一步提高了故障检测的准确性。
在一种可能的实施方式中,在生成报警信息之后,还包括:根据报警信息,确定故障类型,故障类型包括读写故障、温度故障以及噪声故障中的一种或多种;在预设数据库中查找故障类型,若预设数据库中存在故障类型,则获取故障类型对应的解决方案,预设数据库中预先存储有故障类型与解决方案之间的对应关系;将报警信息与解决方案均发送至用户设备,以供用户设备对应的用户参考。
具体地,在服务器生成报警信息之后,还将确定报警信息中的故障类型,比如读写故障、温度故障以及噪声故障,甚至为其它未知故障。未知故障在本申请实施例中可以理解为在过往历史检测记录中SSD没有出现过的故障类型。服务器通过在预设数据库中查找该故障类型,当存在该故障类型,表明该故障类型为历史检测过程中出现过的,则直接获取过往记录中的解决方案。并同时将报警信息、故障类型和解决方案发送至用户设备,从而用户可以根据解决方案采取适当的措施,比如解决方案为重新安装驱动程序,或者更换损坏的SSD等。预设数据库可以理解为存储过往历史检测故障记录的数据库,该数据库中存储有历史故障类型与历史解决方案的对应关系,并不断更新该对应关系。当预设数据库中不存在该故障类型时,服务器将设置该故障类型为未知故障类型,从而提高用户的警惕性,以使用户设备对应的用户妥善处理故障。
其中,用户设备可以与服务器通过有线或无线方式进行通讯,用户设备的类型包括但不限于:安卓(Android)系统设备、苹果公司开发的移动操作系统(iOS)设备、个人计算机(PC)、全球局域网(World Wide Web,web)设备、虚拟现实(Virtual Reality,VR)设备、增强现实(Augmented Reality,AR)设备等设备。
本申请还提供了一种SSD的故障检测装置,参照图2,图2为本申请实施例提供的一种SSD的故障检测装置的模块示意图。该故障检测装置为服务器,服务器包括获取模块21和处理模块22,其中,获取模块21,用于获取SSD的检测数据包;处理模块22,用于将检测数据包输入至预设故障检测模型中,得到输出结果;处理模块22,还用于对输出结果进行分析,若输出结果指示检测数据包异常,则生成报警信息,报警信息用于表示SSD存在潜在故障。
在一种可能的实施方式中,获取模块21获取SSD的检测数据包,具体包括:获取模块21接收检测设备发送的多种检测数据,检测设备用于对SSD进行检测;处理模块22对多种检测数据进行预处理,生成检测数据包,预处理包括数据清洗、数据分类以及归一化处理。
在一种可能的实施方式中,检测数据包包括读写速度,处理模块22将检测数据包输入至预设故障检测模型中,得到输出结果,具体包括:处理模块22判断读写速度是否超出预设读写速度范围内,预设读写速度范围预先存储于预设故障检测模型中;若读写速度超出预设读写速度范围,则处理模块22生成第一输出结果,第一输出结果用于表示SSD的读写速度异常。
在一种可能的实施方式中,检测数据包还包括温度数据,处理模块22将检测数据包输入至预设故障检测模型中,得到输出结果,具体还包括:处理模块22根据温度数据,确定第一温度值;处理模块22将第一温度值与预设温度阈值进行比较;若第一温度值大于或等于预设温度阈值,则处理模块22生成第三输出结果,第三输出结果用于表示SSD的温度数据异常。
在一种可能的实施方式中,检测数据包还包括噪声数据,处理模块22将检测数据包输入至预设故障检测模型中,得到输出结果,具体还包括:处理模块22根据噪声数据,得到噪声值,噪声值包括电流噪声值和机械噪声值;处理模块22将电流噪声值和机械噪声值与各自对应的预设噪声阈值进行比较,电流噪声值对应一个预设噪声阈值,机械噪声值对应一个预设噪声阈值;若电流噪声值和机械噪声值中的任意一种噪声值大于或等于对应的预设噪声阈值,则处理模块22生成第三输出结果,第三输出结果用于表示噪声数据异常。
在一种可能的实施方式中,在处理模块22将检测数据包输入至预设故障检测模型中,得到输出结果之前,训练预设故障检测模型;处理模块22训练预设故障检测模型,具体包括:获取训练信息,训练信息包括检测数据包和输出结果;处理模块22将训练信息输入至自适应特征融合网络中进行训练,得到第一训练结果;处理模块22将第一训练结果与训练信息进行叠加与标准化处理后,得到第二训练结果;处理模块22将第二训练结果输入至自适应特征融合网络中进行处理,得到第三训练结果;处理模块22将第三训练结果与第二训练结果进行叠加与标准化处理,直至输出训练信息相似度矩阵,训练信息相似度矩阵满足预设逻辑回归条件。
在一种可能的实施方式中,在处理模块22生成报警信息之后,还包括:处理模块22根据报警信息,确定故障类型,故障类型包括读写故障、温度故障以及噪声故障中的一种或多种;处理模块22在预设数据库中查找故障类型,若预设数据库中存在故障类型,则获取故障类型对应的解决方案,预设数据库中预先存储有故障类型与解决方案之间的对应关系;处理模块22将报警信息与解决方案均发送至用户设备,以供用户设备对应的用户参考。
本申请还提供了一种电子设备,参照图3,图3为本申请实施例提供的一种电子设备的结构示意图。电子设备可以包括:至少一个处理器31,至少一个网络接口34,用户接口33,存储器35,至少一个通信总线32。
其中,通信总线32用于实现这些组件之间的连接通信。
其中,用户接口33可以包括显示屏(Display)、摄像头(Camera),可选用户接口33还可以包括标准的有线接口、无线接口。
其中,网络接口34可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器31可以包括一个或者多个处理核心。处理器31利用各种接口和线路连接整个服务器内的各个部分,通过运行或执行存储在存储器35内的指令、程序、代码集或指令集,以及调用存储在存储器35内的数据,执行服务器的各种功能和处理数据。可选的,处理器31可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器31可集成中央处理器(Central ProcessingUnit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器31中,单独通过一块芯片进行实现。
其中,存储器35可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器35包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器35可用于存储指令、程序、代码、代码集或指令集。存储器35可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及的数据等。存储器35可选的还可以是至少一个位于远离前述处理器31的存储装置。如图3所示,作为一种计算机存储介质的存储器35中可以包括操作系统、网络通信模块、用户接口模块以及一种SSD的故障检测方法的应用程序。
在图3所示的电子设备中,用户接口33主要用于为用户提供输入的接口,获取用户输入的数据;而处理器31可以用于调用存储器35中存储一种SSD的故障检测方法的应用程序,当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个的方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必需的。
本申请还提供了一种计算机可读存储介质,计算机可读存储介质存储有指令。当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所披露的装置,可通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些服务接口,装置或单元的间接耦合或通信连接,可以是电性或其他的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:U盘、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述者,仅为本公开的示例性实施例,不能以此限定本公开的范围。即但凡依本公开教导所作的等效变化与修饰,皆仍属本公开涵盖的范围内。本领域技术人员在考虑说明书及实践真理的公开后,将容易想到本公开的其他实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未记载的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的范围和精神由权利要求限定。
Claims (10)
1.一种SSD的故障检测方法,其特征在于,应用于服务器,所述方法包括:
获取SSD的检测数据包;
将所述检测数据包输入至预设故障检测模型中,得到输出结果;
对所述输出结果进行分析,若所述输出结果指示所述检测数据包异常,则生成报警信息,所述报警信息用于表示所述SSD存在潜在故障。
2.根据权利要求1所述的故障检测方法,其特征在于,所述获取SSD的检测数据包,具体包括:
接收检测设备发送的多种检测数据,所述检测设备用于对所述SSD进行检测;
对多种所述检测数据进行预处理,生成所述检测数据包,所述预处理包括数据清洗、数据分类以及归一化处理。
3.根据权利要求1所述的故障检测方法,其特征在于,所述检测数据包包括读写速度,所述将所述检测数据包输入至预设故障检测模型中,得到输出结果,具体包括:
判断所述读写速度是否超出预设读写速度范围内,所述预设读写速度范围预先存储于所述预设故障检测模型中;
若所述读写速度超出所述预设读写速度范围,则生成第一输出结果,所述第一输出结果用于表示所述SSD的读写速度异常。
4.根据权利要求1所述的故障检测方法,其特征在于,所述检测数据包还包括温度数据,所述将所述检测数据包输入至预设故障检测模型中,得到输出结果,具体还包括:
根据温度数据,确定第一温度值;
将所述第一温度值与预设温度阈值进行比较;
若所述第一温度值大于或等于所述预设温度阈值,则生成第三输出结果,所述第三输出结果用于表示所述SSD的温度数据异常。
5.根据权利要求1所述的故障检测方法,其特征在于,所述检测数据包还包括噪声数据,所述将所述检测数据包输入至预设故障检测模型中,得到输出结果,具体还包括:
根据所述噪声数据,得到噪声值,所述噪声值包括电流噪声值和机械噪声值;
将所述电流噪声值和机械噪声值与各自对应的预设噪声阈值进行比较,所述电流噪声值对应一个预设噪声阈值,所述机械噪声值对应一个预设噪声阈值;
若所述电流噪声值和机械噪声值中的任意一种噪声值大于或等于对应的预设噪声阈值,则生成第三输出结果,所述第三输出结果用于表示所述噪声数据异常。
6.根据权利要求1所述的故障检测方法,其特征在于,在所述将所述检测数据包输入至预设故障检测模型中,得到输出结果之前,训练所述预设故障检测模型;所述训练所述预设故障检测模型,具体包括:
获取训练信息,所述训练信息包括检测数据包和所述输出结果;
将所述训练信息输入至自适应特征融合网络中进行训练,得到第一训练结果;
将所述第一训练结果与所述训练信息进行叠加与标准化处理后,得到第二训练结果;
将所述第二训练结果输入至所述自适应特征融合网络中进行处理,得到第三训练结果;
将所述第三训练结果与所述第二训练结果进行叠加与标准化处理,直至输出所述训练信息相似度矩阵,所述训练信息相似度矩阵满足预设逻辑回归条件。
7.根据权利要求1所述的故障检测方法,其特征在于,在所述生成报警信息之后,所述方法还包括:
根据所述报警信息,确定故障类型,所述故障类型包括读写故障、温度故障以及噪声故障中的一种或多种;
在预设数据库中查找所述故障类型,若所述预设数据库中存在所述故障类型,则获取所述故障类型对应的解决方案,所述预设数据库中预先存储有所述故障类型与所述解决方案之间的对应关系;
将所述报警信息与所述解决方案均发送至用户设备,以供所述用户设备对应的用户参考。
8.一种SSD的故障检测装置,其特征在于,所述故障检测装置为服务器,所述服务器包括获取模块(21)和处理模块(22),其中,
所述获取模块(21),用于获取SSD的检测数据包;
所述处理模块(22),用于将所述检测数据包输入至预设故障检测模型中,得到输出结果;
所述处理模块(22),还用于对所述输出结果进行分析,若所述输出结果指示所述检测数据包异常,则生成报警信息,所述报警信息用于表示所述SSD存在潜在故障。
9.一种电子设备,其特征在于,所述电子设备包括处理器(31)、存储器(35)、用户接口(33)以及网络接口(34),所述存储器(35)用于存储指令,所述用户接口(33)和所述网络接口(34)均用于给其他设备通信,所述处理器(31)用于执行所述存储器(35)中存储的指令,以使所述电子设备执行如权利要求1至7任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,当所述指令被执行时,执行如权利要求1至7任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311497022.9A CN117457059A (zh) | 2023-11-10 | 2023-11-10 | 一种ssd的故障检测方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311497022.9A CN117457059A (zh) | 2023-11-10 | 2023-11-10 | 一种ssd的故障检测方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117457059A true CN117457059A (zh) | 2024-01-26 |
Family
ID=89587245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311497022.9A Pending CN117457059A (zh) | 2023-11-10 | 2023-11-10 | 一种ssd的故障检测方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117457059A (zh) |
-
2023
- 2023-11-10 CN CN202311497022.9A patent/CN117457059A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6585482B2 (ja) | 機器診断装置及びシステム及び方法 | |
US20190372832A1 (en) | Method, apparatus and storage medium for diagnosing failure based on a service monitoring indicator | |
JP2017076360A (ja) | 予測信頼性マイニングのためのシステム及び方法 | |
US10866852B2 (en) | Image based fault state determination | |
CN110674009B (zh) | 应用服务器性能监测方法、装置、存储介质及电子设备 | |
WO2022001125A1 (zh) | 一种存储系统的存储故障预测方法、系统及装置 | |
JP2015028700A (ja) | 障害検知装置、障害検知方法、障害検知プログラム及び記録媒体 | |
CN111459692B (zh) | 用于预测驱动器故障的方法、设备和计算机程序产品 | |
KR20230125116A (ko) | 머신러닝 클러스터링 알고리즘과 통계적 기법을 이용해 고장 데이터가 부재한 시스템의 결함 탐지 및 고장 진단 예측 방법 | |
CN114758714A (zh) | 一种硬盘故障预测方法、装置、电子设备及存储介质 | |
CN110457349B (zh) | 信息流出的监控方法及监控装置 | |
US20230280861A1 (en) | System and Method for Detecting Imperfections in a Screen | |
CN117457059A (zh) | 一种ssd的故障检测方法、装置及电子设备 | |
WO2020044898A1 (ja) | 機器状態監視装置及びプログラム | |
WO2016159039A1 (ja) | 中継装置及びプログラム | |
CN115793990A (zh) | 存储器健康状态确定方法、装置、电子设备及存储介质 | |
CN115147236A (zh) | 一种处理方法、处理装置和电子设备 | |
US9372746B2 (en) | Methods for identifying silent failures in an application and devices thereof | |
CN114595765A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN108959028B (zh) | 磁盘生命周期分析方法及装置 | |
CN109491844B (zh) | 一种识别异常信息的计算机系统 | |
CN115310139A (zh) | 文件监控预警系统、方法、计算设备及计算机存储介质 | |
CN112416896A (zh) | 数据异常的报警方法和装置、存储介质、电子装置 | |
CN117149569A (zh) | 一种板卡运行状态预警方法、装置及电子设备 | |
US10970643B2 (en) | Assigning a fire system safety score and predictive analysis via data mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |