CN104866411A - 固态硬盘的监测及分析方法及装置 - Google Patents

固态硬盘的监测及分析方法及装置 Download PDF

Info

Publication number
CN104866411A
CN104866411A CN201510310204.XA CN201510310204A CN104866411A CN 104866411 A CN104866411 A CN 104866411A CN 201510310204 A CN201510310204 A CN 201510310204A CN 104866411 A CN104866411 A CN 104866411A
Authority
CN
China
Prior art keywords
solid state
monitoring
hard disc
state hard
ssd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510310204.XA
Other languages
English (en)
Inventor
杨挺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510310204.XA priority Critical patent/CN104866411A/zh
Publication of CN104866411A publication Critical patent/CN104866411A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种固态硬盘的监测及分析方法,包括:根据预定时间间隔对多个机器设备的固态硬盘进行监测,并采集固态硬盘的多个预定监测项的监测数据;对多个预定监测项的监测数据进行分析处理,确定固态硬盘的分析结果;基于固态硬盘的分析结果,确定相应的固态硬盘的硬件状态。本发明中通过周期性地对固态硬盘进行自动化监控,节约了人力资源成本;同时,由于上述监测的过程可在硬件设备实际发生故障前进行,因此可避免由于硬件故障未提前发现而导致前端数据业务中断的问题;对于大规模集群式计算设备,可快速定位故障机器并确定相应的解决方案。

Description

固态硬盘的监测及分析方法及装置
技术领域
本发明涉及计算机技术领域,具体而言,本发明涉及一种固态硬盘的监测及分析方法及装置。
背景技术
SSD(Solid State Disk,固态硬盘)是用固态电子存储芯片阵列而制成的硬盘,由控制单元和存储单元(FLASH芯片)组成。SSD的接口规范和定义、功能及使用方法与普通硬盘相同。SSD不再采用机械转动装置,因而具有传统机械硬盘不具备的快速读写、质量轻、能耗低以及体积小等优势。SSD被广泛应用于军事、车载、工控、视频监控、网络监控、网络终端、电力、医疗、航空等、导航设备等领域。随着SSD的广泛使用,对其性能进行监测的方法和技术也提出了新的要求。
当前,只有在发现机器设备出现异常状况后,才会去检查SSD是否正常,而现有的SSD检测方式为人工登陆机器设备检查SSD的各项性能指标。因此,现有方式不能实现周期性地自动化监控,浪费人力资源成本;也无法在硬件发生故障前发现潜在问题而导致前端数据业务中断,对前端业务产生不良影响。
发明内容
为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:
本发明的实施例提出了一种固态硬盘的监测及分析方法,包括:
根据预定时间间隔对多个机器设备的固态硬盘进行监测,并采集固态硬盘的多个预定监测项的监测数据;
对多个预定监测项的监测数据进行分析处理,确定固态硬盘的分析结果;
基于固态硬盘的分析结果,确定相应的固态硬盘的硬件状态。
本发明的另一实施例提出了一种固态硬盘的监测及分析装置,包括:
监测模块,用于根据预定时间间隔对多个机器设备的固态硬盘进行监测,并采集固态硬盘的多个预定监测项的监测数据;
分析模块,用于对多个预定监测项的监测数据进行分析处理,确定固态硬盘的分析结果;
故障判断模块,用于基于固态硬盘的分析结果,确定相应的固态硬盘的硬件状态。
本发明的实施例中,通过周期性地对硬件设备的固态硬盘进行自动化监控,节约了人力资源成本;同时,由于对多个机器设备的固态硬盘进行监测的过程可在硬件设备实际发生故障前进行,因此可避免由于硬件故障未提前发现而导致前端数据业务中断的问题;对于大规模集群式计算设备,可快速定位故障机器,提高固态硬盘的监控效率;此外,在监控到具体性能指标异常时,能够实时对性能指标进行分析进而确定相应的解决方案;还能够实时向用户直观显示固态硬盘各项性能测试结果,提高了用户的监控体验。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明中固态硬盘的监测及分析方法一个实施例的流程示意图;
图2为本发明中固态硬盘的监测及分析方法一个优选实施例的流程示意图;
图3为本发明中固态硬盘的监测及分析装置一个实施例的结构示意图;
图4为本发明中固态硬盘的监测及分析装置一个优选实施例的结构示意图;
图5为本发明一个优选实施例中监测数据进行显示的示例图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
在上下文中所称“计算设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
本发明的实施例中,所述计算设备可为网络服务器,所述多个计算设备可组成的服务器组或大规模服务器集群。
图1为本发明中固态硬盘SSD的监测及分析方法一个实施例的流程示意图。
步骤S110:根据预定时间间隔对多个机器设备的固态硬盘进行监测,并采集固态硬盘的多个预定监测项的监测数据;步骤S120:对多个预定监测项的监测数据进行分析处理,确定固态硬盘的分析结果;步骤S130:基于固态硬盘的分析结果,确定相应的固态硬盘的硬件状态。
本发明的实施例中,通过周期性地对硬件设备SSD进行自动化监控,节约了人力资源成本;同时,由于对多个机器设备的SSD进行监测的过程可在硬件设备实际发生故障前进行,因此可避免由于硬件故障未提前发现而导致前端数据业务中断的问题;对于大规模集群式计算设备,可快速定位故障机器,提高SSD监控效率;此外,在监控到具体性能指标异常时,能够实时对性能指标进行分析进而确定相应的解决方案;还能够实时向用户直观显示SSD各项性能测试结果,提高了用户的监控体验。
步骤S110:根据预定时间间隔对多个机器设备的SSD进行监测,并采集SSD的多个预定监测项的监测数据。
根据预定时间间隔进行自动化监控,预定时间间隔可以基于历史监控分析确定,也可以基于业务要求和/或业务重要性来确定。
其中,预定监测项包括但不限于:介质磨损率;可用剩余预留空间百分比;SSD盘写入量;SSD盘读取量;SSD盘物理容量。
其中,对多个机器设备的SSD进行监测的具体监测方式为smarctl监测方式。
具体地,通过smarctl方式对每个机器设备包括的一个或多个SSD分别进行监测,并采集SSD的多个预定监测项的监测数据。例如,通过执行smartctl--all-T permissive$dev>/tmp/smartctl.txt命令,采集到SSD的多个预定监测项的监测数据;如,对于一个SSD,可采集到与该SSD相应的介质磨损率、可用剩余预留空间百分比、SSD盘写入量、SSD盘读取量、SSD盘物理容量等监测数据。
优选地,可周期性地对多个机器设备的SSD进行监测;例如,通过crontab定时任务,执行命令001***cd/home/dba;sh ssd_monitor.sh,每天早上1点定时对多个机器设备的SSD进行周期性地监测。
优选地,对多个机器设备的SSD进行监测之前,还包括步骤S140(图中未示出);步骤S140:判断每一机器设备是否包括磁盘阵列RAID卡;当该机器设备包括RAID卡时,步骤S110:基于smarctl监测方式,通过RAID卡采集该机器设备的SSD的多个预定监测项的监测数据。
其中,RAID(Redundant Arrays of Independent Disks,磁盘阵列)是由多个磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。RAID卡能够提供在线扩容、动态修改阵列级别、自动数据恢复、驱动器漫游、超高速缓冲等功能。它能提供性能、数据保护、可靠性、可用性和可管理性的解决方案,其中一种解决方案为在RAID卡下用SSD做阵列。
具体地,判断每一机器设备是否包括RAID卡,若确定该机器设备包括RAID卡,即在硬件上,该机器设备中SSD插入RAID卡中;则基于smarctl监测方式,通过RAID卡采集该机器设备的SSD的多个预定监测项的监测数据。
例如,若判断确定某一机器设备包括RAID卡时,基于smarctl执行smartctl-a-d sat+megaraid,$dev_id/dev/sda>/tmp/smartctl.txt命令,并利用RAID工具,如MegaCli工具megacli-2.00.11-2.x86_64.rpm,通过RAID卡读取该RAID卡中插入的一个或多个SSD的多个预定监测项的监测数据。
步骤S120:对多个预定监测项的监测数据进行分析处理,确定SSD的分析结果。
例如,预定监测项为SSD物理容量,采集到该预定监测项的监测数据为该SSD的物理容量为300G,将该SSD的物理容量300G与预定的容量600G进行比较,当SSD盘物理容量与预定容量不一致时,确定该SSD盘的物理容量有误。
优选地,如图2所示,对多个预定监测项的监测数据进行分析处理,确定SSD的分析结果的步骤具体包括步骤S221和步骤S222;步骤S221:判断每一预定监测项的监测数据是否达到相应的阈值;步骤S222:当达到相应的阈值时,生成指示SSD相应预定监测项异常的分析结果。
具体地,为每一预定监测项预设相应的阈值,判断每一预定监测项的监测数据是否达到相应的阈值,如预定监测项为介质磨损率,当介质磨损率的监测数据大于介质磨损率相应的阈值时,生成指示该SSD介质磨损率异常的分析结果。
例如,通过smarctl监测方式可采集到SSD的介质磨损率大于相应的阈值时,生成分析结果指示该SSD的介质磨损率过高。
通过smarctl监测方式可采集到SSD的介质磨损率“Media WearoutIndicator”,介质磨损率指SSD上闪存的磨耗指数,闪存写入次数是有限的,当到达一定阈值时会迅速损坏,“Media Wearout Indicator”的初始值为“100”,当减少到“0”时就表示SSD随时可能会坏掉。通过smarctl监测方式可采集到SSD的可用剩余预留空间百分比“Available_Reservd_Space”,预留空间指SSD上用户不可操作的容量,其大小为实际容量减去用户可用容量,预留空间一般被用于优化操作;可用剩余预留空间百分比指可用剩余预留空间与总预留空间的比值。SSD盘写入量“Total_LBAs_Written”、SSD盘读取量“Total_LBAs_Read”分别指写入SSD盘的数据总量及读取总量,也可以反应SSD盘的使用损耗情况。
步骤S130:基于SSD的分析结果,确定相应的SSD的硬件状态。
例如,分析结果指示SSD的介质磨损率过高,确定该SSD盘的硬件磨损严重,硬件状态为故障状态;分析结果指示SSD的可用剩余预留空间百分比过低,确定该SSD盘的可用剩余预留空间过小,严重影响SSD的性能,硬件状态为故障状态。
在一优选实施例中(参照图1),当SSD的硬件状态为故障状态时,该方法还包括步骤S140(图中未示出);步骤S140:基于SSD的分析结果,生成相应的SSD故障处理方案。
具体地,与SSD的分析结果相应的SSD处理方案包括但不限于以下情形:
1)由于介质磨损率过高而导致SSD处于故障状态时,SSD处理方案为更换相应的SSD;
2)由于可用剩余预留空间百分比过低而导致SSD处于故障状态时,SSD处理方案为更换相应的SSD;
3)由于SSD物理容量与预定的容量大小不一致而导致SSD异常状态时,SSD处理方案为重新确定SSD是否安装错误;
4)若仅SSD盘读取量大于预定读取量阈值而导致SSD异常状态时,SSD处理方案可为对SSD进行优化;其中,优化方案包括但不限于:保证SSD读写模式为AHCI;更新芯片组驱动程序以开启TRIM模式;关闭磁盘整理计划;关闭磁盘分页。
在另一优选实施例中(参照图1),该方法还包括步骤S150(图中未示出)和步骤S160(图中未示出);步骤S150:创建监测数据库,并将采集到的多个机器设备的SSD的多个预定监测项的监测数据保存至监测数据库;步骤S160:从监测数据库中解析出多个机器设备的SSD的各预定监测项的监测数据,并根据需求绘制图形以供展示。
具体地,创建监测数据库,如MySQL数据库,并将采集到的每个机器设备的每块SSD的多个预定监测项的监测数据保存至监测数据库的一个MySQL数据库中。
例如,创建MySQL数据库作为监测数据库,把采集到的数据写入到MySQL数据库中存储,一个MySQL数据库包括:SSD的唯一标示信息,如SSD串号;该SSD所在机器设备的标示信息,如主机名;机器设备的IP地址;多个预定监测项的监测数据。
如下所示,MySQL数据库的表结构可为:
随后,根据预定规则,利用监测数据库中的各预定监测项的监测数据,生成图形以供展示。
其中,预定规则包括生成的图形样式,如柱状图、线型图(斜率)、饼状图等,相应于每种图形样式,还包括度量单位的设置、图形颜色的设置等;如相应于柱状图设置柱体的高度单位,相应于线型图设置线段的斜率单位,相应于饼状图设置扇区的角度单位;不同颜色设置为代表不同的硬件状态,如红色代表硬件状态正常,黑色代表硬件状态故障,绿色代表硬件状态待定等。
具体地,根据预定的图形样式、相应度量单位的设置及图形颜色设置,基于用户所选择的对某项预定监测项进行排序的操作指令,生成多个机器设备的一个或多个SSD基于该预定监测项的监测数据排序后的图形,可选地,将预定监测项中的异常数据通过红色进行显示。
如图5所示的应用场景中,向用户提供基于介质磨损率、SSD盘写入量、SSD盘读取量及SSD盘物理容量四种维度的排序方式,对多台服务器的一个或多个SSD的各预定监测项的监测数据进行排序展示。
本优选实施例可为用户提供清晰的图形展示,用户通过所展示的图形可快递定位故障SSD,特别是对大规模集群式计算设备的SSD的性能监控统计提供了有力的展示支持,极大提高了用户定位故障SSD的效率。
图3为本发明中固态硬盘SSD的监测及分析装置一个实施例的结构示意图。
该装置包括监测模块310、分析模块320和故障判断模块330;监测模块310对多个机器设备的SSD进行监测,并采集SSD的多个预定监测项的监测数据;分析模块320对多个预定监测项的监测数据进行分析处理,确定SSD的分析结果;故障判断模块330基于SSD的分析结果,确定相应的SSD的硬件状态。
本发明的实施例中,由于对多个机器设备的SSD进行监测的过程可在硬件设备实际发生故障前进行,因此可避免由于硬件故障未提前发现而导致前端数据业务中断的问题;对于大规模集群式计算设备,可快速定位故障机器,提高SSD监控效率;同时,在监控到具体性能指标异常时,能够实时对性能指标进行分析进而确定相应的解决方案。
监测模块310对多个机器设备的SSD进行监测,并采集SSD的多个预定监测项的监测数据。
其中,预定监测项包括但不限于:介质磨损率;可用剩余预留空间百分比;SSD盘写入量;SSD盘读取量;SSD盘物理容量。
其中,对多个机器设备的SSD进行监测的具体监测方式为smarctl监测方式。
具体地,通过smarctl方式对每个机器设备包括的一个或多个SSD分别进行监测,并采集SSD的多个预定监测项的监测数据。例如,通过执行smartctl--all-T permissive$dev>/tmp/smartctl.txt命令,采集到SSD的多个预定监测项的监测数据;如,对于一个SSD,可采集到与该SSD相应的介质磨损率、可用剩余预留空间百分比、SSD盘写入量、SSD盘读取量、SSD盘物理容量等监测数据。
优选地,可周期性地对多个机器设备的SSD进行监测;例如,通过crontab定时任务,执行命令001***cd/home/dba;sh ssd_monitor.sh,每天早上1点定时对多个机器设备的SSD进行周期性地监测。
优选地,该装置还包括磁盘阵列卡判断模块(图中未示出),在对多个机器设备的SSD进行监测之前,磁盘阵列卡判断模块判断每一机器设备是否包括磁盘阵列RAID卡;当该机器设备包括RAID卡时,监测模块310基于smarctl监测方式,通过RAID卡采集该机器设备的SSD的多个预定监测项的监测数据。
其中,RAID是由多个磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。RAID卡能够提供在线扩容、动态修改阵列级别、自动数据恢复、驱动器漫游、超高速缓冲等功能。它能提供性能、数据保护、可靠性、可用性和可管理性的解决方案,其中一种解决方案为在RAID卡下用SSD做阵列。
具体地,判断每一机器设备是否包括RAID卡,若确定该机器设备包括RAID卡,即在硬件上,该机器设备中SSD插入RAID卡中;则基于smarctl监测方式,通过RAID卡采集该机器设备的SSD的多个预定监测项的监测数据。
例如,若判断确定某一机器设备包括RAID卡时,基于smarctl执行smartctl-a-d sat+megaraid,$dev_id/dev/sda>/tmp/smartctl.txt命令,并利用RAID工具,如MegaCli工具megacli-2.00.11-2.x86_64.rpm,通过RAID卡读取该RAID卡中插入的一个或多个SSD的多个预定监测项的监测数据。
分析模块320对多个预定监测项的监测数据进行分析处理,确定SSD的分析结果。
例如,预定监测项为SSD物理容量,采集到该预定监测项的监测数据为该SSD的物理容量为300G,将该SSD的物理容量300G与预定的容量600G进行比较,当SSD盘物理容量与预定容量不一致时,确定该SSD盘的物理容量有误。
优选地,如图4所示,分析模块具体包括阈值判断单元421和分析结果生成单元422;阈值判断单元421判断每一预定监测项的监测数据是否达到相应的阈值;当达到相应的阈值时,分析结果生成单元422生成指示SSD相应预定监测项异常的分析结果。
具体地,为每一预定监测项预设相应的阈值,判断每一预定监测项的监测数据是否达到相应的阈值,如预定监测项为介质磨损率,当介质磨损率的监测数据大于介质磨损率相应的阈值时,生成指示该SSD介质磨损率异常的分析结果。
例如,通过smarctl监测方式可采集到SSD的介质磨损率大于相应的阈值时,生成分析结果指示该SSD的介质磨损率过高。
通过smarctl监测方式可采集到SSD的介质磨损率“Media WearoutIndicator”,介质磨损率指SSD上闪存的磨耗指数,闪存写入次数是有限的,当到达一定阈值时会迅速损坏,“Media Wearout Indicator”的初始值为“100”,当减少到“0”时就表示SSD随时可能会坏掉。通过smarctl监测方式可采集到SSD的可用剩余预留空间百分比“Available_Reservd_Space”,预留空间指SSD上用户不可操作的容量,其大小为实际容量减去用户可用容量,预留空间一般被用于优化操作;可用剩余预留空间百分比指可用剩余预留空间与总预留空间的比值。SSD盘写入量“Total_LBAs_Written”、SSD盘读取量“Total_LBAs_Read”分别指写入SSD盘的数据总量及读取总量,也可以反应SSD盘的使用损耗情况。
监测模块310基于SSD的分析结果,确定相应的SSD的硬件状态。
具体地,分析结果指示SSD的介质磨损率过高,确定该SSD盘的硬件磨损严重,硬件状态为故障状态;分析结果指示SSD的可用剩余预留空间百分比过低,确定该SSD盘的可用剩余预留空间过小,严重影响SSD的性能,硬件状态为故障状态。
在一优选实施例中(参照图3),当SSD的硬件状态为故障状态时,该装置还包括方案生成模块(图中未示出);方案生成模块基于SSD的分析结果,生成相应的SSD故障处理方案。
具体地,与SSD的分析结果相应的SSD处理方案包括但不限于以下情形:
1)由于介质磨损率过高而导致SSD处于故障状态时,SSD处理方案为更换相应的SSD;
2)由于可用剩余预留空间百分比过低而导致SSD处于故障状态时,SSD处理方案为更换相应的SSD;
3)由于SSD物理容量与预定的容量大小不一致而导致SSD异常状态时,SSD处理方案为重新确定SSD是否安装错误;
4)若仅SSD盘读取量大于预定读取量阈值而导致SSD异常状态时,SSD处理方案可为对SSD进行优化;其中,优化方案包括但不限于:保证SSD读写模式为AHCI;更新芯片组驱动程序以开启TRIM模式;关闭磁盘整理计划;关闭磁盘分页。
在另一优选实施例中(参照图3),该装置还包括数据库创建模块(图中未示出)和图形绘制模块(图中未示出);数据库创建模块创建监测数据库,并将采集到的多个机器设备的SSD的多个预定监测项的监测数据保存至监测数据库;图形绘制模块从监测数据库中解析出多个机器设备的SSD的各预定监测项的监测数据,并根据需求绘制图形以供展示。
具体地,创建监测数据库,如MySQL数据库,并将采集到的每个机器设备的每块SSD的多个预定监测项的监测数据保存至监测数据库的一个MySQL数据库中。
例如,创建MySQL数据库作为监测数据库,把采集到的数据写入到MySQL数据库中存储,一个MySQL数据库包括:SSD的唯一标示信息,如SSD串号;该SSD所在机器设备的标示信息,如主机名;机器设备的IP地址;多个预定监测项的监测数据。
如下所示,MySQL数据库的表结构可为:
随后,根据预定规则,利用监测数据库中的各预定监测项的监测数据,生成图形以供展示。
其中,预定规则包括生成的图形样式,如柱状图、线型图(斜率)、饼状图等,相应于每种图形样式,还包括度量单位的设置、图形颜色的设5置等;如相应于柱状图设置柱体的高度单位,相应于线型图设置线段的斜率单位,相应于饼状图设置扇区的角度单位;不同颜色设置为代表不同的硬件状态,如红色代表硬件状态正常,黑色代表硬件状态故障,绿色代表硬件状态待定等。
具体地,根据预定的图形样式、相应度量单位的设置及图形颜色设置,基于用户所选择的对某项预定监测项进行排序的操作指令,生成多个机器设备的一个或多个SSD基于该预定监测项的监测数据排序后的图形,可选地,将预定监测项中的异常数据通过红色进行显示。
本技术领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随即存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable ProgrammableRead-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种固态硬盘的监测及分析方法,其特征在于,包括:
根据预定时间间隔对多个机器设备的固态硬盘进行监测,并采集所述固态硬盘的多个预定监测项的监测数据;
对所述多个预定监测项的监测数据进行分析处理,确定所述固态硬盘的分析结果;以及
基于所述固态硬盘的分析结果,确定相应的固态硬盘的硬件状态。
2.根据权利要求1所述的固态硬盘的监测及分析方法,其中,根据预定时间间隔对多个机器设备的固态硬盘进行监测之前,还包括:
判断每一机器设备是否包括磁盘阵列卡;
当该机器设备包括磁盘阵列卡时,根据预定时间间隔对多个机器设备的固态硬盘进行监测,并采集所述固态硬盘的多个监测项的监测数据,具体包括:
基于smarctl监测方式,通过所述磁盘阵列卡采集该机器设备的固态硬盘的多个预定监测项的监测数据。
3.根据权利要求1或2所述的固态硬盘的监测及分析方法,其中,对所述多个预定监测项的监测数据进行分析处理,确定所述固态硬盘的分析结果,具体包括:
判断每一预定监测项的监测数据是否达到相应的阈值;
当达到所述相应的阈值时,生成指示所述预定监测项异常的分析结果。
4.根据权利要求1-3任一项所述的固态硬盘的监测及分析方法,其中,当固态硬盘的硬件状态为故障状态时,该方法还包括:
基于所述固态硬盘的分析结果,生成相应的固态硬盘故障处理方案。
5.根据权利要求1-4任一项所述的固态硬盘的监测及分析方法,其中,该方法还包括:
创建监测数据库,并将采集到的所述多个机器设备的固态硬盘的多个预定监测项的监测数据保存至所述监测数据库;以及
根据预定规则,利用所述监测数据库中的各预定监测项的监测数据,生成图形以供展示。
6.一种固态硬盘的监测及分析装置,其特征在于,包括:
监测模块,用于根据预定时间间隔对多个机器设备的固态硬盘进行监测,并采集所述固态硬盘的多个预定监测项的监测数据;
分析模块,用于对所述多个预定监测项的监测数据进行分析处理,确定所述固态硬盘的分析结果;以及
故障判断模块,用于基于所述固态硬盘的分析结果,确定相应的固态硬盘的硬件状态。
7.根据权利要求6所述的固态硬盘的监测及分析装置,其中,还包括:
磁盘阵列卡判断模块,用于对多个机器设备的固态硬盘进行监测之前,判断每一机器设备是否包括磁盘阵列卡;
当该机器设备包括磁盘阵列卡时,所述监测模块具体用于基于smarctl监测方式,通过所述磁盘阵列卡采集该机器设备的固态硬盘的多个预定监测项的监测数据。
8.根据权利要求6或7所述的固态硬盘的监测及分析装置,其中,所述分析模块具体包括:
阈值判断单元,用于判断每一预定监测项的监测数据是否达到相应的阈值;
分析结果生成单元,用于当达到所述相应预定监测项的阈值时,生成指示所述固态硬盘相应预定监测项异常的分析结果。
9.根据权利要求6-8任一项所述的固态硬盘的监测及分析装置,其中,当固态硬盘的硬件状态为故障状态时,还包括:
方案生成模块,用于基于所述固态硬盘的分析结果,生成相应的固态硬盘故障处理方案。
10.根据权利要求6-9任一项所述的固态硬盘的监测及分析装置,其中,还包括:
数据库创建模块,用于创建监测数据库,并将采集到的所述多个机器设备的固态硬盘的多个预定监测项的监测数据保存至所述监测数据库;
图形绘制模块,用于根据预定规则,利用所述监测数据库中的各预定监测项的监测数据,生成图形以供展示。
CN201510310204.XA 2015-06-08 2015-06-08 固态硬盘的监测及分析方法及装置 Pending CN104866411A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510310204.XA CN104866411A (zh) 2015-06-08 2015-06-08 固态硬盘的监测及分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510310204.XA CN104866411A (zh) 2015-06-08 2015-06-08 固态硬盘的监测及分析方法及装置

Publications (1)

Publication Number Publication Date
CN104866411A true CN104866411A (zh) 2015-08-26

Family

ID=53912257

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510310204.XA Pending CN104866411A (zh) 2015-06-08 2015-06-08 固态硬盘的监测及分析方法及装置

Country Status (1)

Country Link
CN (1) CN104866411A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095651A (zh) * 2016-06-15 2016-11-09 浪潮(北京)电子信息产业有限公司 一种3d虚拟机房监控管理方法及系统
WO2016188175A1 (zh) * 2015-10-14 2016-12-01 中兴通讯股份有限公司 一种硬件故障分析系统和方法
CN106528377A (zh) * 2016-11-11 2017-03-22 合肥联宝信息技术有限公司 固态硬盘健康状态监测方法及装置
CN106776102A (zh) * 2016-12-27 2017-05-31 中国建设银行股份有限公司 一种应用系统健康检查方法及系统
CN106844166A (zh) * 2016-12-28 2017-06-13 上海华为技术有限公司 一种数据处理方法及装置
WO2017125014A1 (zh) * 2016-01-18 2017-07-27 中兴通讯股份有限公司 硬盘监控方法及装置
CN107545129A (zh) * 2016-06-27 2018-01-05 西门子(深圳)磁共振有限公司 一种医疗设备的故障检查方法和装置
CN107678919A (zh) * 2017-09-27 2018-02-09 联想(北京)有限公司 一种设备状态的检测方法及电子设备
CN107766191A (zh) * 2017-11-03 2018-03-06 郑州云海信息技术有限公司 Linux 系统的自动巡检存储信息及健康状态的测试方法
CN107861829A (zh) * 2017-11-06 2018-03-30 郑州云海信息技术有限公司 一种磁盘故障检测的方法、系统、装置及存储介质
CN108280799A (zh) * 2017-01-06 2018-07-13 中航华东光电(上海)有限公司 一种基于fpga的图形生成器及图形生成方法
CN109032897A (zh) * 2018-08-01 2018-12-18 浪潮电子信息产业股份有限公司 数据调度方法、主机以及固态硬盘
CN116610469A (zh) * 2023-07-21 2023-08-18 江苏华存电子科技有限公司 一种固态硬盘的综合质量性能测试方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127233A (zh) * 2007-09-25 2008-02-20 Ut斯达康通讯有限公司 流媒体应用中的硬盘错误检测与容错方法
CN102279775A (zh) * 2011-08-19 2011-12-14 西安交通大学 一种Linux系统下的硬盘故障处理方法
CN102591591A (zh) * 2011-12-19 2012-07-18 杭州瑞网广通信息技术有限公司 磁盘检测系统、磁盘检测方法以及网络存储系统
CN103136091A (zh) * 2013-01-28 2013-06-05 北京奇虎科技有限公司 对终端设备安全状态检测的方法及装置
CN103984615A (zh) * 2014-05-12 2014-08-13 浪潮(北京)电子信息产业有限公司 一种实现磁盘监控的方法及装置
CN104461824A (zh) * 2014-12-01 2015-03-25 北京同有飞骥科技股份有限公司 一种磁盘健康信息优化管理方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127233A (zh) * 2007-09-25 2008-02-20 Ut斯达康通讯有限公司 流媒体应用中的硬盘错误检测与容错方法
CN102279775A (zh) * 2011-08-19 2011-12-14 西安交通大学 一种Linux系统下的硬盘故障处理方法
CN102591591A (zh) * 2011-12-19 2012-07-18 杭州瑞网广通信息技术有限公司 磁盘检测系统、磁盘检测方法以及网络存储系统
CN103136091A (zh) * 2013-01-28 2013-06-05 北京奇虎科技有限公司 对终端设备安全状态检测的方法及装置
CN103984615A (zh) * 2014-05-12 2014-08-13 浪潮(北京)电子信息产业有限公司 一种实现磁盘监控的方法及装置
CN104461824A (zh) * 2014-12-01 2015-03-25 北京同有飞骥科技股份有限公司 一种磁盘健康信息优化管理方法和装置

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016188175A1 (zh) * 2015-10-14 2016-12-01 中兴通讯股份有限公司 一种硬件故障分析系统和方法
WO2017125014A1 (zh) * 2016-01-18 2017-07-27 中兴通讯股份有限公司 硬盘监控方法及装置
CN106095651A (zh) * 2016-06-15 2016-11-09 浪潮(北京)电子信息产业有限公司 一种3d虚拟机房监控管理方法及系统
CN107545129A (zh) * 2016-06-27 2018-01-05 西门子(深圳)磁共振有限公司 一种医疗设备的故障检查方法和装置
CN107545129B (zh) * 2016-06-27 2021-06-22 西门子(深圳)磁共振有限公司 一种医疗设备的故障检查方法和装置
CN106528377A (zh) * 2016-11-11 2017-03-22 合肥联宝信息技术有限公司 固态硬盘健康状态监测方法及装置
CN106776102A (zh) * 2016-12-27 2017-05-31 中国建设银行股份有限公司 一种应用系统健康检查方法及系统
CN106844166A (zh) * 2016-12-28 2017-06-13 上海华为技术有限公司 一种数据处理方法及装置
CN106844166B (zh) * 2016-12-28 2021-01-29 上海华为技术有限公司 一种数据处理方法及装置
CN108280799A (zh) * 2017-01-06 2018-07-13 中航华东光电(上海)有限公司 一种基于fpga的图形生成器及图形生成方法
CN107678919B (zh) * 2017-09-27 2020-09-25 联想(北京)有限公司 一种设备状态的检测方法及电子设备
CN107678919A (zh) * 2017-09-27 2018-02-09 联想(北京)有限公司 一种设备状态的检测方法及电子设备
CN107766191A (zh) * 2017-11-03 2018-03-06 郑州云海信息技术有限公司 Linux 系统的自动巡检存储信息及健康状态的测试方法
CN107861829A (zh) * 2017-11-06 2018-03-30 郑州云海信息技术有限公司 一种磁盘故障检测的方法、系统、装置及存储介质
CN109032897A (zh) * 2018-08-01 2018-12-18 浪潮电子信息产业股份有限公司 数据调度方法、主机以及固态硬盘
CN116610469A (zh) * 2023-07-21 2023-08-18 江苏华存电子科技有限公司 一种固态硬盘的综合质量性能测试方法及系统
CN116610469B (zh) * 2023-07-21 2023-11-14 江苏华存电子科技有限公司 一种固态硬盘的综合质量性能测试方法及系统

Similar Documents

Publication Publication Date Title
CN104866411A (zh) 固态硬盘的监测及分析方法及装置
US20190286510A1 (en) Automatic correlation of dynamic system events within computing devices
CN102279786B (zh) 一种监测应用程序有效访问量的方法及装置
CN102662608B (zh) 一种降低读延时的方法及装置
CN106294222A (zh) 一种确定pcie设备与插槽对应关系的方法及装置
CN102411533A (zh) 一种集群存储系统的日志管理优化方法
CN103049354B (zh) 数据修复方法、数据修复装置以及存储系统
CN103870205A (zh) 用于存储控制的方法和装置、以及信息处理的方法和装置
CN106776362A (zh) 存储器的控制方法及装置
CN106844166B (zh) 一种数据处理方法及装置
CN107516546B (zh) 一种随机存储器的在线检测装置及方法
CN108647118A (zh) 基于存储集群的副本异常恢复方法、装置及计算机设备
CN101989322B (zh) 自动提取恶意代码内存特征的方法和系统
CN105573872A (zh) 数据存储系统的硬盘维护方法和装置
CN103176867A (zh) 一种快速文件差异备份方法
CN112069023B (zh) 一种存储链路监控系统及方法
CN109918221A (zh) 一种硬盘报错解析方法、系统、终端及存储介质
CN105117303A (zh) 一种数据恢复的方法及设备
CN106021046A (zh) 一种对比硬盘性能的方法、装置和服务器
CN111224807A (zh) 分布式日志处理方法、装置、设备及计算机存储介质
CN103368762A (zh) 大数据对比测试方法、系统及装置
US7546489B2 (en) Real time event logging and analysis in a software system
CN116909494A (zh) 服务器的存储切换方法和装置,以及服务器系统
CN104699564A (zh) 一种采用Raid0磁盘组服务器的自动恢复方法及装置
CN104954351A (zh) 数据检测方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150826

RJ01 Rejection of invention patent application after publication