CN109885465A - 多品牌服务器上ssd磁盘寿命的批量统计与监控方法 - Google Patents

多品牌服务器上ssd磁盘寿命的批量统计与监控方法 Download PDF

Info

Publication number
CN109885465A
CN109885465A CN201910071473.3A CN201910071473A CN109885465A CN 109885465 A CN109885465 A CN 109885465A CN 201910071473 A CN201910071473 A CN 201910071473A CN 109885465 A CN109885465 A CN 109885465A
Authority
CN
China
Prior art keywords
disk
service life
ssd
agreement
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910071473.3A
Other languages
English (en)
Inventor
蒋川
陈帮民
张鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN SECURITIES COMMUNICATION CO Ltd
Original Assignee
SHENZHEN SECURITIES COMMUNICATION CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN SECURITIES COMMUNICATION CO Ltd filed Critical SHENZHEN SECURITIES COMMUNICATION CO Ltd
Priority to CN201910071473.3A priority Critical patent/CN109885465A/zh
Publication of CN109885465A publication Critical patent/CN109885465A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了多品牌服务器上SSD磁盘寿命的批量统计与监控方法,包括:判断磁盘是否支持S.M.A.R.T协议,对于支持S.M.A.R.T协议的磁盘,在服务器上使用lspci判断是否使用磁盘阵列卡;若使用磁盘阵列卡,则判断阵列卡型号;若磁盘不支持S.M.A.R.T协议,则在监控系统中添加性能相关的监控;通过各自的磁盘阵列卡管理工具需要获取到各阵列卡的管理参数。本发明兼容多品牌服务器并兼容多品牌的SSD磁盘数据采集;同时,实现可对多服务器、多SSD磁盘并行采集,这将大大降低人力资源,提高运维效率;对于分析、处理所得数据,自动报关多种监控平台并智能报警,有效防患SSD磁盘故障与低寿命磁盘事件及次生事故。

Description

多品牌服务器上SSD磁盘寿命的批量统计与监控方法
技术领域
本发明涉及金融证券相关技术领域,具体是多品牌服务器上SSD磁盘寿命的批量统计与监控方法。
背景技术
当前中国证券行业机构与证券、基金公司在招标采购服务器时,通常会采购到不同品牌的服务器(如浪潮,华为,HPE,H3C,DELL等)。而对于不同品牌的服务器的磁盘阵列卡型号不同,且SSD磁盘管理的方式也有明显差异;对于服务器上SSD寿命统计与监测更是缺少统一有效的实现方式。
对于一个技术人员,在对磁盘管理方面的工作,通常都是效率低下的。以一个普通A厂商的服务器为例,通常需要以下步骤:
(1)使用服务器厂商工具查询到设备的device id;
(2)通过人为识别来将设备与其device id相对应;
(3)将设备名称与设备id以参数形式通过某种磁盘检查工具进行查询;
(4)在查询结果中,过滤筛选出SSD寿命等有用信息;
(5)对于没有使用raid(阵列卡)的ssd,则直接使用磁盘检查工具直接查询。
在对于不同厂商的服务器,管理工具是不一致的。上述方式有如下缺陷:1.服务器厂商A的管理工具在服务器厂商B上存在兼容性问题,要做适配;2.所以对于一个技术人员,需要了解到多个厂商的多种管理工具,这样带来的时间人力与成本是巨大的;3.类似操作也容易误操作且有数据丢失风险;4.整体过程人工操作,没有实现批量统计操作。服务器上SSD盘寿命指标,没有输出(上报)给监控系统;没有实现SSD寿命的实现监测,更没有对于低于寿命“阀值”的SSD进行告警。
为解决行业技术人员困惑,提升运维效率,减少运维事故,本申请提出并实现关于SSD磁盘寿命批量统计与监控告警方法;此方法创造性统一多种RAID卡工具,可在多种品牌服务器运行。
发明内容
本发明的目的在于提供多品牌服务器上SSD磁盘寿命的批量统计与监控方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
多品牌服务器上SSD磁盘寿命的批量统计与监控方法,包括以下步骤:
(1).判断磁盘是否支持S.M.A.R.T协议,对于支持S.M.A.R.T协议的磁盘,在服务器上使用lspci判断是否使用磁盘阵列卡;
(2). 若使用磁盘阵列卡,则判断阵列卡型号;
(3).通过各自的磁盘阵列卡管理工具需要获取到各阵列卡的管理参数;
(4).对于支持S.M.A.R.T协议的磁盘,通过S.M.A.R.T协议,并使用磁盘检测工具,赋以刚刚获取到的参数,获取到相应磁盘的S.M.A.R.T信息,将数据进行分析整合处理,并返回结果;
若磁盘不支持S.M.A.R.T协议,则在监控系统中添加性能相关的监控;
(5).数据分析与整合:将得到的磁盘信息提取所需要的数据,进行分析和整合;
(6).返回上层,对接上层的监控系统。
作为本发明进一步的方案:步骤2中若未使用磁盘阵列卡,则直接使用工具查看其磁盘信息。
作为本发明进一步的方案:步骤3中磁盘阵列卡管理工具包括:Megacli、Hpssacli和Adaptec阵列卡软件。
作为本发明进一步的方案:步骤4中,所述监控从监控系统中获取性能监控数据,判断性能是否下降,若性能下降到一定阀值,或者性能下降幅度超过一定阀值,则进行SSD磁盘寿命低报警。
作为本发明进一步的方案:所述监控系统为Nagios监控系统或Zabbix监控系统。
与现有技术相比,本发明的有益效果是:
(1)兼容多品牌服务器并兼容多品牌的SSD磁盘数据采集;同时,实现可对多服务器、多SSD磁盘并行采集,这将大大降低人力资源,简化操作流程,提高运维效率;
(2)、完成对各个阵列卡工具进行整合,扩大应用多种场景;
(3)、对于不支持S.M.A.R.T协议的磁盘,利用监控中的性能数据,检测其性能波动,以及,进行分析与报警;
(4)、对于分析、处理所得数据,自动报关多种监控平台并智能报警;有效防患SSD磁盘故障与低寿命磁盘事件及次生事故。
附图说明
图1为本发明的流程示意图。
图2为本发明的原理框图。
图3为本发明中监控系统性能数据分析的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1~2,本发明实施例中,多品牌服务器上SSD磁盘寿命的批量统计与监控方法,包括以下步骤:
1. 判断磁盘是否支持S.M.A.R.T协议,对于支持S.M.A.R.T协议的磁盘,在服务器上使用lspci判断是否使用磁盘阵列卡;
2. 若未使用磁盘阵列卡,则为裸盘,可直接使用工具查看其磁盘信息;若使用磁盘阵列卡,则需要判断阵列卡型号;
3.不同型号的阵列卡带来的磁盘阵列卡管理工具主要有三个:Megacli, Hpssacli,Adaptec,通过各自的磁盘阵列卡管理工具需要获取到各自不同的管理参数;
4.对于支持S.M.A.R.T协议的磁盘,通过S.M.A.R.T协议,并使用smartctl工具,赋以刚刚获取到的参数,从而获取到相应磁盘的S.M.A.R.T信息,单块磁盘S.M.A.R.T.信息包含了很多数据,包括磁盘使用时间、磁盘错误计数等信息,将数据进行分析整合处理,并返回结果;
如图3,若磁盘不支持S.M.A.R.T协议,则在监控系统中添加性能相关的监控系统;从监控系统中获取性能监控数据,判断性能是否下降,若性能下降到一定阀值,或者性能下降幅度超过一定阀值,判断为磁盘寿命损耗高,则进行SSD磁盘寿命低报警;
5.数据分析与整合:将得到的磁盘信息提取所需要的数据,进行分析和整合;
6.返回上层,对接上层的监控系统(Nagios\Zabbix)。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (5)

1.多品牌服务器上SSD磁盘寿命的批量统计与监控方法,其特征在于:包括以下步骤:
(1).判断磁盘是否支持S.M.A.R.T协议,对于支持S.M.A.R.T协议的磁盘,在服务器上使用lspci判断是否使用磁盘阵列卡;
(2). 若使用磁盘阵列卡,则判断阵列卡型号;
(3).通过各自的磁盘阵列卡管理工具需要获取到各阵列卡的管理参数;
(4).对于支持S.M.A.R.T协议的磁盘,通过S.M.A.R.T协议,并使用磁盘检测工具,赋以刚刚获取到的参数,获取到相应磁盘的S.M.A.R.T信息,将数据进行分析整合处理,并返回结果;若磁盘不支持S.M.A.R.T协议,则在监控系统中添加性能相关的监控;
(5).数据分析与整合:将得到的磁盘信息提取所需要的数据,进行分析和整合;
(6).返回上层,对接上层的监控系统。
2.根据权利要求1所述的多品牌服务器上SSD磁盘寿命的批量统计与监控方法,其特征在于:步骤2中若磁盘未使用磁盘阵列卡,则直接使用工具查看其磁盘信息。
3.根据权利要求1所述的多品牌服务器上SSD磁盘寿命的批量统计与监控方法,其特征在于:步骤3中磁盘阵列卡管理工具包括:Megacli、 Hpssacli和Adaptec阵列卡软件。
4.根据权利要求1所述的多品牌服务器上SSD磁盘寿命的批量统计与监控方法,其特征在于:步骤4中,所述监控从监控系统中获取性能监控数据,判断性能是否下降,若性能下降到一定阀值,或者性能下降幅度超过一定阀值,则进行SSD磁盘寿命低报警。
5.根据权利要求1所述的多品牌服务器上SSD磁盘寿命的批量统计与监控方法,其特征在于:所述监控系统为Nagios监控系统或Zabbix监控系统。
CN201910071473.3A 2019-01-25 2019-01-25 多品牌服务器上ssd磁盘寿命的批量统计与监控方法 Pending CN109885465A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910071473.3A CN109885465A (zh) 2019-01-25 2019-01-25 多品牌服务器上ssd磁盘寿命的批量统计与监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910071473.3A CN109885465A (zh) 2019-01-25 2019-01-25 多品牌服务器上ssd磁盘寿命的批量统计与监控方法

Publications (1)

Publication Number Publication Date
CN109885465A true CN109885465A (zh) 2019-06-14

Family

ID=66926866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910071473.3A Pending CN109885465A (zh) 2019-01-25 2019-01-25 多品牌服务器上ssd磁盘寿命的批量统计与监控方法

Country Status (1)

Country Link
CN (1) CN109885465A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722179A (zh) * 2021-08-13 2021-11-30 浪潮电子信息产业股份有限公司 一种磁盘健康状态监测方法、系统及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080052459A1 (en) * 2006-08-25 2008-02-28 Icreate Technologies Corporation Redundant array of independent disks system
CN105183388A (zh) * 2015-09-14 2015-12-23 北京华青融天技术有限责任公司 一种硬盘物理序列号的获取方法、装置以及系统
CN105955875A (zh) * 2016-05-04 2016-09-21 浪潮电子信息产业股份有限公司 一种监控raid卡日志的装置和方法
CN106708585A (zh) * 2017-01-03 2017-05-24 郑州云海信息技术有限公司 一种Linux系统下通过RAID卡抓取硬盘SMART日志的方法及系统
CN109164987A (zh) * 2018-08-29 2019-01-08 郑州云海信息技术有限公司 一种磁盘阵列卡的控制方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080052459A1 (en) * 2006-08-25 2008-02-28 Icreate Technologies Corporation Redundant array of independent disks system
CN105183388A (zh) * 2015-09-14 2015-12-23 北京华青融天技术有限责任公司 一种硬盘物理序列号的获取方法、装置以及系统
CN105955875A (zh) * 2016-05-04 2016-09-21 浪潮电子信息产业股份有限公司 一种监控raid卡日志的装置和方法
CN106708585A (zh) * 2017-01-03 2017-05-24 郑州云海信息技术有限公司 一种Linux系统下通过RAID卡抓取硬盘SMART日志的方法及系统
CN109164987A (zh) * 2018-08-29 2019-01-08 郑州云海信息技术有限公司 一种磁盘阵列卡的控制方法、装置及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722179A (zh) * 2021-08-13 2021-11-30 浪潮电子信息产业股份有限公司 一种磁盘健康状态监测方法、系统及装置
CN113722179B (zh) * 2021-08-13 2024-02-13 浪潮电子信息产业股份有限公司 一种磁盘健康状态监测方法、系统及装置

Similar Documents

Publication Publication Date Title
CN109067610B (zh) 一种监控方法和装置
CN103578568B (zh) 固态硬盘的性能测试方法及装置
CN111178760B (zh) 风险监测方法、装置、终端设备及计算机可读存储介质
US9817742B2 (en) Detecting hardware and software problems in remote systems
CN107810500A (zh) 数据质量分析
CN109359007B (zh) 错误日志的处理方法、系统、电子设备和存储介质
CN104346574A (zh) 基于配置规范的主机安全配置漏洞自动修复方法及系统
CN110333995A (zh) 对工业设备运行状态进行监测的方法及装置
CN109241014B (zh) 数据处理方法、装置和服务器
CN107577545A (zh) 一种故障磁盘检测与修复方法和装置
CN105116870A (zh) 空调机组的故障分析方法、装置和系统
CN115033463B (zh) 一种系统异常类型确定方法、装置、设备和存储介质
US9384044B2 (en) Intelligent inclusion/exclusion automation
CN111598410A (zh) 产品抽检方法及装置、计算机可读介质及终端设备
CN109885465A (zh) 多品牌服务器上ssd磁盘寿命的批量统计与监控方法
CN112214373B (zh) 硬件监控方法、装置及电子设备
CN106021046A (zh) 一种对比硬盘性能的方法、装置和服务器
CN111654405B (zh) 通信链路的故障节点方法、装置、设备及存储介质
CN110535972B (zh) 一种平台化的燃气检测设备集中管控及通信系统,设备及可读存储介质
CN111176950A (zh) 一种监控服务器集群的网卡的方法和设备
CN116955071A (zh) 故障分类方法、装置、设备及存储介质
CN115687406A (zh) 一种调用链数据的采样方法、装置、设备及存储介质
CN116069618A (zh) 一种面向应用场景的国产化系统评估方法
CN115437663A (zh) 升级策略更新方法及装置、电子设备、存储介质和车辆
CN108199979A (zh) 流量处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190614