CN105511979A - 一种Windows下监控Intel SATA HostRaid硬盘变化的工具 - Google Patents

一种Windows下监控Intel SATA HostRaid硬盘变化的工具 Download PDF

Info

Publication number
CN105511979A
CN105511979A CN201510912096.3A CN201510912096A CN105511979A CN 105511979 A CN105511979 A CN 105511979A CN 201510912096 A CN201510912096 A CN 201510912096A CN 105511979 A CN105511979 A CN 105511979A
Authority
CN
China
Prior art keywords
hard disk
bat
script
monitoring
windows
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510912096.3A
Other languages
English (en)
Inventor
侯杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201510912096.3A priority Critical patent/CN105511979A/zh
Publication of CN105511979A publication Critical patent/CN105511979A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种Windows下监控Intel?SATA?HostRaid硬盘变化的工具,涉及硬盘故障处理技术领域。本发明包括:(1)Windows操作系统(2)Intel?SATA?HostRaid控制器;(3)SATA接口硬盘;(4)主监控脚本;(5)硬盘smart信息监控脚本;(6)服务器传感器监控脚本。针对Windows操作系统的工具来记录硬盘及服务器的状态变化,进而可以确定故障发生的准确时间,查看故障前的硬件变化,以帮助定位发生故障的原因。

Description

一种Windows下监控Intel SATA HostRaid硬盘变化的工具
技术领域
本发明涉及硬盘故障处理技术,尤其涉及一种Windows下监控IntelSATAHostRaid硬盘变化的工具。
背景技术
Raid技术因其对数据安全性的提高广泛应用于服务器和存储领域,外插raid卡因造价较高导致服务器本身的成本太高,因而廉价的板载raid解决方案被很多服务器厂商采用,进而广泛应用于低端服务器产品,其中IntelSATAHostRaid所占比例远远高于其他板载raid,且IntelSATAHostRaid大多应用于Windows操作系统。IntelSATAHostRaid廉价方便的同时也带来了显著的问题,因控制器没有日志系统,无法记录硬盘变化,且raid集成在主板上,受外界影响比较大,进而经常出现意外掉盘的情况。针对大多数的掉盘情况因无法获取发生故障之前的各部件的运行状态,不能准确定位故障原因。
发明内容
针对Intel板载SATA控制器经常出现的硬盘掉线问题,本发明提出了一种Windows下监控IntelSATAHostRaid硬盘变化的工具来记录硬盘及服务器的状态变化,进而可以确定故障发生的准确时间,查看故障前的硬件变化,以帮助定位发生故障的原因。
本发明的技术方案是:
一种Windows下监控IntelSATAHostRaid硬盘变化的工具,包括:(1)Windows操作系统(2)IntelSATAHostRaid控制器;(3)SATA接口硬盘;(4)主监控脚本;(5)硬盘smart信息监控脚本;(6)服务器传感器监控脚本;
(1)Windows操作系统:即该工具的使用环境为Windows;
(2)IntelSATAHostRaid控制器:即服务器主板集成的Intelraid控制器;
(3)SATA接口硬盘:硬盘通过SATA线缆连接板载IntelSATAHostRaid控制器;
(4)主监控脚本:设置监控时间间隔,调用其它脚本以读取传感器信息;
(5)硬盘smart信息监控脚本:该脚本实时读取smart信息,存档同时记录读取smart信息的时间,且通过smart信息判断目前硬盘状态是否正常,读取及存档时间间隔可调;
(6)服务器传感器监控脚本:该脚本实时读取服务器本身的功率、电压、温度等传感器变化,并将信息存档且记录存档时间,读取及存档时间间隔可调。
其中,
主监控脚本:设置监控时间间隔,调用其他脚本以读取传感器信息。
for/l%%iin(1,0,10)do(
if%1==1(
callsda.bat
)else(if%1==2(
callsda.bat
callsdb.bat
)else(if%1==3(
callsda.bat
callsdb.bat
callsdc.bat
)else(
callsda.bat
callsdb.bat
callsdc.bat
callsdd.bat)))
callsdr.bat
timeout/t3/nobreak>null)
说明:通过调整该命令的时间间隔来确定多长时间收集一次
硬盘smart信息监控脚本:监控硬盘smart信息并将其存入日志
echo%date%%time%>>sda.log
smartctl.exe-son-data/dev/sda>null
smartctl.exe-H-data/dev/sda>>sda.log
smartctl.exe-A/dev/sda>>sda.log
服务器传感器监控脚本:监控服务器传感器状态并将其存入日志
echo%date%%time%>>sdr.log
echooff
if%PROCESSOR_ARCHITECTURE%==x86(setdriver_path=imbdriver32)elsesetdriver_path=imbdriver64
cd%driver_path%
callinstall.cmd
cd..\ipmitool
ipmitoolsdr>>..\sdr.log
cd..
本发明可以实时监控硬盘状态变化,同时记录服务器其他传感器信息。
本发明通过Windows脚本执行,监控时间间隔可手动调节,使用时执行脚本并输入硬盘数量即可,方便易用。出现故障后通过日志可以清晰的定位发生故障的时间段及硬盘状态变化和传感器信息变化,进而定位引起硬盘故障的原因并进行排查。
附图说明
图1是本发明的系统流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明做进一步地详细描述。
本工具通过实时监控硬盘状态及环境变化记录硬盘使用中最近一段时间各传感器的值,当硬盘掉线时,可以通过查看掉线前最近一段时间的传感器变化及硬盘本身的传感器信息确定引起硬盘掉线的原因。
操作方式为:
1.将该工具复制至Windows操作系统下,并根据需要调整主监控脚本中传感器信息收集时间间隔。
2.在命令提示符界面找到脚本所处位置,执行脚本jiankong.bat“硬盘块数”,此时脚本会自动运行。
3.保持命令提示符界面一直运行,需要结束脚本运行时按下ctrl+c键,输入y停止脚本运行,之前收集的日志文件保存在对应的磁盘信息日志如sda.bat和服务器传感器信息日志sdr.bat中。
4.运行结果分析。脚本运行后会产生磁盘信息日志和服务器传感器信息日志,磁盘信息日志如下:
2015/11/25周三13:26:58.47
smartctl6.42015-06-04r4109[x86_64-w64-mingw32-win7](sf-6.4-1)
Copyright(C)2002-15,BruceAllen,ChristianFranke,www.smartmontools.org
Warning:Limitedfunctionalityduetomissingadminrights
Warning!SMARTAttributeDataStructureerror:invalidSMARTchecksum.
ReadSMARTThresholdsfailed:Functionnotimplemented
===STARTOFREADSMARTDATASECTION===
SMARToverall-healthself-assessmenttestresult:PASSED
smartctl6.42015-06-04r4109[x86_64-w64-mingw32-win7](sf-6.4-1)
Copyright(C)2002-15,BruceAllen,ChristianFranke,www.smartmontools.org
Warning:Limitedfunctionalityduetomissingadminrights
Warning!SMARTAttributeDataStructureerror:invalidSMARTchecksum.
ReadSMARTThresholdsfailed:Functionnotimplemented
===STARTOFREADSMARTDATASECTION===
SMARTAttributesDataStructurerevisionnumber:0
VendorSpecificSMARTAttributeswithThresholds:
在磁盘信息日志中可以看到日志产生的时间,当前硬盘状态是否通过检测以及当前硬盘的smart信息,当发生意外掉盘时可以通过查看硬盘掉线前的状态变化,确定掉盘原因。同时借助服务器传感器日志所记录的服务器传感器的变化辅助定位是否因温度电压变化等导致硬盘掉线。服务器传感器日志如下:
2015/11/26周四15:57:42.51
CPU0BelowTmax|75degreesC|ok
CPU1BelowTmax|73degreesC|ok
PCIArea(RT3)|45degreesC|ok
DIMM0Area(RT4)|26degreesC|ok
CPU0VCORE|0.93Volts|ok
CPU1VCORE|0.93Volts|ok
5V|4.85Volts|ok
+12V|11.71Volts|ok
VBAT|2.93Volts|ok
3.3V|3.26Volts|ok
FAN0|5400RPM|ok
FAN1|5400RPM|ok
FAN2|4950RPM|ok
FAN3|noreading|ns
FAN4|5490RPM|ok
FAN5|5400RPM|ok
PMbusPower1|noreading|ns
PMBusPower2|noreading|ns

Claims (4)

1.一种Windows下监控IntelSATAHostRaid硬盘变化的工具,其特征在于,包括:(1)Windows操作系统(2)IntelSATAHostRaid控制器;(3)SATA接口硬盘;(4)主监控脚本;(5)硬盘smart信息监控脚本;(6)服务器传感器监控脚本;
(1)Windows操作系统:即该工具的使用环境为Windows;
(2)IntelSATAHostRaid控制器:即服务器主板集成的Intelraid控制器;
(3)SATA接口硬盘:硬盘通过SATA线缆连接板载IntelSATAHostRaid控制器;
(4)主监控脚本:设置监控时间间隔,调用其它脚本以读取传感器信息;
(5)硬盘smart信息监控脚本:该脚本实时读取smart信息,存档同时记录读取smart信息的时间,且通过smart信息判断目前硬盘状态是否正常,读取及存档时间间隔可调;
(6)服务器传感器监控脚本:该脚本实时读取服务器本身的功率、电压、温度等传感器变化,并将信息存档且记录存档时间,读取及存档时间间隔可调。
2.根据权利要求1所述的工具,其特征在于,
主监控脚本:
for/l%%iin(1,0,10)do(
if%1==1(
callsda.bat
)else(if%1==2(
callsda.bat
callsdb.bat
)else(if%1==3(
callsda.bat
callsdb.bat
callsdc.bat
)else(
callsda.bat
callsdb.bat
callsdc.bat
callsdd.bat)))
callsdr.bat
timeout/t3/nobreak>null)
通过调整该命令的时间间隔来确定多长时间收集一次。
3.根据权利要求1所述的工具,其特征在于,
硬盘监控脚本:
echo%date%%time%>>sda.log
smartctl.exe-son-data/dev/sda>null
smartctl.exe-H-data/dev/sda>>sda.log
smartctl.exe-A/dev/sda>>sda.log。
4.根据权利要求1所述的工具,其特征在于,
服务器传感器脚本:
echo%date%%time%>>sdr.log
echooff
if%PROCESSOR_ARCHITECTURE%==x86(setdriver_path=imbdriver32)elsesetdriver_path=imbdriver64
cd%driver_path%
callinstall.cmd
cd..\ipmitool
ipmitoolsdr>>..\sdr.log
cd..。
CN201510912096.3A 2015-12-11 2015-12-11 一种Windows下监控Intel SATA HostRaid硬盘变化的工具 Pending CN105511979A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510912096.3A CN105511979A (zh) 2015-12-11 2015-12-11 一种Windows下监控Intel SATA HostRaid硬盘变化的工具

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510912096.3A CN105511979A (zh) 2015-12-11 2015-12-11 一种Windows下监控Intel SATA HostRaid硬盘变化的工具

Publications (1)

Publication Number Publication Date
CN105511979A true CN105511979A (zh) 2016-04-20

Family

ID=55719982

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510912096.3A Pending CN105511979A (zh) 2015-12-11 2015-12-11 一种Windows下监控Intel SATA HostRaid硬盘变化的工具

Country Status (1)

Country Link
CN (1) CN105511979A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095647A (zh) * 2016-06-29 2016-11-09 浪潮电子信息产业股份有限公司 一种实时监控希捷硬盘电压的方法
CN106802857A (zh) * 2017-01-11 2017-06-06 郑州云海信息技术有限公司 一种用于解析希捷硬盘smart日志的方法
CN109460340A (zh) * 2018-10-22 2019-03-12 重庆电子工程职业学院 计算机硬件监控方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1716428A (zh) * 2004-07-01 2006-01-04 华为技术有限公司 硬盘检测装置及方法
US20060041595A1 (en) * 2004-08-19 2006-02-23 Hitachi, Ltd. Storage network migration method, management device, management program and storage network system
CN1896963A (zh) * 2005-07-11 2007-01-17 英业达股份有限公司 硬盘装置损坏监测方法及系统
CN101866271A (zh) * 2010-06-08 2010-10-20 华中科技大学 一种基于raid的安全预警系统和方法
CN102591591A (zh) * 2011-12-19 2012-07-18 杭州瑞网广通信息技术有限公司 磁盘检测系统、磁盘检测方法以及网络存储系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1716428A (zh) * 2004-07-01 2006-01-04 华为技术有限公司 硬盘检测装置及方法
US20060041595A1 (en) * 2004-08-19 2006-02-23 Hitachi, Ltd. Storage network migration method, management device, management program and storage network system
CN1896963A (zh) * 2005-07-11 2007-01-17 英业达股份有限公司 硬盘装置损坏监测方法及系统
CN101866271A (zh) * 2010-06-08 2010-10-20 华中科技大学 一种基于raid的安全预警系统和方法
CN102591591A (zh) * 2011-12-19 2012-07-18 杭州瑞网广通信息技术有限公司 磁盘检测系统、磁盘检测方法以及网络存储系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095647A (zh) * 2016-06-29 2016-11-09 浪潮电子信息产业股份有限公司 一种实时监控希捷硬盘电压的方法
CN106802857A (zh) * 2017-01-11 2017-06-06 郑州云海信息技术有限公司 一种用于解析希捷硬盘smart日志的方法
CN109460340A (zh) * 2018-10-22 2019-03-12 重庆电子工程职业学院 计算机硬件监控方法及装置

Similar Documents

Publication Publication Date Title
CN103207820B (zh) 基于raid卡日志的硬盘的故障定位方法及装置
CN105740110A (zh) 一种linux系统下硬盘smart信息的检测方法
US20130198574A1 (en) Autonomous event logging for drive failure analysis
CN106527646A (zh) 一种基于pmbus总线的主板电源管理方法
CN105511979A (zh) 一种Windows下监控Intel SATA HostRaid硬盘变化的工具
DE69934665T2 (de) Vorrichtung und verfahren zum gesicherten schreiben in einem plattencachespeicher für festplatten eines massenspeichersubsystems
CN103049345B (zh) 基于异步通信机制的磁盘状态变迁检测方法及装置
CN110457907A (zh) 一种固件程序检测方法和装置
CN101408790B (zh) 用于当运行在电池后备模式时检测器件移除的方法和系统
CN106802857A (zh) 一种用于解析希捷硬盘smart日志的方法
CN114758714A (zh) 一种硬盘故障预测方法、装置、电子设备及存储介质
DE112019005558T5 (de) Verwendung einer auf fehlerkorrektur basierenden metrik zur identifizierung schlecht funktionierender datenspeichervorrichtungen
CN111048138A (zh) 一种硬盘的故障检测方法及相关装置
CN102681928B (zh) 计算机系统的异常信息输出系统
US11537501B2 (en) Method and device for monitoring server based on recordings of data from sensors, and non-transitory storage medium
CN107807862A (zh) 检测硬盘故障点的方法、装置及服务器
US7861031B2 (en) Access control management
US8001425B2 (en) Preserving state information of a storage subsystem in response to communication loss to the storage subsystem
JP4087974B2 (ja) 設備障害管理装置および設備障害管理方法、ならびに記憶媒体
CN104750041A (zh) WinCE系统中的异常监控方法和系统
CN105893196A (zh) 一种服务器调试辅助工具及系统
CN113742166B (zh) 一种服务器系统器件日志记录方法、装置及系统
CN113624321B (zh) 一种基于振动监测的实时在线保护系统及方法
CN104346252A (zh) 监控芯片对于异常的感测数据的过滤方法
CN109491846B (zh) 一种用于服务器抓取SATA硬盘trace的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160420