CN102521090B - 一种jbod上硬盘应用故障的定位方法 - Google Patents
一种jbod上硬盘应用故障的定位方法 Download PDFInfo
- Publication number
- CN102521090B CN102521090B CN201110386833.2A CN201110386833A CN102521090B CN 102521090 B CN102521090 B CN 102521090B CN 201110386833 A CN201110386833 A CN 201110386833A CN 102521090 B CN102521090 B CN 102521090B
- Authority
- CN
- China
- Prior art keywords
- hard disk
- fault
- jbod
- judgment
- link
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本发明公开了一种JBOD上硬盘应用故障的定位方法,属于计算机领域技术,包括JBOD、连接线缆、控制器板、硬盘中板及硬盘,通过对连接线缆、控制器板、硬盘中板及硬盘部件的更换与调试,来对JBOD上硬盘应用故障的定位;分为链路故障判定和部件故障判定;链路故障判定为:通过连接线缆的调换,来确认故障链路;故障部件判定是在链路故障判定的基础上,针对控制器板、硬盘中板及硬盘可疑部件,进行交换筛选,最终确定JBOD上硬盘应用故障所在。本发明的一种JBOD上硬盘应用故障的定位方法和现有技术相比,具有效率高、广泛的通用性、简单易行等特点。
Description
技术领域
本发明涉及一种计算机领域技术,具体地说是一种JBOD上硬盘应用故障的定位方法。
背景技术
随着计算机应用和网络技术的飞速发展,用户对存储系统的扩容是在所难免的。与此同时,JBOD在存储扩容中的应用数量也是越来越多。
JBOD是存储领域中一类重要的存储设备。 JBOD,英文Just a Bunch Of Disks的缩写,意思为:磁盘簇。是在一个底板上安装的带有多个磁盘驱动器的存储设备。通常又称为Span。 和RAID阵列不同,JBOD没有前端逻辑来管理磁盘上的数据分布,相反,每个磁盘进行单独寻址,作为分开的存储资源,或者基于主机软件的一部分,或者是RAID组的一个适配器卡。
而JBOD上经常会出现硬盘不能正常识别、RAID创建及使用异常等问题。
发明内容
本发明的技术任务是提供一种效率高、具有广泛的通用性、简单易行的一种JBOD上硬盘应用故障的定位方法。
本发明的技术任务是按以下方式实现的,包括JBOD、连接线缆、控制器板、硬盘中板及硬盘,连接线缆是JBOD对上一级产品的上联线缆,是上下级信息及数据传输的载体,控制器板是JBOD上负责硬盘识别及数据传输的控制器单元,硬盘中板是负责硬盘和控制器板两者之间信息传输的连接设备;通过对连接线缆、控制器板、硬盘中板及硬盘部件的更换与调试,来对JBOD上硬盘应用故障的定位;分为链路故障判定和部件故障判定;链路故障判定为:通过连接线缆的调换,来确认故障链路;故障部件判定是在链路故障判定的基础上,针对控制器板、硬盘中板及硬盘可疑部件,进行交换筛选,最终确定JBOD上硬盘应用故障所在。
所述的链路故障判定,对应双控及多控存储JBOD产品时,首先通过连接线缆的调换,来确认故障连接线缆;对应单控JBOD产品时,此步骤主要判定JBOD和存储系统主柜连接线缆问题。
所述的双控JBOD中,双控JBOD为最后一级,且链路通道为A、B两侧,主柜或上级JBOD分别通过连接线缆LA、连接线缆LB连接,链路故障判定具体步骤为:若连接线缆的调换前,B侧上显示故障信息,则将连接线缆LA和连接线缆LB交叉调换,出现两种可能情况,B侧上显示故障信息或者A侧上显示故障信息,若B侧上显示故障信息,即考虑JBOD的B侧上部件存在问题;若A侧上显示故障信息,即可以考虑连接线缆LB存在问题。
所述的部件故障判定具体步骤为:部件故障判定开始;显示故障槽位硬盘和其他正常槽位硬盘互换位置;继续测试;故障是否随硬盘移动,若故障是随硬盘移动,则更换新硬盘、继续测试、问题解决则故障部件定位成功;若故障不是随硬盘移动,则看故障是否随槽位移动;若故障是随槽位移动,则更换硬盘中板、继续测试、问题解决则故障部件定位成功;若故障不是随槽位移动,则更换控制器板、继续测试、问题解决则故障部件定位成功。
本发明的一种JBOD上硬盘应用故障的定位方法,结合了服务器和存储检测两方面的使用,并按照链路、部件等具体分析,最终定位问题所在:链路的评定(主要针对双控及多控),定位到具体的控制链路通道;故障链路上,进行部件替换及转移,最终确认故障部件,解决问题。在从链路到部件类别的诊断方法,从大处入手,逐渐缩小定位范围,最终确认问题所在。在此基础上,各个步骤是可以交叉进行,相互之间没有必然顺序,既在认为需要情况下进行自由组合求证。
本发明的一种JBOD上硬盘应用故障的定位方法具有以下优点:
(1)高效性:此JBOD上硬盘应用故障的定位方法,从链路测试到部件诊断,故障范围定位由大到小,可以快速查找问题,具有效率高的特点。
(2)通用性:此JBOD上硬盘应用故障的定位方法,具有广泛的通用性,可以方便地推广到其他存储乃至服务器系统中。
(3)易用性:此JBOD上硬盘应用故障的定位方法,简单易行,无需太多专业知识。
附图说明
下面结合附图对本发明进一步说明。
附图1为一种JBOD上硬盘应用故障的定位方法的链路故障判定的示意框图;
附图2为一种JBOD上硬盘应用故障的定位方法的部件故障判定的步骤流程图。
具体实施方式
参照说明书附图和具体实施例对本发明的一种JBOD上硬盘应用故障的定位方法作以下详细地说明。
实施例:
本发明的一种JBOD上硬盘应用故障的定位方法,包括JBOD、连接线缆、控制器板、硬盘中板及硬盘,连接线缆是JBOD对上一级产品的上联线缆,是上下级信息及数据传输的载体,控制器板是JBOD上负责硬盘识别及数据传输的控制器单元,硬盘中板是负责硬盘和控制器板两者之间信息传输的连接设备;通过对连接线缆、控制器板、硬盘中板及硬盘部件的更换与调试,来对JBOD上硬盘应用故障的定位;分为链路故障判定和部件故障判定;链路故障判定为:通过连接线缆的调换,来确认故障链路;故障部件判定是在链路故障判定的基础上,针对控制器板、硬盘中板及硬盘可疑部件,进行交换筛选,最终确定JBOD上硬盘应用故障所在。
链路故障判定,对应双控及多控存储JBOD产品时,首先通过连接线缆的调换,来确认故障连接线缆;对应单控JBOD产品时,此步骤主要判定JBOD和存储系统主柜连接线缆问题。
如图1所示,双控JBOD中,双控JBOD为最后一级,且链路通道为A、B两侧,主柜或上级JBOD分别通过连接线缆LA、连接线缆LB连接,链路故障判定具体步骤为:若连接线缆的调换前,B侧上显示故障信息,则将连接线缆LA和连接线缆LB交叉调换,出现两种可能情况,可能状态1:B侧上显示故障信息或者可能状态2:A侧上显示故障信息,若B侧上显示故障信息,即考虑JBOD的B侧上部件存在问题;若A侧上显示故障信息,即可以考虑连接线缆LB存在问题。
如图2所示,部件故障判定具体步骤为:部件故障判定开始;显示故障槽位硬盘和其他正常槽位硬盘互换位置;继续测试;故障是否随硬盘移动,若故障是随硬盘移动,则更换新硬盘、继续测试、问题解决则故障部件定位成功;若故障不是随硬盘移动,则看故障是否随槽位移动;若故障是随槽位移动,则更换硬盘中板、继续测试、问题解决则故障部件定位成功;若故障不是随槽位移动,则更换控制器板、继续测试、问题解决则故障部件定位成功。
本发明除说明书所述的技术特征外,均为本专业技术人员的已知技术。
Claims (4)
1.一种JBOD上硬盘应用故障的定位方法,所涉及到的硬件包括JBOD、连接线缆、控制器板、硬盘中板及硬盘,连接线缆是JBOD对上一级产品的上联线缆,控制器板是JBOD上负责硬盘识别及数据传输的控制器单元,硬盘中板是负责硬盘和控制器板两者之间信息传输的连接设备;其特征在于通过对连接线缆、控制器板、硬盘中板及硬盘部件的更换与调试,来对JBOD上硬盘应用故障的定位;分为链路故障判定和部件故障判定;链路故障判定为:通过连接线缆的调换,来确认故障链路;故障部件判定是在链路故障判定的基础上,针对控制器板、硬盘中板及硬盘可疑部件,进行交换筛选,最终确定JBOD上硬盘应用故障所在。
2.根据权利要求1所述的一种JBOD上硬盘应用故障的定位方法,其特征在于链路故障判定,对应双控及多控存储JBOD产品时,首先通过连接线缆的调换,来确认故障连接线缆;对应单控JBOD产品时,此步骤主要判定JBOD和存储系统主柜连接线缆问题。
3.根据权利要求1或2所述的一种JBOD上硬盘应用故障的定位方法,其特征在于双控JBOD中,双控JBOD为最后一级,且链路通道为A、B两侧,主柜或上级JBOD分别通过连接线缆LA、连接线缆LB连接,链路故障判定具体步骤为:若连接线缆的调换前,B侧上显示故障信息,则将连接线缆LA和连接线缆LB交叉调换,出现两种可能情况,B侧上显示故障信息或者A侧上显示故障信息,若B侧上显示故障信息,即考虑JBOD的B侧上部件存在问题;若A侧上显示故障信息,即考虑连接线缆LB存在问题。
4.根据权利要求1所述的一种JBOD上硬盘应用故障的定位方法,其特征在于部件故障判定具体步骤为:部件故障判定开始;显示故障槽位硬盘和其他正常槽位硬盘互换位置;继续测试;故障是否随硬盘移动,若故障是随硬盘移动,则更换新硬盘、继续测试、问题解决则故障部件定位成功;若故障不是随硬盘移动,则看故障是否随槽位移动;若故障是随槽位移动,则更换硬盘中板、继续测试、问题解决则故障部件定位成功;若故障不是随槽位移动,则更换控制器板、继续测试、问题解决则故障部件定位成功。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110386833.2A CN102521090B (zh) | 2011-11-29 | 2011-11-29 | 一种jbod上硬盘应用故障的定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110386833.2A CN102521090B (zh) | 2011-11-29 | 2011-11-29 | 一种jbod上硬盘应用故障的定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102521090A CN102521090A (zh) | 2012-06-27 |
CN102521090B true CN102521090B (zh) | 2014-02-19 |
Family
ID=46292023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110386833.2A Active CN102521090B (zh) | 2011-11-29 | 2011-11-29 | 一种jbod上硬盘应用故障的定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102521090B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105468484B (zh) * | 2014-09-30 | 2020-07-28 | 伊姆西Ip控股有限责任公司 | 用于在存储系统中确定故障位置的方法和装置 |
CN106021048A (zh) * | 2016-05-17 | 2016-10-12 | 浪潮电子信息产业股份有限公司 | 一种磁盘组乱序验证的方法及装置 |
CN106201795A (zh) * | 2016-07-07 | 2016-12-07 | 浪潮电子信息产业股份有限公司 | 一种快速检测数据存储链路稳定性的方法 |
CN106648949B (zh) * | 2016-12-28 | 2019-08-02 | 郑州云海信息技术有限公司 | 一种存储系统及数据传输方法 |
CN107577580A (zh) * | 2017-09-18 | 2018-01-12 | 郑州云海信息技术有限公司 | 一种机箱管理系统及方法 |
CN107807862A (zh) * | 2017-09-29 | 2018-03-16 | 曙光信息产业(北京)有限公司 | 检测硬盘故障点的方法、装置及服务器 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101256429A (zh) * | 2008-03-05 | 2008-09-03 | 浪潮电子信息产业股份有限公司 | 一种低成本的jbod |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5383192A (en) * | 1992-12-23 | 1995-01-17 | Intel Corporation | Minimizing the likelihood of slip between the instant a candidate for a break event is generated and the instant a microprocessor is instructed to perform a break, without missing breakpoints |
DE4418231C2 (de) * | 1994-05-25 | 1997-02-27 | Siemens Ag | Modular strukturierter Service-Personalcomputer |
-
2011
- 2011-11-29 CN CN201110386833.2A patent/CN102521090B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101256429A (zh) * | 2008-03-05 | 2008-09-03 | 浪潮电子信息产业股份有限公司 | 一种低成本的jbod |
Also Published As
Publication number | Publication date |
---|---|
CN102521090A (zh) | 2012-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8204980B1 (en) | Storage array network path impact analysis server for path selection in a host-based I/O multi-path system | |
CN102521090B (zh) | 一种jbod上硬盘应用故障的定位方法 | |
US7111084B2 (en) | Data storage network with host transparent failover controlled by host bus adapter | |
US6904544B2 (en) | Method, system, program, and data structures for testing a network system including input/output devices | |
US20070101199A1 (en) | Disk array device and failure response verification method thereof | |
TWI409624B (zh) | 自磁碟陣列隔離一驅動器以進行診斷操作 | |
JP4886601B2 (ja) | Usbインタフェース設備に対して操作を行う装置及び方法 | |
CN105183600A (zh) | 一种远程定位硬盘故障的装置和方法 | |
US20140258790A1 (en) | Communication failure source isolation in a distributed computing system | |
US9286151B2 (en) | Computerised storage system comprising replaceable units for managing testing of replacement units | |
CN105975357B (zh) | 一种定位故障的方法和系统 | |
US8347142B2 (en) | Non-disruptive I/O adapter diagnostic testing | |
CN106936616A (zh) | 备份通信方法和装置 | |
GB2395578A (en) | Fault tracing in systems with virtualization layers | |
JP2013117922A (ja) | ディスクシステム、データ保持装置、及びディスクデバイス | |
US20070028041A1 (en) | Extended failure analysis in RAID environments | |
CN102819480A (zh) | 一种监控计算机存储器的方法和计算机 | |
US7451354B2 (en) | Apparatus and method to configure, format, and test, a data storage subsystem product | |
US8381027B1 (en) | Determining alternate paths in faulted systems | |
US10915405B2 (en) | Methods for handling storage element failures to reduce storage device failure rates and devices thereof | |
CN101930393B (zh) | Sas背板的测试装置 | |
TW201423387A (zh) | Sas擴展卡測試系統及方法 | |
CN105005515B (zh) | 一种LAN‑free备份系统 | |
US20140025886A1 (en) | Disk array system and connection method | |
US8429462B2 (en) | Storage system and method for automatic restoration upon loop anomaly |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |