CN102521090B - 一种jbod上硬盘应用故障的定位方法 - Google Patents

一种jbod上硬盘应用故障的定位方法 Download PDF

Info

Publication number
CN102521090B
CN102521090B CN201110386833.2A CN201110386833A CN102521090B CN 102521090 B CN102521090 B CN 102521090B CN 201110386833 A CN201110386833 A CN 201110386833A CN 102521090 B CN102521090 B CN 102521090B
Authority
CN
China
Prior art keywords
hard disk
fault
jbod
judgment
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110386833.2A
Other languages
English (en)
Other versions
CN102521090A (zh
Inventor
刘刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IEIT Systems Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201110386833.2A priority Critical patent/CN102521090B/zh
Publication of CN102521090A publication Critical patent/CN102521090A/zh
Application granted granted Critical
Publication of CN102521090B publication Critical patent/CN102521090B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了一种JBOD上硬盘应用故障的定位方法,属于计算机领域技术,包括JBOD、连接线缆、控制器板、硬盘中板及硬盘,通过对连接线缆、控制器板、硬盘中板及硬盘部件的更换与调试,来对JBOD上硬盘应用故障的定位;分为链路故障判定和部件故障判定;链路故障判定为:通过连接线缆的调换,来确认故障链路;故障部件判定是在链路故障判定的基础上,针对控制器板、硬盘中板及硬盘可疑部件,进行交换筛选,最终确定JBOD上硬盘应用故障所在。本发明的一种JBOD上硬盘应用故障的定位方法和现有技术相比,具有效率高、广泛的通用性、简单易行等特点。

Description

一种JBOD上硬盘应用故障的定位方法
技术领域
本发明涉及一种计算机领域技术,具体地说是一种JBOD上硬盘应用故障的定位方法。
背景技术
随着计算机应用和网络技术的飞速发展,用户对存储系统的扩容是在所难免的。与此同时,JBOD在存储扩容中的应用数量也是越来越多。
JBOD是存储领域中一类重要的存储设备。 JBOD,英文Just a Bunch Of Disks的缩写,意思为:磁盘簇。是在一个底板上安装的带有多个磁盘驱动器的存储设备。通常又称为Span。 和RAID阵列不同,JBOD没有前端逻辑来管理磁盘上的数据分布,相反,每个磁盘进行单独寻址,作为分开的存储资源,或者基于主机软件的一部分,或者是RAID组的一个适配器卡。
而JBOD上经常会出现硬盘不能正常识别、RAID创建及使用异常等问题。
发明内容  
  本发明的技术任务是提供一种效率高、具有广泛的通用性、简单易行的一种JBOD上硬盘应用故障的定位方法。
本发明的技术任务是按以下方式实现的,包括JBOD、连接线缆、控制器板、硬盘中板及硬盘,连接线缆是JBOD对上一级产品的上联线缆,是上下级信息及数据传输的载体,控制器板是JBOD上负责硬盘识别及数据传输的控制器单元,硬盘中板是负责硬盘和控制器板两者之间信息传输的连接设备;通过对连接线缆、控制器板、硬盘中板及硬盘部件的更换与调试,来对JBOD上硬盘应用故障的定位;分为链路故障判定和部件故障判定;链路故障判定为:通过连接线缆的调换,来确认故障链路;故障部件判定是在链路故障判定的基础上,针对控制器板、硬盘中板及硬盘可疑部件,进行交换筛选,最终确定JBOD上硬盘应用故障所在。
所述的链路故障判定,对应双控及多控存储JBOD产品时,首先通过连接线缆的调换,来确认故障连接线缆;对应单控JBOD产品时,此步骤主要判定JBOD和存储系统主柜连接线缆问题。
所述的双控JBOD中,双控JBOD为最后一级,且链路通道为A、B两侧,主柜或上级JBOD分别通过连接线缆LA、连接线缆LB连接,链路故障判定具体步骤为:若连接线缆的调换前,B侧上显示故障信息,则将连接线缆LA和连接线缆LB交叉调换,出现两种可能情况,B侧上显示故障信息或者A侧上显示故障信息,若B侧上显示故障信息,即考虑JBOD的B侧上部件存在问题;若A侧上显示故障信息,即可以考虑连接线缆LB存在问题。
所述的部件故障判定具体步骤为:部件故障判定开始;显示故障槽位硬盘和其他正常槽位硬盘互换位置;继续测试;故障是否随硬盘移动,若故障是随硬盘移动,则更换新硬盘、继续测试、问题解决则故障部件定位成功;若故障不是随硬盘移动,则看故障是否随槽位移动;若故障是随槽位移动,则更换硬盘中板、继续测试、问题解决则故障部件定位成功;若故障不是随槽位移动,则更换控制器板、继续测试、问题解决则故障部件定位成功。
本发明的一种JBOD上硬盘应用故障的定位方法,结合了服务器和存储检测两方面的使用,并按照链路、部件等具体分析,最终定位问题所在:链路的评定(主要针对双控及多控),定位到具体的控制链路通道;故障链路上,进行部件替换及转移,最终确认故障部件,解决问题。在从链路到部件类别的诊断方法,从大处入手,逐渐缩小定位范围,最终确认问题所在。在此基础上,各个步骤是可以交叉进行,相互之间没有必然顺序,既在认为需要情况下进行自由组合求证。
本发明的一种JBOD上硬盘应用故障的定位方法具有以下优点:
(1)高效性:此JBOD上硬盘应用故障的定位方法,从链路测试到部件诊断,故障范围定位由大到小,可以快速查找问题,具有效率高的特点。
(2)通用性:此JBOD上硬盘应用故障的定位方法,具有广泛的通用性,可以方便地推广到其他存储乃至服务器系统中。
(3)易用性:此JBOD上硬盘应用故障的定位方法,简单易行,无需太多专业知识。
附图说明
下面结合附图对本发明进一步说明。
附图1为一种JBOD上硬盘应用故障的定位方法的链路故障判定的示意框图;
  附图2为一种JBOD上硬盘应用故障的定位方法的部件故障判定的步骤流程图。
具体实施方式
参照说明书附图和具体实施例对本发明的一种JBOD上硬盘应用故障的定位方法作以下详细地说明。
实施例:
本发明的一种JBOD上硬盘应用故障的定位方法,包括JBOD、连接线缆、控制器板、硬盘中板及硬盘,连接线缆是JBOD对上一级产品的上联线缆,是上下级信息及数据传输的载体,控制器板是JBOD上负责硬盘识别及数据传输的控制器单元,硬盘中板是负责硬盘和控制器板两者之间信息传输的连接设备;通过对连接线缆、控制器板、硬盘中板及硬盘部件的更换与调试,来对JBOD上硬盘应用故障的定位;分为链路故障判定和部件故障判定;链路故障判定为:通过连接线缆的调换,来确认故障链路;故障部件判定是在链路故障判定的基础上,针对控制器板、硬盘中板及硬盘可疑部件,进行交换筛选,最终确定JBOD上硬盘应用故障所在。
链路故障判定,对应双控及多控存储JBOD产品时,首先通过连接线缆的调换,来确认故障连接线缆;对应单控JBOD产品时,此步骤主要判定JBOD和存储系统主柜连接线缆问题。
如图1所示,双控JBOD中,双控JBOD为最后一级,且链路通道为A、B两侧,主柜或上级JBOD分别通过连接线缆LA、连接线缆LB连接,链路故障判定具体步骤为:若连接线缆的调换前,B侧上显示故障信息,则将连接线缆LA和连接线缆LB交叉调换,出现两种可能情况,可能状态1:B侧上显示故障信息或者可能状态2:A侧上显示故障信息,若B侧上显示故障信息,即考虑JBOD的B侧上部件存在问题;若A侧上显示故障信息,即可以考虑连接线缆LB存在问题。
如图2所示,部件故障判定具体步骤为:部件故障判定开始;显示故障槽位硬盘和其他正常槽位硬盘互换位置;继续测试;故障是否随硬盘移动,若故障是随硬盘移动,则更换新硬盘、继续测试、问题解决则故障部件定位成功;若故障不是随硬盘移动,则看故障是否随槽位移动;若故障是随槽位移动,则更换硬盘中板、继续测试、问题解决则故障部件定位成功;若故障不是随槽位移动,则更换控制器板、继续测试、问题解决则故障部件定位成功。
本发明除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (4)

1.一种JBOD上硬盘应用故障的定位方法,所涉及到的硬件包括JBOD、连接线缆、控制器板、硬盘中板及硬盘,连接线缆是JBOD对上一级产品的上联线缆,控制器板是JBOD上负责硬盘识别及数据传输的控制器单元,硬盘中板是负责硬盘和控制器板两者之间信息传输的连接设备;其特征在于通过对连接线缆、控制器板、硬盘中板及硬盘部件的更换与调试,来对JBOD上硬盘应用故障的定位;分为链路故障判定和部件故障判定;链路故障判定为:通过连接线缆的调换,来确认故障链路;故障部件判定是在链路故障判定的基础上,针对控制器板、硬盘中板及硬盘可疑部件,进行交换筛选,最终确定JBOD上硬盘应用故障所在。
2.根据权利要求1所述的一种JBOD上硬盘应用故障的定位方法,其特征在于链路故障判定,对应双控及多控存储JBOD产品时,首先通过连接线缆的调换,来确认故障连接线缆;对应单控JBOD产品时,此步骤主要判定JBOD和存储系统主柜连接线缆问题。
3.根据权利要求1或2所述的一种JBOD上硬盘应用故障的定位方法,其特征在于双控JBOD中,双控JBOD为最后一级,且链路通道为A、B两侧,主柜或上级JBOD分别通过连接线缆LA、连接线缆LB连接,链路故障判定具体步骤为:若连接线缆的调换前,B侧上显示故障信息,则将连接线缆LA和连接线缆LB交叉调换,出现两种可能情况,B侧上显示故障信息或者A侧上显示故障信息,若B侧上显示故障信息,即考虑JBOD的B侧上部件存在问题;若A侧上显示故障信息,即考虑连接线缆LB存在问题。
4.根据权利要求1所述的一种JBOD上硬盘应用故障的定位方法,其特征在于部件故障判定具体步骤为:部件故障判定开始;显示故障槽位硬盘和其他正常槽位硬盘互换位置;继续测试;故障是否随硬盘移动,若故障是随硬盘移动,则更换新硬盘、继续测试、问题解决则故障部件定位成功;若故障不是随硬盘移动,则看故障是否随槽位移动;若故障是随槽位移动,则更换硬盘中板、继续测试、问题解决则故障部件定位成功;若故障不是随槽位移动,则更换控制器板、继续测试、问题解决则故障部件定位成功。
CN201110386833.2A 2011-11-29 2011-11-29 一种jbod上硬盘应用故障的定位方法 Active CN102521090B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110386833.2A CN102521090B (zh) 2011-11-29 2011-11-29 一种jbod上硬盘应用故障的定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110386833.2A CN102521090B (zh) 2011-11-29 2011-11-29 一种jbod上硬盘应用故障的定位方法

Publications (2)

Publication Number Publication Date
CN102521090A CN102521090A (zh) 2012-06-27
CN102521090B true CN102521090B (zh) 2014-02-19

Family

ID=46292023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110386833.2A Active CN102521090B (zh) 2011-11-29 2011-11-29 一种jbod上硬盘应用故障的定位方法

Country Status (1)

Country Link
CN (1) CN102521090B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105468484B (zh) * 2014-09-30 2020-07-28 伊姆西Ip控股有限责任公司 用于在存储系统中确定故障位置的方法和装置
CN106021048A (zh) * 2016-05-17 2016-10-12 浪潮电子信息产业股份有限公司 一种磁盘组乱序验证的方法及装置
CN106201795A (zh) * 2016-07-07 2016-12-07 浪潮电子信息产业股份有限公司 一种快速检测数据存储链路稳定性的方法
CN106648949B (zh) * 2016-12-28 2019-08-02 郑州云海信息技术有限公司 一种存储系统及数据传输方法
CN107577580A (zh) * 2017-09-18 2018-01-12 郑州云海信息技术有限公司 一种机箱管理系统及方法
CN107807862A (zh) * 2017-09-29 2018-03-16 曙光信息产业(北京)有限公司 检测硬盘故障点的方法、装置及服务器

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101256429A (zh) * 2008-03-05 2008-09-03 浪潮电子信息产业股份有限公司 一种低成本的jbod

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5383192A (en) * 1992-12-23 1995-01-17 Intel Corporation Minimizing the likelihood of slip between the instant a candidate for a break event is generated and the instant a microprocessor is instructed to perform a break, without missing breakpoints
DE4418231C2 (de) * 1994-05-25 1997-02-27 Siemens Ag Modular strukturierter Service-Personalcomputer

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101256429A (zh) * 2008-03-05 2008-09-03 浪潮电子信息产业股份有限公司 一种低成本的jbod

Also Published As

Publication number Publication date
CN102521090A (zh) 2012-06-27

Similar Documents

Publication Publication Date Title
US8204980B1 (en) Storage array network path impact analysis server for path selection in a host-based I/O multi-path system
CN102521090B (zh) 一种jbod上硬盘应用故障的定位方法
US7111084B2 (en) Data storage network with host transparent failover controlled by host bus adapter
US6904544B2 (en) Method, system, program, and data structures for testing a network system including input/output devices
US20070101199A1 (en) Disk array device and failure response verification method thereof
TWI409624B (zh) 自磁碟陣列隔離一驅動器以進行診斷操作
JP4886601B2 (ja) Usbインタフェース設備に対して操作を行う装置及び方法
CN105183600A (zh) 一种远程定位硬盘故障的装置和方法
US20140258790A1 (en) Communication failure source isolation in a distributed computing system
US9286151B2 (en) Computerised storage system comprising replaceable units for managing testing of replacement units
CN105975357B (zh) 一种定位故障的方法和系统
US8347142B2 (en) Non-disruptive I/O adapter diagnostic testing
CN106936616A (zh) 备份通信方法和装置
GB2395578A (en) Fault tracing in systems with virtualization layers
JP2013117922A (ja) ディスクシステム、データ保持装置、及びディスクデバイス
US20070028041A1 (en) Extended failure analysis in RAID environments
CN102819480A (zh) 一种监控计算机存储器的方法和计算机
US7451354B2 (en) Apparatus and method to configure, format, and test, a data storage subsystem product
US8381027B1 (en) Determining alternate paths in faulted systems
US10915405B2 (en) Methods for handling storage element failures to reduce storage device failure rates and devices thereof
CN101930393B (zh) Sas背板的测试装置
TW201423387A (zh) Sas擴展卡測試系統及方法
CN105005515B (zh) 一种LAN‑free备份系统
US20140025886A1 (en) Disk array system and connection method
US8429462B2 (en) Storage system and method for automatic restoration upon loop anomaly

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant