CN112256515A - 一种存储服务器链路完整性的检验方法及告警装置 - Google Patents

一种存储服务器链路完整性的检验方法及告警装置 Download PDF

Info

Publication number
CN112256515A
CN112256515A CN202010890080.8A CN202010890080A CN112256515A CN 112256515 A CN112256515 A CN 112256515A CN 202010890080 A CN202010890080 A CN 202010890080A CN 112256515 A CN112256515 A CN 112256515A
Authority
CN
China
Prior art keywords
link
storage server
node
determining
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010890080.8A
Other languages
English (en)
Inventor
徐立华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010890080.8A priority Critical patent/CN112256515A/zh
Publication of CN112256515A publication Critical patent/CN112256515A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/263Generation of test inputs, e.g. test vectors, patterns or sequences ; with adaptation of the tested hardware for testability with external testers

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种存储服务器链路完整性的检验方法及告警装置,属于存储服务器的技术领域,解决了仅针对HD异常现象来更换HD的维修方式,会增加HD的使用频率,也容易造成HD的真正损伤;包括确定存储服务器的链路;其中,所述链路包括多个待测节点;检测每个所述待测节点的链路信息;若每个所述待测节点的链路信息均符合对应的预设要求,则确定所述存储服务器的链路正常;本发明用于针对存储服务器经常遇到的HD异常,通过检验链路的完整性来确定是否是真正的HD异常,能够有效地避免频繁的更换HD,给产线维修节省时间;又能因减少了不必要的HD更换,从而避免潜在的HD损伤,提供工厂作业效率。

Description

一种存储服务器链路完整性的检验方法及告警装置
技术领域
本发明涉及存储服务器技术领域,尤其是涉及一种存储服务器链路完 整性的检验方法及告警装置。
背景技术
随着存储服务器链路的异常可能造成HD的CRC错误,响应超时等现 象,而往往实际HD是正常的,如果不通过链路的检验结果辅助定位分析, 仅针对HD异常现象来更换HD的维修方式,会增加HD的使用频率,也容 易造成HD的真正损伤。
发明内容
本发明的目的在于提供一种存储服务器链路完整性的检验方法及告警 装置,以缓解了仅针对HD异常现象来更换HD的维修方式,会增加HD的 使用频率,也容易造成HD的真正损伤的技术问题。
第一方面,本发明提供的一种存储服务器链路完整性的检测方法,应 用于Linux系统,包括:
确定存储服务器的链路;其中,所述链路包括多个待测节点;
检测每个所述待测节点的链路信息;
若每个所述待测节点的链路信息均符合对应的预设要求,则确定所述 存储服务器的链路正常。
进一步的,所述链路还包括待定节点,所述待定节点包括:HD、坦克 链、电源背板、DC供电线中的一个或多个。
进一步的,所述待测节点包括SAS卡和Expander卡。
进一步的,所述SAS卡的链路信息包括:SAS卡上行的Link状态、 SAS卡下行的Link状态和SAS卡下行的PHY误码。
进一步的,所述Expander卡的链路信息包括:Expander卡的Link状态 和Expander卡的PHY误码。
进一步的,还包括:
若至少一个所述待测节点的链路信息不符合对应的预设要求,则确定 对应的异常节点,并发出与所述异常节点对应的告警信息;其中,所述异 常节点为所述SAS卡、所述Expander卡、所述HD、所述坦克链、所述电 源背板、所述DC供电线中的至少一个。
进一步的,在检测每个所述待测节点的链路信息之前,还包括:
获取目标工具和模块化程序,并将所述目标工具和所述模块化程序存 放于同一路径,以在所述路径下执行所述模块化程序;其中,所述模块化 程序为链路检测程序。
第二方面,本发明还提供一种存储服务器链路完整性的检测装置,应 用于Linux系统,包括:
第一确定单元,用于确定存储服务器的链路;其中,所述链路包括多 个待测节点;
检测单元,用于检测每个所述待测节点的链路信息;
第二确定单元,用于若每个所述待测节点的链路信息均符合对应的预 设要求,则确定所述存储服务器的链路正常。
第三方面,本发明还提供一种电子设备,包括存储器、处理器,所述 存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述 处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法 的步骤。
第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读 存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用 和运行时,所述计算机可运行指令促使所述处理器运行所述权利要求1至7 任一项所述的方法。
本发明提供的,一种存储服务器链路完整性的检测方法和装置,针对 存储服务器经常遇到的HD异常,通过检验链路的完整性来确定是否是真 正的HD异常,能够有效地避免频繁的更换HD,给产线维修节省时间;又 能因减少了不必要的HD更换,从而避免潜在的HD损伤,提供工厂作业效 率。
相应地,本发明实施例提供的一种电子设备及计算机可读存储介质, 也同样具有上述技术效果。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下 面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍, 显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普 通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获 得其他的附图。
图1为本发明实施例提供的存储服务器链路完整性的检测方法流程图;
图2为本发明实施例提供的电子设备原理框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附 图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本 领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施 例,都属于本发明保护的范围。
本发明实施例中所提到的术语“包括”和“具有”以及它们的任何变 形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、 方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还 包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、 产品或设备固有的其它步骤或单元。
本发明实施例提供的一种存储服务器链路完整性的检测方法,应用 于Linux系统,包括:
确定存储服务器的链路;其中,所述链路包括多个待测节点;
检测每个所述待测节点的链路信息;
若每个所述待测节点的链路信息均符合对应的预设要求,则确定所述 存储服务器的链路正常。
进一步的,所述链路还包括待定节点,所述待定节点包括:HD、坦克 链、电源背板、DC供电线中的一个或多个。
进一步的,所述待测节点包括SAS卡和Expander卡。
进一步的,所述SAS卡的链路信息包括:SAS卡上行的Link状态、 SAS卡下行的Link状态和SAS卡下行的PHY误码。
进一步的,所述Expander卡的链路信息包括:Expander卡的Link状态 和Expander卡的PHY误码。
进一步的,还包括:
若至少一个所述待测节点的链路信息不符合对应的预设要求,则确定 对应的异常节点,并发出与所述异常节点对应的告警信息;其中,所述异 常节点为所述SAS卡、所述Expander卡、所述HD、所述坦克链、所述电 源背板、所述DC供电线中的至少一个。
进一步的,在检测每个所述待测节点的链路信息之前,还包括:
获取目标工具和模块化程序,并将所述目标工具和所述模块化程序存 放于同一路径,以在所述路径下执行所述模块化程序;其中,所述模块化 程序为链路检测程序。
本发明实施例还提供的一种存储服务器链路完整性的检测装置,应 用于Linux系统,包括:
第一确定单元,用于确定存储服务器的链路;其中,所述链路包括多 个待测节点;
检测单元,用于检测每个所述待测节点的链路信息;
第二确定单元,用于若每个所述待测节点的链路信息均符合对应的预 设要求,则确定所述存储服务器的链路正常。
本发明实施例提供的一种电子设备,如图2所示,电子设备800包括 存储器801、处理器802,所述存储器中存储有可在所述处理器上运行的计 算机程序,所述处理器执行所述计算机程序时实现上述实施例提供的方法 的步骤。
如图1所示,电子设备还包括:总线803和通信接口804,处理器802、 通信接口804和存储器801通过总线803连接;处理器802用于执行存储 器801中存储的可执行模块,例如计算机程序。
其中,存储器801可能包含高速随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory), 例如至少一个磁盘存储器。通过至少一个通信接口804(可以是有线或者无 线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联 网,广域网,本地网,城域网等。
总线803可以是ISA总线、PCI总线或EISA总线等。所述总线可以分 为地址总线、数据总线、控制总线等。为便于表示,图2中仅用一个双向 箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器801用于存储程序,所述处理器802在接收到执行指令 后,执行所述程序,前述本发明任一实施例揭示的过程定义的装置所执行 的方法可以应用于处理器802中,或者由处理器802实现。
处理器802可能是一种集成电路芯片,具有信号的处理能力。在实现 过程中,上述方法的各步骤可以通过处理器802中的硬件的集成逻辑电路 或者软件形式的指令完成。上述的处理器802可以是通用处理器,包括中 央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing, 简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称 ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可 以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用 处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合 本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完 成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以 位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可 编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器 801,处理器802读取存储器801中的信息,结合其硬件完成上述方法的步 骤。
对应于上述方法,本发明实施例还提供了一种计算机可读存储介质, 所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令 在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上 述方法的步骤。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法, 也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的, 例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方 法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流 程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所 述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标 注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方 框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依 所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及 框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的 基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
又例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可 以有另外的划分方式,再例如,多个单元或组件可以结合或者可以集成到 另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的 相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或 单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的, 作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地 方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的 部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单 元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成 在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使 用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发 明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的 部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储 介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服 务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步 骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称 RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用 以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于 此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术 人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围 内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变 化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。都应涵盖 在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护 范围为准。

Claims (10)

1.一种存储服务器链路完整性的检测方法,其特征在于,应用于Linux系统,包括:
确定存储服务器的链路;其中,所述链路包括多个待测节点;
检测每个所述待测节点的链路信息;
若每个所述待测节点的链路信息均符合对应的预设要求,则确定所述存储服务器的链路正常。
2.根据权利要求1所述的方法,其特征在于,所述链路还包括待定节点,所述待定节点包括:HD、坦克链、电源背板、DC供电线中的一个或多个。
3.根据权利要求2所述的方法,其特征在于,所述待测节点包括SAS卡和Expander卡。
4.根据权利要求3所述的方法,其特征在于,所述SAS卡的链路信息包括:SAS卡上行的Link状态、SAS卡下行的Link状态和SAS卡下行的PHY误码。
5.根据权利要求3所述的方法,其特征在于,所述Expander卡的链路信息包括:Expander卡的Link状态和Expander卡的PHY误码。
6.根据权利要求3所述的方法,其特征在于,还包括:
若至少一个所述待测节点的链路信息不符合对应的预设要求,则确定对应的异常节点,并发出与所述异常节点对应的告警信息;其中,所述异常节点为所述SAS卡、所述Expander卡、所述HD、所述坦克链、所述电源背板、所述DC供电线中的至少一个。
7.根据权利要求1所述的方法,其特征在于,在检测每个所述待测节点的链路信息之前,还包括:
获取目标工具和模块化程序,并将所述目标工具和所述模块化程序存放于同一路径,以在所述路径下执行所述模块化程序;其中,所述模块化程序为链路检测程序。
8.一种存储服务器链路完整性的检测装置,其特征在于,应用于Linux系统,包括:
第一确定单元,用于确定存储服务器的链路;其中,所述链路包括多个待测节点;
检测单元,用于检测每个所述待测节点的链路信息;
第二确定单元,用于若每个所述待测节点的链路信息均符合对应的预设要求,则确定所述存储服务器的链路正常。
9.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行所述权利要求1至7任一项所述的方法。
CN202010890080.8A 2020-08-28 2020-08-28 一种存储服务器链路完整性的检验方法及告警装置 Pending CN112256515A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010890080.8A CN112256515A (zh) 2020-08-28 2020-08-28 一种存储服务器链路完整性的检验方法及告警装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010890080.8A CN112256515A (zh) 2020-08-28 2020-08-28 一种存储服务器链路完整性的检验方法及告警装置

Publications (1)

Publication Number Publication Date
CN112256515A true CN112256515A (zh) 2021-01-22

Family

ID=74224187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010890080.8A Pending CN112256515A (zh) 2020-08-28 2020-08-28 一种存储服务器链路完整性的检验方法及告警装置

Country Status (1)

Country Link
CN (1) CN112256515A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294077A (zh) * 2016-08-31 2017-01-04 浪潮(北京)电子信息产业有限公司 链路expander工作状态监控方法、系统及服务器
CN109684149A (zh) * 2018-12-13 2019-04-26 浪潮电子信息产业股份有限公司 一种NVMe硬盘的硬件信息监控方法、装置及设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294077A (zh) * 2016-08-31 2017-01-04 浪潮(北京)电子信息产业有限公司 链路expander工作状态监控方法、系统及服务器
CN109684149A (zh) * 2018-12-13 2019-04-26 浪潮电子信息产业股份有限公司 一种NVMe硬盘的硬件信息监控方法、装置及设备

Similar Documents

Publication Publication Date Title
CN109783262B (zh) 故障数据处理方法、装置、服务器及计算机可读存储介质
CN111414268B (zh) 故障处理方法、装置及服务器
CN109558282B (zh) 一种pcie链路检测方法、系统及电子设备和存储介质
CN111324192A (zh) 一种系统板卡电源检测方法、装置、设备及存储介质
CN112286709B (zh) 一种服务器硬件故障的诊断方法、诊断装置及诊断设备
CN106547653B (zh) 计算机系统故障状态检测方法、装置及系统
CN112579400B (zh) 一种设备故障定位方法、装置、设备及存储介质
CN112783703A (zh) 一种sas链路故障定位方法、装置、设备及存储介质
CN114844768A (zh) 信息分析方法、装置及电子设备
CN110580220A (zh) 测量代码段执行时间的方法及终端设备
US11093361B2 (en) Bus monitoring system, method and apparatus
CN111124818B (zh) 一种扩展器Expander的监控方法、装置及设备
CN112463238A (zh) Pcie设备的报错定位方法、装置、bios和bmc
CN112506693A (zh) 一种记录异常信息的方法、装置、存储介质和电子设备
CN112256515A (zh) 一种存储服务器链路完整性的检验方法及告警装置
CN111338864A (zh) 内存问题检测方法、装置、计算机设备及存储介质
CN114265489B (zh) 电源故障监测方法、装置、电子设备及存储介质
WO2015083226A1 (ja) 情報処理装置及び情報処理装置制御プログラム
CN111143138A (zh) 一种PCIe Bus总线故障定位方法、系统、终端及存储介质
CN116382968B (zh) 外部设备的故障检测方法以及装置
CN117149492A (zh) 一种服务器故障检测方法、装置、设备及计算机存储介质
CN111026610B (zh) 服务器故障日志多级分析方法、系统、终端及存储介质
CN116820863A (zh) 级联测试方法、装置、电子设备及存储介质
CN114443382A (zh) 硬盘测试方法、系统、终端及存储介质
CN114661500A (zh) 一种机器人故障检测方法、系统及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210122

RJ01 Rejection of invention patent application after publication