CN110716838A - 一种raid卡有效故障日志的获取方法、系统及设备 - Google Patents

一种raid卡有效故障日志的获取方法、系统及设备 Download PDF

Info

Publication number
CN110716838A
CN110716838A CN201910819744.9A CN201910819744A CN110716838A CN 110716838 A CN110716838 A CN 110716838A CN 201910819744 A CN201910819744 A CN 201910819744A CN 110716838 A CN110716838 A CN 110716838A
Authority
CN
China
Prior art keywords
raid card
fault
log
fault log
firmware
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910819744.9A
Other languages
English (en)
Inventor
张晶晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910819744.9A priority Critical patent/CN110716838A/zh
Publication of CN110716838A publication Critical patent/CN110716838A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提出的一种RAID卡有效故障日志的获取方法、系统及设备,可以保证在问题发生时将故障日志记录保存在RAID卡中,无论系统能否正常运行,都可以通过特定的工具执行相应的命令来将日志拷贝到host端,使得在问题处理过程中可以通过第一时间的有效日志记录进行问题分析,从而更准确的定位问题,提高问题解决的时效性。

Description

一种RAID卡有效故障日志的获取方法、系统及设备
技术领域
本发明涉及计算机技术领域,更具体的说是涉及一种RAID卡有效故障日志的获取方法、系统及设备。
背景技术
RAID是一种把多块独立的物理硬盘按不同方式组合起来形成一个逻辑硬盘,从而提供比单个硬盘有着更高的性能和提供数据冗余的技术。RAID卡一般分为硬RAID卡和软RAID卡两种,通过用硬件来实现RAID功能的就是硬RAID,独立的RAID卡,主板集成的RAID芯片都是硬RAID。通过软件并使用CPU的RAID卡是指使用CPU来完成RAID的常用计算,软件RAID占用CPU资源较高,绝大部分服务器设备是硬件RAID。
作为存储子系统的核心部件,RAID卡的稳定运行保证着存储子系统的性能和稳定性,而当系统出现异常时,通常需要通过获取RAID卡日志来查找异常点并分析问题,但现有的获取故障日志的方法存在如下缺点:
1、异常发生时往往伴随着系统重启或宕机,导致无法第一时间获取到异常信息。
2、现有的问题分析方法通常需要客户去复现问题来查找问题的根本原因,多次的问题复现会影响问题分析的时效性。
3、异常可能会出现在特定环境下,如复现不是在问题发生的第一现场,可能会造成问题无法复现,从而无法有效地解决问题。
发明内容
针对以上问题,本发明的目的在于提供一种RAID卡有效故障日志的获取方法、系统及设备。可以在问题发生的第一时间获取到有效的故障信息,从而更准确的定位问题,更快速的解决存储子系统的异常问题。
本发明为实现上述目的,通过以下技术方案实现:一种RAID卡有效故障日志的获取方法,包括:
使用RAID卡固件管理故障日志;
判断系统出现异常的次数N是否小于等于预设值,若是,通过将Firmware将故障信息记录并压缩保存在RAID卡缓存中;若否,Firmware自动清除原有的故障日志,并保存最新的故障日志;
判断系统是否可以正常运行,若是,在系统下通过storcli工具将故障日志记录从RAID卡端拷贝到host端;若否,通过外接串口的方式将故障日志记录从RAID卡端拷贝到host端。
进一步,所述使用RAID卡固件管理故障日志包括:
使用RAID卡固件预留固定容量的内存用于管理故障日志的数据结构;
RAID卡固件通过筛选关键字的方式保存预设固定模块的日志数据结构,用于减少由存储数据引起的运行延迟带来的影响。
进一步,所述通过将Firmware将故障信息记录并压缩保存在RAID卡缓存中包括:
Firmware按照所保存的故障日志数据结构,将RAID卡、系统的信息记录并压缩保存在RAID卡缓存中,同时,Firmware log中会出现故障日志保存的事件记录。
进一步,所述在系统下通过storcli工具将故障日志记录从RAID卡端拷贝到host端包括:
在系统下通过storcli工具执行storcli/c0 show snapdump命令查看当前Raid卡的故障记录列表;
通过查看故障记录保存的时间,锁定故障发生时间的故障日志记录;
通过storcli工具执行Storcli/c0 get snapdump id=xx file=xx.zip命令将日志记录从RAID卡端拷贝到host端。
进一步,所述通过外接串口的方式将故障日志记录从RAID卡端拷贝到host端包括:
通过外接串口的方式,触发日志记录的输出;
在接入串口的串口软件的Megamon界面下输入zcdump命令将故障日志从RAID卡端拷贝到host端。
进一步,还包括:
在host端将故障日志解压缩,获得故障信息。
相应的,本发明还公开了一种RAID卡有效故障日志的获取系统,包括:
管理单元,用于使用RAID卡固件管理故障日志;
存储单元,用于判断系统出现异常的次数N是否小于等于预设值,若是,通过将Firmware将故障信息记录并压缩保存在RAID卡缓存中;若否,Firmware自动清除原有的故障日志,并保存最新的故障日志;
输出单元,用于判断系统是否可以正常运行,若是,在系统下通过storcli工具将故障日志记录从RAID卡端拷贝到host端;若否,通过外接串口的方式将故障日志记录从RAID卡端拷贝到host端。
进一步,还包括:
信息获取单元,用于在host端将故障日志解压缩,获得故障信息。
相应的,本发明还公开了一种RAID卡有效故障日志的获取设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任一项所述RAID卡有效故障日志的获取方法步骤。
对比现有技术,本发明有益效果在于:本发明提供了一种RAID卡有效故障日志的获取方法、系统及设备,可以保证在问题发生时将故障日志记录保存在RAID卡中,无论系统能否正常运行,都可以通过特定的工具执行相应的命令来将日志拷贝到host端,使得在问题处理过程中可以通过第一时间的有效日志记录进行问题分析,从而更准确的定位问题,提高问题解决的时效性。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
附图1是本发明实施例一的方法流程图。
附图2是本发明实施例二的方法流程图。
附图3是本发明的系统结构图。
具体实施方式
下面结合附图对本发明的具体实施方式做出说明。
实施例一:
如图1所示,本发明提供了一种RAID卡有效故障日志的获取方法,包括:
使用RAID卡固件管理故障日志。
判断系统出现异常的次数N是否小于等于预设值,若是,通过将Firmware将故障信息记录并压缩保存在RAID卡缓存中;若否,Firmware自动清除原有的故障日志,并保存最新的故障日志。
判断系统是否可以正常运行,若是,在系统下通过storcli工具将故障日志记录从RAID卡端拷贝到host端;若否,通过外接串口的方式将故障日志记录从RAID卡端拷贝到host端。
在host端将故障日志解压缩,获得故障信息。
实施例二:
如图2所示,本发明提供了一种RAID卡有效故障日志的获取方法,包括:
使用RAID卡固件预留固定容量的内存用于管理故障日志的数据结构。
RAID卡固件通过筛选关键字的方式保存预设固定模块的日志数据结构,用于减少由存储数据引起的运行延迟带来的影响。因为RAID卡固件会预留固定容量的内存去管理故障日志的数据结构,所以,对于任何系统运行时出现的故障现象,固件通过筛选关键字的方式只保存固定模块的日志数据结构,以减少由存储数据引起的运行延迟带来的影响。
判断系统出现异常的次数N是否小于等于预设值。其中,系统异常具体包括系统重启、崩溃等。
若是,Firmware按照所保存的故障日志数据结构,将RAID卡、系统的信息记录并压缩保存在RAID卡缓存中,同时,Firmware log中会出现故障日志保存的事件记录。
若否,Firmware自动清除原有的故障日志,并保存最新的故障日志。由于系统任何的异常都会触发故障信息的记录,生成相应的故障日志,当故障发生次数达到设定值或日志总容量达到预留内存时,Firmware会自动清除最初的故障日志并将最新的日志保存。
判断系统是否可以正常运行。
若是,首先,在系统下通过storcli工具执行storcli/c0 show snapdump命令查看当前Raid卡的故障记录列表;然后,由于日志保存以故障发生的时刻为节点,因此,通过查看故障记录保存的时间,可锁定故障发生时间的故障日志记录;最后,通过storcli工具执行Storcli/c0 get snapdump id=xx file=xx.zip命令将日志记录从RAID卡端拷贝到host端。
若否,首先,即使故障导致系统无法运行,由于Firmware已将日志记录保存在Raid卡缓存中,通过外接串口的方式,触发日志记录的输出;然后,在接入串口的串口软件的Megamon界面下输入zcdump命令将故障日志从RAID卡端拷贝到host端。
最终,在host端将故障日志解压缩,获得故障信息。
相应的,基于上述实施例一提供的RAID卡有效故障日志的获取方法,如图3所示,本发明还公开了一种RAID卡有效故障日志的获取系统,包括:
管理单元,用于使用RAID卡固件管理故障日志。
存储单元,用于判断系统出现异常的次数N是否小于等于预设值,若是,通过将Firmware将故障信息记录并压缩保存在RAID卡缓存中;若否,Firmware自动清除原有的故障日志,并保存最新的故障日志。
输出单元,用于判断系统是否可以正常运行,若是,在系统下通过storcli工具将故障日志记录从RAID卡端拷贝到host端;若否,通过外接串口的方式将故障日志记录从RAID卡端拷贝到host端。
信息获取单元,用于在host端将故障日志解压缩,获得故障信息。
相应的,本发明还公开了一种RAID卡有效故障日志的获取设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任一项所述RAID卡有效故障日志的获取方法步骤。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的实施例中,应该理解到,所揭露的系统、系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。
同理,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
结合附图和具体实施例,对本发明作进一步说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所限定的范围。

Claims (9)

1.一种RAID卡有效故障日志的获取方法,其特征在于,包括:
使用RAID卡固件管理故障日志;
判断系统出现异常的次数N是否小于等于预设值,若是,通过将Firmware将故障信息记录并压缩保存在RAID卡缓存中;若否,Firmware自动清除原有的故障日志,并保存最新的故障日志;
判断系统是否可以正常运行,若是,在系统下通过storcli工具将故障日志记录从RAID卡端拷贝到host端;若否,通过外接串口的方式将故障日志记录从RAID卡端拷贝到host端。
2.根据权利要求1所述的RAID卡有效故障日志的获取方法,其特征在于,所述使用RAID卡固件管理故障日志包括:
使用RAID卡固件预留固定容量的内存用于管理故障日志的数据结构;
RAID卡固件通过筛选关键字的方式保存预设固定模块的日志数据结构,用于减少由存储数据引起的运行延迟带来的影响。
3.根据权利要求1所述的RAID卡有效故障日志的获取方法,其特征在于,所述通过将Firmware将故障信息记录并压缩保存在RAID卡缓存中包括:
Firmware按照所保存的故障日志数据结构,将RAID卡、系统的信息记录并压缩保存在RAID卡缓存中,同时,Firmware log中会出现故障日志保存的事件记录。
4.根据权利要求1所述的RAID卡有效故障日志的获取方法,其特征在于,所述在系统下通过storcli工具将故障日志记录从RAID卡端拷贝到host端包括:
在系统下通过storcli工具执行storcli/c0 show snapdump命令查看当前Raid卡的故障记录列表;
通过查看故障记录保存的时间,锁定故障发生时间的故障日志记录;
通过storcli工具执行Storcli/c0 get snapdump id=xx file=xx.zip命令将日志记录从RAID卡端拷贝到host端。
5.根据权利要求1所述的RAID卡有效故障日志的获取方法,其特征在于,所述通过外接串口的方式将故障日志记录从RAID卡端拷贝到host端包括:
通过外接串口的方式,触发日志记录的输出;
在接入串口的串口软件的Megamon界面下输入zcdump命令将故障日志从RAID卡端拷贝到host端。
6.根据权利要求1所述的RAID卡有效故障日志的获取方法,其特征在于,还包括:
在host端将故障日志解压缩,获得故障信息。
7.一种RAID卡有效故障日志的获取系统,其特征在于,包括:
管理单元,用于使用RAID卡固件管理故障日志;
存储单元,用于判断系统出现异常的次数N是否小于等于预设值,若是,通过将Firmware将故障信息记录并压缩保存在RAID卡缓存中;若否,Firmware自动清除原有的故障日志,并保存最新的故障日志;
输出单元,用于判断系统是否可以正常运行,若是,在系统下通过storcli工具将故障日志记录从RAID卡端拷贝到host端;若否,通过外接串口的方式将故障日志记录从RAID卡端拷贝到host端。
8.根据权利要求7所述的RAID卡有效故障日志的获取系统,其特征在于,还包括:
信息获取单元,用于在host端将故障日志解压缩,获得故障信息。
9.一种RAID卡有效故障日志的获取设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述RAID卡有效故障日志的获取方法步骤。
CN201910819744.9A 2019-08-31 2019-08-31 一种raid卡有效故障日志的获取方法、系统及设备 Withdrawn CN110716838A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910819744.9A CN110716838A (zh) 2019-08-31 2019-08-31 一种raid卡有效故障日志的获取方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910819744.9A CN110716838A (zh) 2019-08-31 2019-08-31 一种raid卡有效故障日志的获取方法、系统及设备

Publications (1)

Publication Number Publication Date
CN110716838A true CN110716838A (zh) 2020-01-21

Family

ID=69209705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910819744.9A Withdrawn CN110716838A (zh) 2019-08-31 2019-08-31 一种raid卡有效故障日志的获取方法、系统及设备

Country Status (1)

Country Link
CN (1) CN110716838A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105955875A (zh) * 2016-05-04 2016-09-21 浪潮电子信息产业股份有限公司 一种监控raid卡日志的装置和方法
CN108089971A (zh) * 2017-11-27 2018-05-29 上海华元创信软件有限公司 基于嵌入式实时系统的日志服务方法和系统
CN109189601A (zh) * 2018-09-06 2019-01-11 郑州云海信息技术有限公司 一种Linux系统下RAID卡log信息的抓取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105955875A (zh) * 2016-05-04 2016-09-21 浪潮电子信息产业股份有限公司 一种监控raid卡日志的装置和方法
CN108089971A (zh) * 2017-11-27 2018-05-29 上海华元创信软件有限公司 基于嵌入式实时系统的日志服务方法和系统
CN109189601A (zh) * 2018-09-06 2019-01-11 郑州云海信息技术有限公司 一种Linux系统下RAID卡log信息的抓取方法

Similar Documents

Publication Publication Date Title
Talagala et al. An analysis of error behavior in a large storage system
US20110093437A1 (en) Method and system for generating a space-efficient snapshot or snapclone of logical disks
US10976942B2 (en) Versioning a configuration of data storage equipment
CN106598796A (zh) 一种测试reboot时硬件信息稳定性的方法
CN103092718A (zh) 测试数据备份系统及方法
CN111522703A (zh) 监控访问请求的方法、设备和计算机程序产品
CN111078515A (zh) Ssd分层日志记录方法、装置、计算机设备及存储介质
CN113590405A (zh) 硬盘错误的检测方法、装置、存储介质和电子装置
CN110716838A (zh) 一种raid卡有效故障日志的获取方法、系统及设备
CN116361111A (zh) 一种数据获取方法、装置及电子设备
US7979238B2 (en) System, method and computer program product for evaluating a test of an alternative system
CN111797032B (zh) 存储结构、方法、装置、设备及可读存储介质
US11663165B2 (en) Method, electronic device, and computer program product for managing file system
CN114896276A (zh) 数据存储方法、装置、电子设备及分布式存储系统
CN105988917B (zh) 异常信息获取方法及装置
US10747706B2 (en) Server event log storage and retrieval system
CN111475107A (zh) 一种硬盘格式化的方法、装置及存储介质
CN116028276B (zh) 延迟数据重构方法、装置、存储节点和存储介质
CN112596948B (zh) 一种数据库集群数据备份方法、装置、设备及存储介质
US11587595B1 (en) Method of identifying DAE-context issues through multi-dimension information correlation
CN110658989B (zh) 用于备份存储垃圾收集的系统和方法
CN115543939A (zh) 日志数据的存储方法及装置
CN110413583B (zh) 一种基于flume系统的日志监控方法、装置及服务器
CN117033099A (zh) 一种系统硬盘的压力测试方法、系统、装置及存储介质
CN112380043A (zh) 解析硬盘smart日志的方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200121

WW01 Invention patent application withdrawn after publication