CN115080340A - 软磁盘阵列监控方法、系统、计算机设备和存储介质 - Google Patents
软磁盘阵列监控方法、系统、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN115080340A CN115080340A CN202210522523.7A CN202210522523A CN115080340A CN 115080340 A CN115080340 A CN 115080340A CN 202210522523 A CN202210522523 A CN 202210522523A CN 115080340 A CN115080340 A CN 115080340A
- Authority
- CN
- China
- Prior art keywords
- information
- disk array
- management unit
- floppy disk
- solid state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000012544 monitoring process Methods 0.000 title claims abstract description 57
- 239000007787 solid Substances 0.000 claims abstract description 232
- 230000002159 abnormal effect Effects 0.000 claims abstract description 171
- 239000000284 extract Substances 0.000 claims abstract description 13
- 230000015556 catabolic process Effects 0.000 claims description 84
- 238000006731 degradation reaction Methods 0.000 claims description 84
- 238000007405 data analysis Methods 0.000 claims description 38
- 238000004590 computer program Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 5
- 238000012423 maintenance Methods 0.000 abstract description 48
- 230000001960 triggered effect Effects 0.000 description 10
- 239000000758 substrate Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3037—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/325—Display of status information by lamps or LED's
Abstract
本发明涉及一种软磁盘阵列监控方法、系统、计算机设备和存储介质,方法包括:带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件;所述带内管理单元读取所述日志信息文件和状态信息文件,并从所述日志信息文件和状态信息文件中提取异常信息;所述带内管理单元根据所述异常信息触发相应的控制操作,并将所述异常信息发送至带外管理单元;所述带外管理单元根据异常信息触发相应的告警指令。采用固态硬盘监控方法、系统、计算机设备和存储介质,加强了对固态硬盘和软磁盘阵列的监控能力,以便于维护人员在固态硬盘和软磁盘阵列出现故障时能够及时的进行维护,降低了数据丢失的概率,提高了数据完整性,也提高了维护人员的便利性。
Description
技术领域
本发明涉及通信技术领域,特别是涉及一种软磁盘阵列监控方法、系统、计算机设备和存储介质。
背景技术
目前NVME(Non-Volatile Memory Expre,非易失性内存主机控制器接口)SSD(Solid State Disk,固态硬盘)主流应用是CPU直连的方式,采用intel的VMD(VolumeManagement Device,卷管理设备)进行简单管理,可以通过VROC(Virtual RAID on CPU,专为基于NVMe的固态盘直接连接到CPU而设计的企业混合RAID解决方案)配置软RAID(RedundantArrays ofIndependent Disks,磁盘阵列),或者通过linux系统配置软RAID,而软RAID的方式,管理软件只做到了对NVME SSD的在位不在位状态监测。
传统硬盘是通过RAID卡接硬盘的方式,RAID卡会监控硬盘的运行状态、RAID降级及重构等状态的监控,是通过RAID卡进行管理,而管理软件通过RAID卡的状态上报及主动检测RAID卡信息而做到带外监控硬盘状态,进行硬盘管理及告警管理。但是现有技术中通过CPU直连的NVME固态硬盘,其带外管理只能够实现对硬盘在位与不在位状态的监测,而软磁盘阵列的故障状态、降级状态和重构状态无法做到监测及告警管理。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高监控能力的方法、系统、计算机设备和存储介质。
一方面,提供一种软磁盘阵列监控方法,所述方法包括:
带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件;
所述带内管理单元读取所述日志信息文件和状态信息文件,并从所述日志信息文件和状态信息文件中提取异常信息;
所述带内管理单元根据所述异常信息触发相应的控制操作,并将所述异常信息发送至带外管理单元;
所述带外管理单元根据异常信息触发相应的告警指令;
其中,所述日志信息文件包括所述固态硬盘的故障信息,状态信息文件包括所述软磁盘阵列降级信息、重构信息、主板更换信息。
在其中一个实施例中,所述带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件,包括:
所述带内管理单元通过固态硬盘的信息日志获取所述固态硬盘的日志信息文件;
所述带内管理单元通过软磁盘阵列管理工具获取所述软磁盘阵列的状态信息文件。
在其中一个实施例中,所述带内管理单元读取所述日志信息文件和状态信息文件,从所述日志信息文件和状态信息文件中提取异常信息,包括:
所述带内管理单元对所述日志信息文件和状态信息文件中的数据进行数据分析,得到数据分析结果;
所述带内管理单元从所述数据分析结果中提取异常数据,得到所述异常信息。
在其中一个实施例中,所述带内管理单元根据所述异常信息触发相应的控制操作,包括:
若所述异常信息中包含所述固态硬盘的故障信息,则点亮所述固态硬盘的故障灯。
在其中一个实施例中,所述带内管理单元根据所述异常信息触发相应的控制操作,还包括:
若所述异常信息中包含所述软磁盘阵列的降级信息,则点亮所述固态硬盘的状态灯;
若所述异常信息中包含所述软磁盘阵列的重构信息,则点亮所述固态硬盘的状态灯,并获取所述软磁盘阵列的重构状态;
若所述重构状态为正在重构中,则获取所述软磁盘阵列的重构进度。
在其中一个实施例中,所述带内管理单元根据所述异常信息触发相应的控制操作,还包括:
若所述异常信息中包含主板更换信息,则导入所述软磁盘阵列的配置;
根据所述软磁盘阵列的配置进行所述软磁盘阵列的一致性检查。
在其中一个实施例中,所述带外管理单元根据异常信息触发相应的告警指令,还包括:
所述带外管理单元将所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息根据告警日志格式进行上报告警。
另一方面,提供了一种固态硬盘监控系统,带内管理单元和带外管理单元,所述带内管理单元将固态硬盘的故障信息、软磁盘阵列的降级信息、重构信息、主板更换信息通过SNMP协议发送至所述带外管理单元;
所述带内管理单元包括:
信息监测模块,用于监测所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息;
处理分析模块,用于对所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息进行数据分析,并提取异常数据,得到异常信息;
控制模块,用于根据所述异常信息触发相应的控制操作;
所述带外管理单元包括:
信息接收模块,用于接收所述带内管理单元获取的固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息;
告警上报模块,用于将所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息根据告警日志格式进行上报告警。
再一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件;
所述带内管理单元读取所述日志信息文件和状态信息文件,并从所述日志信息文件和状态信息文件中提取异常信息;
所述带内管理单元根据所述异常信息触发相应的控制操作,并将所述异常信息发送至带外管理单元;
所述带外管理单元根据异常信息触发相应的告警指令。
又一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被处理器执行时,使得所述处理器执行以下步骤:
带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件;
所述带内管理单元读取所述日志信息文件和状态信息文件,并从所述日志信息文件和状态信息文件中提取异常信息;
所述带内管理单元根据所述异常信息触发相应的控制操作,并将所述异常信息发送至带外管理单元;
所述带外管理单元根据异常信息触发相应的告警指令。
本发明的上述技术方案相比现有技术具有以下优点:
上述软磁盘阵列监控方法、系统、计算机设备和存储介质,当异常信息中包含所述固态硬盘的故障信息,则点亮所述固态硬盘的故障灯,将固态硬盘的故障信息上报至带外管理单元并告警;当异常信息中包含所述软磁盘阵列的降级信息和重构信息,则点亮所述固态硬盘的状态灯,将降级信息、重构信息及重构进度上报至带外管理单元并告警;当异常信息中包含主板更换信息,则导入所述软磁盘阵列的配置,进行一致性检查后将软磁盘阵列的状态信息上报至带外管理单元;通过带内管理单元与带外管理单元相结合的方式,加强了对固态硬盘和软磁盘阵列的监控能力,以便于维护人员在固态硬盘和软磁盘阵列出现故障时能够及时的进行维护,降低了数据丢失的概率,提高了数据完整性,也提高了维护人员的便利性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明的软磁盘阵列监控方法的第一方法流程图;
图2是本发明的软磁盘阵列监控方法的第二方法流程图;
图3是本发明的软磁盘阵列监控系统的系统结构图;
图4是本发明的计算机设备的设备结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
现有技术中通过CPU直连的NVME固态硬盘,其带外管理只能够实现对硬盘在位与不在位状态的监测,而软磁盘阵列的故障状态、降级状态和重构状态无法做到监测及告警管理,因此本发明提出了一种软磁盘阵列的监控方法、系统、计算机设备和存储介质,不仅能够对固态硬盘做到故障信息的检测,而且还能够做到对软磁盘阵列进行其降级信息、重构信息、主板更换信息的监测,便于维护人员在固态硬盘和软磁盘阵列出现故障时能够及时的进行维护,降低了数据丢失的概率,提高了数据完整性,也提高了维护人员的便利性。
实施例一:
本实施例的软磁盘阵列监控方法,参照图1~图2所示,图1是本发明的软磁盘阵列监控方法的第一方法流程图;图2是本发明的软磁盘阵列监控方法的第二方法流程图。
方法包括以下步骤:
带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件;
为了能够对固态硬盘的故障信息和软磁盘阵列的状态信息进行监测,就要通过技术手段来获取固态硬盘的故障信息和软磁盘阵列的状态信息。首先要通过带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件,以便于从日志信息文件和状态信息文件中获取异常信息,即,固态硬盘的故障信息和软磁盘阵列的状态信息,通过固态硬盘的故障信息和软磁盘阵列的状态信息以及后续的数据处理分析便可以实现对固态硬盘和软件磁盘阵列的监测,以便于维护人员在固态硬盘和软磁盘阵列出现故障时能够及时的进行维护,降低了数据丢失的概率,提高了数据完整性,也提高了维护人员的便利性。
所述带内管理单元读取所述日志信息文件和状态信息文件,并从所述日志信息文件和状态信息文件中提取异常信息;
带内管理单元获取到固态硬盘的日志信息文件和软磁盘阵列的状态信息文件后,由于日志信息文件中存储着固态硬盘的故障信息,状态信息文件中存储着软磁盘阵列的状态信息,即软磁盘阵列的降级信息、重构信息和主板更换信息,因此通过读取日志信息文件和状态信息文件便可以得到固态硬盘的故障信息,软磁盘阵列的降级信息、重构信息和主板更换信息,也就是异常信息,不同的异常信息对应不同的告警指令,当出现异常信息时,带内管理单元会将异常信息发送至带外管理单元,带外管理单元会触发相应的告警指令,以便于维护人员在固态硬盘和软磁盘阵列出现故障时能够及时的进行维护,降低了数据丢失的概率,提高了数据完整性,也提高了维护人员的便利性。
所述带内管理单元根据所述异常信息触发相应的控制操作,并将所述异常信息发送至带外管理单元;
不同的异常信息对应不同的控制操作,如果是固态硬盘的故障信息,则控制操作为点亮所述固态硬盘的故障灯;如果是软磁盘阵列的降级信息或者重构信息,则控制操作为点亮所述固态硬盘的状态灯;如果是主板更换信息,则控制操作为导入所述软磁盘阵列的配置。触发相应的控制操作后,带内管理单元将所述异常信息发送至带外管理单元,带外管理单元进行相应的告警,实现了对软磁盘阵列的降级和重构的监控,增强了对软磁盘阵列和固态硬盘的监控能力。
所述带外管理单元根据异常信息触发相应的告警指令;
带外管理单元接收到带内管理单元的异常信息后,针对不同的异常信息会对应不同的告警指令,如果是固态硬盘的故障信息,带外管理单元会触发固态硬盘故障的告警信息;如果是磁盘阵列的降级或重构信息,带外管理单元会触发软磁盘阵列的告警信息;如果是主板更换信息,带内管理单元会触发主板的一致性校验,然后将软磁盘阵列的状态信息上报至带外管理单元,即基板管理软件。通过该发明增强了对固态硬盘和软磁盘阵列的监控能力,提高了软磁盘阵列的可靠性。此外,通过基板管理软件可以查看固态硬盘和软磁盘阵列的信息,包括正常与不正常的信息都可以进行查看,方便维护人员从基板管理软件查看告警日志;且也可以在已经订阅告警日志的统一管理平台查看。
其中,所述日志信息文件包括所述固态硬盘的故障信息,状态信息文件包括所述软磁盘阵列降级信息、重构信息、主板更换信息。
日志信息文件包括固态硬盘的故障信息,因此通过日志信息文件可以获取固态硬盘的故障信息;状态信息文件包括软磁盘阵列的状态信息,因此通过状态信息文件可以获取软磁盘阵列的降级信息、重构信息和主板更换信息。通过固态硬盘的故障信息及软磁盘阵列降级信息、重构信息、主板更换信息的监测,可以提高对固态硬盘和软磁盘阵列的监控能力,通过对固态硬盘和软磁盘阵列的监控,能够提高运维人员进行维护的便利性,还能够提高软磁盘阵列的可靠性。
在其中一个实施方式中,所述带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件,包括:
所述带内管理单元通过固态硬盘的信息日志获取所述固态硬盘的日志信息文件;
要想获取固态硬盘的日志信息文件,就要实现与固态硬盘的信息交互,通过设置,使得固态硬盘在运行时产生信息日志,信息日志会记录固态硬盘的运行信息,运行信息中包含固态硬盘的正常运行信息和故障信息,日志信息文件相当于是固态硬盘的信息日志,因此带内管理单元通过信息日志便可以得到日志信息文件,通过日志信息文件便可以得到故障信息,以便于触发相应的告警指令。
所述带内管理单元通过软磁盘阵列管理工具获取所述软磁盘阵列的状态信息文件。
要想获取软磁盘阵列的状态信息文件,就要实现与软件磁盘阵列的信息交互,通过软磁盘阵列管理工具便可以获取软磁盘阵列的状态信息文件,即,mdadm工具。mdadm工具是对软磁盘阵列的管理工具,管理包括创建、启动、状态查看等一系列工具,因此带内管理单元通过mdadm工具便可以获取软磁盘阵列的状态信息文件,状态信息文件中会存储着软磁盘阵列的降级信息、重构信息和主板更换信息,以便于根据不同的异常信息触发不同的告警指令。如果是磁盘阵列的降级信息或重构信息,会触发软磁盘阵列的告警信息;如果是主板更换信息,会触发主板的一致性校验,然后将软磁盘阵列的状态信息上报给带外管理单元。通过该发明增强了固态硬盘及软磁盘阵列的监控能力,提高了软磁盘阵列的可靠性。
在其中一个实施方式中,所述带内管理单元读取所述日志信息文件和状态信息文件,从所述日志信息文件和状态信息文件中提取异常信息,包括:
所述带内管理单元对所述日志信息文件和状态信息文件中的数据进行数据分析,得到数据分析结果;
通过信息日志获取到日志信息文件且通过mdadm工具获取到状态信息文件后,需要对日志信息文件和状态信息文件中的数据进行数据分析,得到数据分析结果。数据分析结果中会包含着固态硬盘的故障信息和软磁盘阵列的降级信息、重构信息、主板更换信息,也就是异常信息,因此带内管理单元通过日志信息文件和状态信息文件中的数据便可以得到异常信息,以便于根据异常信息执行相应的告警指令,增强了固态硬盘及软磁盘阵列的监控能力,提高了软磁盘阵列的可靠性。
所述带内管理单元从所述数据分析结果中提取异常数据,得到所述异常信息。
获取到对日志信息文件和状态信息文件的数据分析结果后,便可以从数据分析结果中得到固态硬盘的故障信息和软磁盘阵列的降级信息、重构信息、主板更换信息,也就是异常信息,因此带内管理单元通过日志信息文件和状态信息文件中的数据便可以得到异常信息,以便于根据异常信息执行相应的告警指令,增强了固态硬盘及软磁盘阵列的监控能力,提高了软磁盘阵列的可靠性。
在其中一个实施方式中,所述带内管理单元根据所述异常信息触发相应的控制操作,包括:
若所述异常信息中包含所述固态硬盘的故障信息,则点亮所述固态硬盘的故障灯。
异常信息主要包括固态硬盘的故障信息和软磁盘阵列降级信息、重构信息、主板更换信息。如果日志信息文件和状态信息文件的数据分析结果中存在固态硬盘的故障信息,则带内管理单元调用ledctl工具来点亮固态硬盘的故障灯。如果异常信息中不存在固态硬盘的故障信息,那么说明固态硬盘一直处于正常运行的状态,因此带内管理单元会通过ledctl工具来点亮固态硬盘的故障灯,使得故障灯为绿色;如果异常信息中存在固态硬盘的故障信息,那么说明固态硬盘出现故障,处于异常运行的状态,因此带内管理单元会通过ledctl工具来点亮固态硬盘的故障灯,使得故障灯为红色。因此通过故障灯的颜色便可以知道固态硬盘是处于正常工作状态还是异常工作状态,方便维护人员快速的定位到出现故障的固态硬盘,提高了维护人员的便利性,更为简单可靠。
在其中一个实施方式中,所述带内管理单元根据所述异常信息触发相应的控制操作,还包括:
若所述异常信息中包含所述软磁盘阵列的降级信息,则点亮所述固态硬盘的状态灯;
异常信息主要包括固态硬盘的故障信息和软磁盘阵列降级信息、重构信息、主板更换信息。如果状态信息文件的数据分析结果中存在软磁盘阵列的降级信息,则说软磁盘阵列中的某一台或多台固态硬盘因为损毁或掉线等原因而脱离软磁盘阵列,软磁盘阵列便处于降级状态,因此如果状态信息文件的数据分析结果中存在软磁盘阵列的降级信息,则说明软磁盘阵列处于降级状态,则带内管理单元点亮固态硬盘的状态灯,使状态灯置于红色;如果状态信息文件的数据分析结果中不存在软磁盘阵列的降级信息,则说明软磁盘阵列处于正常状态,则带内管理单元点亮固态硬盘的状态灯,使状态灯置于绿色。因此通过状态灯的颜色便可以知道软磁盘阵列是处于正常工作状态还是异常工作状态,方便维护人员对软磁盘阵列进行维护,提高了维护人员的便利性,更为简单可靠。
若所述异常信息中包含所述软磁盘阵列的重构信息,则点亮所述固态硬盘的状态灯,并获取所述软磁盘阵列的重构状态;
一般的,软磁盘阵列具有降级重建的功能,即软磁盘阵列因其中一台或多台固态硬盘损毁或掉线而处于降级状态时,可以在更换新的固态硬盘或再次插入掉线的固态硬盘后,通过重构软磁盘阵列来拯救数据,使软磁盘阵列恢复正常状态。因此如果异常信息中包含软磁盘阵列的重构信息,则说明软磁盘阵列处于正在重构中的状态或者是已经重构完毕的状态,此时需要带内管理单元点亮固态硬盘的状态灯,使得状态灯置于红色状态,以便于维护人员进行相关检测,确定数据是否丢失,以进行维护;如果异常信息中不包含软磁盘阵列的重构信息,则说明软磁盘阵列状态正常,则需要带内管理单元点亮固态硬盘的状态灯,使得状态灯置于绿色状态,以提示维护人员软磁盘阵列正常,提高了维护人员的便利性,更为简单可靠。
若所述重构状态为正在重构中,则获取所述软磁盘阵列的重构进度。
重构状态包括两种软磁盘阵列的状态,即重构完毕和正在重构中的状态,如果重构状态处于正在重构中的状态,则带内管理单元获取软磁盘阵列的重构进度,将重构进度上报至带外管理单元,以便于维护人员通过带外管理单元了解重构进度,提高了维护人员的便利性,更为简单可靠。
在其中一个实施方式中,所述带内管理单元根据所述异常信息触发相应的控制操作,还包括:
若所述异常信息中包含主板更换信息,则导入所述软磁盘阵列的配置;
主板在正常使用过程中会出现损坏等故障情况,如果主板出现损坏,则需要更换主板。如果主板进行了更换,那么异常信息中会存在主板更换信息,如果异常信息中存在主板更换信息,则需要带内管理单元将软磁盘阵列的配置重新导入主板中,以便于触发软磁盘阵列的一致性检查。一致性检查是指检查软磁盘阵列上的数据,确保这些数据保持一致,这意味着阵列数据是正确的,没有损坏,因此在更换主板后要进行一致性检查,防止数据丢失。通过FRU(FieldReplace Unit,现场可更换单元)信息便可以监测到是否更换主板。
根据所述软磁盘阵列的配置进行所述软磁盘阵列的一致性检查。
将软磁盘阵列的配置重新导入主板后,触发软磁盘阵列的一致性检查。一致性检查是指检查软磁盘阵列上的数据,确保这些数据保持一致,这意味着阵列数据是正确的,没有损坏,因此在更换主板后要进行一致性检查,防止数据丢失。如果一致性检查不通过,则将软磁盘阵列进行重构,并重新获取软磁盘阵列的状态信息上报至带外管理单元。
在其中一个实施方式中,所述带外管理单元根据异常信息触发相应的告警指令,还包括:
所述带外管理单元将所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息根据告警日志格式进行上报告警。
不同的异常信息对应不同的告警指令,如果异常信息中包含固态硬盘的故障信息,则带内管理单元点亮固态硬盘的故障灯,将固态硬盘的故障灯置于红色,并将固态硬盘的故障信息上报至带外管理单元;如果异常信息中包含软磁盘阵列的降级信息,则带内管理单元点亮所述固态硬盘的状态灯,将固态硬盘的状态灯置于红色,并将软磁盘阵列的降级信息上报至带外管理单元;如果异常信息中包含软磁盘阵列的重构信息,则带内管理单元点亮所述固态硬盘的状态灯,将固态硬盘的状态灯置于红色,并将软磁盘阵列的重构状态及重构进度上报至带外管理单元;如果异常信息中包含主板更换信息,则带内管理单元将触发软磁盘阵列的一致性检查,检查完毕后将软磁盘阵列的状态信息上报至带外管理单元。因此带外管理单元,也就是基板管理软件中会包含固态硬盘和软磁盘阵列的异常信息,通过基板管理软件将异常信息进行告警,告警包括但不限于邮件、短信息等告警方式,将异常信息告警给维护人员,方便维护人员进行维护。进一步地,不同的告警方式,异常信息的告警日志格式不同,例如,通过邮件发送则需符合邮件的告警日志格式;通过短信息发送则需符合短信息的告警日志格式,以便于进行通信。此外,在对异常信息进行上报告警后,将整机的状态灯置于红色,以便于维护人员获取信息。
实施例二:
本实施例的软磁盘阵列监控方法,参照图1~图2所示,图1是本发明的软磁盘阵列监控方法的第一方法流程图;图2是本发明的软磁盘阵列监控方法的第二方法流程图。
所述带内管理单元通过固态硬盘的信息日志获取所述固态硬盘的日志信息文件;
要想获取固态硬盘的日志信息文件,就要实现与固态硬盘的信息交互,通过设置,使得固态硬盘在运行时产生信息日志,信息日志会记录固态硬盘的运行信息,运行信息中包含固态硬盘的正常运行信息和故障信息,日志信息文件相当于是固态硬盘的信息日志,因此带内管理单元通过信息日志便可以得到日志信息文件,通过日志信息文件便可以得到故障信息,以便于触发相应的告警指令。
所述带内管理单元通过软磁盘阵列管理工具获取所述软磁盘阵列的状态信息文件;
要想获取软磁盘阵列的状态信息文件,就要实现与软件磁盘阵列的信息交互,通过软磁盘阵列管理工具便可以获取软磁盘阵列的状态信息文件,即,mdadm工具。mdadm工具是对软磁盘阵列的管理工具,管理包括创建、启动、状态查看等一系列工具,因此带内管理单元通过mdadm工具便可以获取软磁盘阵列的状态信息文件,状态信息文件中会存储着软磁盘阵列的降级信息、重构信息和主板更换信息,以便于根据不同的异常信息触发不同的告警指令。如果是磁盘阵列的降级信息或重构信息,会触发软磁盘阵列的告警信息;如果是主板更换信息,会触发主板的一致性校验,然后将软磁盘阵列的状态信息上报给带外管理单元。通过该发明增强了固态硬盘及软磁盘阵列的监控能力,提高了软磁盘阵列的可靠性。
所述带内管理单元对所述日志信息文件和状态信息文件中的数据进行数据分析,得到数据分析结果;
通过信息日志获取到日志信息文件且通过mdadm工具获取到状态信息文件后,需要对日志信息文件和状态信息文件中的数据进行数据分析,得到数据分析结果。数据分析结果中会包含着固态硬盘的故障信息和软磁盘阵列的降级信息、重构信息、主板更换信息,也就是异常信息,因此带内管理单元通过日志信息文件和状态信息文件中的数据便可以得到异常信息,以便于根据异常信息执行相应的告警指令,增强了固态硬盘及软磁盘阵列的监控能力,提高了软磁盘阵列的可靠性。
所述带内管理单元从所述数据分析结果中提取异常数据,得到所述异常信息;
获取到对日志信息文件和状态信息文件的数据分析结果后,便可以从数据分析结果中得到固态硬盘的故障信息和软磁盘阵列的降级信息、重构信息、主板更换信息,也就是异常信息,因此带内管理单元通过日志信息文件和状态信息文件中的数据便可以得到异常信息,以便于根据异常信息执行相应的告警指令,增强了固态硬盘及软磁盘阵列的监控能力,提高了软磁盘阵列的可靠性。
若所述异常信息中包含所述固态硬盘的故障信息,则点亮所述固态硬盘的故障灯;
异常信息主要包括固态硬盘的故障信息和软磁盘阵列降级信息、重构信息、主板更换信息。如果日志信息文件和状态信息文件的数据分析结果中存在固态硬盘的故障信息,则带内管理单元调用ledctl工具来点亮固态硬盘的故障灯。如果异常信息中不存在固态硬盘的故障信息,那么说明固态硬盘一直处于正常运行的状态,因此带内管理单元会通过ledctl工具来点亮固态硬盘的故障灯,使得故障灯为绿色;如果异常信息中存在固态硬盘的故障信息,那么说明固态硬盘出现故障,处于异常运行的状态,因此带内管理单元会通过ledctl工具来点亮固态硬盘的故障灯,使得故障灯为红色。因此通过故障灯的颜色便可以知道固态硬盘是处于正常工作状态还是异常工作状态,方便维护人员快速的定位到出现故障的固态硬盘,提高了维护人员的便利性,更为简单可靠。
若所述异常信息中包含所述软磁盘阵列的降级信息,则点亮所述固态硬盘的状态灯;
异常信息主要包括固态硬盘的故障信息和软磁盘阵列降级信息、重构信息、主板更换信息。如果状态信息文件的数据分析结果中存在软磁盘阵列的降级信息,则说软磁盘阵列中的某一台或多台固态硬盘因为损毁或掉线等原因而脱离软磁盘阵列,软磁盘阵列便处于降级状态,因此如果状态信息文件的数据分析结果中存在软磁盘阵列的降级信息,则说明软磁盘阵列处于降级状态,则带内管理单元点亮固态硬盘的状态灯,使状态灯置于红色;如果状态信息文件的数据分析结果中不存在软磁盘阵列的降级信息,则说明软磁盘阵列处于正常状态,则带内管理单元点亮固态硬盘的状态灯,使状态灯置于绿色。因此通过状态灯的颜色便可以知道软磁盘阵列是处于正常工作状态还是异常工作状态,方便维护人员对软磁盘阵列进行维护,提高了维护人员的便利性,更为简单可靠。
若所述异常信息中包含所述软磁盘阵列的重构信息,则点亮所述固态硬盘的状态灯,并获取所述软磁盘阵列的重构状态;
一般的,软磁盘阵列具有降级重建的功能,即软磁盘阵列因其中一台或多台固态硬盘损毁或掉线而处于降级状态时,可以在更换新的固态硬盘或再次插入掉线的固态硬盘后,通过重构软磁盘阵列来拯救数据,使软磁盘阵列恢复正常状态。因此如果异常信息中包含软磁盘阵列的重构信息,则说明软磁盘阵列处于正在重构中的状态或者是已经重构完毕的状态,此时需要带内管理单元点亮固态硬盘的状态灯,使得状态灯置于红色状态,以便于维护人员进行相关检测,确定数据是否丢失,以进行维护;如果异常信息中不包含软磁盘阵列的重构信息,则说明软磁盘阵列状态正常,则需要带内管理单元点亮固态硬盘的状态灯,使得状态灯置于绿色状态,以提示维护人员软磁盘阵列正常,提高了维护人员的便利性,更为简单可靠。
若所述重构状态为正在重构中,则获取所述软磁盘阵列的重构进度;
重构状态包括两种软磁盘阵列的状态,即重构完毕和正在重构中的状态,如果重构状态处于正在重构中的状态,则带内管理单元获取软磁盘阵列的重构进度,将重构进度上报至带外管理单元,以便于维护人员通过基板管理软件了解重构进度,提高了维护人员的便利性,更为简单可靠。
若所述异常信息中包含主板更换信息,则导入所述软磁盘阵列的配置;
主板在正常使用过程中会出现损坏等故障情况,如果主板出现损坏,则需要更换主板。如果主板进行了更换,那么异常信息中会存在主板更换信息,如果异常信息中存在主板更换信息,则需要带内管理单元将软磁盘阵列的配置重新导入主板中,以便于触发软磁盘阵列的一致性检查。一致性检查是指检查软磁盘阵列上的数据,确保这些数据保持一致,这意味着阵列数据是正确的,没有损坏,因此在更换主板后要进行一致性检查,防止数据丢失。通过FRU信息便可以监测到是否更换主板。
根据所述软磁盘阵列的配置进行所述软磁盘阵列的一致性检查;
将软磁盘阵列的配置重新导入主板后,触发软磁盘阵列的一致性检查。一致性检查是指检查软磁盘阵列上的数据,确保这些数据保持一致,这意味着阵列数据是正确的,没有损坏,因此在更换主板后要进行一致性检查,防止数据丢失。如果一致性检查不通过,则将软磁盘阵列进行重构,并重新获取软磁盘阵列的状态信息上报至带外管理单元。
所述带内管理单元将所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息发送至带外管理单元;
带内管理单元将所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息发送至带外管理单元,带外管理单元进行相应的告警,实现了对软磁盘阵列的降级和重构的监控,增强了对软磁盘阵列和固态硬盘的监控能力。
所述带外管理单元根据告警日志格式进行上报告警。
不同的异常信息对应不同的告警指令,如果异常信息中包含固态硬盘的故障信息,则带内管理单元点亮固态硬盘的故障灯,将固态硬盘的故障灯置于红色,并将固态硬盘的故障信息上报至带外管理单元;如果异常信息中包含软磁盘阵列的降级信息,则带内管理单元点亮所述固态硬盘的状态灯,将固态硬盘的状态灯置于红色,并将软磁盘阵列的降级信息上报至带外管理单元;如果异常信息中包含软磁盘阵列的重构信息,则带内管理单元点亮所述固态硬盘的状态灯,将固态硬盘的状态灯置于红色,并将软磁盘阵列的重构状态及重构进度上报至带外管理单元;如果异常信息中包含主板更换信息,则带内管理单元将触发软磁盘阵列的一致性检查,检查完毕后将软磁盘阵列的状态信息上报至带外管理单元。因此带外管理单元,也就是基板管理软件中会包含固态硬盘和软磁盘阵列的异常信息,通过基板管理软件将异常信息进行告警,告警包括但不限于邮件、短信息等告警方式,将异常信息告警给维护人员,方便维护人员进行维护。进一步地,不同的告警方式,异常信息的告警日志格式不同,例如,通过邮件发送则需符合邮件的告警日志格式;通过短信息发送则需符合短信息的告警日志格式,以便于进行通信。此外,在对异常信息进行上报告警后,将整机的状态灯置于红色,以便于维护人员获取信息。
应该理解的是,虽然图1~2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1~2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
实施例三:
参照图3所示,图3为本发明的固态硬盘监控系统的系统结构图。
本实施例的固态硬盘监控系统,包括带内管理单元和带外管理单元,所述带内管理单元将固态硬盘的故障信息、软磁盘阵列的降级信息、重构信息、主板更换信息通过SNMP协议发送至所述带外管理单元;
所述带内管理单元包括:
信息监测模块,用于监测所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息;
为了能够对固态硬盘的故障信息和软磁盘阵列的状态信息进行监测,就要通过信息监测模块来获取固态硬盘的故障信息和软磁盘阵列的状态信息。首先要通过带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件,以便于从日志信息文件和状态信息文件中获取异常信息,即,固态硬盘的故障信息和软磁盘阵列的状态信息,通过固态硬盘的故障信息和软磁盘阵列的状态信息以及后续的数据处理分析便可以实现对固态硬盘和软件磁盘阵列的监测,以便于维护人员在固态硬盘和软磁盘阵列出现故障时能够及时的进行维护,降低了数据丢失的概率,提高了数据完整性,也提高了维护人员的便利性。其中,日志信息文件包括固态硬盘的故障信息,状态信息文件包括软磁盘阵列降级信息、重构信息、主板更换信息。
处理分析模块,用于对所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息进行数据分析,并提取异常数据,得到异常信息;
带内管理单元获取到固态硬盘的日志信息文件和软磁盘阵列的状态信息文件后,由于日志信息文件中存储着固态硬盘的故障信息,状态信息文件中存储着软磁盘阵列的状态信息,即软磁盘阵列的降级信息、重构信息和主板更换信息,因此通过处理分析模块便可以得到固态硬盘的故障信息,软磁盘阵列的降级信息、重构信息和主板更换信息,也就是异常信息,不同的异常信息对应不同的告警指令,当出现异常信息时,带内管理单元会将异常信息发送至带外管理单元,带外管理单元会触发相应的告警指令,以便于维护人员在固态硬盘和软磁盘阵列出现故障时能够及时的进行维护,降低了数据丢失的概率,提高了数据完整性,也提高了维护人员的便利性。
控制模块,用于根据所述异常信息触发相应的控制操作;
不同的异常信息对应不同的控制操作,如果是固态硬盘的故障信息,则控制模块的控制操作为点亮所述固态硬盘的故障灯;如果是软磁盘阵列的降级信息或者重构信息,则控制模块的控制操作为点亮所述固态硬盘的状态灯;如果是主板更换信息,则控制模块的控制操作为导入所述软磁盘阵列的配置。触发相应的控制操作后,带内管理单元将所述异常信息发送至带外管理单元,带外管理单元进行相应的告警,实现了对软磁盘阵列的降级和重构的监控,增强了对软磁盘阵列和固态硬盘的监控能力。
所述带外管理单元包括:
信息接收模块,用于接收所述带内管理单元获取的固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息;
控制模块将固态硬盘故障的告警信息、软磁盘阵列的告警信息和状态信息通过SNMP协议发送至带外管理单元后,即,将带内管理单元获取的固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息通过SNMP协议发送至带外管理单元后,信息接收模块来接收带内管理单元获取的固态硬盘的故障信息、软磁盘阵列的降级信息、重构信息、主板更换信息。
告警上报模块,用于将所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息根据告警日志格式上报至告警。
不同的异常信息对应不同的告警指令,如果异常信息中包含固态硬盘的故障信息,则带内管理单元点亮固态硬盘的故障灯,将固态硬盘的故障灯置于红色,并将固态硬盘的故障信息上报至带外管理单元;如果异常信息中包含软磁盘阵列的降级信息,则带内管理单元点亮所述固态硬盘的状态灯,将固态硬盘的状态灯置于红色,并通过告警上报模块将软磁盘阵列的降级信息上报至带外管理单元;如果异常信息中包含软磁盘阵列的重构信息,则带内管理单元点亮所述固态硬盘的状态灯,将固态硬盘的状态灯置于红色,并通过告警上报模块将软磁盘阵列的重构状态及重构进度上报至带外管理单元;如果异常信息中包含主板更换信息,则带内管理单元将触发软磁盘阵列的一致性检查,检查完毕后将软磁盘阵列的状态信息上报至带外管理单元。因此带外管理单元,也就是基板管理软件中会包含固态硬盘和软磁盘阵列的异常信息,通过基板管理软件将异常信息进行告警,告警包括但不限于邮件、短信息等告警方式,将异常信息告警给维护人员,方便维护人员进行维护。
关于软磁盘阵列监控系统的具体限定可以参见上文中对于方法的限定,在此不再赘述。上述软磁盘阵列监控系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
实施例四:
本实施例提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现软磁盘阵列监控方法的步骤。
该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现软磁盘阵列监控方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域内的技术人员应明白,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在其中一个实施方式中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件;
所述带内管理单元读取所述日志信息文件和状态信息文件,并从所述日志信息文件和状态信息文件中提取异常信息;
所述带内管理单元根据所述异常信息触发相应的控制操作,并将所述异常信息发送至带外管理单元;
所述带外管理单元根据异常信息触发相应的告警指令。
在其中一个实施方式中,处理器执行计算机程序时还实现以下步骤:
通过固态硬盘的信息日志获取所述固态硬盘的日志信息文件;
通过mdadm工具获取所述软磁盘阵列的状态信息文件。
在其中一个实施方式中,处理器执行计算机程序时还实现以下步骤:
对所述日志信息文件和状态信息文件中的数据进行数据分析,得到数据分析结果;
从所述数据分析结果中提取异常数据,得到所述异常信息。
在其中一个实施方式中,处理器执行计算机程序时还实现以下步骤:
若所述异常信息中包含所述固态硬盘的故障信息,则点亮所述固态硬盘的故障灯。
在其中一个实施方式中,处理器执行计算机程序时还实现以下步骤:
若所述异常信息中包含所述软磁盘阵列的降级信息,则点亮所述固态硬盘的状态灯;
若所述异常信息中包含所述软磁盘阵列的重构信息,则点亮所述固态硬盘的状态灯,并获取所述软磁盘阵列的重构状态;
若所述重构状态为正在重构中,则获取所述软磁盘阵列的重构进度。
在其中一个实施方式中,处理器执行计算机程序时还实现以下步骤:
若所述异常信息中包含主板更换信息,则导入所述软磁盘阵列的配置;
根据所述软磁盘阵列的配置进行所述软磁盘阵列的一致性检查。
在其中一个实施方式中,处理器执行计算机程序时还实现以下步骤:
将所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息根据告警日志格式进行上报告警。
实施例五:
本实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件;
所述带内管理单元读取所述日志信息文件和状态信息文件,并从所述日志信息文件和状态信息文件中提取异常信息;
所述带内管理单元根据所述异常信息触发相应的控制操作,并将所述异常信息发送至带外管理单元;
所述带外管理单元根据异常信息触发相应的告警指令。
在其中一个实施方式中,处理器执行计算机程序时还实现以下步骤:
通过固态硬盘的信息日志获取所述固态硬盘的日志信息文件;
通过mdadm工具获取所述软磁盘阵列的状态信息文件。
在其中一个实施方式中,处理器执行计算机程序时还实现以下步骤:
对所述日志信息文件和状态信息文件中的数据进行数据分析,得到数据分析结果;
从所述数据分析结果中提取异常数据,得到所述异常信息。
在其中一个实施方式中,处理器执行计算机程序时还实现以下步骤:
若所述异常信息中包含所述固态硬盘的故障信息,则点亮所述固态硬盘的故障灯。
在其中一个实施方式中,处理器执行计算机程序时还实现以下步骤:
若所述异常信息中包含所述软磁盘阵列的降级信息,则点亮所述固态硬盘的状态灯;
若所述异常信息中包含所述软磁盘阵列的重构信息,则点亮所述固态硬盘的状态灯,并获取所述软磁盘阵列的重构状态;
若所述重构状态为正在重构中,则获取所述软磁盘阵列的重构进度。
在其中一个实施方式中,处理器执行计算机程序时还实现以下步骤:
若所述异常信息中包含主板更换信息,则导入所述软磁盘阵列的配置;
根据所述软磁盘阵列的配置进行所述软磁盘阵列的一致性检查。
在其中一个实施方式中,处理器执行计算机程序时还实现以下步骤:
将所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息根据告警日志格式进行上报告警。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种软磁盘阵列监控方法,其特征在于,所述方法包括:
带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件;
所述带内管理单元读取所述日志信息文件和状态信息文件,并从所述日志信息文件和状态信息文件中提取异常信息;
所述带内管理单元根据所述异常信息触发相应的控制操作,并将所述异常信息发送至带外管理单元;
所述带外管理单元根据异常信息触发相应的告警指令;
其中,所述日志信息文件包括所述固态硬盘的故障信息,状态信息文件包括所述软磁盘阵列降级信息、重构信息、主板更换信息。
2.根据权利要求1所述的软磁盘阵列监控方法,其特征在于,所述带内管理单元获取固态硬盘的日志信息文件和软磁盘阵列的状态信息文件,包括:
所述带内管理单元通过固态硬盘的信息日志获取所述固态硬盘的日志信息文件;
所述带内管理单元通过软磁盘阵列管理工具获取所述软磁盘阵列的状态信息文件。
3.根据权利要求1所述的软磁盘阵列监控方法,其特征在于,所述带内管理单元读取所述日志信息文件和状态信息文件,从所述日志信息文件和状态信息文件中提取异常信息,包括:
所述带内管理单元对所述日志信息文件和状态信息文件中的数据进行数据分析,得到数据分析结果;
所述带内管理单元从所述数据分析结果中提取异常数据,得到所述异常信息。
4.根据权利要求1所述的软磁盘阵列监控方法,其特征在于,所述带内管理单元根据所述异常信息触发相应的控制操作,包括:
若所述异常信息中包含所述固态硬盘的故障信息,则点亮所述固态硬盘的故障灯。
5.根据权利要求4所述的软磁盘阵列监控方法,其特征在于,所述带内管理单元根据所述异常信息触发相应的控制操作,还包括:
若所述异常信息中包含所述软磁盘阵列的降级信息,则点亮所述固态硬盘的状态灯;
若所述异常信息中包含所述软磁盘阵列的重构信息,则点亮所述固态硬盘的状态灯,并获取所述软磁盘阵列的重构状态;
若所述重构状态为正在重构中,则获取所述软磁盘阵列的重构进度。
6.根据权利要求5所述的软磁盘阵列监控方法,其特征在于,所述带内管理单元根据所述异常信息触发相应的控制操作,还包括:
若所述异常信息中包含主板更换信息,则导入所述软磁盘阵列的配置;
根据所述软磁盘阵列的配置进行所述软磁盘阵列的一致性检查。
7.根据权利要求6所述的软磁盘阵列监控方法,其特征在于,所述带外管理单元根据异常信息触发相应的告警指令,包括:
所述带外管理单元将所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息根据告警日志格式进行上报告警。
8.一种软磁盘阵列监控系统,其特征在于,所述固态硬盘监控系统包括带内管理单元和带外管理单元,所述带内管理单元将固态硬盘的故障信息、软磁盘阵列的降级信息、重构信息、主板更换信息通过SNMP协议发送至所述带外管理单元;
所述带内管理单元包括:
信息监测模块,用于监测所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息;
处理分析模块,用于对所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息进行数据分析,并提取异常数据,得到异常信息;
控制模块,用于根据所述异常信息触发相应的控制操作;
所述带外管理单元包括:
信息接收模块,用于接收所述带内管理单元获取的固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息;
告警上报模块,用于将所述固态硬盘的故障信息、所述软磁盘阵列的降级信息、重构信息、主板更换信息根据告警日志格式进行上报告警。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~7中任意一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有程序,当所述程序被处理器执行时,使得所述处理器执行如权利要求1~7中任意一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210522523.7A CN115080340A (zh) | 2022-05-13 | 2022-05-13 | 软磁盘阵列监控方法、系统、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210522523.7A CN115080340A (zh) | 2022-05-13 | 2022-05-13 | 软磁盘阵列监控方法、系统、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115080340A true CN115080340A (zh) | 2022-09-20 |
Family
ID=83246950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210522523.7A Pending CN115080340A (zh) | 2022-05-13 | 2022-05-13 | 软磁盘阵列监控方法、系统、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115080340A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117312054A (zh) * | 2023-10-30 | 2023-12-29 | 广州鼎甲计算机科技有限公司 | 磁盘阵列的目标数据恢复方法、装置和计算机设备 |
CN117312054B (zh) * | 2023-10-30 | 2024-05-14 | 广州鼎甲计算机科技有限公司 | 磁盘阵列的目标数据恢复方法、装置和计算机设备 |
-
2022
- 2022-05-13 CN CN202210522523.7A patent/CN115080340A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117312054A (zh) * | 2023-10-30 | 2023-12-29 | 广州鼎甲计算机科技有限公司 | 磁盘阵列的目标数据恢复方法、装置和计算机设备 |
CN117312054B (zh) * | 2023-10-30 | 2024-05-14 | 广州鼎甲计算机科技有限公司 | 磁盘阵列的目标数据恢复方法、装置和计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106682162B (zh) | 日志管理方法及装置 | |
CN114116280B (zh) | 交互式bmc自恢复方法、系统、终端及存储介质 | |
CN111881014A (zh) | 一种系统测试方法、装置、存储介质及电子设备 | |
CN110119290A (zh) | 应用程序备用页面切换方法、装置、计算机设备和存储介质 | |
CN109710444A (zh) | 智能医院信息系统的异常处理的方法及相关设备 | |
CN114924929A (zh) | 一种NVMe硬盘故障预警方法、系统和计算机设备 | |
CN111611138B (zh) | 日志数据抓取方法、装置、计算机设备和存储介质 | |
CN117453036A (zh) | 调整服务器中的设备的功耗的方法、系统及装置 | |
CN115080340A (zh) | 软磁盘阵列监控方法、系统、计算机设备和存储介质 | |
CN114968129B (zh) | 磁盘阵列冗余方法、系统、计算机设备和存储介质 | |
CN109947628B (zh) | 管理控制方法、管理控制系统和服务器 | |
CN113868001B (zh) | 一种内存修复结果的检查方法、系统及计算机存储介质 | |
CN114911578A (zh) | 存储系统监控及故障收集方法、装置、终端及存储介质 | |
CN115022163A (zh) | 日志收集方法、装置、计算机设备及存储介质 | |
CN112231170B (zh) | 一种数据交互卡监管方法、系统、终端及存储介质 | |
CN113691395A (zh) | 网络运维方法、装置、计算机设备和存储介质 | |
CN110851300A (zh) | 程序进程监控的方法、装置、计算机设备及可读存储介质 | |
KR102526368B1 (ko) | 멀티벤더를 지원하는 서버 관리 시스템 | |
CN113608750B (zh) | 监控组件的部署方法、装置、计算机设备以及存储介质 | |
JPH1188471A (ja) | 試験方法及び試験装置 | |
CN114443446B (zh) | 硬盘指示灯控制方法、系统、终端及存储介质 | |
US11513931B2 (en) | Anomaly aware log retrieval from disk array enclosures (DAEs) | |
CN114968626A (zh) | 服务器故障的确定方法、装置、设备及存储介质 | |
CN116893946A (zh) | 云平台工作状态监控方法及系统 | |
CN117271263A (zh) | Oracle数据库监控方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |