CN115858221A - 存储设备的管理方法、装置、存储介质及电子设备 - Google Patents
存储设备的管理方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN115858221A CN115858221A CN202211625885.5A CN202211625885A CN115858221A CN 115858221 A CN115858221 A CN 115858221A CN 202211625885 A CN202211625885 A CN 202211625885A CN 115858221 A CN115858221 A CN 115858221A
- Authority
- CN
- China
- Prior art keywords
- storage device
- information
- fault
- target
- cpu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 35
- 230000004044 response Effects 0.000 claims abstract description 10
- 238000012360 testing method Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 16
- 238000011056 performance test Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本申请实施例提供了一种存储设备的管理方法、装置、存储介质及电子设备,该方法包括:在三模模式下,通过复杂可编程逻辑器件CPLD接收基板管理控制器BMC发送的故障信息收集命令;响应故障信息收集命令,检测至少一个存储设备的运行状态;在至少一个存储设备的运行状态处于无故障状态的情况下,获取中央处理器CPU的内核信息和至少一个存储设备的设备信息;基于设备信息,从至少一个存储设备中确定目标存储设备;基于内核信息,将CPU的内核与目标存储设备进行绑定处理,以使目标存储设备性能稳定。通过本申请,解决了现有技术中采用Tri‑Mode模式进行硬盘混合搭配使用的情况下,NVMe硬盘等存储设备性能不稳定的问题。
Description
技术领域
本申请实施例涉及计算机领域,具体而言,涉及一种存储设备的管理方法、装置、存储介质及电子设备。
背景技术
在大数据背景下,越来越多的产品开始引入三模(Tri-Mode)技术,通过存储控制器和Expander背板扩展多种接口标准的存储设备,实现数据的海量存储,提升产品的兼容性。在Tri-Mode模式下,Expander背板既能搭配传统机械硬盘(例如,SATA硬盘),又能搭配新兴的以NVMe接口标准为依据的固态硬盘(例如,NVMe硬盘)。
然而,在这种硬盘混搭模式的实际应用过程中,硬盘之间存在较大的性能偏差,使得某些NVMe硬盘的性能不稳定、性能不能有效的发挥,甚至无法满足厂商提供的产品规格书中的技术参数。另外,硬盘在处理较多业务数据的情况下,还会触发CE(CorrectableError)报错、输入输出(Input/Output Error)报错等,从而导致硬盘性能下降而出现掉盘。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种存储设备的管理方法、装置、存储介质及电子设备,以至少解决相关技术中采用Tri-Mode模式进行硬盘混合搭配使用的情况下,NVMe硬盘等存储设备性能不稳定的问题。
根据本申请的一个实施例,提供了一种存储设备的管理方法,包括:在三模模式下,通过复杂可编程逻辑器件CPLD接收基板管理控制器BMC发送的故障信息收集命令;响应故障信息收集命令,检测至少一个存储设备的运行状态;在至少一个存储设备的运行状态处于无故障状态的情况下,获取中央处理器CPU的内核信息和至少一个存储设备的设备信息;基于设备信息,从至少一个存储设备中确定目标存储设备;基于内核信息,将CPU的内核与目标存储设备进行绑定处理,以使目标存储设备性能稳定。
在一个示例性实施例中,响应故障信息收集命令,检测至少一个存储设备的运行状态,包括:响应故障信息收集命令,从目标寄存器中进行信息收集处理,其中,目标寄存器用于存储至少一个存储设备的故障信息;在收集到故障信息的情况下,确定至少一个存储设备的运行状态处于故障状态;在未收集到故障信息的情况下,确定至少一个存储设备的运行状态处于无故障状态。
在一个示例性实施例中,响应故障信息收集命令,从目标寄存器中进行信息收集处理,包括:获取目标背板的地址信息,其中,目标背板上设有多个槽位,至少一个存储设备通过多个槽位与目标背板连接;基于地址信息,对多个槽位进行信息扫描处理;在扫描到故障信息的情况下,将故障信息和故障信息对应的槽位地址发送至目标寄存器,并从目标寄存器中进行信息收集处理。
在一个示例性实施例中,基于内核信息,将CPU的内核与目标存储设备进行绑定处理,包括:从内核信息中获取CPU的空闲内核数量;确定目标存储设备的数量;根据目标存储设备的数量,将CPU的空闲内核数量进行平均分配,得到分配结果,其中,CPU的空闲内核数量大于目标存储设备的数量;根据分配结果,将CPU的内核与目标存储设备进行绑定处理。
在一个示例性实施例中,基于设备信息,从至少一个存储设备中确定目标存储设备,包括:从设备信息中获取至少一个存储设备的盘符;基于盘符,确定至少一个存储设备的设备类型;基于设备类型,确定目标存储设备。
在一个示例性实施例中,在收集到故障信息的情况下,确定至少一个存储设备的运行状态处于故障状态之后,基于故障信息生成故障日志,并将故障日志发送至BMC的控制界面,以通过BMC的控制界面对目标对象展示故障日志,并基于故障日志确定对至少一个存储设备中的故障存储设备进行修复的策略。
在一个示例性实施例中,在基于内核信息,将CPU的内核与目标存储设备进行绑定处理之后,根据预设测试脚本,对绑定后的目标存储设备进行性能测试,生成测试数据;在测试数据满足预设阈值的情况下,确定绑定后的目标存储设备的性能稳定。
根据本申请的另一个实施例,提供了一种存储设备的管理装置,包括:接收模块,用于在三模模式下,通过复杂可编程逻辑器件CPLD接收基板管理控制器BMC发送的故障信息收集命令;检测模块,用于响应故障信息收集命令,检测至少一个存储设备的运行状态;获取模块,用于在至少一个存储设备的运行状态处于无故障状态的情况下,获取中央处理器CPU的内核信息和至少一个存储设备的设备信息;确定模块,用于基于设备信息,从至少一个存储设备中确定目标存储设备;处理模块,用于基于内核信息,将CPU的内核与目标存储设备进行绑定处理,以使目标存储设备性能稳定。
根据本申请的又一个实施例,还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本申请的又一个实施例,还提供了一种电子设备,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在本发明实施例中,采用通过CPLD和BMC协作对存储设备进行监控,并将目标存储设备与CPU的内核绑定实现使目标存储设备性能稳定的方式,首先在三模模式下,通过复杂可编程逻辑器件CPLD接收基板管理控制器BMC发送的故障信息收集命令,然后响应故障信息收集命令,检测至少一个存储设备的运行状态,在至少一个存储设备的运行状态处于无故障状态的情况下,获取中央处理器CPU的内核信息和至少一个存储设备的设备信息,然后基于设备信息,从至少一个存储设备中确定目标存储设备,然后基于内核信息,将CPU的内核与目标存储设备进行绑定处理,以使目标存储设备性能稳定。
在上述过程中,在三模模式下,通过复杂可编程逻辑器件CPLD接收基板管理控制器BMC发送的故障信息收集命令,可以触发CPLD中的目标寄存器,从而对至少一个存储设备的故障信息进行扫描和收集,实现了通过CPLD和BMC协作对存储设备的监控;通过将CPU的内核与目标存储设备进行绑定处理,能够使目标存储设备性能稳定,实现了对CPU资源的合理分配,从而能够提升目标存储设备的业务处理能力,使目标存储设备发挥更好的性能优势。
由此可见,通过本发明的技术方案,达到了使目标存储设备发挥更好的性能优势的目的,从而实现了保障NVMe硬盘性能稳定发挥的技术效果,进而解决了现有技术中采用Tri-Mode模式进行硬盘混合搭配使用的情况下,NVMe硬盘等存储设备性能不稳定的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本申请实施例的一种可选的存储设备的管理方法的移动终端的硬件结构框图;
图2是根据本申请实施例的一种可选的存储设备的管理方法的流程图;
图3是根据本申请实施例的一种可选的存储设备的性能测试示意图;
图4是根据本申请实施例的一种可选的存储设备的管理装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请的实施例。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本申请实施例的一种存储设备的管理方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本申请实施例中的存储设备的管理方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种运行于上述移动终端的方法,图2是根据本申请实施例的一种可选的存储设备的管理方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,在三模模式下,通过复杂可编程逻辑器件CPLD接收基板管理控制器BMC发送的故障信息收集命令;
步骤S204,响应故障信息收集命令,检测至少一个存储设备的运行状态;
步骤S206,在至少一个存储设备的运行状态处于无故障状态的情况下,获取中央处理器CPU的内核信息和至少一个存储设备的设备信息;
步骤S208,基于设备信息,从至少一个存储设备中确定目标存储设备;
步骤S210,基于内核信息,将CPU的内核与目标存储设备进行绑定处理,以使目标存储设备性能稳定。
通过上述步骤,解决了现有技术中采用Tri-Mode模式进行硬盘混合搭配使用的情况下,NVMe硬盘等存储设备性能不稳定的问题,进而达到了保障NVMe硬盘性能稳定发挥的效果。
其中,上述步骤的执行主体可以为终端等,但不限于此。
步骤S202和步骤S204的执行顺序是可以互换的,即可以先执行步骤S204,然后再执行S202。
具体的,图3是根据本申请实施例的一种可选的存储设备的性能测试示意图,如图3所示,通过CPLD与BMC协作监控存储设备的运行状态,可以及时发现存储设备的故障,以及时解决故障,并且,通过将存储设备与CPU的内核进行绑定,可以为存储设备合理分配CPU资源,从而使存储设备性能发挥稳定。
可选的,CPLD位于Expander背板上,Expander背板上有多个槽位,不同类型的存储设备插在槽位上实现与Expander背板的连接,BMC位于主板上,主板上有多个接口,存储控制器(例如,RAID卡)插在接口上实现与主板的连接,并且通过线缆连接Expander背板。另外,主板上还有至少一个CPU。
其中,存储控制器(例如,RAID卡)支持Tri-Mode三模信号,Expander背板支持Tri-Mode三模信号,在三模(即Tri-Mode)模式下,服务器正常工作时,可以实现通过存储控制器(例如,RAID卡)将数据写入存储设备。存储控制器(RAID卡)通过线缆和Expander背板连接,CPLD收集到故障信息之后,传给存储控制器(RAID卡),存储控制器(RAID卡)可以将故障信息反馈到Expander背板。
具体的,在步骤S202中,BMC和CPLD之间通过I2C总线通信,故障信息收集命令可以是BMC向CPLD发送的I2C命令。通过I2C命令可以触发CPLD中的硬盘故障寄存器,扫描并收集硬盘的故障信息,将故障信息回传至BMC的控制界面。具体的,CPLD接收到I2C命令后,通过通用输入输出接口GPIO读取硬盘的故障指示灯的亮灭信息,在硬盘的故障指示灯亮的情况下,GPIO读取到故障信息,存储到硬盘故障寄存器中,硬盘故障寄存器扫描并收集故障信息,将故障信息回传至BMC的控制界面。
具体的,在步骤S204中,存储设备可以是传统机械硬盘(Hard Disk Drive,HDD),以及支持非易失性内存主机控制器接口规范(Non-Volatile Memory express,NVMe)的固态硬盘(Solid State Drive,SSD)。在Tri-Mode模式下,Expander背板搭配HDD和NVMe SSD混合使用。可选的,运行状态至少包括故障状态和健康状态即无故障状态。
需要说明的是,通过检测至少一个存储设备的运行状态,可以及时发现存储设备的故障,从而及时解决故障。
具体的,在步骤S206中,CPU的内核信息至少包括CPU的内核数量、空闲内核数量等信息。存储设备的设备信息至少包括存储设备的盘符、数量等信息。
具体的,在步骤S208中,目标存储设备可以是NVMe硬盘(例如,NVMe SSD),基于设备信息,可以从至少一个硬盘中确定NVMe硬盘。
具体的,在步骤S210中,将CPU的内核与NVMe硬盘进行绑定处理,可以为NVMe硬盘合理分配CPU资源。由于NVMe SSD采用的是PCIe接口,性能比支持Tri-Mode的RAID卡高很多,因此,在一定程度上会增加输入输出的延迟,并且,RAID卡自身也会出现性能瓶颈。通过将CPU的内核与NVMe硬盘进行绑定处理,可以为NVMe硬盘合理分配CPU资源,使得支持Tri-Mode的Expander背板与支持Tri-Mode的RAID卡交互时,NVMe硬盘能够发挥更好的性能优势。
基于上述步骤S202至步骤S210所限定的方案,可以获知,在本发明实施例中,采用通过CPLD和BMC协作对存储设备进行监控,并将目标存储设备与CPU的内核绑定实现使目标存储设备性能稳定的方式,首先在三模模式下,通过复杂可编程逻辑器件CPLD接收基板管理控制器BMC发送的故障信息收集命令,然后响应故障信息收集命令,检测至少一个存储设备的运行状态,在至少一个存储设备的运行状态处于无故障状态的情况下,获取中央处理器CPU的内核信息和至少一个存储设备的设备信息,然后基于设备信息,从至少一个存储设备中确定目标存储设备,然后基于内核信息,将CPU的内核与目标存储设备进行绑定处理,以使目标存储设备性能稳定。
容易注意到的是,在上述过程中,在三模模式下,通过复杂可编程逻辑器件CPLD接收基板管理控制器BMC发送的故障信息收集命令,可以触发CPLD中的目标寄存器,从而对至少一个存储设备的故障信息进行扫描和收集,实现了通过CPLD和BMC协作对存储设备的监控;通过将CPU的内核与目标存储设备进行绑定处理,能够使目标存储设备性能稳定,实现了对CPU资源的合理分配,从而能够提升目标存储设备的业务处理能力,使目标存储设备发挥更好的性能优势。
由此可见,通过本发明的技术方案,达到了使目标存储设备发挥更好的性能优势的目的,从而实现了保障NVMe硬盘性能稳定发挥的技术效果,进而解决了现有技术中采用Tri-Mode模式进行硬盘混合搭配使用的情况下,NVMe硬盘等存储设备性能不稳定的技术问题。
在一个示例性实施例中,响应故障信息收集命令,检测至少一个存储设备的运行状态,包括:响应故障信息收集命令,从目标寄存器中进行信息收集处理,其中,目标寄存器用于存储至少一个存储设备的故障信息;在收集到故障信息的情况下,确定至少一个存储设备的运行状态处于故障状态;在未收集到故障信息的情况下,确定至少一个存储设备的运行状态处于无故障状态。
可选的,目标寄存器可以是CPLD中的硬盘故障寄存器,硬盘故障寄存器中存储硬盘的故障信息。响应故障信息收集命令,如果从硬盘故障寄存器中收集到了故障信息,说明硬盘存在故障,生成了故障信息,即硬盘处于故障状态。如果从硬盘故障寄存器中没有收集到故障信息,说明硬盘不存在故障,没有生成故障信息,即硬盘处于无故障状态即健康状态。
在一个示例性实施例中,响应故障信息收集命令,从目标寄存器中进行信息收集处理,包括:获取目标背板的地址信息,其中,目标背板上设有多个槽位,至少一个存储设备通过多个槽位与目标背板连接;基于地址信息,对多个槽位进行信息扫描处理;在扫描到故障信息的情况下,将故障信息和故障信息对应的槽位地址发送至目标寄存器,并从目标寄存器中进行信息收集处理。
可选的,目标背板可以是上述Expander背板,地址信息可以是Expander背板的地址。故障信息对应的槽位地址可以是处于故障状态的硬盘所插的槽位的地址。
具体的,在从目标寄存器即硬盘故障寄存器中进行信息收集处理的过程中,首先通过寻址找到Expander背板,然后对Expander背板上的多个槽位进行信息扫描,如果硬盘处于故障状态,由于硬盘插在槽位上,因此可以通过对多个槽位进行信息扫描,找到处于故障状态的硬盘。
进一步地,在扫描到故障信息的情况下,将故障信息和故障信息对应的槽位地址发送至硬盘故障寄存器,并从硬盘故障寄存器中进行信息收集处理。可选的,通过以下程序代码实现CPLD和BMC协作对存储设备进行监控:
i2c-test-b 1-s 0x74-m 1-w-d 0x0*;
i2c-test-b 1-s 0x11-m 1-w-d 0x85 0x0*;
i2c-test-b 1-s 0x11-m 1-w-d 0x87 0x0*0x**。
其中,i2c-test为本实施例中示例的I2C命令。
在一个示例性实施例中,基于内核信息,将CPU的内核与目标存储设备进行绑定处理,包括:从内核信息中获取CPU的空闲内核数量;确定目标存储设备的数量;根据目标存储设备的数量,将CPU的空闲内核数量进行平均分配,得到分配结果,其中,CPU的空闲内核数量大于目标存储设备的数量;根据分配结果,将CPU的内核与目标存储设备进行绑定处理。
可选的,服务器中包括至少一个CPU,一个CPU中有多个内核即CPU资源。由于在Tri-Mode模式下,多为HDD和NVMe SSD硬盘混合搭配使用,HDD和NVMe SSD之间存在抢占CPU资源的情况,因此,在本实施例中,通过从内核信息中获取CPU的空闲内核数量,将CPU的空闲内核数量进行平均分配,并将CPU的内核与目标存储设备即NVMe SSD进行绑定处理,实现了对服务器资源的合理优化,能够提升HDD和NVMe SSD等不同类型硬盘的优势。
例如,CPU的空闲内核数量为10个,NVMe SSD的数量为5个,平均分配即为每个NVMeSSD分配2个CPU内核,进一步地,将每个NVMe SSD即目标存储设备与2个CPU的内核进行绑定。
可选的,通过以下程序代码实现将目标存储设备与CPU的内核绑定:
#taskset-c2-5fio;
$CONF_DIR/$rw-$bs-$numjobs-$dep-nvme0n1>$RES_DIR/$bs-$rw-$numjobs-$dep-nvme0n1.txt&;
#taskset-c6-9fio;
$CONF_DIR/$rw-$bs-$numjobs-$dep-nvme1n1>$RES_DIR/$bs-$rw-$numjobs-$dep-nvme1n1.txt&;
#taskset-c10-13fio;
$CONF_DIR/$rw-$bs-$numjobs-$dep-nvme2n1>$RES_DIR/$bs-$rw-$numjobs-$dep-nvme2n1.txt&。
其中,taskset为绑定处理,“#taskset-c2-5fio”为将CPU的第2个到第5个内核绑定给第一个硬盘(目标存储设备)。
在一个示例性实施例中,基于设备信息,从至少一个存储设备中确定目标存储设备,包括:从设备信息中获取至少一个存储设备的盘符;基于盘符,确定至少一个存储设备的设备类型;基于设备类型,确定目标存储设备。
可选的,设备信息中至少包括至少一个存储设备的盘符,通过盘符可以确定至少一个存储设备的设备类型,从而可以通过设备类型确定目标存储设备。例如,传统机械硬盘HDD的盘符可以是SATA等,NVMe硬盘的盘符可以是NVMe0n1,NVMe1n1等。例如,从设备信息中获取至少一个存储设备的盘符为NVMe0n1,可以确定至少一个存储设备的设备类型为NVMe硬盘。
在一个示例性实施例中,在收集到故障信息的情况下,确定至少一个存储设备的运行状态处于故障状态之后,基于故障信息生成故障日志,并将故障日志发送至BMC的控制界面,以通过BMC的控制界面对目标对象展示故障日志,并基于故障日志确定对至少一个存储设备中的故障存储设备进行修复的策略。
可选的,目标对象可以是相关技术人员,例如,运维人员、测试人员等。具体的,在至少一个存储设备的运行过程中,实时监控至少一个存储设备的运行状态,通过BMC获取到故障信息之后,基于故障信息生成故障日志,并将故障日志发送至BMC的控制界面。
进一步地,可以通过BMC的控制界面对相关技术人员展示故障日志。可选的,基于故障日志确定对至少一个存储设备中的故障存储设备进行修复的策略,可以是相关技术人员查看故障日志,根据故障日志中的故障信息,定位到故障的存储设备,从而进行故障修复。
可选的,基于故障日志确定对至少一个存储设备中的故障存储设备进行修复的策略,也可以是通过服务器管理系统对故障日志中的故障信息进行分析,确定出与故障的存储设备相对应的修复策略。
在一个示例性实施例中,在基于内核信息,将CPU的内核与目标存储设备进行绑定处理之后,根据预设测试脚本,对绑定后的目标存储设备进行性能测试,生成测试数据;在测试数据满足预设阈值的情况下,确定绑定后的目标存储设备的性能稳定。
可选的,在本实施例中,以对目标存储设备即NVMe硬盘进行性能测试为例进行说明。具体的,如图3所示,BMC向CPLD发送故障信息收集命令即I2C命令,CPLD接收I2C命令,触发CPLD中的硬盘故障寄存器扫描并收集硬盘的故障信息。若收集到故障信息,则将故障信息回传至BMC的控制界面,并及时对故障的存储设备进行修复。
若没有收集到故障信息,或者,对故障的存储设备修复完成即解决故障之后,则继续获取CPU的空闲内核数量和多个硬盘的硬盘信息,例如,盘符、数量等信息。进一步地,通过硬盘的盘符,可以从传统机械硬盘和NVMe硬盘混合搭配使用的多个硬盘中,确定目标硬盘即NVMe硬盘。
进一步地,根据NVMe硬盘的数量,将当前CPU的空闲内核数量进行平均分配之后,将CPU的内核与NVMe硬盘进行绑定。可选的,如图3所示,CPU0的某些内核与硬盘0-7绑定,CPU0的某些内核与硬盘8-15中的某些硬盘绑定(例如,与硬盘8-10绑定),CPU1的某些内核与硬盘8-15中的某些硬盘绑定(例如,与硬盘11-15绑定),CPU1的某些内核与硬盘16-23绑定。
进一步地,根据预设测试脚本,对绑定后的NVMe硬盘进行性能测试,生成测试数据,在测试数据满足预设阈值的情况下,确定绑定后的目标存储设备的性能稳定。其中,预设阈值可以是设备带宽的90%,即硬盘的稳定性能达成设备带宽的90%,认为绑定后的NVMe硬盘在运行过程中可以发挥稳定的性能。其中,预设测试脚本可以由测试人员根据需求自行设定,在本实施例中不做限定。
需要说明的是,在本实施例中,可以首先对至少一个存储设备进行故障监控,确保硬盘在运行业务前,处在硬件和软件均无报错、无预警状态。还可以在业务运行过程中,对至少一个存储设备实时监控,抓取预警日志回传至BMC的控制界面的日志收集器中。另外,通过将NVMe硬盘和CPU的内核进行绑定,使硬盘得到足够的CPU资源,从而能够确保Tri-Mode三模信号背板和Tri-Mode三模信号RAID卡交互时,NVMe硬盘性能发挥到最佳水平。
由此可见,通过本发明的技术方案,达到了使目标存储设备发挥更好的性能优势的目的,从而实现了保障NVMe硬盘性能稳定发挥的技术效果,进而解决了现有技术中采用Tri-Mode模式进行硬盘混合搭配使用的情况下,NVMe硬盘等存储设备性能不稳定的技术问题。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的存储设备的管理方法。
在本实施例中还提供了一种存储设备的管理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本申请实施例的存储设备的管理装置的结构框图,如图4所示,该装置包括:接收模块402,用于在三模模式下,通过复杂可编程逻辑器件CPLD接收基板管理控制器BMC发送的故障信息收集命令;检测模块404,用于响应故障信息收集命令,检测至少一个存储设备的运行状态;获取模块406,用于在至少一个存储设备的运行状态处于无故障状态的情况下,获取中央处理器CPU的内核信息和至少一个存储设备的设备信息;确定模块408,用于基于设备信息,从至少一个存储设备中确定目标存储设备;处理模块410,用于基于内核信息,将CPU的内核与目标存储设备进行绑定处理,以使目标存储设备性能稳定。
需要说明的是,上述接收模块402、检测模块404、获取模块406、确定模块408以及处理模块410对应于上述实施例中的步骤S202至步骤S210,五个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述方法实施例所公开的内容。
可选的,检测模块包括:第一处理单元,用于响应故障信息收集命令,从目标寄存器中进行信息收集处理,其中,目标寄存器用于存储至少一个存储设备的故障信息;第一确定单元,用于在收集到故障信息的情况下,确定至少一个存储设备的运行状态处于故障状态;第二确定单元,用于在未收集到故障信息的情况下,确定至少一个存储设备的运行状态处于无故障状态。
可选的,第一处理单元包括:第一获取子模块,用于获取目标背板的地址信息,其中,目标背板上设有多个槽位,至少一个存储设备通过多个槽位与目标背板连接;第二处理子模块,用于基于地址信息,对多个槽位进行信息扫描处理;第三处理子模块,用于在扫描到故障信息的情况下,将故障信息和故障信息对应的槽位地址发送至目标寄存器,并从目标寄存器中进行信息收集处理。
可选的,处理模块包括:第二获取单元,用于从内核信息中获取CPU的空闲内核数量;第三确定单元,用于确定目标存储设备的数量;分配单元,用于根据目标存储设备的数量,将CPU的空闲内核数量进行平均分配,得到分配结果,其中,CPU的空闲内核数量大于目标存储设备的数量;第四处理单元,用于根据分配结果,将CPU的内核与目标存储设备进行绑定处理。
可选的,确定模块包括:第三获取单元,用于从设备信息中获取至少一个存储设备的盘符;第四确定单元,用于基于盘符,确定至少一个存储设备的设备类型;第五确定单元,用于基于设备类型,确定目标存储设备。
可选的,存储设备的管理装置还包括:发送模块,用于基于故障信息生成故障日志,并将故障日志发送至BMC的控制界面,以通过BMC的控制界面对目标对象展示故障日志,并基于故障日志确定对至少一个存储设备中的故障存储设备进行修复的策略。
可选的,存储设备的管理装置还包括:测试模块,用于根据预设测试脚本,对绑定后的目标存储设备进行性能测试,生成测试数据;第六确定模块,用于在测试数据满足预设阈值的情况下,确定绑定后的目标存储设备的性能稳定。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本申请的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种存储设备的管理方法,其特征在于,包括:
在三模模式下,通过复杂可编程逻辑器件CPLD接收基板管理控制器BMC发送的故障信息收集命令;
响应所述故障信息收集命令,检测至少一个存储设备的运行状态;
在所述至少一个存储设备的运行状态处于无故障状态的情况下,获取中央处理器CPU的内核信息和所述至少一个存储设备的设备信息;
基于所述设备信息,从所述至少一个存储设备中确定目标存储设备;
基于所述内核信息,将所述CPU的内核与所述目标存储设备进行绑定处理,以使所述目标存储设备性能稳定。
2.根据权利要求1所述的方法,其特征在于,响应所述故障信息收集命令,检测至少一个存储设备的运行状态,包括:
响应所述故障信息收集命令,从目标寄存器中进行信息收集处理,其中,所述目标寄存器用于存储所述至少一个存储设备的故障信息;
在收集到所述故障信息的情况下,确定所述至少一个存储设备的运行状态处于故障状态;
在未收集到所述故障信息的情况下,确定所述至少一个存储设备的运行状态处于所述无故障状态。
3.根据权利要求2所述的方法,其特征在于,响应所述故障信息收集命令,从目标寄存器中进行信息收集处理,包括:
获取目标背板的地址信息,其中,所述目标背板上设有多个槽位,所述至少一个存储设备通过所述多个槽位与所述目标背板连接;
基于所述地址信息,对所述多个槽位进行信息扫描处理;
在扫描到所述故障信息的情况下,将所述故障信息和所述故障信息对应的槽位地址发送至所述目标寄存器,并从所述目标寄存器中进行信息收集处理。
4.根据权利要求1所述的方法,其特征在于,基于所述内核信息,将所述CPU的内核与所述目标存储设备进行绑定处理,包括:
从所述内核信息中获取所述CPU的空闲内核数量;
确定所述目标存储设备的数量;
根据所述目标存储设备的数量,将所述CPU的空闲内核数量进行平均分配,得到分配结果,其中,所述CPU的空闲内核数量大于所述目标存储设备的数量;
根据所述分配结果,将所述CPU的内核与所述目标存储设备进行绑定处理。
5.根据权利要求1所述的方法,其特征在于,基于所述设备信息,从所述至少一个存储设备中确定目标存储设备,包括:
从所述设备信息中获取所述至少一个存储设备的盘符;
基于所述盘符,确定所述至少一个存储设备的设备类型;
基于所述设备类型,确定所述目标存储设备。
6.根据权利要求2所述的方法,其特征在于,在收集到所述故障信息的情况下,确定所述至少一个存储设备的运行状态处于故障状态之后,所述方法还包括:
基于所述故障信息生成故障日志,并将所述故障日志发送至所述BMC的控制界面,以通过所述BMC的控制界面对目标对象展示所述故障日志,并基于所述故障日志确定对所述至少一个存储设备中的故障存储设备进行修复的策略。
7.根据权利要求1所述的方法,其特征在于,在基于所述内核信息,将所述CPU的内核与所述目标存储设备进行绑定处理之后,所述方法还包括:
根据预设测试脚本,对绑定后的目标存储设备进行性能测试,生成测试数据;
在所述测试数据满足预设阈值的情况下,确定所述绑定后的目标存储设备的性能稳定。
8.一种存储设备的管理装置,其特征在于,包括:
接收模块,用于在三模模式下,通过复杂可编程逻辑器件CPLD接收基板管理控制器BMC发送的故障信息收集命令;
检测模块,用于响应所述故障信息收集命令,检测至少一个存储设备的运行状态;
获取模块,用于在所述至少一个存储设备的运行状态处于无故障状态的情况下,获取中央处理器CPU的内核信息和所述至少一个存储设备的设备信息;
确定模块,用于基于所述设备信息,从所述至少一个存储设备中确定目标存储设备;
处理模块,用于基于所述内核信息,将所述CPU的内核与所述目标存储设备进行绑定处理,以使所述目标存储设备性能稳定。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至7任一项中所述的存储设备的管理方法的步骤。
10.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至7任一项中所述的存储设备的管理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211625885.5A CN115858221A (zh) | 2022-12-16 | 2022-12-16 | 存储设备的管理方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211625885.5A CN115858221A (zh) | 2022-12-16 | 2022-12-16 | 存储设备的管理方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115858221A true CN115858221A (zh) | 2023-03-28 |
Family
ID=85673785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211625885.5A Pending CN115858221A (zh) | 2022-12-16 | 2022-12-16 | 存储设备的管理方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115858221A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116501563A (zh) * | 2023-06-25 | 2023-07-28 | 苏州浪潮智能科技有限公司 | 存储设备测试方法、系统、装置、通信设备及存储介质 |
CN117055824A (zh) * | 2023-10-12 | 2023-11-14 | 苏州元脑智能科技有限公司 | 控制器、控制器的配置方法及系统、存储介质及电子设备 |
-
2022
- 2022-12-16 CN CN202211625885.5A patent/CN115858221A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116501563A (zh) * | 2023-06-25 | 2023-07-28 | 苏州浪潮智能科技有限公司 | 存储设备测试方法、系统、装置、通信设备及存储介质 |
CN116501563B (zh) * | 2023-06-25 | 2023-09-29 | 苏州浪潮智能科技有限公司 | 存储设备测试方法、系统、装置、通信设备及存储介质 |
CN117055824A (zh) * | 2023-10-12 | 2023-11-14 | 苏州元脑智能科技有限公司 | 控制器、控制器的配置方法及系统、存储介质及电子设备 |
CN117055824B (zh) * | 2023-10-12 | 2024-02-09 | 苏州元脑智能科技有限公司 | 控制器、控制器的配置方法及系统、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6895534B2 (en) | Systems and methods for providing automated diagnostic services for a cluster computer system | |
US7058858B2 (en) | Systems and methods for providing automated diagnostic services for a cluster computer system | |
CN115858221A (zh) | 存储设备的管理方法、装置、存储介质及电子设备 | |
CN111181800B (zh) | 测试数据处理方法、装置、电子设备及存储介质 | |
CN110245759A (zh) | 一种巡检方法、系统、服务器及设备 | |
CN105183575A (zh) | 处理器故障的诊断方法、装置及系统 | |
CN111625419A (zh) | 一种日志采集方法、系统、设备及计算机可读存储介质 | |
CN112134754A (zh) | 压力测试方法、装置、网络设备及存储介质 | |
CN118568032A (zh) | 信息发送方法及装置、存储介质及电子设备 | |
CN109918221B (zh) | 一种硬盘报错解析方法、系统、终端及存储介质 | |
CN109471763B (zh) | 抓取NVME硬盘trace的方法、装置、设备及系统 | |
CN103532728B (zh) | 一种对故障dsp芯片复位的方法及装置 | |
CN115543872A (zh) | 一种设备管理方法、装置及计算机存储介质 | |
CN111858199A (zh) | 一种自适配硬盘日志采集方法、系统、终端及存储介质 | |
CN109885420B (zh) | 一种PCIe链路故障的分析方法、BMC及存储介质 | |
CN112306871A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN118245295A (zh) | 一种服务器的PCIe链路状态检测方法及服务器 | |
CN116137603B (zh) | 链路故障的检测方法和装置、存储介质及电子装置 | |
CN117667634A (zh) | 故障的确定方法及装置、存储介质、电子装置 | |
CN117271234A (zh) | 故障诊断方法、装置、存储介质及电子装置 | |
CN115543707A (zh) | 硬盘故障的检测方法、系统和装置、存储介质及电子装置 | |
CN114115753A (zh) | 一种存储设备、基于存储设备的请求处理方法及装置 | |
CN112003727A (zh) | 一种多节点服务器电源测试方法、系统、终端及存储介质 | |
CN112905415A (zh) | 一种串口日志文件获取方法、装置及相关组件 | |
CN116886445B (zh) | 过滤结果的处理方法及装置、存储介质、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |