CN113204361A - 一种整机柜服务器自动配置方法及装置 - Google Patents

一种整机柜服务器自动配置方法及装置 Download PDF

Info

Publication number
CN113204361A
CN113204361A CN202110552729.XA CN202110552729A CN113204361A CN 113204361 A CN113204361 A CN 113204361A CN 202110552729 A CN202110552729 A CN 202110552729A CN 113204361 A CN113204361 A CN 113204361A
Authority
CN
China
Prior art keywords
information
firmware
node
rmc
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110552729.XA
Other languages
English (en)
Inventor
张志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yingxin Computer Technology Co Ltd
Original Assignee
Shandong Yingxin Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Yingxin Computer Technology Co Ltd filed Critical Shandong Yingxin Computer Technology Co Ltd
Priority to CN202110552729.XA priority Critical patent/CN113204361A/zh
Publication of CN113204361A publication Critical patent/CN113204361A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/325Display of status information by lamps or LED's
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/71Version control; Configuration management

Abstract

本发明公开一种整机柜服务器自动配置方法及装置,RMC读取各个节点的固件版本信息;将所读取的固件版本信息与数据库模块中预存的固件文件的版本信息进行比较;若两者不一致,则调取相应的固件刷新工具,使用预存的固件文件对相应节点进行固件刷新。本发明预先在数据库模块中存储各个节点对应的固件文件,所有节点的信息均可由RMC获取,RMC根据获得的节点信息集合数据库模块中的存储文件对节点进行自动配置,使RMC既实现自身对整机柜的监控功能,又可对节点进行批量文件刷新,实现RMC和BMC功能的结合,提升用户使用的便利性,提高工作效率。

Description

一种整机柜服务器自动配置方法及装置
技术领域
本发明涉及整机柜服务器配置领域,具体涉及一种整机柜服务器自动配置方法及装置。
背景技术
随着互联网、公有云等网络业务的迅速发展,互联网服务企业对服务器的使用要求也越来越高,整机柜服务器因其占地小、存储/计算密度高,在更多行业和场景下得到了广泛应用。
相比于标准塔式/机架式服务器的传统监控设备BMC(Baseboard ManagementController,基板管理控制器)来说,在整机柜服务器的架构中又增加了针对于整机柜的监控设备RMC(Rack Manager Center,整机柜管理中心),BMC和RMC统称为服务器的外围监控设备。二者分别在单节点和整机柜的状态监控中发挥着作用,相得益彰、优势互补,共同保障了多台服务器的正常平稳运行。
然而,BMC和RMC虽然同为服务器外围监控设备,但二者更多的在独立工作,对于单节点的状态监测和控制需要登录该节点的BMC web界面或在系统下使用IPMI指令,对于整机柜的整体监控则需要登录RMC界面进行操作。
简言之,RMC主要负责对整机柜节点状态的整体把控,BMC负责对单个节点的状态监控以及单个节点的固件、FRU信息刷新。如何将RMC和BMC的功能相结合,在宏观和微观两方面同时实现对服务器的监测和控制,是现有技术所缺失的。
发明内容
为解决上述问题,本发明提供一种整机柜服务器自动配置方法及装置。
本发明的技术方案为:一种整机柜服务器自动配置方法,包括以下步骤:
RMC读取各个节点的固件版本信息;
将所读取的固件版本信息与数据库模块中预存的固件文件的版本信息进行比较;
若两者不一致,则调取相应的固件刷新工具,使用预存的固件文件对相应节点进行固件刷新。
进一步地,该方法还包括以下步骤:
RMC读取各个节点的FRU信息;
筛选出需刷新的关键字;
在数据库模块中编辑所筛选的需刷新关键字;
将编辑后的FRU信息进行扩展;
根据扩展后的FRU信息对节点进行FRU信息批量刷新。
进一步地,该方法还包括以下步骤:
RMC读取各个节点的配置信息;
判断该次所读取配置信息与所保存的上一次读取的配置信息是否一致;
若不一致,则发出报警。
进一步地,该方法还包括以下步骤:
在该次所读取配置信息与所保存的上一次读取的配置信息不一致时,将异常信息以事件日志形式输出。
进一步地,所读取配置信息包括风扇状态信息、电源状态信息、节点位置信息、硬件变化信息、FRU信息。
本发明的技术方案还包括一种整机柜服务器自动配置装置,包括,
数据库模块:与各个RMC芯片通讯,存储各个节点的固件文件,编辑各个节点的FRU信息;
读取模块:配置于RMC芯片,读取各个节点的固件版本信息、FRU信息和配置信息,并将所读取的固件版本信息与数据库模块中对应固件文件的版本信息进行比较,将所读取的配置信息与上一次读取的配置信息进行比较;
刷新模块:配置于RMC芯片,存储有固件刷新工具,对节点进行固件刷新和FRU信息刷新。
进一步地,存入数据库模块的固件文件以对应整机柜位置、整机柜上节点位置为依据进行分类存放。
进一步地,新存入数据库模块的固件文件自动覆盖数据库模块中原有的对应固件文件。
本发明提供的一种整机柜服务器自动配置方法及装置,预先在数据库模块中存储各个节点对应的固件文件,所有节点的信息均可由RMC获取,RMC根据获得的节点信息集合数据库模块中的存储文件对节点进行自动配置,使RMC既实现自身对整机柜的监控功能,又可对节点进行批量文件刷新,实现RMC和BMC功能的结合,提升用户使用的便利性,提高工作效率。
附图说明
图1是本发明具体实施例一固件刷新方法流程示意图;
图2是本发明具体实施例一FRU信息刷新方法流程示意图;
图3是本发明具体实施例一配置信息监控方法流程示意图;
图4是本发明具体实施例二结构示意框图;
图5是本发明具体实施例二工作流程示意图。
具体实施方式
下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
实施例一
本实施例提供一种整机柜服务器自动配置方法,该方法由RMC读取各节点的相关信息,并在数据库模块中预存相关文件、对相关信息进行编辑等,RMC与数据模块向结合实现RMC对节点的自动监控和配置。
如图1所示,本实施例的方法包括节点固件刷新过程,包括以下步骤:
S101,RMC读取各个节点的固件版本信息;
S102,将所读取的固件版本信息与数据库模块中预存的固件文件的版本信息进行比较;
S103,若两者不一致,则调取相应的固件刷新工具,使用预存的固件文件对相应节点进行固件刷新。
需要说明的是,需要进行固件刷新时,首先将固件文件存入数据库模块,然后通知RMC读取节点的固件版本信息并进行比较刷新等。优选地,在刷新完成后,可由RMC再次读取节点固件版本信息。以验证是否刷新成功。
如图2所示,本实施例的方法还包括节点FRU信息刷新过程,包括以下步骤:
S201,RMC读取各个节点的FRU信息;
S202,筛选出需刷新的关键字;
S203,在数据库模块中编辑所筛选的需刷新关键字;
S204,将编辑后的FRU信息进行扩展;
S205,根据扩展后的FRU信息对节点进行FRU信息批量刷新。
FRU是Field Replace Unit(现场可更换单元)的简称,FRU信息包括产品型号(Product Part Number,简称PPN)、机器的序列号(Serial Number)等等,方便后续对机器的各个部件进行维护。
需要说明的是,本方法中RMC读取FRU信息,由数据库模块对FRU信息进行编辑,编辑后RMC对节点进行刷新。
所获取关键字可以是FRU信息的任一信息,以PPN为例,本实施例需对各节点的PPN进行排序,RMC读取出各节点FRU信息,并筛选出PPN关键字后,数据库对各PPN进行扩展,具体为将PPN按节点从下到上的位置进行编号。
如图3所示,本实施例的方法还包括对节点的配置监控过程,包括以下步骤:
S301,RMC读取各个节点的配置信息;
S302,判断该次所读取配置信息与所保存的上一次读取的配置信息是否一致;
S303,若不一致,则发出报警。
需要说明的是,所读取配置信息包括风扇状态信息、电源状态信息、节点位置信息、硬件变化信息、FRU信息。
在步骤S302判断两者不一致时,所发出报警可以是触发指示灯亮起,除此之外,还将异常信息以事件日志形式输出,事件日志中包含发生异常的节点信息,以便工作人员定位。其中所读取的配置信息包括FRU信息,在机柜出厂前,已对各节点FRU信息进行刷新,该步骤的监控功能可监测FRU信息是否有改动。
实施例二
如图4所示,本实施例提供一种整机柜服务器自动配置装置,运行后可实现实施例一的方法。
该装置包括以下功能模块:
(1)数据库模块:与各个RMC芯片通讯,存储各个节点的固件文件,编辑各个节点的FRU信息。
需要说明的是,存入数据库模块的固件文件以对应整机柜位置、整机柜上节点位置为依据进行分类存放,防止文件混淆,进而引发刷新模块的误操作或者无操作。
另外,新存入数据库模块的固件文件自动覆盖数据库模块中原有的对应固件文件,保证同类型固件文件的唯一性和正确性。
对于FRU信息,数据库模块自动按序扩展,扩展的范围和数量与该整机柜节点数量相匹配。
(2)读取模块:配置于RMC芯片,读取各个节点的固件版本信息、FRU信息和配置信息,并将所读取的固件版本信息与数据库模块中对应固件文件的版本信息进行比较,将所读取的配置信息与上一次读取的配置信息进行比较。
需要说明的是,所读取的信息可安装节点所在机柜位置进行标号保存,以进行后续比对等工作。
(3)刷新模块:配置于RMC芯片,存储有固件刷新工具,对节点进行固件刷新和FRU信息刷新。
需要说明的是,刷新模块可进行单个或多个节点固件版本、FRU信息的刷新。以固件刷新为例,当读取模块与数据库模块信息比对完成后,若有不同,刷新模块就会定位节点位置、定位需要刷新的文件,驱动刷新模块执行动作。
如图5所示,该装置包括监控、固件自动配置、FRU信息自动配置功能。
一台配有30台节点的整机柜为例,此时进行节点错误警告(监控功能),图示顺序为:①→②
1)30台节点通过刷新后的FRU信息加以区分,每间隔300s读取模块抓取各个节点的配置信息;
2)当风扇/电源状态发生变化、节点位置发生变化、或某个节点的硬件发生变化时,读取模块通过与之前保存的信息做对比,发现不同后在不覆盖原有配置信息的前提下,保存现有节点配置信息,同时将异常信息以RMC Event Log(事件日志)的形式输出;
3)以电信号的形式发送指令至RMC芯片,RMC板指示灯亮红灯
4)人工查看具体报错信息并进行干预。
输出的Event Log可定位到出现错误告警的节点及具体部件,方便运维人员进行筛查;而当人为判断该告警信息可接受或者可忽略时,此时可启动读取模块的reset功能,重新抓取并保存节点配置信息,以reset后的信息为标准,并对节点配置信息重新进行监测。
一台配有30台节点的整机柜为例,此时进行BIOS、BMC等固件版本的刷新(自动配置功能),图示顺序为:③→④→⑤
1)将需要刷新的固件文件上传至数据库模块,数据库模块会根据整机柜和机柜上节点的不同对固件文件加以区分保存;
2)调用读取模块,进行30台节点的固件版本信息读取;
3)将读取到的固件版本与上传至数据库模块中的固件文件版本进行对比,当读取模块读取到的节点固件版本与数据库中固件版本一致时,RMC保持未操作状态;当二者版本不同时,自动调用刷新模块,对该节点进行固件版本刷新;当刷新完成后执行节点自动重启命令;
4)当节点重启完成后,再次由读取模块对节点固件版本进行读取并核对。
一台配有30台节点的整机柜为例,此时进行FRU信息的刷新(自动配置功能),图示顺序为:①→③→⑥
1)读取模块将30台节点的FRU信息进行读取,读取到的信息以节点从下往上的位置进行1-29编号
2)筛选出想要刷新的关键字,如Product Part Number(PPN),调用数据库模块,在数据库模块中编辑想要刷新的关键字PPN-Inspur-X(X为1-29的编号)
3)编辑完成后,调用刷新模块进行FRU信息批量刷新。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。

Claims (8)

1.一种整机柜服务器自动配置方法,其特征在于,包括以下步骤:
RMC读取各个节点的固件版本信息;
将所读取的固件版本信息与数据库模块中预存的固件文件的版本信息进行比较;
若两者不一致,则调取相应的固件刷新工具,使用预存的固件文件对相应节点进行固件刷新。
2.根据权利要求1所述的整机柜服务器自动配置方法,其特征在于,该方法还包括以下步骤:
RMC读取各个节点的FRU信息;
筛选出需刷新的关键字;
在数据库模块中编辑所筛选的需刷新关键字;
将编辑后的FRU信息进行扩展;
根据扩展后的FRU信息对节点进行FRU信息批量刷新。
3.根据权利要求2所述的整机柜服务器自动配置方法,其特征在于,该方法还包括以下步骤:
RMC读取各个节点的配置信息;
判断该次所读取配置信息与所保存的上一次读取的配置信息是否一致;
若不一致,则发出报警。
4.根据权利要求3所述的整机柜服务器自动配置方法,其特征在于,该方法还包括以下步骤:
在该次所读取配置信息与所保存的上一次读取的配置信息不一致时,将异常信息以事件日志形式输出。
5.根据权利要求3或4所述的整机柜服务器自动配置方法,其特征在于,所读取配置信息包括风扇状态信息、电源状态信息、节点位置信息、硬件变化信息、FRU信息。
6.一种整机柜服务器自动配置装置,其特征在于,包括,
数据库模块:与各个RMC芯片通讯,存储各个节点的固件文件,编辑各个节点的FRU信息;
读取模块:配置于RMC芯片,读取各个节点的固件版本信息、FRU信息和配置信息,并将所读取的固件版本信息与数据库模块中对应固件文件的版本信息进行比较,将所读取的配置信息与上一次读取的配置信息进行比较;
刷新模块:配置于RMC芯片,存储有固件刷新工具,对节点进行固件刷新和FRU信息刷新。
7.根据权利要求6所述的整机柜服务器自动配置装置,其特征在于,存入数据库模块的固件文件以对应整机柜位置、整机柜上节点位置为依据进行分类存放。
8.根据权利要求7所述的整机柜服务器自动配置装置,其特征在于,新存入数据库模块的固件文件自动覆盖数据库模块中原有的对应固件文件。
CN202110552729.XA 2021-05-20 2021-05-20 一种整机柜服务器自动配置方法及装置 Pending CN113204361A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110552729.XA CN113204361A (zh) 2021-05-20 2021-05-20 一种整机柜服务器自动配置方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110552729.XA CN113204361A (zh) 2021-05-20 2021-05-20 一种整机柜服务器自动配置方法及装置

Publications (1)

Publication Number Publication Date
CN113204361A true CN113204361A (zh) 2021-08-03

Family

ID=77032102

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110552729.XA Pending CN113204361A (zh) 2021-05-20 2021-05-20 一种整机柜服务器自动配置方法及装置

Country Status (1)

Country Link
CN (1) CN113204361A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104615447A (zh) * 2015-03-12 2015-05-13 浪潮集团有限公司 一种整机柜服务器监控管理软件复用方法
CN105511924A (zh) * 2015-12-10 2016-04-20 浪潮电子信息产业股份有限公司 一种基于rack的节点中板混插使用自动刷新固件的设计方法
CN105868077A (zh) * 2016-04-12 2016-08-17 浪潮电子信息产业股份有限公司 一种获取整机柜服务器节点监控信息的方法
US20180212823A1 (en) * 2015-10-14 2018-07-26 Inspur Electronic Information Industry Co., Ltd Monitoring and management method for complete machine cabinet server

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104615447A (zh) * 2015-03-12 2015-05-13 浪潮集团有限公司 一种整机柜服务器监控管理软件复用方法
US20180212823A1 (en) * 2015-10-14 2018-07-26 Inspur Electronic Information Industry Co., Ltd Monitoring and management method for complete machine cabinet server
CN105511924A (zh) * 2015-12-10 2016-04-20 浪潮电子信息产业股份有限公司 一种基于rack的节点中板混插使用自动刷新固件的设计方法
CN105868077A (zh) * 2016-04-12 2016-08-17 浪潮电子信息产业股份有限公司 一种获取整机柜服务器节点监控信息的方法

Similar Documents

Publication Publication Date Title
US9189349B2 (en) Distributed blade server system, management server and switching method
US20060218326A1 (en) Blade server system and method of managing same
CN105450472A (zh) 一种自动获取服务器物理部件状态的方法及装置
US20110060826A1 (en) Detecting and determining availability of a network structure with active connection nodes
CN112799909A (zh) 一种服务器自动化管理系统及方法
CN111796959A (zh) 宿主机容器自愈方法、装置及系统
CN112529223A (zh) 一种设备故障报修方法、装置、服务器及储存介质
CN113364628A (zh) 服务器与交换机拓扑关系建立方法及设备
WO2017220013A1 (zh) 业务处理方法及装置、存储介质
US6973412B2 (en) Method and apparatus involving a hierarchy of field replaceable units containing stored data
US7631064B1 (en) Method and apparatus for determining interconnections of network devices
GB2398405A (en) Consolidating data regarding a hierarchy of field replaceable units containing stored data
CN113067729B (zh) 一种网络设备监控方法、设备及介质
CN112671586B (zh) 一种业务配置自动迁移和保障方法及装置
CN109271270A (zh) 存储系统中底层硬件的故障排除方法、系统及相关装置
CN113204361A (zh) 一种整机柜服务器自动配置方法及装置
CN110968456B (zh) 分布式存储系统中故障磁盘的处理方法及装置
CN104253715A (zh) 多层级联业务监控系统及方法
CN116737444A (zh) 一种数据库服务器故障处理方法及系统
CN116719657A (zh) 一种固件故障日志生成方法、装置、服务器及可读介质
CN114860494A (zh) 一种sas拓展器配置自适应系统
TWI685740B (zh) 運用於資料中心的機櫃異常狀態的遠端排除方法(一)
CN114064401A (zh) 定位硬盘故障的方法、装置、电子设备及存储介质
CN111199701B (zh) 一种led点阵显示屏同步控制系统及其自检方法
CN111459556A (zh) 一种基于客户现场的服务器bmc批量配置方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination