CN108874420B - 一种批量服务器fru的远程刷新系统及方法 - Google Patents

一种批量服务器fru的远程刷新系统及方法 Download PDF

Info

Publication number
CN108874420B
CN108874420B CN201810599526.4A CN201810599526A CN108874420B CN 108874420 B CN108874420 B CN 108874420B CN 201810599526 A CN201810599526 A CN 201810599526A CN 108874420 B CN108874420 B CN 108874420B
Authority
CN
China
Prior art keywords
server
fru
remote
batch
self
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810599526.4A
Other languages
English (en)
Other versions
CN108874420A (zh
Inventor
张日洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810599526.4A priority Critical patent/CN108874420B/zh
Publication of CN108874420A publication Critical patent/CN108874420A/zh
Application granted granted Critical
Publication of CN108874420B publication Critical patent/CN108874420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2284Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by power-on test, e.g. power-on self test [POST]

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明属于计算机服务器技术领域,公开了一种批量服务器FRU的远程刷新系统及方法,该系统包括远程管理器和基板服务器,远程管理器与基板服务器通过连接单元建立通讯,远程管理器用于对基板服务器执行带外FRU状态自检和带外FRU批量刷新,基板服务器用于系统状态自检。该方法包括:搭建测试平台,远程管理器与基板服务器建立通讯;基板服务器进行系统状态自检,用于判断基板服务器的操作系统及位数;远程管理器对基板服务器执行带外远程FRU自检脚本进行自检;远程管理器执行带外批量刷新FRU脚本,对基板服务器进行批量刷新。本发明可对基板服务器批量带外刷新,不用人工单节点本地逐一单独刷新,节省刷新时间,提高工作效率。

Description

一种批量服务器FRU的远程刷新系统及方法
技术领域
本发明属于计算机服务器技术领域,具体地说是一种批量服务器FRU的远程刷新系统及方法。
背景技术
FRU的技术最早使用在服务器等大型设备上,以IBM的水平最高,后来FRU技术被Dell移植在PC上,接着联想等厂商也开始了FRU的步伐。对于服务器和PC中,厂商为了节省成本,把设备分成多个FRU,大到Power Supply,Board Number,小到Fan之类的。
所有的PC(Personal Computer)、通用以及RACK服务器,正常显示各设备信息的FRU(Field Replace Unit)现场可更换单元,对于多数节点在系统下需要刷新各种主板制造商,产品生产商等各种信息,其中FRU集成各种信息于一体,目前多数服务器厂商对于FRU的刷新,多采取单节点本地系统使用不同刷新工具,对FRU信息进行刷新,对于多数批量的服务器刷新,则没有更好的批量刷新方法,只能人工逐个节点进行依次刷新,增加人均工作量,效率也慢。
所以对于大量节点进行批量刷新FRU功能就变得至关重要,快速有效准确的刷新各种FRU信息,能够大大提高工作效率。
发明内容
本发明的目的是提供一种批量服务器FRU的远程刷新系统及方法,能够快速有效的把需要导入的产品信息批量的刷入服务器中,使产品信息完整,提高刷新工作效率,同时可检测FRU信息是否批量刷新完全以及刷新正确。
为了实现上述目的,本发明的技术方案是:
一种批量服务器FRU的远程刷新系统,包括远程管理器和基板服务器,所述远程管理器与基板服务器通过连接单元建立通讯,所述远程管理器用于对所述基板服务器执行带外FRU状态自检和带外FRU批量刷新,所述基板服务器用于系统状态自检。
具体的,所述远程管理器包括输入单元、读取单元、比较单元、提示单元;
所述输入单元,用于输入FRU信息;
所述读取单元,用于从所述远程管理器和基板服务器中读取FRU信息;
所述比较单元,用于判断读取的FRU信息与所述输入FRU信息是否一致;
所述提示单元,用于生成异常错误日志。
具体的,所述远程管理器还包括获取单元、分析单元;
所述获取单元,用于获取日志文件中的错误日志;
所述分析单元,用于通过对比获取的错误日志和异常错误日志,分析FRU的异常原因,解决问题。
本发明还提供一种批量服务器FRU的远程刷新方法,所述的方法包括以下步骤:
S1.搭建测试平台,远程管理器与基板服务器建立通讯;
S2.基板服务器进行系统状态自检,用于判断基板服务器的操作系统及位数;
S3.远程管理器对基板服务器执行带外远程FRU自检脚本进行自检;
S4.远程管理器执行带外批量刷新FRU脚本,对基板服务器进行批量刷新。
具体的,所述步骤S2.远程管理器向基板服务器发出系统状态查询命令,基板服务器进行系统状态自检,用于判断基板服务器的操作系统,并将结果传回远程管理器。
具体的,所述步骤S3中,基板服务器执行带外远程FRU自检脚本进行自检的方法包括;
S31.远程管理器根据基板服务器的系统状态自检结果配置匹配的带外远程FRU自检脚本;
S32.执行带外远程FRU自检脚本进行带外远程FRU自检;
S33.带外远程FRU自检完成生成自检结果日志,远程管理器获取其中的错误日志,
若无错误日志,则进行步骤S4;
若有错误日志,远程管理器分析错误异常原因,解决错误异常,继续执行步骤S32、S33。
具体的,所述步骤S4中,远程管理器执行带外批量刷新FRU脚本,对基板服务器进行批量刷新的方法包括:
S41.远程管理器配置匹配的带外批量刷新FRU脚本,输入批量基板服务器的BMC信息、FRU信息;
S42.执行带外批量刷新FRU脚本,进行FRU信息批量刷新,并生成日志文件;
S43.远程管理器获取日志文件中的错误日志,分析错误异常原因,解决错误异常;
S44.解决错误异常后,继续执行步骤S2、S3、S4,直至刷新成功。
本发明的有益效果为:
1.本发明的批量服务器FRU的远程刷新系统及方法覆盖多种操作系统的多种位数下的FRU的批量刷新,例如linux64位、linux32位、windows64位、windows32位操作系统均可适用。
2.本发明的批量服务器FRU的远程刷新方法程序自动执行,进行FRU信息自检,可有效快速检查服务器的FRU信息,及时监控厂商及产品FRU信息缺失、错误、版本不符等异常情况等,自动收集所有FRU信息,同时可批量刷新导入所需产品信息,有效准确地体现了产品设备信息。
3.本发明的脚本自动执行,免去人工操作,效率提升,准确率提升。
4.该方法与传统FRU刷新区别在于,可批量带外刷新,不用人工单节点本地逐一单独刷新,节省刷新时间,提高工作效率,还可实现FRU信息自检,错误自查,批量刷新,节省人力,保证FRU信息快速有效准确的进行大批量刷新。
附图说明
图1为本发明的批量服务器FRU的远程刷新方法的流程图。
具体实施方式
根据下述实施例,可以更好地理解本发明。然而,本领域的技术人员容易理解,以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
一种批量服务器FRU的远程刷新系统,包括远程管理器和基板服务器,所述远程管理器与基板服务器通过连接单元建立通讯,所述远程管理器用于对所述基板服务器执行带外FRU状态自检和带外FRU批量刷新,所述基板服务器用于系统自检。
所述远程管理器包括输入单元、读取单元、比较单元、提示单元、获取单元、分析单元;
所述输入单元,用于输入FRU信息;
所述读取单元,用于从所述远程管理器和基板服务器中读取FRU信息;
所述比较单元,用于判断读取的FRU信息与所述输入FRU信息是否一致;
所述提示单元,用于生成异常错误日志。
所述获取单元,用于日志文件中的错误日志;
所述分析单元,用于通过对比获取的错误日志和异常错误日志,分析FRU的异常原因,解决问题。
本发明同时提供了一种批量服务器FRU的远程刷新方法,如图1所示,所述的方法包括以下步骤:
S1.搭建测试平台,远程管理器与批量基板服务器通过连接单元建立通讯;
S2.基板服务器进行系统状态自检,用于判断基板服务器的操作系统;
S3.远程管理器对批量基板服务器执行带外远程FRU自检脚本进行自检;
S4.远程管理器执行带外批量刷新FRU脚本,对批量基板服务器进行批量刷新。
所述步骤S2.远程管理器向基板服务器发出系统状态查询命令,基板服务器进行系统状态自检,用于判断基板服务器的操作系统及位数,并将结果传回远程管理器。
所述步骤S3中,基板服务器执行带外远程FRU自检脚本进行自检的方法包括;
S31.远程管理器根据基板服务器的系统状态自检结果配置匹配的带外远程FRU自检脚本;
S32.执行带外远程FRU自检脚本进行带外远程FRU自检;
S33.带外远程FRU自检完成生成自检结果日志,远程管理器获取其中的错误日志,
若无错误日志,则进行步骤S4;
若有错误日志,远程管理器分析错误异常原因,解决错误异常,继续执行步骤S32、S33。
所述步骤S4中,远程管理器执行带外批量刷新FRU脚本,对基板服务器进行批量刷新的方法包括:
S41.远程管理器配置匹配的带外批量刷新FRU脚本,输入批量基板服务器的BMC信息、FRU信息;
S42.执行带外批量刷新FRU脚本,进行FRU信息批量刷新,并生成日志文件;
S43.远程管理器获取日志文件中的错误日志,分析错误异常原因,解决错误异常;
S44.解决错误异常后,继续执行步骤S2、S3、S4,直至刷新成功。
基板服务器系统状态自检,对于不同操作系统的服务器,如Linux和windows环境下32位与64位。虽然对应的批量刷新方法相同,但是使用的刷新工具脚本有32位与64位之分,所以对于本地服务器操作系统的自检变得很重要,不同系统下不同位数的刷新,增加了刷新的覆盖率。也可保证批量FRU刷新的正常进行。以下介实施例以Linux下64位为例。
实施例1
一种批量服务器FRU的远程刷新方法包括以下步骤:
S1.搭建测试平台,将远程管理器与基板服务器通过连接单元建立通讯,确保远程管理器与机房内各个基板服务器的BMC IP能够ping通,并可登录有效;
S2.远程管理器向基板服务器发出系统状态查询命令,基板服务器进行系统状态自检,自检判断得到该操作系统为linux64位操作系统,并将系统自检结果传回远程管理器;
S3.远程管理器根据基板服务器的系统状态自检结果配置匹配linux64位操作系统的带外远程FRU自检脚本,先增加自检脚本的权限.chmod 777flash_fru_selftest.sh,然后执行带外远程FRU自检脚本./flash_fru_selftest.sh-i ipfile standard.fru,对基板服务器进行批量自检,其中IPfile为批量服务器的BMC信息,包括BMC IP、用户名以及密码,standard.fru为通用fru信息,通过自检脚本生成测试log,可批量查看此时服务器FRU显示状态,有无异常,各种厂商、产品编码等信息,同时可收集此种服务器FRU各版块包含信息;获取单元获取其中的错误日志,若无错误日志,则进行下一程序;若获取到错误日志,分析单元分析错误异常原因,解决错误异常,继续执行带外远程FRU自检脚本进行带外远程FRU自检,直至若无错误日志,进行下一程序;
S4.远程管理器配置匹配linux64位操作系统的带外批量刷新FRU脚本,先增加带外批量刷新FRU脚本权限.chmod 777flash_fru_outband.sh,然后执行./flash_fru_outband.sh-i ipfile update.fru进行批量刷新,按照FRU设备对应关系,对需要导入的FRU信息进行批量刷新,刷新成功后自动生成对应基板服务器的pass.log日志,可查看是否刷新成功,有无错误产品信息,对厂商产品信息的准确性提高;若刷新失败,则会停止刷新,并生成fail.log日志文件,分析单元分析错误日志,找到刷新错误的基板服务器,分析错误原因,比如刷新过程中IP中断,或者刷新系统与刷新工具不兼容,亦或者待刷新FRU信息与实际基板服务器设备信息不一致,数量缺失或多余等,解决刷新错误问题,然后进行步骤S3、S4,直至FRU批量刷新至成功。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请,并不能以此限制本申请的保护范围。凡根据本申请精神实质所做的等效变化或修饰,都应涵在盖本申请的保护范围内。

Claims (7)

1.一种批量服务器FRU的远程刷新方法,其特征在于,所述的方法包括以下步骤:
S1.搭建测试平台,远程管理器与基板服务器建立通讯;
S2.基板服务器进行系统状态自检,用于判断基板服务器的操作系统及位数;
S3.远程管理器根据基板服务器的系统状态自检结果配置匹配的带外远程FRU自检脚本;远程管理器对基板服务器执行带外远程FRU自检脚本进行自检;
S4.远程管理器执行带外批量刷新FRU脚本,对基板服务器进行批量刷新。
2.如权利要求1所述的一种批量服务器FRU的远程刷新方法,其特征在于,所述步骤S2.远程管理器向基板服务器发出系统状态查询命令,基板服务器进行系统状态自检,用于判断基板服务器的操作系统及位数,并将结果传回远程管理器。
3.如权利要求1所述的一种批量服务器FRU的远程刷新方法,其特征在于,所述步骤S3中,基板服务器执行带外远程FRU自检脚本进行自检的方法包括;
S32.执行带外远程FRU自检脚本进行带外远程FRU自检;
S33.带外远程FRU自检完成生成自检结果日志,远程管理器获取其中的错误日志,
若无错误日志,则进行步骤S4;
若有错误日志,远程管理器分析错误异常原因,解决错误异常,继续执行步骤S32、S33。
4.如权利要求1所述的一种批量服务器FRU的远程刷新方法,其特征在于,所述步骤S4中,远程管理器执行带外批量刷新FRU脚本,对基板服务器进行批量刷新的方法包括:
S41.远程管理器配置匹配的带外批量刷新FRU脚本,输入批量基板服务器的BMC信息、FRU信息;
S42.执行带外批量刷新FRU脚本,进行FRU信息批量刷新,并生成日志文件;
S43.远程管理器获取日志文件中的错误日志,分析错误异常原因,解决错误异常;
S44.解决错误异常后,继续执行步骤S2、S3、S4,直至刷新成功。
5.一种批量服务器FRU的远程刷新系统,实现如权利要求1-4任一所述的批量服务器FRU的远程刷新方法,其特征在于,包括远程管理器和基板服务器,所述远程管理器与基板服务器通过连接单元建立通讯,所述远程管理器用于对所述基板服务器执行带外FRU状态自检和带外FRU批量刷新,所述基板服务器用于系统状态自检。
6.如权利要求5所述的一种批量服务器FRU的远程刷新系统,其特征在于,所述远程管理器包括输入单元、读取单元、比较单元、提示单元;
所述输入单元,用于输入FRU信息;
所述读取单元,用于从所述远程管理器和基板服务器中读取FRU信息;
所述比较单元,用于判断读取的FRU信息与所述输入FRU信息是否一致;
所述提示单元,用于生成异常错误日志。
7.如权利要求6所述的一种批量服务器FRU的远程刷新系统,其特征在于,所述远程管理器还包括获取单元、分析单元;
所述获取单元,用于获取日志文件中的错误日志;
所述分析单元,用于通过对比异常错误日志和获取的错误日志,分析FRU的异常原因,解决问题。
CN201810599526.4A 2018-06-12 2018-06-12 一种批量服务器fru的远程刷新系统及方法 Active CN108874420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810599526.4A CN108874420B (zh) 2018-06-12 2018-06-12 一种批量服务器fru的远程刷新系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810599526.4A CN108874420B (zh) 2018-06-12 2018-06-12 一种批量服务器fru的远程刷新系统及方法

Publications (2)

Publication Number Publication Date
CN108874420A CN108874420A (zh) 2018-11-23
CN108874420B true CN108874420B (zh) 2021-07-23

Family

ID=64338067

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810599526.4A Active CN108874420B (zh) 2018-06-12 2018-06-12 一种批量服务器fru的远程刷新系统及方法

Country Status (1)

Country Link
CN (1) CN108874420B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101030867A (zh) * 2006-02-28 2007-09-05 联想(北京)有限公司 一种bios刷新升级的系统和方法
CN101833462A (zh) * 2010-04-01 2010-09-15 山东高效能服务器和存储研究院 一种跨操作系统平台的通用的安装程序制作方法
CN202736027U (zh) * 2011-12-23 2013-02-13 广东电网公司电力科学研究院 等保测评中操作系统安全的自动测评系统
CN103593211A (zh) * 2013-11-01 2014-02-19 浪潮电子信息产业股份有限公司 一种带外隔离刷写固件程序的方法
CN104899061A (zh) * 2015-05-27 2015-09-09 浪潮电子信息产业股份有限公司 一种自动刷新fru信息的方法
CN107066307A (zh) * 2017-05-27 2017-08-18 郑州云海信息技术有限公司 一种易运维的带外批量定向升级bmc的方法
CN107171833A (zh) * 2017-05-03 2017-09-15 深圳市同泰怡信息技术有限公司 一种通过bmc实现服务器bmc和bios批量升级方法
CN107423081A (zh) * 2017-04-14 2017-12-01 广东浪潮大数据研究有限公司 一种带外批量升级bmc固件的方法
CN107526663A (zh) * 2017-08-31 2017-12-29 郑州云海信息技术有限公司 一种基于带外管理与操作系统协同的开关机测试方法及系统
CN107704390A (zh) * 2017-09-28 2018-02-16 郑州云海信息技术有限公司 一种测试fru信息一致性的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102244591B (zh) * 2010-05-10 2015-04-15 淮南东正电子科技有限公司 客户端服务器及对其功能测试全程监测的方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101030867A (zh) * 2006-02-28 2007-09-05 联想(北京)有限公司 一种bios刷新升级的系统和方法
CN101833462A (zh) * 2010-04-01 2010-09-15 山东高效能服务器和存储研究院 一种跨操作系统平台的通用的安装程序制作方法
CN202736027U (zh) * 2011-12-23 2013-02-13 广东电网公司电力科学研究院 等保测评中操作系统安全的自动测评系统
CN103593211A (zh) * 2013-11-01 2014-02-19 浪潮电子信息产业股份有限公司 一种带外隔离刷写固件程序的方法
CN104899061A (zh) * 2015-05-27 2015-09-09 浪潮电子信息产业股份有限公司 一种自动刷新fru信息的方法
CN107423081A (zh) * 2017-04-14 2017-12-01 广东浪潮大数据研究有限公司 一种带外批量升级bmc固件的方法
CN107171833A (zh) * 2017-05-03 2017-09-15 深圳市同泰怡信息技术有限公司 一种通过bmc实现服务器bmc和bios批量升级方法
CN107066307A (zh) * 2017-05-27 2017-08-18 郑州云海信息技术有限公司 一种易运维的带外批量定向升级bmc的方法
CN107526663A (zh) * 2017-08-31 2017-12-29 郑州云海信息技术有限公司 一种基于带外管理与操作系统协同的开关机测试方法及系统
CN107704390A (zh) * 2017-09-28 2018-02-16 郑州云海信息技术有限公司 一种测试fru信息一致性的方法

Also Published As

Publication number Publication date
CN108874420A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
TWI576706B (zh) 用於早期啟動階段之方法及相關裝置
KR20160044484A (ko) 클라우드 배치 기반구조 검증 엔진
CN109240851A (zh) 一种自主式实现批量bmc自恢复的方法及系统
CN110058998B (zh) 软件测试方法及装置
CN106919485A (zh) 一种基于服务器上配置硬件测试工具的系统
US9343181B2 (en) Memory module errors
CN108874420B (zh) 一种批量服务器fru的远程刷新系统及方法
CN113051180B (zh) 测试任务的监测方法、装置、设备及存储介质
TW202018312A (zh) 測試系統
US20200127882A1 (en) Identification of cause of failure of computing elements in a computing environment
CN112559266A (zh) 固态硬盘测试方法、装置、可读存储介质及电子设备
Nguyen Using control charts for detecting and understanding performance regressions in large software
WO2021056913A1 (zh) 基于i2c通讯的故障定位方法、装置及系统
CN110932886A (zh) 一种自动测试服务器网络性能的方法,系统及sol测试装置
US9798608B2 (en) Recovery program using diagnostic results
CN115794530A (zh) 一种硬件连接测试方法、装置、设备和可读存储介质
CN112698998B (zh) 一种可持续集成的arm服务器出厂测试方法
CN116382968B (zh) 外部设备的故障检测方法以及装置
US20180336084A1 (en) Managing component errors with a common software sensor based diagnostic method
CN112463610A (zh) 一种测试过程控制方法及装置
CN115250249B (zh) 一种基于IPv6Ready自动化测试方法、装置、介质及设备
CN117493065B (zh) 处理器信息的处理方法和装置,存储介质及电子设备
WO2024042599A1 (ja) 障害発生時におけるサーバ状態確認支援
CN116680101A (zh) 一种操作系统宕机检测方法及装置、消除方法及装置
CN115454820A (zh) 固件升级异常测试方法、装置和计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant