CN110471800A - 服务器及自动检修基板管理控制器的方法 - Google Patents
服务器及自动检修基板管理控制器的方法 Download PDFInfo
- Publication number
- CN110471800A CN110471800A CN201810446253.XA CN201810446253A CN110471800A CN 110471800 A CN110471800 A CN 110471800A CN 201810446253 A CN201810446253 A CN 201810446253A CN 110471800 A CN110471800 A CN 110471800A
- Authority
- CN
- China
- Prior art keywords
- management controller
- baseboard management
- control chipset
- count value
- determines
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2284—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by power-on test, e.g. power-on self test [POST]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3604—Software analysis for verifying properties of programs
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供一种服务器,包含一基板管理控制器、一记忆模块,及一控制芯片组,该控制芯片组回应于一基本输入输出系统程序的执行,进行一开机自我检测,并于进行该开机自我检测时,传送一询问指令至该基板管理控制器,且判定是否接收到一来自该基板管理控制器且回应于该询问指令的回覆指令。当该控制芯片组判定出无接收到该回覆指令时,该控制芯片组将一计数值加一,并判定该计数值是否大于一预设值,当该控制芯片组判定出该计数值大于该预设值时,该控制芯片组使该基板管理控制器所储存的一第一映像档更新为一第二映像档。
Description
技术领域
本发明是有关于一种服务器及自动检修基板管理控制器的方法,特别是指一种能够节省检修基板管理控制器所需耗费的人力成本与时间的自动检修基板管理控制器的方法。
背景技术
现有的基板管理控制器(Baseboard Management Controller,BMC)适用于服务器,并支援智慧平台管理界面(Intelligent Platform Management Interface,IPMI)的工业标准,用来监控服务器主机板上的硬设备的状态,如环境温度、风扇转速、供电情况等。然而,若该基板管理控制器发生异常,如系统功能崩溃或硬件问题,则该基板管理控制器即无法达成监控服务器主机板上的硬设备的功能。
现有技术虽可藉由一控制芯片组执行一基本输入输出系统程序来侦测该基板管理控制器是否发生异常,并在该控制芯片组侦测出该基板管理控制器发生异常时,传送一重置指令至该基板管理控制器,以重置该基板管理控制器,藉此来达到自动检修的效果。然而,在某些情况下,即便重置该基板管理控制器仍无法使该基板管理控制器恢复正常运作,此时,便需要派遣人力对该基板管理控制器进行检修,因而造成人力成本及时间的耗费。
发明内容
本发明要解决的技术问题是在于提供一种能够节省检修基板管理控制器所需耗费的人力成本与时间的自动检修基板管理控制器的方法。
为解决上述技术问题,一种自动检修基板管理控制器的方法,藉由一控制芯片组执行一基本输入输出系统程序来实施,该控制芯片组电连接一储存有一第一映像档的基板管理控制器,以及一记忆模块,该记忆模块储存有一相关于该基板管理控制器的第二映像档,该自动检修基板管理控制器的方法包含以下步骤:
(A)该控制芯片组进行一开机自我检测;
(B)该控制芯片组传送一询问指令至该基板管理控制器;
(C)该控制芯片组判定是否接收到一来自该基板管理控制器且回应于该询问指令的回覆指令;
(D)当该控制芯片组判定出无接收到该回覆指令时,该控制芯片组将一计数值加一,并判定该计数值是否大于一预设值;及
(E)当该控制芯片组判定出该计数值大于该预设值时,该控制芯片组使该基板管理控制器所储存的第一映像档更新为该第二映像档。
一种适用于上述方法的服务器,该服务器包含一基板管理控制器、一记忆模块,及一电连接该基板管理控制器及该记忆模块的控制芯片组。
该基板管理控制器储存有一第一映像档。
该记忆模块储存有一相关于该基板管理控制器的第二映像档。
该控制芯片组回应于一基本输入输出系统程序的执行,进行一开机自我检测,并于进行该开机自我检测时,传送一询问指令至该基板管理控制器,且判定是否接收到一来自该基板管理控制器且回应于该询问指令的回覆指令,当该控制芯片组判定出无接收到该回覆指令时,该控制芯片组将一计数值加一,并判定该计数值是否大于一预设值,当该控制芯片组判定出该计数值大于该预设值时,该控制芯片组使该基板管理控制器所储存的第一映像档更新为该第二映像档。
相较于现有技术,本发明服务器及自动检修基板管理控制器的方法,藉由该控制芯片组执行该基本输入输出单元以判定是否接收到一来自该基板管理控制器且回应于该询问指令的回覆指令,当该控制芯片组判定出无接收到该回覆指令时,且判定出该计数值大于该预设值时,即代表透过重置该基板管理控制器仍无法使该基板管理控制器恢复正常运作,此时,该控制芯片组将该基板管理控制器所储存的第一映像档更新为该第二映像档,藉此达到自动检修的效果,而能节省人力并且缩短检修时间。
【附图说明】
图1为一方块图,说明本发明服务器的实施例。
图2为一流程图,说明本发明自动检修基板管理控制器的方法的实施例。
【具体实施方式】
请参阅图1所示,本发明服务器的实施例包含一基板管理控制器1(BaseboardManagement Controller,BMC)、一第一记忆模块23、一第二记忆模块24,及一电连接该基板管理控制器1、该第一记忆模块23与该第二记忆模块24的控制芯片组3。
该基板管理控制器1储存有一第一映像档11,该第一映像档11为一程序,用以执行该基板管理控制器1的功能,包括监控服务器主机板上的硬设备的状态,如环境温度、风扇转速、供电情况等等。当该基板管理控制器1接收到一来自该控制芯片组3的重置指令时,该基板管理控制器1即会重新启动。
该第一记忆模块232储存有一基本输入输出系统(Basic Input/Output System,简称BIOS)程序,该第二记忆模块24储存有一相关于该基板管理控制器1的第二映像档22。在本实施例中,该第一记忆模块23例如为一唯读存储器(Read Only Memory,简称ROM),该第二记忆模块24可为一USB存储器、M.2的硬盘(M.2 HDD)或一PXE 服务器等的外部储存装置,但不限于此。
该控制芯片组3包含一平台路径控制器31(Platform Controller Hub,简称PCH)及一中央处理单元32(Central Processing Unit,简称CPU)。在该服务器上电启动后,该控制芯片组3执行该基本输入输出系统程序21以启动服务器硬件及周边装置,执行开机自我检测(Power On Self Test,简称POST)。
请参阅图1和图2所示,以下将配合本发明自动检修基板管理控制器1的方法的实施例来说明该基板管理控制器1、该第一记忆模块23、该第二记忆模块24及该控制芯片组3各元件间的作动。
在步骤201中,该控制芯片组3回应于该基本输入输出系统程序21的执行,进行一开机自我检测(POST)。
在步骤202中,该控制芯片组3回应于该基本输入输出系统程序21的执行,传送一询问指令至该基板管理控制器1。
在步骤203中,该控制芯片组3回应于该基本输入输出系统程序21的执行,判定是否接收到一来自该基板管理控制器1且回应于该询问指令的回覆指令。当该控制芯片组3判定出无接收到该回覆指令时,流程进行步骤204;当该控制芯片组3判定出接收到该回覆指令时,流程进行步骤209。
在步骤204中,该控制芯片组3回应于该基本输入输出系统程序21的执行,将一计数值加一并判定该计数值是否大于一预设值。当该控制芯片组3判定出该计数值大于该预设值时,流程进行步骤205;当该控制芯片组3判定出该计数值小于等于该预设值时,流程进行步骤207。值得特别说明的是,实施上,该计数值例如可被设置为该基本输入输出系统程序21中所包含的一参数,且初始时该参数被预设为0。
在步骤205中,该控制芯片组3回应于该基本输入输出系统程序21的执行,初始化该计数值(使其归零)并使该基板管理控制器1所储存的第一映像档11更新为该第二映像档22。因此,藉由该控制芯片组3判定该计数值是否大于该预设值,当该计数值大于该预设值时,表示透过多次重置该基板管理控制器1后仍无法使该基板管理控制器1恢复正常运作,该控制芯片组3即令该基板管理控制器1自动更新运行于该基板管理控制器1中的映像档,以达成自动检修的效果。值得一提的是,该控制芯片组3是透过一基板管理控制器软件工具(BMC tool)来更新该基板管理控制器1的映像档。值得一提的是,在本实施例中,该服务器除了包含该第二记忆模块24外,还可包含其他的外部储存装置,当该控制芯片组3判定出该计数值大于该预设值时,该控制芯片组3会先自所有外部储存装置搜寻出储存有该第二映像档22的第二记忆模块24,接着,该控制芯片组3才使该基板管理控制器1所储存的第一映像档11更新为储存于所搜寻出的第二记忆模块24中的该第二映像档22。
接续在步骤205后,在步骤206中,该基板管理控制器1重新启动,流程继续执行步骤202。值得一提的是,在该基板管理控制器1完成该第一映像档11的更新后(亦即,该第一映像档11已更新为该第二映像档22),该基板管理控制器1即会重新启动。
在步骤207中,该控制芯片组3回应于该基本输入输出系统程序21的执行,传送一重置指令至该基板管理控制器1,以致该基板管理控制器1重新启动。值得一提的是,该重置指令是为一IPMI指令。
接续在步骤207后,在步骤208中,该基板管理控制器1重新启动,流程继续执行步骤202。
在步骤209中,该控制芯片组3回应于该基本输入输出系统程序21的执行,计数一预设时间并判定是否完成该开机自我检测。当该控制芯片组3判定出尚未完成该开机自我检测时,流程进行步骤202,也就是说,该控制芯片组3会在该开机自我检测的过程中,每间隔该预设时间,周期性的重复发出该询问指令,以确认该基板管理控制器11是否仍正常运作(亦即,保持为存活状态);当该控制芯片组3判定出已完成该开机自我检测时,流程进行步骤210。
在步骤210中,该控制芯片组3回应于该基本输入输出系统程序21的执行,初始化该计数值并移交系统控制权予作业系统。
值得特别说明的是,本发明自动检修基板管理控制器1的方法的实施例中的步骤201~205、步骤207及步骤209~210皆是藉由该控制芯片组3执行该基本输入输出系统程序21来实行,换言之上述步骤是被编程(programming)在该基本输入输出系统程序21中。
综上所述,本发明自动检修基板管理控制器的方法,藉由该控制芯片组3于该开机自我检测的过程间,周期性的重复发出该询问指令,以确认该基板管理控制器1是否仍保持为存活状态。当未接收到该基板管理控制器1的回覆指令时,该控制芯片组3即判定该计数值是否大于该预设值,以确认透过多次地重置该基板管理控制器1是否仍无法使该基板管理控制器1恢复正常运作,当该计数值大于该预设值时,该控制芯片组3使该基板管理控制器1所储存的第一映像档11更新为该第二映像档22,藉此达到自动检修的效果,从而能节省人力并且缩短检修时间,故确实能达成本发明的目的。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种自动检修基板管理控制器的方法,藉由一控制芯片组执行一基本输入输出系统程序来实施,该控制芯片组电连接一储存有一第一映像档的基板管理控制器,以及一记忆模块,该记忆模块储存有一相关于该基板管理控制器的第二映像档,其特征在于,该自动检修基板管理控制器的方法包含以下步骤:
(A)该控制芯片组进行一开机自我检测;
(B)该控制芯片组传送一询问指令至该基板管理控制器;
(C)该控制芯片组判定是否接收到一来自该基板管理控制器且回应于该询问指令的回覆指令;
(D)当该控制芯片组判定出无接收到该回覆指令时,该控制芯片组将一计数值加一,并判定该计数值是否大于一预设值;及
(E)当该控制芯片组判定出该计数值大于该预设值时,该控制芯片组使该基板管理控制器所储存的第一映像档更新为该第二映像档。
2.根据权利要求1所述的自动检修基板管理控制器的方法,其特征在于,在步骤(D)后,还包含一步骤(F),当该控制芯片组判定出该计数值小于等于该预设值时,该控制芯片组传送一重置指令至该基板管理控制器,以致该基板管理控制器重新启动,并重复执行步骤(B)至步骤(C)。
3.根据权利要求1所述的自动检修基板管理控制器的方法,其特征在于,在步骤(C)后,还包含以下步骤:
(F)当该控制芯片组判定出接收到该回覆指令时,该控制芯片组计数一预设时间,并判定是否完成该开机自我检测;及
(G)当该控制芯片组判定出尚未完成该开机自我检测时,该控制芯片组继续进行该开机自我检测,并重复执行步骤(B)至步骤(C)。
4.根据权利要求3所述的自动检修基板管理控制器的方法,其特征在于,在步骤(F)后,还包含一步骤:
(H)当该控制芯片组判定出已完成该开机自我检测时,该控制芯片组初始化该计数值。
5.根据权利要求1所述的自动检修基板管理控制器的方法,其特征在于,在步骤(E)中,当该控制芯片组判定出该计数值大于该预设值时,该控制芯片组还初始化该计数值。
6.根据权利要求1所述的自动检修基板管理控制器的方法,其特征在于,步骤(E)包含以下子步骤:
(E-1) 当该控制芯片组判定出该计数值大于该预设值时,该控制芯片组搜寻出储存有该第二映像档的记忆模块;及
(E-2) 该控制芯片组使该基板管理控制器所储存的第一映像档更新为储存于所搜寻出的记忆模块中的该第二映像档。
7.一种服务器,其特征在于,包含:
一基板管理控制器,储存有一第一映像档;
一记忆模块,储存有一相关于该基板管理控制器的第二映像档;及
一控制芯片组,电连接该基板管理控制器及该记忆模块,该控制芯片组回应于一基本输入输出系统程序的执行,进行一开机自我检测,并于进行该开机自我检测时,传送一询问指令至该基板管理控制器,且判定是否接收到一来自该基板管理控制器且回应于该询问指令的回覆指令,当该控制芯片组判定出无接收到该回覆指令时,该控制芯片组将一计数值加一,并判定该计数值是否大于一预设值,当该控制芯片组判定出该计数值大于该预设值时,该控制芯片组使该基板管理控制器所储存的第一映像档更新为该第二映像档。
8.根据权利要求7所述的服务器,其特征在于,当该控制芯片组判定出该计数值小于等于该预设值时,该控制芯片组传送一重置指令至该基板管理控制器,以致该基板管理控制器重新启动,该控制芯片组重复地传送另一询问指令至该基板管理控制器,且判定是否接收到另一来自该基板管理控制器且回应于该另一询问指令的回覆指令。
9.根据权利要求7所述的服务器,其特征在于,当该控制芯片组判定出接收到该回覆指令时,该控制芯片组计数一预设时间,并判定是否完成该开机自我检测,当该控制芯片组判定出尚未完成该开机自我检测时,该控制芯片组继续进行该开机自我检测,并重复地传送另一询问指令至该基板管理控制器,且判定是否接收到另一来自该基板管理控制器且回应于该另一询问指令的回覆指令。
10.根据权利要求7所述的服务器,其特征在于,当该控制芯片组判定出该计数值大于该预设值时,该控制芯片组还初始化该计数值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810446253.XA CN110471800B (zh) | 2018-05-11 | 2018-05-11 | 服务器及自动检修基板管理控制器的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810446253.XA CN110471800B (zh) | 2018-05-11 | 2018-05-11 | 服务器及自动检修基板管理控制器的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110471800A true CN110471800A (zh) | 2019-11-19 |
CN110471800B CN110471800B (zh) | 2023-06-06 |
Family
ID=68504336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810446253.XA Active CN110471800B (zh) | 2018-05-11 | 2018-05-11 | 服务器及自动检修基板管理控制器的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110471800B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111858239A (zh) * | 2020-06-30 | 2020-10-30 | 浪潮电子信息产业股份有限公司 | 一种服务器硬盘监测方法、装置、设备及介质 |
CN112069035A (zh) * | 2020-10-10 | 2020-12-11 | 北京大地信合信息技术有限公司 | 用于机箱的ipmi板卡健康管理系统以及健康监控方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102375423A (zh) * | 2010-08-24 | 2012-03-14 | 鸿富锦精密工业(深圳)有限公司 | 电源开关控制装置及方法 |
US20160277271A1 (en) * | 2015-03-19 | 2016-09-22 | National Central University | Fault tolerant method and system for multiple servers |
CN106445571A (zh) * | 2015-08-08 | 2017-02-22 | 昆达电脑科技(昆山)有限公司 | 主机板及开机的方法 |
US20170052854A1 (en) * | 2015-08-18 | 2017-02-23 | Mitac Computing Technology Corporation | Method and system for performing automatic system recovery |
CN106547645A (zh) * | 2015-09-22 | 2017-03-29 | 佛山市顺德区顺达电脑厂有限公司 | 自动修复映像档的方法及服务器系统 |
CN106649002A (zh) * | 2015-10-29 | 2017-05-10 | 佛山市顺德区顺达电脑厂有限公司 | 服务器及自动检修基板管理控制器的方法 |
-
2018
- 2018-05-11 CN CN201810446253.XA patent/CN110471800B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102375423A (zh) * | 2010-08-24 | 2012-03-14 | 鸿富锦精密工业(深圳)有限公司 | 电源开关控制装置及方法 |
US20160277271A1 (en) * | 2015-03-19 | 2016-09-22 | National Central University | Fault tolerant method and system for multiple servers |
CN106445571A (zh) * | 2015-08-08 | 2017-02-22 | 昆达电脑科技(昆山)有限公司 | 主机板及开机的方法 |
US20170052854A1 (en) * | 2015-08-18 | 2017-02-23 | Mitac Computing Technology Corporation | Method and system for performing automatic system recovery |
CN106547645A (zh) * | 2015-09-22 | 2017-03-29 | 佛山市顺德区顺达电脑厂有限公司 | 自动修复映像档的方法及服务器系统 |
CN106649002A (zh) * | 2015-10-29 | 2017-05-10 | 佛山市顺德区顺达电脑厂有限公司 | 服务器及自动检修基板管理控制器的方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111858239A (zh) * | 2020-06-30 | 2020-10-30 | 浪潮电子信息产业股份有限公司 | 一种服务器硬盘监测方法、装置、设备及介质 |
CN111858239B (zh) * | 2020-06-30 | 2022-06-10 | 浪潮电子信息产业股份有限公司 | 一种服务器硬盘监测方法、装置、设备及介质 |
CN112069035A (zh) * | 2020-10-10 | 2020-12-11 | 北京大地信合信息技术有限公司 | 用于机箱的ipmi板卡健康管理系统以及健康监控方法 |
CN112069035B (zh) * | 2020-10-10 | 2024-04-30 | 北京大地信合信息技术有限公司 | 用于机箱的ipmi板卡健康管理系统以及健康监控方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110471800B (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112948157B (zh) | 服务器故障定位方法、装置、系统及计算机可读存储介质 | |
TWI668567B (zh) | 伺服器及自動檢修基板管理控制器的方法 | |
CN104636221A (zh) | 一种计算机系统故障处理方法和装置 | |
CN112286709B (zh) | 一种服务器硬件故障的诊断方法、诊断装置及诊断设备 | |
WO2023115999A1 (zh) | 设备状态监控方法、装置、设备及计算机可读存储介质 | |
CN109254783A (zh) | 一种服务器系统安装方法、装置、设备及可读存储介质 | |
CN107943637A (zh) | 一种基于ipmi平台的电源循环测试装置及方法 | |
CN101471820B (zh) | 基板管理控制器的测试方法 | |
CN111782283A (zh) | 一种裸金属服务器的自动化管理方法、装置及介质 | |
CN111352779A (zh) | 一种moc卡的ac电源的开关机测试方法及相关组件 | |
CN110471800A (zh) | 服务器及自动检修基板管理控制器的方法 | |
CN112187574A (zh) | 使用虚拟机进行网络压力测试的方法、系统和存储介质 | |
CN111338698A (zh) | 一种bios准确引导服务器启动的方法及系统 | |
CN111897697A (zh) | 服务器硬件故障修复方法和装置 | |
KR20000006786A (ko) | 통신망을 통한 원격 사후관리 방법 및 이를 이용한전자제품의 사후관리시스템 | |
CN104699215A (zh) | 电源保护系统及方法 | |
CN114138527A (zh) | 一种提高服务器性能的方法、装置及介质 | |
CN117289963A (zh) | 在线更新服务器平台服务固件的目标区域的方法及设备 | |
CN106649002B (zh) | 服务器及自动检修基板管理控制器的方法 | |
CN112035346A (zh) | 基于嵌入式dsp操作系统的自动化测试方法、系统及介质 | |
CN104571098B (zh) | 基于Atom平台的远程自诊断方法 | |
CN102819474A (zh) | 系统操作的测试方法和装置 | |
CN107870840B (zh) | 基于ipmi的服务器多个测试指令自动执行方法 | |
CN114637644A (zh) | 设备异常重启检测方法、装置、计算机设备和介质 | |
KR102068830B1 (ko) | 서버 검증 자동화 및 관리시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |