CN113687998A - 排除管理引擎运作异常的控制方法 - Google Patents

排除管理引擎运作异常的控制方法 Download PDF

Info

Publication number
CN113687998A
CN113687998A CN202010425357.XA CN202010425357A CN113687998A CN 113687998 A CN113687998 A CN 113687998A CN 202010425357 A CN202010425357 A CN 202010425357A CN 113687998 A CN113687998 A CN 113687998A
Authority
CN
China
Prior art keywords
management engine
engine
control method
abnormal state
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010425357.XA
Other languages
English (en)
Inventor
费维声
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitac Computer Shunde Ltd
Shencloud Technology Co Ltd
Mitac Computing Technology Corp
Original Assignee
Mitac Computer Shunde Ltd
Mitac Computing Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitac Computer Shunde Ltd, Mitac Computing Technology Corp filed Critical Mitac Computer Shunde Ltd
Priority to CN202010425357.XA priority Critical patent/CN113687998A/zh
Publication of CN113687998A publication Critical patent/CN113687998A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Combined Controls Of Internal Combustion Engines (AREA)

Abstract

一种排除管理引擎运作异常的控制方法包含:当一基板管理控制器接收到一远程开机指令时,该基板管理控制器根据对应一管理引擎对应的一状态缓存器所储存的一数值,判断该管理引擎是否操作在一异常状态;当该基板管理控制器判断该管理引擎是操作在该异常状态时,且再判断一心跳信号的逻辑值没有在逻辑0与逻辑1之间跳动时,判定该管理引擎是操作在一韧体异常状态。借由该控制方法能够快速且有效率地侦测出该管理引擎的一韧体发生异常,进而能够作出对应的处理。

Description

排除管理引擎运作异常的控制方法
技术领域
本发明是有关于一种控制方法,特别是指一种排除管理引擎运作异常的控制方法。
背景技术
现今借由远程联机以操作计算机系统时,如远程执行开机,此时,如果该计算机系统发生无法开机的情况,则使用者或管理者通常会需要耗费相当多的时间成本来进行问题分析。也就是说,现有技术在处理计算机系统无法开机时,最常用来尝试修复系统的方法是重新刻录系统开机所使用的只读存储器(ROM)。然而,整个只读存储器的容量例如为256Mb,则要重新刻录整个只读存储器所需要的时间高达约8~10分钟,若计算机系统在这么长的更新过程(即刻录过程)中,又遭遇到无预警的断电情况,这将导致更难以借由远程管理的方式来回复系统至正常运作的状态。因此,习知远程联机计算机系统的异常处理作法便存有相当多的改善空间。
发明内容
本发明要解决的技术问题是提供一种有效缩短所需时间以排除管理引擎运作异常的控制方法。
为解决上述技术问题,本发明排除管理引擎运作异常的控制方法,适用于一管理引擎及一基板管理控制器,该控制方法包含步骤(a)~(c)。
于步骤(a),当该基板管理控制器接收到一远程开机指令时,该基板管理控制器根据对应该管理引擎的一状态缓存器所储存的一数值,判断该管理引擎是否操作在一异常状态。
于步骤(b),当该基板管理控制器判断该管理引擎是操作在该异常状态时,接收来自该管理引擎输出一心跳信号(Heartbeat)。
于步骤(c),当该基板管理控制器判断该管理引擎是操作在该异常状态,且再判断该心跳信号的逻辑值没有在逻辑0与逻辑1之间跳动时,判定该管理引擎是操作在一韧体异常状态。
优选地,该控制方法还包含在步骤(c)之后的一步骤(d),当该基板管理控制器判断该管理引擎是操作在该韧体异常状态时,该基板管理控制器将对应一韧体的一程序代码重新刻录在一只读存储器的一预定区块,该只读存储器的该预定区块是用来储存对应该管理引擎的该韧体的该程序代码。
优选地,其中,在步骤(a)中,该状态缓存器是英特尔(Intel)管理引擎标准中的Intel ME firmware Status #1(MEFS1) Register,该数值是Current State字段所储存的值。
优选地,其中,在步骤(a)中,当该数值等于5时,该基板管理控制器判断该管理引擎不是操作在该异常状态。
优选地,该控制方法还包含在步骤(b)之前的一步骤(e),借由该管理引擎所储存的一第一参数被设定为一第一逻辑值,使得该管理引擎输出该心跳信号。
优选地,其中,在步骤(e)中,该管理引擎所储存的一第二参数被设定为一预设数值,使得该管理引擎在对应该默认数值的一预设输出脚位输出该心跳信号,进而使得该基板管理控制器在对应的一预设输入脚位接收该心跳信号。
优选地,其中,在步骤(b)中,当该管理引擎不是操作在该异常状态时,该管理引擎所输出的该心跳信号在逻辑0与逻辑1之间跳动,且具有一周期等于1秒
相较于现有技术,本发明当该基板管理控制器接收到该远程开机指令时,借由先根据该状态缓存器的该数值判断该管理引擎是操作在该异常状态,且再判断该心跳信号是否正常,以正确判定该管理引擎是操作在该韧体异常状态。如此一来,该基板管理控制器仅需要借由该状态缓存器的该数值判断该管理引擎不是操作在该异常状态,即大部分运作正常的情况,而不需要每次都借由侦测该心跳信号来确定不是操作在该异常状态,而能够快速且有效率地侦测出该管理引擎的一韧体是否发生异常,进而能够做出对应的处理。
【附图说明】
本发明的其他的特征及功效,将于参照图式的实施方式中清楚地呈现,其中:
图1是一方块图,说明本发明排除管理引擎运作异常的控制方法所适用的一第一计算机系统及一第二计算机系统;及
图2是一流程图,说明本发明排除管理引擎运作异常的控制方法的一实施例。
【具体实施方式】
在本发明被详细描述之前,应当注意在以下的说明内容中,类似的组件是以相同的编号来表示。
参阅图1与图2,本发明排除管理引擎运作异常的控制方法之一实施例,适用于一第一计算机系统及一第二计算机系统。该第一计算机系统包含一基板管理控制器(Baseboard Management Controller,BMC)1、一中央处理器(CPU)3、及电连接该基板管理控制器1与该中央处理器3的一芯片组(PCH)2,该芯片组2包括一管理引擎(ManagementEngine,ME)21。
该第一计算机系统或该第二计算机系统例如是一计算机主机、一计算机服务器、或类似的计算机设备。该管理引擎21例如是英特尔(Intel)管理引擎。另外,在本实施例中,该管理引擎21是设置于该芯片组2之中,且该基板管理控制器1、该芯片组2、及该中央处理器3是分别设置的硬件组件,而在其他实施例中,该芯片组2及该中央处理器3也可以整合成单一个硬件组件,如系统芯片(SoC),或者,该管理引擎21也可以是单独设置于该芯片组2之外,例如是一个微控制器(MCU)的形式。
该控制方法包含步骤S1~S5。
于步骤S1,当该基板管理控制器1接收到来自该第二计算机系统的一远程开机指令时,该基板管理控制器1根据该芯片组2所包含的一状态缓存器所储存的一数值,判断该管理引擎21是否操作在一异常状态。更详细地说,该状态缓存器是英特尔(Intel)管理引擎标准中的Intel ME firmware Status #1(MEFS1) Register,该数值是Current State字段所储存的值。举例来说,当该基板管理控制器1判断该数值等于5时,该基板管理控制器1判断为该管理引擎21是操作在一正常状态。而当该数值不等于5时,则判断为操作在该异常状态。在本实施例中,该基板管理控制器1例如包括一平台环境控制接口(Platformenvironment control interface,PECI)控制器,并借由一设置于该中央处理器3与该基板管理控制器1之间的连接线4,利用该中央处理器3读取该状态缓存器的该数值,以获得该数值。该连接线4是支持平台环境控制接口(PECI)的协议。而在其他实施例中,该基板管理控制器1例如不包括该平台环境控制接口PECI)控制器,并借由设置于该基板管理控制器1与该芯片组2之间的另一连接线,读取该状态缓存器的该数值。该另一连接线是支持智能平台管理总线(Intelligent platform management bus,IPMB)的协议。
于步骤S2,借由将该管理引擎21所储存的一第一参数设定为一第一逻辑值,使得该管理引擎21输出一心跳信号(Heartbeat),且还将该管理引擎21所储存的一第二参数设定为一预设数值,使得该管理引擎21在对应该默认数值的一预设输出脚位(Pin)输出该心跳信号,进而使得该基板管理控制器1在对应的一预设输入脚位接收该心跳信号。举例来说,该第一参数被称作HeartBeatMgpio,并被设定为逻辑1(即该第一逻辑值)时,该管理引擎21会输出该心跳信号,且该第二参数被设定为5(即该预设数值)时,编号为5的该预设输出脚位输出该心跳信号。再者,例如借由英特尔(Intel)公司所提供的一工具程序(如spsFITC),在该管理引擎21的一韧体的开发阶段,即设定该第一参数及该第二参数的数值。
于步骤S3,当该基板管理控制器1判断该管理引擎21是操作在该异常状态时,由于该基板管理控制器1已预先作好该预设输入脚位与该管理引擎21的该默认输出脚位之间的电连接,因此,该基板管理控制器1能够接收到来自该管理引擎21输出该心跳信号(Heartbeat)。举例来说,当该管理引擎21不是操作在该异常状态时,即操作在该正常状态时,该管理引擎21所输出的该心跳信号在逻辑0与逻辑1之间跳动,且具有一周期等于1秒。而当该管理引擎21是操作在该异常状态时,该心跳信号例如都等于逻辑0。
于步骤S4,当该基板管理控制器1判断该管理引擎21是操作在该异常状态,且再判断该心跳信号的逻辑值没有在逻辑0与逻辑1之间跳动时,判定该管理引擎21是操作在一韧体异常状态。换句话说,在本实施例中,该基板管理控制器1先借由步骤S1判断该管理引擎21是操作在该异常状态,再于步骤S2、S3控制该管理引擎21产生并接收该心跳信号,以在步骤S4中,进一步再根据判断该心跳信号的结果,判定该管理引擎21是否操作在该韧体异常状态。而在其他实施例中,步骤S2、S3之其中任一者或两者也可以被省略,使得该基板管理控制器1预设处于接收来自该管理引擎21的该心跳信号的状态,同样能够达成相同的先后判断顺序。
步骤S5,当该基板管理控制器1判断该管理引擎21是操作在该韧体异常状态时,该基板管理控制器1将对应该韧体的一程序代码重新刻录在一只读存储器的一预定区块,该只读存储器的该预定区块是用来储存对应该管理引擎21的该韧体的该程序代码。也就是说,在该基板管理控制器1判断出该管理引擎21运作异常时,该基板管理控制器1重新刻录对应的该韧体的该程序代码,以针对该管理引擎21的该韧体异常状态情形作出对应的解决方法。
接着,该基板管理控制器1控制该管理引擎21重新启动,并在判断该管理引擎21操作在该正常状态之后,通知该基本输入输出系统(BIOS)执行一开机自我测试(Power OnSelf Test,POST)程序,并在其顺利执行结束之后,完成该第一计算机系统的启动。
更详细地说,在本实施例中,该芯片组2还包含该只读存储器,且该只读存储器(如BIOS flash)是同时储存该基本输入输出系统(BIOS)的程序代码与设定参数,及该管理引擎21的该韧体的该程序代码,其中,该只读存储器的该预定区块储存该管理引擎21的该韧体的该程序代码。当该基板管理控制器1判断该管理引擎21是操作在该韧体异常状态时,该基板管理控制器1主动向一远程服务器或向一预设的服务器下载该韧体的该程序代码,如最新的版本,并储存至一外挂内存,再传送且储存至该预定区块。接着,该基板管理控制器1主动控制该芯片组2重新启动,则储存于该预定区块且更新后的该韧体的该程序代码就能够被执行。
另外要特别补充说明的是,当该基板管理控制器1判断该管理引擎21是操作在该正常状态时,即步骤S1的另一判断结果,该基板管理控制器1通知该基本输入输出系统(BIOS)执行该开机自我测试(Power On Self Test,POST)程序,并在其顺利执行结束之后,完成该第一计算机系统的启动。此外,当该基板管理控制器1判断该管理引擎21是操作在该异常状态但不是操作在该韧体异常状态时,也就是该基板管理控制器1判断该管理引擎21判断该心跳信号的逻辑值有在逻辑0与逻辑1之间跳动时,即步骤S4的另一判断结果,则该管理引擎21仅需要被重新启动,例如包含该管理引擎21的该芯片组2被重启,或独立设置的该管理引擎21被重启,就能重新操作在该正常状态。
综上所述,当该基板管理控制器接收到该远程开机指令时,借由先根据对应该管理引擎的该状态缓存器的该数值判断该管理引擎是操作在该异常状态,且在操作在该异常状态时,再判断该心跳信号是否正常,以正确判定该管理引擎是操作在该韧体异常状态。借此,该基板管理控制器仅需要借由该状态缓存器的该数值判断该管理引擎不是操作在该异常状态,即大部分运作正常的情况,而不需要每次都借由侦测该心跳信号来确定已操作在该正常状态,而能够快速且有效率地侦测出该管理引擎的该韧体是否发生异常,进而能够做出对应的处理,故确实能达成本发明的目的。
惟以上所述者,仅为本发明的实施例而已,当不能以此限定本发明实施的范围,凡是依本发明权利要求书及专利说明书内容所作的简单的等效变化与修饰,皆仍属本发明专利涵盖的范围内。

Claims (7)

1.一种控制方法,适用于一管理引擎及一基板管理控制器,其特征在于,该控制方法包含下列步骤:
(a)当该基板管理控制器接收到一远程开机指令时,该基板管理控制器根据对应该管理引擎的一状态缓存器所储存的一数值,判断该管理引擎是否操作在一异常状态;
(b)当该基板管理控制器判断该管理引擎是操作在该异常状态时,接收来自该管理引擎输出一心跳信号;及
(c)当该基板管理控制器判断该管理引擎是操作在该异常状态,且再判断该心跳信号的逻辑值没有在逻辑0与逻辑1之间跳动时,判定该管理引擎是操作在一韧体异常状态。
2.如权利要求1所述的控制方法,其特征在于,还包含在步骤(c)之后的一步骤(d),当该基板管理控制器判断该管理引擎是操作在该韧体异常状态时,该基板管理控制器将对应一韧体的一程序代码重新刻录在一只读存储器的一预定区块,该只读存储器的该预定区块是用来储存对应该管理引擎的该韧体的该程序代码。
3.如权利要求1所述的控制方法,其特征在于,在步骤(a)中,该状态缓存器是英特尔管理引擎标准中的Intel ME firmware Status #1 Register,该数值是Current State字段所储存的值。
4.如权利要求3所述的控制方法,其特征在于,在步骤(a)中,当该数值等于5时,该基板管理控制器判断该管理引擎不是操作在该异常状态。
5.如权利要求1所述的控制方法,还包含在步骤(b)之前的一步骤(e),藉由该管理引擎所储存的一第一参数被设定为一第一逻辑值,使得该管理引擎输出该心跳信号。
6.如权利要求5所述的控制方法,其中,在步骤(e)中,该管理引擎所储存的一第二参数被设定为一预设数值,使得该管理引擎在对应该默认数值的一预设输出脚位输出该心跳信号,进而使得该基板管理控制器在对应的一预设输入脚位接收该心跳信号。
7.如权利要求1所述的控制方法,其中,在步骤(b)中,当该管理引擎不是操作在该异常状态时,该管理引擎所输出的该心跳信号在逻辑0与逻辑1之间跳动,且具有一周期等于1秒。
CN202010425357.XA 2020-05-19 2020-05-19 排除管理引擎运作异常的控制方法 Pending CN113687998A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010425357.XA CN113687998A (zh) 2020-05-19 2020-05-19 排除管理引擎运作异常的控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010425357.XA CN113687998A (zh) 2020-05-19 2020-05-19 排除管理引擎运作异常的控制方法

Publications (1)

Publication Number Publication Date
CN113687998A true CN113687998A (zh) 2021-11-23

Family

ID=78575884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010425357.XA Pending CN113687998A (zh) 2020-05-19 2020-05-19 排除管理引擎运作异常的控制方法

Country Status (1)

Country Link
CN (1) CN113687998A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101572619A (zh) * 2008-04-30 2009-11-04 技嘉科技股份有限公司 控制系统及其管理方法
TW201224728A (en) * 2010-12-14 2012-06-16 Hon Hai Prec Ind Co Ltd Power self-controlling networking device and method of controlling power
TW201626134A (zh) * 2015-01-05 2016-07-16 營邦企業股份有限公司 具有多機櫃管理模組的機櫃及其韌體更新方法
CN107179804A (zh) * 2016-03-09 2017-09-19 佛山市顺德区顺达电脑厂有限公司 机柜装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101572619A (zh) * 2008-04-30 2009-11-04 技嘉科技股份有限公司 控制系统及其管理方法
TW201224728A (en) * 2010-12-14 2012-06-16 Hon Hai Prec Ind Co Ltd Power self-controlling networking device and method of controlling power
TW201626134A (zh) * 2015-01-05 2016-07-16 營邦企業股份有限公司 具有多機櫃管理模組的機櫃及其韌體更新方法
CN107179804A (zh) * 2016-03-09 2017-09-19 佛山市顺德区顺达电脑厂有限公司 机柜装置

Similar Documents

Publication Publication Date Title
CN113489597B (zh) 用于网络装置的最佳启动路径的方法和系统
US9946553B2 (en) BMC firmware recovery
US20040158702A1 (en) Redundancy architecture of computer system using a plurality of BIOS programs
US9329959B2 (en) Device and method for performing regression testing on bios boot information
WO2016206514A1 (zh) 启动处理方法及装置
CN110908847A (zh) 一种异常恢复方法、系统、电子设备及存储介质
RU2602378C9 (ru) Стойка с множеством модулей управления стойкой и способ обновления встроенного программного обеспечения, используемого для стойки
US20150154091A1 (en) Bios maintenance method
US10474517B2 (en) Techniques of storing operational states of processes at particular memory locations of an embedded-system device
CN111338698A (zh) 一种bios准确引导服务器启动的方法及系统
CN111124509B (zh) 一种服务器启动方法与装置
CN111966380A (zh) 一种bmc固件升级方法、系统、终端及存储介质
US20050033952A1 (en) Dynamic scheduling of diagnostic tests to be performed during a system boot process
TW201734779A (zh) 通知開機階段的方法及伺服器系統
US10572435B2 (en) Techniques of accessing serial console of BMC using host serial port
US10509656B2 (en) Techniques of providing policy options to enable and disable system components
CN113867812B (zh) 一种bmc获取链路信息的方法、系统、设备以及介质
CN113687998A (zh) 排除管理引擎运作异常的控制方法
US10802901B2 (en) Obtaining state information of threads of a device
US10176142B2 (en) Techniques of accessing BMC terminals through serial port
TWI726434B (zh) 排除管理引擎運作異常的控制方法
CN113721992A (zh) 一种服务器的bios启动方法及相关装置
US20220206823A1 (en) Information processing method and electronic apparatus
CN114139168B (zh) 一种tpcm度量的方法、装置及介质
US20240012572A1 (en) Operationalization of memories using memory information sets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination