CN103178977A - 计算机系统及计算机系统的开机管理方法 - Google Patents

计算机系统及计算机系统的开机管理方法 Download PDF

Info

Publication number
CN103178977A
CN103178977A CN 201110434798 CN201110434798A CN103178977A CN 103178977 A CN103178977 A CN 103178977A CN 201110434798 CN201110434798 CN 201110434798 CN 201110434798 A CN201110434798 A CN 201110434798A CN 103178977 A CN103178977 A CN 103178977A
Authority
CN
China
Prior art keywords
power
remote server
computer installation
time
complete
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110434798
Other languages
English (en)
Inventor
陈宗楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CN 201110434798 priority Critical patent/CN103178977A/zh
Publication of CN103178977A publication Critical patent/CN103178977A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Power Sources (AREA)

Abstract

一种计算机系统及计算机系统的开机管理方法,适用于一远程服务器。此开机管理方法包括下列步骤。当受远程服务器管理的计算机装置为关机状态时,便通过网络发送一开机命令到所述计算机装置,并重置计数器以开始倒数一超时时间。当没有接收到BIOS启动完毕日志信息,并且上述超时时间已倒数完毕后,便通过网络发送重新开机命令到计算机装置,并再次重置计数器,以重新检验所述计算机装置是否开机完成。因此,远程服务器可利用云计算机制对计算机装置进行开机管理,使得计算机装置可采用低计算效率的基板管理控制器来降低成本。

Description

计算机系统及计算机系统的开机管理方法
技术领域
本发明涉及一种基板管理控制器(Baseboard ManagementController,BMC)技术,尤其涉及一种计算机系统及利用远程服务器对多台计算机装置的开机管理方法。
背景技术
基板管理控制器(Baseboard Management Controller;BMC)是智能平台管理接口(Intelligent Platform Management Interface;IPMI)架构中的核心处理控制器,其可传感、监控及记录服务器中的各种工作情况,并将异常的工作情况进行侦测以执行相应程序,以及时排除异常。此外,BMC并具有远程管理、系统状态侦测与记录、数据追踪与系统恢复等功能,使从业人员能够有效管理众多服务器,并同时可以降低维护成本的期望。
有鉴于BMC的功能强大,因此BMC在服务器管理的地位上越发重要。BMC在服务器中的效率及地位逐渐提升的同时,BMC芯片的成本也逐渐偏于昂贵,尤其是具有高计算效率的BMC芯片更是如此。
在云计算技术的蓬勃发展下,许多研究机构及相关应用服务逐渐将复杂的计算及庞大的数据库由本机逐渐转移到许多服务器所串联而成的云服务器中,藉以在网络联通的情况下能够增加计算的速度及应用服务的反应速度。于现在的云服务器中,每个服务器内部亦具有BMC来进行监控管理。因此,是否可将BMC中的计算机制与云计算机制相互结合,让服务器能够利用低成本的BMC芯片亦可达到高计算效率,便是研究人员可以研究的重要方向。
发明内容
本发明提供一种计算机系统的开机管理方法,使得远程服务器可利用云计算机制对计算机装置进行开机管理流程,让计算机装置采用低计算效率的基板管理控制器来降低成本。
此外,本发明提供一种计算机系统,此计算机系统中的远程服务器可利用云计算机制对受其管理的计算机装置进行开机管理流程,让计算机装置可采用低计算效率的基板管理控制器来降低成本。
本发明提出一种计算机系统的开机管理方法,其适用于计算机系统内的远程服务器中。计算机系统的开机管理方法包括下列步骤。当受远程服务器管理的计算机装置为关机状态时,便可通过网络来发送一开机命令到计算机装置,并重置一计数器以开始倒数一超时时间。在此超时时间倒数完毕之前,检验是否通过网络接收到计算机装置所发送的基本输入输出系统(Basic Input/Output System;BIOS)启动完毕日志信息。以及,当没有接收到上述BIOS启动完毕日志信息,并且上述超时时间已倒数完毕之后,便通过网络发送一重新开机命令到上述计算机装置,并再次重置上述计数器以使其重新开始倒数所述的超时时间。
在本发明之一实施例中,上述的开机管理方法还包括下列步骤。当在发送上述开机命令时,远程服务器将一重新启动标记重置为0。当在发送上述重新开机命令时,远程服务器便对上述重新启动标记加1。当重新启动标记等于一预设数值时,远程服务器便停止发送上述重新开机命令并停止重置上述计数器,且执行一警告操作以告知计算机系统的维护人员。
在本发明之一实施例中,上述的开机管理方法还包括下列步骤。在上述超时时间倒数完毕,并且检验是否接收到上述BIOS启动完毕日志信息之前,远程服务器应可检验是否接收到上述计算机装置所发送的一BIOS开始执行日志信息。
在本发明之一实施例中,上述的开机管理方法还包括下列步骤。在上述超时时间倒数完毕,并且检验是否接收到上述BIOS启动完毕日志信息之前,远程服务器应可检验是否接收到上述计算机装置所发送的一电源启动日志信息。
在本发明之一实施例中,上述的计算机装置包括有一基板管理控制器(Baseboard Management Controller;BMC),其可接收上述开机命令以执行一开机操作。并且,BMC亦会将计算机装置的每一个运行情况皆处理为系统事件日志(System Event Log;SEL),并触发一云传输事件以及时将每个系统事件日志通过网络来发送到远程服务器。此外,上述的系统事件日志应可包括上述的BIOS开始执行日志信息、BIOS启动完毕日志信息及电源启动日志信息。
从另一个角度而言,本发明提出一种计算机系统,其包括有至少一计算机装置及一远程服务器。每个计算机装置中皆包括有BMC,其可接收开机命令以执行开机操作,并且将计算机装置上每一运行情况皆处理为系统事件日志,并触发一云传输事件以将上述系统事件日志通过网络及时地发送到远程服务器。远程服务器包括一计数器,其中,当所述计算机装置为关机状态时,远程服务器可通过网络发送开机命令到计算机装置,并重置计数器以开始倒数一超时时间。在上述超时时间倒数完毕之前,远程服务器便会检验是否通过网络来接收到此计算机装置发送的一BIOS启动完毕日志信息。如果在超时时间已倒数完毕后还没有接收到BIOS启动完毕日志信息的时候,远程服务器便通过网络发送一重新开机命令到上述计算机装置,并重置上述计数器以使其重新开始倒数超时时间。
接续上述,此计算机系统的其余实施细节请参照上述说明,在此不多加赘述。
基于上述,本发明实施例为了使计算机装置采用低计算效率的BMC,本发明实施例的BMC便会持续将计算机装置的系统管理日志通过网络来提供给远程服务器,让BMC的开机管理机制皆利用云计算机制中的远程服务器进行处理,BMC本身不具判断功能。因此,远程服务器便可在发送开机命令后,利用超时时间(time-out)的倒数机制(或是俗称的看门狗(watch dog)机制)来判断计算机装置的BIOS是否启动完毕,藉以完成对计算机装置的错误恢复开机(FRB)机制。
为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。
附图说明
图1是根据本发明一实施例所述的计算机系统的示意图。
图2为计算机装置的功能方框图。
图3为远程服务器的功能方框图。
图4是根据本发明一实施例所述的计算机系统的开机管理方法。
图5是根据本发明另一实施例所述的计算机系统的开机管理方法。
附图标记:
100:计算机系统
110:计算机装置
120:基板管理控制器(BMC)
130:网络
140:远程服务器
210:传感器
215:事件接收器
220:系统事件日志器
230  云传输模块
240:网卡接口
250:消息处理器
260:平台事件过滤器
270:警告处理模块
280:错误恢复开机模块
290:计数器
S410~S530:步骤
具体实施方式
现将详细参考本发明的示范性实施例,在附图中说明所述示范性实施例的实例。另外,凡可能之处,在附图及实施方式中使用相同标号的元件/构件/符号代表相同或类似部分。
如图1所示,图1是根据本发明一实施例所述的计算机系统100的示意图。计算机系统100包括有至少一个计算机装置110、网络130及远程服务器140,并且每个计算机装置110中亦包括有基板管理控制器(BMC)120。计算机装置110在此以多台服务器为例,但本发明并不限制于此。于其他实施例中,可利用具有BMC 120的个人计算机来作为计算机装置110的实现方式。
因此,符合本实施例的基板管理控制器120及远程服务器140的功能架构则如图2及图3所示,图2及图3分别为计算机装置110及远程服务器140的功能方框图。如图2及图3所示,为了使计算机装置110可采用低计算效率的BMC 120,本发明实施例的BMC 120本身不具备判断功能,让BMC的判断机制皆利用云计算机制中的远程服务器进行处理。
详细说明之,本实施例的BMC 120与以往BMC的不同之处在于,BMC 120并不包含以往BMC中所拥有的消息处理器(Message Handler)250、平台事件过滤器(Platform Event Filter,PEF)260、错误恢复开机(Fault Resilient Booting;FRB)模块280,甚到将警告处理模块270中的复杂判断机制皆转移到远程服务器140中,让以往BMC 120的判断机制皆利用远程服务器140以云计算机制的方式来进行处理。其中,FRB模块280中包括有一错误恢复计数器(也就是,图3中的计数器290),其于下述的开机管理方法中详细描述。
如图2所示,计算机装置110包括有BMC 120,而BMC 120本身仅保留有多个传感器210、事件接收器215、系统事件日志(System EventLog,SEL)器220、云传输模块230及网卡接口240。不同种类及用途的传感器210将会安装于计算机装置110各处。BMC 120利用传感器210或与其他接口相连的其他传感设备来侦测计算机装置的运行情况,例如微处理器的温度、风扇转速...等,并将这些所有的运行情况皆发送到事件接收器215以整理为系统事件日志(SEL)。
系统事件日志器220则是将这些系统事件日志进行储存记录。接着,BMC 120便在事件接收器215产生系统事件日志后,立即触发云传输模块230中的云传输事件,以利用云传输模块230及网卡接口240将系统事件日志通过网络130传递到图1之远程服务器140。此外,BMC 120亦可以利用网卡接口240及云传输模块230来接收并执行由图1的远程服务器140发送到计算机装置110的程序命令。
于其他实施例中,如果想要更为节省BMC 120的制作成本,亦可以将系统事件日志器220设置于图3的远程服务器140内,而不是设置于BMC 120中,使得BMC 120亦不需具备有系统事件日志的储存功能。
请参照图3,远程服务器140的网卡接口240及云传输模块230可从网络130中接收此计算机装置110所发送的系统事件日志,在经过BMC种类的判断流程、并且记录BMC的来源网址之后,消息处理器250便会配合平台事件过滤器260来分析上述系统事件日志,进而判断计算机装置的运行情况是否正常。
当判断出系统不正常时(例如微处理器过热、风扇无正常运转等),消息处理器250及平台事件过滤器260便会产生相应的程序命令,并通过网卡接口240及云传输模块230将程序命令传递到对应的计算机装置110的BMC 120中。其中,云传输模块230的云传输事件是利用软件进行实现,但亦可以利用模块化方式以硬件来实现,藉以降低开发成本,因此本发明并不限制于此。
远程服务器140亦可利用警告处理模块260来进行一警告操作,藉以通知维修人员对该台计算机装置110进行处理。另一方面,远程服务器140亦可利用错误恢复开机模块280来进行受其管理的计算机装置110的开机管理/开机恢复程序。
特别说明的是,以往每个BMC在进行开机管理程序时,现有技术是采用BMC当中的错误恢复开机(Fault Resilient Booting;FRB)模块,通过判断基本输入输出系统(Basic Input/Output System;BIOS)是否在一超时时间(time-out)内执行完毕与否,藉以达成开机管理/错误恢复开机机制。但若将BMC 120的计算机制利用云计算机制来实现的同时,BMC120当中便不会具有上述的FRB模块,因此便无法对计算机装置110进行良好的开机管理程序。
于此,本发明的精神在于,利用云计算机制将每个计算机装置110中BMC 120的开机管理/错误恢复开机机制功能挪到远程服务器140进行实现,藉以降低基板管理控制器的运行效率,从而减少BMC 120的制作成本。
于此,在此提出一实施例以实现本发明的精神。图4是根据本发明一实施例所述的计算机系统100的开机管理方法,其可适用于计算机系统100内的远程服务器140。此外,计算机装置110的BMC 120亦需对应此开机管理方法而进行相应的适合设计。
请以图4配合图1及图3来说明,在计算机系统100的开机管理方法中,计数器290当中已预设有一超时时间(time-out)。若远程服务器140在所有受其管理的计算机装置110的系统事件日志中得知其中一个计算机装置110为关机状态,而此计算机装置110应该为开机状态时;或是,如果想要将已知以关机的计算机装置110开启时,便进入步骤S410,远程服务器140通过其云传输模块230及网卡接口240以通过网络130来发送一开机命令到计算机装置110。
并且,于本实施例的步骤S410中,错误恢复开机模块280中的计数器290将会被重置,并开始将预先设定的超时时间进行倒数。此外,错误恢复开机模块280也会同时将一重新启动标记Frst重置为0。于其他实施例中,计数器290亦可通过看门狗计数器(Watch Dog Timer)作为其实现方式,在此不再赘述。
于步骤S420中,远程服务器140的错误恢复开机模块280便会持续判断超时时间是否倒数完毕。在超时时间倒数完毕之前,远程服务器140将会持续检验是否通过网络130来接收到计算机装置110所发送的基本输入输出系统(BIOS)启动完毕日志信息(步骤S430)。于本实施例中,在此所指的BIOS启动完毕日志信息为系统事件日志(SEL)的一种,是在计算机装置110中的BIOS将其电源启动自我测试(Power-OnSelf-Test;POST)程序执行完成时将会产生的系统事件日志。
正常而言,远程服务器140如果在超时时间倒数完毕之前收到上述BIOS启动完毕日志信息,便表示计算机装置110已开机完毕,因此便进入步骤S440,远程服务器140便会在计算机装置110的状态中标记其为开机状态。
然而,不幸地,如果并没有接收到计算机装置110的BIOS启动完毕日志信息,而步骤S420中的超时时间已倒数完毕后,便由步骤S420进入步骤S450,错误恢复开机模块280先行检验其重新启动标记Frst是否超过一预定数值的重新启动次数,使远程服务器140不必一直对该计算机装置110持续不断地进行重新开机动作。于本实施例中,上述的预定数值可为5,但不限制于此。
如果重新启动标记Frst并没有等于或是超过上述的预定数值,便由步骤S450进入步骤S460,远程服务器140通过网络130发送一重新开机命令、或是再次发送一开机命令到对应的计算机装置110,错误恢复开机模块280亦再次将计数器290进行重置,以使其回到步骤S420,并且重新开始倒数该超时时间。此外,错误恢复开机模块280于此同时并且对重新启动标记Frst加1,藉以计数远程服务器140对该计算机装置110进行重新开机动作的次数。
相对地,如果重新启动标记Frst已等于或是超过上述的预定数值时,表示已对该计算机装置110进行重新开机的次数已达到预定的次数。因此,便从步骤S450进入步骤S470,远程服务器140便停止发送上述的重新开机命令,错误恢复开机模块280于此同时亦停止重置计数器290。
并且,在步骤S470中,远程服务器140便会利用警告处理模块270来执行一警告操作,以对计算机系统100的维护人员自动告知此项信息,并请求维护人员的协助。上述警告操作可以是:发送特定的警告信息于远程服务器140的屏幕上、发送特定的警告封包到特定服务器或发出特定的警告声响等,本发明应不能受限于上述举例中。
综上所述,在每个计算机装置110中的BMC 120均将其开机管理/错误恢复开机机制的相关模块删除时,本发明实施例的远程服务器140可通过其中的错误恢复开机模块280来对每台计算机装置110达到以往BMC同样的效果。与以往的计算机系统相较,本发明实施例还可利用低计算效率的BMC来达成原本高计算效率的BMC的相关机制,因此可以更为降低每个计算机装置110的架设成本。在此特别说明的是,只要错误恢复开机模块280中的计数器290具有足够的数量,远程服务器140便可同时对多台受其管理的计算机装置110同时进行上述的开机管理方法/错误恢复开机机制。
图5是根据本发明另一实施例所述的计算机系统100的开机管理方法。本实施例与上述图4中所显示的开机管理方法相类似,其相同或类似的描述在此不再赘述。本实施例与图4的实施例的不同处在于,由于以往的BMC在其开机管理方法/错误恢复开机机制中,除了判断BIOS启动完毕日志信息以外,亦需对其他与错误恢复开机机制有关的系统事件信息进行判断,例如:计算机装置110的电源启动日志信息(于计算机装置110通电时产生的系统事件日志)、及BIOS开始执行日志信息(于计算机装置110中BIOS开始执行时时产生的系统事件日志)。
因此,于图5的步骤S530中,在超时时间倒数完毕之前,远程服务器140将会持续检验是否通过网络130依次接收到计算机装置110所发送的电源启动日志信息(亦即,先行检验计算机装置110是否通电),然后继续检验是否接收BIOS开始执行日志信息(亦即,检验计算机装置110的BIOS是否开始执行),最后才检验是否接收上述的BIOS启动完毕日志信息(亦即,检验计算机装置110的BIOS是否执行完毕)。若有依据上述的顺序来接收到这些系统事件日志,那么便进入步骤S440以认定计算机装置110已开机完成。相对地,如果没有依据上述顺序接收到这些系统事件日志,表示计算机装置110在其开机程序中有产生错误,因此便进入步骤S450~S470以继续进行错误恢复开机机制。
综合上述,本发明实施例为了使计算机装置可采用低计算效率的BMC,本发明实施例的BMC便会持续将计算机装置的系统管理日志通过网络来提供给远程服务器,让BMC的开机管理机制皆利用云计算机制中的远程服务器进行处理,BMC本身不具判断功能。因此,远程服务器便可在发送开机命令后,利用超时时间(time-out)的倒数机制(或是俗称的看门狗(watch dog)机制)来判断计算机装置的BIOS是否启动完毕,藉以完成对计算机装置的开机管理机制(或称为,错误恢复开机(FRB)机制)。
虽然本发明已以实施例揭示如上,然其并非用以限定本发明,任何所属技术领域中普通技术人员,当可作些许更动与润饰,而不脱离本发明的精神和范围。

Claims (10)

1.一种计算机系统的开机管理方法,适用于一远程服务器,该计算机系统的开机管理方法包括:
当受远程服务器管理的一计算机装置为一关机状态时,通过一网络发送一开机命令到该计算机装置,并重置该远程服务器中的一计数器以开始倒数一超时时间;
在该超时时间倒数完毕之前,检验是否通过该网络接收到该计算机装置发送的一BIOS启动完毕日志信息;以及
当没有接收到该BIOS启动完毕日志信息,且该超时时间已倒数完毕后,通过该网络发送一重新开机命令到该计算机装置,并重置该计数器以使其重新开始倒数该超时时间。
2.根据权利要求1所述的计算机系统的开机管理方法,其中还包括:
当在发送该开机命令时,重置一重新启动标记为0;
当在发送该重新开机命令时,对该重新启动标记加1;以及
当该重新启动标记等于一预设数值时,停止发送该重新开机命令并停止重置该计数器,且执行一警告操作。
3.根据权利要求1所述的计算机系统的开机管理方法,其中还包括:
在该超时时间倒数完毕,且检验是否接收到该BIOS启动完毕日志信息之前,检验是否接收到该计算机装置发送的一BIOS开始执行日志信息。
4.根据权利要求1所述的计算机系统的开机管理方法,其中还包括:
在该超时时间倒数完毕,且检验是否接收到该BIOS启动完毕日志信息之前,检验是否接收到该计算机装置发送的一电源启动日志信息。
5.根据权利要求1所述的计算机系统的开机管理方法,其中该计算机装置包括:
一基板管理控制器,其接收该开机命令以执行一开机操作,且将该计算机装置的每一运行情况处理为至少一系统事件日志,并触发一云传输事件以将所述系统事件日志通过该网络发送到该远程服务器。
6.根据权利要求5所述的计算机系统的开机管理方法,其中该系统事件日志包括一BIOS开始执行日志信息及该BIOS启动完毕日志信息。
7.一种计算机系统,包括:
至少一计算机装置,包括:
一基板管理控制器,其接收一开机命令以执行一开机操作,且将该计算机装置的每一运行情况处理为至少一系统事件日志,并触发一云传输事件以将所述系统事件日志通过一网络发送到该远程服务器;以及
一远程服务器,其包括一计数器,其中,当受远程服务器管理的该计算机装置为一关机状态时,该远程服务器通过该网络发送一开机命令到该计算机装置,并重置该计数器以开始倒数一超时时间;在该超时时间倒数完毕之前,该远程服务器检验是否通过该网络接收到该计算机装置发送的一BIOS启动完毕日志信息;当没有接收到该BIOS启动完毕日志信息,且该超时时间已倒数完毕后,该远程服务器通过该网络发送一重新开机命令到该计算机装置,并重置该计数器以使其重新开始倒数该超时时间。
8.根据权利要求7所述的计算机系统,其中该远程服务器在发送该开机命令时还重置一重新启动标记为0,且在发送该重新开机命令时,该远程服务器还对该重新启动标记加1,当该重新启动标记等于一预设数值时,该远程服务器停止发送该重新开机命令,停止重置该计数器,并执行一警告操作。
9.根据权利要求8所述的计算机系统,其中在该超时时间倒数完毕,且检验是否接收到该BIOS启动完毕日志信息之前,该远程服务器检验是否接收到该计算机装置发送的一BIOS开始执行日志信息。
10.根据权利要求8所述的计算机系统,其中在该超时时间倒数完毕,且检验是否接收到该BIOS启动完毕日志信息之前,该远程服务器检验是否接收到该计算机装置发送的一电源启动日志信息。
CN 201110434798 2011-12-22 2011-12-22 计算机系统及计算机系统的开机管理方法 Pending CN103178977A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110434798 CN103178977A (zh) 2011-12-22 2011-12-22 计算机系统及计算机系统的开机管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110434798 CN103178977A (zh) 2011-12-22 2011-12-22 计算机系统及计算机系统的开机管理方法

Publications (1)

Publication Number Publication Date
CN103178977A true CN103178977A (zh) 2013-06-26

Family

ID=48638609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110434798 Pending CN103178977A (zh) 2011-12-22 2011-12-22 计算机系统及计算机系统的开机管理方法

Country Status (1)

Country Link
CN (1) CN103178977A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295276A (zh) * 2016-08-09 2017-01-04 浪潮电子信息产业股份有限公司 一种记录用户输入bios密码进入系统的方法
CN106502818A (zh) * 2016-11-10 2017-03-15 英业达科技有限公司 一种计算机系统及其看门狗实现方法
CN109032888A (zh) * 2018-06-28 2018-12-18 郑州云海信息技术有限公司 一种服务器启动过程故障检测方法、装置及受控终端
CN112486661A (zh) * 2019-09-12 2021-03-12 赵伟 一种计算机集群错峰开机的自动控制方法及系统
CN113626233A (zh) * 2021-06-30 2021-11-09 浪潮电子信息产业股份有限公司 一种自动检测bios看门狗功能的方法、装置及设备
CN116303213A (zh) * 2023-03-22 2023-06-23 合芯科技有限公司 一种提高bmc芯片计算效率的系统及方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295276A (zh) * 2016-08-09 2017-01-04 浪潮电子信息产业股份有限公司 一种记录用户输入bios密码进入系统的方法
CN106502818A (zh) * 2016-11-10 2017-03-15 英业达科技有限公司 一种计算机系统及其看门狗实现方法
CN109032888A (zh) * 2018-06-28 2018-12-18 郑州云海信息技术有限公司 一种服务器启动过程故障检测方法、装置及受控终端
CN112486661A (zh) * 2019-09-12 2021-03-12 赵伟 一种计算机集群错峰开机的自动控制方法及系统
CN113626233A (zh) * 2021-06-30 2021-11-09 浪潮电子信息产业股份有限公司 一种自动检测bios看门狗功能的方法、装置及设备
CN113626233B (zh) * 2021-06-30 2024-02-13 浪潮电子信息产业股份有限公司 一种自动检测bios看门狗功能的方法、装置及设备
CN116303213A (zh) * 2023-03-22 2023-06-23 合芯科技有限公司 一种提高bmc芯片计算效率的系统及方法
CN116303213B (zh) * 2023-03-22 2024-03-15 合芯科技有限公司 一种提高bmc芯片计算效率的系统及方法

Similar Documents

Publication Publication Date Title
JP6530774B2 (ja) ハードウェア障害回復システム
TWI746512B (zh) 實體機器故障分類處理方法、裝置和虛擬機器恢復方法、系統
US9954727B2 (en) Automatic debug information collection
TWI229796B (en) Method and system to implement a system event log for system manageability
US10698788B2 (en) Method for monitoring server, and monitoring device and monitoring system using the same
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
CN102880527B (zh) 一种基板管理控制器的数据恢复方法
US10037238B2 (en) System and method for encoding exception conditions included at a remediation database
CN102571498B (zh) 故障注入控制方法和装置
JP2017517060A (ja) 障害処理方法、関連装置、およびコンピュータ
CN104391777B (zh) 基于Linux操作系统的云平台及其运行监控方法和装置
CN103178977A (zh) 计算机系统及计算机系统的开机管理方法
CN111831488B (zh) 具有安全等级设计的tcms-mpu控制单元
CN103475696A (zh) 云计算集群服务器状态监控系统和方法
CN109240851A (zh) 一种自主式实现批量bmc自恢复的方法及系统
CN103580941B (zh) 网络看门狗及其实现方法
CN104506362A (zh) 一种cc-numa多节点服务器上系统状态切换和监控的方法
CN107111595A (zh) 双用途引导寄存器
US10298479B2 (en) Method of monitoring a server rack system, and the server rack system
CN114116280A (zh) 交互式bmc自恢复方法、系统、终端及存储介质
CN110502369A (zh) 一种设备死机恢复的方法、装置和存储介质
CN108762886A (zh) 虚拟机的故障检测恢复方法及系统
CN104571098B (zh) 基于Atom平台的远程自诊断方法
CN102819474A (zh) 系统操作的测试方法和装置
TW201324115A (zh) 電腦系統及電腦系統的開機管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C05 Deemed withdrawal (patent law before 1993)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130626