CN1635472A - 多处理器计算机系统的开机切换方法 - Google Patents

多处理器计算机系统的开机切换方法 Download PDF

Info

Publication number
CN1635472A
CN1635472A CN 200310124031 CN200310124031A CN1635472A CN 1635472 A CN1635472 A CN 1635472A CN 200310124031 CN200310124031 CN 200310124031 CN 200310124031 A CN200310124031 A CN 200310124031A CN 1635472 A CN1635472 A CN 1635472A
Authority
CN
China
Prior art keywords
cpu
rom
bios
bmc
changeover program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200310124031
Other languages
English (en)
Other versions
CN1294488C (zh
Inventor
李俊良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CNB200310124031XA priority Critical patent/CN1294488C/zh
Publication of CN1635472A publication Critical patent/CN1635472A/zh
Application granted granted Critical
Publication of CN1294488C publication Critical patent/CN1294488C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Stored Programmes (AREA)

Abstract

一种多处理器计算机系统的开机切换方法,利用一基板管理控制器BMC管理多处理器计算机系统的开机异常问题,其根据计算机系统的中央处理单元(CPU)或储存于只读存储器(ROM)中的基本输入输出系统(BIOS)的使用状态,通过一CPU切换程序或一ROM切换程序,可切换到可用的CPU与BIOS进行开机,该CPU切换程序通过该BMC于一开机CPU与至少一应用CPU之间切换,将执行开机程序的BIOS由储存于一开机ROM的一开机BIOS,切换至储存于至少一备份ROM的一备份BIOS;当通过该CPU切换程序仍无法开机时,还包含进行一ROM只读存储器切换程序并重新开机的步骤。该方法可有效提升系统的稳定性。

Description

多处理器计算机系统的开机切换方法
技术领域
本发明涉及一种多处理器计算机系统的开机异常管理方法,特别是指一种由BMC基板管理控制器进行CPU或ROM切换程序,以管理开机异常问题的方法。
背景技术
在计算机系统中,基于高可用性(High Available)系统的设计理念,为了可以维持系统继续运行,而不需任何人为操作将故障排除,就有备份系统存在的必要,此是多处理器(multiple processor)系统产生的原因之一。多处理器计算机系统如服务器(sever),由于具有多个中央处理单元(CPU),因此可以提高整体处理效能,并于指定CPU发生错误时作为替代之用。
一般而言,对于多处理器计算机系统的开机程序,是指定单一的开机CPU(Boot strap Processor)提供运算功能,负责处理开机时基本输入输出系统(BIOS)的指令,以进行计算机系统初始化作业并加载操作系统(OS);其中,开机BIOS是储存于基本输入输出系统的只读存储器(BIOS ROM)上,而开机时其它的CPU被定义为应用CPU(application processors),并被设定处于等待状态(wait state)。
当使用开机CPU无法开机时,既有的作法是于BIOS中编写开机时切换CPU的程序,由开机CPU切换到其它的应用CPU,其切换机制如图1所示。
另一个可能发生的问题,是BIOS已经切换到所有的CPU尝试,但仍然无法开机;此状况可能是BIOS ROM出了问题。为了解决BIOS异常的问题,一个甚至多个备份只读存储器(backup ROM)被用来作为替代方案;将开机BIOS切换到储存在备份ROM上的备份BIOS,继续进行开机程序,其切换机制如图2所示。
然而,前述作法的缺点是必须使用特殊的BIOS来切换CPU,或者作只读存储器开机切换(ROM Boot Swap)设计,进行BIOS ROM的切换,其电子线路是比较复杂的,所以其过于麻烦且不符合成本效益。
发明内容
本发明所要解决的技术问题,在于常用技术中是以改写BIOS、设计ROM切换开机等方式进行开机异常的切换处理,不符合成本效益与工作需求。
鉴于以上公知技术的问题,本发明提供一种多处理器计算机系统的开机切换方法,利用基板管理控制器BMC来管理开机异常时CPU与BIOS切换的判断与执行作业,其中包含以下步骤:通过一BMC基板管理控制器确认开机异常;进行一CPU中央处理单元切换程序并重新开机;当CPU切换程序失败时,还包含进行一ROM只读存储器切换程序并重新开机的步骤;其中,CPU切换程序通过BMC于一开机CPU与至少一应用CPU之间切换;而且,ROM切换程序通过BMC,将执行开机程序的BIOS由储存于一开机ROM的一开机BIOS,切换至储存于至少一备份ROM的一备份BIOS。
本发明达到的功效,在于可以BMC管理开机异常问题,系统BIOS和ROM均不必作额外的设计,而可进一步提高系统稳定性。
附图说明
图1、图2是说明先前技术中多处理器系统的开机切换机制;
图3是说明本发明以BMC管理多处理器系统的开机切换机制;
图4是说明本发明以BMC进行多处理器系统开机的CPU切换流程;及
图5是说明本发明以BMC进行多处理器系统开机的ROM切换流程。
其中,附图标记说明如下:
步骤110BMC未接获开机BIOS和一已开机信息
步骤120系统正常开机运行
步骤130未完成CPU切换程序与ROM切换程序
步骤140系统无法开机运行
步骤150确认未完成CPU切换程序
步骤160进行CPU切换程序
步骤161改变所有CPU的SMI状态以将BSP CPU与CPU总线隔绝
步骤162BMC产生一CPU切换信号与一重开机信号至开机BIOS或备份BIOS
步骤170 ROM切换程序
CPU中央处理单元
BIOS基本输入输出系统
ROM只读存储器
BMC基板管理控制器
BSP CPU预设开机的CPU SMI1、SMI2系统管理中断
SWAP状态切换状态
STBY_PGD待命开机状态
ROM_SWAP ROM切换状态
STATE_CHANGE状态转换
SYS_PGD系统重开机状态
CPU_SWAP CPU切换状态
LOW低位
HIGH高位
BACKUPROM备份ROM状态
ROMswitch ROM切换状态
具体实施方式
本发明涉及一种多处理器计算机系统的开机切换方法,主要是利用基板管理控制器BMC(Baseboard Management Controller)来管理开机异常时CPU与BIOS切换的判断与执行作业。
BMC原本是应用于智能平台管理接口(IPMI),控制系统的管理软件和平台管理硬件之间的接口,提供自主监视、事件记录和恢复控制功能,并可作为系统管理软件和智能平台管理总线IPMB(Intelligent Platform Management Bus)与智能机箱管理总线ICMB(Intelligent Chassis Management Bus)接口间的网络网关使用。
之所以可以通过BMC来管理系统异常问题,是因为系统可以通过低接脚数LPC(Low Pin Count)接口,从BMC得到系统的状况信息。
本发明即为BMC的另一全新的应用领域,以下根据图3说明通过BMC管理开机异常状况的处理方式。执行优先级,基本是先作CPU切换、重开机,若不行再做ROM切换、重开机。
首先,在系统电源激活后,确认BMC未接获开机BIOS的一已开机信息(步骤110);如接获已开机信息,表示系统正常开机操作(步骤120)。BMC以系统备用电源供电,因此系统电源激活前,BMC即已备妥,如此才能在系统电源一激活,就接收BIOS传来的开机程序运行状态。
接着,确认未完成CPU切换程序与ROM切换程序(步骤130);如系统已完成CPU、ROM切换程序却无法开机,代表所有CPU均发生错误,系统无法开机运行(步骤140),只能人工排除故障,例如更换CPU。
其次,确认未完成CPU切换程序(步骤150),随即进行CPU切换程序(步骤160)。
步骤160的CPU切换程序,还包括两个详细流程;其一为改变所有CPU的SMI状态以将BSP CPU(所谓BSP CPU是指boot strap processor,是指一开始开机时,先开始动作开机的CPU,也就是预设用以开机的CPU;于第二次以后的CPU切换程序中,则为前一次开机的CPU)与CPU总线隔绝(步骤161),然后BMC产生一CPU切换信号与一重开机信号至开机BIOS或备份BIOS(步骤162)。重开机之后,即回到步骤110确认开机状态。
步骤150的判断后,如已进行过CPU切换,即进行ROM切换程序(步骤170)。此程序即在将执行开机程序的BIOS,由BIOS ROM中的开机BIOS,切换到备份ROM中的备份BIOS,并以备份BIOS重开机;详而言之,由BMC产生ROM切换信号至一复杂可编程逻辑器件CPLD(Complex ProgrammableLogic Device)以切换至备份ROM,并产生系统重开机信号至备份BIOS。重开机之后,也回到步骤110确认开机状态。
请参阅图4,说明在执行CPU切换时,BMC中的执行流程,可用以证明本发明的可行性。SMI1与SMI2为BMC上的两个系统管理中断SMI(SystemManagement Interrupt),SWAP状态表示切换状态,STBY_PGD、ROM_SWAP、STATE_CHANGE、SYS_PGD、CPU_SWAP等为BMC中控制程序的功能参数;STBY_PGD为待命开机状态,ROM_SWAP为ROM切换状态,STATE_CHANGE为状态转换,SYS_PGD为系统重开机状态,CPU_SWAP为CPU切换状态。图中CPU的切换包含四个状态,可让BMC知道切换到第几个CPU,各状态下的执行内容分述如下:
第1状态的执行内容包括:a.设定SMI1为LOW(低位);
b.设定SMI2为HIGH(高位);
c.设定SWAP状态至第2状态;
d.设定STATE_CHANGE为CHANGE(转换)。
第2状态的执行内容包括:
a.设定SMI1为HIGH;
b.设定SMI2为LOW;
c.设定SWAP状态至第3状态;
d.设定STATE_CHANGE为CHANGE。
第3状态的执行内容包括:
a.设定SMI1为LOW;
b.设定SMI2为LOW;
c.设定SWAP状态至第4状态;
d.设定STATE_CHANGE为CHANGE。
第4状态的执行内容包括:
a.设定SWAP状态至第4状态;
b.设定STATE_CHANGE为CHANGE。
图5可说明本发明在利用BMC进行ROM切换(ROM SWAP)时的详细流程,也可用以验证本发明的可行性。其中BACKUPROM代表备份ROM状态,于本发明中,备份ROM可处于正常状态(normal state)或备用状态(backupstate);ROMswitch则代表ROM切换状态的功能参数。
根据图4、图5的CPU及ROM流程,BMC可依据图3的流程,于开机异常时先进行图4的CPU切换,未成功开机时再进行图5ROM切换,证实以BMC管理开机异常状况确实可行。
以上所述,仅为本发明较佳的实施例,并非用以限定本发明实施的范围,熟悉此技术人员经本发明的揭示后,据此所作的改变及调整,均属于本发明技术思想的范围内。
因此,在不脱离本发明的精神和范围内所作的均等变化与修饰,均应属于本发明的权利要求书所要求保护的申请专利范围内。

Claims (6)

1.一种多处理器计算机系统的开机切换方法,其中包含以下步骤:
通过一BMC基板管理控制器确认开机异常;及
进行一CPU中央处理单元切换程序并重新开机;
该CPU切换程序通过该BMC于一开机CPU与至少一应用CPU之间切换;
当通过该CPU切换程序仍无法开机时,还包含进行一ROM只读存储器切换程序并重新开机的步骤;
该ROM切换程序通过该BMC,将执行开机程序的BIOS由储存于一开机ROM的一开机BIOS,切换至储存于至少一备份ROM的一备份BIOS。
2.如权利要求1所述的多处理器计算机系统的开机切换方法,其中该CPU切换程序还包含:
改变各CPU的SMI系统管理中断状态,将前一次开机的该CPU与一CPU总线隔绝;以及
通过BMC产生一CPU切换信号与一重开机信号至该开机BIOS或该备份BIOS。
3.如权利要求1所述的多处理器计算机系统的开机切换方法,其中该ROM切换程序是由该BMC产生一ROM切换信号至一复杂可编程逻辑器件CPLD以切换至该备份ROM,并产生一系统重开机信号至该备份BIOS。
4.如权利要求1所述的多处理器计算机系统的开机切换方法,其中开机异常是指该BMC未收到来自该开机BIOS或该备份BIOS的一已开机信息。
5.如权利要求1所述的多处理器计算机系统的开机切换方法,其中在确认开机异常之后,还包含一确认未完成该CPU切换程序与该ROM切换程序的步骤。
6.如权利要求5所述的多处理器计算机系统的开机切换方法,其中在进行该CPU切换程序前,还包含一确认未完成该CPU切换程序的步骤。
CNB200310124031XA 2003-12-31 2003-12-31 多处理器计算机系统的开机切换方法 Expired - Fee Related CN1294488C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB200310124031XA CN1294488C (zh) 2003-12-31 2003-12-31 多处理器计算机系统的开机切换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB200310124031XA CN1294488C (zh) 2003-12-31 2003-12-31 多处理器计算机系统的开机切换方法

Publications (2)

Publication Number Publication Date
CN1635472A true CN1635472A (zh) 2005-07-06
CN1294488C CN1294488C (zh) 2007-01-10

Family

ID=34844924

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200310124031XA Expired - Fee Related CN1294488C (zh) 2003-12-31 2003-12-31 多处理器计算机系统的开机切换方法

Country Status (1)

Country Link
CN (1) CN1294488C (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008104117A1 (fr) * 2007-02-27 2008-09-04 Huawei Technologies Co., Ltd. Équipement électronique.sa méthode d'activation et méthode et dispositif de mise à niveau de bios
CN100418059C (zh) * 2006-01-25 2008-09-10 英业达股份有限公司 切换失效的检测方法
CN100442231C (zh) * 2006-09-20 2008-12-10 威盛电子股份有限公司 计算机系统的开机装置及方法
CN101132314B (zh) * 2007-09-21 2010-09-29 中兴通讯股份有限公司 实现冗余备份的方法
CN102722423A (zh) * 2011-03-29 2012-10-10 比亚迪股份有限公司 一种便携式终端及其自行修复的方法
CN101582036B (zh) * 2008-05-14 2013-01-02 英业达股份有限公司 共享式基本输入输出系统的伺服装置及方法
CN103077060A (zh) * 2013-01-10 2013-05-01 中兴通讯股份有限公司 主备用bios的切换方法及装置、系统
CN104618121A (zh) * 2015-01-29 2015-05-13 曙光云计算技术有限公司 交换器及服务器系统
CN105022629A (zh) * 2015-06-29 2015-11-04 浪潮电子信息产业股份有限公司 开机控制方法、装置和服务器
CN105100179A (zh) * 2014-05-23 2015-11-25 杭州华为数字技术有限公司 服务器集群系统
CN108153648A (zh) * 2017-12-27 2018-06-12 西安奇维科技有限公司 一种实现灵活调度的多冗余计算机的方法
CN112486742A (zh) * 2019-09-12 2021-03-12 环达电脑(上海)有限公司 远端查看服务器开机状态的方法与服务器

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847043B (zh) * 2009-03-25 2012-11-21 联想(北京)有限公司 共用存储设备的方法及移动终端

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5923830A (en) * 1997-05-07 1999-07-13 General Dynamics Information Systems, Inc. Non-interrupting power control for fault tolerant computer systems
US6892323B2 (en) * 1999-05-05 2005-05-10 Giga-Byte Technology Co., Ltd. Dual basic input/output system for a computer
US6760869B2 (en) * 2001-06-29 2004-07-06 Intel Corporation Reporting hard disk drive failure

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100418059C (zh) * 2006-01-25 2008-09-10 英业达股份有限公司 切换失效的检测方法
CN100442231C (zh) * 2006-09-20 2008-12-10 威盛电子股份有限公司 计算机系统的开机装置及方法
WO2008104117A1 (fr) * 2007-02-27 2008-09-04 Huawei Technologies Co., Ltd. Équipement électronique.sa méthode d'activation et méthode et dispositif de mise à niveau de bios
CN101132314B (zh) * 2007-09-21 2010-09-29 中兴通讯股份有限公司 实现冗余备份的方法
CN101582036B (zh) * 2008-05-14 2013-01-02 英业达股份有限公司 共享式基本输入输出系统的伺服装置及方法
CN102722423A (zh) * 2011-03-29 2012-10-10 比亚迪股份有限公司 一种便携式终端及其自行修复的方法
CN103077060A (zh) * 2013-01-10 2013-05-01 中兴通讯股份有限公司 主备用bios的切换方法及装置、系统
CN105100179A (zh) * 2014-05-23 2015-11-25 杭州华为数字技术有限公司 服务器集群系统
CN105100179B (zh) * 2014-05-23 2018-10-19 杭州华为数字技术有限公司 服务器集群系统
CN104618121A (zh) * 2015-01-29 2015-05-13 曙光云计算技术有限公司 交换器及服务器系统
CN105022629A (zh) * 2015-06-29 2015-11-04 浪潮电子信息产业股份有限公司 开机控制方法、装置和服务器
CN105022629B (zh) * 2015-06-29 2018-02-23 浪潮电子信息产业股份有限公司 开机控制方法、装置和服务器
CN108153648A (zh) * 2017-12-27 2018-06-12 西安奇维科技有限公司 一种实现灵活调度的多冗余计算机的方法
CN112486742A (zh) * 2019-09-12 2021-03-12 环达电脑(上海)有限公司 远端查看服务器开机状态的方法与服务器
CN112486742B (zh) * 2019-09-12 2024-04-12 环达电脑(上海)有限公司 远端查看服务器开机状态的方法与服务器

Also Published As

Publication number Publication date
CN1294488C (zh) 2007-01-10

Similar Documents

Publication Publication Date Title
CN1294488C (zh) 多处理器计算机系统的开机切换方法
US9798556B2 (en) Method, system, and apparatus for dynamic reconfiguration of resources
CN1191528C (zh) 透明的基于时间的选择软件再生的方法和系统
CN1147788C (zh) 双重化计算机系统
CN1495611A (zh) 容错计算机系统及其再同步方法和再同步程序
CN1892612A (zh) 集群可用性管理方法和系统
CN1615472A (zh) 在多处理环境中执行进程
CN1991783A (zh) 检测以及校正挂起i2c总线的i2c总线监视器和方法
CN1760839A (zh) 帮助多端口主机适配器的端口测试的装置、系统和方法
US7194614B2 (en) Boot swap method for multiple processor computer systems
JP2007172334A (ja) 並列型演算システムの冗長性を確保するための方法、システム、およびプログラム
US10417012B2 (en) Reprogramming a field programmable device on-demand
CN108874549B (zh) 资源复用方法、装置、终端和计算机可读存储介质
CN1828573A (zh) 一种多cpu系统及其控制方法
US20040177242A1 (en) Dynamic computer system reset architecture
CN1295903C (zh) 一种系统安全启动方法
CN1908911A (zh) 在可修复的故障后使群集器系统自动投入运行
CN115981685A (zh) 应用升级方法、装置、计算设备和芯片系统
CN103885920A (zh) 对用于多处理器系统的初始化的主微处理器的选择
JP2011044110A (ja) ソフトウェアプログラム実行装置、ソフトウェアプログラム実行方法、及びプログラム
CN1300661C (zh) 计算机系统及电源管理状态切换方法
CN1722628A (zh) 通信系统中设备的倒换方法及其系统
CN101044459A (zh) 在具有混合体系结构的系统中使用原子操作来修改信息单元的方法和装置
CN1093661C (zh) 反向恢复型输入输出控制装置和输入输出控制方法
CN1278204C (zh) 电源管理状态控制方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Assignee: Inventec Technology Co., Ltd.

Assignor: Inventec Corporation

Contract fulfillment period: 2007.2.1 to 2013.1.31 contract change

Contract record no.: 2008990000343

Denomination of invention: Starting-up switching method of multi-processor computer system

Granted publication date: 20070110

License type: Exclusive license

Record date: 2008.9.2

LIC Patent licence contract for exploitation submitted for record

Free format text: EXCLUSIVE LICENCE; TIME LIMIT OF IMPLEMENTING CONTACT: 2007.2.1 TO 2013.1.31

Name of requester: SINO-BRITISH TRADE AMOUNTED TECHNOLOGY CO.

Effective date: 20080902

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070110

Termination date: 20101231