CN104133759A - 一种实现扩展模组移除的方法及装置 - Google Patents

一种实现扩展模组移除的方法及装置 Download PDF

Info

Publication number
CN104133759A
CN104133759A CN201410384121.0A CN201410384121A CN104133759A CN 104133759 A CN104133759 A CN 104133759A CN 201410384121 A CN201410384121 A CN 201410384121A CN 104133759 A CN104133759 A CN 104133759A
Authority
CN
China
Prior art keywords
expansion module
abnormal
module
occurs
notice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410384121.0A
Other languages
English (en)
Inventor
王永欢
薛广营
王瑞东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201410384121.0A priority Critical patent/CN104133759A/zh
Publication of CN104133759A publication Critical patent/CN104133759A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种实现扩展模组移除的方法及装置,包括:实时检测各个扩展模组是否发生异常,当检测到某个扩展模组发生异常时,通知中央处理器CPU;CPU停止发生异常的扩展模组中全部PCIE卡的工作,并通知基板管理控制器BMC关闭该发生异常的扩展模组的电源,移除该发生异常的扩展模组。本发明技术方案实现了扩展模组的异常检测以及将发生异常的扩展模组进行移除。

Description

一种实现扩展模组移除的方法及装置
技术领域
本发明涉及移动通信技术,尤指一种实现对发生异常的扩展模组移除的方法及装置。
背景技术
飞速发展的业务需求带动了服务器行业巨大的技术变革,服务器的扩展模组支持热拔插化处理更是极大的方便了用户的管理。
当用户需要管理扩展模组的PCIE扩展卡,或者需要更换扩展模组的风扇时,可以通过扩展模组的热拔插来实现。
但是,现有技术中一般都是依据用户的需求来移除扩展模组,如用户需要更新扩展模组或者是更换扩展模组上的风扇等。但是,目前没有提供对发生异常的扩展模组进行故障检测并将其移除的技术方案。
发明内容
为了解决上述技术问题,本发明提供了一种实现扩展模组移除的方法及装置,能够实现扩展模组的异常检测,并将发生异常的扩展模组移除。
为了达到本发明目的,本发明提供了一种实现扩展模组移除的方法,包括:
实时检测各个扩展模组是否发生异常,当检测到某个扩展模组发生异常时,通知中央处理器CPU;
CPU停止发生异常的扩展模组中全部PCIE卡的工作,并通知基板管理控制器BMC关闭该发生异常的扩展模组的电源,移除该发生异常的扩展模组。
进一步地,在实时检测各个扩展模组是否发生异常之前,该方法还包括:预先设置检测参数异常条件。
进一步地,实时检测各个扩展模组是否发生异常,包括:
实时获取各个扩展模组的检测参数值;
比较实时获得的检测参数值是否满足所述检测参数异常条件,如果满足,则确定所述扩展模组发生异常。
进一步地,检测参数值包括温度值和/或电压值;
上述确定扩展模组发生异常为:实时获得的温度值不满足预先设置的温度阈值,或实时获得的电压值不满足预先设置的电压阈值。
进一步地,在通知中央处理器CPU该扩展模组异常之前,该方法还包括:
将发生异常的扩展模组通知依次经由BMC、操作系统OS、基本输入输出系统BIOS发送至CPU。
进一步地,通知BMC关闭所述扩展模组的电源,包括:
CPU通知BIOS发生异常的扩展模组中的全部PCIE卡已停止工作;
BIOS将该通知经由OS发送给BMC;
BMC控制发生异常的扩展模组关闭电源。
本发明还提供了一种实现扩展模组移除的装置,包括:异常检测模块、通知模块、中央处理模块和管理控制模块;其中,
异常检测模,用于实时检测各个扩展模组是否发生异常;
通知模块,用于当检测到某个扩展模组发生异常时,通知中央处理模块该扩展模组异常;
中央处理模块,用于停止该发生异常的扩展模组中全部PCIE卡的工作,并通知管理控制模块关闭该发生异常的扩展模组的电源;
管理控制模块,用于接收中央处理模块的通知,根据获得的通知关闭该发生异常的扩展模组的电源,移除该发生异常的扩展模组。
进一步地,该装置还包括:设置模块,用于预先设置检测参数异常条件。
进一步地,异常检测模具体用于:
实时获取各个扩展模组的检测参数值;
比较实时获得的检测参数值是否满足所述检测参数异常条件,如果满足,则确定所述扩展模组发生异常。
进一步地,检测参数值包括温度值和/或电压值;
确定所述扩展模组发生异常为:实时获得的温度值不满足预先设置的温度阈值,或实时获得的电压值不满足预先设置的电压阈值。
进一步地,通知管理控制模块关闭所述发生异常的扩展模组的电源,包括:
中央处理模块通知管理控制模块发生异常的扩展模组中的全部PCIE卡已停止工作;
管理控制模块控制发生异常的扩展模组关闭电源。
本发明技术方案包括:实时检测各个扩展模组是否发生异常,当检测到某个扩展模组发生异常时,实时检测各个扩展模组是否发生异常,当检测到某个扩展模组发生异常时,通知中央处理器CPU;CPU停止发生异常的扩展模组中全部PCIE卡的工作,并通知基板管理控制器BMC关闭该发生异常的扩展模组的电源,移除该发生异常的扩展模组。本发明技术方案实现了扩展模组的异常检测以及将发生异常的扩展模组进行移除。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实现扩展模组移除的方法的流程图;
图2为本发明实现扩展模组移除的方法的实施例的流程图;
图3为本发明实现扩展模组移除的装置的结构示意图。
具体实施方式
下面结合附图及具体实施例对本发明进行详细的说明。
图1为本发明实现扩展模组移除的方法的流程图,如图1所示,包括以下步骤:
步骤101,实时检测各个扩展模组是否发生异常,当检测到某个扩展模组发生异常时,通知中央处理器(CPU)。
在步骤101之前,该方法还包括:预先设置检测参数异常条件,如温度阈值、电压阈值等。关于如何设置阈值,是本领域技术人员所熟知的惯用技术手段,在此不再赘述。
其中,实时检测各个扩展模组是否发生异常,包括:
实时获取各个扩展模组的检测参数值;
比较实时获得的检测参数值是否满足所述检测参数异常条件,如果满足,则确定所述扩展模组发生异常。
上述检测参数值包括温度值和/或电压值。
本步骤中,可以采用W83795实时获取各个扩展模组的检测参数如温度值和/或电压值,并将获得的检测参数如温度值和/或电压值发送给基板管理控制器(BMC),其中W83795芯片可以通过集成电路总线(IIC)接口与基板管理控制器(BMC)相连。W83795芯片是新唐科技(Nuvoton)公司的主板侦测控制芯片,具有精准的电压、温度侦测能力,还具有检测风扇转速和控制风扇转速的功能,能够提供完整的主板侦测功能。
进一步地,确定扩展模组发生异常为:实时获得的温度值不满足预先设置的温度阈值,或实时获得的电压值不满足预先设置的电压阈值。需要说明的是,这里的温度阈值是指正常的温度范围,当实时获得的温度值不在正常的温度范围内,即温度异常,继而认为扩展模组发生异常;电压阈值是正常的电压范围,当实时获得的电压值不在正常的电压范围内,即电压异常,继而认为扩展模组发生异常。正常的温度范围和正常的电压范围是根据机器的性能和测试最终得到的,并不是一个固定值。
具体地,比较实时获得的检测参数值是否满足所述检测参数异常条件是指:比较实时获得的检测参数值与预先设置的检测参数阈值之间的大小,当实时获得的检测参数值不满足预先设置的检测参数阈值,比如实时检测到的温度值不满足预先设置的温度阈值,或实时检测的电压值不满足预先设置的电压阈值时,认为扩展模组发生异常。
进一步地,在通知CPU该扩展模组异常之前,该方法还包括:
将该扩展模组异常的通知依次经由BMC、操作系统(OS)、基本输入输出系统(BIOS)发送至CPU。
步骤102,CPU停止发生异常的扩展模组中全部PCIE卡的工作,并通知BMC关闭该发生异常的扩展模组的电源,移除该发生异常的扩展模组。
其中,通知BMC关闭发生异常的扩展模组的电源,包括:
CPU通知BIOS发生异常的扩展模组中的全部PCIE卡已停止工作;
BIOS将该通知经由OS发送给BMC;
BMC控制该发生异常的扩展模组关闭电源。
图2为本发明实现扩展模组移除的方法的实施例的流程图,如图2所示,包括以下步骤:
步骤201,实时检测各个扩展模组是否发生异常。
步骤202,当基板管理控制器(BMC)检测到某个扩展模组发生异常时,BMC将此通知发送给操作系统(OS),OS转发此通知至基本输入输出系统(BIOS)。
步骤203,BIOS通知中央处理器(CPU),CPU在获取发生异常的扩展模组的通知后,停止该发生异常的扩展模组中的所有PCIE卡的工作。
步骤204,CPU完成停止该发生异常的扩展模组中的所有PCIE卡的工作之后,通知BIOS可以移除该异常扩展模组。
步骤205,BIOS将CPU准备好移除异常的扩展模组的通知发送给OS,OS将此通知转发给BMC。
步骤206,BMC接收到来自OS的通知后,控制该发生异常的扩展模组关闭电源,此时可以将该发生异常的扩展模组拔下。
图3为本发明实现扩展模组移除的装置的结构示意图,如图3所示,包括:异常检测模块、通知模块、中央处理模块和管理控制模块。其中,
异常检测模,用于实时检测各个扩展模组是否发生异常。
进一步地,异常检测模块具体用于:
实时获取各个扩展模组的检测参数值;
比较实时获得的检测参数值是否满足所述检测参数异常条件,如果满足,则确定所述扩展模组发生异常。
其中,检测参数值包括温度值和/或电压值;
确定扩展模组发生异常为:实时获得的温度值不满足预先设置的温度阈值,或实时获得的电压值不满足预先设置的电压阈值。需要说明的是,这里的温度阈值是指正常的温度范围,当实时获得的温度值不在正常的温度范围内,即温度异常,继而认为扩展模组发生异常;电压阈值是正常的电压范围,当实时获得的电压值不在正常的电压范围内,即电压异常,继而认为扩展模组发生异常。正常的温度范围和正常的电压范围是根据机器的性能和测试最终得到的,并不是一个固定值。
可以采用W83795实时获取各个扩展模组的温度值或电压值。
通知模块,用于当检测到某个扩展模组发生异常时,通知中央处理模块。
中央处理模块,用于停止该发生异常的扩展模组中全部PCIE卡的工作,并通知管理控制模块关闭发生异常的扩展模组的电源。
管理控制模块,用于接收中央处理模块的通知,根据获得的通知关闭该发生异常的扩展模组的电源,移除该发生异常的扩展模组。
进一步地,通知管理控制模块关闭该发生异常的扩展模组的电源,包括:
中央处理模块通知管理控制模块该发生异常的扩展模组中的全部PCIE卡已停止工作;
管理控制模块控制该发生异常的扩展模组关闭电源。
进一步地,该装置还包括:设置模块,用于预先设置检测参数异常条件。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本申请不限制于任何特定形式的硬件和软件的结合。
以上所述,仅为本发明的较佳实例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种实现扩展模组移除的方法,其特征在于,包括:
实时检测各个扩展模组是否发生异常,当检测到某个扩展模组发生异常时,通知中央处理器CPU;
CPU停止发生异常的扩展模组中全部PCIE卡的工作,并通知基板管理控制器BMC关闭该发生异常的扩展模组的电源,移除该发生异常的扩展模组。
2.根据权利要求1所述的方法,其特征在于,所述实时检测各个扩展模组是否发生异常之前,该方法还包括:预先设置检测参数异常条件。
3.根据权利要求2所述的方法,其特征在于,所述实时检测各个扩展模组是否发生异常,包括:
实时获取各个扩展模组的检测参数值;
比较实时获得的检测参数值是否满足所述检测参数异常条件,如果满足,则确定所述扩展模组发生异常。
4.根据权利要求3所述的方法,其特征在于,所述检测参数值包括温度值和/或电压值;
所述确定所述扩展模组发生异常为:所述实时获得的温度值不满足预先设置的温度阈值,或实时获得的电压值不满足预先设置的电压阈值。
5.根据权利要求1所述的方法,其特征在于,在所述通知中央处理器CPU该扩展模组异常之前,该方法还包括:
将所述发生异常的扩展模组通知依次经由BMC、操作系统OS、基本输入输出系统BIOS发送至CPU。
6.根据权利要求1所述的方法,其特征在于,所述通知BMC关闭所述发生异常的扩展模组的电源,包括:
CPU通知BIOS发生异常的扩展模组中的全部PCIE卡已停止工作;
BIOS将该通知经由OS发送给BMC;
BMC控制发生异常的扩展模组关闭电源。
7.一种实现扩展模组移除的装置,其特征在于,包括:异常检测模块、通知模块、中央处理模块和管理控制模块;其中,
异常检测模,用于实时检测各个扩展模组是否发生异常;
通知模块,用于当检测到某个扩展模组发生异常时,通知中央处理模块该扩展模组异常;
中央处理模块,用于停止该发生异常的扩展模组中全部PCIE卡的工作,并通知管理控制模块关闭该发生异常的扩展模组的电源;
管理控制模块,用于接收中央处理模块的通知,根据获得的通知关闭该发生异常的扩展模组的电源,移除该发生异常的扩展模组。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:设置模块,用于预先设置检测参数异常条件。
9.根据权利要求8所述的装置,其特征在于,所述异常检测模具体用于:
实时获取各个扩展模组的检测参数值;
比较实时获得的检测参数值是否满足所述检测参数异常条件,如果满足,则确定所述扩展模组发生异常。
10.根据权利要求9所述的装置,其特征在于,所述检测参数值包括温度值和/或电压值;
所述确定所述扩展模组发生异常为:所述实时获得的温度值不满足预先设置的温度阈值,或实时获得的电压值不满足预先设置的电压阈值。
11.根据权利要求7所述的装置,其特征在于,所述通知管理控制模块关闭所述发生异常的扩展模组的电源,包括:
中央处理模块通知管理控制模块发生异常的扩展模组中的全部PCIE卡已停止工作;
管理控制模块控制发生异常的扩展模组关闭电源。
CN201410384121.0A 2014-08-06 2014-08-06 一种实现扩展模组移除的方法及装置 Pending CN104133759A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410384121.0A CN104133759A (zh) 2014-08-06 2014-08-06 一种实现扩展模组移除的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410384121.0A CN104133759A (zh) 2014-08-06 2014-08-06 一种实现扩展模组移除的方法及装置

Publications (1)

Publication Number Publication Date
CN104133759A true CN104133759A (zh) 2014-11-05

Family

ID=51806442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410384121.0A Pending CN104133759A (zh) 2014-08-06 2014-08-06 一种实现扩展模组移除的方法及装置

Country Status (1)

Country Link
CN (1) CN104133759A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105490260A (zh) * 2015-12-31 2016-04-13 山东海量信息技术研究院 一种基于power平台ovp保护线路
CN107270474A (zh) * 2017-06-05 2017-10-20 广东美的暖通设备有限公司 主板控制逻辑识别方法、装置及空调
CN107657866A (zh) * 2016-07-25 2018-02-02 北京东易晖煌国际教育科技有限公司 一种模块化可编程的智能教育机器人
CN113495763A (zh) * 2020-04-03 2021-10-12 神讯电脑(昆山)有限公司 开机方法及电子装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1367747A1 (en) * 2002-05-31 2003-12-03 Microsoft Corporation A system and method for identifying and segmenting repeating media objects embedded in a stream
CN101071392A (zh) * 2006-05-12 2007-11-14 国际商业机器公司 用于维护固件的备份副本的方法和系统
CN103678087A (zh) * 2012-09-26 2014-03-26 鸿富锦精密工业(深圳)有限公司 服务器风扇状态监控方法及系统
CN103797469A (zh) * 2013-05-20 2014-05-14 华为技术有限公司 一种计算机系统、高速外围组件互联端点设备的访问方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1367747A1 (en) * 2002-05-31 2003-12-03 Microsoft Corporation A system and method for identifying and segmenting repeating media objects embedded in a stream
CN101071392A (zh) * 2006-05-12 2007-11-14 国际商业机器公司 用于维护固件的备份副本的方法和系统
CN103678087A (zh) * 2012-09-26 2014-03-26 鸿富锦精密工业(深圳)有限公司 服务器风扇状态监控方法及系统
CN103797469A (zh) * 2013-05-20 2014-05-14 华为技术有限公司 一种计算机系统、高速外围组件互联端点设备的访问方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105490260A (zh) * 2015-12-31 2016-04-13 山东海量信息技术研究院 一种基于power平台ovp保护线路
CN107657866A (zh) * 2016-07-25 2018-02-02 北京东易晖煌国际教育科技有限公司 一种模块化可编程的智能教育机器人
CN107270474A (zh) * 2017-06-05 2017-10-20 广东美的暖通设备有限公司 主板控制逻辑识别方法、装置及空调
CN107270474B (zh) * 2017-06-05 2019-09-27 广东美的暖通设备有限公司 主板控制逻辑识别方法、装置及空调
CN113495763A (zh) * 2020-04-03 2021-10-12 神讯电脑(昆山)有限公司 开机方法及电子装置
CN113495763B (zh) * 2020-04-03 2024-03-19 神讯电脑(昆山)有限公司 开机方法及电子装置

Similar Documents

Publication Publication Date Title
CN107122321B (zh) 硬件修复方法、硬件修复系统以及计算机可读取存储装置
CN107783882B (zh) 一种服务器功耗管理方法及设备
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
CN104133759A (zh) 一种实现扩展模组移除的方法及装置
US8527788B2 (en) Network wake up system with protection function
CN102455950A (zh) 基板管理控制器的韧体恢复系统及方法
CN106610712B (zh) 基板管理控制器复位系统及方法
US20180300202A1 (en) System and Method for Information Handling System Boot Status and Error Data Capture and Analysis
CN104636221A (zh) 一种计算机系统故障处理方法和装置
CN102478800A (zh) 电力顺序信号的监控系统与其方法
CN103970640A (zh) 一种处理服务器的系统温度传感器故障的方法及系统
CN102801133B (zh) 一种自动恢复供电的方法及装置
CN104660440A (zh) 一种刀片服务器管理系统及其控制方法
CN105426289A (zh) 基板管理控制器及侦测风扇及风扇控制器的方法
CN103412836A (zh) 热插拔处理方法、装置以及系统
CN110704228B (zh) 一种固态硬盘异常处理方法及系统
CN104699215A (zh) 电源保护系统及方法
CN106528320B (zh) 计算机系统
CN114048108A (zh) 多源异构数据的自动化治理方法及装置
US10310575B2 (en) Virtual AC cycling within an information handling system
CN111190468B (zh) 一种ocp网卡散热装置及方法
CN108255666A (zh) 一种计算平台低温开关机判别方法
US8661271B2 (en) Apparatus and method to control the state of a power supply when a trigger signal is received during a predetermined time period
CN108279761B (zh) 一种支持风扇热插拔的服务器电源电路及控制方法
CN104345850B (zh) 智能型自动开机装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141105

WD01 Invention patent application deemed withdrawn after publication