CN111338891A - 一种风扇稳定性测试方法及装置 - Google Patents

一种风扇稳定性测试方法及装置 Download PDF

Info

Publication number
CN111338891A
CN111338891A CN202010095393.4A CN202010095393A CN111338891A CN 111338891 A CN111338891 A CN 111338891A CN 202010095393 A CN202010095393 A CN 202010095393A CN 111338891 A CN111338891 A CN 111338891A
Authority
CN
China
Prior art keywords
fan
monitoring
state
self
stability testing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010095393.4A
Other languages
English (en)
Inventor
邢艳如
张日洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010095393.4A priority Critical patent/CN111338891A/zh
Publication of CN111338891A publication Critical patent/CN111338891A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种风扇稳定性测试方法,包括:主板监控装置通过传感器实时监控风扇运行数据,并发送至监控管理软件;系统执行风扇自检,通过智能平台管理接口指令监控风扇状态,生成自检日志,根据自检日志判断风扇运行是否稳定,并将判断结果发送至监控管理软件;监控管理软件根据预设的风扇规格信息对比接收到的运行数据和判断结果,监控管理风扇运行状态,调控管理异常状态。本发明还公开了一种风扇稳定性测试装置,包括:主板监控单元、风扇自检单元和监控管理单元。本发明通过多种方式读取风扇运行状态,可以使判定结果更趋近于准确稳定,能够提高风扇性能测试的效率,并对故障风扇状态有效监控管理。

Description

一种风扇稳定性测试方法及装置
技术领域
本发明涉及服务器测试领域,具体涉及一种风扇稳定性测试方法及装置
背景技术
服务器及机柜长时间运行会产生大量热量,如果不能及时有效散热,可能导致机器过热烧毁,因此必须配套设置合理的散热手段,目前服务器及机柜一般采取搭配风扇进行散热。
目前针对风扇散热性能的测试和监控,由服务器搭配的基板管理控制器(Baseboard Management Controller,BMC)对服务器整机风扇进行散热调控,当服务器整机温度升高时,风扇转速会升高,降低服务器运行温度;当服务器风扇发生故障时,其余风扇会全速运行,以保证服务器正常使用。但是,服务器所配备的风扇种类繁多,质量不一,无法在运行时进行自我监控管理,导致监控效果不佳。而且,风扇发生故障时无法及时通知用户,也无法对风扇故障问题进行定位。
发明内容
为了解决上述技术问题,本发明提出了一种风扇稳定性测试方法及装置,能够提高风扇性能测试的效率,并对故障风扇状态有效监控管理。
为实现上述目的,本发明采用以下技术方案:
一种风扇稳定性测试方法,包括:
主板监控装置通过传感器实时监控风扇运行数据,并发送至监控管理软件;
系统执行风扇自检,通过智能平台管理接口指令监控风扇状态,生成自检日志,根据自检日志判断风扇运行是否稳定,并将判断结果发送至监控管理软件;
监控管理软件根据预设的风扇规格信息对比接收到的运行数据和判断结果,监控管理风扇运行状态,调控管理异常状态。
进一步地,主板监控装置通过传感器实时监控的风扇运行数据异常时,通过报警装置告警。
进一步地,所述风扇运行数据包括风扇在位状态、转速信息。
进一步地,通过智能平台管理接口指令监控风扇状态包括风扇在位状态、在位数量、当前转速、提速时间、风扇功耗和基板管理控制器事件日志。
进一步地,所述监控管理软件根据预设的风扇规格信息对比接收到的运行数据和判断结果,监控管理风扇运行状态,调控管理异常状态,包括:
当运行数据和判断结果与风扇规格信息的误差均在预设误差范围内且两者差值满足预设偏差范围时,判定风扇运行状态正常;否则,判定风扇运行状态异常。
进一步地,判定风扇运行状态异常后,监控管理软件通知用户进行告警,并向服务器发送保护指令。
本发明还提出了一种风扇稳定性测试装置,包括:
主板监控单元,用于通过传感器监控风扇运行数据,并发送至监控管理单元;
风扇自检单元,用于通过智能平台管理接口指令监控风扇状态,生成自检日志,根据自检日志判断风扇运行是否稳定,并将判断结果发送至监控管理单元;
监控管理单元,用于根据预设的风扇规格信息对比接收到的运行数据和判断结果,监控管理风扇运行状态,调控管理异常状态。
进一步地,所述主板监控单元包括风扇告警蜂鸣器和指示灯,用于在风扇异常时告警。
进一步地,所述主板监控单元监控风扇在位状态、转速信息。
进一步地,所述通过智能平台管理接口指令监控风扇状态包括风扇在位状态、在位数量、当前转速、提速时间、风扇功耗和基板管理控制器事件日志。
本发明的有益效果是:
本发明通过提出一种风扇稳定性测试方法及装置,能够提高风扇性能测试的效率,并对故障风扇状态有效监控管理。本发明通过多种方式读取风扇运行状态,消除了单一方式监测时读取参数与实际状态的偏差对于运行状态监控的影响,可以使判定结果更趋近于准确稳定;通过监控管理软件向测试人员远程告警,并向服务器发送相应保护指令,实现了远程批量实时监控管理,可以有效预防更大事故产生,降低风扇故障率,保证了服务器运行稳定。
附图说明
图1是本发明风扇稳定性测试方法流程图;
图2是本发明风扇稳定性测试装置结构示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
如图1所示,本发明实施例公开了一种风扇稳定性测试方法,包括:
主板监控装置通过传感器实时监控风扇运行数据,并发送至监控管理软件;
系统执行风扇自检,通过智能平台管理接口(Intelligent Platform ManagementInterface,IPMI)指令监控风扇状态,生成自检日志,根据自检日志判断风扇运行是否稳定,并将判断结果发送至监控管理软件;
监控管理软件根据预设的风扇规格信息对比接收到的运行数据和判断结果,监控管理风扇运行状态,调控管理异常状态。
具体地,所述主板监控装置集成温度传感、电压传感、功耗等参数检测于一体,可以实时记录服务器负载运行状态下的风扇运行情况,如风扇在位状态、转速信息等,并可以将记录保存在装置本地,同时通过网络实时发送至监控管理软件。主板监控装置还配置有报警装置,当风扇运行状态出现异常时,进行告警。所述报警装置可选为蜂鸣器和/或指示灯,告警时蜂鸣器发声告警,指示灯亮红灯,便于提醒现场测试人员风扇故障,方便快速解决风扇故障。
所述系统执行风扇自检通过风扇状态自检工具fan_selftest.sh执行,首先对自检工具加执行权限:chmod 777fan_selftest.sh,然后执行方法:./fan_selftest.sh。所述自检工具通过IPMI指令监控的风扇状态包括风扇在位状态、在位数量、当前转速、提速时间、风扇功耗和基板管理控制器事件日志。
所述自检工具预存风扇相关信息,如风扇转速范围、风扇功耗阈值区间、风扇在位数量、风扇占空比范围等。这些预存信息由BMC相关风扇代码IPMI命令转换而成,按照自检工具执行,可以自动收集相关风扇信息,并与自检工具里预存的风扇在位信息、数量、转速、功耗等阈值进行比对,检测是否符合范围要求,检测结果生成自检日志,自检日志显示当前风扇读数和状态以及判断的标准和读数范围。
所述监控管理软件可选为服务器集中监控与管理软件(Server UnifiedMonitor&Management,SUM),是集服务器、网络设备、应用程序服务器、用户软件于一体的集中式、跨平台的集中监控与管理软件,能够根据设置收集的阀值指标,针对各种故障问题信息即时通过终端界面、声音、短信、E-Mail等方式进行报警,还可以通过短信对服务器、服务器中的程序等进行重启以及可以执行服务器中授权的命令,方便维护人员日常维护管理。
所述监控管理软件根据预设的风扇规格信息对比接收到的运行数据和判断结果,监控管理风扇运行状态,调控管理异常状态,包括:
当运行数据和判断结果与风扇规格信息的误差均在预设误差范围内且两者差值满足预设偏差范围时,判定风扇运行状态正常;否则,判定风扇运行状态异常。
判定风扇运行状态异常后,监控管理软件通知用户进行告警,并向服务器发送保护指令。
具体地,所述预设的风扇规格信息记录了风扇出厂时符合风扇运行的规格信息,风扇规格信息预先导入监控管理软件,可从风扇厂商处或者对应风扇官网下载,一般包括但不限于:额定功耗、额定电压、额定电流、规格尺寸、重量、适合环境温度湿度范围、风扇转速、最大风量等等。
监控管理软件接收到主板监控装置发送的风扇运行数据和自检工具发送的判断结果时,与软件本地预存的风扇规格信息比对,当比对结果超过预设误差范围时,判定失败;两者比对结果均符合预设误差,但是两者差值超过预设偏差范围,也判定失败。判定失败后,生成失败日志,并把失败日志记录保存。判定失败时,监控管理软件根据失败日志,调控管理异常状态。
所述调控管理异常状态包括:
当单颗风扇失效时,其他所有风扇设定为80%占空比;有两颗或两颗以上风扇失效时,其它风扇全速。
当系统在开机状态下,BMC重启时,系统的默认风扇转速为80%占空比,该转速必须能满足系统在35℃环温下,满载(100%loading)时需要的最低转速。
当系统上电、BMC启动之前,系统的默认风扇转速为30%占空比。
中央处理器(Central Processing Unit,CPU)、内存(Memory)等温度传感器无法读取或者异常时,所有系统风扇设定为80%占空比。
如图2所示,本发明实施例还公开了一种风扇稳定性测试装置,包括:
主板监控单元,用于通过传感器监控风扇运行数据,并发送至监控管理单元;
风扇自检单元,用于通过智能平台管理接口指令监控风扇状态,生成自检日志,根据自检日志判断风扇运行是否稳定,并将判断结果发送至监控管理单元;
监控管理单元,用于根据预设的风扇规格信息对比接收到的运行数据和判断结果,监控管理风扇运行状态,调控管理异常状态。
所述主板监控单元包括风扇告警蜂鸣器和指示灯,用于在风扇异常时告警。
所述主板监控单元监控风扇在位状态、转速信息。
所述通过智能平台管理接口指令监控风扇状态包括风扇在位状态、在位数量、当前转速、提速时间、风扇功耗和基板管理控制器事件日志。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制。对于所属领域的技术人员来说,在上述说明的基础上还可以做出其它不同形式的修改或变形。这里无需也无法对所有的实施方式予以穷举。在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种风扇稳定性测试方法,其特征在于,包括:
主板监控装置通过传感器实时监控风扇运行数据,并发送至监控管理软件;
系统执行风扇自检,通过智能平台管理接口指令监控风扇状态,生成自检日志,根据自检日志判断风扇运行是否稳定,并将判断结果发送至监控管理软件;
监控管理软件根据预设的风扇规格信息对比接收到的运行数据和判断结果,监控管理风扇运行状态,调控管理异常状态。
2.根据权利要求1所述的风扇稳定性测试方法,其特征在于,主板监控装置通过传感器实时监控的风扇运行数据异常时,通过报警装置告警。
3.根据权利要求1所述的风扇稳定性测试方法,其特征在于,所述风扇运行数据包括风扇在位状态、转速信息。
4.根据权利要求1所述的风扇稳定性测试方法,其特征在于,通过智能平台管理接口指令监控风扇状态包括风扇在位状态、在位数量、当前转速、提速时间、风扇功耗和基板管理控制器事件日志。
5.根据权利要求1所述的风扇稳定性测试方法,其特征在于,所述监控管理软件根据预设的风扇规格信息对比接收到的运行数据和判断结果,监控管理风扇运行状态,调控管理异常状态,包括:
当运行数据和判断结果与风扇规格信息的误差均在预设误差范围内且两者差值满足预设偏差范围时,判定风扇运行状态正常;否则,判定风扇运行状态异常。
6.根据权利要求5所述的风扇稳定性测试方法,其特征在于,判定风扇运行状态异常后,监控管理软件通知用户进行告警,并向服务器发送保护指令。
7.一种风扇稳定性测试装置,其特征在于,包括:
主板监控单元,用于通过传感器监控风扇运行数据,并发送至监控管理单元;
风扇自检单元,用于通过智能平台管理接口指令监控风扇状态,生成自检日志,根据自检日志判断风扇运行是否稳定,并将判断结果发送至监控管理单元;
监控管理单元,用于根据预设的风扇规格信息对比接收到的运行数据和判断结果,监控管理风扇运行状态,调控管理异常状态。
8.根据权利要求7所述的风扇稳定性测试装置,其特征在于,所述主板监控单元包括风扇告警蜂鸣器和指示灯,用于在风扇异常时告警。
9.根据权利要求7所述的风扇稳定性测试装置,其特征在于,所述主板监控单元监控风扇在位状态、转速信息。
10.根据权利要求7所述的风扇稳定性测试装置,其特征在于,所述通过智能平台管理接口指令监控风扇状态包括风扇在位状态、在位数量、当前转速、提速时间、风扇功耗和基板管理控制器事件日志。
CN202010095393.4A 2020-02-16 2020-02-16 一种风扇稳定性测试方法及装置 Withdrawn CN111338891A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010095393.4A CN111338891A (zh) 2020-02-16 2020-02-16 一种风扇稳定性测试方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010095393.4A CN111338891A (zh) 2020-02-16 2020-02-16 一种风扇稳定性测试方法及装置

Publications (1)

Publication Number Publication Date
CN111338891A true CN111338891A (zh) 2020-06-26

Family

ID=71186330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010095393.4A Withdrawn CN111338891A (zh) 2020-02-16 2020-02-16 一种风扇稳定性测试方法及装置

Country Status (1)

Country Link
CN (1) CN111338891A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113757156A (zh) * 2021-09-16 2021-12-07 中国南方电网有限责任公司超高压输电公司昆明局 Ebm风扇测试方法、装置、计算机设备以及计算机存储介质
CN114184361A (zh) * 2021-11-12 2022-03-15 苏州浪潮智能科技有限公司 一种交换机风扇信息检测方法、装置以及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102158527A (zh) * 2011-01-18 2011-08-17 青岛海信电器股份有限公司 家用电器维护系统及具有自检功能的家用电器
CN107631892A (zh) * 2017-09-07 2018-01-26 郑州云海信息技术有限公司 一种风扇测试的方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102158527A (zh) * 2011-01-18 2011-08-17 青岛海信电器股份有限公司 家用电器维护系统及具有自检功能的家用电器
CN107631892A (zh) * 2017-09-07 2018-01-26 郑州云海信息技术有限公司 一种风扇测试的方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113757156A (zh) * 2021-09-16 2021-12-07 中国南方电网有限责任公司超高压输电公司昆明局 Ebm风扇测试方法、装置、计算机设备以及计算机存储介质
CN113757156B (zh) * 2021-09-16 2023-09-26 中国南方电网有限责任公司超高压输电公司昆明局 Ebm风扇测试方法、装置、计算机设备以及计算机存储介质
CN114184361A (zh) * 2021-11-12 2022-03-15 苏州浪潮智能科技有限公司 一种交换机风扇信息检测方法、装置以及介质
CN114184361B (zh) * 2021-11-12 2024-03-22 苏州浪潮智能科技有限公司 一种交换机风扇信息检测方法、装置以及介质

Similar Documents

Publication Publication Date Title
US7203560B1 (en) System and methodology facilitating remote and automated maintenance procedures in an industrial controller environment
JP3831377B2 (ja) コンピュータ・システムにおける電力障害を解析する方法および装置
CN111444031A (zh) 服务器故障预警方法、装置、计算机设备及存储介质
CN111338891A (zh) 一种风扇稳定性测试方法及装置
WO2023178923A1 (zh) 一种智能监控微调整方法、装置、设备及存储介质
CN112667470A (zh) 一种服务器功率评估及检测的系统、方法及介质
TW201516672A (zh) 伺服器監控系統及方法
CN114676019A (zh) 一种中央处理器状态监测方法、装置、设备、存储介质
CN116225812B (zh) 基板管理控制器系统运行方法、装置、设备及存储介质
CN111488050B (zh) 一种电源监控方法、系统及服务器
CN114281173A (zh) 一种服务器的可靠散热控制方法及装置
CN117251333A (zh) 一种硬盘信息获取方法、装置、设备及存储介质
CN113550928B (zh) 一种风扇控制方法及电子设备
CN115237719A (zh) 一种服务器电源可靠性的预警方法及系统
CN115080132A (zh) 信息处理方法、装置、服务器及存储介质
TWI494754B (zh) 伺服器監控裝置和其操作方法
CN110750427A (zh) 一种数据中心设备巡检方法及系统
CN113469453B (zh) 基于信息物理系统的电梯评估方法以及电梯评估装置
CN110990226A (zh) 数据中心设备巡检方法及服务器、计算机可读存储介质
CN115277353B (zh) 一种智能柜机远程故障主被动预警方法
CN110943863A (zh) 一种数据中心
CN111352789B (zh) 一种用于服务器的交流循环测试方法、装置及存储介质
CN117573455B (zh) 一种pcie设备检测系统、方法、装置及产品
CN117271267A (zh) 一种服务器硬件的远程监测系统及其监测方法
CN111623554B (zh) 一种热泵机组的异常掉电检测方法及其装置、和热泵机组

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200626

WW01 Invention patent application withdrawn after publication