CN104253828A - 伺服器系统及监控方法 - Google Patents
伺服器系统及监控方法 Download PDFInfo
- Publication number
- CN104253828A CN104253828A CN201310257359.2A CN201310257359A CN104253828A CN 104253828 A CN104253828 A CN 104253828A CN 201310257359 A CN201310257359 A CN 201310257359A CN 104253828 A CN104253828 A CN 104253828A
- Authority
- CN
- China
- Prior art keywords
- control unit
- processing unit
- temperature threshold
- model specification
- basic input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3024—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0721—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/81—Threshold
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
- Automation & Control Theory (AREA)
Abstract
一种伺服器系统及监控方法,伺服器系统包括一处理单元、一基本输入输出系统、及一控制单元。处理单元具有一型号规格。基本输入输出系统耦接处理单元,用以检测型号规格,并依据型号规格,以输出处理单元的一温度阈值。控制单元耦接处理单元与基本输入输出系统,用以接收温度阈值,控制单元监控处理单元的一实时温度并与温度阈值进行一对比,以产生一对比结果,且控制单元依据对比结果,以产生一警示信号。其中,当对比结果为实时温度超出温度阈值,控制单元产生警示信号。
Description
技术领域
本发明涉及一种伺服器系统及监控方法,特别涉及一种可提升伺服器内的中央处理器的温度的监控能力,并节省伺服器的生产成本的伺服器系统及监控方法。
背景技术
这些年来,随着电子科技的进步,各种不同应用场合的电子运算装置的需求也逐渐增加。其中,以信息科技业来说,由于网络的发展和公司内部中小型区域网搭建规模的扩增,网络伺服系统有了更专业化的要求,也因此提升了网络伺服系统的功能性和易用性。
由此可知,各企业中对于数据伺服器的需求也大幅增加。数据伺服器可以作为数据储存与读取的平台,使得数据得以保存或者是提供进行统计分析所需的信息。因此,稳定且有效率的伺服器是选用的重要关键。
为了避免伺服器发生故障,会通过例如基板管理控制器(BaseboardManagement Controller,BMC)的固件配置,以监控位于伺服器中的中央处理器(Central Processor Unit,以下简称CPU)的温度。当监控到CPU到达临界温度时,可发出温度警报并同时调整对应的风扇转速。
然而,当CPU因实际需求而被置换成另一类型规格时,必须同步更新基板管理控制器的固件版本,以使基板管理控制器能即时监控CPU的温度状态。但是,由于基板管理控制器的固件版本无法同步更新,因而使基板管理控制器发出错误的温度警报,或者甚至导致基板管理控制器不发出温度警报等误动作的情况发生。另外,因应不同类型规格的CPU,必须额外备妥相对应的基板管理控制器的固件版本,亦增加了伺服器的生产成本。
发明内容
本发明的目的在于提供一种伺服器系统及监控方法,藉以提升伺服器内的中央处理器的温度的监控能力,并节省伺服器的生产成本。
根据本发明的一实施例,一种监控方法,适于一伺服器系统,此监控方法包括以下步骤。在伺服器系统开机时,以一基本输入输出系统检测一处理单元的一型号规格。基本输入输出系统依据型号规格,以得出处理单元的一温度阈值。基本输入输出系统输出温度阈值给一控制单元。控制单元监控处理单元的一实时温度并与温度阈值进行一对比,以产生一对比结果。当对比结果为实时温度超出温度阈值,控制单元产生一警示信号。
根据本发明的一实施例,一种伺服器系统,包括一处理单元、一基本输入输出系统、及一控制单元。处理单元具有一型号规格。基本输入输出系统耦接处理单元,用以检测型号规格,并依据型号规格,以输出处理单元的一温度阈值。控制单元耦接处理单元与基本输入输出系统,用以接收温度阈值,控制单元监控处理单元的一实时温度并与温度阈值进行一对比,以产生一对比结果,且控制单元依据对比结果,以产生一警示信号。其中,当对比结果为实时温度超出温度阈值,控制单元产生警示信号。
本发明所提供的伺服器系统及监控方法,藉由基本输入输出系统检测处理单元的型号规格,而据以输出温度阈值给控制单元。接着,控制单元对处理单元的实时温度与温度阈值进行对比,以产生对比结果。并且,控制单元再依据对比结果,以产生警示信号。如此一来,可有效提升伺服器内的处理单元的温度的监控能力以及节省伺服器的生产成本。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1为本发明的伺服器系统的示意图;
图2为本发明的监控方法的步骤流程图。
其中,附图标记
10 伺服器系统
100 处理单元
110 型号规格
200 基本输入输出系统
300 控制单元
400 风扇
具体实施方式
以下在实施方式中详细叙述本发明的详细特征以及优点,其内容足以使任何熟习相关技艺者了解本发明的技术内容并据以实施,且根据本说明书所揭露的内容、权利要求范围及附图,任何熟习相关技艺者可轻易地理解本发明相关的目的及优点。以下的实施例进一步详细说明本发明的观点,但非以任何观点限制本发明的范畴。
请参照图1,其为本发明的伺服器系统的示意图。本实施例的伺服器系统10适于提升控制单元300对处理单元100的温度监控能力。伺服器系统10包括一处理单元100、一基本输入输出系统200、及一控制单元300。
处理单元100具有一型号规格110。在本实施例中,处理单元100例如可为一中央处理器。但本实施例不限于此,处理单元100亦可使用其他类似的元件来实施。基本输入输出系统200耦接处理单元100,用以检测型号规格110,并依据型号规格110,以输出处理单元100的一温度阈值。
控制单元300耦接于处理单元100与基本输入输出系统200之间。进一步来说,基本输入输出系统200通过一智能平台管理接口(Intelligent PlatformManagement Interface,IPMI)耦接控制单元300。此控制单元300用以接收温度阈值,且控制单元300监控处理单元100的一实时温度并与温度阈值进行一对比,以产生一对比结果。并且,控制单元300依据对比结果,以产生一警示信号。其中,当对比结果为实时温度超出温度阈值,控制单元产生警示信号。另外,控制单元300亦会依据前述实时温度,而产生一驱动信号。
在本实施例中,控制单元300例如可为一基板管理控制器。但本实施例不限于此,控制单元300亦可使用其他类似的元件来实施。其中,控制单元300包括一感应数据记录(Sensor Data Record,SDR),此感应数据记录具有前述的温度阈值,以作为控制单元300进行前述对比的依据。
另外,前述的监控系统10还包括一风扇400。风扇400耦接控制单元300,且风扇400用以接收控制单元300所产生的驱动信号,并依据驱动信号,以产生一转速。藉由风扇400的转动,可对处理单元100进行散热。其中,风扇400例如可依据控制单元300所产生的驱动信号,以对应调整风扇400的转速的大小值。
举例来说,处理单元100的型号规格110更存在一预设值。当型号规格110为此预设值时,基本输入输出系统200会依据预设值,例如直接查询出预设值所对应的温度阈值。并且,基本输入输出系统200会输出温度阈值给控制单元300。接着,控制单元300会对处理单元100的实时温度与温度阈值进行对比,以产生对比结果。若对比结果为处理单元100的实时温度未超出温度阈值,则控制单元300会不产生警示信号。
若对比结果为处理单元100的实时温度超出或等于预设临界温度,则控制单元300会依据此对比结果而产生警示信号。并且,控制单元300也会依据此实时温度而产生驱动信号给风扇400,以使风扇400作对应的转动,进而对处理单元100进行散热。
当型号规格110不为此预设值时,基本输入输出系统200例如会依据一命令及一演算法于处理单元100中得到温度阈值。并且,基本输入输出系统200会输出温度阈值给控制单元300。接着,控制单元300对处理单元100的实时温度与温度阈值进行对比,并产生对比结果。若对比结果为处理单元100的实时温度未超出温度阈值,则控制单元300不会产生警示信号。
若处理单元100的实时温度超出或等于临界温度,则控制单元300会依据此对比结果而产生警示信号。并且,控制单元300也会依据此实时温度而产生驱动信号给风扇400,以使风扇400作对应的转动,进而对处理单元100进行散热。据此,本实施例的伺服器系统10可通过基本输入输出系统200,以提升控制单元300对处理单元100的温度监控能力。
藉由上述实施例的说明,可以归纳出一种监控方法,且此监控方法适于一伺服器系统。请参照图2,其为本发明的监控方法的步骤流程图。在步骤S210中,在伺服器系统开机时,以一基本输入输出系统检测一处理单元的一型号规格。在步骤S220中,基本输入输出系统依据型号规格,以得出处理单元的一温度阈值。在步骤S230中,基本输入输出系统输出温度阈值给一控制单元。在步骤S240中,控制单元监控处理单元的一实时温度并与温度阈值进行一对比,以产生一对比结果。在步骤S250中,当对比结果为实时温度超出温度阈值,控制单元产生一警示信号。进一步来说,控制单元依据实时温度,产生一驱动信号,以控制一风扇的转速。
在本实施例中,处理单元例如为一中央处理器,且控制单元为一基板管理控制器。其中,型号规格更存在一预设值,当型号规格为预设值时,基本输入输出系统依据预设值直接查询出预设值对应的温度阈值并输出给控制单元。当型号规格不为预设值时,基本输入输出系统依据一命令及一演算法于处理单元中得到温度阈值并输出给控制单元。
综上所述,本发明的实施例所揭露的伺服器系统及监控方法,藉由基本输入输出系统检测处理单元的型号规格,而据以输出温度阈值给控制单元。接着,控制单元对处理单元的实时温度与温度阈值进行对比,以产生对比结果。并且,控制单元再依据对比结果,以产生警示信号。如此一来,可有效提升伺服器内的处理单元的温度的监控能力,并节省伺服器的生产成本。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (10)
1.一种监控方法,适于一伺服器系统,其特征在于,该监控方法包括:
在该伺服器系统开机时,以一基本输入输出系统检测一处理单元的一型号规格;
该基本输入输出系统依据该型号规格,以得出该处理单元的一温度阈值;
该基本输入输出系统输出该温度阈值给一控制单元;
该控制单元监控该处理单元的一实时温度并与该温度阈值进行一对比,以产生一对比结果;以及
当该对比结果为该实时温度超出该温度阈值,该控制单元产生一警示信号。
2.根据权利要求1所述的监控方法,其特征在于,该型号规格更存在一预设值,当该型号规格为该预设值时,该基本输入输出系统依据该预设值直接查询出该预设值对应的该温度阈值并输出给该控制单元,当该型号规格不为该预设值时,该基本输入输出系统依据一命令及一演算法于该处理单元中得到该温度阈值并输出给该控制单元。
3.根据权利要求1所述的监控方法,其特征在于,更包括:
该控制单元依据该实时温度,产生一驱动信号,以控制一风扇的转速。
4.根据权利要求1所述的监控方法,其特征在于,该处理单元为一中央处理器。
5.根据权利要求1所述的监控方法,其特征在于,该控制单元为一基板管理控制器。
6.一种伺服器系统,其特征在于,包括:
一处理单元,具有一型号规格;
一基本输入输出系统,耦接该处理单元,用以检测该型号规格,并依据该型号规格,以输出该处理单元的一温度阈值;以及
一控制单元,耦接该处理单元与该基本输入输出系统,用以接收该温度阈值,该控制单元监控该处理单元的一实时温度并与该温度阈值进行一对比,以产生一对比结果,且该控制单元依据该对比结果,以产生一警示信号;
其中,当该对比结果为该实时温度超出该温度阈值,该控制单元产生该警示信号。
7.根据权利要求6所述的伺服器系统,其特征在于,该型号规格更存在一预设值,当该型号规格为该预设值时,该基本输入输出系统依据该预设值直接查询出该预设值对应的该温度阈值并输出给该控制单元,当该型号规格不为该预设值时,该基本输入输出系统依据一命令及一演算法于该处理单元中得到该温度阈值并输出给该控制单元。
8.根据权利要求6所述的伺服器系统,其特征在于,更包括:
一风扇,耦接该控制单元,用以接收该控制单元所产生的一驱动信号,并依据该驱动信号,以产生一转速,其中该控制单元依据该实时温度,以产生该驱动信号。
9.根据权利要求6所述的伺服器系统,其特征在于,该处理单元为一中央处理器,该控制单元为一基板管理控制器。
10.根据权利要求6所述的伺服器系统,其特征在于,该控制单元包括一感应数据记录,该感应数据记录具有该温度阈值。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310257359.2A CN104253828A (zh) | 2013-06-25 | 2013-06-25 | 伺服器系统及监控方法 |
US14/035,910 US20140379162A1 (en) | 2013-06-25 | 2013-09-24 | Server system and monitoring method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310257359.2A CN104253828A (zh) | 2013-06-25 | 2013-06-25 | 伺服器系统及监控方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104253828A true CN104253828A (zh) | 2014-12-31 |
Family
ID=52111550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310257359.2A Pending CN104253828A (zh) | 2013-06-25 | 2013-06-25 | 伺服器系统及监控方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20140379162A1 (zh) |
CN (1) | CN104253828A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107562156A (zh) * | 2017-09-22 | 2018-01-09 | 郑州云海信息技术有限公司 | 一种服务器散热控制系统及方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9830226B2 (en) * | 2015-06-25 | 2017-11-28 | Dell Products, L.P. | Proactive fault avoidance |
TWI563371B (en) * | 2015-09-24 | 2016-12-21 | Hon Hai Prec Ind Co Ltd | A server control system and method |
CN109581882A (zh) * | 2018-11-20 | 2019-04-05 | 顺丰科技有限公司 | 动力测试系统的主控制器、控制方法、系统及存储介质 |
TWI801324B (zh) * | 2022-11-15 | 2023-05-01 | 國立虎尾科技大學 | 冷凍設備遠端故障診斷系統及其方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1153117C (zh) * | 2001-02-12 | 2004-06-09 | 英业达股份有限公司 | 即时控制笔记型电脑中央处理器温度的方法 |
CN101685329A (zh) * | 2008-09-27 | 2010-03-31 | 佛山市顺德区汉达精密电子科技有限公司 | 自动降温保护方法与使用该方法之电脑装置 |
CN102193606A (zh) * | 2010-03-10 | 2011-09-21 | 英业达股份有限公司 | 一种温度控制系统及其操作方法 |
CN102841579A (zh) * | 2011-06-24 | 2012-12-26 | 鸿富锦精密工业(深圳)有限公司 | 服务器散热控制系统及方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6145098A (en) * | 1997-05-13 | 2000-11-07 | Micron Electronics, Inc. | System for displaying system status |
TWI342518B (en) * | 2007-05-16 | 2011-05-21 | Inventec Corp | Adjusting method for set-up default value of bios and mainboard using the same method |
TWI505104B (zh) * | 2010-11-03 | 2015-10-21 | Inventec Corp | 具有客製化偵測器資料記錄的基板管理控制器之控制方法 |
US20120215359A1 (en) * | 2011-02-21 | 2012-08-23 | Amir Meir Michael | Adaptive fan control based on server configuration |
-
2013
- 2013-06-25 CN CN201310257359.2A patent/CN104253828A/zh active Pending
- 2013-09-24 US US14/035,910 patent/US20140379162A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1153117C (zh) * | 2001-02-12 | 2004-06-09 | 英业达股份有限公司 | 即时控制笔记型电脑中央处理器温度的方法 |
CN101685329A (zh) * | 2008-09-27 | 2010-03-31 | 佛山市顺德区汉达精密电子科技有限公司 | 自动降温保护方法与使用该方法之电脑装置 |
CN102193606A (zh) * | 2010-03-10 | 2011-09-21 | 英业达股份有限公司 | 一种温度控制系统及其操作方法 |
CN102841579A (zh) * | 2011-06-24 | 2012-12-26 | 鸿富锦精密工业(深圳)有限公司 | 服务器散热控制系统及方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107562156A (zh) * | 2017-09-22 | 2018-01-09 | 郑州云海信息技术有限公司 | 一种服务器散热控制系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
US20140379162A1 (en) | 2014-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104253828A (zh) | 伺服器系统及监控方法 | |
WO2020000745A1 (zh) | 日志管理方法、装置、计算机设备及存储介质 | |
CN109088775B (zh) | 异常监控方法、装置以及服务器 | |
US9881072B2 (en) | Dynamic feature set management | |
CN110068435B (zh) | 振动分析系统及方法 | |
CN106932012A (zh) | 工业服务器工作环境的监控系统及监控方法 | |
CN108885199B (zh) | 传感器信号处理设备 | |
CN108920103B (zh) | 服务器的管理方法、装置、计算机设备及存储介质 | |
CN114387762A (zh) | 一种楼宇数据管理的方法、装置、设备及存储介质 | |
US20130198362A1 (en) | System for Identifying a Server to be Decommissioned | |
US20140169936A1 (en) | Method for detecting heat-dissipating air flow and electronic device using the same | |
CN103678090A (zh) | 数据处理的监控方法和装置 | |
CN112532435A (zh) | 一种运维方法、运维管理平台、设备及介质 | |
CN111983412A (zh) | 监控系统、监控方法、监控终端及存储介质 | |
CN112730516B (zh) | 一种冷却塔湿球温度逼近度实时监测方法及装置 | |
CN116627770B (zh) | 网卡温度预测方法、装置、计算机设备及存储介质 | |
CN108897667A (zh) | 一种内存过热报警方法、装置及设备 | |
CN112859768A (zh) | 生产线的三维动态状态监测方法及系统 | |
CN106484441A (zh) | 控制器初始化方法及应用该方法的电子装置 | |
US20140115371A1 (en) | Decommission of a Server in Wireless Environment | |
TW201710895A (zh) | 伺服器機櫃監控方法 | |
CN109882437A (zh) | 一种风扇运行状态监控方法、系统、装置及可读存储介质 | |
CN114237947A (zh) | 机器人异常检测方法、装置、通信设备及存储介质 | |
CN114328080A (zh) | 一种固件状态检测的方法及装置、电子设备 | |
CN106897195A (zh) | 一种服务器机柜的监测方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20141231 |