CN109388213B - 服务器系统、计算机实施方法及非暂态计算机可读介质 - Google Patents

服务器系统、计算机实施方法及非暂态计算机可读介质 Download PDF

Info

Publication number
CN109388213B
CN109388213B CN201810319726.XA CN201810319726A CN109388213B CN 109388213 B CN109388213 B CN 109388213B CN 201810319726 A CN201810319726 A CN 201810319726A CN 109388213 B CN109388213 B CN 109388213B
Authority
CN
China
Prior art keywords
controller
server system
node
control switch
cooling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810319726.XA
Other languages
English (en)
Other versions
CN109388213A (zh
Inventor
王舜宏
柯廷铮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quanta Computer Inc
Original Assignee
Quanta Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Computer Inc filed Critical Quanta Computer Inc
Publication of CN109388213A publication Critical patent/CN109388213A/zh
Application granted granted Critical
Publication of CN109388213B publication Critical patent/CN109388213B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20836Thermal management, e.g. server temperature control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D23/00Control of temperature
    • G05D23/19Control of temperature characterised by the use of electric means
    • G05D23/1927Control of temperature characterised by the use of electric means using a plurality of sensors
    • G05D23/193Control of temperature characterised by the use of electric means using a plurality of sensors sensing the temperaure in different places in thermal relationship with one or more spaces
    • G05D23/1932Control of temperature characterised by the use of electric means using a plurality of sensors sensing the temperaure in different places in thermal relationship with one or more spaces to control the temperature of a plurality of spaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/18Packaging or power distribution
    • G06F1/183Internal mounting support structures, e.g. for printed circuit boards, internal connecting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提供一种服务器系统、计算机实施方法及非暂态计算机可读介质。本公开的多种实施例提供一多节点风扇控制开关,以及使用一节点的一风扇控制开关及一特定控制器(如基板管理控制器或一特定处理器)控制该节点的一或多个冷却风扇的系统与方法。该节点也包括一监视电路。该监视电路可监视该特定控制器的健康状态,并且在判断该特定控制器失效的事件时,开启该风扇控制开关至一外部模式以允许机架内一邻近节点的一控制器控制该节点的该一或多个冷却风扇。

Description

服务器系统、计算机实施方法及非暂态计算机可读介质
技术领域
本公开涉及一电信网络中的一服务器系统。
背景技术
现代服务器系统农场(server farms)或数据中心通常设置大量的服务器系统以处理各种不同服务应用的处理需求。每一处理器处理不同的作业,并需要一定量的能源消耗以维持该等作业。该等作业中的某些作业为重要任务 (mission critical)作业,重要任务作业的中断会造成严重的安全漏洞或是这些作业相关的用户的利益损失。一服务器系统中过量的热能可造成该服务器系统中作业的中断。
冷却风扇已在服务器系统中被广泛使用以移除系统中过量的热能。在传统服务器系统中,一机箱管理控制器(chase manager controller)通常被使用于一服务器系统机架系统以读取机架系统内中央处理器以及硬盘的温度以及控制该机架系统中冷却风扇的风速。
但是,改善服务器系统中风扇控制方法的效率与可靠度仍是一个挑战。
发明内容
依据本发明不同实施例的系统与方法提供一用于一机架系统中多个节点的每一个的多节点风扇控制开关;以及,藉由使用一节点的一控制器管理该节点的一或多个冷却风扇以及使用该该机架系统中一邻近节点的一不同控制器作为一备用控制器以解决上述问题的方法。尤其是,本发明的多种范例提供使用一风扇控制开关以及一特定控制器(如基板管理控制器或一特定处理器)控置一或多个冷却风扇的系统与方法。该节点也包括一监视电路(watch dog circuit)。该监视电路可监视该特定控制器的健康状态,并且在判断该特定控制器失效的事件中,开启该风扇控制开关至一外部模式以允许该机架内一邻近节点的一控制器控制该节点的该一或多个冷却风扇。
在一些实施例中,该监视电路更可接收该节点的温度讯息(如中央处理器、特定控制器或硬盘的温度),并依据至少该节点的温度讯息,控制该一或多个冷却零件。在某些实施例中,该特定控制器送出的命令为可控制该一或多个冷却风扇的脉冲宽度调制(pulsewidth modulation)信号。
在某些实施例中,该监视电路可接收来自该特定控制器的心跳信号,当在一预定期间内没有接收到该心跳信号,该监视电路判断该特定控制器已失效。
在某些实施例中,该监视电路可主动测试该特定控制器的健康状态。在该特定控制器的任一操作参数超过一预设标准的事件中,该监视电路判断该特定控制器失效,并将该风扇控制开关开启至一外部模式。
在一些范例中,该监视电路接收该节点的一交流电电源与一电源供应单元的状态讯息,该监视电路仅在该交流电电源与该电源供单元状态良好的情况下将该节点的该风扇控制开关开启至一外部模式。
在某些实施例中,一节点的特定控制器连接至一邻近节点的一或多个冷却风扇,且可接收该一或多个冷却风扇的状态讯息(如每一风扇的风扇旋转状态)。在判断邻近节点的风扇控制开关已被切换至一外部模式的事件中,该特定控制器可依据至少该邻近节点的该一或多个冷却风扇的状态讯息,送出命令以控制该邻近节点的该一或多个冷却风扇的风扇速度。
在一些实施例中,该特定控制器可送出命令至该邻近节点的该一或多个冷却风扇以使该该一或多个冷却风扇以预设速度运行。在其他实施例中,该特定控制器更可接收该邻近节点的温度讯息(如中央处理器、硬盘或特定控制器的温度),并依据至少该邻近节点的温度讯息,控制该邻近节点的该一或多个冷却风扇的风扇速度。
在某些实施例,该邻近节点可为一具有一或多个冷却风的扇空置托盘 (dummytray)。如检测到该空置托盘内并无服务器系统,该邻近节点的一风扇控制开关可被自动设置为一外部模式。该特定控制器可以接收该空置托盘内该一或多个冷却风的状态讯息(如每一风扇的旋转状态),并依据至少接收的该状态讯息,送出控制该一或多个冷却风扇的命令。
在某些应用中,该机架系统包括3个或更多节点。该等节点的每一特定控制器同时连接至该机架系统中一邻近节点的一或多个冷却风扇。如果判断该邻近节点的风扇控制开关被切换至一外部模式,一节点的特定控制器可送出命令至该邻近节点的该一或多个冷却风扇以控制风扇速度。
附图说明
为了描述上述方法的与其他本公开可达成的优点和特性,上述原理的特定叙述以特定实施例的方式被描述并以下列图示呈现。应当理解的是这些图示仅为举例用而并非用于限制本公开的范围。随着下列图示的使用,本发明的原则被详细描述并解释,其中:
图1A、1B为依据本公开实施例的一机架系统中两范例服务器系统的系统方块示意图,每一服务器系统统具有一监视电路以及一风扇控制开关。
图1C-1与图1C-2的组合为一依据本公开实施例的一机架系统中三范例服务器系统的系统方块示意图,每一服务器系统统具有一监视电路以及一风扇控制开关。
图1D为一依据本公开实施例的一机架系统中一范例服务器系统位与一空置托盘的系统方块示意图,该服务器系统统具有一监视电路以及一风扇控制开关。
图1E为一依据本公开实施例的具有一监视电路以及一风扇控制开关的范例系统的系统方块示意图。
图2A、2B为一依据本公开实施例的管理一机架系统中一或多个冷却装置的方法示意图。
图3为一依据现行技术的应用的范例计算机装置。
图4、5为依据现行技术的各种范例实施的范例系统。
【符号说明】
100A~100D 机架系统
101-1~101-3 服务器系统
102 冷却零件
102-1~102-3 冷却风扇
103 监视电路
103-1~103-3 监视电路
104 风扇控制开关
104-1~104-3 风扇控制开关
105 背板
106 基板管理控制器
106-1~106-3 基板管理控制器
107 交流电电源
108 电源供应单元
109 电源供应单元输出
110 电池系统
111 主要直流电总线
112 PCI总线
113 存储器
114 处里器
115 北桥逻辑
116 南桥逻辑
117 存储装置
150~151 ISA插槽
160~161 PCIe插槽
170~171 PCI插槽
200A 方法
202~216 步骤
200B 方法
220~232 步骤
361 存储器
362 中央处理器
363 处理器
368 接口
402 总线
404 存储器
406 只读存储器
408 随机存取存储器
410 控制器
412 存储装置
414 模块1
416 模块2
418 模块3
420 输入装置
422 输出装置
424 通信接口
426 传感器
428 快取存储器
430 处理器
432 快闪存储器
434 固件
436 显示器
500 计算机系统
502 芯片组
504 总线
506 用户接口零件
508 通信接口
510 处理器
512 固件
514 输出装置
516 存储装置
518 随机存取存储器
PWM-1~PWM-3 脉冲宽度调制信号
Tach-1~Tach-4 状态讯息
具体实施方式
本公开可被不同的形式实现。以图示的方式呈现并详加描述的代表性实施,应当理解为本公开的原则的举例,而非为用以限制本公开的范围于列举的实施例。在摘要、结论与详细实施方式中出现但并未在权利要求书中提及的限制与元件,不应单一地或集合地藉由涉及、推论或其他的方式纳入权利要求书中。在本说明书中除非特别指明排除,单数名词即包括复数名词且反之皆可。“包括”意指“包括但不限于”。此外,近似的用词如“大约”、“几乎”、“大体上”、“近似”以及类似用词在此可用例如“于、接近,接近于”或“在 3~5%内”,或是“位于可接受的制造容忍度”或类似的逻辑组合。
本公开的各种实施例提供一使用一节点的一多节点风扇控制开关与一特定控制器(如一基板管理控制器(Baseboard Management Controller)或一特定控制器)控制一节点的一或多个风扇的系统与方法。该节点同时包括一监视电路。该监视电路可监视该特定控制器的健康状态,并在判断该特定控制器失效时,将该风扇控制开关开启至一外部模式并允许一邻近节点的一控制器控制该节点的一或多个冷却风扇。
图1A为一依据本公开实施例的一机架系统100A中两范例服务器系统的系统示意图。在机架系统100A中,每一服务器系统具有一监视电路以及一风扇控制开关。在此范例中,机架系统100A包括一背板105以及两服务器系统101-1与101-2。每一服务器系统包括一或多个冷却风扇(如102-1和 102-2)、一监视电路(如103-1和103-2)、一风扇控制开关(如104-1和104-2) 和一基板管理控制器(如106-1和106-2)。服务器系统101-1的基板管理控制器106-1通过风扇控制开关104-1连接至该一或多个冷却风扇102-1,并且也通过背板105与风扇控制开关104-2连接至邻近的服务器系统101-2的一或多个冷却风扇102-2。类似的,服务器系统101-2的基板管理控制器106-2通过风扇控制开关104-2连接至该一或多个冷却风扇102-2,并且也通过背板105 与风扇控制开关104-1连接至邻近的服务器系统101-1的一或多个冷却风扇 102-1。
在此范例中,一特定服务器系统的基板管理控制器(如106-1或106-2)可接受该服务器系统内一或多个冷却风扇的状态讯息Tach-3、Tach-4(如每一冷却风扇的风扇旋转状态)。基板管理控制器(如106-1或106-2)也可接收该特定服务器系统的温度讯息(如中央处理器或基板管理控制器的温度)。在该特定服务器系统的该风扇控制开关被开启至一内部模式的事件中,基板管理控制器可依据至少所接收的温度讯息控制该服务器系统内一或多个冷却风扇的风扇速度。在某些应用中,基板管理控制器藉由送出脉冲宽度调制(pulse-width modulation)信号(PWM1、PWM2)至该一或多个冷却风扇以控制风扇速度。
每一监视电路(如103-1和103-2)可监视同一服务器系统内一相对应基板管理控制器(如106-1和106-2)的健康状态,当判断该相对应基板管理控制器已失效时,开启相同服务器系统内一相对应风扇控制开关至一外部模式,并允许一邻近服务器系统的基板管理控制器控制该服务器系统内一或多个冷却风扇。例如,一特定服务器系统的一监视电路可自该特定服务器系统内基板管理控制器接受心跳信号。当在一预定期间内未接收到心跳信号时,该监视电路可判断该基板管理控制器已失效,接着开启该特定服务器系统的一相对应风扇控制开关至一外部模式并允许一邻近服务器系统的一不同的基板管理控制器控制该特定服务器系统的该一或多个冷却风扇。此一方案被举例于图 1B,其中风扇控制开关104-1被开启至一外部模式并允许邻近节点101-2的基板管理控制器106-2控制节点101-1的该一或多个冷却风扇。
又例如,该监视电路可主动监视一特定服务器系统的一相对应基板管理控制器的健康状态。在该基板管理控制器动作异常的事件中,该监视电路可判断该基板管理控制器已失效,接着开启该特定服务器系统的风扇控制开关至一外部模式并允许一邻近服务器系统的一不同的基板管理控制器控制该特定服务器系统的一或多个冷却风扇。
在某些应用中,每一监视电路(如103-1和103-2)也连接至一相对应服务器系统或该机架系统100A的一电源供应单元(power supply unit),并可自该电源供应单元接受该相对应服务器系统的交流电电源以及该电源供应单元的状态讯息。该监视电路仅在该相对应服务器系统的该交流电电源以及该电源供应单元状态良好的情况下开启一相对应风扇控制开关至一外部模式。表一为依据本发明的实施例的监视电路(如103-1和103-2)的一范例逻辑真值表。在一相对应节点的交流电电源以及电源供应单元状态良好(即“1”)以及一用于相对应控制器的心跳信号被接收到(即“1”)的事件中,该监视电路开启一相对应风扇控制开关至内部模式(即“1”)并关闭外部模式(即“0”)。在该相对应节点交流电电源以及电源供应单元状态良好(即“1”)但相对应控制器的心跳信号在一既定期间内没被接收到(即“0”)的事件中,该监视电路开启该相对应风扇控制开关至外部模式(即“1”)并关闭内部模式(“0”)。在所有该相对应节点交流电电源或及电源供应单元失效(即“0”)的事件中,该监视电路开启该相对应风扇控制开关至内部模式(即“1”)并关闭外部模式(“0”)。
表1
Figure BDA0001624932280000071
Figure BDA0001624932280000081
在某些范例中,一特定服务器系统的一基板管理控制器可接收一邻近服务器系统的一或多个冷却风扇的状态讯息(如每一冷却风扇的风扇旋转状态)。如果该邻近服务器系统的一风扇控制开关被开启至一外部模式,该基板管理控制器可进而接收该邻近服务器系统的温度讯息(如中央处理器、硬盘、基板管理控制器的温度)。该基板管理控制器可依据至少所接收的该邻近服务器系统的温度讯息控制该邻近服务器系统内一或多个冷却风扇的风扇速度。在某些范例中,该基板管理控制器依据预设或预定的参数控制该邻近服务器系统的一或多个冷却风扇的风扇速度。
图1C-1和图1C-2的组合为依据本发明实施例的一机架系统100C中三个范例服务器系统的系统方块示意图,其中每一服务器系统具有一监视电路与一风扇控制开关。在本范例中,该系统100C包括一背板105和三个服务器系统101-1、101-2和101-3。每一服务器系统包括一或多个冷却风扇(如102-1、102-2和102-3)、一个监视电路(如103-1、103-2和103-3)、一风扇控制开关(如 104-1、104-2和104-3)以及一基板管理控制器(如106-1、106-2和106-3)。每一服务器系统(如101-1、101-2和101-3)中的基板管理控制器藉由一风扇控制开关联接至一相对应服务器系统中的一或多个冷却风扇,并同时藉由该背板 105与邻近服务器系统的一风扇控制开关联接至该邻近服务器系统的一或多个冷却风扇。
在此范例中,该机架系统100C中一特定服务器系统的基板管理控制器 (如106-1、106-2或106-3)可接收该特定服务器系统的一或多个风扇的状态讯息(如每一风扇的风扇旋转状态),以及一邻近服务器系统的一或多个风扇的状态讯息。该一特定服务器系统的基板管理控制器也可接收该特定服务器系统的温度讯息(如中央处理器、硬盘或基板管理控制器的温度)。在该特定服务器系统的该风扇控制开关为开启至一内部模式的事件,该基板管理控制器可依据至少所接收的温度讯息控制该特定服务器系统内一或多个冷却风扇的风扇速度。
在一邻近服务器系统的一风扇控制开关被开启至一外部模式的事件,该基板管理控制器可进而接收该邻近服务器系统的温度讯息(如中央处理器、硬盘或基板管理控制器的温度)。该基板管理控制器可依据至少所接收该邻近服务器系统的温度讯息控制该邻近服务器系统内一或多个冷却风扇的风扇速度。在某些范例中,该基板管理控制器可依据预设或预定的参数控制该邻近服务器系统的一或多个冷却风扇的风扇速度。
图1D为一依据本公开实施例的一机架系统100D中一范例服务器系统与一范例空置托盘的系统方块示意图,其中该范例服务器系统具有一监视电路与一风扇控制开关。在此范例中,该系统100D包括一背板105、一服务器系统101-1与一虚拟托盘101-2。该服务器系统101-1包括一或多个冷却风扇 102-1、一监视电路103-1、一风扇控制开关104-1和一基板管理控制器106-1。该基板管理控制器106-1通过该风扇控制开关104-1连接至该一或多个冷却风扇102-1,并通过背板105和该虚拟托盘101-2的一风扇控制开关104-2连接至该空置托盘101-2的一或多个冷却风扇102-2。
在此范例中,该基板管理控制器106-1可接收一或多个冷却风扇102-1 的状态讯息(如每一风扇的风扇旋转状态),以及该空置托盘101-2的一或多个冷却风扇的状态讯息。该基板管理控制器106-1也可接收该特定服务器系统 101-1系统的温度讯息(如中央处理器或基板管理控制器的温度)。在该风扇控制开关104-1被开启至一内部模式的事件,该基板管理控制器106-1可依据至少所接收的温度讯息控制该一或多个冷却风扇102-1的风扇速度。
在某些范例中,当探测到该虚拟托盘101-2内并无服务器系统,该空置托盘101-2的该风扇控制开关104-2可被自动开启一外部模式。该基板管理控制器106-1可进而接收该空置托盘101-2的温度讯息。该基板管理控制器106-1 可依据至少接收到的该空置托盘101-2的温度讯息控制该空置托盘101-2的该一或多个冷却风扇102-2。在某些范例中,该基板管理控制器可依据预设或预定的参数控制该空置托盘101-2的该一或多个冷却风扇102-2。
总体而言,本公开与传统解决方案相比较为进步。在一传统电池备援单元(BackupBattery Unit)系统中,一机箱管理控制器通常用于控制一机架系统内的风扇。该机箱管理控制器接收来自该机箱内每一节点的温度讯息后并控制该等风扇的风扇速度。本公开提供一更有效率的机架系统内风扇控制方法。在实现本公开的机架系统中,该机箱管理控制器已被省去,花费以及基板空间可被节省。此外,本发明允许该机架系统内一独立节点的风扇控制,并藉由允许该机架系统内每一节点的多余风扇控以改善风扇控制方法的可靠度。
图1E为依据本发明实施例的一具有一监视电路与一风扇控制开关的范例系统100E的系统概要方块图。在此范例中,服务器系统100E包括至少一微处理器或处理器114、一或多个冷却零件102、一主要存储器113、一电池系统110以及至少一电源供应单元108,该至少一电源供应单元108自一交流电电源107接收交流电并供应电源至该服务器系统100E内各零件,如处理器114、电池系统110、北桥逻辑115、PCIe插槽160、南桥逻辑116、存储装置117、基本输入输出系统(basic input output system)118、ISA插槽150、PCI 插槽170、一监视电路103、一冷却控制开关104以及一控制器106。在开启电源后,该服务器系统100E被设定为从存储器、计算机存储装置或是一外接存储装置载入一应用软件以执行各种作业。该存储装置117被架构成可为一操作系统与应用所使用的逻辑区块,并被设置成在该服务器系统100E电源关闭后仍能保存服务器系统数据。
该电池系统110被设置以在该交流电电源107或是该至少一电源供应单元108失效时供应电源给该服务器系统100E。该存储器113可藉由北桥逻辑 115耦接至该处理器114。该存储器113可包括但不限于:动态随机存取存储器(dynamic random access memory)、双倍数据速度动态随机存取存储器 (double data rate dynamic random access memory)、静态随机存取存储器(static random access memory)或其他适合种类的存储器。该存储器113可被设置以存储该服务器系统100E的基本输入输出系统的数据。在某些设置中,基本输入输出系统的数据可存储于该存储装置117。
该基本输入输出系统118可为任何被设置用以初始化及辨识该服务器系统100E内不同零件的程序指令或固件。该基本输入输出系统118为一负责初始化及测试该服务器系统100E的硬件零件的重要系统零件。该基本输入输出系统118可提供该等硬件零件的一抽象层,因此提供应用和操作系统与一外部装置(如一键盘、显示器及其他输入/输出系统)一个一致的互动方法。
在一些设置中,该基本输入输出系统118可在一相对应服务器系统开启一操作系统(如微软视窗操作系统、Linux操作系统或其他任何操作系统)前执行一系统检查,该系统检查为在该相对应服务器系统初始化时执行的一系统诊断测试。一系统检查的范例包括:开机自我检测(Power-On Self-Test)。该基本输入输出系统可处理开机自我检测的主要功能、并可将一些工作交与其他设计为初始化特定外部装置的程序(如图像与小型计算机接口(video and small computer system interface)的初始化)。该开机自我检测的主要功能可包括:验证中央处理器的寄存器与该基本输入输出系统程序代码的完整性、检查基本零件、测试系统主要存储器、以及将控制权传与其他专门的基本输入输出系统延伸。在某些设置中,该基本输入输出系统也可处理额外的开机自我检测功能包括:探索、初始化以及编制所有的系统总线与装置的目录,提供一更新系统设置的用户接口,以及建立该操作系统要求的系统环境。
在服务器系统100E中,该存储装置117可以是任何设置成为在一段时间内存储程序指令或数据的存储介质。该存储装置117可为该控制器106与该处理器114的一共享存储器。在某些设置中,该存储装置117可为一独立存储装置。该存储装置可为一快闪存储碟、一随机存取存储器(random access memory,以下简称RAM)、一非易失性随机存取存储器(non-volatile random access memory)、一只读存储器或是一电子抹除式可复写只读存储器 (electrically erasable programmable read-only memory)。该存储装置117设置以存储系统设定,如基本输入输出系统数据。
该处理器114可为一设置成执行特定功能的程序指令的中央处理器。例如,在一开机过程中该处里器114可存取存储于该存储装置117内的基本输入输出系统数据,并执行该基本输入输出系统118以初始化该服务器系统 110E。在开机过程完成之后,该处理器114可执行一操作系统以执行与管理该服务器系统100E的特定工作。
在某些设置中,该处理器114可为多个多内核处理器,其每一个通过一连接至该北桥逻辑105的中央处理器总线互相耦接。在某些设置中,该北桥逻辑115可整合至该处理器114中。该北桥逻辑115也可连接至多个PCIe插槽160和一南桥逻辑116(可选择性的)。该等PCIe插槽116可用于如下用途的连接与总线:PCI Express x1、
Figure BDA0001624932280000111
2.0、SMBus、SIM卡、另一未来扩展用的PCIe线、1.5伏特和3.3伏特电源供应以及该服务器系统100E机箱的诊断LED的接线。
在服务器系统100E中,该北桥逻辑115和该南桥逻辑116藉由一PCI 总线112所连接。该PCI总线112可在一独立于任何该处理器114的原生总线的标准化格式上支持该处理器114上的功能。该PCI总线112可进而连接至多个PCI插槽170(如一PCI插槽171)。对于一总线控制器(未绘出)而言,连接至该PCI总线112的装置可显示为直接连接至一中央处理器总线、在该处理器114的地址空间中被指定一地址,并同步至一单一总线时钟。可使用于该等PCI插槽170的PCI卡包括但不限于:网络接口卡、音效卡、数据机、电视解调卡、磁盘控制器、视频卡、小型计算机系统接口(small computer system interface)转接器以及个人计算机存储卡国际协会(personal computer memory card international association)卡。
该南桥逻辑116可通过一扩展总线耦接该PCI总线112至多个扩展卡或是工业标准架构(industry standard archecture,以下简称ISA)插槽150(如一ISA 插槽151)。该扩展总线可为一用于该南桥逻辑116与外部装置间通信用途的总线,可包括但不限于:一ISA总线、PC/104总线、低脚数总线、延伸 ISA(extended ISA)总线、通用串行总线(universalserial bus、以下简称USB)、 IDE总线、或是其他任何适合用于外部装置数据通信的总线。
在服务器系统100E中,该南桥逻辑116更进而耦接至该控制器106,该控制器106至少连接至一电源供应单元108。在某些应用中,该控制器106 可为一基板管理控制器、机架管理控制器或是其他种类独立于一中央处理器 (如该处理器114)并可用于执行本公开功能的服务控制器。
在此范例中,该监视电路103可监视该控制器106的健康状态,当判断该该控制器106已失效时,起始该冷却风扇控制开关104至一外部模式,并允许同一机架系统内一邻近服务器系统的一控制器控制该冷却零件102。例如,该监视电路103可接收来自该控制器106的心跳信号。当判断已超过一预定期间未接收到该等心跳信号,该监视电路103可判断该控制器106已失效,接着开启该风扇控制开关104至一外部模式已允许一邻近服务器系统的一控制器控制该冷却零件102。
在某些应用,该监视电路103可主动监视该控制器106的健康状态。在该控制器106运作不正常的事件中,该监视电路103可判断该控制器106已失效并进而开启该特定服务器系统的风扇控制开关至一外部模式。
在某些设置中,该控制器106与该监视电路103被耦接至至少一电源供应单元108,并可从该至少一电源供应单元108接收该交流电电源107与电源供应单元108的状态讯息。例如,该控制器106与该监视电路103可从该至少一电源供应单元108接收电压、电流与温度数据。该监视电路103仅在该交流电电源107与该电源供应单元108状态良好的情况下开启该冷却控制开关104至一外部模式。
基于接收到的数据,该控制器106可管理该至少一电源供应单元108的作业。例如该控制器106可开启或关闭该至少一电源供应单元108,或是开启该至少一电源供应单元108中的一部分,并关闭其余的电源供应单元。在某些范例中,该控制器106可通过SMBus、I2C或PMBus与该至少一电源供应单元108通信。
该控制器106可接收该冷却零件102的状态讯息(如每一冷却零件的状态) 与该服务器系统100E的温度讯息(如处理器114、存储装置117、存储器113 和控制器106的温度)。在一该冷却控制开关104被开启至一内部模式的事件中,该控制器106可依据至少接收到的温度讯息控制该冷却零件102。
在某些范例中,该控制器106更可接收一邻近服务器系统(未绘出)的一冷却零件的状态讯息(如每一冷却零件的状态)与该邻近服务器系统的温度讯息 (如处理器、存储装置、存储器和控制器的温度)。在该邻近服务器系统的一冷却控制开关为开启至一外部模式的事件中,该控制器106可依据至少接收到的该冷却零件的状态讯息和/或该邻近服务器系统的温度讯息控制该邻近服务器系统的冷却零件。在一些其他范例中,该控制器106可依据预设或预定的参数控制该邻近服务器系统的该冷却零件。
在一些设置中,该控制器106可通过使用智能平台管理总线(intelligentplatform management bridge,以下简称IPMB)的智能平台管理接口(intelligentplatform management interface,以下简称IPMI)讯息,与该处理器114与该存储装置117通信。IPMB为一集成电路总线(inter-integrated circuit bus)的强化应用,且为一基于讯息的硬件层基础接口标准。
在某些应用中,该控制器106可设置为监视电源供应特征、服务器系统机架和/或数据中心的温度、与数据中心相关的断电警告、处理需求以及服务器系统100E的零件和/或连接状态。依据至少可能/预期的段电,该控制器106 可设置为转移该服务器系统100E的程序至另一未被该可能/预期断电影响的服务器系统,并使该电池系统110准备就绪以提供电源给该服务器系统100E。
虽仅有特定零件被显示于分别位于图1A、1B、1C、1D与1E中的范例系统100A、100B、100C、100D与100E中,各种可处理或存储数据或是接收或传送信号的电子或计算机零件也可被包括于范例系统100A、100B、100C、 100D与100E中。进而,在范例系统100A、100B、100C、100D与100E中的电子或计算机零件可设置为执行各种类型的应用和/或可使用各种类的操作系统。该等操作系统可包括但不限于:安卓系统、博客来软件套件(Berkeley SoftwareDistribution),iPhone操作系统(iOS)、Linux、OS X、类Unix即时操作系统(如QNX)、微软视窗操作系统、视窗手机操作系统以及IBM z/OS。
依据该范例系统100A、100B、100C、100D与100E预期的应用,多种的网络与讯息协议可被使用,包括但不限于:TCP/IP、开放式系统互联通信 (open systemsinterconnection)、文件传输协议(file transfer protocol)、通用随插即用(universalplug and play)、网络文件系统(network file system)、网络文件共享系统(commoninternet file system)和AppleTalk等。本领域技术人员应明了于图1A、1B、1C、1D与1E中的范例系统100A、100B、100C、100D与 100E为解释用,因此一网络系统可适当地应用于多种变化形态,但仍依据本公开的多种实施例提供一网络平台设置。
在图1A、1B、1C、1D与1E中的范例设置中,范例系统100A、100B、 100C、100D与100E可同时包括一或多个可在一特定无线频道的可处理范围内与一或多个电子装置通信的无线零件。该无线信道可为任何适合装置进行无线通信的信道,如蓝牙(bluetooth)、蜂窝式(cellular)、近场通信(near-field communication)或是WiFi信道。应当理解的是该装置如同此领域的现有技术,可拥有一或多个传统有线通信连接。其他多种元件和/或组合在不同范例的范围下也为可能。
图2A为依据本发明实施例的于一机架系统内管理一或多个冷却装置的管理方法200A。应当理解的是方法200A仅为举例说明用,而依据本发明的其他方法可包括额外、较少或变化的步骤,并以类似、变化或是平行的顺序执行。该范例方法200A起始于步骤202。在步骤204,一监视电路可接收该机架系统内一服务器系统的一特定控制器(如基板管理控制器或处理器)的健康状态讯息,如图1A~1D所示。在某些范例中,该监视电路可接收来自该特定控制器的心跳信号。在某些范例中,该监视电路可主动测试该特定控制器的健康状态。
在步骤206,该监视电路可判断该特定控制器是否正常,如图1A~1D所示。该监视电路可进而接收该服务器系统的一交流电电源与一电源供应单元的状态讯息。在该特定控制器已失效的事件中,在步骤208中该监视电路可进而判断该交流电电源与该电源供应单元是否正常。
在步骤210,在该特定控制器已失效或无响应,且该该电源供应单元与交流电电源的状态正常的事件中,该监视电路可开启该服务器系统之一冷却控制开关至一外部模式,并进而允许该机架系统中一邻近服务器系统内的另一控制器控制该服务器系统的一或多个冷却零件,如图1A~1D所示。该方法 200A结束于步骤216。
在步骤214,在该特定控制器状态正常,且该电源供应单元或该交流电电源的一个已失效的事件中,该监视电路可开启该服务器系统的该冷却控制开关至一内部模式,如图1A~1D所示。该方法200A接着回到步骤204。
图2B为依据本发明实施例的另一于一机架系统内管理一或多个冷却装置的管理方法200B。应当理解的是方200B仅为举例说明用,而依据本发明的其他方法可包括额外、较少或是变化的步骤,并以类似、变化或是平行的顺序执行。该范例方法200B起始于步骤220。在步骤222,该机架系统的一特定节点的一控制器(如基板管理控制器或处理器)可接收该特定节点内一或多个冷却零件的状态讯息,如图1A~1D所示。在某些范例中,该控制器可进而接收该特定节点的温度讯息(如中央处理器、特定控制器或硬盘的温度)。
在步骤224,如果该特定节点内的一冷却控制开关被开启至一内部模式,该控制器可依据至少该一或多个冷却零件的状态讯息和/或该特定节点的温度讯息控制该一或多个冷却零件,如图1A~1D所示。
在步骤226,该控制器可接收该机架系统内一邻近节点的一或多个冷却零件的状态讯息。在某些范例中,该控制器可进而接收该邻近节点的温度讯息(如中央处理器、特定控制器或硬盘的温度)。
在步骤228,该控制器进而判断该邻近节点的一冷却控制开关是否被开启至一外部模式。在该邻近节点的该冷却控制开关被开启至该外部模式的事件中,该控制器可藉由送出依据至少该邻近节点的该一或多个冷却零件的状态讯息或该邻近节点的温度讯息的命令,控制该邻近节点的该一或多个冷却零件。该方法200B结束于步骤232。
上述讨论用意为举例本公开的原则与提供多种范例。当本公开被充分理解时,多种变化以及改变方式即会变得明显。
一计算机网络为藉由通信连接和区段互连的节点的地理分配聚集,用以在终端,如个人计算机及工作站,之间传输数据。已有许多可得类型的网络,其类型范围从局域网络(Local Area Network,LAN)、广域网络(Wide Area Netwoek,WAN)到重叠式与软件定义网络(Software-defined Network),如虚拟可扩展局域网络(virtual extensible localarea networks,VXLAN)。
LAN通常连接位于同一物理区域,如同一建筑物或园区,节点的专用私有通信连接。另一方面,WAN通常连接地理上分散长距离的节点间的连接,如同载波电话线、光纤路径、同步光纤网络(Synchronous optical networks, SONET)或同步数字阶级(synchronous digital hierarchy,SDH)。LAN和 WAN可包括第二层(L2)和/或第三层(L3)网络和装置。
互联网为WAN连接世界不同网络提供各网络上节点全球通信的例子。节点通常依据预设定义通信协议如传输控制通信协议、互联网通信协议 (TCP/IP)等交换离散信息帧或分组于在前述网络进行通信。在本申请中,通信协议可意指节点间如何互动的规范。计算机网络可进而藉由中继点,如路由器,而连接进而扩每一网络的有效“尺寸”。
重叠式网络一般允许在一物理网络架构上建立并分层虚拟网络。重叠式网络协议,如虚拟可扩展局域网络(Virtual Extensible LAN,下称VXLAN)、一般路由封装实现网络虚拟化(Network Virtualization using Generic Routing Enca电源供应单元lation,NVGRE)、网络虚拟化堆迭(Network Virtualization Overlays,NV03)及传输层隧道(Stateless Transport Tunneling,STT),提供一允许于逻辑信道上通过L3和L3网络层乘载网络流量的流量封装法则。此类逻辑信道可通过虚拟信道终端(Virtual Tunnel EndPoints,VTEP)起始及结束。
另外,重叠式网络可包括虚拟区段,如VXLAN重叠网络内的VXLAN 区段,其中可包含提供虚拟机器(Virtual Machine,VM)于其上进行通信的 L2和/或L3重叠网络。虚拟区段可为一虚拟网络辨识值(Virtual Network Iidentifier,VNI),如VXLAN网络辨识值,所辨识,该辨识值可辨识其连接的虚拟区段或网域。
网络虚拟化允许硬件和软件资源整合至一虚拟网络。例如,网络虚拟化可允许多个虚拟机器通过各自的虚拟LAN(VLAN)连接至物理网络。虚拟机器可依照其所相对应的虚拟网络进行分组,并可与其他虚拟机器及内部或外部网络的其他装置进行通信。
网络区段,如物理或虚拟区段、网络、装置、端口、物理或逻辑连接和/ 或流量可大致被区分为桥接(bridge)或洪水(Flood)网域。桥接或洪水网域可表示一广播网域如L2广播网域。桥接或洪水网域可包括单独子网络,但也可包括多个子网络。另外桥接网域可连接于网络装置上的桥接网域接口,如开关。桥接网域接口可为支持L2桥接网络与L3路由网络之间流量的逻辑接口。此外,桥接网域接口可支持网络协议(IP)终止、VPN终止、位置解析处理、MAC定位等。桥接网域和桥接网域接口皆可为同一索引或辨识值所辨识。
此外,终端群组(End Groups,EPG)可在网络中用为将应用程序映射 (mapping)至网络。尤其是,EPG可使用网络中应用程序终端的分组以将连接性与准则应用至该应用程序分组。EPG可作为装运的容器、应用程序的集合、或应用程序元件、以及现实传送与准则逻辑的层级。EPG也藉由改为使用逻辑应用边界(logical application boundary)以允许网络方针(network policy)、安全与地址转发(forwarding from addressing)的分离。
云端运算可在一或多个网络中被提供以使用共享资源提供运算服务。云端运算通常可包含以网络为基础的运算,其可得运算资源集合通过网络(如“云端”)被动态提供与分布至各客户或用户计算机或其他随选装置。云端运算资源,例如,可包括任何种类的资源如运算、存储、网络装置和虚拟机器等。例如,资源可包括服务器系统装置(防火墙、深度分组检测、流量检测、负载均衡等)、运算/处理装置(服务器、CPU、存储器、具强力(brute force)处理能力的装置),存储装置(如网络连接存储装置、存储局域网络装置)等。此外,此些资源可用于支持虚拟网络、虚拟机器(VM)、数据库与应用程序 (Apps)等。
云端运算资源可包含“私有云端”、“公有云端”和/或“混合云端”。“混合云端”可为由二或多个云端端通过技术之内部互动或结盟而组成的云端架构。在本质上,混合云端为私有和公有云端间的互动,其中私有云端加入公有云端并以安全与有弹性的方式利用公有云端的资源。云端运算资源也可通过重叠网络中的虚拟网络如VXLAN提供。
在网络交换系统中,可维持一查看数据库(lookup database)以记录各连接至此交换系统的终端的路由。然而终端可有多组设置并连接至多个租户。这些终端可具有多种类型的识别值,如IPv4、
Figure BDA0001624932280000171
或第二层(Layer 2)。查看数据库必须设置至不同模式以处理不同类型的终端识别值。一些查看数据库的能力是设计为处理进入分组的不同地址类型。此外,网络交换系统的查看数据库通常受限于一千个虚拟路由以及转送(VRF)。因此,需要一可用于处理各式终端辨识值的改良查看算法。本发明公开技术提出用于电信网络中的位置查看所需技术。本发明公开为系统、方法与计算机可读取存储介质以统一各类型的终端识别值,藉由映射终端识别值至一统一空间并允许不同形式的查看为统一处理。一范例系统与网络的简介,如图3与4在此公开。本实施案例的变形于各实施案例中描述。相关技术请参考图3。
图3显示一适合实现本公开的范例运算装置300。运算装置300包括一主中央处理器(CPU)362、接口368和一总线515(如PC总线)。当在适合的软件或固件控制下运作时,CPU362负责执行分组管理、错误检测、和/或路由功能,如不当连接检测(miscablingdetection)功能。CPU 362在软件控制下,包括操作系统与任何适合的应用软件,较佳地完成上述功能。CPU 362 可包含一或多个处理器363,如Motorola微处理器家族或MIPS微处理器家族的处理器。在另一实施例中,处理器363为一别设计以控制运算装置300 运作的硬件。在一特定实施例中,存储器361(如非易失性RAM和/或ROM) 亦形成CPU 362的部分。然而,存储器有许多不同可耦接于系统的方式。
接口368通常提供作为接口卡(有时被称为“线卡(line card)”)。一般而言,这些接口卡控制网络上的分组的传送与接收并有时支持运算装置300 使用的其他周边设备。可提供的接口为以太网络接口、帧中继接口、同轴电缆接口、DSL接口、令牌环(token ring)接口等等。此外,各种极高速接口可为提供,如快速令牌环接口、无线接口、以太网络接口、Gigabit以太网络接口、ATM接口、HSS接口、POS接口、FDDI接口等等。一般而言,此些接口可包括适合介质通信的适合端口。在某些实施例,接口也可包括独立处理器,以及在一些实施例中可包括易失性RAM。这些独立处理器可控制通信密集任务如分组交换和介质控制与管理。藉由对通信密集任务提供多个分离处理器,这些接口可允许主CPU 362有效率地执行路由运算、网络诊断、安全功能与其他。
虽然图3所示的系统为本公开的一特定运算装置,但绝非本发明申请可实施的唯一网络装置构造。例如具有处理通信及路由运算等的单一处理器的架构及其他架构经常被使用到。另外其他种类接口与介质也可与路由器一起使用。
无论网络装置设置为何,可使用一至多组存储器或存储器模块(包括存储器361)设置以存储通用网络作业的程序指令及上述的漫游机制、路由最佳化与路由功能,例如该程序指令可控制操作系统及一或多个应用程序的作业。该或这些存储器也可设置为存储表格如移动连接、注册、相关表格与其他。
图4与5显示范例系统实施例。本领域技术人员在应用本技术时可明了更适合的实施例。本领域技术人员也容易地明了其他系统实施例的可能性。
图4显示一系统总线运算系统架构400,其中系统零件使用总线402互相进行电子通信。范例系统400包括一处理器(CPU或处理器)430和一系统总线402。系统总线402将不同的系统零件耦接至处理器430,其中系统零件包括系统存储器404,例如只读存储器(ROM)406和随机存取存储器 (RAM)408。系统400可包含近距离连接或整合至处理器430的一高速存储器快取。系统400可从存储器404和/或存储装置412中复制数据至快取428 以利处理器430的快速存取。用此方法快取可避免处理器430的等待数据时间延迟而提供效能提升。此些或其他模块可控制或被设定为控制处理器430 以执行各式动作。其他系统存储器404也有可为利用。存储器404可包含具有不同效能特征的不同种类存储器。处理器430可包含任何通用处理器和一设定为控制处理器430的硬件或软件模块,如存储于存储装置412中模块1 414、模块2 416和模块3 418,或有软件指令并入进入实际处理器设计的特殊用途处理器。处理器430可为本质上一自足的运算系统,包括多内核或多处理器、总线、存储器控制器、快取等等。多内核处理器可为对称式或非对称式。
为了允许用户与运算系统400的互动,输入装置420可代表任何数目的输入机制,如语音使用的麦克风、手势或图像输入的触控感应屏幕、键盘、鼠标、动作输入、语音及其他。输出装置442可为本领域技术人员所知的一或多个输出机制。在某些实施例中,多重模式系统可允许用户提供与系统400 沟通的多种输入方法。该沟通接口424一般可支配与管理用户输入与系统输出。在硬件设置上并无设限,因此此处的基本特质可为完成发展的改良硬件或固件取代。
存储装置412为一非易失性存储器,可为一硬盘或其他种类可存储计算机可读取的数据的计算机可读介质,如磁性卡匣、快闪存储卡、固态存储器装置、多功能数字碟片(DVD)、卡带、RAM 408、ROM 406以及其混合。
存储装置412可包含控制处理器430的软件模块414、416和418。其他硬件或软件模块在预期之内。存储装置412可连接至系统总线402。在一方面,执行特定功能的硬件模块可包含存储于计算机可读介质中的软件零件以执行该功能,该计算机可读介质连接至必要的硬件零件如处理器430、总线 402、显示器436及其他。
控制器410可为系统400中一特制化微控制器或处理器,如基板管理控制器。在某些实施例中,控制器410可为智能平台管理接口(IPMI)的部分。此外在某些实施例中,控制器410可嵌入系统400之一主机板或主线路板。控制器410可管理系统管理软件与平台硬件间的接口。控制器410也可与不同的系统装置与零件(内部和/或外部),例如将于下列详述的控制器或周边零件,进行通信。
控制器410可针对通知、警示和/或事件产生特定响应以及与远端装置或零件进行通信(如电子邮件讯息、网络讯息等),产生自动硬件复原程序的指令或命令等。管理者可通过与控制器410远端通信以起始或执行特定硬件复原程序或作业,如下列详述。
系统400的不同种类感应器(如感应器426)可向控制器410回报参数,例如冷却风扇速度、电源状态、操作系统(OS)状态、硬件状态及其他。控制器410也可包含一系统事件记录控制器和/或存储器以管理及保留控制器 410接收到的事件、警示以及通知。例如,控制器410或系统事件记录控制器可从一或多个装置或零件接收警示或通知并于系统事件记录存储零件中保留这些警示或通知。
快闪存储器432可为一电子非易失性计算机存储介质或芯片,其可为系统400使用作为存储和/或数据传输之用。快闪存储器432可为电子抹除和/ 或重新编程。快闪存储器432可包括例如可抹除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、电子抹除式可复写只读存储器 (Electrically Erasable Programmable Read-Only Memory,EEPROM)、ROM、 NVRAM或互补式金属氧化物半导体(Complementary Metal-Oxide-Semiconductor,CMOS)。快闪存储器432可存储系统400开机时执行的固件434以及固件434的专用设置集。快闪存储器432也可存储固件434的设置。
固件434可包括一基本输入/输出系统(BIOS)或其继承者或等效者,如可扩展固件接口(Extensible Firmware Interface,EFI)或统一可扩展固件接口(UnifiedExtensible Firmware Interface,UEFI)。固件434可在系统400 每次起始时被以序列程序载入并执行。固件434可依据设置集辨识、初始化并测试系统400中的硬件。固件434可在系统400上执行自我测试,如开机自我测试(POST)。此自我测试可测试多种硬件零件的功能如硬盘、光学读取装置、冷却装置、存储器模块、扩展卡等等。固件434可在存储器404、 ROM406、RAM 408和/或存储装置412中划分一区块以存储一操作系统 (OS)。固件434可载入一开启程序和/或操作系统并将系统400的控制交与操作系统。
系统400的固件434可包括一固件设置,用以定义固件434如何控制系统400中各硬件零件。该固件设置可决定系统400中各硬件零件起始的顺序。固件434可提供一接口,如UEFI,以允许不同参数的设定,这些设定可能不同于固件的预设参数设定。例如,一用户(如管理者)可使用固件434以指定时钟及总线速度、定义哪些周边零件为接入系统400、设定系统健康状态的检测(如风扇速度及CPU温度限制)和/或提供其他可影响系统400整体效能与电力使用的参数。
虽然固件434显示存储于快闪存储器432,本领域技术人员应即了解固件434可存储于其他存储器零件,例如存储器404或ROM 406。然而固件434 显示存储于快闪存储器432为一非限制性的说明例。
系统400可包含一或多个传感器426。此一或多个传感器426可包括如一或多个温度传感器、热敏传感器(thermal sensor)、氧气传感器、化学传感器、噪声传感器、热传感器(heat sensor)、电流传感器、电压传感器、气流传感器、流量传感器、红外线传感器、热流传感器、温度计、高温器及其他。此一或多个传感器426可通过例如总线402与处理器、快取428、快闪存储器432、通信接口424、存储器404、ROM 406、RAM 408、控制器410和存储装置412进行通信。此一或多个传感器426也可通过一或多个其他方式,如内部整合电路(I2C)、通用型输出(GPO)等等和系统中其他零件进行通信。
图5显示一范例计算机系统500,该系统具有一可执行前述方法或作业并产生与显示一图形用户接口(GUI)的芯片架构。计算机系统500可包括计算机硬件、软件与固件以用于实现本发明的技术。计算机系统500可包括一处理器510,该处理器代表任何数目的物理和/或逻辑性上的明确资源,可执行设置为完成指定运算的软件、固件和硬件。处理器520可与可控制其输入输出的控制器510进行通信。在此例中,芯片组502输出数据至输出装置514,例如一屏幕,并可读取与写入讯息至存储装置516,例如可包括如磁性与固态介质。芯片组502也可读取与写入讯息至RAM 518。一用于接口连接各式用户接口零件506的总线504可供于接口连接芯片组502。此些用户接口零件506可包括键盘、麦克风、触控检测与处理电路、指标装置如鼠标和其他。一般而言,系统500的输入可为任何由机械产生或用户产生的多种来源。
芯片组502也可跟一或多个通信接口508建立接口连接,这些通信接口 508可拥有不同的物理接口。这些通信接口可包括有线局域网络、无线局域网络、宽带无线网络及个人局域网络的接口。此处描述的生成、展示与使用 GUI的一些应用可包括接收条理式数据集,该调理式数据集为通过物理接口接收或是藉由自身机器处理器510分析存储于存储装置516或518的数据而产生。进而,该机器可藉由用户接口零件506接收用户的输入并执行适当的功能,例如利用处理器510解议这些输入的浏览功能。
此外,芯片组502可与固件512进行通信,固件512在计算机系统500 开机时可被执行。固件512可依据一固件设置集辨识、初始化并测试计算机系统500中的硬件。固件512可在系统500上执行自我测试,如POST。此自我测试可测试多种硬件零件502-518的功能。固件512可在存储器518中划分一区块以存储操作系统。固件512可载入一开启程序和/或操作系统并将系统500的控制交与操作系统。在一些案例中,固件512可与硬件零件502-510 和514-518进行通信。在此,固件512可藉由芯片组502和/或一或多个零件与硬件零件502-510和514-518进行通信。在一些案例中,固件512可与硬件零件502-510和514-518进行直接通信。
可理解的是范例系统300、400与3500可拥有超过一个处理器(如363, 430,510)或为网络连接增强处理能力的运算装置群集的部分。
为了说明的清晰,本技术在某些案例中可能以包括性独立功能区块呈现,包括性独立功能区包括功能区块,功能区块包括装置、装置零件、软件中嵌入方法的步骤与程序,或软硬件的组合。
在某些实施例,计算机可读存储装置、介质和存储器可包含一有线或无线信号,该信号包含一位流(bit stream)等等。然而,当提及非暂态计算机可读介质时,排除的介质如能量、载波信号、电磁波和信号的本体。
上述范例的方式可藉由使用已存储或可由计算机可读介质获得的计算机可执行指令实现。此类指令可包括,例如导致或设定一般用途计算机、特殊用途计算机或特殊处理装置以执行一特定或群体功能的指令或数据。计算机资源的一部分可藉由网络获得。计算机可执行指令可为例如位,中阶格式指令如组合语言、固件或原始码。可用于存储存储指令、使用过的讯息和/或上述范例方法所产生的讯息的计算机可读介质范例包括磁盘、光盘、快闪存储器、使用非易失性存储器的USB装置、网络存储装置及其他。
根据本发明的装置实施方法可包括硬件、固件和/或软件,且可为多种类型。此类类型的通常范例包括笔记型计算机、智能手机、小型个人计算机、个人数字助理、机架式装置、独立装置等等。本描述的功能也可被嵌入至周边设备或扩展卡。进一步举例,此功能也可实现于一电路板中不同的芯片或单一装置上执行的不同指令。
指令、运送指令的介质、执行指令的运算资源以及其他用以支持此运算资源的结构是为提供本描述的功能的手段。
本公开的多个面向提供使用一节点的冷却控制开关与一特定控制器(如一基板管理控制器或一特定控制器)控制该节点的一或多个冷却零件的系统与方法。特定范例已呈现于上述讨论中以显示可选择的作业可被应用于不同的操作中,其他范例可包含可选择的操作于不同的操作中。为了清楚的说明,本公开的某些范例可用包含单独功能区块(包括装置、装置零件、嵌入软件、硬件或是软硬件结合的步骤或是流程)的方式呈现。
此多种案例可进而实现于多种操作环境,在某些案例中可包括一或多个可用于执行任何数目的应用程序的服务器计算机、用户计算机或运算装置。用户或客户装置可包括任何数目的一般用途个人计算机,如执行标准操作系统的桌上型或笔记型计算机,或运行移动软件且支持多种网络与讯息协议的蜂窝式网络、无线或手持装置。此系统也可包括多个运行任何市售操作系统与其他以知功能,如发展与数据管理,的运用程序的工作站计算机。此类装置也可包括其他电子装置,如虚拟终端(dummy terminal)、精简客户端(thinclient)、游戏系统和其他具有网络通信功能的装置。
就硬件实现的范例或其部分而言,本专利申请可以下列技术的任何组合实现:具有依据数据信号实现逻辑功能的逻辑门的非连续逻辑线路、具有适当逻辑门组合的特殊应用集成电路(Application Specific Integrated Circuit, ASIC)、可编程逻辑门阵列(Programmable Gate Array,PGA)、现场可编程逻辑门阵列(Field Programmable GateArray,FPGA)等等。
多数范例使用为本领域技术人员所熟悉的多种市售协议中一或多个种网络以支持通信功能,这些协议如TCP/IP、OSI、FTP、UPnP、NFS、CIFS、 AppleTalk等等。该网络可为,例如局域网络、广域网络、虚拟私人网络、互联网、互联网、外部网络、公共交换电话网络、红外线网络、无线网络以及任何以上的组合。
上述范例的方法可藉由使用计算机可执行指令而实现,该指令存于或可得于计算机可读介质。此类指令可包括如导致或设置一般用途计算机、特殊用途计算机或特殊用途处理装置以执行一特定或群体功能。计算机资源的一部分可藉由网络获得。这些计算机可执行指令可为例如位,中阶格式指令如组合语言、固件或原始码。可用于存储存储指令、使用过的讯息和/或上述范例方法所产生的讯息的计算机可读介质范例包括磁盘、光盘、快闪存储器、使用非易失性存储器的USB装置、网络存储装置及其他。
根据本发明的装置实施方法可包括硬件、固件和/或软件,且可为多种类型。此类类型的通常范例包括服务器计算机、笔记型计算机、智能手机、小型个人计算机、个人数字助理等等。本描述的功能也可被嵌入至周边设备或扩展卡。进一步举例,此功能也可实现于一电路板中不同的芯片或单一装置上执行的不同指令。
在使用网络服务器的范例中,该服务器可执行多种服务或中层应用软件,包括HTTP服务器、FTP服务器、CGI服务器、数据服务器、Java服务器以及商业应用服务器。该服务器也可依据用户装置的要求执行程序或脚本,如执行以一或多个网络应用程序,这些网络应用程序以一或多个以任何程序语言写成的脚本或程序实现,这些语言如Java、C、C#、C++或任何脚本语言如 Perl、Python或TCL,以及以上的组合。这些服务器也可包含数据库服务器,包括但不限于公开市场上市售者。
服务器可包括多种上述的数据存储和存储器及存储介质。该可存放于多种位置,如一或多个计算机区域内(和/或计算机中)的存储介质或远离任一或全部网络内的计算机的存储介质。在一特定范例组中,这些讯息可存储于本领域技术人员所熟悉的存储局域网络(Storage Area Network,SAN)中。类似地,执行计算机、服务器或其他网络装置功能所需的任何文件可适当地存储在当地或远距位置。其中系统包括计算机化元件、每一该元件可包括可藉由总线耦接的硬件单元。该单元包括如一或多个中央处理单元CPU,一或多个输入装置(如鼠标、键盘、控制器、触碰感应显示元件或键盘)和一或多个输出装置(如显示装置、打印机或喇叭)。此一系统也可包括一或多个存储装置,如碟片装置、光学存储装置和固态装置如随机存取存储器(RAM) 或只读存储器(ROM)、以及可移除式介质装置、存储卡、快闪存储器卡等等。
此类装置也可包括一计算机可读存储介质读取器、一通信装置(如数据机,有线或无线网络卡、红外线运算装置)和上述的工作用存储器。计算机可读存储介质读取器可连接,或设定为接收,计算机可读存储介质,该计算机可读存储介质代表远端、近端、固定和/或可移除式存储装置,以及用于暂时和/或长时容纳、存储、传送与接收计算机可读讯息的存储介质。此系统与多种装置也通常包括多种位于一或多个工作存储器装置中的软件应用程序、模块和其他元件,包括一操作系统及应用程序如网页浏览器。显而易见地,不同范例可由上述多种变化而得。例如,定制硬件也可被使用和/或特殊元件可于硬件软件(包括可移式软件如小指令(applet))或两者中实现。进而,与其他运算装置的连接,如网络输入输出装置,可被使用。
用于存储程序代码或程序代码的部分的存储介质和计算机可读介质可包含任何本领域技术人员熟知或使用的适合介质,包含存储介质和运算介质,包含存储介质和运算介质,例如但不限于以任何方法实现的易失与非易失性、可移除和不可移除介质,用于存储和/或传输信息如计算机可读指令、数据结构、程序模块和其他数据。包括RAM、ROM、EPROM、EEPROM、快闪存储器活其他存储器技术、CD光盘、多功能数字碟片(DVD)或其他光学存储装置、磁性卡夹、磁带、磁盘或其他磁性存储装置或其他任何可用于存储系统可存取数据的介质。基于本技术与教示,本领域技术人员可知的其他方式和/或方法以实现本发明的各方面。
本说明的规范与图例应为举例教示而非限制作用。但其应足为教示本领域技术人员在不脱离本发明及所附的权利要求书的精神与范围内,当可做些许的更动与润饰。

Claims (10)

1.一种服务器系统,设置于机架系统内,该机架系统至少具有第一服务器系统与第二服务器系统,该服务器系统是所述第一服务器系统,该服务器系统包括:
一或多个冷却零件;
第一控制器,被设定以控制该一或多个冷却零件;
第一冷却控制开关;以及
监视电路,被设定用以:
判断该第一控制器的健康状态;以及
在该第一控制器失效的事件中,开启该第一冷却控制开关至外部模式并允许该第二服务器系统的第二控制器控制该一或多个冷却零件,此时该第二服务器系统在第二控制器处于内部模式下继续正常运行。
2.如权利要求1所述的服务器系统,其中该监视电路还设定为接收该服务器系统的交流电电源以及电源供应单元的状态讯息,并仅在该交流电电源与该电源供应单元状态良好的情况下才可操作用以开启该第一冷却控制开关至该外部模式。
3.如权利要求1所述的服务器系统,其中在该第一控制器状态良好的事件中,该监视电路设定为开启所述冷却控制开关至内部模式,并允许该第一控制器控制该一或多个冷却零件。
4.如权利要求1所述的服务器系统,其中该监视电路藉由主动监视该第一控制器的健康状态以判断该第一控制器的健康状态;其中如果该第一控制器的任何操作参数超过预设的标准,该监视电路判断该第一控制器失效。
5.如权利要求1所述的服务器系统,其中该第一控制器还被设定用以:
接收该第二服务器系统的至少一冷却零件的状态讯息;
判断该第二服务器系统的第二冷却控制开关为被开启至外部模式;以及
依据至少所接收的该至少一冷却零件的状态讯息,控制该第二服务器的该至少一冷却零件。
6.如权利要求1所述的服务器系统,其中该第一控制器还设定为:
接收该服务器系统的温度讯息;
判断该第一冷却控制开关为被开启至外部模式;以及
依据至少该服务器系统的温度讯息,控制该服务器系统的该一或多个冷却零件。
7.一种计算机实施方法,用以控制机架系统中的第一节点的一或多个冷却零件,其中该机架系统至少具有所述第一节点以及第二节点,所述计算机实施方法包括:
在所述第一节点的控制器接收该一或多个冷却零件的状态讯息;
当判断所述第一节点的第一冷却控制开关为被开启至内部模式时,依据至少接收自该一或多个冷却零件的该状态讯息控制该一或多个冷却零件;
接收该机架系统中所述第二节点的至少一冷却零件的状态讯息;
判断所述第二节点的第二冷却控制开关为被开启至外部模式;以及
依据至少所接收到的所述第二节点的该至少一冷却零件的状态讯息,控制所述第二节点的该至少一冷却零件,此时所述第一节点在第一控制器处于内部模式下继续正常运行。
8.如权利要求7所述的计算机实施方法,其中所述第一节点包括设定为监视该控制器健康状态的监视电路。
9.如权利要求7所述的计算机实施方法,还包括:
接收所述第二节点的温度讯息;以及
依据至少所述第二节点的该温度讯息控制所述第二节点的该至少一冷却零件。
10.一种非暂态计算机可读存储介质,该存储介质包含指令,当该指令被系统的至少一处理器执行时,使该系统执行权利要求7所述的方法。
CN201810319726.XA 2017-08-09 2018-04-11 服务器系统、计算机实施方法及非暂态计算机可读介质 Active CN109388213B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/673,031 US10806057B2 (en) 2017-08-09 2017-08-09 Multi-node system-fan-control switch
US15/673,031 2017-08-09

Publications (2)

Publication Number Publication Date
CN109388213A CN109388213A (zh) 2019-02-26
CN109388213B true CN109388213B (zh) 2021-02-02

Family

ID=62486399

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810319726.XA Active CN109388213B (zh) 2017-08-09 2018-04-11 服务器系统、计算机实施方法及非暂态计算机可读介质

Country Status (5)

Country Link
US (1) US10806057B2 (zh)
EP (1) EP3442319B1 (zh)
JP (1) JP6559842B2 (zh)
CN (1) CN109388213B (zh)
TW (1) TW201911045A (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11206243B2 (en) * 2019-03-04 2021-12-21 Cyxtera Cybersecurity, Inc. Multiple gateway controllers to establish network access
TWI709941B (zh) * 2019-09-20 2020-11-11 中華電信股份有限公司 虛實資源整合管理系統及其方法
TWI743569B (zh) * 2019-10-09 2021-10-21 葉焦明 工業電腦故障與異常檢知判讀系統
CN111400140B (zh) * 2020-03-18 2023-12-12 北京达佳互联信息技术有限公司 通信设备的控制系统、方法、装置、计算设备和存储介质
US11503737B2 (en) 2020-04-03 2022-11-15 National Environmental Products Ltd Modular computing device and fan enclosure
TWI752696B (zh) * 2020-10-28 2022-01-11 英業達股份有限公司 溫度管理系統
KR102532063B1 (ko) * 2020-12-14 2023-05-12 현대모비스 주식회사 멀티 컨트롤러를 이용한 구동 제어 방법과 시스템 및 이를 위한 장치
US20220237570A1 (en) * 2021-01-22 2022-07-28 Dell Products L.P. Method and System for Determining Computer Fan Usage and Maintenance
US11263083B1 (en) * 2021-03-26 2022-03-01 Quanta Computer Inc. Method and apparatus for selective boot-up in computing devices
TWI776579B (zh) * 2021-07-06 2022-09-01 技嘉科技股份有限公司 韌體更新的處理方法與裝置
CN113377186B (zh) * 2021-08-13 2021-11-19 深圳市有为信息技术发展有限公司 电源管理电路及其控制方法、车载设备、机动车
JP7436060B2 (ja) 2022-02-24 2024-02-21 Necプラットフォームズ株式会社 管理装置、制御方法、及びプログラム
CN114911332B (zh) * 2022-04-29 2023-08-04 苏州浪潮智能科技有限公司 服务器风扇调控方法、系统、电子设备及存储介质
CN115168160B (zh) * 2022-09-07 2022-12-20 中国电子科技集团公司第十五研究所 一种vpx服务器智能机箱监控系统
CN115993881B (zh) * 2023-03-20 2023-06-27 新华三信息技术有限公司 风扇调速策略确定方法、装置、电子设备及存储介质
CN116719397A (zh) * 2023-08-03 2023-09-08 深圳比特微电子科技有限公司 区块链服务器及其电源散热方法、装置、电源和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5906315A (en) * 1998-05-08 1999-05-25 Sun Microsystems, Inc. Watchdog timer for controlling a cooling system
CN103810136A (zh) * 2012-11-13 2014-05-21 王明仁 计算机集群、用于计算机集群的管理方法及系统
WO2016016925A1 (ja) * 2014-07-28 2016-02-04 株式会社日立製作所 ストレージ装置のfan制御最適化
TWI530776B (zh) * 2013-11-19 2016-04-21 英業達股份有限公司 風扇控制器以及具該風扇控制器之伺服器系統

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5184025A (en) * 1988-11-14 1993-02-02 Elegant Design Solutions, Inc. Computer-controlled uninterruptible power supply
US6004020A (en) * 1997-06-11 1999-12-21 Bartur; Meir Medication dispensing and monitoring system
US7287708B2 (en) * 2004-11-12 2007-10-30 International Business Machines Corporation Cooling system control with clustered management services
US8113010B2 (en) * 2009-11-02 2012-02-14 Exaflop Llc Data center cooling
US9098257B2 (en) * 2011-02-03 2015-08-04 Dell Products L.P. Information handling system server architecture for improved management communication
CN103139248B (zh) * 2011-11-28 2016-04-20 英业达科技有限公司 机架系统
US9158310B2 (en) * 2011-12-14 2015-10-13 International Business Machines Corporation Integrating a data center thermal control system and individual fan controllers for controlling a thermal environment in a data center room
CN102622279B (zh) * 2012-03-16 2015-08-19 华为技术有限公司 冗余控制系统、方法及管理控制器
US9223326B2 (en) * 2012-07-22 2015-12-29 International Business Machines Corporation Distributed thermal management system for servers
CN104564764B (zh) * 2013-10-12 2016-09-21 英业达科技有限公司 服务器系统
GB201320778D0 (en) * 2013-11-25 2014-01-08 Microsoft Corp Communication system architecture
US9763356B2 (en) * 2014-03-26 2017-09-12 Lenovo (Singapore) Pte. Ltd. Closed-loop control and monitoring in cooling electronic components
US10101780B2 (en) * 2015-12-09 2018-10-16 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Secondary management device determining desired fan speed upon failure of primary management device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5906315A (en) * 1998-05-08 1999-05-25 Sun Microsystems, Inc. Watchdog timer for controlling a cooling system
CN103810136A (zh) * 2012-11-13 2014-05-21 王明仁 计算机集群、用于计算机集群的管理方法及系统
TWI530776B (zh) * 2013-11-19 2016-04-21 英業達股份有限公司 風扇控制器以及具該風扇控制器之伺服器系統
WO2016016925A1 (ja) * 2014-07-28 2016-02-04 株式会社日立製作所 ストレージ装置のfan制御最適化

Also Published As

Publication number Publication date
US20190053405A1 (en) 2019-02-14
EP3442319A1 (en) 2019-02-13
CN109388213A (zh) 2019-02-26
JP6559842B2 (ja) 2019-08-14
US10806057B2 (en) 2020-10-13
JP2019032818A (ja) 2019-02-28
TW201911045A (zh) 2019-03-16
EP3442319B1 (en) 2022-07-27

Similar Documents

Publication Publication Date Title
CN109388213B (zh) 服务器系统、计算机实施方法及非暂态计算机可读介质
CN108228209B (zh) 自动更新服务器系统的元件的固件的系统、方法和介质
CN108509210B (zh) 自动更新基本输入输出系统的系统与方法
CN108983938B (zh) 当待机电源故障时可操作系统、计算机实现方法、及介质
EP3242297B1 (en) System with fresh air flow toward downstream components for cooling
CN108984351B (zh) 电压调整器预烧测试的系统、方法和计算机可读存储介质
US10402205B2 (en) System and method for dynamically optimizing hardware frequency for booting
EP3352047A1 (en) Power supply unit (psu) management
TWI637611B (zh) 使用wol的系統復原

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant