CN109213653A - 服务器的远程管理系统及其远程管理方法 - Google Patents

服务器的远程管理系统及其远程管理方法 Download PDF

Info

Publication number
CN109213653A
CN109213653A CN201710629076.4A CN201710629076A CN109213653A CN 109213653 A CN109213653 A CN 109213653A CN 201710629076 A CN201710629076 A CN 201710629076A CN 109213653 A CN109213653 A CN 109213653A
Authority
CN
China
Prior art keywords
server
equipment
sensing data
management system
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710629076.4A
Other languages
English (en)
Inventor
薛清益
廖仁忠
吴武杰
蔡文贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chunghwa Telecom Co Ltd
Original Assignee
Chunghwa Telecom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chunghwa Telecom Co Ltd filed Critical Chunghwa Telecom Co Ltd
Publication of CN109213653A publication Critical patent/CN109213653A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Air Conditioning Control Device (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种服务器的远程管理系统及其远程管理方法,远程管理系统包括服务器、网关装置及远程监控设备。服务器设置在机房内,且监测自身的运作效能(资源利用率),并通过感测元件感测感测数据(用电、温度、风扇转速等)甚至冷热道温度。网关装置连接服务器,并转送运作效能及感测数据。远程监控设备连接至网关装置,并整合运作效能及感测数据,以提供对应的监控操作(告警通报、图形化界面呈现、空调控制、负载转移等)。由此,维修人员可实时了解服务器及机房状况,并能有效解决机柜局部热点问题。

Description

服务器的远程管理系统及其远程管理方法
技术领域
本发明涉及一种远程监控技术,且特别涉及一种服务器的远程管理系统及其远程管理方法。
背景技术
对于各大型公司、资安业者或电信业者而言,其需要规划机房来放置大量服务器,以方便集中控管。然而,由于维修人员不会经常处于机房内,因此通常无法实时掌握机房内的状况。在现有技术中,已提出通过远程监控的方式来监测机房内的状况。然而,现有技术都仅针对单一部分监测,无法为服务器及机房整体提供全面的监控方案。
发明内容
有鉴于此,本发明提供一种服务器的远程管理系统及其远程管理方法,其整合内部运作效能、感测数据及外在环境状态,从而提供合适的调整机制。
本发明的服务器的远程管理系统,其包括服务器、网关装置及远程监控设备。服务器设置在机房内,监测自身的运作效能,并通过感测元件感测感测数据。网关装置连接服务器,并转送运作效能及感测数据。远程监控设备连接至网关装置,并整合运作效能及感测数据,以提供对应的监控操作。另一方面,本发明的服务器的远程管理方法,适用于监控服务器的远程监控设备。远程管理方法包括下列步骤。监测服务器自身的运作效能。感测服务器所处的机房的感测数据。整合运作效能及感测数据,以提供对应的监控操作。基于上内容述,通过同时整合运作效能及外部的感测数据,本发明实施例能进一步提供较合适的调整机制,以方便维修人员管理,并快速排除障碍。
为了让本发明的上述特征和优点能更明显易懂,下文特别列举实施例,并配合附图作详细说明如下。
附图说明
图1是根据本发明一实施例的远程管理系统的架构示意图。
图2是根据本发明一实施例的服务器的远程管理方法的流程图。
附图标号说明:
1:远程管理系统
100:服务器
101:服务器管理软件
103:系统基本输入输出系统
130:感测元件
150:空调温度控制器
170:机房冷热通道传感器
200:网关装置
300:远程监控设备
400:使用者设备
S21~S25:方法步骤。
具体实施方式
图1是根据本发明一实施例的远程管理系统1的架构示意图,远程管理系统1包括一个或更多个服务器100、一个或更多个感测元件130(外置或内建于服务器100)、空调温度控制器150、机房冷热通道传感器170、网关装置200、远程监控设备300及使用者设备400。
这些服务器100分别、部分或全部设置在机房(未示出)内,服务器100可以是行动数据、网络、档案、数据库、邮件、域名、代理、应用程序等任何类型的服务器。服务器100装载有服务器管理软件101,以通过系统基本输入输出系统(BIOS)103感测其内部中央处理器(CPU)、内存、输入输出(I/O)使用率等运作效能。感测元件130可以是用于感测服务器100的温度、用电、风扇转速等感测值的感测元件。而服务器100的管理软件101也可通过感测元件130取得上述感测值的感测数据。
机房内设有空调温度控制器150,并在冷热通道处设有机房冷热通道传感器170。空调温度控制器150为特定电路、芯片或微处理器,以直接控制空调设备的温度、风向、风量、运转等功能。而机房冷热通道传感器170用于感测温度等机房内的感测数据。需说明的是,机房内可另外布建其他类型的感测元件,根据应用者的需求而调整。
网关装置200设置在机房端,并通过网络服务(web service)应用程序接口(API)与服务器100的管理软件101、空调温度控制器150及机房冷热通道传感器170整合,网关装置200即可取得服务器管理软件101所收集的运作效能及感测数据,并转送至服务器100之外的其他网络(例如因特网(Internet)等)。
远程监控设备300可以是云端服务器、个人计算机、计算机工作站等类型的电子装置,并可与网关装置200连接以收发数据。
使用者设备400可以是智能型手机、平板计算机、台式计算机、笔记本计算机等类型的电子装置,并可连接至远程监控设备300以收发数据。使用者设备400装载有浏览器或监控程序,以提供使用者界面,方便维修人员操作。
以上是关于远程管理系统1中各装置的说明,接着将搭配上述装置说明本发明实施例的运作流程。本方法的各个流程可根据实施情形而随之调整,且并不仅限于此。
请参照图2,图2是根据本发明一实施例的服务器100的远程管理方法的流程图。由于CPU、内存和输入/输出装置是服务器100的三大核心元件,因此其效能数据(例如使用率(%))即可用于评估服务器100的整体运作效能。而服务器100通过其管理软件101来监控CPU、内存和输入/输出装置使用率,并将上述数据整合,以计算出服务器100的资源利用率等运作效能(步骤S21)。资源利用率的数值越大表示服务器100运作繁忙。
另一方面,服务器100的管理软件101也通过感测元件130感测服务器100的用电、温度、风扇转速等感测数据(步骤S23),且机房冷热通道传感器170感测的冷热通道温度,更能取得例如进出风温度等其他外部环境状态。而网关装置200便将运作效能、感测数据及外部环境状态转送至远程监控设备300。
远程监控设备300取得上述数据后,便能整合运作效能、感测数据及外部环境状态等数据,以提供对应的监控操作(步骤S25)。监控操作的实施例有很多种,以下列举几个范例来说明,应用者可根据需求自行调整。
监控操作-界面呈现操作:
使用者设备400可运行浏览器、监控程序以通过图形化的使用者界面呈现服务器100用电、温度、风扇转速等感测数据,资源利用率等运作效能,甚至是冷热通道温度。通过获取服务器100的资源利用率可以了解目前服务器100的运作效能,例如可基于数据利用率的数值归类出服务器100的工作量低、中、高等群组,并以不同颜色表示不同群组,以方面维修人员在使用者界面中通过不同颜色了解目前服务器100的运作效能。而机房的温度信息、冷热通道温度,远程监控设备300将服务器100与冷热通道温度分级成不同颜色,利用不同颜色建立机柜二维(2D)/三维(3D)温度场,使得在使用者设备400的使用者界面上建立机柜3D温度场,从而有效掌握机房热点与周遭状况。远程监控设备300也可利用服务器100的用电信息建立能源使用效率(PUE)程度(level)3指标(PUE Level 1、2、3代表电表量测位置的不同,Level 1是指量测到配电盘端,Level 2是指量测到不断电系统(UPS)端,Level 3是指量测到服务器100的用电端),并在使用者设备400的使用者界面上显示PUE Level 3指针,以了解机房用电效能。
监控操作-告警通报操作:
当运作效能及感测数据符合通报条件时,远程监控设备300即对使用者设备400执行告警通报操作。例如,针对风散异常告警,远程监控设备300设定服务器100的温度过高门槛(>25℃)、资源利用率上限数值(>50%)、风扇风速下限数值(<10cfm),而当温度过高、资源利用率过低、风扇风速过慢时,远程监控设备300即对使用者设备400自动发出风扇异常告警,使得使用者设备400的使用者界面呈现风扇异常告警讯息。而针对热点告警,远程监控设备300设定IT服务器温度门槛(>25℃)、设备资源利用率上限数值(>50%),而当温度、资源利用率过高,远程监控设备300即对使用者设备400自动发出热点告警,使得使用者设备400的使用者界面呈现热点告警讯息。
监控操作-负载转移操作:
假设存在两组以上的服务器100,当其中一组服务器100的运作效能超出运作门槛时,远程监控设备300执行负载转移操作,以将该组服务器100的工作负载转移至另一组服务器100。例如,远程监控设备300区分资源使用率区间,假设资源利用率(<25%)为低使用率、资源利用率(介于25%~50%)为中使用率、资源利用率(>50%)为高使用率。设定服务器100的温度门槛(>25℃)、资源利用率门槛(>50%)及负载数值上限(>3kW),当一组服务器100的温度、资源利用率及负载数值过高时,远程监控设备300提供虚拟机(VM)负载移转建议,建议使用者将资源利用率、负载、温度过高的服务器100的工作负载转移到资源利用率低(<25%)、低负载(<3kW)、温度较低(<25℃)的服务器100,或直接将工作负载转移。而使用者设备400的使用者界面可呈现上述负载转移建议,使得维修人员可进一步分析,并控制工作负载的转移。另需说明的是,上述门槛、上下限数值可根据实际需求调整。
监控操作-空调控制操作:
远程监控设备300设定监视目标物与上下限温度,目标物可选择单一个服务器100的进出风温度、所有服务器100平均进出风温度或冷热通道温度。当所选择的目标物满足其条件(例如大于上限温度)时,远程监控设备300通报空调温度控制器150对目标物热点进行自动降温,当温度达标(例如小于上限温度)后,远程监控设备300再通报空调温度控制器150停止降温,将能够有效提升空调节能率与机房能源效益。在实际设计上,空调设备的出风口可针对单一个或更多个服务器100或其所设置的机柜,以达成针对性的热点的温度调控。
需说明的是,为了提供较精准的温度控制器,本发明运用比例-积分-微分(proportional-integral-derivative,PID)算法搭配死区(dead zone)运算分析技术,由此提升控制精准度与稳定度,并解决在物理上限制而产生控制输入的非线性问题,从而掌握控制精准度。方程式如下所示:
(1)
其中Toutput为控制温度,T为温度,t为时间,KP、Ki、Kd为调整参数。再通过死区运算分析技术解决控制稳定度问题,当实时量测值(PV)进入控制目标值(SP)的迟滞区范围,便停止演算,即可解决上述问题。
上述监控操作可同时运行或经由远程监控设备300或使用者设备400挑选部分或全部来执行。
综上所述,本发明远程管理系统及其远程管理方法通过不同的监控操作,可方便维修人员随时随地了解服务器100与机房的状况,并能实时获得告警信息以加速障碍排除的作业。另一方面,结合空调控制,本发明实施例可对目标服务器100自动降温,有效解决机柜局部热点问题,从而达成空调节能并改善机房能源效益。
虽然本发明已通过实施例的方式公开如上,但其并非用于限定本发明,任何所属技术领域中具有公知常识的人,在不脱离本发明的精神和范围内,应当可以作出一定的更动与润饰,因此本发明的保护范围应当以后附的权利要求书所限定的范围为准。

Claims (10)

1.一种服务器的远程管理系统,其特征在于,包括:
至少一个服务器,该至少一个服务器监测自身的运作效能,并通过至少一个感测元件感测感测数据;
网关装置,该网关装置连接该至少一个服务器,并转送该运作效能及该感测数据;以及
远程监控设备,该远程监控设备连接至该网关装置,并整合该运作效能及该感测数据,以提供对应的监控操作。
2.如权利要求1所述的远程管理系统,其特征在于,还包括使用者设备,该使用者设备连接至该远程监控设备,而该监控操作包括告警通报操作,当该运作效能及该感测数据符合通报条件时,该远程监控设备对该使用者设备执行该告警通报操作。
3.如权利要求1所述的远程管理系统,其特征在于,该监控操作包括负载转移操作,该至少一个服务器包括两个服务器,当其中一个服务器的该运作效能超出运作门槛时,该远程监控设备执行该负载转移操作,以将该服务器的工作负载转移至另一个服务器。
4.如权利要求1所述的远程管理系统,其特征在于,还包括使用者设备,该使用者设备连接至该远程监控设备,而该监控操作包括界面呈现操作,该远程监控设备通过该使用者设备以图形化的使用者界面呈现该运作效能及该感测数据,以执行该界面呈现操作。
5.如权利要求4所述的远程管理系统,其特征在于,该远程监控设备将该运作效能及该感测资料分别根据程度归类至不同群组,并以不同颜色表示不同群组。
6.如权利要求1所述的远程管理系统,其特征在于,还包括空调温度控制器及机房冷热通道传感器,该空调温度控制器及该机房冷热通道传感器均连接该网关设备,该至少一个服务器设置在至少一个机房内,而该监控操作包括空调控制操作,该远程监控设备取得该机房冷热通道传感器所感测的通道温度,并整合运作效能及该感测数据来控制该空调温度控制器,以执行该空调控制操作。
7.如权利要求6所述的远程管理系统,其特征在于,该空调温度控制器利用比例-积分-微分算法并搭配死区运算分析技术。
8.如权利要求6所述的远程管理系统,其特征在于,该至少一个服务器包括多个服务器,而该空调温度控制器针对其中一个服务器调节温度。
9.一种服务器的远程管理方法,适用于监控至少一个服务器的远程监控设备,其特征在于,该远程管理方法包括:
监测该至少一个服务器自身的运作效能;
通过至少一个感测元件感测感测数据;以及
整合该运作效能及该感测数据,以提供对应的监控操作。
10.如权利要求9所述的远程管理方法,其特征在于,该监控操作包括空调控制操作,而整合该运作效能及该感测数据以提供对应的监控操作的步骤包括:
取得机房冷热通道传感器所感测的通道温度;以及
整合运作效能及该感测数据来控制该空调温度控制器,以执行该空调控制操作。
CN201710629076.4A 2017-07-06 2017-07-28 服务器的远程管理系统及其远程管理方法 Pending CN109213653A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW106122707A TWI770038B (zh) 2017-07-06 2017-07-06 伺服器之遠端管理系統及其遠端管理方法
TW106122707 2017-07-06

Publications (1)

Publication Number Publication Date
CN109213653A true CN109213653A (zh) 2019-01-15

Family

ID=64991394

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710629076.4A Pending CN109213653A (zh) 2017-07-06 2017-07-28 服务器的远程管理系统及其远程管理方法

Country Status (2)

Country Link
CN (1) CN109213653A (zh)
TW (1) TWI770038B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110333700A (zh) * 2019-05-24 2019-10-15 蓝炬兴业(赤壁)科技有限公司 工控机服务器远程管理平台系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102455035A (zh) * 2010-11-03 2012-05-16 中华电信股份有限公司 机房空调调控系统
CN103064389A (zh) * 2012-12-27 2013-04-24 无锡博欧节能科技有限公司 一种智能能耗管理支撑系统
CN105323158A (zh) * 2014-07-31 2016-02-10 三星电子株式会社 控制连接到网关的外部装置的数据传输的系统和方法
CN106484756A (zh) * 2015-08-25 2017-03-08 动联国际股份有限公司 服务器及使用该服务器的数据搜索方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7054329B2 (en) * 2000-07-07 2006-05-30 Koninklijke Philips Electronics, N.V. Collision avoidance in IEEE 802.11 contention free period (CFP) with overlapping basic service sets (BSSs)
US7032119B2 (en) * 2000-09-27 2006-04-18 Amphus, Inc. Dynamic power and workload management for multi-server system
WO2012070292A1 (ja) * 2010-11-22 2012-05-31 インターナショナル・ビジネス・マシーンズ・コーポレーション 分散データベースの負荷均衡のためのコネクション配分を実現する情報処理システム、情報処理装置、負荷均衡方法、データベース配置計画方法およびプログラム
KR101249469B1 (ko) * 2011-11-02 2013-04-01 (주)테키스트 업다운 모드를 구비하며 데드존을 회피하는 반도체 제조 설비의 온도제어시스템
TWI597602B (zh) * 2013-08-15 2017-09-01 Chunghwa Telecom Co Ltd Server Room Energy Saving Method Based on Server Resource Load and Location Awareness
TWI568213B (zh) * 2014-04-03 2017-01-21 財團法人工業技術研究院 交談式遠端管理系統及其負載平衡控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102455035A (zh) * 2010-11-03 2012-05-16 中华电信股份有限公司 机房空调调控系统
CN103064389A (zh) * 2012-12-27 2013-04-24 无锡博欧节能科技有限公司 一种智能能耗管理支撑系统
CN105323158A (zh) * 2014-07-31 2016-02-10 三星电子株式会社 控制连接到网关的外部装置的数据传输的系统和方法
CN106484756A (zh) * 2015-08-25 2017-03-08 动联国际股份有限公司 服务器及使用该服务器的数据搜索方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110333700A (zh) * 2019-05-24 2019-10-15 蓝炬兴业(赤壁)科技有限公司 工控机服务器远程管理平台系统及方法

Also Published As

Publication number Publication date
TWI770038B (zh) 2022-07-11
TW201907691A (zh) 2019-02-16

Similar Documents

Publication Publication Date Title
CN109800066B (zh) 一种数据中心节能调度方法及系统
US20170219241A1 (en) Data Center Infrastructure Management (DCIM) system comprising predictive analytics
US8954197B2 (en) Arrangement for operating a data center using building automation system interface
CN109116812A (zh) 基于SparkStreaming的智能配电柜、节能系统及方法
US11906180B1 (en) Data center management systems and methods for compute density efficiency measurements
CN110793653A (zh) 温度监控方法及装置
WO2014137559A1 (en) Data center intelligent control and optimization
CN109784504A (zh) 数据中心远程智能运维管理方法及系统
US10401401B2 (en) System and methods thereof for monitoring of energy consumption cycles
CN112926791A (zh) 一种机房温度分布预测方法及系统
CN105066372A (zh) 一种电力机房内温湿度控制方法
CN105872061A (zh) 一种服务器集群管理方法、装置及系统
CN113065293A (zh) 一种数据中心环境监控方法、系统、电子设备及存储介质
Rocha et al. Energy efficiency in smart buildings: An IoT-based air conditioning control system
US10599204B1 (en) Performance efficiency monitoring system
CN115327264A (zh) 一种数据中心的异常检测方法、装置、电子设备和介质
CA2723407A1 (en) Arrangement for operating a data center using building automation system interface
CN109213653A (zh) 服务器的远程管理系统及其远程管理方法
KR20130122194A (ko) 냉온수 왕복온도차 제어를 통한 에너지 관리 방법 및 이를 위한 에너지관리장치
EP3942486A1 (en) Data center management systems and methods for compute density efficiency measurements
CN106649025A (zh) 一种服务器管理方法
CN115511296A (zh) 一种园区能效一体化管理方法、系统、设备及存储介质
Bermudez et al. Optimal and distributed automatic discrete control of air conditioning units in data centers
Cisco Gaining Energy Transparency & Efficiency in the Data Center
Center it@ intel

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination