CN106534162A - 一种基于远程管理通讯协议的服务器温度监控系统及方法 - Google Patents

一种基于远程管理通讯协议的服务器温度监控系统及方法 Download PDF

Info

Publication number
CN106534162A
CN106534162A CN201611101378.6A CN201611101378A CN106534162A CN 106534162 A CN106534162 A CN 106534162A CN 201611101378 A CN201611101378 A CN 201611101378A CN 106534162 A CN106534162 A CN 106534162A
Authority
CN
China
Prior art keywords
temperature
real
server
time
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611101378.6A
Other languages
English (en)
Inventor
金鑫
蒋树春
吕兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Datcent Technology Co Ltd
Original Assignee
Datcent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datcent Technology Co Ltd filed Critical Datcent Technology Co Ltd
Priority to CN201611101378.6A priority Critical patent/CN106534162A/zh
Publication of CN106534162A publication Critical patent/CN106534162A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D23/00Control of temperature
    • G05D23/19Control of temperature characterised by the use of electric means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/133Protocols for remote procedure calls [RPC]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Human Computer Interaction (AREA)
  • Computer Hardware Design (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明是一种基于远程管理通讯协议的服务器温度监控系统,包括:温度采集模块,用于采集服务器温度,将采集到的温度值,通过远程管理通讯协议提供给其他模块获取;温度数据记录模块,与温度采集模块通讯,将温度值记录到数据库中;温度数据分析模块,用于提取温度数据记录模块记录在数据库中的实时温度值,对其进行汇总和分析;温度数据展示模块,用于将温度数据分析模块产生的数据直观具体的展示给用户;温度数据报警模块,用于对采集到的实时温度值进行扫描、监控和报警,当实时温度值异常时,及时的通过监控系统或短信通知用户,防止温度异常造成的进一步损失;本发明可以预防由于温度问题导致的服务器异常、数据中心安全隐患、数据中心能耗浪费。

Description

一种基于远程管理通讯协议的服务器温度监控系统及方法
技术领域
属于计算机数据中心智能监测管理系统领域,涉及一种服务器温度监控方法,具体的说是一种基于远程管理通讯协议的服务器温度监控系统及方法。
背景技术
当今社会,随着互联网的高速发展,计算机数据中心的数量越来越多,规模越来越大,高密度的服务器搭建在数据中心的机房中,每台服务器的温度监控就显得非常重要,温度的异常,轻则导致服务器宕机,造成业务上的异常,重则引起火灾,导致不可预期的严重后果。
现有技术中,服务器温度监控方法有以下两种:一是在服务器周围部署温度传感器,但服务器内部温度异常传递到温度传感器有时间延迟,采集数值也不够精确,造成该方法将温度异常通知到用户时,已经错过了最佳时机。二是在服务器操作系统上部署监控软件,由软件读取服务器温度并向外部发送,该方法会较大占用操作系统的系统资源和网络数据传输带宽,在操作系统异常时整个监控就会失效。
目前,随着物联网和嵌入式的飞速发展,在服务器主板上定制支持远程管理和温度采集的芯片的技术和方案已经很成熟,这为硬件级的服务器温度监控方法提供了技术支持。
发明内容
本发明所要解决的技术问题是,克服现有技术的缺点,提供一种基于远程管理通讯协议的服务器温度监控系统及方法,可以针对大数量、高密度的数据中心里的服务器,采用硬件级芯片的方案,通过远程管理通讯协议,对服务器温度进行监控,同时对采集到的温度值进行汇总、分析、报警,预防由于温度问题导致的服务器异常、数据中心安全隐患、数据中心能耗浪费。
本发明解决以上技术问题的技术方案是:
一种基于远程管理通讯协议的服务器温度监控系统,包括:
温度采集模块,用于采集服务器温度,将采集到的温度值,通过远程管理通讯协议提供给其他模块获取;
温度数据记录模块,与温度采集模块通讯,将温度值记录到数据库中;
温度数据分析模块,用于提取温度数据记录模块记录在数据库中的实时温度值,对其进行汇总和分析;
温度数据展示模块,用于将温度数据分析模块产生的数据直观具体的展示给用户;
温度数据报警模块,用于对采集到的实时温度值进行扫描、监控和报警,当实时温度值异常时,及时的通过监控系统或短信通知用户,防止温度异常造成的进一步损失;
所述温度数据分析模块包括:
小时温度记录子模块,首先每隔一个小时,将这一个小时的实时温度值取平均值,记录在小时温度值表中;
天温度记录子模块,每隔一天,将小时温度值表中这一天的温度值取平均值,记录在天温度值表中;
数据分析模块子模块,通过实时、小时、天,这3个时间维度的温度值之后,分析一天之中的最高温度出现在哪个时间段,意味着哪个时间段负载最高,机房中哪些位置的服务器温度较高,哪些位置的服务器温度较低,温度高的说明制冷不够,需要加强,温度低的说明制冷过度,需要调整。
一种基于远程管理通讯协议的服务器温度监控方法,包括以下步骤:
㈠采集服务器温度,将采集到的温度值,通过远程管理通讯协议提供给其他模块获取;
㈡与温度采集模块通讯,将温度值记录到数据库中;
㈢提取记录在数据库中的实时温度值,对其进行汇总和分析;
㈣将温度数据分析模块产生的数据直观具体的展示给用户;
㈤对采集到的实时温度值进行扫描、监控和报警,当实时温度值异常时,及时的通过监控系统或短信通知用户,防止温度异常造成的进一步损失;
步骤㈢具体包括:
⑴每隔一个小时,将这一个小时的实时温度值取平均值,记录在小时温度值表中;
⑵每隔一天,将小时温度值表中这一天的温度值取平均值,记录在天温度值表中;
⑶通过实时、小时、天,这3个时间维度的温度值之后,分析一天之中的最高温度出现在哪个时间段,意味着哪个时间段负载最高,机房中哪些位置的服务器温度较高,哪些位置的服务器温度较低,温度高的说明制冷不够,需要加强,温度低的说明制冷过度,需要调整。
本发明的有益效果是:⑴基于硬件的温度采集,稳定,高效:温度采集芯片位于服务器主板上,不受操作系统和各种软件的干扰,即使服务器关机,仍然可以采集;因为不是传统的软件采集形式,所以没有占用珍贵的服务器系统资源。⑵数据分析功能健全:系统将采集到的实时温度值,按照小时、天的粒度,统计出平均值、最高值、最低值,为展示和报警功能提供基础数据。⑶历史数据可追溯:实时采集温度值、数据分析生成的各种粒度、维度的温度值,都记录在系统的数据库中,历史数据可以很方便的进行追溯、查询。⑷温度监控展示合理:在基础数据的支撑下,可以向用户展示各种粒度、维度的温度监控;比如实时温度显示、温度历史曲线图、各种用户定制的温度报表。⑸温度报警及时:系统在进行实时温度采集的同时,会监控温度值,如果某台服务器的温度异常,将会在实时温度显示界面进行明显的报警显示,并通过邮件、手机短信等方式向监控系统用户进行报警提示,保证温度异常的及时报警。
附图说明
图1为本发明的部署示意图。
具体实施方式
实施例1
本实施例是一种基于远程管理通讯协议的服务器温度监控系统,本实施例服务器采用的主板嵌有定制的温度监控芯片,服务器采用的主板上嵌有支持远程管理通讯协议的芯片,该芯片采集温度,并支持外部读取,现在物联网和嵌入式技术高速发展,定制这种芯片很方便。
本实施例温度数据处理服务器部署,将负责温度汇总、分析、报警的温度数据处理服务器部署在用户数据中心网络中,保证可以和所有嵌有温度监控芯片的服务器通讯。服务器装有linux操作系统,并安装mysql数据库。温度汇总、分析、报警分成3个linux程序运行在操作系统上,以降低耦合。
本实施例基于远程管理通讯协议的服务器温度监控系统包括:
温度采集模块,用于采集服务器温度,将采集到的温度值,通过远程管理通讯协议提供给其他模块获取;该模块的任务是进行服务器温度采集,定制服务器主板上的芯片,用于采集服务器的温度,该采集方案不依赖于操作系统,也不占用系统资源,完全硬件级,高效,稳定,即使在操作系统关机情况下依然可以正常工作。采集到的温度值,通过远程管理通讯协议,提供给其他子模块获取;
温度数据记录模块,与温度采集模块通讯,将温度值记录到数据库中;该模块与温度采集子模块中的芯片通讯,将温度值记录到数据库中;通讯周期可根据业务需要进行设置,周期越短温度值的记录密度越高,更利于迅速发现问题,但代价是对存储空间要求也会相应的提高;该模块记录的数据为其他模块进行数据分析提供数据基础;
温度数据分析模块,用于提取温度数据记录模块记录在数据库中的实时温度值,对其进行汇总和分析;
温度数据展示模块,用于将温度数据分析模块产生的数据直观具体的展示给用户;温度数据展示模块主要通过仪表、曲线图、报表展示给用户。其中,所述仪表用于展示各个服务器当前的温度值,给用户实时、直观的展;曲线图用于展示历史温度曲线,曲线图的粒度可以变化,可以设置为实时温度曲线图、小时温度曲线图、天温度曲线图,方便用户从不同粒度了解温度的变化情况;报表用于系统、直观的将经过统计的温度情况展示给用户,每一类报表都有自己独有的统计方法,可以根据用户需求进行定制,展现不同维度的统计情况。
温度数据报警模块,用于对采集到的实时温度值进行扫描、监控和报警,当实时温度值异常时,及时的通过监控系统或短信通知用户,防止温度异常造成的进一步损失;
温度数据分析模块包括:
小时温度记录子模块,首先每隔一个小时,将这一个小时的实时温度值取平均值,记录在小时温度值表中;
天温度记录子模块,每隔一天,将小时温度值表中这一天的温度值取平均值,记录在天温度值表中;
数据分析模块子模块,通过实时、小时、天,这3个时间维度的温度值之后,分析一天之中的最高温度出现在哪个时间段,意味着哪个时间段负载最高,机房中哪些位置的服务器温度较高,哪些位置的服务器温度较低,温度高的说明制冷不够,需要加强,温度低的说明制冷过度,需要调整。
本实施例的一种基于远程管理通讯协议的服务器温度监控方法,包括以下步骤:
㈠采集服务器温度,将采集到的温度值,通过远程管理通讯协议提供给其他模块获取;
㈡与温度采集模块通讯,将温度值记录到数据库中;
㈢提取记录在数据库中的实时温度值,对其进行汇总和分析;
㈣将温度数据分析模块产生的数据直观具体的展示给用户;
㈤对采集到的实时温度值进行扫描、监控和报警,当实时温度值异常时,及时的通过监控系统或短信通知用户,防止温度异常造成的进一步损失;
步骤㈢具体包括:
⑴每隔一个小时,将这一个小时的实时温度值取平均值,记录在小时温度值表中;
⑵每隔一天,将小时温度值表中这一天的温度值取平均值,记录在天温度值表中;
⑶通过实时、小时、天,这3个时间维度的温度值之后,分析一天之中的最高温度出现在哪个时间段,意味着哪个时间段负载最高,机房中哪些位置的服务器温度较高,哪些位置的服务器温度较低,温度高的说明制冷不够,需要加强,温度低的说明制冷过度,需要调整。
除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。

Claims (3)

1.一种基于远程管理通讯协议的服务器温度监控系统,其特征在于:包括:
温度采集模块,用于采集服务器温度,将采集到的温度值,通过远程管理通讯协议提供给其他模块获取;
温度数据记录模块,与温度采集模块通讯,将温度值记录到数据库中;
温度数据分析模块,用于提取温度数据记录模块记录在数据库中的实时温度值,对其进行汇总和分析;
温度数据展示模块,用于将温度数据分析模块产生的数据直观具体的展示给用户;
温度数据报警模块,用于对采集到的实时温度值进行扫描、监控和报警,当实时温度值异常时,及时的通过监控系统或短信通知用户,防止温度异常造成的进一步损失;
所述温度数据分析模块包括:
小时温度记录子模块,首先每隔一个小时,将这一个小时的实时温度值取平均值,记录在小时温度值表中;
天温度记录子模块,每隔一天,将小时温度值表中这一天的温度值取平均值,记录在天温度值表中;
数据分析模块子模块,通过实时、小时、天,这3个时间维度的温度值之后,分析一天之中的最高温度出现在哪个时间段,意味着哪个时间段负载最高,机房中哪些位置的服务器温度较高,哪些位置的服务器温度较低,温度高的说明制冷不够,需要加强,温度低的说明制冷过度,需要调整。
2.如权利要求1所述的基于远程管理通讯协议的服务器温度监控系统,其特征在于:所述温度数据展示模块主要通过仪表、曲线图、报表展示给用户。
3.一种基于远程管理通讯协议的服务器温度监控方法,其特征在于:包括以下步骤:
㈠采集服务器温度,将采集到的温度值,通过远程管理通讯协议提供给其他模块获取;
㈡与温度采集模块通讯,将温度值记录到数据库中;
㈢提取记录在数据库中的实时温度值,对其进行汇总和分析;
㈣将温度数据分析模块产生的数据直观具体的展示给用户;
㈤对采集到的实时温度值进行扫描、监控和报警,当实时温度值异常时,及时的通过监控系统或短信通知用户,防止温度异常造成的进一步损失;
所述步骤㈢具体包括:
⑴每隔一个小时,将这一个小时的实时温度值取平均值,记录在小时温度值表中;
⑵每隔一天,将小时温度值表中这一天的温度值取平均值,记录在天温度值表中;
⑶通过实时、小时、天,这3个时间维度的温度值之后,分析一天之中的最高温度出现在哪个时间段,意味着哪个时间段负载最高,机房中哪些位置的服务器温度较高,哪些位置的服务器温度较低,温度高的说明制冷不够,需要加强,温度低的说明制冷过度,需要调整。
CN201611101378.6A 2016-12-05 2016-12-05 一种基于远程管理通讯协议的服务器温度监控系统及方法 Pending CN106534162A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611101378.6A CN106534162A (zh) 2016-12-05 2016-12-05 一种基于远程管理通讯协议的服务器温度监控系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611101378.6A CN106534162A (zh) 2016-12-05 2016-12-05 一种基于远程管理通讯协议的服务器温度监控系统及方法

Publications (1)

Publication Number Publication Date
CN106534162A true CN106534162A (zh) 2017-03-22

Family

ID=58354987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611101378.6A Pending CN106534162A (zh) 2016-12-05 2016-12-05 一种基于远程管理通讯协议的服务器温度监控系统及方法

Country Status (1)

Country Link
CN (1) CN106534162A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168483A (zh) * 2017-06-22 2017-09-15 安徽康海时代科技股份有限公司 Rj45型四网八串口服务器
CN107194976A (zh) * 2017-03-31 2017-09-22 深圳市浩远智能科技有限公司 一种温度云图的处理方法和装置
CN109040478A (zh) * 2018-08-31 2018-12-18 北京云迹科技有限公司 电话盒子的过载告警方法和装置
CN113029234A (zh) * 2021-02-24 2021-06-25 北京中大科慧科技发展有限公司 用于数据中心的机房温湿度环境检测方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102323905A (zh) * 2011-07-21 2012-01-18 曙光信息产业股份有限公司 一种龙芯主板的远程监控系统
CN103049988A (zh) * 2012-11-09 2013-04-17 上海爱控自动化设备有限公司 基于WiFi无线网络的仓储空间参数监控系统及其方法
CN103048054A (zh) * 2012-12-27 2013-04-17 德讯科技股份有限公司 一种基于高密度温度采集的数据中心温度处理方法
CN103995549A (zh) * 2013-01-14 2014-08-20 湖北大学 基于集中温控系统的温度数据采集方法
CN105872071A (zh) * 2016-04-30 2016-08-17 深圳市普特生物医学工程有限公司 基于血站成分科的温湿度监控系统的监控方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102323905A (zh) * 2011-07-21 2012-01-18 曙光信息产业股份有限公司 一种龙芯主板的远程监控系统
CN103049988A (zh) * 2012-11-09 2013-04-17 上海爱控自动化设备有限公司 基于WiFi无线网络的仓储空间参数监控系统及其方法
CN103048054A (zh) * 2012-12-27 2013-04-17 德讯科技股份有限公司 一种基于高密度温度采集的数据中心温度处理方法
CN103995549A (zh) * 2013-01-14 2014-08-20 湖北大学 基于集中温控系统的温度数据采集方法
CN105872071A (zh) * 2016-04-30 2016-08-17 深圳市普特生物医学工程有限公司 基于血站成分科的温湿度监控系统的监控方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107194976A (zh) * 2017-03-31 2017-09-22 深圳市浩远智能科技有限公司 一种温度云图的处理方法和装置
CN107168483A (zh) * 2017-06-22 2017-09-15 安徽康海时代科技股份有限公司 Rj45型四网八串口服务器
CN109040478A (zh) * 2018-08-31 2018-12-18 北京云迹科技有限公司 电话盒子的过载告警方法和装置
CN113029234A (zh) * 2021-02-24 2021-06-25 北京中大科慧科技发展有限公司 用于数据中心的机房温湿度环境检测方法及系统
CN113029234B (zh) * 2021-02-24 2022-04-22 北京中大科慧科技发展有限公司 用于数据中心的机房温湿度环境检测方法及系统

Similar Documents

Publication Publication Date Title
CN110224858B (zh) 基于日志的告警方法及相关装置
US20150170070A1 (en) Method, apparatus, and system for monitoring website
CN106534162A (zh) 一种基于远程管理通讯协议的服务器温度监控系统及方法
CN102801785B (zh) 一种对广告投放引擎进行监控的系统及方法
CN105335271A (zh) 一种状态监控装置、综合监控系统和方法
US10275476B2 (en) Machine to machine data aggregator
CN106411659A (zh) 一种业务数据监测方法及装置
CN112311617A (zh) 一种配置化数据监控告警方法及系统
CN105407015A (zh) 一种业务平台、监控平台、业务监控系统及方法
CN104301147A (zh) 一种对业务应用系统中业务及流程活动的监测方法
CN113746703B (zh) 一种异常链路监控方法、系统和装置
CN104104734A (zh) 日志分析方法和装置
CN103873298A (zh) 一种可以配置的维护中心操作维护中心北向接口的数据质量自动监测的方法
CN109347665A (zh) 一种基于web日志的网站可用性告警方法及其系统
CN204291014U (zh) 一种机房监控系统
CN102981939A (zh) 磁盘监控方法
CN107678915A (zh) 一种输变电设备监测平台基础资源监控方法
CN112256548B (zh) 异常数据的监听方法、装置、服务器及存储介质
KR100984282B1 (ko) 메모리캐쉬를 이용한 통합보안관리시스템
CN110633191B (zh) 实时监控软件系统业务健康度的方法和系统
CN113676509A (zh) Http接口健康状态主动探测方法及系统
CN115934464A (zh) 一种信息化平台监控采集系统
CN112291347B (zh) 一种基于http的网络产品业务与运行状态监控系统及获取测试结果的方法
CN114138720A (zh) 日志处理方法、装置、电子装置和存储介质
CN114595135A (zh) 日志数据处理方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170322

RJ01 Rejection of invention patent application after publication