CN103760838A - 基于环境参数的服务器集群自动保护系统 - Google Patents

基于环境参数的服务器集群自动保护系统 Download PDF

Info

Publication number
CN103760838A
CN103760838A CN201310573173.8A CN201310573173A CN103760838A CN 103760838 A CN103760838 A CN 103760838A CN 201310573173 A CN201310573173 A CN 201310573173A CN 103760838 A CN103760838 A CN 103760838A
Authority
CN
China
Prior art keywords
server cluster
server
environmental parameter
data acquisition
relay group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310573173.8A
Other languages
English (en)
Inventor
张晓峰
牛亚斌
张荷
仵亚伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwest A&F University
Original Assignee
Northwest A&F University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwest A&F University filed Critical Northwest A&F University
Priority to CN201310573173.8A priority Critical patent/CN103760838A/zh
Publication of CN103760838A publication Critical patent/CN103760838A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Abstract

本发明涉及一种基于环境参数的服务器集群自动保护系统,属于服务器安全技术领域。系统包括下位机和上位机,其中,下位机包括数据采集与控制系统、温度传感器、电网电压传感器和继电器组,温度传感器、电网电压传感器连接在数据采集与控制系统上,数据采集与控制系统与继电器组相连,继电器组采用UPS电源供电。上位机由服务器集群运行环境监测与控制系统组成,下位机由一台IBM server组成,上、下位机之间通过RS-232总线相连,与服务器集群之间通过以太网相连。本发明可以达到保护服务器数据及设备安全的目的,同时大大减轻技术管理人员的工作负担。

Description

基于环境参数的服务器集群自动保护系统
技术领域
[0001] 本发明涉及一种基于环境参数的服务器集群自动保护系统,属于服务器安全技术领域。
背景技术
[0002] 在高校的计算机实验教学中心,网络教学资源共享、网络应用服务和网络管理是由服务器集群来实现的。由于教学和科研的需要,要求这种网络服务是全天候的,即全年365天每天24小时不间断服务。为此,服务器集群也必须全天候工作,而且要保障设备无故障、连续可靠运行。如何保障服务器集群连续、可靠运行除设备本身的因素外,运行环境至关重要。运行环境中最重要的两个因素是电网供电和环境温度,因为异常停电会造成服务器数据丢失,而高温会使服务器设备瘫痪或损坏。因此,几乎在所有的服务器集群的运行环境中,大功率UPS电源和精密制冷空调是必须的配套设备。
[0003] 但在实际应用中,一些突发因素仍然会导致服务器数据丢失甚至造成设备损坏。根据对西北农林科技大学计算机实验教学中心服务器集群10多年的运行统计,概率最高的两个因素是电网异常停电和空调故障。这里要特别强调一个技术细节,因为空调是感性负载,UPS电源不能给感性负责提供电力,也就是当电网停电时,空调也会停止工作。因此,当电网停电时,虽然服务器集群有UPS供电仍能正常工作,但由于空调停止工作,服务器集群自身工作所产生的热量使运行环境的温度会越来越高,高温最终会导致服务器瘫痪,并引起数据丢失甚至造成设备损坏。
[0004] 因此,当出现电网异常停电、空调故障时,如何保护服务器设备,需要重点予以关注。目前市场上成熟的技术和产品是基于GSM的短信报警系统,即当温度超过设定的上限值时,将环境温度以手机短信形式发给技术管理者,以便管理人员能及时地处置问题。但在长期的应用中,也发现了其存在一些弊端,主要表现在以下几个方面:
[0005] ①在晚上一些时段,即使报警短信发给技术管理人员,但由于大家都在熟睡,短信可能被忽略。
[0006] ②遇到双休日、节假日,技术管理人员可能远离设备所在地,当收到报警短信时,问题很难及时处置。特别是在高校的寒、暑假期间,这种问题表现得最为突出。
[0007] ③短信报警方式实质上是“无线报警技术+人力保障”的技术管理模式,这种管理方式本身就存在漏洞。因为对高校计算机实验教学中心而言,服务器集群的规模相对较小(几十台服务器),因此往往不安排技术管理人员24小时值班,所以“人力保障”本身就存在不确定性和响应效率低下的现实问题。
[0008] ④可能造成较大的经济损失。一般情况下,计算机服务器与交换机、路由器等网络设备都集中安装在中心机房,而且这些设备价值比较高,一旦出现以上异常情况,如果处置不及时而造成设备损坏,其损失往往较大。我们自己就曾因此造成了一台价值12万元的防火墙设备损坏,其原因是雷雨天导致半夜突然停电,而高温报警的短信未被及时发现。
[0009] 以上问题是基于GSM的短信报警技术本身无法解决的。发明内容
[0010] 本发明的目的在于针对上述问题,提供一种基于环境参数的服务器集群自动保护系统,通过实时监测服务器集群的运行环境参数(电网电压、环境温度),当环境参数异常并达到设定的上限值时,在保证服务器数据安全的情况下,自动停止服务器集群的运行,防止高温损坏设备;当环境参数恢复正常时,设计系统会自动开启服务器集群,恢复服务器集群的服务功能。
[0011] 为了实现上述目的,本发明的技术方案如下。
[0012] 一种基于环境参数的服务器集群自动保护系统,包括下位机和上位机,其中,下位机包括数据采集与控制系统、温度传感器、电网电压传感器和继电器组,温度传感器、电网电压传感器连接在数据采集与控制系统上,数据采集与控制系统与继电器组相连。上位机由服务器集群运行环境监测与控制系统组成,上位机由一台IBM server组成,与下位机之间通过RS-232总线相连,与服务器集群之间通过以太网相连。上、下位机采用UPS电源供电。
[0013] 下位机的功能可以使用单片机技术结合传感器技术来实现。其各部分功能电路如下:
[0014] ①数据采集与控制电路:选择美国Silicon Laboratories公司的C8051F340来实现数据的采集和控制。C8051F340使用Silicon Labs的专利CIP-51微控制器内核,具有片内上电复位、电压调整器、看门狗定时器和时钟振荡器等功能电路,是真正能独立工作的片上系统。CIP-51采用流水线结构,与标准的8051结构相比指令执行速度有很大的提高。FLASH存储器具有在系统重新编程能力,用户软件能对所有外设进行完全控制。
[0015] ②电网电压采集电路:使用直流稳压电源作为电网电压传感器,即可对电网电压进行实时监测,系统设计使用DC+5V稳压电源。通过对电网电压检测端的测试,即可判断电网供电是否正常。
[0016] ③温度检测电路:通过对环境温度的检测来判断空调是否正常工作,环境温度可通过温度传感器进行监测。系统设计选择美国Dallas公司生产的DS18B20作为温度传感器。
[0017] ④继电器组控制电路:继电器组的主要功能是接受C8051F340单片机发出的命令,实现对服务器供电的控制。
[0018] 该发明中,上位机通过运行设计的服务器自动保护系统软件,实现对下位机发送数据的分析,并当环境参数异常并达到设定的阀值时,通过以太网发送控制命令,关闭服务器集群,当服务器集群关闭后,再通过控制下位机切断服务器的供电电源;当环境参数恢复正常时,开启服务器并恢复其正常的网络服务功能。从而达到自动保护服务器集群及自动管理的目的。
[0019] 该发明的有益效果在于:在服务器集群的管理中,由于空调故障、电网停电等突发因素不可避免,而这些因素可能造成服务器及网络系统瘫痪甚至设备损坏,严重影响服务器的安全可靠运行。再者,由于服务器及网络设备处于网络应用的核心位置,且设备价值较高,一旦出现问题,不但损失大、而且造成影响也很大。因此,对服务器集群进行自动保护具
有重要意义。[0020] 本发明正是针对现实需要,以解决服务器集群在日常运行和管理中存在的问题为出发点,通过对服务器集群的运行环境因素进行实时监测,并当环境因素异常时,实现对保护服务器集群及网络设备保护;同时,当环境因素恢复正常时,恢复服务器集群原有的功能。即达到保护服务器数据及设备安全的目的,同时大大减轻技术管理人员的工作负担。
附图说明
[0021] 图1是本发明实施例中系统结构组成框图。
[0022] 图2是本发明实施例中系统电路组成框图。
[0023] 图3是本发明实施例中数据采集与控制电路图。
[0024] 图4是本发明实施例中电网电压采集电路图。
[0025] 图5是本发明实施例中温度采集电路图。
[0026] 图6是本发明实施例中继电器控制电路图。
[0027] 图7是本发明实施例中上位机连接框图。
[0028] 图8是本发明实施例中上位机系统设计流程图。
具体实施方式
[0029] 下面结合附图和实施例对本发明的具体实施方式进行描述,以便更好的理解本发明。
[0030] 如图1所示,基于环境参数的服务器集群自动保护系统,包括下位机和上位机,其中,下位机包括数据采集与控制系统、温度传感器、电网电压传感器和继电器组,温度传感器、电网电压传感器连接在数据采集与控制系统上,数据采集与控制系统与继电器组相连,继电器组采用UPS电源供电。下位机的功能是对服务器集群的运行环境参数进行实时采集,并将采集的数据上传至上位机;同时接收上位机发送的控制命令,控制服务器集群供电。上位机由服务器集群运行环境监测与控制系统组成,其功能是接收下位机采集的数据,并对数据进行分析,当数据异常并达到系统设计的阀值时,关闭服务器并切断服务器的供电;当环境参数恢复正常后,恢复服务器集群的正常服务功能。本发明实施例中,系统电路组成框图如图2所示。
[0031] 下位机的功能可以使用单片机技术结合传感器技术来实现。各部分功能电路如下:
[0032] ①数据采集与控制电路:由于S0C(System on a chip)单片机在一个芯片中集成了构成教据采集和控制系统所需的几乎所有数字、模拟接口和功能部件,而且具有与MCS-51内核及指令完全兼容的微控制器,因此选择美国Silicon Laboratories公司的C8051F340来实现数据的采集和控制。C8051F340使用Silicon Labs的专利CIP-51微控制器内核,具有片内上电复位、电压调整器、看门狗定时器和时钟振荡器等功能电路,是真正能独立工作的片上系统。CIP-51采用流水线结构,与标准的8051结构相比指令执行速度有很大的提高。FLASH存储器具有在系统重新编程能力,用户软件能对所有外设进行完全控制。因此,采用C8051F340为核心的单片机能更好地完成系统设计预期的功能,也能大大提高系统开发的效率。系统设计的C8051F340的外围引脚及信号定义如图3所示。
[0033] ②电网电压采集电路:使用直流稳压电源作为电网电压传感器,即可对电网电压进行实时监测,系统设计使用DC+5V稳压电源,采集电路如图4所示。通过对电网电压检测端的测试,即可判断电网供电是否正常。
[0034] ③温度检测电路:通过对环境温度的检测来判断空调是否正常工作,环境温度可通过温度传感器进行监测。系统设计选择美国Dallas公司生产的DS18B20作为温度传感器。温度采集电路如图5所示。其中,DQ为温度检测端,与C8051F340的P2.2端口相连接,实现温度的采集。
[0035] ④继电器组控制电路:继电器组的主要功能是接受C8051F340单片机发出的命令,实现对服务器供电的控制。为尽量减化电路的设计,在设计中,将服务器集群及其附属的网络设备分为3组,分别由3组继电器进行控制。继电器控制电路如图6所示。
[0036] 上位机由一台IBM server组成,与下位机之间通过RS-232总线相连,与服务器集群之间通过以太网相连,如图7所示。
[0037] 上位机通过运行设计的服务器自动保护系统软件,实现对下位机发送数据的分析,当环境参数异常并达到设定的阀值时,通过以太网发送控制命令,关闭服务器集群,当服务器集群关闭后,再通过控制下位机切断服务器的供电电源;当环境参数恢复正常时,开启服务器并恢复其正常的网络服务功能。从而达到自动保护服务器集群及自动管理的目的。上位机系统设计流程如图8所示。
[0038] 以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (5)

1.一种基于环境参数的服务器集群自动保护系统,包括下位机和上位机,其特征在于:所述下位机包括数据采集与控制系统、温度传感器、电网电压传感器和继电器组,温度传感器、电网电压传感器连接在数据采集与控制系统上,数据采集与控制系统与继电器组相连;所述上位机由服务器集群运行环境监测与控制系统组成,所述上位机由一台IBM server组成,与下位机之间通过RS-232总线相连,与服务器集群之间通过以太网相连;上、下位机采用UPS电源供电。
2.根据权利要求1所述的基于环境参数的服务器集群自动保护系统,其特征在于:所述数据采集与控制系统选择美国Silicon Laboratories公司的C805IF340来实现数据的采集和控制。
3.根据权利要求1所述的基于环境参数的服务器集群自动保护系统,其特征在于:所述电网电压采集电路使用直流稳压电源作为电网电压传感器,即可对电网电压进行实时监测,系统设计使用DC+5V稳压电源。
4.根据权利要求1所述的基于环境参数的服务器集群自动保护系统,其特征在于:所述温度传感器为美国Dallas公司生产的DS18B20。
5.根据权利要求1所述的基于环境参数的服务器集群自动保护系统,其特征在于:所述继电器组主要是接受C8051F340单片机发出的命令,实现对服务器供电的控制。
CN201310573173.8A 2013-11-14 2013-11-14 基于环境参数的服务器集群自动保护系统 Pending CN103760838A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310573173.8A CN103760838A (zh) 2013-11-14 2013-11-14 基于环境参数的服务器集群自动保护系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310573173.8A CN103760838A (zh) 2013-11-14 2013-11-14 基于环境参数的服务器集群自动保护系统

Publications (1)

Publication Number Publication Date
CN103760838A true CN103760838A (zh) 2014-04-30

Family

ID=50528093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310573173.8A Pending CN103760838A (zh) 2013-11-14 2013-11-14 基于环境参数的服务器集群自动保护系统

Country Status (1)

Country Link
CN (1) CN103760838A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107272507A (zh) * 2017-07-27 2017-10-20 郑州云海信息技术有限公司 一种恒温恒湿柜与服务器电源联动控制的装置及方法
CN108365975A (zh) * 2018-01-23 2018-08-03 浙江中新电力发展集团有限公司萧山科技分公司 基于云计算的智能配网系统
CN110007632A (zh) * 2019-04-26 2019-07-12 武汉汉镇既济电力设备有限公司 一种基于断路器的电路控制方法
WO2020244403A1 (zh) * 2019-06-06 2020-12-10 上海霖罕信息科技有限公司 一种适用于智能冷柜的控制系统及其控制方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100675737B1 (ko) * 2005-08-22 2007-01-30 한국지역난방공사 무선통신망을 이용하여 열배관의 누수를 원격으로 감시하는열배관 감시시스템
CN203025550U (zh) * 2013-01-17 2013-06-26 山东华兴网络科技有限公司 一种用于机房的监控系统
CN203070086U (zh) * 2013-03-01 2013-07-17 黑龙江民族职业学院 用于学校机房的无线设备智能监控系统
CN203133573U (zh) * 2012-11-01 2013-08-14 曲阜师范大学 机房远程智能监控系统
CN203193656U (zh) * 2013-04-22 2013-09-11 成都勤智数码科技股份有限公司 机房能耗监控系统的巡检终端
CN203232309U (zh) * 2013-04-27 2013-10-09 刘慧� 一种校内机房环境监测系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100675737B1 (ko) * 2005-08-22 2007-01-30 한국지역난방공사 무선통신망을 이용하여 열배관의 누수를 원격으로 감시하는열배관 감시시스템
CN203133573U (zh) * 2012-11-01 2013-08-14 曲阜师范大学 机房远程智能监控系统
CN203025550U (zh) * 2013-01-17 2013-06-26 山东华兴网络科技有限公司 一种用于机房的监控系统
CN203070086U (zh) * 2013-03-01 2013-07-17 黑龙江民族职业学院 用于学校机房的无线设备智能监控系统
CN203193656U (zh) * 2013-04-22 2013-09-11 成都勤智数码科技股份有限公司 机房能耗监控系统的巡检终端
CN203232309U (zh) * 2013-04-27 2013-10-09 刘慧� 一种校内机房环境监测系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107272507A (zh) * 2017-07-27 2017-10-20 郑州云海信息技术有限公司 一种恒温恒湿柜与服务器电源联动控制的装置及方法
CN107272507B (zh) * 2017-07-27 2020-06-19 苏州浪潮智能科技有限公司 一种恒温恒湿柜与服务器电源联动控制的装置及方法
CN108365975A (zh) * 2018-01-23 2018-08-03 浙江中新电力发展集团有限公司萧山科技分公司 基于云计算的智能配网系统
CN108365975B (zh) * 2018-01-23 2019-08-16 浙江中新电力工程建设有限公司自动化分公司 基于云计算的智能配网系统
CN110007632A (zh) * 2019-04-26 2019-07-12 武汉汉镇既济电力设备有限公司 一种基于断路器的电路控制方法
WO2020244403A1 (zh) * 2019-06-06 2020-12-10 上海霖罕信息科技有限公司 一种适用于智能冷柜的控制系统及其控制方法

Similar Documents

Publication Publication Date Title
CN204178533U (zh) 远程智能监测仪
CN103760838A (zh) 基于环境参数的服务器集群自动保护系统
CN108332060B (zh) 一种管道漏水智能监控系统
CN107044714A (zh) 一种机房双水冷设备节能控制系统和方法
CN103700235A (zh) 一种用电信息采集故障检测系统及其远程通道检测方法
CN203455690U (zh) 智能化变压器油压力在线监测装置
CN203800700U (zh) 配电网监测系统
CN101145681A (zh) 矿用多功能智能综合继电器保护装置
CN204669406U (zh) 一种ups智能监控系统
CN104753172A (zh) 一种基于多种无线通信的电力开关控制器
CN203416050U (zh) 变电室低压供电远程实时监控装置
CN203588444U (zh) 一种用电信息采集故障检测系统
CN205882851U (zh) 一种带故障录波的配电网故障指示器
CN204906004U (zh) 一种网络分层分布式的智能区域电网
CN107945496A (zh) 一种基于智能电表的数据采集监控系统
CN201656457U (zh) 配电线路故障检测控制系统
CN204089348U (zh) 一种配电室远程在线智能安全运维系统
CN203232270U (zh) 一种变电站电能量采集终端自动重启系统
CN202221923U (zh) 多路开关监测单元
CN203445507U (zh) 有刷发电机机组一体化智能控制屏
CN106679714A (zh) 基站电源监控系统
CN206282267U (zh) 一种计算机故障报警系统
Liu et al. Research on Intelligent Monitoring and Early Warning of Electric Power Safety Based on Artificial Intelligence Technology
CN201426048Y (zh) 一种用于给视频监控设备提供不间断电源的装置
CN205155328U (zh) 一种管道机械阀门开关监测系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140430