CN204731725U - 一种集群掉电自检自保护系统 - Google Patents

一种集群掉电自检自保护系统 Download PDF

Info

Publication number
CN204731725U
CN204731725U CN201520521386.0U CN201520521386U CN204731725U CN 204731725 U CN204731725 U CN 204731725U CN 201520521386 U CN201520521386 U CN 201520521386U CN 204731725 U CN204731725 U CN 204731725U
Authority
CN
China
Prior art keywords
cluster
power
self
protection subsystem
inspection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201520521386.0U
Other languages
English (en)
Inventor
李俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201520521386.0U priority Critical patent/CN204731725U/zh
Application granted granted Critical
Publication of CN204731725U publication Critical patent/CN204731725U/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Power Sources (AREA)

Abstract

本实用新型公开了一种集群掉电自检自保护系统,属于计算机集群技术领域;包括安装linux操作系统的集群服务器,UPS电源,所述的集群服务器与UPS电源相连,还通过网络通路连接一个外置机;UPS电源与外置机连接到相同的外部供电电源;本实用新型可以监控集群掉电情况,做到满足掉电情况时,系统便会依步骤执行集群进行下电的操作命令,实现整个过程中所需成本低廉,易于操作,效果明显,适合推广。

Description

一种集群掉电自检自保护系统
技术领域
本实用新型公开了一种掉电自检自保护系统,属于计算机集群技术领域,具体地说是一种集群掉电自检自保护系统。
背景技术
一般高性能集群里采用适量和相应规模的服务器作为其硬件架构,在硬件基础上多搭建linux操作系统平台,再在平台上按需安装各种类型的编译及应用软件来构成整个高性能计算的主体。集群有着高速交换网络,对内用于数据传输和管理,对外有着登陆提交的作用。整个集群由于其庞大的系统功耗量大,因此高强度耗电和高负载成为其一大特点,这就要求集群的供电设施完备。然而总会出现按需进行适当停电的情况,更有时会出现无通知和突发性断电,此时若当集群处于高速运转下,突然掉电造成的损失就难以估量,轻则损失当时计算数据,及毁坏文件系统;重则损坏集群硬件基础条件,甚至因损坏磁盘空间致使重要数据难以保留。本实用新型提供一种掉电自检自保护系统,利用现有的UPS智能环境并在系统集群外部增设供电环境的外部监控设备,就可以监控集群掉电情况,做到满足掉电情况时,系统便会依步骤执行集群进行下电的操作命令,实现整个过程中所需成本低廉,易于操作,效果明显,适合推广。
发明内容
本实用新型针对出现断电情况时,集群若处于高速运转下,会损失数据,及毁坏系统;损坏集群硬件基础条件,损坏磁盘空间致使重要数据难以保留等问题,提供一种集群掉电自检自保护系统,可以监控集群掉电情况,做到满足掉电情况时,系统便会依步骤执行集群进行下电的操作命令,实现整个过程中所需成本低廉,易于操作,效果明显,适合推广。
本实用新型所采用的技术方案为:
一种集群掉电自检自保护系统,包括安装linux操作系统的集群服务器,UPS电源,所述的集群服务器与UPS电源相连,还通过网络通路连接一个外置机;UPS电源与外置机连接到相同的外部供电电源,所述的集群服务器通过内部网络交换机与外置机配置同网段而形成的网络通路相连。
所述的UPS电源为在线式UPS电源,至少为双变换结构,经过两次变换后再供给集群服务器电源。
所述的集群服务器至少有2台。
本实用新型的有益效果为:本实用新型提供一种掉电自检自保护系统,利用现有的UPS智能环境并在系统集群外部增设供电环境的外部监控设备,就可以监控集群掉电情况,做到满足掉电情况时,系统便会依步骤执行集群进行下电的操作命令,实现整个过程中所需成本低廉,易于操作,效果明显,适合推广。
附图说明
图1本实用新型的结构连接示意图。
具体实施方式
下面参照附图所示,通过具体实施方式对本实用新型进一步说明:
一种集群掉电自检自保护系统,包括50台安装linux操作系统的集群服务器,在线式UPS电源,为双变换结构,经过两次变换后再供给集群服务器电源;集群主节点服务器与UPS电源相连,集群服务器通过内部网络交换机与外置机配置同网段而形成的网络通路相连;UPS电源与外置机连接到相同的外部供电电源,UPS电源从外部公共环境入电,向整个集群供电。
集群内的所有节点装linux操作系统,管理节点linux系统下自带crontab定时执行模块功能可自动按时执行检测脚本,可设置为每20分钟检测一次执行相应脚本,时间可根据需要进行适当调节。该脚本用于ping置于外部的外置机,外置机可以是pc机或者服务器,ping成功即证明外部环境有电;若不能ping通,同时排除部件自然损坏,自然损坏情况微乎其微,说明外部环境已掉电,此时继续执行集群关机脚本。关机脚本应根据当前集群的不同部署情况进行不同的编写,通常可串行或者并行关闭所有计算节点,在关闭之前也可以先向所有使用用户发送邮件告知系统下电,然后关闭所有运行作业,再进行关机操作。
安装部署完成后,可先行测试。在外部装置加电状态下,观察集群反应,一段时间后将外部装置断电,再次观察集群反应以确保整个装置能有效运行。

Claims (3)

1.一种集群掉电自检自保护系统,包括安装linux操作系统的集群服务器,UPS电源,其特征是所述的集群服务器与UPS电源相连,还通过网络通路连接一个外置机;UPS电源与外置机连接到相同的外部供电电源,所述的集群服务器通过内部网络交换机与外置机配置同网段而形成的网络通路相连。
2.根据权利要求1所述的一种集群掉电自检自保护系统,其特征是所述的UPS电源为在线式UPS电源,至少为双变换结构,经过两次变换后再供给集群服务器电源。
3.根据权利要求2所述的一种集群掉电自检自保护系统,其特征是所述的集群服务器至少有2台。
CN201520521386.0U 2015-07-17 2015-07-17 一种集群掉电自检自保护系统 Expired - Fee Related CN204731725U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201520521386.0U CN204731725U (zh) 2015-07-17 2015-07-17 一种集群掉电自检自保护系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201520521386.0U CN204731725U (zh) 2015-07-17 2015-07-17 一种集群掉电自检自保护系统

Publications (1)

Publication Number Publication Date
CN204731725U true CN204731725U (zh) 2015-10-28

Family

ID=54390061

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201520521386.0U Expired - Fee Related CN204731725U (zh) 2015-07-17 2015-07-17 一种集群掉电自检自保护系统

Country Status (1)

Country Link
CN (1) CN204731725U (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107015622A (zh) * 2017-04-20 2017-08-04 西北大学 一种spark集群断电自保护及来电自启动的方法
CN109962796A (zh) * 2017-12-22 2019-07-02 北京世纪东方通讯设备有限公司 应用于铁路视频监控系统的交换机掉电告警方法及设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107015622A (zh) * 2017-04-20 2017-08-04 西北大学 一种spark集群断电自保护及来电自启动的方法
CN107015622B (zh) * 2017-04-20 2023-05-26 西北大学 一种spark集群断电自保护及来电自启动的方法
CN109962796A (zh) * 2017-12-22 2019-07-02 北京世纪东方通讯设备有限公司 应用于铁路视频监控系统的交换机掉电告警方法及设备
CN109962796B (zh) * 2017-12-22 2022-05-03 北京世纪东方智汇科技股份有限公司 应用于铁路视频监控系统的交换机掉电告警方法及设备

Similar Documents

Publication Publication Date Title
TWI540423B (zh) 電源分配系統
US10317985B2 (en) Shutdown of computing devices
CN102624546B (zh) 功耗封顶的控制方法、设备和系统
CN104049709A (zh) 服务器系统的电源管理方法
CN104375908A (zh) 一种侦测服务器漏电的方法及设备
CN104216497A (zh) 电源故障侦测装置及方法
US10528113B2 (en) Low latency computer system power reduction
CN103455880A (zh) 一种基于虚拟化技术的电网调度自动化系统
CN204731725U (zh) 一种集群掉电自检自保护系统
CN103605596A (zh) 用于atca刀片上的fpga芯片与bmc芯片协同电源管理系统和方法
CN203241986U (zh) 一种国产服务器的远程控制装置
CN103984394A (zh) 一种高密度、节能刀片服务器系统
US20190324515A1 (en) Architecture for improving reliability of mult-server system
TWI517033B (zh) 用於降低功耗之轉換方法與其運算裝置
CN105553766A (zh) 异常节点动态追踪集群节点状态的监测方法
CN105183598A (zh) 一种云计算生态系统中服务器整机的可靠性测试方法
CN102541248A (zh) 一种云计算行业集中动态调整供电效率的方法
CN107731260B (zh) 一种ssd的供电方法、系统及ssd
CN110677288A (zh) 一种通用于多场景部署的边缘计算系统及方法
CN103995758A (zh) 一种主板故障信息的延时显示方法
CN105068641A (zh) 一种计算机系统待机/唤醒功能实现方法
CN102722232A (zh) 一种atca刀片上电的控制系统和方法
CN105511980A (zh) 一种高端容错服务器的电源故障记录方法
CN102325040A (zh) 一种基于MicroTCA系统的电源管理方法
CN111858453A (zh) 一种gpu板

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20151028

Termination date: 20170717

CF01 Termination of patent right due to non-payment of annual fee