CN102902612A - 一种适用于龙芯刀片服务器的管理系统 - Google Patents

一种适用于龙芯刀片服务器的管理系统 Download PDF

Info

Publication number
CN102902612A
CN102902612A CN2012103501474A CN201210350147A CN102902612A CN 102902612 A CN102902612 A CN 102902612A CN 2012103501474 A CN2012103501474 A CN 2012103501474A CN 201210350147 A CN201210350147 A CN 201210350147A CN 102902612 A CN102902612 A CN 102902612A
Authority
CN
China
Prior art keywords
godson
blade
management system
bus
calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012103501474A
Other languages
English (en)
Inventor
郑臣明
柳胜杰
王晖
邵宗有
沙超群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dawning Information Industry Co Ltd
Original Assignee
Dawning Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Co Ltd filed Critical Dawning Information Industry Co Ltd
Priority to CN2012103501474A priority Critical patent/CN102902612A/zh
Publication of CN102902612A publication Critical patent/CN102902612A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种适用于龙芯刀片服务器的管理系统,包括在位检测电路、RS485监控网络和千兆以太网监控网络;管理模块通过所述在位检测电路识别计算刀片,并通过所述RS485监控网络、千兆以太网络与龙芯计算刀片连接,实现对龙芯计算刀片在关机和开机状态下的监控;此管理系统能够读取BIOS信息,实现温度、电压、风扇转速的监控,收集和控制龙芯计算刀片运行状态,并实现计算刀片的开关机和重启功能。此管理系统并能通过所述千兆以太网监控网络实现远程监控功能。该管理系统简单、成本低,不仅适用于龙芯刀片服务器,也适用于X86刀片服务器。

Description

一种适用于龙芯刀片服务器的管理系统
技术领域
本发明属于计算机技术领域,具体涉及一种适用于龙芯刀片服务器的管理系统。
背景技术
目前刀片服务器管理系统常用的方式是在刀片服务器的计算刀片模块和管理模块上各自放置一个基板管理控制器BMC(baseboard management controller)芯片(例如Aspeed公司的AST2300芯片)来实现刀片服务器的管理功能,如图1所示。BMC采集计算刀片的状态信息通过百兆或者千兆网络进行传输和交换,最后连接到一个电脑终端来进行显示,实现监视功能。电脑终端通过分析监控的数据作出判断,通过以太网络把命令传输给BMC,通过BMC控制计算刀片的执行动作,实现对计算刀片的控制功能。
国产龙芯CPU诞生的时间短,用此所研发的龙芯刀片服务器诞生的时间更短,只有两三年的时间,配套的管理系统根本没有或者十分不成熟。把目前现有BMC管理系统移植到龙芯刀片服务器上存在巨大的困难:
Figure BDA00002156727600011
龙芯CPU是MIPS架构,目前现有BMC管理系统是基于X86架构开发的,如果移植到龙芯CPU系统上,存在巨大的困难,一是需要投入大量的人力物力,二是需要相关公司开发BMC管理系统源代码;
Figure BDA00002156727600012
BMC 芯片的价格比较贵;
Figure BDA00002156727600013
BMC的配套程序代码被控制在极少数的厂商手中,无论开发还是销售产品都需要付出昂贵的知识产权费用。如果用户采用购买源代码的开发方式,需要支持购买源代码的费用。
发明内容
为了克服上述现有技术的不足,本发明提供一种适用于龙芯刀片服务器的管理系统,该管理系统简单、成本低,不仅适用于龙芯刀片服务器,也适用于X86刀片服务器。
为了实现上述发明目的,本发明采取如下技术方案:
提供一种适用于龙芯刀片服务器的管理系统,所述系统包括在位检测电路、RS485监控网络和千兆以太网监控网络;管理模块通过所述在位检测电路识别计算刀片,并通过所述RS485监控网络、千兆以太网络与龙芯计算刀片连接,对龙芯计算刀片在关机和开机状态下的监控;此管理系统能够读取BIOS信息,实现温度、电压、风扇转速的监控,收集和控制龙芯计算刀片运行状态,并实现计算刀片的开关机和重启功能。此管理系统并能通过所述千兆以太网监控网络实现远程监控功能。
所述在位检测电路在所述计算刀片上设有在位检测信号线,所述在位检测信号线经过中板连接IO Port芯片,并通过SMBUS总线连接管理模块上的CPU1,管理模块通过在位检测信号线的高低判断计算刀片是否存在。
所述RS485监控网络包括计算刀片RS485监控网络、中板RS485监控网络和管理模块RS485监控网络。
所述计算刀片上设有管理子卡,所述管理子卡以插卡的方式插在计算刀片的主板上,或采用LOM方式设计在插在计算刀片的主板上。
所述计算刀片包括龙芯3A、龙芯3B和龙芯3C。
所述管理子卡上设有单片机,所述单片机通过IIC总线分别连接南桥上的IIC接口和计算刀片主板上的监控芯片,并连接放置在管理子卡上的EEPROM芯片,单片机的GPIO信号线与南桥的GPIO针脚相连;所述单片机的RS232bus通过RS485转换芯片转换成RS485总线连接中板上的RS485总线,组成共享总线(share bus)拓扑。
所述南桥包括AMD chipset SP5100、SP5100R、SP5100RS、SB700、SB710、SB750和SB600,与所述南桥对应的北桥包括AMD chipset SR5690、SR5670、SR5650、RS780、RS780C、RS780D、RS780E、RS780G、RS780M、RS780MC、RX781、RS785G和RD790。
所述中板RS485监控网络中,中板将来自龙芯计算刀片的RS485总线和来自管理模块的RS485总线组成共享总线share bus形式。
所述管理模块RS485监控网络中,管理模块CPU1设有RS232接口,通过RS485转换芯片将RS232总线转换成RS485总线,与中板的RS485总线连接组成共享总线形式。
所述管理模块上的CPU1、控制终端和每个龙芯计算刀片上的千兆网卡分别通过所述千兆以太网监控网络与管理模块上的以太网交换芯片连接,实现管理模块对每个龙芯计算刀片的监控,并实现控制终端对龙芯计算刀片的远程监控。
与现有技术相比,本发明的有益效果在于:本发明采用简单且成本低廉的方式实现目前刀片服务器中现行的BMC管理方式,实现简单,使用的芯片都是极其普通的IC,成本低廉,解决了国产龙芯刀片服务器的管理问题,且没有源代码授权的问题,用户可以自己编写代码。
附图说明
图1是现有技术中刀片服务器BMC管理系统示意图;
图2是适用于龙芯刀片服务器的管理系统结构图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
本发明实现对龙芯刀片服务器的监控管理,实现的功能如下:
●实现龙芯计算刀片的在位检测;
●实现对龙芯计算刀片BIOS信息的读取,收集BIOS启动过程中状态信息;
●实现对龙芯计算刀片温度、电压的监视,实现对风扇转速的监视和控制;
●实现对龙芯计算刀片开关机和重启;
●实现对龙芯计算刀片OS运行情况下状态信息的监控;
●实现日志记录和报警;
●实现远程监控功能。
如图2,提供一种适用于龙芯刀片服务器的管理系统,所述系统包括在位检测电路、RS485监控网络和千兆以太网监控网络;管理模块通过所述在位检测电路识别计算刀片,并通过所述RS485监控网络、千兆以太网络与龙芯计算刀片连接,实现对龙芯计算刀片在关机和开机状态下的监控;此管理系统能够读取BIOS信息,实现温度、电压、风扇转速的监控,收集和控制龙芯计算刀片运行状态,并实现计算刀片的开关机和重启功能。此管理系统并能通过所述千兆以太网监控网络实现远程监控功能。
所述在位检测电路在所述计算刀片上设有在位检测信号线,所述在位检测信号线经过中板连接IO Port芯片(302),并通过SMBUS总线连接管理模块上的CPU1(306),管理模块通过在位检测信号线的高低判断计算刀片是否存在。
所述RS485监控网络包括计算刀片RS485监控网络、中板RS485监控网络和管理模块RS485监控网络。
在龙芯计算刀片上有管理子卡,管理子卡可以设计成插卡的方式插在主板上,也可以采用LOM(Located On Motherboard)方式直接设计在主板上。
每个龙芯计算刀片的设计都是一样的,一个刀片服务器系统中可以有多个计算刀片,为方便阐述,只以错误!未找到引用源。中管理子卡(102)为例来介绍。
管理子卡(102)上有单片机(104),有两个功能,一个功能是监控龙芯计算刀片,另一个功能在单片机和管理模块的CPU1(306)之间接收和发送信息。
单片机的RS232总线(107)连接SuperIO(117)芯片的RS232接口,实现两者串口的通讯,单片机从串口来收集龙芯计算刀片的信息。
单片机通过IIC总线(109)连接南桥(111)上的IIC接口、主板上的监控芯片(122),并连接放置在管理子卡上的EEPROM 芯片(110)。单片机的GPIO信号线(108)与南桥的GPIO针脚相连,作为仲裁所用。工作原理是在龙芯计算刀片BIOS启动时,南桥把信号线(108)拉低,向单片机(104)表明IIC总线正被南桥占用,单片机在此段时间内不要对EEPROM进行读写操作,于是南桥通过IIC总线(109)把BIOS信息写入到EEPROM中,写入完毕后就把信号线(108)拉高。当单片机检测信号线(108)变高后,就可以通过IIC总线读取EEPROM里的BIOS信息。
在龙芯计算刀片上的监控芯片(122)连接主板的温度传感器、电压传感器、风扇监控电路和开关机、重启电路。单片机通过IIC总线对监控芯片(122)进行控制,可以读取主板上的温度、电压信息,并读取和控制所连风扇的转速,并实现对龙芯计算刀片的开关机和重启。
单片机把通过串口和IIC总线所读取的监控信息存储在EEPROM(110)里,等待管理模块(301)的命令随时被读取发给管理模块。
单片机的另一RS232bus(105)通RS485转换芯片(106)转换为RS485总线(121)连接中板(201)上的RS485总线,组成share bus(共享总线)拓扑。单片机就通过此链路在和管理模块的CPU1(306)之间接收和发送信息。
中板RS485监控网络,把来自每个龙芯计算刀片的RS485总线和来自管理模块的RS485总线组成share bus(共享总线)形式。
管理模块RS485监控网络,在管理模块(301)上的CPU1(306)有一个RS232接口,并通过RS485转换芯片(303)把RS232总线(305)转换成RS485总线(121),与中板(201)的RS485总线(121)连接在一起组成share bus(共享总线)形式。
管理模块利用在位检测信号唯一识别每个龙芯计算刀片,通过RS485总线和某个计算刀片建立连接,主动对此龙芯刀片发出各种不同的命令,读取各种状态信息,并发出对应的控制命令。
千兆以太网监控网络的构成是从每个龙芯计算刀片的网卡引出一路以太网络经过中板连接管理模块上的以太网交换芯片(307);CPU1(306)和控制终端(401)也通过以太网络和以太网交换芯片(307)相连,实现远程监控功能。
当龙芯计算刀片OS运行起来后,以太网络就能正常工作了,控制终端通过以太网络可以访问每个龙芯计算刀片,能够收集每个计算刀片运行状态信息,并能实现对每个计算刀片的控制。控制终端也可以通过以太网访问CPU1收集的状态信息,实现日志记录,通过分析日志记录得出系统异常运行状态,实现对用户的报警,并能够给CPU1发送控制命令,实现对龙芯计算刀片开关机和风扇转速等功能的控制。
所述计算刀片包括龙芯3A、龙芯3B和龙芯3C。
所述南桥包括AMD chipset SP5100、SP5100R、SP5100RS、SB700、SB710、SB750和SB600,与所述南桥对应的北桥包括AMD chipset SR5690、SR5670、SR5650、RS780、RS780C、RS780D、RS780E、RS780G、RS780M、RS780MC、RX781、RS785G和RD790。
本发明中,采用的单片机(104)为Atmel公司的AT89S52,RS485转换芯片(106)和(303)为SIPEX公司SP3072E,CPU1(306)为NXP公司的LPC2132,以太网交换芯片(307)为Broadcom公司的BCM53115S,IO Port 芯片(302)为NXP公司的PCA9555。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种适用于龙芯刀片服务器的管理系统,其特征在于:所述系统包括在位检测电路、RS485监控网络和千兆以太网监控网络;管理模块通过所述在位检测电路识别计算刀片,并通过所述RS485监控网络、千兆以太网络与龙芯计算刀片连接,对龙芯计算刀片在关机和开机状态下的监控。
2.根据权利要求1所述的适用于龙芯刀片服务器的管理系统,其特征在于:所述在位检测电路在所述计算刀片上设有在位检测信号线,所述在位检测信号线经过中板连接IO Port芯片,并通过SMBUS总线连接管理模块上的CPU1,管理模块通过在位检测信号线的高低判断计算刀片是否存在。
3.根据权利要求1所述的适用于龙芯刀片服务器的管理系统,其特征在于:所述RS485监控网络包括计算刀片RS485监控网络、中板RS485监控网络和管理模块RS485监控网络。
4.根据权利要求1-3任一所述的适用于龙芯刀片服务器的管理系统,其特征在于:所述计算刀片上设有管理子卡,所述管理子卡以插卡的方式插在计算刀片的主板上,或采用LOM方式设计在插在计算刀片的主板上。
5.根据权利要求4所述的适用于龙芯刀片服务器的管理系统,其特征在于:所述计算刀片包括龙芯3A、龙芯3B和龙芯3C。
6.根据权利要求4所述的适用于龙芯刀片服务器的管理系统,其特征在于:所述管理子卡上设有单片机,所述单片机通过IIC总线分别连接南桥上的IIC接口和计算刀片主板上的监控芯片,并连接放置在管理子卡上的EEPROM 芯片,单片机的GPIO信号线与南桥的GPIO针脚相连;所述单片机的RS232bus通过RS485转换芯片转换成RS485总线连接中板上的RS485总线,组成共享总线拓扑。
7.根据权利要求6所述的适用于龙芯刀片服务器的管理系统,其特征在于:所述南桥包括AMD chipset SP5100、SP5100R、SP5100RS、SB700、SB710、SB750和SB600,与所述南桥对应的北桥包括AMD chipset SR5690、SR5670、SR5650、RS780、RS780C、RS780D、RS780E、RS780G、RS780M、RS780MC、RX781、RS785G和RD790。
8.根据权利要求3所述的适用于龙芯刀片服务器的管理系统,其特征在于:所述中板RS485监控网络中,中板将来自龙芯计算刀片的RS485总线和来自管理模块的RS485总线组成共享总线形式。
9.根据权利要求3所述的适用于龙芯刀片服务器的管理系统,其特征在于:所述管理模块RS485监控网络中,管理模块CPU1设有RS232接口,通过RS485转换芯片将RS232总线转换成RS485总线,与中板的RS485总线连接组成共享总线形式。
10.根据权利要求1所述的适用于龙芯刀片服务器的管理系统,其特征在于:所述管理模块上的CPU1、控制终端和每个龙芯计算刀片上的千兆网卡分别通过所述千兆以太网监控网络与管理模块上的以太网交换芯片连接,实现管理模块对每个龙芯计算刀片的监控,并实现控制终端对龙芯计算刀片的远程监控。
CN2012103501474A 2012-09-18 2012-09-18 一种适用于龙芯刀片服务器的管理系统 Pending CN102902612A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012103501474A CN102902612A (zh) 2012-09-18 2012-09-18 一种适用于龙芯刀片服务器的管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012103501474A CN102902612A (zh) 2012-09-18 2012-09-18 一种适用于龙芯刀片服务器的管理系统

Publications (1)

Publication Number Publication Date
CN102902612A true CN102902612A (zh) 2013-01-30

Family

ID=47574858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012103501474A Pending CN102902612A (zh) 2012-09-18 2012-09-18 一种适用于龙芯刀片服务器的管理系统

Country Status (1)

Country Link
CN (1) CN102902612A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455395A (zh) * 2013-08-08 2013-12-18 华为技术有限公司 一种硬盘故障的检测方法及装置
CN104049692A (zh) * 2014-06-27 2014-09-17 浪潮(北京)电子信息产业有限公司 一种刀片服务器
CN104202203A (zh) * 2014-09-26 2014-12-10 浪潮电子信息产业股份有限公司 一种服务器主板的远程管理方法
CN104501877A (zh) * 2015-01-22 2015-04-08 浪潮(北京)电子信息产业有限公司 一种数据采集方法和装置
CN104572397A (zh) * 2015-01-19 2015-04-29 浪潮集团有限公司 一种服务器状态实时监控实现方式
CN104754019A (zh) * 2013-12-31 2015-07-01 研祥智能科技股份有限公司 工业服务器监控系统和方法
CN110309031A (zh) * 2019-07-04 2019-10-08 深圳市瑞驰信息技术有限公司 一种负载均衡微计算集群架构
CN112000613A (zh) * 2020-08-28 2020-11-27 山东超越数控电子股份有限公司 一种多单元服务器管理单元及多单元服务器
CN112099589A (zh) * 2020-09-28 2020-12-18 山东云海国创云计算装备产业创新中心有限公司 一种多功能拓展管理集成卡
CN113849375A (zh) * 2021-09-29 2021-12-28 超越科技股份有限公司 一种用于计算机的远程管理方法、系统及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1508713A (zh) * 2002-12-18 2004-06-30 广达电脑股份有限公司 具有硬件备用结构的刀片型服务器管理系统
US20070217910A1 (en) * 2006-03-17 2007-09-20 Inventec Corporation Fan fastening structure
CN200983158Y (zh) * 2006-09-04 2007-11-28 曙光信息产业(北京)有限公司 一种计算机刀片服务器用刀片管理卡
CN101212345A (zh) * 2006-12-31 2008-07-02 联想(北京)有限公司 一种刀片服务器管理系统
CN101345631A (zh) * 2008-08-14 2009-01-14 中兴通讯股份有限公司 刀片服务器系统交换平面的管理方法和系统
CN102103556A (zh) * 2011-02-25 2011-06-22 曙光信息产业(北京)有限公司 刀片服务器的管理系统中的通信建立方法
CN202102335U (zh) * 2011-05-16 2012-01-04 曙光信息产业股份有限公司 一种基于龙芯3a cpu的刀片服务器

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1508713A (zh) * 2002-12-18 2004-06-30 广达电脑股份有限公司 具有硬件备用结构的刀片型服务器管理系统
US20070217910A1 (en) * 2006-03-17 2007-09-20 Inventec Corporation Fan fastening structure
CN200983158Y (zh) * 2006-09-04 2007-11-28 曙光信息产业(北京)有限公司 一种计算机刀片服务器用刀片管理卡
CN101212345A (zh) * 2006-12-31 2008-07-02 联想(北京)有限公司 一种刀片服务器管理系统
CN101345631A (zh) * 2008-08-14 2009-01-14 中兴通讯股份有限公司 刀片服务器系统交换平面的管理方法和系统
CN102103556A (zh) * 2011-02-25 2011-06-22 曙光信息产业(北京)有限公司 刀片服务器的管理系统中的通信建立方法
CN202102335U (zh) * 2011-05-16 2012-01-04 曙光信息产业股份有限公司 一种基于龙芯3a cpu的刀片服务器

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455395A (zh) * 2013-08-08 2013-12-18 华为技术有限公司 一种硬盘故障的检测方法及装置
CN103455395B (zh) * 2013-08-08 2016-12-07 华为技术有限公司 一种硬盘故障的检测方法及装置
CN104754019A (zh) * 2013-12-31 2015-07-01 研祥智能科技股份有限公司 工业服务器监控系统和方法
CN104049692A (zh) * 2014-06-27 2014-09-17 浪潮(北京)电子信息产业有限公司 一种刀片服务器
CN104202203A (zh) * 2014-09-26 2014-12-10 浪潮电子信息产业股份有限公司 一种服务器主板的远程管理方法
CN104572397A (zh) * 2015-01-19 2015-04-29 浪潮集团有限公司 一种服务器状态实时监控实现方式
CN104501877A (zh) * 2015-01-22 2015-04-08 浪潮(北京)电子信息产业有限公司 一种数据采集方法和装置
CN110309031A (zh) * 2019-07-04 2019-10-08 深圳市瑞驰信息技术有限公司 一种负载均衡微计算集群架构
CN112000613A (zh) * 2020-08-28 2020-11-27 山东超越数控电子股份有限公司 一种多单元服务器管理单元及多单元服务器
CN112099589A (zh) * 2020-09-28 2020-12-18 山东云海国创云计算装备产业创新中心有限公司 一种多功能拓展管理集成卡
CN113849375A (zh) * 2021-09-29 2021-12-28 超越科技股份有限公司 一种用于计算机的远程管理方法、系统及介质

Similar Documents

Publication Publication Date Title
CN102902612A (zh) 一种适用于龙芯刀片服务器的管理系统
CN105548777B (zh) 基于双cpu并行录波存储的故障录波装置
CN106970866A (zh) 一种磁盘监控系统及方法
CN102693162A (zh) 基于共享内存和核间中断的多核平台上多个虚拟机之间进程通信方法
CN105302248A (zh) 芯片组以及服务器系统
CN106708707A (zh) 一种基于服务器架构的服务器监控系统
CN104838373A (zh) 基于单个微控制器的多个计算节点管理
CN103200199A (zh) 一种带外数据采集系统
CN111880487A (zh) 一种产线边缘终端及产线管理系统
CN102983989B (zh) 一种服务器虚拟地址的迁移方法、装置和设备
CN205450908U (zh) 一种基于龙芯3a 2000的普通型机架式服务器
CN206542427U (zh) 一种数据机房监控设备及系统
CN117992311B (zh) 一种服务器及其硬盘监控方法、装置、设备和介质
CN207516990U (zh) 一种atca机箱控制电路
CN110245048A (zh) 一种机箱智能管理系统和管理方法
CN202771305U (zh) 基于龙芯cpu和北桥芯片sr5650的机架服务器
CN114721593B (zh) 存储设备信息收集方法、系统及电子设备
CN202153320U (zh) 一种基于龙芯3a cpu的机架服务器
CN205619971U (zh) 基于分布式结构的双冗余主机烤房温湿度远程监测系统
CN202771308U (zh) 基于龙芯cpu和北桥芯片sr5670的机架服务器
CN202771301U (zh) 基于龙芯cpu和北桥芯片sr5650的刀片服务器
CN202102335U (zh) 一种基于龙芯3a cpu的刀片服务器
CN202838092U (zh) 基于龙芯cpu和北桥芯片sr5690的机架服务器
CN106056178A (zh) 一种基于lifi移动端的综合管理系统
CN201788391U (zh) 一种智能可编程控制器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130130