CN110677509A - 一种适用于高性能计算机的地址自动配置系统 - Google Patents

一种适用于高性能计算机的地址自动配置系统 Download PDF

Info

Publication number
CN110677509A
CN110677509A CN201910848709.XA CN201910848709A CN110677509A CN 110677509 A CN110677509 A CN 110677509A CN 201910848709 A CN201910848709 A CN 201910848709A CN 110677509 A CN110677509 A CN 110677509A
Authority
CN
China
Prior art keywords
bmc
address
management system
configuration file
performance computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910848709.XA
Other languages
English (en)
Other versions
CN110677509B (zh
Inventor
张祯
吴智
黄益明
张春林
韩小虎
建澜涛
郑生滨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Jiangnan Computing Technology Institute
Original Assignee
Wuxi Jiangnan Computing Technology Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Jiangnan Computing Technology Institute filed Critical Wuxi Jiangnan Computing Technology Institute
Priority to CN201910848709.XA priority Critical patent/CN110677509B/zh
Publication of CN110677509A publication Critical patent/CN110677509A/zh
Application granted granted Critical
Publication of CN110677509B publication Critical patent/CN110677509B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • H04L61/5007Internet protocol [IP] addresses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2101/00Indexing scheme associated with group H04L61/00
    • H04L2101/60Types of network addresses
    • H04L2101/618Details of network addresses
    • H04L2101/622Layer-2 addresses, e.g. medium access control [MAC] addresses

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Small-Scale Networks (AREA)

Abstract

本发明涉及网络设计与控制领域,具体涉及一种适用于高性能计算机的地址自动配置系统。本发明通过以下技术方案得以实现的:BMC管理系统,所述BMC管理系统包含编号配置模块和基于所述物理编号生成自身地址的地址生成模块,所述BMC管理系统基于自身位置生成下层BMC对应的地址配置文件;BMC系统,每个所述BMC系统均通过独立的物理通路与所述BMC管理系统连接,且获取对应的所述地址配置文件;计算节点,每个所述计算节点的CPU均有一条独立的维护通路与所述BMC系统连接。本发明的目的是提供一种适用于高性能计算机的地址自动配置系统,在让高性能计算机系统的节点和BMC均能实现MAC/IP的自动配置,减少人工维护成本,提高高性能计算机系统部署和维护效率。

Description

一种适用于高性能计算机的地址自动配置系统
技术领域
本发明涉及网络设计与控制领域,具体涉及一种适用于高性能计算机的地址自动配置系统。
背景技术
随着高性能计算机运算性能的不断提升,主机系统包含的节点数量剧增,因此以维护节点为主要任务的分布式维护系统的规模也在一起增加。目前在紧耦合高性能计算系统中,一般部署有数量极大的基板管理控制器(BMC),通过以太网连接起来。一部分高性能计算机中,运算节点本身也配备以太网接口。
以太网通信的前提是每个通信节点分配有MAC/IP地址。如果采用常规方式,在上机前给每个BMC和运算节点先通过预先设置的方式绑定一个固定MAC/IP地址,无疑需要极大的人工成本,且容易出错,当运算节点替换或移动位置时,会造成管理上的复杂和混乱。
在现有技术中,如公号号为201110047862.6的中国专利文件所公开的技术方案,使用了DHCP服务器,当有以太网节点接入时,自动响应其申请,自动分配IP地址,提升了网络分配效率。
然而,在高性能计算机中使用此方法有两个问题。问题一、通过DHCP服务器获取的IP地址是随机分配,不与通信节点的位置相关,在高性能计算机中,管理运算节点,定位故障,更换运算节点,都需要指定到具体的物理位置,因此不利于管理。问题二、以太网节点能申请到IP的前提是其已经有一个唯一的MAC地址,在研制高性能计算系统过程中,如果每个节点和BMC都先要手动配置一个唯一的MAC地址,也会带来巨大的工作量。
发明内容
本发明的目的是提供一种适用于高性能计算机的地址自动配置系统,在让高性能计算机系统的节点和BMC均能实现MAC/IP的自动配置,减少人工维护成本,提高高性能计算机系统部署和维护效率。
一种适用于高性能计算机的地址自动配置系统,包含:
BMC管理系统,所述BMC管理系统包含用于手动配置物理编号的编号配置模块和基于所述物理编号生成自身地址的地址生成模块,所述BMC管理系统基于自身位置生成下层BMC对应的地址配置文件;
BMC系统,每个所述BMC系统均通过独立的物理通路与所述BMC管理系统连接,且获取对应的所述地址配置文件;
计算节点,每个所述计算节点的CPU均有一条独立的维护通路与所述BMC系统连接;
所述BMC系统将每个所述计算节点对应的地址配置文件写入到对应节点。
作为本发明的优选,所述BMC管理系统中的所述编号配置模块为拨码开关,用户将所述拨码开关配置成实际物理位置的编号。
作为本发明的优选,所述BMC管理系统包含FPGA芯片,在所述FPGA芯片中设有用于与所述BMC系统通信的UART通信接口。
作为本发明的优选, 所述BMC管理系统包含串口服务程序,用于监听每个串口通路上的数据。
作为本发明的优选,当所述BMC启动后,会启动地址申请程序,通过串口向所述BMC管理系统发送获取地址请求,所述BMC管理系统在收到所述BMC发过来的所述获取地址请求后,将对应位置的地址配置文件写入到BMC端的指定配置文件中。
作为本发明的优选,所述BMC管理系统发送给所述BMC的所述地址配置文件中包含有校验数据,所述BMC通过所述校验数据来检查配置文件的正确性。
作为本发明的优选,所述BMC系统包含随机等待数生成模块,当所述BMC系统向所述BMC管理系统发送地址申请程序后无响应,则会生成随机的等待秒数来进行下一次申请。
作为本发明的优选,所述BMC系统与每个所述节点的CPU之间均有独立的JTAG通路。
作为本发明的优选,所述BMC系统将每个所述CPU的地址写入到给CPU的引导文件中,来完成CPU地址的配置。
综上所述,本发明具备如下有益效果:
1.实现了高性能计算机系统全机以太网通信节点MAC/IP地址自动配置。
2.所有的物理部件具有相同的硬件和软件,无需个性化设置,替换时也无需单独设置。
3.MAC/IP地址与实际物理位置对应,在管理时能很容易对应到实际物理单元。
4.MAC/IP配置基于配置文件方式,可以根据具体需求在线灵活调整映射规则。
5.利用了高性能计算机系统用树型分级管理架构,实现了高效并行配置。
附图说明
图1分级配置结构图;
图2为实施例一中的配置结构图;
图3为BMC获取MAC/IP软件流程图。
具体实施方式
以下结合附图对本发明作进一步详细说明。
本具体实施例仅仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本发明的权利要求范围内都受到专利法的保护。
实施例1,一种适用于高性能计算机的地址自动配置系统。如图1,本系统可看成三层结构。第一层,即最顶层为BMC管理系统。第二层,即中间层,为多个BMC,每个BMC均与BMC管理系统通信连接。第三层,即图中的底层,为多个节点,每个节点均有CPU,每一个BMC根据实际情况包含有不同数量的CPU。
如图2所示,在本实施例中,BMC管理系统包含嵌入式处理器、拨码开关和FPGA三部分。拨码开关是现有技术的成熟产品,此处不再赘述。当BMC管理系统部署到实际物理位置时,就配置拨码开关,且将拨码开关配置成物理位置的相应编号。
拨码开关连接至嵌入式处理器的GIPO引脚,当嵌入式处理器启动时,就直接读取引脚对应的点评即可获取到自身的物理位置信息。
在这之前,工程人员已经事先定义好映射规则,该映射规则可根据该物理位置信息生成MAC/IP地址数据,这就是该BMC管理系统自身的地址数据。
随后,BMC管理系统启动完成后,在应用层按照自身位置,生成下层BMC对应的MAC/IP配置文件,在这个配置文件中,就包含了每一个不同串口连接的BMC应该对应的地址信息。这就使得,该BMC管理系统下层的BMC对应的地址信息与其呈树状上层的BMC管理系统的地址信息,有上下级的对应逻辑关系。BMC管理系统中包含有FPGA芯片,在FPGA内对每一个下层BMC均设计UART通信接口,连接到每一个BMC。
如图2所示,中间层的GMC系统与上层的BMC管理系统通过UART连接。具体的数据配置和流程如图3所示。在上层的BMC管理系统常驻串口服务程序,起多个线程,每一个线程均来监听一个串口通路上的数据。
当BMC的运算单元插入到系统上,加电运行,BMC会自启动MAC/IP申请程序,通过串口向BMC管理系统上的串口服务程序发起获取MAC/IP请求。当BMC管理系统中的串口服务程序接收到某个BMC串口发来的请求,就将对应位置的MAC/IP配置文件写入到BMC端的指定配置文件中,BMC端的申请程序读取该文件,完成自身MAC/IP地址配置。
至此,BMC端的地址也自动配置完毕,这个过程去人工化,全程自动化分配,不仅分配IP地址,同样分配了MAC地址。此外,BMC端的地址由于是通过特定的串口向上层的BMC管理系统申请的,基于串口位置的分配,使得BMC端的MAC/IP地址与实际物理位置对应,在管理时能很容易对应到实际物理单元。
进一步的,在这个过程中为了提高可靠性,可加入校验设计。
具体的,可以在配置文件格式中包含校验数据。BMC端的申请程序在读取配置文件后,先依据此校验数据检查配置文件的正确性。如果发现配置文件不正确,可以多次发起申请。
此外,本案还有随机延时的设计。为了防止全机上电时,多个BMC同时向服务程序申请,造成服务端压力过大而响应不过来的情况,申请程序内置一个生成等待数函数。BMC端一旦发送请求却没有收到来自BMC管理系统的响应后,可以利用生成随机的等待秒数,这样多个BMC的下次请求时间即被打散,提高请求成功率。
诚如上文所述,当中层的各个BMC获取到自身MAC/IP后,也就知道了自身的物理位置。每个BMC对应多个CPU。BMC与每个CPU之间设计独立的JTAG通路。BMC对CPU进行系统引导时,计算出每个CPU对应的MAC/IP地址,写入到CPU的引导文件中,即可以完成运算CPU的MAC/IP自动配置。

Claims (9)

1.一种适用于高性能计算机的地址自动配置系统,其特征在于,包含: BMC管理系统,所述BMC管理系统包含用于手动配置物理编号的编号配置模块和基于所述物理编号生成自身地址的地址生成模块,所述BMC管理系统基于自身位置生成下层BMC对应的地址配置文件; BMC系统,每个所述BMC系统均通过独立的物理通路与所述BMC管理系统连接,且获取对应的所述地址配置文件; 计算节点,每个所述计算节点的CPU均有一条独立的维护通路与所述BMC系统连接; 所述BMC系统将每个所述计算节点对应的地址配置文件写入到对应节点。
2.根据权利要求1所述的一种适用于高性能计算机的地址自动配置系统,其特征在于:所述BMC管理系统中的所述编号配置模块为拨码开关,用户将所述拨码开关配置成实际物理位置的编号。
3.根据权利要求1所述的一种适用于高性能计算机的地址自动配置系统,其特征在于:所述BMC管理系统包含FPGA芯片,在所述FPGA芯片中设有用于与所述BMC系统通信的UART通信接口。
4.根据权利要求3所述的一种适用于高性能计算机的地址自动配置系统,其特征在于:所述BMC管理系统包含串口服务程序,用于监听每个串口通路上的数据。
5.根据权利要求1-4任意一项所述的一种适用于高性能计算机的地址自动配置系统,其特征在于: 当所述BMC启动后,会启动地址申请程序,通过串口向所述BMC管理系统发送获取地址请求,所述BMC管理系统在收到所述BMC发过来的所述获取地址请求后,将对应位置的地址配置文件写入到BMC端的指定配置文件中。
6.根据权利要求5所述的一种适用于高性能计算机的地址自动配置系统,其特征在于:所述BMC管理系统发送给所述BMC的所述地址配置文件中包含有校验数据,所述BMC通过所述校验数据来检查配置文件的正确性。
7.根据权利要求1-4任意一项所述的一种适用于高性能计算机的地址自动配置系统,其特征在于:所述BMC系统包含随机等待数生成模块,当所述BMC系统向所述BMC管理系统发送地址申请程序后无响应,则会生成随机的等待秒数来进行下一次申请。
8.根据权利要求1-4任意一项所述的一种适用于高性能计算机的地址自动配置系统,其特征在于:所述BMC系统与每个所述节点的CPU之间均有独立的JTAG通路。
9.根据权利要求8所述的一种适用于高性能计算机的地址自动配置系统,其特征在于:所述BMC系统将每个所述CPU的地址写入到给CPU的引导文件中,来完成CPU地址的配置。
CN201910848709.XA 2019-09-09 2019-09-09 一种适用于高性能计算机的地址自动配置系统 Active CN110677509B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910848709.XA CN110677509B (zh) 2019-09-09 2019-09-09 一种适用于高性能计算机的地址自动配置系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910848709.XA CN110677509B (zh) 2019-09-09 2019-09-09 一种适用于高性能计算机的地址自动配置系统

Publications (2)

Publication Number Publication Date
CN110677509A true CN110677509A (zh) 2020-01-10
CN110677509B CN110677509B (zh) 2022-04-12

Family

ID=69076692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910848709.XA Active CN110677509B (zh) 2019-09-09 2019-09-09 一种适用于高性能计算机的地址自动配置系统

Country Status (1)

Country Link
CN (1) CN110677509B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113556412A (zh) * 2021-07-29 2021-10-26 中车南京浦镇车辆有限公司 一种轨道交通车辆终端设备网络地址设置方法
CN113835770A (zh) * 2021-11-30 2021-12-24 四川华鲲振宇智能科技有限责任公司 一种服务器管理模块在线更换方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413202A (zh) * 2011-11-18 2012-04-11 浪潮电子信息产业股份有限公司 一种刀片服务器管理内网ip的自动分配方法
CN103516547A (zh) * 2013-09-18 2014-01-15 深圳市华为技术软件有限公司 一种网络参数分配方法及装置
CN103533102A (zh) * 2013-10-25 2014-01-22 深圳市多尼卡电子技术有限公司 网元网络地址的配置方法及数据传输系统和音视频系统
CN104378218A (zh) * 2013-08-12 2015-02-25 鸿富锦精密工业(深圳)有限公司 机柜内服务器管理系统及方法
CN105227696A (zh) * 2015-10-20 2016-01-06 浪潮集团有限公司 一种服务器管理系统mac地址分配方法
WO2016018293A1 (en) * 2014-07-30 2016-02-04 Hewlett-Packard Development Company, L.P. Configuring managed server
CN105592178A (zh) * 2015-09-17 2016-05-18 杭州华三通信技术有限公司 一种数据节点位置的确定方法和装置
CN105812190A (zh) * 2016-04-29 2016-07-27 中国人民解放军国防科学技术大学 一种飞腾服务器刀片系统的网络地址管理方法
CN108900656A (zh) * 2018-08-23 2018-11-27 郑州云海信息技术有限公司 一种批量部署的方法及装置
CN109587284A (zh) * 2018-11-22 2019-04-05 郑州云海信息技术有限公司 一种远程自动配置机房服务器bmc网口ip的方法与系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413202A (zh) * 2011-11-18 2012-04-11 浪潮电子信息产业股份有限公司 一种刀片服务器管理内网ip的自动分配方法
CN104378218A (zh) * 2013-08-12 2015-02-25 鸿富锦精密工业(深圳)有限公司 机柜内服务器管理系统及方法
CN103516547A (zh) * 2013-09-18 2014-01-15 深圳市华为技术软件有限公司 一种网络参数分配方法及装置
CN103533102A (zh) * 2013-10-25 2014-01-22 深圳市多尼卡电子技术有限公司 网元网络地址的配置方法及数据传输系统和音视频系统
WO2016018293A1 (en) * 2014-07-30 2016-02-04 Hewlett-Packard Development Company, L.P. Configuring managed server
CN105592178A (zh) * 2015-09-17 2016-05-18 杭州华三通信技术有限公司 一种数据节点位置的确定方法和装置
CN105227696A (zh) * 2015-10-20 2016-01-06 浪潮集团有限公司 一种服务器管理系统mac地址分配方法
CN105812190A (zh) * 2016-04-29 2016-07-27 中国人民解放军国防科学技术大学 一种飞腾服务器刀片系统的网络地址管理方法
CN108900656A (zh) * 2018-08-23 2018-11-27 郑州云海信息技术有限公司 一种批量部署的方法及装置
CN109587284A (zh) * 2018-11-22 2019-04-05 郑州云海信息技术有限公司 一种远程自动配置机房服务器bmc网口ip的方法与系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蔡积淼: "基于IPMI的服务器管理的软硬件设计与实现", 《中国优秀硕士学位论文全文数据库》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113556412A (zh) * 2021-07-29 2021-10-26 中车南京浦镇车辆有限公司 一种轨道交通车辆终端设备网络地址设置方法
CN113835770A (zh) * 2021-11-30 2021-12-24 四川华鲲振宇智能科技有限责任公司 一种服务器管理模块在线更换方法及系统
CN113835770B (zh) * 2021-11-30 2022-02-18 四川华鲲振宇智能科技有限责任公司 一种服务器管理模块在线更换方法及系统

Also Published As

Publication number Publication date
CN110677509B (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
US8359415B2 (en) Multi-root I/O virtualization using separate management facilities of multiple logical partitions
US8141093B2 (en) Management of an IOV adapter through a virtual intermediary in an IOV management partition
US7930511B2 (en) Method and apparatus for management between virtualized machines and virtualized storage systems
US20090133028A1 (en) System and method for management of an iov adapter through a virtual intermediary in a hypervisor with functional management in an iov management partition
CN106933753B (zh) 智能接口卡的控制方法及装置
JP2016519381A (ja) クラウドアプリケーションの冗長化のための方法、システム、および装置
JP2006085543A (ja) 仮想計算機システム
WO2007126471A1 (en) Managing system components
JP5149732B2 (ja) 仮想計算機システム
CN110677509B (zh) 一种适用于高性能计算机的地址自动配置系统
JP2019101700A (ja) システム及びその制御方法並びにプログラム
US8793481B2 (en) Managing hardware resources for soft partitioning
TW201250455A (en) System and method for controlling power devices in data center
WO2017049433A1 (zh) 计算机系统和计算机系统中端点设备访问的方法
US8819200B2 (en) Automated cluster node configuration
US20210334235A1 (en) Systems and methods for configuring, creating, and modifying parallel file systems
US8595362B2 (en) Managing hardware resources for soft partitioning
US20060010133A1 (en) Management of a scalable computer system
CN103618634A (zh) 集群中自动发现节点的方法
US20120254578A1 (en) Zone group connectivity indicator
CN113626183A (zh) 一种基于超融合基础架构的集群构建方法和装置
US8601128B2 (en) Managing hardware resources for soft partitioning
JP2020191100A (ja) システム及びその制御方法並びにプログラム
US10534733B2 (en) Flexible I/O slot connections
US20170153907A1 (en) Out-of-band Management Of Virtual Machines

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant