CN103067296B - 一种实现高性能计算集群登录节点负载均衡的方法 - Google Patents

一种实现高性能计算集群登录节点负载均衡的方法 Download PDF

Info

Publication number
CN103067296B
CN103067296B CN201310017941.1A CN201310017941A CN103067296B CN 103067296 B CN103067296 B CN 103067296B CN 201310017941 A CN201310017941 A CN 201310017941A CN 103067296 B CN103067296 B CN 103067296B
Authority
CN
China
Prior art keywords
node
load
cluster
load balancing
scheduling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310017941.1A
Other languages
English (en)
Other versions
CN103067296A (zh
Inventor
陈良华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201310017941.1A priority Critical patent/CN103067296B/zh
Publication of CN103067296A publication Critical patent/CN103067296A/zh
Application granted granted Critical
Publication of CN103067296B publication Critical patent/CN103067296B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Multi Processors (AREA)

Abstract

本发明提供一种实现HPC集群登录节点负载均衡的方法,本发明的目的是为同时解决基于linux的HPC集群登录节点的稳定性和安全性而提出的一种实现HPC集群登录节点负载均衡的方法,以此方法构建的集群调度负载均衡系统适用于成百、数千个节点的大规模HPC集群系统。集群普通用户要在高性能集群上进行程序编译和提交作业运算,只需要登录到管理员给出的虚拟调度IP即可,不需要登录到实际调度服务器节点和了解后台的调度节点状态,负载均衡设备会根据设定好的访问策略自动把该ssh访问定位到相应的登录节点服务器。

Description

一种实现高性能计算集群登录节点负载均衡的方法
技术领域
本发明涉及基于linux操作系统的高性能计算集群登录节点的负载均衡,具体涉及一种实现高性能计算集群登录节点负载均衡的方法。
背景技术
高性能计算(HPC) 集群通常采用大规模计算节点进行计算,伴随着大型集群的普及应用,高性能计算用户的数量也越来越多。为了保证集群的安全性和稳定性,不建议高性能计算用户直接登录到管理节点进行程序的便也和作业提交。
对于传统的高性能计算集群,通常采用单个调度节点,或者独立的多个调度节点进行程序编译和计算作业的提交和资源分配。在这种环境中,存在以下几点不足:
1)调度节点宕机影响将会整个集群运算作业的提交和运行;
2)如果登录节点存在正在编译的程序,登录节点的性能没有保障;
3)集群用户直接登录到调度节点,容易对操作系统和pbs系统造成误操作等,存在安全隐患。
发明内容
本发明的目的是为同时解决基于linux的高性能计算集群登录节点的稳定性和安全性而提出的一种实现高性能计算集群登录节点负载均衡的方法,以此方法构建的集群调度负载均衡系统适用于成百、数千个节点的大规模高性能计算集群系统。
本1. 一种实现高性能计算集群登录节点负载均衡的方法,该方法是基于高性能计算集群的负载均衡调度系统的部署,其中:
a) 高性能计算集群包括:登录负载均衡节点和计算资源;
登录负载均衡节点分为负载均衡节点和登录节点2部分:负载均衡节点是负载均衡设备或者普通服务器安装开源负载均衡软件ipvasdm;
登录节点:用于高性能普通用户在该登录节点上进行程序编译和完成作业任务的提交;
b)负载均衡调度系统的部署
1)选择负载均衡节点作为负载均衡服务器,N个登录节点作为真实服务器节点;
2)在负载均衡节点上编译安装ipvsadm,检查ipvsadm环境;
3)在负载均衡服务器上配置NAT模式负载均衡,开启IPV4路由机制,加载NAT模块;针对ssh端口添加虚拟IP提供对外访问,配置访问策略,同时需要把调度节点服务器的网关设置为负载均衡服务器的内网IP地址;
4)这样外部的集群用户通过VPN或内部网路就能直接访问ipvs虚拟服务器的Ip地址,该负载均衡就会根据访问策略把不同的ssh访问需求定位到不同的调度节点服务器上,然后即可使用qsub命令进行作业的提交运算;
集群普通用户要在高性能集群上进行程序编译和提交作业运算,只需要登录到管理员给出的虚拟调度IP即可,不需要登录到实际调度服务器节点和了解后台的调度节点状态,负载均衡设备会根据设定好的访问策略自动把该ssh访问定位到相应的登录节点服务器,具体步骤如下:
第一步,普通用户通过以太网使用ssh工具登录到虚拟调度IP地址;
第二步,虚拟调度IP会指向负载均衡设备,包括负载均衡服务器或者硬件负载设备,负载均衡设备会根据设定好的访问策略,把该ssh访问转向对应的登录节点,登录节点至少需要2台以上,以便实现节点的冗余和负载均衡;
第三步,ssh定位到登录节点上之后,集群普通用户即能在上面进行程序编辑和使用qsub命令提交相关的pbs作业脚本;
第四步,登录节点会根据集群的调度策略,结合集群计算节点的资源使用状况,自动分配计算资源;
第五步,计算节点运算完毕后,会把计算结果返回到该登录节点,集群普通用户即可查看运算结果。
本发明的有益效果:
1)高性能计算集群通常配置登录节点,以便高性能用户进行程序的编译和作业的提交;
2)针对大规模高性能计算集群多个登录节点进行负载均衡,以满足高性能用户的分流,减轻登录节点的压力;
3)通过IPVSADM或硬件负载均衡设备,针对ssh端口22实现多个计算节点作业调度负载均衡;
4)通过登录节点的负载均衡功能,实现高性能计算集群程序编译和作业调度环节的冗余,并保证集群运行的稳定性和安全性。
附图说明
图1是登录节点负载均衡系统结构示意图;
图2是登录节点负载均衡流程图。
具体实施方式
下面结合附图对本发明的方法作进一步详细说明。
本发明的目的是为同时解决基于linux的高性能计算集群登录节点的稳定性和安全性而提出的一种实现高性能计算集群登录节点负载均衡的方法,以此方法构建的集群调度负载均衡系统适用于成百、数千个节点的大规模高性能计算集群系统。
一种实现高性能计算集群登录节点负载均衡的方法,该方法是基于高性能计算集群的负载均衡调度系统的部署,其中:
a) 高性能计算集群包括:登录负载均衡节点和计算资源;
登录负载均衡节点分为负载均衡节点和登录节点2部分:负载均衡节点是负载均衡设备或者普通服务器安装开源负载均衡软件ipvasdm;负载均衡设备可以使用浪潮TS8650G3等硬件负载均衡设备;
登录节点:用于高性能普通用户在该登录节点上进行程序编译和完成作业任务的提交;
d)负载均衡调度系统的部署
1)选择负载均衡节点作为负载均衡服务器,N个登录节点作为真实服务器节点;
2)在负载均衡节点上编译安装ipvsadm,检查ipvsadm环境;
3)在负载均衡服务器上配置NAT模式负载均衡,开启IPV4路由机制,加载NAT模块;针对ssh端口添加虚拟IP提供对外访问,配置访问策略,同时需要把调度节点服务器的网关设置为负载均衡服务器的内网IP地址;
4)这样外部的集群用户通过VPN或内部网路就能直接访问ipvs虚拟服务器的Ip地址,该负载均衡就会根据访问策略把不同的ssh访问需求定位到不同的调度节点服务器上,然后即可使用qsub命令进行作业的提交运算;
集群普通用户要在高性能集群上进行程序编译和提交作业运算,只需要登录到管理员给出的虚拟调度IP即可,不需要登录到实际调度服务器节点和了解后台的调度节点状态,负载均衡设备会根据设定好的访问策略自动把该ssh访问定位到相应的登录节点服务器,具体步骤如下:
第一步,普通用户通过以太网使用ssh工具登录到虚拟调度IP地址;
第二步,虚拟调度IP会指向负载均衡设备,包括负载均衡服务器或者硬件负载设备,负载均衡设备会根据设定好的访问策略,把该ssh访问转向对应的登录节点,登录节点至少需要2台以上,以便实现节点的冗余和负载均衡;
第三步,ssh定位到登录节点上之后,集群普通用户即能在上面进行程序编辑和使用qsub命令提交相关的pbs作业脚本;
第四步,登录节点会根据集群的调度策略,结合集群计算节点的资源使用状况,自动分配计算资源;
第五步,计算节点运算完毕后,会把计算结果返回到该登录节点,集群普通用户即可查看运算结果。
除本发明的说明书公开的技术特征外均为本专业技术人员的公职技术。

Claims (1)

1.一种实现高性能计算集群登录节点负载均衡的方法,其特征在于,该方法是基于高性能计算集群的负载均衡调度系统的部署,其中:
a) 高性能计算集群包括:登录负载均衡节点和计算资源;
登录负载均衡节点分为负载均衡节点和登录节点2部分:负载均衡节点是负载均衡设备或者普通服务器安装开源负载均衡软件ipvasdm;
登录节点:用于高性能普通用户在该登录节点上进行程序编译和完成作业任务的提交;
b)负载均衡调度系统的部署
1)选择负载均衡节点作为负载均衡服务器,N个登录节点作为真实服务器节点;
2)在负载均衡节点上编译安装ipvsadm,检查ipvsadm环境;
3)在负载均衡服务器上配置NAT模式负载均衡,开启IPV4路由机制,加载NAT模块;针对ssh端口添加虚拟IP提供对外访问,配置访问策略,同时需要把调度节点服务器的网关设置为负载均衡服务器的内网IP地址;
4)这样外部的集群用户通过VPN或内部网路就能直接访问ipvs虚拟服务器的Ip地址,该负载均衡就会根据访问策略把不同的ssh访问需求定位到不同的调度节点服务器上,然后即可使用qsub命令进行作业的提交运算;
集群普通用户要在高性能集群上进行程序编译和提交作业运算,只需要登录到管理员给出的虚拟调度IP即可,不需要登录到实际调度服务器节点和了解后台的调度节点状态,负载均衡设备会根据设定好的访问策略自动把该ssh访问定位到相应的登录节点服务器,具体步骤如下:
第一步,普通用户通过以太网使用ssh工具登录到虚拟调度IP地址;
第二步,虚拟调度IP会指向负载均衡设备,包括负载均衡服务器或者硬件负载设备,负载均衡设备会根据设定好的访问策略,把该ssh访问转向对应的登录节点,登录节点至少需要2台以上,以便实现节点的冗余和负载均衡;
第三步,ssh定位到登录节点上之后,集群普通用户即能在上面进行程序编辑和使用qsub命令提交相关的pbs作业脚本;
第四步,登录节点会根据集群的调度策略,结合集群计算节点的资源使用状况,自动分配计算资源;
第五步,计算节点运算完毕后,会把计算结果返回到该登录节点,集群普通用户即可查看运算结果。
CN201310017941.1A 2013-01-18 2013-01-18 一种实现高性能计算集群登录节点负载均衡的方法 Active CN103067296B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310017941.1A CN103067296B (zh) 2013-01-18 2013-01-18 一种实现高性能计算集群登录节点负载均衡的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310017941.1A CN103067296B (zh) 2013-01-18 2013-01-18 一种实现高性能计算集群登录节点负载均衡的方法

Publications (2)

Publication Number Publication Date
CN103067296A CN103067296A (zh) 2013-04-24
CN103067296B true CN103067296B (zh) 2017-05-10

Family

ID=48109764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310017941.1A Active CN103067296B (zh) 2013-01-18 2013-01-18 一种实现高性能计算集群登录节点负载均衡的方法

Country Status (1)

Country Link
CN (1) CN103067296B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103297543A (zh) * 2013-06-24 2013-09-11 浪潮电子信息产业股份有限公司 一种基于计算机集群作业调度的方法
CN104301417B (zh) * 2014-10-22 2018-08-07 网宿科技股份有限公司 一种负载均衡方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1617126A (zh) * 2003-11-11 2005-05-18 联想(北京)有限公司 一种计算机机群系统及其作业管理方法
CN101741907A (zh) * 2009-12-23 2010-06-16 金蝶软件(中国)有限公司 一种均衡服务器负载的方法、系统和主服务器
CN102571782A (zh) * 2011-12-29 2012-07-11 浙江大学 一种新型负载平衡服务器集群系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1617126A (zh) * 2003-11-11 2005-05-18 联想(北京)有限公司 一种计算机机群系统及其作业管理方法
CN101741907A (zh) * 2009-12-23 2010-06-16 金蝶软件(中国)有限公司 一种均衡服务器负载的方法、系统和主服务器
CN102571782A (zh) * 2011-12-29 2012-07-11 浙江大学 一种新型负载平衡服务器集群系统

Also Published As

Publication number Publication date
CN103067296A (zh) 2013-04-24

Similar Documents

Publication Publication Date Title
US9450813B2 (en) Automated host device virtual network configuration system
CN109120494B (zh) 在云计算系统中接入物理机的方法
US10411947B2 (en) Hot swapping and hot scaling containers
JP5714187B2 (ja) ミドルボックスを備えるネットワークのアーキテクチャ
WO2018157299A1 (zh) 一种光线路终端olt设备虚拟方法及相关设备
CN107483390B (zh) 一种云渲染网络部署子系统、系统及云渲染平台
WO2018166111A1 (zh) 基于集中控制器及dci设备的负载均衡的方法、系统、电子装置及计算机可读存储介质
US8612738B2 (en) System and method for automated network configuration
CN107026890A (zh) 一种基于服务器集群的报文生成方法和负载均衡器
CN110008005B (zh) 基于云平台的电网通信资源虚拟机迁移系统及方法
CN108900651B (zh) 基于多租户环境的Kubernetes与Neutron对接方法、存储介质、设备
CN103595772A (zh) 一种基于虚拟路由器的云数据中心网络部署方案
JP2013168140A (ja) バーチャルマシンの配置方法
CN105554015A (zh) 多租户容器云计算系统的管理网络及方法
CN104301417B (zh) 一种负载均衡方法及装置
CN102457439A (zh) 一种云计算系统的虚拟交换系统及其虚拟交换方法
CN105791402B (zh) 一种云计算平台网络虚拟化实现方法及相应插件和代理
US9112769B1 (en) Programatically provisioning virtual networks
WO2015127851A1 (en) System and method for creating service chains and virtual networks in the cloud
US10237235B1 (en) System for network address translation
WO2020088340A1 (zh) 一种提供云计算服务的方法及系统
CN106487935A (zh) 一种私有云内部服务器远程维护方法和系统
CN104363306A (zh) 一种企业私有云管理控制方法
CN103067296B (zh) 一种实现高性能计算集群登录节点负载均衡的方法
CN103401954B (zh) 虚拟dhcp的实现方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant