CN103067296A - 一种实现hpc集群登录节点负载均衡的方法 - Google Patents
一种实现hpc集群登录节点负载均衡的方法 Download PDFInfo
- Publication number
- CN103067296A CN103067296A CN2013100179411A CN201310017941A CN103067296A CN 103067296 A CN103067296 A CN 103067296A CN 2013100179411 A CN2013100179411 A CN 2013100179411A CN 201310017941 A CN201310017941 A CN 201310017941A CN 103067296 A CN103067296 A CN 103067296A
- Authority
- CN
- China
- Prior art keywords
- node
- cluster
- load
- login
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Computer And Data Communications (AREA)
- Multi Processors (AREA)
Abstract
本发明提供一种实现HPC集群登录节点负载均衡的方法,本发明的目的是为同时解决基于linux的HPC集群登录节点的稳定性和安全性而提出的一种实现HPC集群登录节点负载均衡的方法,以此方法构建的集群调度负载均衡系统适用于成百、数千个节点的大规模HPC集群系统。集群普通用户要在高性能集群上进行程序编译和提交作业运算,只需要登录到管理员给出的虚拟调度IP即可,不需要登录到实际调度服务器节点和了解后台的调度节点状态,负载均衡设备会根据设定好的访问策略自动把该ssh访问定位到相应的登录节点服务器。
Description
技术领域
本发明涉及基于linux操作系统的HPC集群登录节点的负载均衡,具体涉及一种实现HPC集群登录节点负载均衡的方法。
背景技术
高性能计算(HPC) 集群通常采用大规模计算节点进行计算,伴随着大型集群的普及应用,高性能计算用户的数量也越来越多。为了保证集群的安全性和稳定性,不建议高性能计算用户直接登录到管理节点进行程序的便也和作业提交。
对于传统的HPC集群,通常采用单个调度节点,或者独立的多个调度节点进行程序编译和计算作业的提交和资源分配。在这种环境中,存在以下几点不足:
1)调度节点宕机影响将会整个集群运算作业的提交和运行;
2)如果登录节点存在正在编译的程序,登录节点的性能没有保障;
3)集群用户直接登录到调度节点,容易对操作系统和pbs系统造成误操作等,存在安全隐患。
发明内容
本发明的目的是为同时解决基于linux的HPC集群登录节点的稳定性和安全性而提出的一种实现HPC集群登录节点负载均衡的方法,以此方法构建的集群调度负载均衡系统适用于成百、数千个节点的大规模HPC集群系统。
本发明的技术方案是按以下方式实现的,该方法包括系统物理结构和负载均衡调度系统的部署,其中:
a) 系统物理结构包括:登录负载均衡节点和计算资源;
登录负载均衡节点分为负载均衡节点和登录节点2部分:负载均衡节点是负载均衡设备或者普通服务器安装开源负载均衡软件ipvasdm;
登录节点:用于高性能普通用户在该类型节点上进行程序编译和完成作业任务的提交;
b)负载均衡调度系统的部署
1)选择负载均衡节点作为ipvs服务器,N个登录节点作为真实服务器节点;
2)在负载均衡节点上编译安装ipvsadm,检查ipvsadm环境;
3)在负载均衡服务器上配置NAT模式负载均衡,开启IPV4路由机制,加载NAT模块;针对ssh端口添加虚拟IP提供对外访问,配置访问策略,同时需要把调度节点服务器的网关设置为ipvs服务器的内网IP地址;
4)这样外部的集群用户通过VPN或内部网路就能直接访问ipvs虚拟服务器的Ip地址,该负载均衡就会根据访问策略把不同的ssh访问需求定位到不同的调度节点服务器上,然后即可使用qsub命令进行作业的提交运算;
集群普通用户要在高性能集群上进行程序编译和提交作业运算,只需要登录到管理员给出的虚拟调度IP即可,不需要登录到实际调度服务器节点和了解后台的调度节点状态,负载均衡设备会根据设定好的访问策略自动把该ssh访问定位到相应的登录节点服务器,具体步骤如下:
第一步,普通用户通过以太网使用ssh工具登录到虚拟调度IP地址;
第二步,虚拟调度IP会指向负载均衡设备,包括ipvs服务器或者硬件负载设备,负载均衡设备会根据设定好的访问策略,把该ssh访问转向对应的登录节点,登录节点至少需要2台以上,以便实现节点的冗余和负载均衡;
第三步,ssh定位到登录节点上之后,集群普通用户即能在上面进行程序编辑和使用qsub命令提交相关的pbs作业脚本;
第四步,登录节点会根据集群的调度策略,结合集群计算节点的资源使用状况,自动分配计算资源;
第五步,计算节点运算完毕后,会把计算结果返回到该登录节点,集群普通用户即可查看运算结果。
本发明的有益效果:
1)HPC集群通常配置登录节点,以便高性能用户进行程序的编译和作业的提交;
2)针对大规模HPC集群多个登录节点进行负载均衡,以满足高性能用户的分流,减轻登录节点的压力;
3)通过IPVSADM或硬件负载均衡设备,针对ssh端口22实现多个计算节点作业调度负载均衡;
4)通过登录节点的负载均衡功能,实现HPC集群程序编译和作业调度环节的冗余,并保证集群运行的稳定性和安全性。
附图说明
图1是登录节点负载均衡系统结构示意图;
图2是登录节点负载均衡流程图。
具体实施方式
下面结合附图对本发明的方法作进一步详细说明。
本发明的目的是为同时解决基于linux的HPC集群登录节点的稳定性和安全性而提出的一种实现HPC集群登录节点负载均衡的方法,以此方法构建的集群调度负载均衡系统适用于成百、数千个节点的大规模HPC集群系统。
该方法包括系统物理结构和负载均衡调度系统的部署,其中:
c) 系统物理结构包括:登录负载均衡节点和计算资源;
登录负载均衡节点分为负载均衡节点和登录节点2部分:负载均衡节点是负载均衡设备或者普通服务器安装开源负载均衡软件ipvasdm;负载均衡设备可以使用浪潮TS8650G3等硬件负载均衡设备;
登录节点:用于高性能普通用户在该类型节点上进行程序编译和完成作业任务的提交;
d)负载均衡调度系统的部署
1)选择负载均衡节点作为ipvs服务器,N个登录节点作为真实服务器节点;
2)在负载均衡节点上编译安装ipvsadm,检查ipvsadm环境;
3)在负载均衡服务器上配置NAT模式负载均衡,开启IPV4路由机制,加载NAT模块;针对ssh端口添加虚拟IP提供对外访问,配置访问策略,同时需要把调度节点服务器的网关设置为ipvs服务器的内网IP地址;
4)这样外部的集群用户通过VPN或内部网路就能直接访问ipvs虚拟服务器的Ip地址,该负载均衡就会根据访问策略把不同的ssh访问需求定位到不同的调度节点服务器上,然后即可使用qsub命令进行作业的提交运算;
集群普通用户要在高性能集群上进行程序编译和提交作业运算,只需要登录到管理员给出的虚拟调度IP即可,不需要登录到实际调度服务器节点和了解后台的调度节点状态,负载均衡设备会根据设定好的访问策略自动把该ssh访问定位到相应的登录节点服务器,具体步骤如下:
第一步,普通用户通过以太网使用ssh工具登录到虚拟调度IP地址;
第二步,虚拟调度IP会指向负载均衡设备,包括ipvs服务器或者硬件负载设备,负载均衡设备会根据设定好的访问策略,把该ssh访问转向对应的登录节点,登录节点至少需要2台以上,以便实现节点的冗余和负载均衡;
第三步,ssh定位到登录节点上之后,集群普通用户即能在上面进行程序编辑和使用qsub命令提交相关的pbs作业脚本;
第四步,登录节点会根据集群的调度策略,结合集群计算节点的资源使用状况,自动分配计算资源;
第五步,计算节点运算完毕后,会把计算结果返回到该登录节点,集群普通用户即可查看运算结果。
除本发明的说明书公开的技术特征外均为本专业技术人员的公职技术。
Claims (1)
1.一种实现HPC集群登录节点负载均衡的方法,其特征在于,该方法包括系统物理结构和负载均衡调度系统的部署,其中:
a)系统物理结构包括:登录负载均衡节点和计算资源;
登录负载均衡节点分为负载均衡节点和登录节点2部分:负载均衡节点是负载均衡设备或者普通服务器安装开源负载均衡软件ipvasdm;
登录节点:用于高性能普通用户在该类型节点上进行程序编译和完成作业任务的提交;
b)负载均衡调度系统的部署
1)选择负载均衡节点作为ipvs服务器,N个登录节点作为真实服务器节点;
2)在负载均衡节点上编译安装ipvsadm,检查ipvsadm环境;
3)在负载均衡服务器上配置NAT模式负载均衡,开启IPV4路由机制,加载NAT模块;针对ssh端口添加虚拟IP提供对外访问,配置访问策略,同时需要把调度节点服务器的网关设置为ipvs服务器的内网IP地址;
4)这样外部的集群用户通过VPN或内部网路就能直接访问ipvs虚拟服务器的Ip地址,该负载均衡就会根据访问策略把不同的ssh访问需求定位到不同的调度节点服务器上,然后即可使用qsub命令进行作业的提交运算;
集群普通用户要在高性能集群上进行程序编译和提交作业运算,只需要登录到管理员给出的虚拟调度IP即可,不需要登录到实际调度服务器节点和了解后台的调度节点状态,负载均衡设备会根据设定好的访问策略自动把该ssh访问定位到相应的登录节点服务器,具体步骤如下:
第一步,普通用户通过以太网使用ssh工具登录到虚拟调度IP地址;
第二步,虚拟调度IP会指向负载均衡设备,包括ipvs服务器或者硬件负载设备,负载均衡设备会根据设定好的访问策略,把该ssh访问转向对应的登录节点,登录节点至少需要2台以上,以便实现节点的冗余和负载均衡;
第三步,ssh定位到登录节点上之后,集群普通用户即能在上面进行程序编辑和使用qsub命令提交相关的pbs作业脚本;
第四步,登录节点会根据集群的调度策略,结合集群计算节点的资源使用状况,自动分配计算资源;
第五步,计算节点运算完毕后,会把计算结果返回到该登录节点,集群普通用户即可查看运算结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310017941.1A CN103067296B (zh) | 2013-01-18 | 2013-01-18 | 一种实现高性能计算集群登录节点负载均衡的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310017941.1A CN103067296B (zh) | 2013-01-18 | 2013-01-18 | 一种实现高性能计算集群登录节点负载均衡的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103067296A true CN103067296A (zh) | 2013-04-24 |
CN103067296B CN103067296B (zh) | 2017-05-10 |
Family
ID=48109764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310017941.1A Active CN103067296B (zh) | 2013-01-18 | 2013-01-18 | 一种实现高性能计算集群登录节点负载均衡的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103067296B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103297543A (zh) * | 2013-06-24 | 2013-09-11 | 浪潮电子信息产业股份有限公司 | 一种基于计算机集群作业调度的方法 |
CN104301417A (zh) * | 2014-10-22 | 2015-01-21 | 网宿科技股份有限公司 | 一种负载均衡方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1617126A (zh) * | 2003-11-11 | 2005-05-18 | 联想(北京)有限公司 | 一种计算机机群系统及其作业管理方法 |
CN101741907A (zh) * | 2009-12-23 | 2010-06-16 | 金蝶软件(中国)有限公司 | 一种均衡服务器负载的方法、系统和主服务器 |
CN102571782A (zh) * | 2011-12-29 | 2012-07-11 | 浙江大学 | 一种新型负载平衡服务器集群系统 |
-
2013
- 2013-01-18 CN CN201310017941.1A patent/CN103067296B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1617126A (zh) * | 2003-11-11 | 2005-05-18 | 联想(北京)有限公司 | 一种计算机机群系统及其作业管理方法 |
CN101741907A (zh) * | 2009-12-23 | 2010-06-16 | 金蝶软件(中国)有限公司 | 一种均衡服务器负载的方法、系统和主服务器 |
CN102571782A (zh) * | 2011-12-29 | 2012-07-11 | 浙江大学 | 一种新型负载平衡服务器集群系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103297543A (zh) * | 2013-06-24 | 2013-09-11 | 浪潮电子信息产业股份有限公司 | 一种基于计算机集群作业调度的方法 |
CN104301417A (zh) * | 2014-10-22 | 2015-01-21 | 网宿科技股份有限公司 | 一种负载均衡方法及装置 |
CN104301417B (zh) * | 2014-10-22 | 2018-08-07 | 网宿科技股份有限公司 | 一种负载均衡方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103067296B (zh) | 2017-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109120494B (zh) | 在云计算系统中接入物理机的方法 | |
US10171294B2 (en) | Information processing device and system design support method | |
Moghaddam et al. | Cloud computing: Vision, architecture and Characteristics | |
CN102457439A (zh) | 一种云计算系统的虚拟交换系统及其虚拟交换方法 | |
CN103763367A (zh) | 一种云计算数据中心分布式虚拟网络设计方法及系统 | |
CN103581325B (zh) | 一种云计算资源池系统及其实现方法 | |
CN110008005B (zh) | 基于云平台的电网通信资源虚拟机迁移系统及方法 | |
CN105376133A (zh) | 一种基于虚拟化技术的网络实验系统及构造方法 | |
CN105791402B (zh) | 一种云计算平台网络虚拟化实现方法及相应插件和代理 | |
CN105894159A (zh) | 一种跨领域跨平台的用户统一管理系统的实现方法 | |
CN104301417B (zh) | 一种负载均衡方法及装置 | |
CN103118130A (zh) | 一种用于分布式服务的集群管理方法和系统 | |
AU2013375618A1 (en) | Load sharing method and apparatus | |
CN103377402A (zh) | 一种多用户分析系统以及相应的装置和方法 | |
CA2931687A1 (en) | System and method for creating service chains and virtual networks in the cloud | |
CN108900651A (zh) | 基于多租户环境的Kubernetes与Neutron对接方法、存储介质、设备 | |
CN108600344A (zh) | 一种网络访问请求调度方法、装置和存储介质 | |
CN104363306A (zh) | 一种企业私有云管理控制方法 | |
CN114610440A (zh) | 模拟机系统的运行环境构建方法及系统 | |
CN103986665A (zh) | 云海os中网络负载均衡的方法 | |
CN103067296A (zh) | 一种实现hpc集群登录节点负载均衡的方法 | |
CN203225789U (zh) | 基于云计算的虚拟桌面终端系统 | |
CN105046393A (zh) | 基于云计算的交通资源管理系统 | |
CN104166581A (zh) | 一种面向增量制造设备的虚拟化方法 | |
CN104994137B (zh) | 一种网络透明代理的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |