CN111258592A - 一种应用于集群服务器的免安装串行执行方法与系统 - Google Patents
一种应用于集群服务器的免安装串行执行方法与系统 Download PDFInfo
- Publication number
- CN111258592A CN111258592A CN202010063681.1A CN202010063681A CN111258592A CN 111258592 A CN111258592 A CN 111258592A CN 202010063681 A CN202010063681 A CN 202010063681A CN 111258592 A CN111258592 A CN 111258592A
- Authority
- CN
- China
- Prior art keywords
- nodes
- cluster
- installation
- serial execution
- cluster server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013515 script Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000004904 shortening Methods 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/172—Caching, prefetching or hoarding of files
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Stored Programmes (AREA)
Abstract
本发明提供了一种应用于集群服务器的免安装串行执行方法与系统,本发明通过将集群中所有节点进行分组,并通过免安装串行执行命令工具serialcmd,在HPC集群环境中以免安装串行执行命令的方式,使得分组中所有节点按照顺序执行批量操作,且实时输出执行结果,从而可以在不改变集群现有软件安装环境下,有效缩短配置时间,快速定位和解决集群软件部署问题,且其操作方便,配置简单,对于集群的初级管理员来说,可大大提高工作效率。
Description
技术领域
本发明涉及集群服务器技术领域,特别是一种应用于集群服务器的免安装串行执行方法与系统。
背景技术
随着信息化社会的飞速发展,人类对信息处理能力的要求越来越高,不仅石油勘探、气象预报、航天国防、科学研究等需求高性能计算机,而且金融、政府信息化、教育、企业以及网络游戏等更广泛的领域对高性能计算的需求迅猛增长。由于HPC高性能集群环境涉及众多的服务器单元,在实施或者运维过程中,需要对集群中各个处理单元进行执行同一条指令时会耗费工作人员大量的时间及精力来登录每一个计算单元进行操作。
在实际应用场景中,实施人员或运维人员在登录集群的每一个节点执行指令时,由于节点数量庞大无序,很容易造成工作人员疲劳,以致输入了危害节点健康的命令,并且即使工作人员仔细,也会造成不必要的开销和时间上的浪费。
发明内容
本发明的目的是提供一种应用于集群服务器的免安装串行执行方法与系统,旨在解决现有技术中集群服务器依靠人工部署所造成的人力成本高的问题,实现有效缩短配置时间,提高工作效率。
为达到上述技术目的,本发明提供了一种应用于集群服务器的免安装串行执行方法,所述方法包括以下步骤:
S1、将集群中所有节点进行分组,将相同类型的节点或所需执行操作相同的节点划分为同一分组,并将所有分组存储至hostlists文件中;
S2、利用serialcmd读取hostlists文件,以命令行的方式,选取需要执行操作的分组,将分组中所有节点按照顺序以串行执行的方式执行预设操作命令;
S3、实时显示每个节点的输出结果,并根据输出结果判定执行是否异常。
优选地,所述hostlists文件与操作脚本存放于同一目录中。
优选地,所述预设操作命令包括:
检查根目录的空间、检查所有节点的ypbind服务、将命令写入所有节点的启动项中、挂载集群所有节点的sdb磁盘至data目录中以及重启所有节点的ntp服务。
本发明还提供了一种应用于集群服务器的免安装串行执行系统,所述系统包括:
节点分组模块,用于将集群中所有节点进行分组,将相同类型的节点或所需执行操作相同的节点划分为同一分组,并将所有分组存储至hostlists文件中;
串行执行模块,用于利用serialcmd读取hostlists文件,以命令行的方式,选取需要执行操作的分组,将分组中所有节点按照顺序以串行执行的方式执行预设操作命令;
实时输出模块,用于实时显示每个节点的输出结果,并根据输出结果判定执行是否异常。
优选地,所述hostlists文件与操作脚本存放于同一目录中。
优选地,所述预设操作命令包括:
检查根目录的空间、检查所有节点的ypbind服务、将命令写入所有节点的启动项中、挂载集群所有节点的sdb磁盘至data目录中以及重启所有节点的ntp服务。
本发明还提供了一种应用于集群服务器的免安装串行执行设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现所述的应用于集群服务器的免安装串行执行方法。
本发明还提供了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现所述的应用于集群服务器的免安装串行执行方法。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
与现有技术相比,本发明通过将集群中所有节点进行分组,并通过免安装串行执行命令工具serialcmd,在HPC集群环境中以免安装串行执行命令的方式,使得分组中所有节点按照顺序执行批量操作,且实时输出执行结果,从而可以在不改变集群现有软件安装环境下,有效缩短配置时间,快速定位和解决集群软件部署问题,且其操作方便,配置简单,对于集群的初级管理员来说,可大大提高工作效率。
附图说明
图1为本发明实施例中所提供的一种应用于集群服务器的免安装串行执行方法流程图;
图2为本发明实施例中所提供的一种应用于集群服务器的免安装串行执行系统框图。
具体实施方式
为了能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
下面结合附图对本发明实施例所提供的一种应用于集群服务器的免安装串行执行方法与系统进行详细说明。
如图1所示,本发明公开了一种应用于集群服务器的免安装串行执行方法,所述方法包括以下步骤:
S1、将集群中所有节点进行分组,将相同类型的节点或所需执行操作相同的节点划分为同一分组,并将所有分组存储至hostlists文件中;
S2、利用serialcmd读取hostlists文件,以命令行的方式,选取需要执行操作的分组,将分组中所有节点按照顺序以串行执行的方式执行预设操作命令;
S3、实时显示每个节点的输出结果,并根据输出结果判定执行是否异常。
本发明实施例通过免安装串行执行命令工具serialcmd,通过在HPC集群环境中,以免安装串行执行命令的方式,可以在不改变集群现有软件安装环境下,有效缩短配置时间,快速定位和解决集群软件部署问题。
将集群中所有节点进行分组,以分组的形式对节点进行资源分组,对于相同类型的节点或所需执行操作相同的节点划分为一个分组,如此便可在执行某一指令或操作时,选择相应分组即可。通过下述命令即可将节点进行分组:
groupname=”nodename01 nodename02 nodename03……”
节点与节点之间以空格进行分隔,并将节点设置于分组名之下,可以for循环的方式将节点写入分组名中。分组完成后,将所有分组存放在hostlists文件中。
对集群进行批量操作时,利用串行执行命令工具serialcmd读取hostlists文件,操作脚本与hostlists文件默认存放于同一目录中。
执行脚本时,可通过以下指令执行相应操作:
./serialcmd-g<group>"cmd"
第一个输入参数为模式选项,如果在模式选项参数之后没有其他输入参数,将会把所有的组名进行打印,第二个输入参数为为组名,会搜索hostlists文件中是否存在输入的组名,如果错误则终止脚本运行并输出错误信息,如无误则会按照组内节点的顺序对节点执行第三个输入参数并返回执行结果。第三个参数为要执行的命令,如果没有输入第三个输入参数会将所选组包含的所有节点依次打印出来。
所述第三个参数可以为任意的执行命令,可根据需要设置该命令所要执行的操作内容,例如第三个参数“cmd”可以为“df-hT|grep-w/”检查根目录的空间、“systemctlstatus ypbind|grep-i active”检查所有节点的ypbind服务、“echo nvidia-smi-pm 1>>/etc/rc.d/rc.local”将命令写入所有节点的启动项中、“mount/dev/sdb/data”挂载集群所有节点的sdb磁盘至data目录中、“systemctl restart ntpd”重启所有节点的ntp服务以及其他操作命令。
在执行过程中为串行执行,实时输出执行结果,由此可清楚知悉在执行命令时出现问题的节点,无需再等脚本执行完成之后再查找和定位,且脚本配置简单,使用方便,执行过程一目了然,在实施部署过程中和检查相应服务和挂载以及网络通信时尤其便捷。
本发明实施例通过将集群中所有节点进行分组,并通过免安装串行执行命令工具serialcmd,在HPC集群环境中以免安装串行执行命令的方式,使得分组中所有节点按照顺序执行批量操作,且实时输出执行结果,从而可以在不改变集群现有软件安装环境下,有效缩短配置时间,快速定位和解决集群软件部署问题,且其操作方便,配置简单,对于集群的初级管理员来说,可大大提高工作效率。
如图2所示,本发明实施例还公开了一种应用于集群服务器的免安装串行执行系统,所述系统包括:
节点分组模块,用于将集群中所有节点进行分组,将相同类型的节点或所需执行操作相同的节点划分为同一分组,并将所有分组存储至hostlists文件中;
串行执行模块,用于利用serialcmd读取hostlists文件,以命令行的方式,选取需要执行操作的分组,将分组中所有节点按照顺序以串行执行的方式执行预设操作命令;
实时输出模块,用于实时显示每个节点的输出结果,并根据输出结果判定执行是否异常。
将集群中所有节点进行分组,以分组的形式对节点进行资源分组,对于相同类型的节点或所需执行操作相同的节点划分为一个分组,如此便可在执行某一指令或操作时,选择相应分组即可。节点与节点之间以空格进行分隔,并将节点设置于分组名之下,可以for循环的方式将节点写入分组名中。分组完成后,将所有分组存放在hostlists文件中。
对集群进行批量操作时,利用串行执行命令工具serialcmd读取hostlists文件,操作脚本与hostlists文件默认存放于同一目录中。
执行脚本时,可通过以下指令执行相应操作:
./serialcmd-g<group>"cmd"
第一个输入参数为模式选项,如果在模式选项参数之后没有其他输入参数,将会把所有的组名进行打印,第二个输入参数为为组名,会搜索hostlists文件中是否存在输入的组名,如果错误则终止脚本运行并输出错误信息,如无误则会按照组内节点的顺序对节点执行第三个输入参数并返回执行结果。第三个参数为要执行的命令,如果没有输入第三个输入参数会将所选组包含的所有节点依次打印出来。
所述第三个参数可以为任意的执行命令,可根据需要设置该命令所要执行的操作内容,例如第三个参数“cmd”可以为“df-hT|grep-w/”检查根目录的空间、“systemctlstatus ypbind|grep-i active”检查所有节点的ypbind服务、“echo nvidia-smi-pm 1>>/etc/rc.d/rc.local”将命令写入所有节点的启动项中、“mount/dev/sdb/data”挂载集群所有节点的sdb磁盘至data目录中、“systemctl restart ntpd”重启所有节点的ntp服务以及其他操作命令。
在执行过程中为串行执行,实时输出执行结果,由此可清楚知悉在执行命令时出现问题的节点,无需再等脚本执行完成之后再查找和定位,且脚本配置简单,使用方便,执行过程一目了然,在实施部署过程中和检查相应服务和挂载以及网络通信时尤其便捷。
本发明实施例还公开了一种应用于集群服务器的免安装串行执行设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现所述的应用于集群服务器的免安装串行执行方法。
本发明实施例还公开了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现所述的应用于集群服务器的免安装串行执行方法。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种应用于集群服务器的免安装串行执行方法,其特征在于,所述方法包括以下步骤:
S1、将集群中所有节点进行分组,将相同类型的节点或所需执行操作相同的节点划分为同一分组,并将所有分组存储至hostlists文件中;
S2、利用serialcmd读取hostlists文件,以命令行的方式,选取需要执行操作的分组,将分组中所有节点按照顺序以串行执行的方式执行预设操作命令;
S3、实时显示每个节点的输出结果,并根据输出结果判定执行是否异常。
2.根据权利要求1所述的一种应用于集群服务器的免安装串行执行方法,其特征在于,所述hostlists文件与操作脚本存放于同一目录中。
3.根据权利要求1所述的一种应用于集群服务器的免安装串行执行方法,其特征在于,所述预设操作命令包括:
检查根目录的空间、检查所有节点的ypbind服务、将命令写入所有节点的启动项中、挂载集群所有节点的sdb磁盘至data目录中以及重启所有节点的ntp服务。
4.一种应用于集群服务器的免安装串行执行系统,其特征在于,所述系统包括:
节点分组模块,用于将集群中所有节点进行分组,将相同类型的节点或所需执行操作相同的节点划分为同一分组,并将所有分组存储至hostlists文件中;
串行执行模块,用于利用serialcmd读取hostlists文件,以命令行的方式,选取需要执行操作的分组,将分组中所有节点按照顺序以串行执行的方式执行预设操作命令;
实时输出模块,用于实时显示每个节点的输出结果,并根据输出结果判定执行是否异常。
5.根据权利要求4所述的一种应用于集群服务器的免安装串行执行系统,其特征在于,所述hostlists文件与操作脚本存放于同一目录中。
6.根据权利要求4所述的一种应用于集群服务器的免安装串行执行系统,其特征在于,所述预设操作命令包括:
检查根目录的空间、检查所有节点的ypbind服务、将命令写入所有节点的启动项中、挂载集群所有节点的sdb磁盘至data目录中以及重启所有节点的ntp服务。
7.一种应用于集群服务器的免安装串行执行设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现根据权利要求1至3任一项所述的应用于集群服务器的免安装串行执行方法。
8.一种可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现根据权利要求1至3任一项所述的应用于集群服务器的免安装串行执行方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010063681.1A CN111258592B (zh) | 2020-01-20 | 2020-01-20 | 一种应用于集群服务器的免安装串行执行方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010063681.1A CN111258592B (zh) | 2020-01-20 | 2020-01-20 | 一种应用于集群服务器的免安装串行执行方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111258592A true CN111258592A (zh) | 2020-06-09 |
CN111258592B CN111258592B (zh) | 2022-07-08 |
Family
ID=70954293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010063681.1A Active CN111258592B (zh) | 2020-01-20 | 2020-01-20 | 一种应用于集群服务器的免安装串行执行方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111258592B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112269714A (zh) * | 2020-10-23 | 2021-01-26 | 山东云海国创云计算装备产业创新中心有限公司 | 一种服务器bmc集中管理系统、方法、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040143599A1 (en) * | 2003-01-22 | 2004-07-22 | International Business Machines Corporation | System and method for command line administration of project spaces using XML objects |
CN103209197A (zh) * | 2012-01-12 | 2013-07-17 | 百度在线网络技术(北京)有限公司 | 集群服务器部署方法及系统 |
CN103631623A (zh) * | 2013-11-29 | 2014-03-12 | 浪潮(北京)电子信息产业有限公司 | 一种集群系统中部署应用软件的方法及装置 |
CN108574712A (zh) * | 2017-03-13 | 2018-09-25 | 阿里巴巴集团控股有限公司 | 一种容器服务集群的创建方法及装置 |
CN109445825A (zh) * | 2018-11-09 | 2019-03-08 | 郑州云海信息技术有限公司 | 一种服务器集群系统更新升级的方法和装置 |
-
2020
- 2020-01-20 CN CN202010063681.1A patent/CN111258592B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040143599A1 (en) * | 2003-01-22 | 2004-07-22 | International Business Machines Corporation | System and method for command line administration of project spaces using XML objects |
CN103209197A (zh) * | 2012-01-12 | 2013-07-17 | 百度在线网络技术(北京)有限公司 | 集群服务器部署方法及系统 |
CN103631623A (zh) * | 2013-11-29 | 2014-03-12 | 浪潮(北京)电子信息产业有限公司 | 一种集群系统中部署应用软件的方法及装置 |
CN108574712A (zh) * | 2017-03-13 | 2018-09-25 | 阿里巴巴集团控股有限公司 | 一种容器服务集群的创建方法及装置 |
CN109445825A (zh) * | 2018-11-09 | 2019-03-08 | 郑州云海信息技术有限公司 | 一种服务器集群系统更新升级的方法和装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112269714A (zh) * | 2020-10-23 | 2021-01-26 | 山东云海国创云计算装备产业创新中心有限公司 | 一种服务器bmc集中管理系统、方法、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111258592B (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111414389B (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
US20190129833A1 (en) | Method, device and computer program product for executing test cases | |
WO2020024408A1 (zh) | 测试装置、测试的方法及存储介质 | |
US8910294B1 (en) | System and method for application failure testing in a cloud computing environment | |
CN110955589A (zh) | 基于浏览器的无头模式的测试方法、系统、设备及介质 | |
US11880484B2 (en) | Enforcing data isolation in jobs executed by a multi-tenant system on a secondary platform | |
Lemoudden et al. | Managing cloud-generated logs using big data technologies | |
US10579502B2 (en) | Resuming applications using pass-through servers and trace data | |
US10788997B2 (en) | Method and device for storage management with metadata stored in disk extents in an extent pool | |
CN111782452A (zh) | 接口对比测试的方法、系统、设备和介质 | |
CN111258592B (zh) | 一种应用于集群服务器的免安装串行执行方法与系统 | |
CN115203054A (zh) | 一种虚拟化芯片测试系统 | |
CN116743619B (zh) | 网络服务的测试方法、装置、设备及存储介质 | |
CN111290942A (zh) | 压力测试方法、装置以及计算机可读介质 | |
CN117290250A (zh) | 自动化测试框架建立方法、计算机设备及计算机存储介质 | |
CN111683091A (zh) | 一种访问云主机控制台方法、装置、设备及存储介质 | |
CN111324332A (zh) | 大数据任务的处理方法及系统、电子设备、存储介质 | |
US11347579B1 (en) | Instinctive slither application assessment engine | |
CN115509925A (zh) | 一种接口自动化测试方法及相关装置 | |
CN111078975B (zh) | 一种多节点增量式数据采集系统及采集方法 | |
KR20150096286A (ko) | 유휴 컴퓨터를 활용한 클라우드 대용량 데이터 분석 방법 | |
CN111459793B (zh) | 一种全生命周期的软件自动化测试方法和装置 | |
CN114780436A (zh) | 一种对系统数据进行定向清理的方法和装置 | |
US11501014B2 (en) | Secure data replication in distributed data storage environments | |
JP7251649B2 (ja) | グラフ関連付けシステムおよびグラフ関連付け方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |