CN107506262A - 一种高性能集群用户系统备份与恢复的方法及装置 - Google Patents

一种高性能集群用户系统备份与恢复的方法及装置 Download PDF

Info

Publication number
CN107506262A
CN107506262A CN201710710721.5A CN201710710721A CN107506262A CN 107506262 A CN107506262 A CN 107506262A CN 201710710721 A CN201710710721 A CN 201710710721A CN 107506262 A CN107506262 A CN 107506262A
Authority
CN
China
Prior art keywords
information
cluster
file
user
new cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710710721.5A
Other languages
English (en)
Inventor
宋辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710710721.5A priority Critical patent/CN107506262A/zh
Publication of CN107506262A publication Critical patent/CN107506262A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种高性能集群用户系统备份与恢复的方法及装置,包括:信息确认模块,通过信息确认模块确认旧集群用户信息所涉及文件;信息压缩模块,通过信息压缩模块将确认的旧集群用户信息涉及文件压缩打包,并将压缩包复制到新集群中;信息提取模块,通过信息提取模块将新集群中压缩包文件编辑并提取为需要的格式,将提取的文件保存为临时文件;信息导入模块,通过信息导入模块将提取后的临时文件输出为用户信息并导入至新集群中;信息核查模块,通过信息核查模块检查新集群中用户信息导入结果是否正确。本发明既避免了人工操作的繁琐,减少实施工作量,节省项目时间成本,又保证了数据一致性,防止个别用户的编译环境因人工导入失误而变化。

Description

一种高性能集群用户系统备份与恢复的方法及装置
技术领域
本发明涉及高性能计算集群技术领域,具体地说是一种高性能集群用户系统备份与恢复的方法及装置。
背景技术
高性能计算,谓之“国之重器”,其制造和应用水平不仅代表国家的科技发展水平,更是国家在经济建设中塑造核心竞争力的关键武器。在高性能+云计算时代,各地大规模采用HPC集群进行科学计算及商用计算的场景已经来临,并渗透到各行各业。以前的“搞科研才用HPC”的概念已不复存在,各种商业公司在创造生产力的同时,也借助HPC的改进生产效率,从而将虚拟的、仿真阶段所花的时间和成本降至最低,缩短企业研发产品加快产品上市的时间,加快企业的创新速度。
由于摩尔定律的存在,高性能计算集群采用的CPU在两三年时间内便会落后于计算力的发展,面临更新换代。当新一代集群安装部署后,首先面临的一个问题便是如何将原有集群上的计算环境及计算数据迁移至新的集群中。多年来,Linux操作系统一直是超级计算机领域里的王者。在世界最快超级计算机TOP500排名中,Linux操作系统不仅占据主导地位,且远远将其他对手甩在身后。若在Linux新集群中重新部署使用环境,不仅费时费力,还可能丢失原有用户自己部署的个性化使用环境,从而出现新旧集群迁移的空档期,影响集群用户的计算任务。
发明内容
本发明的技术任务是提供一种高性能集群用户系统备份与恢复的方法及装置。
本发明的技术任务是按以下方式实现的:
一种高性能集群用户系统备份与恢复的方法,包括:
创建信息确认模块,通过信息确认模块确认旧集群用户信息所涉及文件;
创建信息压缩模块,通过信息压缩模块将确认的旧集群用户信息涉及文件压缩打包,并将压缩包复制到新集群中;
创建信息提取模块,通过信息提取模块将新集群中压缩包文件编辑并提取为需要的格式,将提取的文件保存为临时文件;
创建信息导入模块,通过信息导入模块将提取后的临时文件输出为用户信息并导入至新集群中;
创建信息核查模块,通过信息核查模块检查新集群中用户信息导入结果是否正确。
所述的确认旧集群用户信息所涉及文件,所述的文件包括用户基本信息、用户密码、组信息及bash环境变量。
所述的确认旧集群用户信息所涉及文件,包括,
登录旧集群,通过cat命令确认用户信息所涉及文件状况。
所述的将确认的旧集群用户信息涉及文件压缩打包,并将压缩包复制到新集群中,包括;
通过saveold脚本,将旧集群用户信息文件压缩打包。
所述的将提取的文件保存为临时文件,所述的临时文件为userlist、shadowlist和grouplist。
所述的将提取后的临时文件输出为用户信息并导入至新集群中,包括;
通过revivenew脚本,将收集的用户信息导入至新集群中,并恢复相关用户的环境变量设置。
所述的新集群中,在NIS管理节点上执行"cd /var/yp, make",更新集群NIS信息。
所述的检查新集群中用户信息导入结果是否正确,包括;
在新集群中任意切换普通用户,检查测试用户使用环境是否正常。
一种高性能集群用户系统备份与恢复的装置,基于Linux系统,采用Linux Shell脚本,包括:
信息确认模块、信息压缩模块、信息提取模块、信息导入模块和信息核查模块。
所述的信息确认模块用于确认旧集群用户信息所涉及文件;
所述的信息压缩模块用于将确认的旧集群用户信息涉及文件压缩打包,并将压缩包复制到新集群中;
所述的信息提取模块用于将新集群中压缩包文件编辑并提取为需要的格式,将提取的文件保存为临时文件;
所述的信息导入模块用于将提取后的临时文件输出为用户信息并导入至新集群中;
所述的信息核查模块用于检查新集群中用户信息导入结果是否正确。
本发明的一种高性能集群用户系统备份与恢复的方法及装置和现有技术相比,既避免了人工操作的繁琐,大大减少实施工作量,节省项目时间成本,又保证了数据一致性,防止个别用户的编译环境因人工导入失误而变化;且在RedHat和CentOS发行版环境中具有通用性和易移植性。
附图说明
附图1为实施例2高性能集群用户系统备份与恢复的方法的流程示意图。
具体实施方式
实施例1:
创建高性能集群用户系统备份与恢复的装置,基于Linux系统,采用Linux Shell脚本,包括:
信息确认模块、信息压缩模块、信息提取模块、信息导入模块和信息核查模块。
所述的信息确认模块用于确认旧集群用户信息所涉及文件;
所述的信息压缩模块用于将确认的旧集群用户信息涉及文件压缩打包,并将压缩包复制到新集群中;
所述的信息提取模块用于将新集群中压缩包文件编辑并提取为需要的格式,将提取的文件保存为临时文件;
所述的信息导入模块用于将提取后的临时文件输出为用户信息并导入至新集群中;
所述的信息核查模块用于检查新集群中用户信息导入结果是否正确。
高性能集群用户系统备份与恢复的方法,包括:
创建信息确认模块,通过信息确认模块cat命令确认旧集群用户信息所涉及文件;所述的文件包括用户基本信息、用户密码、组信息及bash环境变量。
创建信息压缩模块,通过信息压缩模块saveold脚本将确认的旧集群用户信息涉及文件压缩打包,并将压缩包复制到新集群中;
创建信息提取模块,通过信息提取模块将新集群中压缩包文件编辑并提取为需要的格式,将提取的文件保存为临时文件;所述的临时文件为userlist、shadowlist和grouplist。
创建信息导入模块,通过信息导入模块revivenew脚本将提取后的临时文件输出为用户信息并导入至新集群中,并恢复相关用户的环境变量设置;
所述的新集群中,在NIS管理节点上执行"cd /var/yp, make",更新集群NIS信息。
创建信息核查模块,通过信息核查模块检查新集群中用户信息导入结果是否正确;包括,在新集群中任意切换普通用户,检查测试用户使用环境是否正常。
实施例2:
创建高性能集群用户系统备份与恢复的装置,基于Linux系统,采用Linux Shell脚本,包括:
信息确认模块、信息压缩模块、信息提取模块、信息导入模块和信息核查模块。
所述的信息确认模块用于确认旧集群用户信息所涉及文件;
所述的信息压缩模块用于将确认的旧集群用户信息涉及文件压缩打包,并将压缩包复制到新集群中;
所述的信息提取模块用于将新集群中压缩包文件编辑并提取为需要的格式,将提取的文件保存为临时文件;
所述的信息导入模块用于将提取后的临时文件输出为用户信息并导入至新集群中;
所述的信息核查模块用于检查新集群中用户信息导入结果是否正确。
高性能集群用户系统备份与恢复的方法,包括:
创建信息确认模块,通过信息确认模块cat命令确认旧集群用户信息所涉及文件;所述的文件包括用户基本信息、用户密码、组信息及bash环境变量,文件状况,包括但不限于以下:
/etc/passwd
/etc/shadow
/etc/group
$HOME/.bashrc
创建信息压缩模块,通过信息压缩模块saveold脚本将确认的旧集群用户信息涉及文件压缩打包,并将压缩包复制到新集群中;
saveold脚本内容如下:
#!/bin/bash
cp /etc/passwd ~/saveold/passwd-bak
cp /etc/shadow ~/saveold/shadow-bak
cp /etc/group ~/saveold/group-bak
awk -F: '($3>=500) && ($3!=65534)' ~/saveold/passwd-bak | cut -d: -f1,3,4> ~/saveold/userlist
cut -d: -f1,2 ~/saveold/shadow-bak > ~/saveold/shadowlist
awk -F: '($3>=500) && ($3!=65534)' ~/saveold/group-bak | cut -d: -f1,3 >~/saveold/grouplist
for user in `awk -F: '{print $1}' ~/saveold/userlist`
do
cp /home/$user/.bashrc ~/saveold/bashrc/$user.bashrc
done
tar zcf saveold.tgz ~/saveold/
创建信息提取模块,通过信息提取模块将新集群中压缩包文件编辑并提取为需要的格式,将提取的文件保存为临时文件;所述的临时文件为userlist、shadowlist和grouplist。
创建信息导入模块,通过信息导入模块revivenew脚本将提取后的临时文件输出为用户信息并导入至新集群中,并恢复相关用户的环境变量设置;
revivenew脚本内容如下:
#!/bin/bash
tar zxf saveold.tgz
for group in `awk -F: '{print $1}' ~/saveold/grouplist
do
export groupid=`grep -w $group ~/saveold/grouplist | awk -F: '{print $2}'`
groupadd -g $groupid $group
done
newusers < ~/saveold/passwd-bak
chpasswd -e < ~/saveold/shadowlist
for user in `awk -F: '{print $1}' ~/saveold/userlist`
do
export groupid=`grep -w $user ~/saveold/userlist | awk -F: '{print $3}'`
export group=`grep -w $groupid ~/saveold/grouplist | awk -F: '{print $1}'`
echo "$user:$group"
cp -a /etc/skel/.bash* /etc/skel/.mozilla/ /etc/skel/.config /home/$user
cp -a ~/saveold/bashrc/$user.bashrc /home/$user/.bashrc
chown -R $user:$group /home/$user
done
所述的新集群中,在NIS管理节点上执行"cd /var/yp, make",更新集群NIS信息。
创建信息核查模块,通过信息核查模块检查新集群中用户信息导入结果是否正确;包括,在新集群中任意切换普通用户,检查测试用户使用环境是否正常。
通过上面具体实施方式,所述技术领域的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的几种具体实施方式。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。

Claims (10)

1.一种高性能集群用户系统备份与恢复的方法,其特征在于,包括:
创建信息确认模块,通过信息确认模块确认旧集群用户信息所涉及文件;
创建信息压缩模块,通过信息压缩模块将确认的旧集群用户信息涉及文件压缩打包,并将压缩包复制到新集群中;
创建信息提取模块,通过信息提取模块将新集群中压缩包文件编辑并提取为需要的格式,将提取的文件保存为临时文件;
创建信息导入模块,通过信息导入模块将提取后的临时文件输出为用户信息并导入至新集群中;
创建信息核查模块,通过信息核查模块检查新集群中用户信息导入结果是否正确。
2.根据权利要求1所述的的方法,其特征在于,所述的确认旧集群用户信息所涉及文件,所述的文件包括用户基本信息、用户密码、组信息及bash环境变量。
3.根据权利要求1或2的的方法,其特征在于,所述的确认旧集群用户信息所涉及文件,包括,
登录旧集群,通过cat命令确认用户信息所涉及文件状况。
4.根据权利要求1所述的的方法,其特征在于,所述的将确认的旧集群用户信息涉及文件压缩打包,并将压缩包复制到新集群中,包括;
通过saveold脚本,将旧集群用户信息文件压缩打包。
5.根据权利要求1所述的的方法,其特征在于,所述的将提取的文件保存为临时文件,所述的临时文件为userlist、shadowlist和grouplist。
6.根据权利要求1所述的的方法,其特征在于,所述的将提取后的临时文件输出为用户信息并导入至新集群中,包括;
通过revivenew脚本,将收集的用户信息导入至新集群中,并恢复相关用户的环境变量设置。
7.根据权利要求1或6所述的的方法,其特征在于,所述的新集群中,在NIS管理节点上执行"cd /var/yp, make",更新集群NIS信息。
8.根据权利要求1所述的的方法,其特征在于,所述的检查新集群中用户信息导入结果是否正确,包括;
在新集群中任意切换普通用户,检查测试用户使用环境是否正常。
9.一种高性能集群用户系统备份与恢复的装置,其特征在于,基于Linux系统,采用Linux Shell脚本,包括:
信息确认模块、信息压缩模块、信息提取模块、信息导入模块和信息核查模块。
10.根据权利要求9所述的装置,其特征在于,所述的信息确认模块用于确认旧集群用户信息所涉及文件;
所述的信息压缩模块用于将确认的旧集群用户信息涉及文件压缩打包,并将压缩包复制到新集群中;
所述的信息提取模块用于将新集群中压缩包文件编辑并提取为需要的格式,将提取的文件保存为临时文件;
所述的信息导入模块用于将提取后的临时文件输出为用户信息并导入至新集群中;
所述的信息核查模块用于检查新集群中用户信息导入结果是否正确。
CN201710710721.5A 2017-08-18 2017-08-18 一种高性能集群用户系统备份与恢复的方法及装置 Pending CN107506262A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710710721.5A CN107506262A (zh) 2017-08-18 2017-08-18 一种高性能集群用户系统备份与恢复的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710710721.5A CN107506262A (zh) 2017-08-18 2017-08-18 一种高性能集群用户系统备份与恢复的方法及装置

Publications (1)

Publication Number Publication Date
CN107506262A true CN107506262A (zh) 2017-12-22

Family

ID=60692147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710710721.5A Pending CN107506262A (zh) 2017-08-18 2017-08-18 一种高性能集群用户系统备份与恢复的方法及装置

Country Status (1)

Country Link
CN (1) CN107506262A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110286732A (zh) * 2019-06-27 2019-09-27 无锡华云数据技术服务有限公司 高可用集群掉电自动恢复方法、装置、设备及存储介质
CN113300913A (zh) * 2021-06-21 2021-08-24 北京飞讯数码科技有限公司 一种设备测试方法、装置、测试设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110178983A1 (en) * 2006-11-08 2011-07-21 Hitachi Data Systems Corporation Fast primary cluster recovery
CN103412768A (zh) * 2013-07-19 2013-11-27 蓝盾信息安全技术股份有限公司 一种基于脚本程序自动化部署Zookeeper集群的方法
CN103475734A (zh) * 2013-09-25 2013-12-25 浪潮电子信息产业股份有限公司 一种Linux集群用户备份迁移的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110178983A1 (en) * 2006-11-08 2011-07-21 Hitachi Data Systems Corporation Fast primary cluster recovery
CN103412768A (zh) * 2013-07-19 2013-11-27 蓝盾信息安全技术股份有限公司 一种基于脚本程序自动化部署Zookeeper集群的方法
CN103475734A (zh) * 2013-09-25 2013-12-25 浪潮电子信息产业股份有限公司 一种Linux集群用户备份迁移的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韩晓雨 等: "在Linux上实现异地全自动备份", 《科技信息》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110286732A (zh) * 2019-06-27 2019-09-27 无锡华云数据技术服务有限公司 高可用集群掉电自动恢复方法、装置、设备及存储介质
CN110286732B (zh) * 2019-06-27 2021-01-12 华云数据控股集团有限公司 高可用集群掉电自动恢复方法、装置、设备及存储介质
CN113300913A (zh) * 2021-06-21 2021-08-24 北京飞讯数码科技有限公司 一种设备测试方法、装置、测试设备及存储介质
CN113300913B (zh) * 2021-06-21 2023-01-06 北京飞讯数码科技有限公司 一种设备测试方法、装置、测试设备及存储介质

Similar Documents

Publication Publication Date Title
CN103970585B (zh) 创建虚拟机的方法及装置
CN102591654B (zh) 一种基于ssh架构的代码生成器及方法
CN102981933B (zh) 物联网感知层的数据增量备份方法及系统
CN104391692B (zh) 用于读写psd‑bpa数据文件的面向对象编程方法
CN105022656A (zh) 虚拟机快照管理方法和装置
CN102890735B (zh) 稳控装置的策略表和策略搜索匹配的建模方法
CN103164295B (zh) 基于zfs文件系统和kvm内核虚拟底层系统的企业it业务虚拟化容灾方法
CN104063325A (zh) 一种针对嵌入式软件的测试用例自动化生成装置及其方法
CN102917064B (zh) 基于私有云计算平台的双机热备方法
CN112270550A (zh) 一种基于区块链的新能源电力溯源方法及系统
CN101963911B (zh) 补丁生成方法和装置
CN106815096A (zh) 一种数据管理方法与装置
CN107506262A (zh) 一种高性能集群用户系统备份与恢复的方法及装置
CN104375905A (zh) 一种基于数据块的增量备份的方法和系统
CN102024021A (zh) 一种逻辑文件系统元数据的日志方法
CN107329806A (zh) 一种开发环境构建方法及装置
CN105376329A (zh) 一种远程在线备份虚拟机的方法
CN102486749A (zh) 数据驱动测试方法及系统
CN105678118B (zh) 一种含数字证书的软件版本生成方法及装置
CN111949445A (zh) 一种增量备份数据存储方法、装置、设备、产品
Agullo et al. On the resilience of parallel sparse hybrid solvers
CN103699746B (zh) 基于数据库的cadds5管系三维设计方法及系统
CN103514074A (zh) Mvb网卡开发方法及平台
CN103677819A (zh) 基于osgi的代码正向工程的实现方法和实现装置
CN109684517A (zh) 一种历史数据存储方法、读写方法、存储装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171222

RJ01 Rejection of invention patent application after publication