CN109150941B - 一种数据中心物理资源浮动方法 - Google Patents

一种数据中心物理资源浮动方法 Download PDF

Info

Publication number
CN109150941B
CN109150941B CN201710499054.0A CN201710499054A CN109150941B CN 109150941 B CN109150941 B CN 109150941B CN 201710499054 A CN201710499054 A CN 201710499054A CN 109150941 B CN109150941 B CN 109150941B
Authority
CN
China
Prior art keywords
network
physical
host
mirror
computing cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710499054.0A
Other languages
English (en)
Other versions
CN109150941A (zh
Inventor
刘炳宏
龚晓锐
朴爱花
霍玮
宋振宇
王鹏举
刘歌
邹维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
Original Assignee
Institute of Information Engineering of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS filed Critical Institute of Information Engineering of CAS
Priority to CN201710499054.0A priority Critical patent/CN109150941B/zh
Publication of CN109150941A publication Critical patent/CN109150941A/zh
Application granted granted Critical
Publication of CN109150941B publication Critical patent/CN109150941B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)

Abstract

本发明提供一种数据中心物理资源浮动方法,包括以下步骤:将各计算集群中所有物理主机的一网卡网口作为镜像网络连接镜像交换机、其余网络作为主机网络连接主机交换机;在一计算集群中选取一台物理主机,将其设置为镜像网络启动,将该物理主机的操作系统通过镜像网络克隆成镜像模板;将该计算集群所需网络的交换机配置文件保存至主机交换机制作成网络配置模板;将前述镜像模板通过镜像网络批量还原到另一计算集群中的空闲物理主机上;对空闲物理主机所属计算集群的主机交换机加载前述网络配置模板。能够将物理资源批量地在各计算集群之间快速弹性伸缩,达到物理资源浮动效果,从而提高资源利用率。

Description

一种数据中心物理资源浮动方法
技术领域
本发明涉及IT领域,特别涉及数据中心物理资源浮动方法。
背景技术
近年来,云计算技术的蓬勃发展为整个IT行业带来了巨大变革。作为云计算的基础设施和下一代网络技术的创新平台,数据中心资源的研究成为了近年来学术界和工业界关注的热点。在新的应用模式下,数据中心存在多种系统和云计算集群,传统层次结构数据中心网络拓扑构建方式存在固化性,在规模、扩展性、利用率和成本方面存在诸多不足,无法支持多种计算集群间快速弹性伸缩,已经难以满足新形势下日益增长的高性能、高性价比、高利用率需求。
发明内容
为了克服现有技术的不足,本发明的目的为提供一种数据中心物理资源浮动方法,能够将物理资源批量地在各计算集群之间快速弹性伸缩,达到物理资源浮动效果,从而提高资源利用率;同时,还能按需保存各计算集群的中间状态,方便还原和故障处理,从而提高数据中心物理资源安全性,方便运行维护。
为了实现上述目的,本发明提供的技术方案如下:
一种数据中心物理资源浮动方法,所述物理资源包括物理主机及物理网络设备;物理网络设备包括管理交换机、镜像交换机和主机交换机;包括以下步骤:
1)将各计算集群中所有物理主机的远程管理网口作为远程网络连接管理交换机、一网卡网口作为镜像网络连接镜像交换机、其余网络作为主机网络连接主机交换机;
2)在一计算集群中选取一台物理主机,将其设置为镜像网络启动,将该物理主机的操作系统通过镜像网络克隆成镜像模板;
3)将该计算集群所需网络的交换机配置文件保存至主机交换机制作成网络配置模板;
4)将前述镜像模板通过镜像网络批量还原到另一计算集群中的空闲物理主机上;
5)对空闲物理主机所属计算集群的主机交换机加载前述网络配置模板。
进一步地,步骤1)中所述其余网络为除远程网络及镜像网络以外的操作系统的所有业务网络。
进一步地,步骤2)中选取的所述物理主机为计算集群中为布置操作系统和基础服务的非空闲物理主机。
进一步地,步骤2)中通过克隆软件将物理主机的操作系统通过镜像网络克隆成镜像模板。
进一步地,将步骤2)中的镜像模板存储至镜像服务器,各镜像模板中均部署自动配置程序和监控程序。
进一步地,所述自动配置程序用以根据制作像模板的操作系统的特有属性自动修改服务配置。
进一步地,所述监控程序用以在镜像模板还原后采集监控数据和日志,并发送至一监控服务器。
进一步地,步骤4)中将镜像模板通过镜像网络批量还原到空闲物理主机上之前首先将前述空闲物理主机设置为镜像网络启动。
进一步地,还包括将计算集群的中间态克隆成中间态镜像并保存至镜像服务器。
进一步地,在一计算集群中功能相同的物理主机只将其中一台备份为中间态镜像。
通过采取上述技术方案,本发明通过将计算集群中物理主机的操作系统克隆镜像模板,再将不同计算集群的交换机网络配置制作成不同的模板,然后在空闲物理主机加载镜像模板,再相应主机交换机在加载对应的配置模板,从而实现将数据中心的物理资源在不同集群间按需浮动切换;打破了计算集群之间的限制。在不需要改变网络结构情况下可实现网络切换;并且计算集群可大批量快速弹性伸缩;实现资源复用,更高效利用资源。
附图说明
图1为本发明一实施例中数据中心物理资源浮动方法实施的网络架构示意图。
图2为本发明一实施例中数据中心物理资源浮动方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。
如图2所示,本发明所提供的数据中心物理资源浮动方法,主要包括以下核心步骤:
1)将所有物理主机的远程管理网口作为远程网络连接管理交换机、一网卡网口作为镜像网络连接镜像交换机、其余网络作为主机网络连接主机交换机;
2)在一计算集群中选取一台物理主机,将其设置为镜像网络启动,将该物理主机的操作系统通过镜像网络克隆成镜像模板;
3)将该计算集群所需网络的交换机配置文件保存至主机交换机制作成网络配置模板;
4)将前述镜像模板通过镜像网络批量还原到另一计算集群中的空闲物理主机上;
5)对该空闲物理主机所属计算集群的主机交换机加载前述网络配置模板。
当然,上述图示所绘示的过程仅为示例性说明,按照本发明的思路,可以实现不止两个计算集群间的物理资源浮动,实际上,可以在控制范围内的所有计算集群中都选取一个物理主机制作成各计算集群的镜像模板,然后,在根据任务负荷情况,将一个或多个计算集群的镜像模板还原到另外的不同的计算集群中的空闲物理主机上,这些还原过程是可以同步操作的。
其中,数据中心的物理资源主要包括物理主机和物理网络设备。
参考图1所示的一实施例中的网络架构,图中共有三种网络,分别为远程网络、镜像网络和主机网络。其中,远程网络用于远程管理物理主机;镜像网络主要用于刷机镜像的备份和还原;主机网络主要是物理主机业务功能网络,比如访问互联网、数据交换等。图中共有三种交换机,分别为管理交换机、镜像交换机和主机交换机。其中,主机交换机可在各计算集群之间切换,即浮动交换机。将不同系统集群的交换机网络配置制作成不同的模板,主机交换机加载对应的配置模板即可实现集群间的浮动。
结合图1绘示的网络架构对前面的核心步骤做扩展性说明如下:
步骤1,将各计算集群中所有物理主机的远程管理网口作为远程网络连接管理交换机,一张网卡网口作为镜像网络连接镜像交换机,其余网络作为主机网络,用于实际业务用途。
对于各网口网络的具体说明:物理主机有固有专门的远程管理网口,即智能平台管理接口(IPMI)实现远程原理,是一张单独的网卡接口,管理硬件,不受操作系统影响。
远程网络主要是管理硬件、监控硬件和系统的运行状态,是独立于操作系统的管理接口,为物理资源浮动提供远程调试系统功能,当操作系统网络不能访问时,远程网络能起到远程调试作用。
其余网络是除前述两个网络外的操作系统的所有业务网络,比如公有网络,用于访问外网;私有网络,用于集群内部访问网络或数据网络等。
步骤2,同一计算集群中所有物理主机的操作系统是相同的,因此,则各计算集群中选择一台物理主机作为需要克隆的物理主机,将需要克隆的物理主机设置为镜像网络启动,并设置对应镜像网络的IP地址。
需要克隆的物理主机都是非空闲主机,但并不是所有的非空闲主机都需要克隆,只是将计算集群中可以扩展的节点(物理主机)作为需要克隆的物理主机。且所选的物理主机一般都是较纯净的物理主机,例如可以是只布置了操作系统和基础服务的物理主机。
而对应镜像网络的IP地址由备份还原软件(工具)在服务端设置,客户端开机后会自动获取对应的IP地址。
步骤3,利用克隆软件将计算集群中支持扩展的节点的操作系统通过镜像网络克隆成镜像模板,比如OpenStack节点镜像模板、vmware Vsphere节点镜像模板等。
步骤4,将各计算集群业务所需网络的交换机配置文件下载,并上传保存至浮动交换机上制作成网络配置模板。
步骤5,将步骤3中制作好的镜像模板存储到镜像服务器上,各镜像模板中均部署了自动配置程序和监控程序。
这两个程序都是在操作系统事先部署好的,并设置为开机自启动,然后备份为镜像,当镜像模板被还原为操作系统启动后,这两个程序开始自动执行。
步骤6,确定待刷机的台数、主机名和功能网口的IP地址,将待刷机物理主机设置为镜像网络启动后,利用克隆软件,将镜像模板通过镜像网络批量还原到空闲物理主机上,比如将计算集群1中的计算节点镜像模板还原至计算集群2中空闲的物理主机上,空闲物理主机的数量可根据需要确定,可以数十台,数百台,甚至更多。计算集群2中空闲的物理主机就切换成了计算集群1中的计算节点,这样,计算集群1实现了弹性扩展,计算集群2实现了弹性收缩,从而实现了物理资源在集群间浮动。
其中,待刷机台数、主机名和IP为人工确定,待刷机的物理主机是空闲的待还原的物理主机。
步骤7,对应的浮动交换机加载相应的网络配置模板,比如计算集群2中物理资源浮动到计算集群1中后,计算集群2中的浮动交换机加载计算集群1中需要的网络配置模板,以保障网络正常。
步骤8,自动配置程序根据网络现状自动配置各项服务,保证系统服务不冲突。
自动配置程序原理是根据被还原的操作系统的特有属性(IP、主机名)等智能自动修改服务配置,以保证服务的唯一性和稳定性。
步骤9,利用克隆软件,可按需将各计算集群中的中间态克隆成镜像并保存至镜像服务器,方便还原和记录。
中间态为公知术语,比如物理主机的操作系统运行到某时刻会产出结果数据,可以将其备份为镜像,可在多个时刻进行备份,操作系统的某时刻运行状态简称“中间态”。需保存的中间状态,由人工确定,一般为产生重要数据结果或里程碑节点,或是会有风险的操作之前,进行中间态备份。
需要说明的是,中间态克隆过程中不需要将所有物理主机的操作系统都克隆成镜像,功能相同的物理主机只需要其中一台备份为镜像即可。
步骤10,各镜像模板中的监控程序在镜像还原后将采集的监控数据和日志发回监控服务器进行处理,可以实时观察系统的状态和性能。
其中,监控服务器独立于两个(或多个)集群之外,有一台专门负责监控的服务器,收集数据进行处理。该服务器为常用服务器,只需部署监控软件的服务端即可。
综上,结合上述实施例的描述,本发明提供的方法实现了数据中心物理资源批量地在各计算集群之间快速浮动,并可按需保存各计算集群的中间状态。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种数据中心物理资源浮动方法,包括以下步骤:
1)将各计算集群中所有物理主机的远程管理网口作为远程网络、一网卡网口作为镜像网络、其余网络作为主机网络连接主机交换机;
2)在一计算集群中选取一台物理主机,将其设置为镜像网络启动,将该物理主机的操作系统通过镜像网络克隆成镜像模板;
3)将该计算集群所需网络的交换机配置文件保存至主机交换机制作成网络配置模板;
4)将前述镜像模板通过镜像网络批量还原到另一计算集群中的空闲物理主机上;
5)对空闲物理主机所属计算集群的主机交换机加载前述网络配置模板。
2.如权利要求1所述的数据中心物理资源浮动方法,其特征在于,步骤1)中所述其余网络为除远程网络及镜像网络以外的操作系统的所有业务网络。
3.如权利要求1所述的数据中心物理资源浮动方法,其特征在于,步骤2)中选取的所述物理主机为计算集群中布置操作系统和基础服务的非空闲物理主机。
4.如权利要求1所述的数据中心物理资源浮动方法,其特征在于,步骤2)中通过克隆软件将物理主机的操作系统通过镜像网络克隆成镜像模板。
5.如权利要求4所述的数据中心物理资源浮动方法,其特征在于,将步骤2)中的镜像模板存储至镜像服务器,各镜像模板中均部署自动配置程序和监控程序。
6.如权利要求5所述的数据中心物理资源浮动方法,其特征在于,所述自动配置程序用以根据制作像模板的操作系统的特有属性自动修改服务配置。
7.如权利要求5所述的数据中心物理资源浮动方法,其特征在于,所述监控程序用以在镜像模板还原后采集监控数据和日志,并发送至一监控服务器。
8.如权利要求1所述的数据中心物理资源浮动方法,其特征在于,步骤4)中将镜像模板通过镜像网络批量还原到空闲物理主机上之前将前述空闲物理主机设置为镜像网络启动。
9.如权利要求1所述的数据中心物理资源浮动方法,其特征在于,还包括将各计算集群的中间态克隆成中间态镜像并保存至镜像服务器。
10.如权利要求9所述的数据中心物理资源浮动方法,其特征在于,在一计算集群中功能相同的物理主机只将其中一台备份为中间态镜像。
CN201710499054.0A 2017-06-27 2017-06-27 一种数据中心物理资源浮动方法 Active CN109150941B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710499054.0A CN109150941B (zh) 2017-06-27 2017-06-27 一种数据中心物理资源浮动方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710499054.0A CN109150941B (zh) 2017-06-27 2017-06-27 一种数据中心物理资源浮动方法

Publications (2)

Publication Number Publication Date
CN109150941A CN109150941A (zh) 2019-01-04
CN109150941B true CN109150941B (zh) 2021-04-27

Family

ID=64804969

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710499054.0A Active CN109150941B (zh) 2017-06-27 2017-06-27 一种数据中心物理资源浮动方法

Country Status (1)

Country Link
CN (1) CN109150941B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111291227B (zh) * 2020-01-13 2023-04-11 鹏城实验室 大数据分析方法、装置、系统、设备和计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102016748A (zh) * 2008-04-21 2011-04-13 自适应计算企业股份有限公司 用于管理计算环境中的能量消耗的系统和方法
CN105607954A (zh) * 2015-12-21 2016-05-25 华南师范大学 一种有状态容器在线迁移的方法和装置
CN106371889A (zh) * 2016-08-22 2017-02-01 浪潮(北京)电子信息产业有限公司 一种调度镜像的高性能集群系统实现方法及装置
CN106708597A (zh) * 2015-11-17 2017-05-24 中国移动通信集团公司 一种基于Openstack创建集群环境的方法、装置及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7349913B2 (en) * 2003-08-21 2008-03-25 Microsoft Corporation Storage platform for organizing, searching, and sharing data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102016748A (zh) * 2008-04-21 2011-04-13 自适应计算企业股份有限公司 用于管理计算环境中的能量消耗的系统和方法
CN106708597A (zh) * 2015-11-17 2017-05-24 中国移动通信集团公司 一种基于Openstack创建集群环境的方法、装置及系统
CN105607954A (zh) * 2015-12-21 2016-05-25 华南师范大学 一种有状态容器在线迁移的方法和装置
CN106371889A (zh) * 2016-08-22 2017-02-01 浪潮(北京)电子信息产业有限公司 一种调度镜像的高性能集群系统实现方法及装置

Also Published As

Publication number Publication date
CN109150941A (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
CN103200036B (zh) 一种电力系统云计算平台的自动化配置方法
WO2017162173A1 (zh) 云服务器集群建立连接的方法和装置
US7716373B2 (en) Method, apparatus, and computer product for updating software
CN104956332B (zh) 一种用于管理计算资源的方法、存储媒体和计算系统
CN113037560B (zh) 业务流量切换方法及装置、存储介质、电子设备
US9634886B2 (en) Method and apparatus for providing tenant redundancy
CN110134518B (zh) 一种提高大数据集群多节点应用高可用性的方法及系统
CN109002354B (zh) 一种基于OpenStack的计算资源容量弹性伸缩方法及系统
CN107666493B (zh) 一种数据库配置方法及其设备
CN113032085A (zh) 云操作系统的管理方法、装置、服务器、管理系统及介质
CN111538561B (zh) 基于KVM虚拟化技术的OpenStack大规模集群部署测试的方法及系统
CN108347339B (zh) 一种业务恢复方法及装置
CN112948063B (zh) 云平台的创建方法、装置、云平台以及云平台实现系统
WO2016169166A1 (zh) 虚拟机调度方法和装置
CN107395710B (zh) 一种云平台网元的配置和高可用ha实现方法和装置
CN106130763A (zh) 服务器集群及适用于该集群的数据库资源组切换控制方法
CN108319492B (zh) 复位物理机的方法、装置与系统
CN110855739B (zh) 一种基于容器技术的异地及异构资源统一管理方法及系统
US11153173B1 (en) Dynamically updating compute node location information in a distributed computing environment
CN114338670B (zh) 一种边缘云平台和具有其的网联交通三级云控平台
CN109150941B (zh) 一种数据中心物理资源浮动方法
US11531572B2 (en) Cross-cluster host reassignment
CN105487946A (zh) 一种故障计算机自动切换方法及装置
US20200379900A1 (en) Configurable memory device connected to a microprocessor
CN116095145B (zh) 一种vpc集群的数据控制方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant