CN112000421B - 基于超融合架构的管理调度技术 - Google Patents

基于超融合架构的管理调度技术 Download PDF

Info

Publication number
CN112000421B
CN112000421B CN202010678625.9A CN202010678625A CN112000421B CN 112000421 B CN112000421 B CN 112000421B CN 202010678625 A CN202010678625 A CN 202010678625A CN 112000421 B CN112000421 B CN 112000421B
Authority
CN
China
Prior art keywords
resource
container
virtualization
service
fusion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010678625.9A
Other languages
English (en)
Other versions
CN112000421A (zh
Inventor
潘艳红
王泊涵
孙渊博
张宁雨
葛光富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Computer Technology and Applications
Original Assignee
Beijing Institute of Computer Technology and Applications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Computer Technology and Applications filed Critical Beijing Institute of Computer Technology and Applications
Priority to CN202010678625.9A priority Critical patent/CN112000421B/zh
Publication of CN112000421A publication Critical patent/CN112000421A/zh
Application granted granted Critical
Publication of CN112000421B publication Critical patent/CN112000421B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了基于超融合架构的管理调度技术,包括超融合系统架构设计、基于超融合架构的资源一体化管理、面向国产异构平台的统一计算虚拟化、基于分布式存储的存储虚拟化、基于软件定义的网络虚拟化和面向高机动环境的容器动态调度管理技术。本发明提供的基于超融合架构的管理调度技术提升战术云平台的虚拟化能力和管理能力,为构建陆军机动战术云全链路生态提供关键技术支撑,提供按需弹性的虚拟化计算存储资源池,实现异构融合计算虚拟化,同时利用分布式存储技术构建存储资源池,软件定义技术构建虚拟网络,形成超融合资源池,实现应用服务的本地化数据和网络访问,解决传统虚拟化部署模式的I/O瓶颈问题,提高服务响应性能。

Description

基于超融合架构的管理调度技术
技术领域
本发明涉及云计算领域,具体来说,涉及基于超融合架构的管理调度技术。
背景技术
随着陆军部队转型,作战机动性越来越高,信息服务车、指挥车战术前沿装备硬件资源受限,需要对车载平台的计算、存储、网络资源进行高效的管理。依托传统的虚拟化技术进行资源管理难以满足要求:一是KVM、XEN等服务器虚拟化技术具有很高的隔离度,但虚拟机比较“笨重”,难以适应动态的战场环境;二是传统虚拟化架构下,计算与存储分离,使得应用读取数据存在性能瓶颈;三是受限于性能及技术瓶颈,目前传统服务器虚拟化技术在国产CPU平台上运行效率低下,无法满足战场实用需求。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
本发明的目的在于提供基于超融合架构的管理调度技术,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:基于超融合架构的管理调度方法,包括超融合系统架构设计、基于超融合架构的资源一体化管理、面向国产异构平台的统一计算虚拟化、基于分布式存储的存储虚拟化、基于软件定义的网络虚拟化和面向高机动环境的容器动态调度管理技术,所述超融合基础设施层基础设施层包括搭建超融合云平台的物理基础设施,在信息服务车、指挥车车载环境内,由异构CPU的服务器集群、车内万兆网络组成超融合的计算存储环境支撑,为基础设施之上构建超融合虚拟化资源池提供支撑;
所述超融合资源池通过采用虚拟化和超融合技术对单车环境内的硬件设施和基础软件进行虚拟化封装,向用户提供信息基础设施服务,在车内异构服务器上部署超融合组件,利用超融合技术构建统一虚拟化资源池,即Docker轻量级虚拟化技术构建异构计算资源池,分布式存储虚拟化技术构建统一存储资源池,软件定义网络技术构建虚拟化网络环境,其中异构计算资源池纳管车内不同架构CPU服务器的异构计算资源,支持融合管理不少于2种国产CPU计算资源;
所述资源调度层为整个平台系统提供快速创建、按需调度、自动伸缩、安全可靠的轻量级虚拟化平面资源环境,其中容器集群调度器是在虚拟资源池上提供的计算、存储、网络资源监控和调度管理,从而实现容器基于负载的自适应弹性伸缩、容器网络通信管理;
所述基于超融合架构的资源一体化管理在单车内异构服务器上部署超融合组件,利用超融合技术构建统一虚拟化资源池,即Docker轻量级虚拟化技术构建异构计算资源池,Ceph分布式存储虚拟化技术构建统一存储资源池,软件定义技术构建虚拟网络子网,在用户进行应用访问时,后台无需从存储端取出数据,而是将计算直接分发到存储上运行,将计算作为传输单元进行传输,这样大量的存储数据都是本地访问,不需要再跨网络传输,计算和存储运行在了一个服务器上,实现超融合架构下的应用快速响应;
所述面向国产异构平台的统一计算虚拟化分为基于容器的计算资源虚拟化和异构CPU计算资源融合管理,其特征在于:
所述基于容器的计算资源虚拟化是基于Docker容器技术,Docker容器虚拟化技术使用Client-server架构模式,Docker由守护进程、镜像维护、容器管理驱动模块组成,Docker守护进程(Docker-daemon)负责响应来自Docker客户端的请求,然后将这些请求翻译成系统调用完成容器管理操作,该进程会在后台启动一个API服务,负责接收由Dockerclient发送的请求,接收到的请求将通过Docker守护进程内部的一个路由分发调度,再由具体的函数来执行请求,以Docker轻量级虚拟化技术实现计算资源虚拟化,实现在自主可控服务器性能不占优的现状下更高效的利用国产化服务器的计算资源,实现计算资源整合池化、按需调度功能;
所述异构CPU计算资源融合管理由面向通用服务的Service系统和基于服务代理的实例通信组合构成,所述面向通用服务的Service系统的服务层可提供的服务主要包括以下六种类型:数据库服务、存储类服务、中间件服务、基本计算、网络服务、其他类型服务,服务层包括两部分:服务网关和服务节点,服务节点是实际实现基础服务的位置,即应用程序实例绑定的基础服务是由服务节点来实现,启动服务网关时,首先向云控制器发送heartbeat,实际上是一个POST请求,当云控制器接收到上述的请求后,它会向其数据库中插入一条该服务网关的信息,此时注册生效,然后服务网关会查看云控制器的响应状态,若响应结果是成功,此时服务网关在云控制器中注册成功,由于网关在工作过程中会用到一些服务配置和绑定的信息,而由于网关存储的信息都是在云控制器结点上开辟内存来实现的,所以每次在网关启动的时候,都需要向云控制器发送一个获取握手的命令,从而在云控制器结点中找到关于该网关负责服务的服务信息并返回;
所述基于服务代理的实例通信基于服务代理的实例通信技术基于数据库引擎集成各种资源服务,如Mongo、MySQL、RabbitMQ和Redis缓存,通过控制台,用户可以浏览到各种服务的代理,通过简单地界面操作,就可以完成创建和销毁不同规格的服务实例,将目标服务实例与应用绑定,并以安全的方式将服务实例的访问信息和密钥注入到应用容器中,其中服务代理(简称SSB)负责提供一个强大的异步编程模型,可在服务实例之间完成高效可靠的异步通信;
所述基于分布式存储的存储虚拟化基于Ceph技术的分布式存储架构,为自主可控的陆军机动战术云平台提供存储支撑,且可以运行在集网络、计算为一体的超融合云平台节点上,Ceph技术的分布式存储架构基于RADOS提供无限可扩展的存储集群,RADOS是一种可靠的、自动化的、分布式的对象存储,存储Ceph系统中的用户数据,物理上,RADOS由大量的存储设备节点组成,每个节点拥有自己的硬件资源,并运行操作系统和文件系统,基础库librados:Ceph客户端用一定的协议和存储集群交互,并把该功能封装进librados库,基于librados库可创建定制客户端,高层应用接口使用RADOS GW对象网关、RBD块设备接口以及Ceph FS,一个POSIX兼容的分布式文件系统,应用层是不同场景下对于Ceph各个应用接口的各种应用方式,对外统一提供对象存储、块存储和文件存储,并且提供了无限扩展能力;
所述基于软件定义的网络虚拟化包括虚拟网络映射平面、网络结构虚拟化和网络资源隔离三个步骤;
所述虚拟网络映射平面实现面向用户和面向底层网络的透明虚拟化,虚拟化平面管理全部的物理网络拓扑,并向用户提供隔离的虚拟网络;
所述网络结构虚拟化对物理网络结构进行抽象虚拟化;
所述网络资源隔离拟化仅仅完成了物理资源到虚拟资源的抽象过程,为实现完全的网络虚拟化,还需要对不同的用户提供隔离的网络资源;
所述面向高机动环境的容器动态调度管理技术包括容器集群调度器设计、容器网络通信管理与优化和基于负载的自适应弹性伸缩,其特征在于:
所述容器集群调度器设计基于Kubernetes的容器集群管理系统架构集群中的机器被划分为一个Master节点和一群工作节点,其中Master节点上运行着集群管理相关的一组进程API服务、管理控制器、调度器和高可用键值数据库Etcd四个组件,其中前三个组件构成了集群的总控中心,负责对集群中所有资源进行管控和调度,在每个Node节点上运行Kubelet、容器虚拟化、存储虚拟化和网络虚拟化的组件,负责对本节点的Pod的生命周期进行管理,以及实现服务代理的功能,在所有节点运行Kunbectl命令行工具,提供集群管理工具集,集群中的调度器负责Pod在集群节点中的调度分配,接收控制器创建的新Pod,为其安排一个目标Node,目标Node上的Kubelet服务进程接管后续工作负责Pod整个生命周期,调度器的作用是将带调度的Pod按照特定的调度算法和调度策略绑定到集群中的某个Node上,并将绑定信息写入etcd中,在整个调度过程中涉及三个对象,分别是:带调度Pod列表、可用Node列表,以及调度算法和策略;
所述容器网络通信管理与优化包括容器到容器之间的直接通信、Pod到Pod之间的通信和Pod到Service之间的通信三个部分;
所述基于负载的自适应弹性伸缩基于负载的弹性调度系统能够对容器环境的计算、存储负载情况进行监控,并根据实时负载进行自适应弹性伸缩调度,系统主要由底层容器集群、负载均衡和伸缩控制系统这三部分组成,上层微服务基于Docker容器进行构建,负载均衡使得集群中的微服务容器能够正常收到用户的请求,伸缩控制系统是整个系统架构的核心部分,包括资源监控模块、伸缩决策模块和资源调度模块,其中资源监控模块负责统计物理主机和Docker容器的资源使用情况并报告给伸缩决策模块,伸缩决策模块会分析统计数据从而决定是否需要进行扩容或缩容,资源调度模块负责对底层的容器资源进行调度,负责容器的创建和销毁工作,资源动态调度算法在容器集群中每个节点上所有运行着的应用实例之间进行资源动态调度,当可以利用容器集群上应用实例的资源监控数据生成预测数据后,针对每种资源运用该算法生成一系列资源伸缩决策,并将决策响应到容器的请求资源限制中。
进一步的,所述网络资源隔离包括控制面隔离、数据面隔离和地址隔离,其特征在于:
所述控制面隔离保证用户的控制器在运行时不受其他用户控制器的影响,保证用户对虚拟化平面资源的使用;
所述数据面隔离保证用户的资源不被其他用户所占据;
所述地址隔离为使用户能在自己的虚拟用户网中任意使用地址。
进一步的,所述基于负载的自适应弹性伸缩包括资源监控架构设计、伸缩决策模块设计和资源调度架构设计,其特征在于:
所述资源监控架构设计资源监控模块需要对主机和容器的CPU、内存和磁盘资源使用情况进行收集并进行存储,按照功能可以将其划分为数据采集(Agent端)、监控服务(Monitor)、数据存储(Data Server)和仪表盘(Dashboards)这四个模块;
所述伸缩决策模块设计伸缩决策模块主要负责对资源监控模块产生的监控数据进行分析并做出相应的伸缩决策,主要包括建模模块和控制模块,建模预测模块主要针对使用预测型伸缩算法的网络流量这一指标,它会从数据库中获取网络流量的历史观测数据并进行建模预测,给出网络流量的预测数据,控制模块会不断获取建模预测模块和监控服务模块的数据,只要有一种规则指定的数据超过阈值时,便会触发相应的伸缩指令;
所述资源调度架构设计资源调度模块主要负责对容器集群进行数量上的调整,会一直等待伸缩决策模块的伸缩指令,然后执行相应的容器调度命令,包括新建容器和销毁容器,资源调度模块主要由容器调度模块(Docker Scheduler)和管理器模块(Manager)这两部分构成,其中容器调度模块负责每台主机上的容器创建或销毁任务,管理器模块则负责容器调度的计算及分配,在接收到伸缩决策模块的伸缩指令时会自动给容器调度模块发送相应的命令。
与现有技术相比,本发明具有以下有益效果:
(1)本发明提供的基于超融合架构的管理调度技术创新地提出基于超融合架构的轻量级虚拟化技术,提升战术云平台的虚拟化能力和管理能力,为构建陆军机动战术云全链路生态提供关键技术支撑,利用Docker容器技术构建虚拟化计算资源池,将多台物理服务器上的多个虚拟机组合成可弹性扩展的计算集群,提供按需弹性的虚拟化计算存储资源池,基于开源Kubernetes实现虚拟机集群管理,为容器化的应用提供资源调度、部署运行、服务发现、扩容、缩容等一整套功能,针对国产异构CPU架构和指令集,对Docker和Kubernetes进行代码级重构和适配,实现异构融合计算虚拟化,同时利用分布式存储技术构建存储资源池,软件定义技术构建虚拟网络,形成超融合资源池,实现应用服务的本地化数据和网络访问,解决传统虚拟化部署模式的I/O瓶颈问题,提高服务响应性能。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“顶部”、“底部”、“一侧”、“另一侧”、“前面”、“后面”、“中间部位”、“内部”、“顶端”、“底端”等指示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制;术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性;此外,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
根据本发明实施例的基于超融合架构的管理调度方法,包括超融合系统架构设计、基于超融合架构的资源一体化管理、面向国产异构平台的统一计算虚拟化、基于分布式存储的存储虚拟化、基于软件定义的网络虚拟化和面向高机动环境的容器动态调度管理技术,所述超融合基础设施层基础设施层包括搭建超融合云平台的物理基础设施,在信息服务车、指挥车车载环境内,由异构CPU的服务器集群、车内万兆网络组成超融合的计算存储环境支撑,为基础设施之上构建超融合虚拟化资源池提供支撑;
所述超融合资源池通过采用虚拟化和超融合技术对单车环境内的硬件设施和基础软件进行虚拟化封装,向用户提供信息基础设施服务,在车内异构服务器上部署超融合组件,利用超融合技术构建统一虚拟化资源池,即Docker轻量级虚拟化技术构建异构计算资源池,分布式存储虚拟化技术构建统一存储资源池,软件定义网络技术构建虚拟化网络环境,其中异构计算资源池纳管车内不同架构CPU服务器的异构计算资源,支持融合管理不少于2种国产CPU计算资源;
所述资源调度层为整个平台系统提供快速创建、按需调度、自动伸缩、安全可靠的轻量级虚拟化平面资源环境,其中容器集群调度器是在虚拟资源池上提供的计算、存储、网络资源监控和调度管理,从而实现容器基于负载的自适应弹性伸缩、容器网络通信管理;
所述基于超融合架构的资源一体化管理在单车内异构服务器上部署超融合组件,利用超融合技术构建统一虚拟化资源池,即Docker轻量级虚拟化技术构建异构计算资源池,Ceph分布式存储虚拟化技术构建统一存储资源池,软件定义技术构建虚拟网络子网,在用户进行应用访问时,后台无需从存储端取出数据,而是将计算直接分发到存储上运行,将计算作为传输单元进行传输,这样大量的存储数据都是本地访问,不需要再跨网络传输,计算和存储运行在了一个服务器上,实现超融合架构下的应用快速响应;
所述面向国产异构平台的统一计算虚拟化分为基于容器的计算资源虚拟化和异构CPU计算资源融合管理,其特征在于:
所述基于容器的计算资源虚拟化是基于Docker容器技术,Docker容器虚拟化技术使用Client-server架构模式,Docker由守护进程、镜像维护、容器管理驱动模块组成,Docker守护进程(Docker-daemon)负责响应来自Docker客户端的请求,然后将这些请求翻译成系统调用完成容器管理操作,该进程会在后台启动一个API服务,负责接收由Dockerclient发送的请求,接收到的请求将通过Docker守护进程内部的一个路由分发调度,再由具体的函数来执行请求,以Docker轻量级虚拟化技术实现计算资源虚拟化,实现在自主可控服务器性能不占优的现状下更高效的利用国产化服务器的计算资源,实现计算资源整合池化、按需调度功能;
所述异构CPU计算资源融合管理由面向通用服务的Service系统和基于服务代理的实例通信组合构成,所述面向通用服务的Service系统的服务层可提供的服务主要包括以下六种类型:数据库服务、存储类服务、中间件服务、基本计算、网络服务、其他类型服务,服务层包括两部分:服务网关和服务节点,服务节点是实际实现基础服务的位置,即应用程序实例绑定的基础服务是由服务节点来实现,启动服务网关时,首先向云控制器发送heartbeat,实际上是一个POST请求,当云控制器接收到上述的请求后,它会向其数据库中插入一条该服务网关的信息,此时注册生效,然后服务网关会查看云控制器的响应状态,若响应结果是成功,此时服务网关在云控制器中注册成功,由于网关在工作过程中会用到一些服务配置和绑定的信息,而由于网关存储的信息都是在云控制器结点上开辟内存来实现的,所以每次在网关启动的时候,都需要向云控制器发送一个获取握手的命令,从而在云控制器结点中找到关于该网关负责服务的服务信息并返回;
所述基于服务代理的实例通信基于服务代理的实例通信技术基于数据库引擎集成各种资源服务,如Mongo、MySQL、RabbitMQ和Redis缓存,通过控制台,用户可以浏览到各种服务的代理,通过简单地界面操作,就可以完成创建和销毁不同规格的服务实例,将目标服务实例与应用绑定,并以安全的方式将服务实例的访问信息和密钥注入到应用容器中,其中服务代理(简称SSB)负责提供一个强大的异步编程模型,可在服务实例之间完成高效可靠的异步通信;
所述基于分布式存储的存储虚拟化基于Ceph技术的分布式存储架构,为自主可控的陆军机动战术云平台提供存储支撑,且可以运行在集网络、计算为一体的超融合云平台节点上,Ceph技术的分布式存储架构基于RADOS提供无限可扩展的存储集群,RADOS是一种可靠的、自动化的、分布式的对象存储,存储Ceph系统中的用户数据,物理上,RADOS由大量的存储设备节点组成,每个节点拥有自己的硬件资源,并运行操作系统和文件系统,基础库librados:Ceph客户端用一定的协议和存储集群交互,并把该功能封装进librados库,基于librados库可创建定制客户端,高层应用接口使用RADOS GW对象网关、RBD块设备接口以及Ceph FS,一个POSIX兼容的分布式文件系统,应用层是不同场景下对于Ceph各个应用接口的各种应用方式,对外统一提供对象存储、块存储和文件存储,并且提供了无限扩展能力;
所述基于软件定义的网络虚拟化包括虚拟网络映射平面、网络结构虚拟化和网络资源隔离三个步骤;
所述虚拟网络映射平面实现面向用户和面向底层网络的透明虚拟化,虚拟化平面管理全部的物理网络拓扑,并向用户提供隔离的虚拟网络;
所述网络结构虚拟化对物理网络结构进行抽象虚拟化;
所述网络资源隔离拟化仅仅完成了物理资源到虚拟资源的抽象过程,为实现完全的网络虚拟化,还需要对不同的用户提供隔离的网络资源;
所述面向高机动环境的容器动态调度管理技术包括容器集群调度器设计、容器网络通信管理与优化和基于负载的自适应弹性伸缩,其特征在于:
所述容器集群调度器设计基于Kubernetes的容器集群管理系统架构集群中的机器被划分为一个Master节点和一群工作节点,其中Master节点上运行着集群管理相关的一组进程API服务、管理控制器、调度器和高可用键值数据库Etcd四个组件,其中前三个组件构成了集群的总控中心,负责对集群中所有资源进行管控和调度,在每个Node节点上运行Kubelet、容器虚拟化、存储虚拟化和网络虚拟化的组件,负责对本节点的Pod的生命周期进行管理,以及实现服务代理的功能,在所有节点运行Kunbectl命令行工具,提供集群管理工具集,集群中的调度器负责Pod在集群节点中的调度分配,接收控制器创建的新Pod,为其安排一个目标Node,目标Node上的Kubelet服务进程接管后续工作负责Pod整个生命周期,调度器的作用是将带调度的Pod按照特定的调度算法和调度策略绑定到集群中的某个Node上,并将绑定信息写入etcd中,在整个调度过程中涉及三个对象,分别是:带调度Pod列表、可用Node列表,以及调度算法和策略;
所述容器网络通信管理与优化包括容器到容器之间的直接通信、Pod到Pod之间的通信和Pod到Service之间的通信三个部分;
所述基于负载的自适应弹性伸缩基于负载的弹性调度系统能够对容器环境的计算、存储负载情况进行监控,并根据实时负载进行自适应弹性伸缩调度,系统主要由底层容器集群、负载均衡和伸缩控制系统这三部分组成,上层微服务基于Docker容器进行构建,负载均衡使得集群中的微服务容器能够正常收到用户的请求,伸缩控制系统是整个系统架构的核心部分,包括资源监控模块、伸缩决策模块和资源调度模块,其中资源监控模块负责统计物理主机和Docker容器的资源使用情况并报告给伸缩决策模块,伸缩决策模块会分析统计数据从而决定是否需要进行扩容或缩容,资源调度模块负责对底层的容器资源进行调度,负责容器的创建和销毁工作,资源动态调度算法在容器集群中每个节点上所有运行着的应用实例之间进行资源动态调度,当可以利用容器集群上应用实例的资源监控数据生成预测数据后,针对每种资源运用该算法生成一系列资源伸缩决策,并将决策响应到容器的请求资源限制中。
通过本发明的上述方案,所述网络资源隔离包括控制面隔离、数据面隔离和地址隔离,其特征在于:
所述控制面隔离保证用户的控制器在运行时不受其他用户控制器的影响,保证用户对虚拟化平面资源的使用;
所述数据面隔离保证用户的资源不被其他用户所占据;
所述地址隔离为使用户能在自己的虚拟用户网中任意使用地址。
通过本发明的上述方案,所述基于负载的自适应弹性伸缩包括资源监控架构设计、伸缩决策模块设计和资源调度架构设计,其特征在于:
所述资源监控架构设计资源监控模块需要对主机和容器的CPU、内存和磁盘资源使用情况进行收集并进行存储,按照功能可以将其划分为数据采集(Agent端)、监控服务(Monitor)、数据存储(Data Server)和仪表盘(Dashboards)这四个模块;
所述伸缩决策模块设计伸缩决策模块主要负责对资源监控模块产生的监控数据进行分析并做出相应的伸缩决策,主要包括建模模块和控制模块,建模预测模块主要针对使用预测型伸缩算法的网络流量这一指标,它会从数据库中获取网络流量的历史观测数据并进行建模预测,给出网络流量的预测数据,控制模块会不断获取建模预测模块和监控服务模块的数据,只要有一种规则指定的数据超过阈值时,便会触发相应的伸缩指令;
所述资源调度架构设计资源调度模块主要负责对容器集群进行数量上的调整,会一直等待伸缩决策模块的伸缩指令,然后执行相应的容器调度命令,包括新建容器和销毁容器,资源调度模块主要由容器调度模块(Docker Scheduler)和管理器模块(Manager)这两部分构成,其中容器调度模块负责每台主机上的容器创建或销毁任务,管理器模块则负责容器调度的计算及分配,在接收到伸缩决策模块的伸缩指令时会自动给容器调度模块发送相应的命令。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限定本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.基于超融合架构的管理调度方法,包括超融合系统架构设计、基于超融合架构的资源一体化管理、面向国产异构平台的统一计算虚拟化、基于分布式存储的存储虚拟化、基于软件定义的网络虚拟化和面向高机动环境的容器动态调度管理技术,超融合系统架构设计由超融合基础设施层、超融合资源池、资源调度层组成,所述超融合基础设施层包括搭建超融合云平台的物理基础设施,在信息服务车、指挥车车载环境内,由异构CPU的服务器集群、车内万兆网络组成超融合的计算存储环境支撑,为基础设施之上构建超融合虚拟化资源池提供支撑;
所述超融合资源池通过采用虚拟化和超融合技术对单车环境内的硬件设施和基础软件进行虚拟化封装,向用户提供信息基础设施服务,在车内异构服务器上部署超融合组件,利用超融合技术构建统一虚拟化资源池,即Docker轻量级虚拟化技术构建异构计算资源池,分布式存储虚拟化技术构建统一存储资源池,软件定义网络技术构建虚拟化网络环境,其中异构计算资源池纳管车内不同架构CPU服务器的异构计算资源,支持融合管理不少于2种国产CPU计算资源;
所述资源调度层为整个平台系统提供快速创建、按需调度、自动伸缩、安全可靠的轻量级虚拟化平面资源环境,其中容器集群调度器是在虚拟资源池上提供的计算、存储、网络资源监控和调度管理,从而实现容器基于负载的自适应弹性伸缩、容器网络通信管理;
所述基于超融合架构的资源一体化管理在单车内异构服务器上部署超融合组件,利用超融合技术构建统一虚拟化资源池,即Docker轻量级虚拟化技术构建异构计算资源池,Ceph分布式存储虚拟化技术构建统一存储资源池,软件定义技术构建虚拟网络子网,在用户进行应用访问时,后台无需从存储端取出数据,而是将计算直接分发到存储上运行,将计算作为传输单元进行传输,这样大量的存储数据都是本地访问,不需要再跨网络传输,计算和存储运行在了一个服务器上,实现超融合架构下的应用快速响应;
所述面向国产异构平台的统一计算虚拟化分为基于容器的计算资源虚拟化和异构CPU计算资源融合管理,其特征在于:
所述基于容器的计算资源虚拟化是基于Docker容器技术,Docker容器虚拟化技术使用Client-server架构模式,Docker由守护进程、镜像维护、容器管理驱动模块组成,Docker守护进程(Docker-daemon)负责响应来自Docker客户端的请求,然后将这些请求翻译成系统调用完成容器管理操作,该进程会在后台启动一个API服务,负责接收由Docker client发送的请求,接收到的请求将通过Docker守护进程内部的一个路由分发调度,再由具体的函数来执行请求,以Docker轻量级虚拟化技术实现计算资源虚拟化,实现在自主可控服务器性能不占优的现状下更高效的利用国产化服务器的计算资源,实现计算资源整合池化、按需调度功能;
所述异构CPU计算资源融合管理由面向通用服务的Service系统和基于服务代理的实例通信组合构成,所述面向通用服务的Service系统的服务层可提供的服务主要包括以下六种类型:数据库服务、存储类服务、中间件服务、基本计算、网络服务、其他类型服务,服务层包括两部分:服务网关和服务节点,服务节点是实际实现基础服务的位置,即应用程序实例绑定的基础服务是由服务节点来实现,启动服务网关时,首先向云控制器发送heartbeat,实际上是一个POST请求,当云控制器接收到POST请求后,它会向其数据库中插入一条该服务网关的信息,此时注册生效,然后服务网关会查看云控制器的响应状态,若响应结果是成功,此时服务网关在云控制器中注册成功,由于网关在工作过程中会用到一些服务配置和绑定的信息,而由于网关存储的信息都是在云控制器结点上开辟内存来实现的,所以每次在网关启动的时候,都需要向云控制器发送一个获取握手的命令,从而在云控制器结点中找到关于该网关负责服务的服务信息并返回;
所述基于服务代理的实例通信基于服务代理的实例通信技术基于数据库引擎集成各种资源服务,通过控制台,用户可以浏览到各种服务的代理,通过简单地界面操作,就可以完成创建和销毁不同规格的服务实例,将目标服务实例与应用绑定,并以安全的方式将服务实例的访问信息和密钥注入到应用容器中,其中服务代理(简称SSB)负责提供一个强大的异步编程模型,可在服务实例之间完成高效可靠的异步通信;
所述基于分布式存储的存储虚拟化基于Ceph技术的分布式存储架构,为自主可控的陆军机动战术云平台提供存储支撑,且可以运行在集网络、计算为一体的超融合云平台节点上,Ceph技术的分布式存储架构基于RADOS提供无限可扩展的存储集群,RADOS是一种可靠的、自动化的、分布式的对象存储,存储Ceph系统中的用户数据,物理上,RADOS由大量的存储设备节点组成,每个节点拥有自己的硬件资源,并运行操作系统和文件系统,基础库librados:Ceph客户端用一定的协议和存储集群交互,并封装进librados库,基于librados库可创建定制客户端,高层应用接口使用RADOS GW对象网关、RBD块设备接口以及Ceph FS,一个POSIX兼容的分布式文件系统,应用层是不同场景下对于Ceph各个应用接口的各种应用方式,对外统一提供对象存储、块存储和文件存储,并且提供了无限扩展能力;
所述基于软件定义的网络虚拟化包括虚拟网络映射平面、网络结构虚拟化和网络资源隔离三个步骤;
所述虚拟网络映射平面实现面向用户和面向底层网络的透明虚拟化,虚拟化平面管理全部的物理网络拓扑,并向用户提供隔离的虚拟网络;
所述网络结构虚拟化对物理网络结构进行抽象虚拟化;
所述网络资源隔离拟化仅仅完成了物理资源到虚拟资源的抽象过程,为实现完全的网络虚拟化,还需要对不同的用户提供隔离的网络资源;
所述面向高机动环境的容器动态调度管理技术包括容器集群调度器设计、容器网络通信管理与优化和基于负载的自适应弹性伸缩,其特征在于:
所述容器集群调度器设计基于Kubernetes的容器集群管理系统架构集群中的机器被划分为一个Master节点和一群工作节点,其中Master节点上运行着集群管理相关的一组进程API服务、管理控制器、调度器和高可用键值数据库Etcd四个组件,其中前三个组件构成了集群的总控中心,负责对集群中所有资源进行管控和调度,在每个Node节点上运行Kubelet、容器虚拟化、存储虚拟化和网络虚拟化的组件,负责对本节点的Pod的生命周期进行管理,以及实现服务代理的功能,在所有节点运行Kunbectl命令行工具,提供集群管理工具集,集群中的调度器负责Pod在集群节点中的调度分配,接收控制器创建的新Pod,为其安排一个目标Node,目标Node上的Kubelet服务进程接管后续工作负责Pod整个生命周期,调度器的作用是将带调度的Pod按照特定的调度算法和调度策略绑定到集群中的某个Node上,并将绑定信息写入etcd中,在整个调度过程中涉及三个对象,分别是:带调度Pod列表、可用Node列表,以及调度算法和策略;
所述容器网络通信管理与优化包括容器到容器之间的直接通信、Pod到Pod之间的通信和Pod到Service之间的通信三个部分;
所述基于负载的自适应弹性伸缩基于负载的弹性调度系统能够对容器环境的计算、存储负载情况进行监控,并根据实时负载进行自适应弹性伸缩调度,系统主要由底层容器集群、负载均衡和伸缩控制系统这三部分组成,上层微服务基于Docker容器进行构建,负载均衡使得集群中的微服务容器能够正常收到用户的请求,伸缩控制系统是整个系统架构的核心部分,包括资源监控模块、伸缩决策模块和资源调度模块,其中资源监控模块负责统计物理主机和Docker容器的资源使用情况并报告给伸缩决策模块,伸缩决策模块会分析统计数据从而决定是否需要进行扩容或缩容,资源调度模块负责对底层的容器资源进行调度,负责容器的创建和销毁工作,资源动态调度算法在容器集群中每个节点上所有运行着的应用实例之间进行资源动态调度,当可以利用容器集群上应用实例的资源监控数据生成预测数据后,针对每种资源运用该算法生成一系列资源伸缩决策,并将决策响应到容器的请求资源限制中。
2.根据权利要求1所述的基于超融合架构的管理调度方法,所述网络资源隔离包括控制面隔离、数据面隔离和地址隔离,其特征在于:
所述控制面隔离保证用户的控制器在运行时不受其他用户控制器的影响,保证用户对虚拟化平面资源的使用;
所述数据面隔离保证用户的资源不被其他用户所占据;
所述地址隔离为使用户能在自己的虚拟用户网中任意使用地址。
3.根据权利要求1所述的基于超融合架构的管理调度方法,所述基于负载的自适应弹性伸缩包括资源监控架构设计、伸缩决策模块设计和资源调度架构设计,其特征在于:
所述资源监控架构设计资源监控模块需要对主机和容器的CPU、内存和磁盘资源使用情况进行收集并进行存储,按照功能可以将其划分为数据采集(Agent端)、监控服务(Monitor)、数据存储(Data Server)和仪表盘(Dashboards)这四个模块;
所述伸缩决策模块设计伸缩决策模块主要负责对资源监控模块产生的监控数据进行分析并做出相应的伸缩决策,主要包括建模模块和控制模块,建模预测模块主要针对使用预测型伸缩算法的网络流量这一指标,它会从数据库中获取网络流量的历史观测数据并进行建模预测,给出网络流量的预测数据,控制模块会不断获取建模预测模块和监控服务模块的数据,只要有一种规则指定的数据超过阈值时,便会触发相应的伸缩指令;
所述资源调度架构设计资源调度模块主要负责对容器集群进行数量上的调整,会一直等待伸缩决策模块的伸缩指令,然后执行相应的容器调度命令,包括新建容器和销毁容器,资源调度模块主要由容器调度模块(Docker Scheduler)和管理器模块(Manager)这两部分构成,其中容器调度模块负责每台主机上的容器创建或销毁任务,管理器模块则负责容器调度的计算及分配,在接收到伸缩决策模块的伸缩指令时会自动给容器调度模块发送相应的命令。
CN202010678625.9A 2020-07-15 2020-07-15 基于超融合架构的管理调度技术 Active CN112000421B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010678625.9A CN112000421B (zh) 2020-07-15 2020-07-15 基于超融合架构的管理调度技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010678625.9A CN112000421B (zh) 2020-07-15 2020-07-15 基于超融合架构的管理调度技术

Publications (2)

Publication Number Publication Date
CN112000421A CN112000421A (zh) 2020-11-27
CN112000421B true CN112000421B (zh) 2023-11-17

Family

ID=73466900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010678625.9A Active CN112000421B (zh) 2020-07-15 2020-07-15 基于超融合架构的管理调度技术

Country Status (1)

Country Link
CN (1) CN112000421B (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112433819B (zh) * 2020-11-30 2024-04-19 中国科学院深圳先进技术研究院 异构集群调度的模拟方法、装置、计算机设备及存储介质
CN112817725B (zh) * 2021-02-06 2023-08-11 成都飞机工业(集团)有限责任公司 一种基于高效全局优化算法的微服务划分及优化方法
CN113157406A (zh) * 2021-03-09 2021-07-23 东莞中国科学院云计算产业技术创新与育成中心 基于超融合架构的数据调取方法、装置、电子设备及介质
CN112988425A (zh) * 2021-04-07 2021-06-18 多彩贵州印象网络传媒股份有限公司 一种基于gps设备汇聚接入的底层能力平台
CN113159551A (zh) * 2021-04-13 2021-07-23 同济大学 一种开放式技术资源池管理方法及装置
CN112948063B (zh) * 2021-05-17 2021-09-17 北京汇钧科技有限公司 云平台的创建方法、装置、云平台以及云平台实现系统
CN113609068A (zh) * 2021-08-10 2021-11-05 中国人民解放军61646部队 一种基于混合异构处理器的云服务架构
US20230070224A1 (en) * 2021-09-07 2023-03-09 International Business Machines Corporation Using a remote pod in kubernetes
CN113806018B (zh) * 2021-09-13 2023-08-01 北京计算机技术及应用研究所 基于神经网络和分布式缓存的Kubernetes集群资源混合调度方法
CN113849136B (zh) * 2021-10-13 2023-03-31 上海威固信息技术股份有限公司 一种基于国产平台的自动化fc块存储处理方法和系统
CN114422393B (zh) * 2021-12-28 2023-06-13 中国信息通信研究院 用于确定无损网络性能的方法及装置、电子设备、存储介质
CN114327915B (zh) * 2022-03-08 2022-06-28 北京蚂蚁云金融信息服务有限公司 用于在线资源分配的方法及装置
CN115037590B (zh) * 2022-03-25 2023-08-11 烽火通信科技股份有限公司 一种网络虚拟化体系结构以及虚拟化方法
CN114756170B (zh) * 2022-04-02 2023-03-24 苏州空天信息研究院 一种面向容器应用的存储隔离系统及其方法
CN114721719B (zh) * 2022-04-20 2023-08-01 上海道客网络科技有限公司 一种在集群中容器化部署异构应用的方法和系统
CN114915460B (zh) * 2022-04-28 2023-05-05 中国人民解放军战略支援部队信息工程大学 一种面向容器云的异构动态扩缩容装置及方法
CN114968092B (zh) * 2022-04-28 2023-10-17 安超云软件有限公司 容器平台下基于qcow2技术的存储空间动态供应的方法及应用
CN114827148B (zh) * 2022-04-28 2023-01-03 北京交通大学 基于云容错技术的云安全计算方法和装置、存储介质
CN115225664B (zh) * 2022-06-24 2024-04-30 四川省气象探测数据中心 一种气象信息基础设施资源云平台的构建方法
CN115277813B (zh) * 2022-07-19 2023-03-31 北京志凌海纳科技有限公司 超融合集群主机资源控制方法、系统、设备和可读介质
CN115328651A (zh) * 2022-08-12 2022-11-11 扬州万方科技股份有限公司 基于国产vpx服务器的轻量化微云系统
CN115102851B (zh) * 2022-08-26 2022-11-08 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种面向hpc与ai融合计算的融合平台及其资源管理方法
CN115509765B (zh) * 2022-11-22 2023-03-10 江苏迈步信息科技有限公司 一种超融合云计算方法、系统、计算机设备及存储介质
CN116795545B (zh) * 2023-06-21 2024-04-16 中国科学院沈阳自动化研究所 基于网算容器的信息物理生成系统及其管理方法
CN116582546A (zh) * 2023-07-12 2023-08-11 深圳市智博通电子有限公司 一种基于超融合节点的虚拟机集群的网络互通方法
CN116627661B (zh) * 2023-07-24 2023-11-03 杭州谐云科技有限公司 算力资源调度的方法和系统
CN116887357B (zh) * 2023-09-08 2023-12-19 山东海博科技信息系统股份有限公司 基于人工智能的计算平台管理系统
CN117240806B (zh) * 2023-11-16 2024-02-06 北京邮电大学 一种超融合架构下网络资源分配及调度方法
CN117271424B (zh) * 2023-11-24 2024-02-06 北京中星微人工智能芯片技术有限公司 基于多模融合计算框架的处理装置和处理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220039A (zh) * 2017-04-11 2017-09-29 国家电网公司 一种基于云环境的异构资源标准化封装系统
CN107979620A (zh) * 2016-10-25 2018-05-01 北京计算机技术及应用研究所 异构混合云计算系统
US10447806B1 (en) * 2017-06-09 2019-10-15 Nutanix, Inc. Workload scheduling across heterogeneous resource environments
CN110912991A (zh) * 2019-11-22 2020-03-24 北京中实信息技术有限公司 一种基于超融合双节点高可用的实现方法
CN111061540A (zh) * 2019-11-27 2020-04-24 北京计算机技术及应用研究所 一种基于容器技术的应用虚拟化方法及系统
US10708135B1 (en) * 2019-01-31 2020-07-07 EMC IP Holding Company LLC Unified and automated installation, deployment, configuration, and management of software-defined storage assets

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150350102A1 (en) * 2014-06-03 2015-12-03 Alberto Leon-Garcia Method and System for Integrated Management of Converged Heterogeneous Resources in Software-Defined Infrastructure
US10771344B2 (en) * 2018-12-21 2020-09-08 Servicenow, Inc. Discovery of hyper-converged infrastructure devices

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107979620A (zh) * 2016-10-25 2018-05-01 北京计算机技术及应用研究所 异构混合云计算系统
CN107220039A (zh) * 2017-04-11 2017-09-29 国家电网公司 一种基于云环境的异构资源标准化封装系统
US10447806B1 (en) * 2017-06-09 2019-10-15 Nutanix, Inc. Workload scheduling across heterogeneous resource environments
US10708135B1 (en) * 2019-01-31 2020-07-07 EMC IP Holding Company LLC Unified and automated installation, deployment, configuration, and management of software-defined storage assets
CN110912991A (zh) * 2019-11-22 2020-03-24 北京中实信息技术有限公司 一种基于超融合双节点高可用的实现方法
CN111061540A (zh) * 2019-11-27 2020-04-24 北京计算机技术及应用研究所 一种基于容器技术的应用虚拟化方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Carlos Melo ; 等.Availability models for synchronization server infrastructure.《2016 IEEE International Conference on Systems, Man, and Cybernetics (SMC)》.2017,第3658-3663页. *
基于Hadoop架构的分布式计算和存储技术及其应用;田秀霞等;《上海电力学院学报》;第27卷(第01期);第70-74页 *
基于Openstack的超融合平台的研究与实现;艾如鹏;《中国优秀硕士学位论文全文数据库 信息科技辑》(第7期);I139-98 *
超融合架构在数据中心应用探究;唐恒武;王珍;;《金融电子化》(第02期);第89-90页 *

Also Published As

Publication number Publication date
CN112000421A (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
CN112000421B (zh) 基于超融合架构的管理调度技术
Kaur et al. Container-as-a-service at the edge: Trade-off between energy efficiency and service availability at fog nano data centers
CN107979620B (zh) 异构混合云计算系统
CN107426034B (zh) 一种基于云平台的大规模容器调度系统及方法
CN111813560B (zh) 一种基于云池端的智能天基系统体系
CN102479099B (zh) 虚拟机管理系统及其使用方法
CN106453360B (zh) 基于iSCSI协议的分布式块存储数据访问方法及系统
CN105554123B (zh) 大容量感知云计算平台系统
CN117480494A (zh) 改进虚拟计算环境中资源分配的协调容器调度
CN115733754B (zh) 基于云原生中台技术的资源管理系统及其弹性构建方法
CN108449383A (zh) 分布式实时移动微云计算系统
CN109542583A (zh) 一种基于双总线的虚拟设备管理方法
CN112698925B (zh) 一种服务器集群的容器混合运行处理方法
KR101695012B1 (ko) 동적 노드 서비스 제공 방법 및 그 장치
CN115766714A (zh) 基于超级计算的公共计算平台
CN110661865A (zh) 一种网络通信方法及网络通信架构
CN114510321A (zh) 资源调度方法、相关装置和介质
CN115080210A (zh) 基于边缘计算的车载算力共享系统、方法、设备及介质
CN111767139A (zh) 一种跨地域多数据中心资源云服务建模方法及系统
CN104765644A (zh) 基于智能体Agent的资源协作演化系统及方法
CN114615268B (zh) 基于Kubernetes集群的服务网络、监控节点、容器节点及设备
CN112822062A (zh) 一种用于桌面云服务平台的管理方法
CN105681311A (zh) 一种基于云计算技术的火箭地面网络异构系统
CN108737120A (zh) 一种机顶盒的待机方法和机顶盒
CN113742030A (zh) 跨区服务配置方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant