CN107967167A - 一种面向复杂虚拟化环境的云平台资源调度方法 - Google Patents

一种面向复杂虚拟化环境的云平台资源调度方法 Download PDF

Info

Publication number
CN107967167A
CN107967167A CN201711250852.6A CN201711250852A CN107967167A CN 107967167 A CN107967167 A CN 107967167A CN 201711250852 A CN201711250852 A CN 201711250852A CN 107967167 A CN107967167 A CN 107967167A
Authority
CN
China
Prior art keywords
resource
level
scheduler
scheduling
physical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711250852.6A
Other languages
English (en)
Inventor
李亚琼
周博
刘永波
李守超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Run He Software Inc Co
Original Assignee
Jiangsu Run He Software Inc Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Run He Software Inc Co filed Critical Jiangsu Run He Software Inc Co
Priority to CN201711250852.6A priority Critical patent/CN107967167A/zh
Publication of CN107967167A publication Critical patent/CN107967167A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1074Peer-to-peer [P2P] networks for supporting data block transmission mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

发明涉及一种面向复杂虚拟化环境的云平台资源调度方法。面向将虚拟机和容器部署在相同物理服务器上的复杂虚拟化环境,进行云资源调度。首先,调度器将物理资源进行逻辑划分,对物理资源进行监测、评估、决策和调整,并分配给第二层资源调度器;而后,适配已有虚拟机和容器资源调度实现,通过物理资源在异构虚拟化之间分时复用以提高资源利用率。

Description

一种面向复杂虚拟化环境的云平台资源调度方法
技术领域
本发明涉及一种面向复杂虚拟化环境的云平台资源调度方法,属于软件技术领域。
背景技术
虚拟化已成为构建新型信息化系统的主流计算范型,呈现出异构化发展趋势,当前主要包括虚拟机与容器两类。前者模拟OS环境 ,核心思想是执行指令重映射技术,开销相对较大,是当前虚拟化主要实现机制,例如亚马逊AWS、微软Azure、阿里巴巴Alicloud。后者复用OS,模拟沙箱环境,开销较小,近年来得到迅速发展,比如羊年春晚抢红包,京东“618商品秒杀”均采用该技术。相关研究认为,虚拟机可支持多种OS,能有效满足Web应用多样化运行环境支撑需求。容器本质为沙箱进程,运行在其中的分布式系统性能几乎和直接运行在物理机上一致。因此,两种虚拟化分别最优适用于不同的信息化系统场景。
“数据采集器+实时处理系统+离线统计系统”模式是适应IT技术发展主流应用模式之一。数据采集器负责数据的监测、处理和转发;实时处理系统在满足指定目标和时效性约束条件下对数据进行分析处理,并将结果持久化;离线统计模块以持久化数据作为输入,采用常用统计算法进行数据分析。其中,舆情分析、高能物理实验是满足上述应用模式的两类典型场景。当前,数据采集器、实时处理系统、离线统计系统通常部署在虚拟机上,比如Amazon EC2。这种方法尽管管理简单,但牺牲了实时处理系统、离线统计系统性能,难以满足相关研究工作关于信息化系统和异构虚拟化部署的最佳实践建议。实际上,“数据采集器+实时处理系统+离线统计系统”应用场景主要具有两大特点:(1)异构虚拟化协同:相关工作分别采用理论分析和离线测试的方法,得出数据采集部署在虚拟机较优,实时处理系统、离线统计系统部署在容器较优的结论。因此,该场景具有异构虚拟化协同的特点。(2)信息化系统资源需求错峰:数据采集和实时处理系统通常日间活跃,但离线统计通常夜间工作,具有典型的资源需求错峰特点,可采用分时复用思想进一步提高资源利用率。
资源调度是解决“数据采集器+实时处理系统+离线统计系统”应用场景的有效手段,它是指根据一定的资源使用规则,在不同资源使用者之间进行资源调整的过程。已有研究工作分别针对虚拟机与容器进行调度优化,优化目标包括公平性、本地性、时效性、能耗等,但其有效性是建立物理服务器与虚拟化技术一一映射的前提下。上述方法会因物理资服务器难以分时复用给异构虚拟化而导致资源利用率不高。BICHLER提出了一种基于线性规划规约的启发式算法来减少虚拟机放置过程中的计算资源损耗(Speitkamp B, BichlerM. A mathematical programming approach for server consolidation problems invirtualized data centers [J]. Services Computing, IEEE Transactions on, 2010,3(4): 266-78.)。GENEZ提出了一种两阶段的整数线性规划的启发式算法来调度云计算中用户执行的两层SLA调度问题(Genez T A, Bittencourt L F, Madeira E R. Workflowscheduling for SaaS/PaaS cloud providers considering two SLA levels;proceedings of the Network Operations and Management Symposium (NOMS), 2012IEEE, F, 2012 [C]. IEEE.)。GUO提出了一种最小化的Buchberger算法来解决SLA敏感的随机资源IP调度问题(Li Q, Guo Y. Optimization of resource scheduling in cloudcomputing; proceedings of the 12th International Symposium on Symbolic andNumeric Algorithms for Scientific Computing, F, 2010 [C]. IEEE.)。XU提出了一种启发式算法以解决虚拟机的放置问题,它执行一种类深度优先搜索方法来枚举出所有虚拟机可能放置方案的子集,然后使用基于LP的虚拟链路映射优化算法来确定如何将用户需求映射到最小数据中心网络上(Xu J, Tang J, Kwiat K, et al. Enhancingsurvivability in virtualized data centers: A service-aware approach [J].Selected Areas in Communications, IEEE Journal on, 2013, 31(12): 2610-9.)。
因此,学术界开始探索混合虚拟化资源调度方法。所谓混合虚拟化,是指将异构虚拟化部署在相同物理服务器上,物理资源可分时复用给异构虚拟化。异构方法或以物理机作为资源调度粒度,运行时采用动态配置方法动态变更物理服务器角色;或改造操作系统内核,使其具有运行支持异构虚拟化的能力。但上述方法或面临资源供给粒度大问题,或面临操作系统改造,工作量大,易用性差的不足。
发明内容
本发明的目的:针对“数据采集器+实时处理系统+离线处理系统”这种应用模式的混合虚拟化需求特点,发明采用一种两级调度框架来构建系统。使用第二级调度去维持原有调度运行问题,这样就可以通过一级调度来划分虚拟机以及容器的资源分配情况。在一级调度算法的选择方面,提出了一种改进的DRF算法,以解决资源调度过程中所存在的资源权重以及分配过程中存在的硬件异构性的问题。
本发明技术解决方案:一种一种面向复杂虚拟化环境的云平台资源调度方法,其特点在于实现5个步骤如下:
1、一级调度器从每个物理资源节点上获取两种二级调度器的实际任务运行情况与剩余资源情况;
2、一级调度器将这些资源汇总之后进行资源的分配,并将分配结果转发到二级调度器;
3、一级调度器根据算法完成了虚拟机与容器调度器的资源分配,分别为两种调度器分发了S1的<4cpu, 6g>,<2cpu, 2g>和S2的<6cpu, 2g>,<4cpu, 2g>这些资源配额。这两种异构虚拟化的资源调度器根据自身相关的资源放置算法完成其上的任务分配, 虚拟机调度器最终将资源需求<4cpu, 4g>的Task1放到了物理资源1上,将资源需求<2cpu, 2g>的Task2放到S2上;
4、完成这些具体任务放置之后,分配结果通过一级调度器传向所对应的物理资源,完成具体任务的分发与运行;
5、二级调度器决定是否使用某个物理资源上所提供的资源,也就是二级调度器可以拒绝来自一级调度器的资源分发。同时,一级调度器通过二级调度器的多次拒绝历史可以做到相关分发结果的筛选,从而提高运行效率。
其中,一级调度器为每种调度器提供资源分发。每种调度器根据自身任务情况选择接受和拒绝这些来自一级调度器的分发。二级调度器对于来自一级调度器的每种资源分发邀约有三种处理情况:
1、接受该资源邀约。对于分发合理的资源邀约,二级调度器可以选择接受,之后二级调度器可以正常的使用这些资源邀约,完成相关任务的放置并运行;
2、拒绝该资源邀约。当二级调度器无法使用某些一级调度器分发的资源邀约时,二级调度器可以向一级调度器发送拒绝请求。这些资源邀约被连续拒绝后,一级调度器将不再为二级调度器提供这些类型的资源邀约;
3、不使用该资源邀约。对于某些类型资源邀约,二级调度器可能觉得此时不适合使用这些资源邀约,此时它可以选择不使用。对于该类不使用的邀约,一级调度器将不再加入筛选条件,也就是说,之后一级调度器仍可能提供这种类型的资源邀约给二级调度器。
本发明与现有技术相比具有如下优点:
首先,发明提出了两层资源调度方法,其核心思想是将虚拟机和容器部署在相同物理服务器上进行资源调度。其中,第一层资源调度器用于物理资源的监测、评估、决策和调整,其目的是将物理资源进行逻辑划分,分配给第二层资源调度器;第二层资源调度器用于适配已有虚拟机和容器资源调度实现,通过物理资源在异构虚拟化之间分时复用,达到提高资源利用率的目的。
其次,发明考虑物理资源异构因素,在第一层资源调度器中实现主占资源公平调度算法,通过加权的方式构建“Web应用+数据处理系统”应用模式和异构资源的关联优化,在提高资源利用率的同时,提高上述模式应用的性能。
附图说明
图1为资源调度框架。
具体实施方式
以下结合具体实施例和附图对本发明进行详细说明,如图1所示:
发明采用一种两级调度管理框架进行资源的分配与管理,其中第一级调度框架与物理资源进行交互,监测底层物理资源的使用量,进行统计后做出调度分配决策,之后将可使用的物理资源进行划分交给二级调度器。二级调度器是一种完全独立的调度器,它只与一级调度器进行通信交互,虚拟机与容器这两种调度器从一级调度器获得可以使用的资源后,根据自身资源特点进行任务的资源调度。
两级资源调度将资源的分配与任务的调度下放到两个进程进行管理,这种做法减轻了传统一级调度框架的调度集中的特点,同时由于二级调度的相对独立,可以将已有管理系统的算法与调度策略应用到二级调度器上,增加了原有系统迁移的适配性。
第一级资源调度器统筹系统资源分配决策,它主要由四个部分组成,分别是资源监测器,资源统计器,资源分配决策器与资源隔离器:
1、资源监测器:部署于每个物理资源节点上,负责监测每个物理资源节点的任务运行情况,已用资源与可用资源实时情况,每隔一定周期将这些统计数据汇报给资源统计器;
2、资源统计器:负责收集统计来自每个资源监测器上的具体资源信息数据,进行资源的统计与汇总,之后交由资源分配决策器完成第一级资源调度的分配;
3、资源分配决策器:通过对资源统计器的得到的虚拟机与容器具体使用资源情况进行分析,通过加权DRF算法为这两种调度器分配底层物理资源;
4、资源隔离器:负责每个物理资源节点上任务的隔离与运行情况,保证每个任务分配到的资源为预期资源;
第二级资源调度器负责完成具体的任务调度,按照类型主要分为虚拟机资源调度器以及容器资源调度器这两个部分。具体到每一种资源调度器又可以分为资源声明,调度决策,以及调度实施这三个部分:
1、资源声明:负责从前台接口获取具体类型资源需求的声明进行形式化转换以及具体资源类型任务生命周期的管理;
2、调度决策:基于原有调度算法根据一级调度器已经分配的资源配额将虚拟机和容器任务分配到具体的物理节点上运行部署;
3、调度实施:负责与一级调度器的资源隔离进行交互,将要完成的任务通知到一级调度器并负责收集任务的运行情况,保证任务的持久运行。

Claims (1)

1.方法特征在于实现步骤如下:
第一步,一级调度器从每个物理资源节点上获取两种二级调度器的实际任务运行情况与剩余资源情况;
第二步,一级调度器将这些资源汇总之后进行资源的分配,并将分配结果转发到二级调度器;
第三步,一级调度器根据算法完成了虚拟机与容器调度器的资源分配,分别为两种调度器分发了S1的<4cpu, 6g>,<2cpu, 2g>和S2的<6cpu, 2g>,<4cpu, 2g>这些资源配额;
第四步,完成这些具体任务放置之后,分配结果通过一级调度器传向所对应的物理资源,完成具体任务的分发与运行;
第五步,二级调度器决定是否使用某个物理资源上所提供的资源,可以拒绝来自一级调度器的资源分发,通过二级调度器的多次拒绝历史可以做到相关分发结果的筛选。
CN201711250852.6A 2017-12-01 2017-12-01 一种面向复杂虚拟化环境的云平台资源调度方法 Pending CN107967167A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711250852.6A CN107967167A (zh) 2017-12-01 2017-12-01 一种面向复杂虚拟化环境的云平台资源调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711250852.6A CN107967167A (zh) 2017-12-01 2017-12-01 一种面向复杂虚拟化环境的云平台资源调度方法

Publications (1)

Publication Number Publication Date
CN107967167A true CN107967167A (zh) 2018-04-27

Family

ID=61999202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711250852.6A Pending CN107967167A (zh) 2017-12-01 2017-12-01 一种面向复杂虚拟化环境的云平台资源调度方法

Country Status (1)

Country Link
CN (1) CN107967167A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885377A (zh) * 2018-11-23 2019-06-14 中国银联股份有限公司 统一资源调度协调器及其创建虚拟机和/或容器的方法、统一资源调度系统
CN110058946A (zh) * 2019-04-26 2019-07-26 上海燧原科技有限公司 设备虚拟化方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885377A (zh) * 2018-11-23 2019-06-14 中国银联股份有限公司 统一资源调度协调器及其创建虚拟机和/或容器的方法、统一资源调度系统
CN110058946A (zh) * 2019-04-26 2019-07-26 上海燧原科技有限公司 设备虚拟化方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Liu et al. Job scheduling model for cloud computing based on multi-objective genetic algorithm
CN111953526B (zh) 一种分层算力网络编排方法、装置及存储介质
Almeida et al. Resource management in the autonomic service-oriented architecture
CN113448721A (zh) 算力处理的网络系统及算力处理方法
CN107066319A (zh) 一种面向异构资源的多维调度系统
CN106020934A (zh) 一种基于虚拟集群在线迁移的优化部署方法
KR20040019033A (ko) 호스팅되는 애플리케이션을 위한 서버 자원들의 관리
CN109445944A (zh) 一种基于dpdk的网络数据采集处理系统及其方法
CN102495759A (zh) 一种云计算环境中作业调度的方法
CN109783225B (zh) 一种多租户大数据平台的租户优先级管理方法及系统
CN106095581B (zh) 一种私有云条件下的网络存储虚拟化调度方法
Cao et al. Towards tenant demand-aware bandwidth allocation strategy in cloud datacenter
Sharma et al. An improved task allocation strategy in cloud using modified k-means clustering technique
CN107967167A (zh) 一种面向复杂虚拟化环境的云平台资源调度方法
Dalla-Costa et al. Orchestra: A customizable split-aware NFV orchestrator for dynamic cloud radio access networks
Kecskemeti et al. Facilitating self-adaptable Inter-Cloud management
CN108170417A (zh) 一种在mesos集群中集成高性能的作业调度框架的方法和装置
Goel et al. A Systematic Review of Task Offloading & Load Balancing Methods in a Fog Computing Environment: Major Highlights & Research Areas
CN106161640A (zh) 一种基于云计算的虚拟机两级优化调度管理平台
Shen et al. Facilitating application-aware bandwidth allocation in the cloud with one-step-ahead traffic information
Balasubramanian et al. Game theory based offload and migration-enabled smart gateway for cloud of things in fog computing
US20230037293A1 (en) Systems and methods of hybrid centralized distributive scheduling on shared physical hosts
Patil et al. Resource allocation and scheduling in the cloud
Di Stefano et al. Improving the allocation of communication-intensive applications in clouds using time-related information
Mazumdar et al. Adaptive resource allocation for load balancing in cloud

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180427

WD01 Invention patent application deemed withdrawn after publication