WO2021008225A1

WO2021008225A1 - 数据中心面向微服务的电力资源分配的方法和系统

Info

Publication number: WO2021008225A1
Application number: PCT/CN2020/090958
Authority: WO
Inventors: 李超; 侯小凤; 过敏意; 姚斌
Original assignee: 上海交通大学
Priority date: 2019-07-18
Filing date: 2020-05-19
Publication date: 2021-01-21
Also published as: CN112241822B; CN112241822A

Abstract

一种数据中心面向微服务的电力资源分配的方法和系统，基于二分图构建和维护用于指导微服务电力资源分配的模型，并计算每个微服务的关键程度，即微服务在当前状态下，在系统值得电力资源的程度，可以通过微服务在该电力资源分配情况下，是否会对整个应用的服务质量造成影响来衡量；通过检查当前时刻数据中心可用电力资源容量和每个微服务对应的资源分配情况，优先给关键程度高的微服务分配电力资源，从而在保证应用服务质量不变的情况下实现电力资源的优化分配。

Description

数据中心面向微服务的电力资源分配的方法和系统

技术领域

本发明涉及的是一种电力系统智能控制领域的技术，具体是一种数据中心面向微服务的电力资源分配的方法和系统。

背景技术

微服务是一种新兴的软件架构，它把一个大型的单个应用程序和服务拆分为数十个甚至数百个的微形服务组件，通过扩展单个组件而不是整个的应用程序堆栈，从而满足服务等级协议。然而，数据中心电力资源分配方法和系统并不能完全挖掘微服务软件架构带来的节能增效潜力，具体表现为：(1)目前的数据中心功率资源分配忽略了每个微服务异构性；(2)传统云计算环境下的调度算法在微服务环境下会增加数据采集成本和能耗成本。

发明内容

本发明针对现有技术面向微服务存在的上述不足，提出一种数据中心面向微服务的电力资源分配的方法和系统，通过快速地、精准地为不同关键程度的微服务分配对应所需的电力资源，达到保证应用性能不变的情况下，数据中心电力资源利用率最大化，从而实现电力基础设施能够很好地发挥微服务横向扩展的优势。

本发明是通过以下技术方案实现的：

本发明涉及一种数据中心面向微服务的电力资源分配的方法，利用图论中的二分图构建微服务电力资源分配模型，并计算微服务电力资源分配模型中每个微服务的关键程度，即在当前状态下，微服务值得电力资源的程度以及在当前电力资源分配情况下是否会对整个应用的服务质量的影响程度；通过检查当前时刻数据中心可用电力资源容量和每个微服务对应的资源分配情况，对关键程度高的微服务进行电力资源的优先分配，从而实现保证应用服务质量不变的情况下优化电力资源分配。

所述的关键程度(MFC：Microservice Criticality Factor)具体表示一个应用中不同微服务值得分配的电力资源情况以及该微服务在一定电力资源分配下执行后对整个应用的服务质量的影响，该关键程度包括三个静态因素和一个动态因素，其中：静态因素来自微服务自身属性，在微服务执行过程中是常量值；动态因素由用户请求状态变化决定并随用户请求类型以及不同请求比例变化而动态变化。

所述的静态因素包括：单个请求调用微服务的次数、微服务完成当个请求每次调用的计算时间以及每个微服务计算时间和分配的功率之间的关系，即微服务的“性能-功耗”关系。比如对于微服务i，我们可以定义请求类型n调用微服务i的次数为call_ts _{n_i}，微服务i完成当前类型请求每次调用的计算时间为exec_t _{n_i}，以及微服务i计算时间和分配的功率之间的关系β _{n_i}＝<β _{n_i1},…,β _{n_ix}>，其中x是服务器动态电压和频率调制个数，可以阅读服务器数据手册获取。

在测量过程中，每次测量下单个请求调用统一微服务的次数完全一样，每次试验下的调用的计算时间以及每个微服务的“性能-功耗”关系差别小于1％。因此，通过对多次试验的结果分别求平均计算三个静态因素。

所述的动态因素是指：微服务处理的用户请求的类型以及比例的变化，其反映了微服务在当前用户状况下处理不同种类的请求占总请求的比例。

所述的动态因素可以通过统计每个微服务处理不同类型的用户请求的总数计算得到，为了在不同微服务之间进行对比，优选所有用户请求的数量经归一化到访问应用总请求数量。

所述的微服务电力资源分配模型为动态的二分图模型，二分图中每个顶点表示一个微服务，每条边表示分配给微服务处理的一类用户请求数量，每一条边的权重表示微服务处理对应用户请求所需要的时间开销和代价，每个节点入边的数量(入度)会随着用户请求数量而变化。

所述的每一条边的权重为数列结构，数列中的每一个数值由静态因素决定，反映的是微服务在不同运行功率下完成该请求所需要的总的计算时间，即对于微服务每一条边的权重W _{n_i}等于调用次数和当前功率下所需的计算时间的乘积，即W _{n_i}＝call_ts _{n_i}*exec_t _{n_i}*β _{n_i}。

所述的顶点的入度由动态因素决定，即所有访问对应微服务的用户请求数量总和，为了在不同微服务之间进行对比，所有请求数量都归一化到访问应用总请求数量。假设整个应用共有M种请求类型，某一时刻存在一个请求列表RES＝<res ₀,…,res _m-1>分别访问m种请求，其中第n种请求类型调用了微服务i，那么顶点(微服务)i的入度

所述的关键程度，通过将每个顶点连接的所有类型边的数量以及权重乘积之和得到，其反映微服务在对应用户请求下，完成所有请求的所需要的时间之和。例如：当m种请求中一共有N种请求访问了微服务i，那么即对于上述微服务i，其关键程度

为了比较不同微服务是否是约束应用整体性能的关键服务，根据关键程度和基准服务性能的比值，即利用微服务在不同供电情况下MFC除以基准服务性能，把微服务划分成关键微服务、不确定微服务和非关键微服务。

所述的基准服务性能反映整个应用规定的服务质量，即该应用的响应时间一般不能超过基准服务性能规定的时间，其通过运行一些基准测试访问该应用，然后找到最大响应时间，用最大响应时间表示基准服务性能，或采用一些广泛被认同的标准值，这些标准值往往是由权威组织或者著作规定的，比如《可用性工程》规定交互服务的响应时间不超过100毫秒，即100 毫秒可以作为本方法的基准服务性能。

所述的关键微服务的比值都大于等于1，反映该服务在不同的供电情况下响应时间都长于基准时间，则应该保证该服务的电力资源，否则会影响整个应用的服务质量。

所述的非关键微服务的比值都小于1，表示无论如何改变微服务的电力资源供给条件，微服务的计算时间都小于基准时间，对整个应用的性能没有影响。

所述的不确定微服务的比值一部分大于等于1，另一部分小于1，表示微服务在一定供电范围内，供电变化对微服务的性能没有影响，但是当供电低于某个值，微服务的性能下降并且超过基准性能。

所述的优先分配是指：将数据中心服务器划分成用于运行关键服务的冷区域服务器、用于执行不确定的微服务的暖区域服务器和用于运行非关键服务的热区域服务器，其中：冷区域服务器保证冷服务的电力资源供给，热区域服务器可以被任意降频，暖区域服务器可以根据性能设计被调整为热区域服务器或者冷区域服务器。

所述的优先分配，随着系统状态进行动态调整，即调整服务器数量以及微服务关键程度，具体包括：当应用运行功率大于供电功率且当暖区域服务器频率降到最低时，应用的供电功率仍然大于供电功率，则首先将暖区域的服务器逐一更新为热区域服务器，当应用的供电功率仍然大于供电功率，则开始将冷区域的服务器迁移到暖区域，直到应用的供电功率仍然小于等于供电功率，在此过程中：

①对涉及到的微服务进行相应的降级操作，对涉及到的微服务进行相应的降级操作，即上述暖区域的服务器逐一更新为热区域服务器时，原先暖区域的服务器运行的微服务等级从不确定微服务等级降级到非关键微服务，上述冷区域的服务器迁移到暖区域时，原先冷区域的服务器运行的微服务等级从关键微服务等级降级到不确定微服务等级。

②当应用整体运行功率小于等于供电功率后，需要动态调整微服务关键程度，提升系统整体利用率，具体方式如下：

i)当冷区域的服务器使用率小于50％的时候，则逐一地把暖区域关键程度最高的微服务升级成关键微服务并部署到冷区域运行，直到冷区域服务器的使用率提升到75％～85％。

ii)当暖区域的服务器使用率小于50％的时候，则逐一地把热区域关键程度最高的微服务升级成关键微服务并部署到暖区域运行，直到暖区域服务器的使用率提升到75％～85％。

iii)当应用运行功率小于等于供电功率时，所有微服务运行在满频运行的服务器上，不进行任何操作。

技术效果

与现有技术相比，本发明利用基于二分图的模型来计算不同微服务的关键程度，该关键程度可以挖掘不同微服务“性能-功耗”异构性，优先将电力资源分配给关键程度高的微服务可以保证应用性能，避免将电力资源分配给非关键微服务造成的浪费；另一方面，本发明采用一种分区的方法对不同的微服务进行管理，保证应用整体运行功率小于等于供电功率，分区的管理方式避免了针对单一微服务进行细粒度管理带来的巨大开销。

附图说明

图1为本发明用于计算MFC的二分图模型以及对应的计算过程；

图2为发明进行差异化电力管理的示意图；

图3为本发明的系统的模块图；

图4、图5为实施例示意图。

具体实施方式

如图3所示，本实施例涉及一种数据中心面向微服务的电力资源分配的系统，包括：微服务层面管理系统、容器层面管理系统、服务器层面管理系统和ServiceFridge(冷却服务)系统。

所述的微服务层面管理系统包括：静态因素分析模块、用户请求采集模块，其中：静态因素分析模块通过线下分析获取每个微服务关联的请求类型，完成每个请求类型所需要的调用次数，每次调用执行时间以及执行时间和供电的关系曲线，该模块通过1000次以上的重复实现，通过计算平均值的方法获取上述几个因素；用户请求采集模块实时监测用户请求数量。

所述的容器层面管理系统包括：动态因素分模块、二分图动态维护/更新模块、MFC计算模块和容器迁移控制模块，其中：动态因素分析模块通过图计算中分流的思想将用户请求进行划分，计算出每个微服务最终的关联的用户请求数量相对总的用户请求数量比例；二分图动态维护/更新模块更新图中每个顶点(即微服务)关联的边的数量以及对应的入度；MFC计算模块利用图的性质计算每个微服务的关键程度；微服务关键程度划分模块通过比较微服务MFC和基准MFC的关系，将微服务划分至相应关键程度等级；容器迁移控制模块快速重启/终止容器实现不同微服务在不同服务器区间的快速迁移。

所述的二分图动态维护/更新模块分析利用用户请求采集模块提供的用户状态变化信息，更新二分图中每个顶点(即微服务)关联的边的数量以及对应的入度；同时该模块为每个顶点维护了一个权值列表，列表的每一个数值表示在一种功率方案下的微服务的总执行时间，该执行时间等于调用次数乘以对应功率下的单次调用执行时间。

所述的MFC计算模块根据二分图动态维护/更新模块中每个顶点(微服务)的入度、权重为每个微服务计算在不同功率下的MFC，每个微服务包含一个MFC数列，数列的每一个值等于入度和该功率情况下总的执行时间的乘积。

所述的微服务关键程度划分模块将微服务划分成三个关键程度等级的微服务，包括关键微服务、不确定微服务和非关键微服务。当微服务MFC数列中每一个数值都大于等于基准服务性能，那么微服务被划分成关键微服务；反之当MFC数列中每一个数值都小于基准服务性能，则被划分成非关键微服务；对于部分大于等于基准服务性能，部分小于基准微服务的情况，则被划分成不确定微服务。

所述的容器迁移控制模块对微服务在不同区域的迁移，实现微服务的升级或者降级，具体操作包括：

i)当微服务从不确定微服务升级到关键微服务的时候，该模块在冷区域创建需要升级的微服务的容器复制版本，并且终止暖区域运行微服务的容器，从而实现微服务升级。

ii)当微服务从不确定微服务降级到非关键微服务的时候，该模块在热区域创建需要升级的微服务的容器复制版本，并且终止暖区域运行微服务的容器，从而实现微服务降级。

所述的ServiceFridge系统包括：关键微服务动态修正模块、动态服务器区域划分模块、差异化功率分配模块，其中：关键微服务动态修正模块根据当前可用电力资源的情况动态修正关键区域中微服务的种类和数量，动态服务器区域划分模块根据系统状态动态调整服务的关键程度以及每个区域的服务器数量，差异化功率分配模块根据系统供电功率和当前系统整体运行功率，调整不同服务器区域的运行功率。

所述的服务器层面管理系统包括：电力设施监控模块以及服务器调节模块，其中：电力设施监控模块与数据中心中电力资源基础设施相连并实时读取数据中心中可用资源的状态；服务器调节模块通过调整服务器动态电压和频率来控制服务器的运行功率。

所述的微服务层面管理系统中进一步设有用户请求采集模块统计访问应用的用户请求类型和没中类型的请求数量，直接收集了当前系统用户状态；

所述的微服务层面管理系统中进一步设有用户请求采集模块将当前系统用户请求信息传递给动态因素分析模块，根据动态因素分析模块计算出的结果，

所述的数据中心面向微服务的电力资源分配的系统，在整体功率大于供电功率的时候，差异化功率分配模块的目的是调整不同区域的运行功率使得系统整体功率小于或者等于供电功率。该模块始终保证冷区域的服务器运行在最高频率下，优先降低热区域服务器的运行功率来降低整体功耗，当热区域的服务器运行功耗降低到最低值仍不能达到目的，则降不确定区域服务器的运行功率；当仍然不能达到目的，则首先将暖区域的服务器逐一更新为热区域服务器，当应用的供电功率仍然大于供电功率，则开始将冷区域的服务器迁移到暖区域，直到应用的供电功率仍然小于等于供电功率，在此过程中：

①对涉及到的微服务进行相应的降级操作，即上述暖区域的服务器逐一更新为热区域服务器时，原先暖区域的服务器运行的微服务等级从不确定微服务等级降级到非关键微服务，上述冷区域的服务器迁移到暖区域时，原先冷区域的服务器运行的微服务等级从关键微服务等级降级到不确定微服务等级。

i)当冷区域的服务器使用率小于50％的时候，则逐一把暖区域关键程度最高的微服务升级成关键微服务并部署到冷区域运行，直到冷区域服务器的使用率提升到75％～85％。

当系统整体功率小于等于供电功率的时候，该模块不进行任何调整操作。

本实施例将服务器划分成三个不同的区域，不同区域运行不同关键程度的微服务并且实施不同的电源管理方案。

本实例采用系统仿真的形式验证了所提出的技术，如图5所示，图中4种技术方案分别表示为：(a)capping表示现有的利用动态电压和频率扩展来限制功率；(b)P-first优先限制高功率微服务运行功耗来进行电源管理的策略；(c)T-first优先限制运行时间短的微服务的功耗来进行电源管理的策略；(d)ServiceFridge是我们提出的利用关键程度来管理微服务的运行功率的管理策略。图5供电情况和负载情况相同，并且在图5的结果下，所有方案都能满足应用整体运行功率小于供电功率。如图可见，在相同供电功率条件下，本发明可以满足应用性能和没有削峰的情况一致，相比其他方案，能够提供更好的性能。

上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整，本发明的保护范围以权利要求书为准且不由上述具体实施所限，在其范围内的各个实现方案均受本发明之约束。

Claims

一种数据中心面向微服务的电力资源分配的方法，其特征在于，利用图论中的二分图构建微服务电力资源分配模型，并计算微服务电力资源分配模型中每个微服务的关键程度，即在当前状态下，微服务值得电力资源的程度以及在当前电力资源分配情况下是否会对整个应用的服务质量的影响程度；通过检查当前时刻数据中心可用电力资源容量和每个微服务对应的资源分配情况，对关键程度高的微服务进行电力资源的优先分配，从而实现保证应用服务质量不变的情况下优化电力资源分配；

所述的关键程度表示一个应用中不同微服务值得分配的电力资源情况以及该微服务在一定电力资源分配下执行后对整个应用的服务质量的影响，该关键程度包括三个静态因素和一个动态因素，静态因素包括：单个请求调用微服务的次数、微服务完成当个请求每次调用的计算时间以及每个微服务计算时间和分配的功率之间的关系；动态因素是指：微服务处理的用户请求的类型以及比例的变化；

所述的微服务电力资源分配模型为动态的二分图模型，二分图中每个顶点表示一个微服务，每条边表示分配给微服务处理的一类用户请求数量，每一条边的权重表示微服务处理对应用户请求所需要的时间开销和代价，每个节点入边的数量，即入度随着用户请求数量而变化。
根据权利要求1所述的方法，其特征是，所述的顶点的入度
由动态因素决定，即所有访问对应微服务的用户请求数量总和，其中：M为为整个应用的请求类型，请求列表RES＝<res ₀,…,res _m-1>分别访问m种请求，其中第m种请求类型调用了微服务i。
根据权利要求1所述的方法，其特征是，所述的关键程度，通过将每个顶点连接的所有类型边的数量以及权重乘积之和得到，其反映微服务在对应用户请求下，完成所有请求的所需要的时间之和；

所述的关键程度高的微服务是指：通过关键程度和基准服务性能的比值将微服务划分成关键微服务、不确定微服务和非关键微服务。
根据权利要求1所述的方法，其特征是，所述的优先分配是指：将数据中心服务器划分成用于运行关键服务的冷区域服务器、用于执行不确定的微服务的暖区域服务器和用于运行非关键服务的热区域服务器，其中：冷区域服务器保证冷服务的电力资源供给，热区域服务器可以被任意降频，暖区域服务器可以根据性能设计被调整为热区域服务器或者冷区域服务器。
根据权利要求1或4所述的方法，其特征是，所述的优先分配，随着系统状态进行动态调整，即调整服务器数量以及微服务关键程度，具体包括：当应用运行功率大于供电功率且当暖区域服务器频率降到最低时，应用的供电功率仍然大于供电功率，则首先将暖区域的服务器逐一更新为热区域服务器，当应用的供电功率仍然大于供电功率，则开始将冷区域的服务器迁移到暖区域，直到应用的供电功率仍然小于等于供电功率，在此过程中：

①对涉及到的微服务进行相应的降级操作，对涉及到的微服务进行相应的降级操作，即上述暖区域的服务器逐一更新为热区域服务器时，原先暖区域的服务器运行的微服务等级从不确定微服务等级降级到非关键微服务，上述冷区域的服务器迁移到暖区域时，原先冷区域的服务器运行的微服务等级从关键微服务等级降级到不确定微服务等级；

②当应用整体运行功率小于等于供电功率后，需要动态调整微服务关键程度，提升系统整体利用率，具体方式如下：

i)当冷区域的服务器使用率小于50％的时候，则逐一地把暖区域关键程度最高的微服务升级成关键微服务并部署到冷区域运行，直到冷区域服务器的使用率提升到75％～85％；

ii)当暖区域的服务器使用率小于50％的时候，则逐一地把热区域关键程度最高的微服务升级成关键微服务并部署到暖区域运行，直到暖区域服务器的使用率提升到75％～85％；

iii)当应用运行功率小于等于供电功率时，所有微服务运行在满频运行的服务器上，不进行任何操作。
一种实现上述任一权利要求所述方法的电力资源分配的系统，其特征在于，包括：微服务层面管理系统、容器层面管理系统、服务器层面管理系统和ServiceFridge系统；

所述的微服务层面管理系统包括：静态因素分析模块、用户请求采集模块，其中：静态因素分析模块通过线下分析获取每个微服务关联的请求类型，完成每个请求类型所需要的调用次数，每次调用执行时间以及执行时间和供电的关系曲线；

所述的容器层面管理系统包括：动态因素分模块、二分图动态维护/更新模块、MFC计算模块和容器迁移控制模块，其中：动态因素分析模块通过图计算中分流的思想将用户请求进行划分，计算出每个微服务最终的关联的用户请求数量相对总的用户请求数量比例；二分图动态维护/更新模块更新图中每个顶点，即微服务关联的边的数量以及对应的入度；MFC计算模块利用图的性质计算每个微服务的关键程度；微服务关键程度划分模块通过比较微服务MFC和基准MFC的关系，将微服务划分至相应关键程度等级；容器迁移控制模块快速重启/终止容器实现不同微服务在不同服务器区间的快速迁移；

所述的ServiceFridge系统包括：关键微服务动态修正模块、动态服务器区域划分模块、差异化功率分配模块，其中：关键微服务动态修正模块根据当前可用电力资源的情况动态修正关键区域中微服务的种类和数量，动态服务器区域划分模块根据系统状态动态调整服务的关键程度以及每个区域的服务器数量，差异化功率分配模块根据系统供电功率和当前系统整体运行功率，调整不同服务器区域的运行功率；

所述的服务器层面管理系统包括：电力设施监控模块以及服务器调节模块，其中：电力设施监控模块与数据中心中电力资源基础设施相连并实时读取数据中心中可用资源的状态；服务器调节模块通过调整服务器动态电压和频率来控制服务器的运行功率。
根据权利要求6所述的系统，其特征是，所述的二分图动态维护/更新模块分析利用用户请求采集模块提供的用户状态变化信息，更新二分图中每个顶点关联的边的数量以及对应的入度；同时该模块为每个顶点维护了一个权值列表，列表的每一个数值表示在一种功率方案下的微服务的总执行时间，该执行时间等于调用次数乘以对应功率下的单次调用执行时间。
根据权利要求6所述的系统，其特征是，所述的MFC计算模块根据二分图动态维护/更新模块中每个顶点的入度、权重为每个微服务计算在不同功率下的MFC，每个微服务包含一个MFC数列，数列的每一个值等于入度和该功率情况下总的执行时间的乘积。
根据权利要求6所述的系统，其特征是，所述的容器迁移控制模块对微服务在不同区域的迁移，实现微服务的升级或者降级，具体操作包括：

i)当微服务从不确定微服务升级到关键微服务的时候，该模块在冷区域创建需要升级的微服务的容器复制版本，并且终止暖区域运行微服务的容器，从而实现微服务升级；

ii)当微服务从不确定微服务降级到非关键微服务的时候，该模块在热区域创建需要升级的微服务的容器复制版本，并且终止暖区域运行微服务的容器，从而实现微服务降级。
根据权利要求6所述的系统，其特征是，所述的微服务层面管理系统中进一步设有用户请求采集模块统计访问应用的用户请求类型和没中类型的请求数量，直接收集了当前系统用户状态。
根据权利要求6所述的系统，其特征是，所述的微服务层面管理系统中进一步设有用户请求采集模块将当前系统用户请求信息传递给动态因素分析模块，根据动态因素分析模块计算出的结果。
根据权利要求6所述的系统，其特征是，所述的差异化功率分配模块在整体功率大于供电功率时，调整不同区域的运行功率使得系统整体功率小于或者等于供电功率，保证冷区域的服务器运行在最高频率下，优先降低热区域服务器的运行功率来降低整体功耗；当热区域的服务器运行功耗降低到最低值仍不能达到目的，则降不确定区域服务器的运行功率；当仍然不能达到目的，则首先将暖区域的服务器逐一更新为热区域服务器，当应用的供电功率仍然大于供电功率，则开始将冷区域的服务器迁移到暖区域，直到应用的供电功率仍然小于等于供电功率。