CN114610445A

CN114610445A - 用于云计算的基于虚拟机的资源调度方法及其系统

Info

Publication number: CN114610445A
Application number: CN202210235779.XA
Authority: CN
Inventors: 刘笑颖
Original assignee: Hangzhou Wuping Technology Co ltd
Current assignee: Hangzhou Wuping Technology Co ltd
Priority date: 2022-03-11
Filing date: 2022-03-11
Publication date: 2022-06-10

Abstract

本申请云计算的资源调度的领域，其具体地公开了一种用于云计算的基于虚拟机的资源调度方法及其系统，其通过卷积神经网络模型来提取出所述虚拟机个数的度矩阵和所述各个物理节点之间的邻接关系的邻接矩阵的高维隐含特征，进一步构造拉普拉斯特征图以表示所述每个物理节点的拓扑特征信息，并且在对单个物理节点的多个虚拟机进行调度时，利用转换器模型来对所述虚拟机的各个参数进行上下文编码，以获得所述各个节点中各个虚拟机的全局性的参数关联信息，进一步再将分类器包含预定数目的全连接层，并对所述分类器进行剪枝，以使得分类的准确性更高。这样就能够保证负载均衡，从而提高云数据中心的效率。

Description

用于云计算的基于虚拟机的资源调度方法及其系统

技术领域

本申请涉及云计算的资源调度的领域，且更为具体地，涉及一种用于云计算的基于虚拟机的资源调度方法及其系统。

背景技术

云计算(cloud computing)是分布式计算的一种，指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序，然后，通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。

随着云计算技术的日益成熟，云计算技术应用地更加广泛，各个数据中心承担着更复杂、更繁重的任务。“云”中的各个物理机由于数量庞大、异构性强，对它们的弹性管理、按需服务的要求更强烈。但实际上，这些物理机由于自身的易购性、地理位置的差异、算法调度的不同，导致一些物理机处于空闲的状态，一些物理机处于超负载的状态。负载不均衡必然会影响云数据中心的效率以及用户的使用。

因此，期待一种用于云计算的基于虚拟机的资源调度方法。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种用于云计算的基于虚拟机的资源调度方法及其系统，其通过卷积神经网络模型来提取出所述虚拟机个数的度矩阵和所述各个物理节点之间的邻接关系的邻接矩阵的高维隐含特征，进一步构造拉普拉斯特征图以表示所述每个物理节点的拓扑特征信息，并且在对单个物理节点的多个虚拟机进行调度时，利用转换器模型来对所述虚拟机的各个参数进行上下文编码，以获得所述各个节点中各个虚拟机的全局性的参数关联信息，进一步再将分类器包含预定数目的全连接层，并对所述分类器进行剪枝，以使得分类的准确性更高。这样就能够保证负载均衡，从而提高云数据中心的效率。

根据本申请的一个方面，提供了一种用于云计算的基于虚拟机的资源调度方法，其包括：

训练阶段，包括：

对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵；

分别将所述度矩阵和所述邻接矩阵通过第一卷积神经网络和第二卷积神经网络以获得度特征图和邻接特征图；

基于所述度特征图和所述邻接特征图构造拉普拉斯特征图，其中，所述拉普拉斯特征图的沿其高度维度的各个特征矩阵用于表示各个物理节点的拓扑信息在高维特征空间的分布式特征表示；

获取各个所述物理节点的各个虚拟机的多个使用性能参数并将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量；

将各个所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量；

将各个所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量；

将各个所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量；

将各个所述虚拟机的分类特征向量通过包括多个全连接层的分类器以获得分类损失函数值，其中，所述分类器的多个全连接层用于对所述分类特征向量进行全连接编码；

基于所述分类损失函数值的一阶导数并通过梯度下降的反向传播来更新所述第一卷积神经网络、所述第二卷积神经网络、所述编码器模型和所述分类器的参数的同时，使用所述分类损失函数值的二阶倒数来解析所述分类器的回归权值扰动对分类损失函数值的影响程度值；以及

基于所述影响程度值，对所述分类器的多个全连接层之中的部分连接权进行剪枝；以及

推断阶段，包括：

分别将所述度矩阵和所述邻接矩阵通过经训练阶段训练完成的所述第一卷积神经网络和所述第二卷积神经网络以获得度特征图和邻接特征图；

基于所述度特征图和所述邻接特征图构造拉普拉斯特征图；

将各个所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量；以及

将各个所述虚拟机的分类特征向量通过经训练阶段训练完成的分类器以获得分类结果，所述分类结果用于表示虚拟机是否可被迁移。

根据本申请提供的用于云计算的基于虚拟机的资源调度方法及其系统，其通过卷积神经网络模型来提取出所述虚拟机个数的度矩阵和所述各个物理节点之间的邻接关系的邻接矩阵的高维隐含特征，进一步构造拉普拉斯特征图以表示所述每个物理节点的拓扑特征信息，并且在对单个物理节点的多个虚拟机进行调度时，利用转换器模型来对所述虚拟机的各个参数进行上下文编码，以获得所述各个节点中各个虚拟机的全局性的参数关联信息，进一步再将分类器包含预定数目的全连接层，并对所述分类器进行剪枝，以使得分类的准确性更高。这样就能够保证负载均衡，从而提高云数据中心的效率。

附图说明

通过结合附图对本申请实施例进行更详细的描述，本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与本申请实施例一起用于解释本申请，并不构成对本申请的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1为根据本申请实施例的用于云计算的基于虚拟机的资源调度方法中训练阶段的流程图。

图2为根据本申请实施例的用于云计算的基于虚拟机的资源调度方法中推断阶段的流程图。

图3为根据本申请实施例的用于云计算的基于虚拟机的资源调度方法中训练阶段的架构示意图。

图4为根据本申请实施例的用于云计算的基于虚拟机的资源调度方法中推断阶段的架构示意图。

图5为根据本申请实施例的用于云计算的基于虚拟机的资源调度系统的框图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

场景概述

如前所述，随着云计算技术的日益成熟，云计算技术应用地更加广泛，各个数据中心承担着更复杂、更繁重的任务。“云”中的各个物理机由于数量庞大、异构性强，对它们的弹性管理、按需服务的要求更强烈。但实际上，这些物理机由于自身的易购性、地理位置的差异、算法调度的不同，导致一些物理机处于空闲的状态，一些物理机处于超负载的状态。负载不均衡必然会影响云数据中心的效率以及用户的使用，因此，期待一种用于云计算的基于虚拟机的资源调度方法。

具体地，在本申请的技术方案中，首先对每个物理节点进行拓扑信息的特征编码，即以每个物理节点包括的虚拟机个数i构造度矩阵，再以各个物理节点之间的邻接关系构造邻接矩阵。然后，分别将度矩阵和邻接矩阵通过第一卷积神经网络和第二卷积神经网络获得度特征图和邻接特征图，并以度特征图与邻接特征图进行逐位置的相减以获得拉普拉斯特征图。因此，拉普拉斯特征图沿高度方向的每个特征矩阵可以作为每个物理节点的拓扑信息的特征表示。

接下来，要对单个物理节点的多个虚拟机进行调度时，首先获得每个虚拟机的CPU利用率、内存利用率、带宽利用率等参数，并将每个参数通过包含嵌入层的基于上下文的编码器模型，例如转换器模型，并将参数特征向量进行拼接以得到单个虚拟机的特征表达向量。

然后，通过将该物理节点的如上所述得到的特征矩阵与每个虚拟机的特征表达向量相乘，得到每个虚拟机的拓扑特征向量。再将每个虚拟机的拓扑特征向量进行以虚拟机为单位作为整体的上下文编码，例如通过转换器模型，以得到每个虚拟机对应的分类特征向量。

最后，考虑到每个虚拟机的分类特征向量中包含了物理节点的拓扑信息、参数之间的上下文信息以及各个虚拟机之间的上下文信息等大量信息，因此分类器需要包含预定数目的全连接层，例如，全连接层的数目大于预定阈值，以通过全连接层的权重系数来从分类特征向量解析出这些信息，但这又容易造成分类器的过拟合。因此，在通过分类器获得分类损失函数值之后，在通过分类损失函数值的一阶导数进行反向传播来更新整个模型的参数的同时，进一步使用分类损失函数值的二阶导数，来解析分类器的回归权值扰动对分类损失函数值的影响程度，从而消除分类器的多个全连接层之中的部分连接权，来实现分类器的剪枝，以减小过拟合的可能性。

基于此，本申请提出了一种用于云计算的基于虚拟机的资源调度方法，其包括：训练阶段和推断阶段。其中，训练阶段包括步骤：对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵；分别将所述度矩阵和所述邻接矩阵通过第一卷积神经网络和第二卷积神经网络以获得度特征图和邻接特征图；基于所述度特征图和所述邻接特征图构造拉普拉斯特征图，其中，所述拉普拉斯特征图的沿其高度维度的各个特征矩阵用于表示各个物理节点的拓扑信息在高维特征空间的分布式特征表示；获取各个所述物理节点的各个虚拟机的多个使用性能参数并将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量；将各个所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量；将各个所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量；将各个所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量；将各个所述虚拟机的分类特征向量通过包括多个全连接层的分类器以获得分类损失函数值，其中，所述分类器的多个全连接层用于对所述分类特征向量进行全连接编码；基于所述分类损失函数值的一阶导数并通过梯度下降的反向传播来更新所述第一卷积神经网络、所述第二卷积神经网络、所述编码器模型和所述分类器的参数的同时，使用所述分类损失函数值的二阶倒数来解析所述分类器的回归权值扰动对分类损失函数值的影响程度值；以及，基于所述影响程度值，对所述分类器的多个全连接层之中的部分连接权进行剪枝。其中，推断阶段包括步骤：对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵；分别将所述度矩阵和所述邻接矩阵通过经训练阶段训练完成的所述第一卷积神经网络和所述第二卷积神经网络以获得度特征图和邻接特征图；基于所述度特征图和所述邻接特征图构造拉普拉斯特征图；获取各个所述物理节点的各个虚拟机的多个使用性能参数并将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量；将各个所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量；将各个所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量；将各个所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量；以及，将各个所述虚拟机的分类特征向量通过经训练阶段训练完成的分类器以获得分类结果，所述分类结果用于表示虚拟机是否可被迁移。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性方法

图1图示了根据本申请实施例的用于云计算的基于虚拟机的资源调度方法中训练阶段的流程图。如图1所示，根据本申请实施例的用于云计算的基于虚拟机的资源调度方法，包括：训练阶段，包括步骤：S110，对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵；S120，分别将所述度矩阵和所述邻接矩阵通过第一卷积神经网络和第二卷积神经网络以获得度特征图和邻接特征图；S130，基于所述度特征图和所述邻接特征图构造拉普拉斯特征图，其中，所述拉普拉斯特征图的沿其高度维度的各个特征矩阵用于表示各个物理节点的拓扑信息在高维特征空间的分布式特征表示；S140，获取各个所述物理节点的各个虚拟机的多个使用性能参数并将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量；S150，将各个所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量；S160，将各个所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量；S170，将各个所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量；S180，将各个所述虚拟机的分类特征向量通过包括多个全连接层的分类器以获得分类损失函数值，其中，所述分类器的多个全连接层用于对所述分类特征向量进行全连接编码；S190，基于所述分类损失函数值的一阶导数并通过梯度下降的反向传播来更新所述第一卷积神经网络、所述第二卷积神经网络、所述编码器模型和所述分类器的参数的同时，使用所述分类损失函数值的二阶倒数来解析所述分类器的回归权值扰动对分类损失函数值的影响程度值；以及，S200，基于所述影响程度值，对所述分类器的多个全连接层之中的部分连接权进行剪枝。

图2图示了根据本申请实施例的用于云计算的基于虚拟机的资源调度方法中推断阶段的流程图。如图2所示，根据本申请实施例的用于云计算的基于虚拟机的资源调度方法，还包括：推断阶段，包括步骤：S210，对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵；S220，分别将所述度矩阵和所述邻接矩阵通过经训练阶段训练完成的所述第一卷积神经网络和所述第二卷积神经网络以获得度特征图和邻接特征图；S230，基于所述度特征图和所述邻接特征图构造拉普拉斯特征图；S240，获取各个所述物理节点的各个虚拟机的多个使用性能参数并将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量；S250，将各个所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量；S260，将各个所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量；S270，将各个所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量；以及，S280，将各个所述虚拟机的分类特征向量通过经训练阶段训练完成的分类器以获得分类结果，所述分类结果用于表示虚拟机是否可被迁移。

图3图示了根据本申请实施例的用于云计算的基于虚拟机的资源调度方法中训练阶段的架构示意图。如图3所示，在训练阶段中，在该网络架构中，首先，对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数(例如，如图3中所示意的P1)的度矩阵(例如，如图3中所示意的M1)和用于表示各个物理节点之间的邻接关系(例如，如图3中所示意的P2)的邻接矩阵(例如，如图3中所示意的M2)；接着，分别将所述度矩阵和所述邻接矩阵通过第一卷积神经网络(例如，如图3中所示意的CN1)和第二卷积神经网络(例如，如图3中所示意的CN2)以获得度特征图(例如，如图3中所示意的F1)和邻接特征图(例如，如图3中所示意的F2)；然后，基于所述度特征图和所述邻接特征图构造拉普拉斯特征图(例如，如图3中所示意的F3)；接着，将获得的每个所述虚拟机的多个使用性能参数(例如，如图3中所示意的Q)通过包含嵌入层的基于上下文的编码器模型(例如，如图3中所示意的E)以获得所述多个使用性能参数对应的多个参数特征向量(例如，如图3中所示意的VF1)；然后，将各个所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量(例如，如图3中所示意的VF2)；接着，将各个所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量(例如，如图3中所示意的V)；然后，将各个所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量(例如，如图3中所示意的VFC)；接着，将各个所述虚拟机的分类特征向量通过包括多个全连接层的分类器(例如，如图3中所示意的圈S)以获得分类损失函数值(例如，如图3中所示意的CLV)；然后，基于所述分类损失函数值的一阶导数(例如，如图3中所示意的FD)并通过梯度下降的反向传播来更新所述第一卷积神经网络、所述第二卷积神经网络、所述编码器模型和所述分类器的参数的同时，使用所述分类损失函数值的二阶倒数(例如，如图3中所示意的SOR)来解析所述分类器的回归权值扰动对分类损失函数值的影响程度值(例如，如图3中所示意的IDV)；以及，最后，基于所述影响程度值，对所述分类器的多个全连接层之中的部分连接权进行剪枝。

图4图示了根据本申请实施例的用于云计算的基于虚拟机的资源调度方法中推断阶段的架构示意图。如图4所示，在推断阶段中，在该网络结构中，首先，对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数(例如，如图4中所示意的P1)的度矩阵(例如，如图4中所示意的M1)和用于表示各个物理节点之间的邻接关系(例如，如图4中所示意的P2)的邻接矩阵(例如，如图4中所示意的M2)；接着，分别将所述度矩阵和所述邻接矩阵通过经训练阶段训练完成的所述第一卷积神经网络(例如，如图4中所示意的CNN1)和所述第二卷积神经网络(例如，如图4中所示意的CNN2)以获得度特征图(例如，如图4中所示意的F1)和邻接特征图(例如，如图4中所示意的F2)；然后，基于所述度特征图和所述邻接特征图构造拉普拉斯特征图(例如，如图4中所示意的F3)；接着，将获取的每个所述虚拟机的多个使用性能参数(例如，如图4中所示意的Q)通过包含嵌入层的基于上下文的编码器模型(例如，如图4中所示意的E)以获得所述多个使用性能参数对应的多个参数特征向量(例如，如图4中所示意的VF1)；然后，将各个所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量(例如，如图4中所示意的VF2)；接着，将各个所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量(例如，如图4中所示意的VF3)；然后，将各个所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量(例如，如图4中所示意的VFC)；以及，最后，将各个所述虚拟机的分类特征向量通过经训练阶段训练完成的分类器(例如，如图4中所示意的圈S)以获得分类结果，所述分类结果用于表示虚拟机是否可被迁移。

更具体地，在训练阶段中，在步骤S110和步骤S120中，对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵，并分别将所述度矩阵和所述邻接矩阵通过第一卷积神经网络和第二卷积神经网络以获得度特征图和邻接特征图。如前所述，本申请的思路是以虚拟机迁移为基础，也就是，在每个物理机节点包括虚拟机个数i，每个虚拟机的负载通过如下数据来表征：CPU利用率、内存利用率、带宽利用率。

因此，在本申请的技术方案中，需要首先对云计算系统的每个物理节点进行基于拓扑信息的特征编码，也就是，以所述每个物理节点包括的虚拟机个数i构造度矩阵，再以所述各个物理节点之间的邻接关系构造邻接矩阵。应可以理解，邻接矩阵是表示顶点之间相邻关系的矩阵，是n阶方阵，这里，利用所述邻接矩阵可以表示所述各个物理节点之间的关联信息。度矩阵是对角阵，对角上的元素表示为各个顶点的度，这里，利用所述度矩阵，可以用于表示所述各个物理节点包含的虚拟机个数信息。然后，进一步将所述度矩阵通过第一卷积神经网络中进行处理，以提取出所述各个物理节点包含的虚拟机个数信息之间的高维关联信息，从而得到度特征图；再将所述邻接矩阵通过第二卷积神经网络中进行处理，以提取出所述各个物理节点之间的高维关联信息，从而得到邻接特征图。

具体地，在本申请实施例中，对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵的过程，包括：首先，获取所述云计算系统中各个物理节点所包括的虚拟机数量；接着，将各个所述物理节点所包括的虚拟机数量分别填充入矩阵的对角线位置以获得所述度矩阵；然后，获取所述云计算系统中各个物理节点之间的连接关系；最后，如果两个所述物理节点之间存在连接，设定所述邻接矩阵中对应位置的特征值为1，如果两个所述物理节点之间不存在连接，则设定所述邻接矩阵中对应位置的特征值为0。

相应地，在本申请实施例中，分别将所述度矩阵和所述邻接矩阵通过第一卷积神经网络和第二卷积神经网络以获得度特征图和邻接特征图的过程，包括：首先，所述第一卷积神经网络的各层在正向传递的过程中基于卷积核对所述度矩阵进行卷积处理、池化处理和激活处理以获得所述度特征图；然后，所述第二卷积神经网络的各层在正向传递的过程中基于卷积核对所述邻接矩阵进行卷积处理、池化处理和激活处理以获得所述邻接特征图。

更具体地，在训练阶段中，在步骤S130中，基于所述度特征图和所述邻接特征图构造拉普拉斯特征图，其中，所述拉普拉斯特征图的沿其高度维度的各个特征矩阵用于表示各个物理节点的拓扑信息在高维特征空间的分布式特征表示。也就是，在本申请的技术方案中，在得到所述度矩阵和所述邻接矩阵后，进一步基于述度特征图和所述邻接特征图构造拉普拉斯特征图。在一个具体示例中，可以将所述度特征图与所述邻接特征图进行逐位置特征值相减以获得所述拉普拉斯特征图。因此，这里，所述拉普拉斯特征图沿高度方向的每个特征矩阵可以作为每个物理节点的拓扑信息在高维特征空间的分布式特征表示。

更具体地，在训练阶段中，在步骤S140和步骤S150中，获取各个所述物理节点的各个虚拟机的多个使用性能参数并将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量，并将各个所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量。应可以理解，在进行基于虚拟机的资源调度时，需考虑所述各个节点的虚拟机运行的整体情况，所述各个节点的运行情况之间的关联，以及，所述各个节点中各个虚拟机运行之间的关联，来生成各个虚拟机节点是否可被迁移的分类结果。因此，在本申请的技术方案中，要对单个物理节点的多个虚拟机进行调度时，首先，获得各个所述物理节点的各个虚拟机的多个使用性能参数，其中，所述性能参数包括但不局限于CPU利用率、内存利用率和带宽利用率等参数。接着，将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型，例如转换器模型，以获得所述多个使用性能参数对应的多个参数特征向量。应可以理解，由于基于转换器的编码器模型可以基于上下文对输入向量进行编码，因此所得到的参数特征向量可以获得全局性的参数关联信息。然后，再将各个所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量。

更具体地，在本申请实施例中，将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量的过程，包括：首先，使用所述编码器模型的嵌入层将各个所述使用性能参数进行向量化转换以获得多个输入向量；然后，将所述多个输入向量输入所述编码器模型的转换器以获得所述多个参数特征向量。

更具体地，在训练阶段中，在步骤S160中，将各个所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量。也就是，在本申请的技术方案中，在得到各个所述虚拟机的特征表示向量与所述拉普拉斯特征图后，将各个所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述拉普拉斯特征图中对应的特征矩阵进行相乘，以将所述虚拟机的特征表示向量映射到所述虚拟机归属的物理节点在所述拉普拉斯特征图中对应的特征矩阵的高维空间中，从而获得各个所述虚拟机的拓扑特征向量。

更具体地，在训练阶段中，在步骤S170和步骤S180中，将各个所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量，并将各个所述虚拟机的分类特征向量通过包括多个全连接层的分类器以获得分类损失函数值，其中，所述分类器的多个全连接层用于对所述分类特征向量进行全连接编码。也就是，进一步将各个所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码，例如通过转换器模型，以获得各个所述虚拟机的分类特征向量。应可以理解，用于上下文编码的转换器模型可以基于上下文对所述输入的向量进行编码，从而使得获得的所述虚拟机的分类特征向量包含所述各个节点的各个虚拟机运行的全局性关联信息。接着，再将各个所述虚拟机的分类特征向量通过包括多个全连接层的分类器以获得分类损失函数值，其中，所述分类器的多个全连接层用于对所述分类特征向量进行全连接编码。

具体地，在本申请实施例中，将各个所述虚拟机的分类特征向量通过包括多个全连接层的分类器以获得分类损失函数值的过程，包括：首先，使用所述分类器的多个全连接层对各个所述虚拟机的分类特征向量进行全连接编码以获得编码分类特征向量。然后，将所述编码分类特征向量输入所述分类器的Softmax分类函数以获得分类结果。具体地，先将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述编码分类特征向量归属于所述虚拟机可被迁移的第一概率以及所述虚拟机不可被迁移的第二概率；进一步，响应于当所述第一概率大于第二概率时，所述分类结果为所述虚拟机可被迁移，响应于当所述第一概率小于第二概率时，所述分类结果为所述虚拟机不可被迁移。最后，计算所述分类结果与真实值之间的交叉熵值作为所述分类损失函数值。

更具体地，在训练阶段中，在步骤S190和步骤S200中，基于所述分类损失函数值的一阶导数并通过梯度下降的反向传播来更新所述第一卷积神经网络、所述第二卷积神经网络、所述编码器模型和所述分类器的参数的同时，使用所述分类损失函数值的二阶倒数来解析所述分类器的回归权值扰动对分类损失函数值的影响程度值，并基于所述影响程度值，对所述分类器的多个全连接层之中的部分连接权进行剪枝。应可以理解，考虑到所述每个虚拟机的分类特征向量中包含了物理节点的拓扑信息、所述参数之间的上下文信息以及所述各个虚拟机之间的上下文信息等大量信息，因此所述分类器需要包含预定数目的全连接层，例如，全连接层的数目大于预定阈值，以通过全连接层的权重系数来从所述分类特征向量解析出这些信息，但这又容易造成分类器的过拟合。因此，在本申请的技术方案中，在通过所述分类器获得分类损失函数值之后，再通过所述分类损失函数值的一阶导数进行反向传播来更新整个模型的参数的同时，进一步使用所述分类损失函数值的二阶导数，来解析分类器的回归权值扰动对分类损失函数值的影响程度，从而消除分类器的多个全连接层之中的部分连接权，来实现分类器的剪枝，以减小过拟合的可能性。在一个具体示例中，响应于部分连接权对应的影响程度值小于预设阈值，消除所述分类器的多个全连接层之中的所述部分连接权。

在训练完成后，进入推断阶段。也就是，在使用用于云计算的基于虚拟机的资源调度算法来训练所述卷积神经网络、所述编码器模型和所述分类器后，将训练完成的所述卷积神经网络、所述编码器模型和所述分类器用于实际的推断阶段中。

更具体地，在推断阶段中，同样地，首先，对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵。接着，分别将所述度矩阵和所述邻接矩阵通过经训练阶段训练完成的所述第一卷积神经网络和所述第二卷积神经网络以获得度特征图和邻接特征图。然后，基于所述度特征图和所述邻接特征图构造拉普拉斯特征图。接着，获取各个所述物理节点的各个虚拟机的多个使用性能参数并将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量。然后，将各个所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量。接着，将各个所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量。然后，将各个所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量。最后，将各个所述虚拟机的分类特征向量通过经训练阶段训练完成的分类器以获得分类结果，所述分类结果用于表示虚拟机是否可被迁移。

综上，基于本申请实施例的用于云计算的基于虚拟机的资源调度方法被阐明，其通过卷积神经网络模型来提取出所述虚拟机个数的度矩阵和所述各个物理节点之间的邻接关系的邻接矩阵的高维隐含特征，进一步构造拉普拉斯特征图以表示所述每个物理节点的拓扑特征信息，并且在对单个物理节点的多个虚拟机进行调度时，利用转换器模型来对所述虚拟机的各个参数进行上下文编码，以获得所述各个节点中各个虚拟机的全局性的参数关联信息，进一步再将分类器包含预定数目的全连接层，并对所述分类器进行剪枝，以使得分类的准确性更高。这样就能够保证负载均衡，从而提高云数据中心的效率。

示例性系统

图5图示了根据本申请实施例的用于云计算的基于虚拟机的资源调度系统的框图。如图5所示，根据本申请实施例的用于云计算的基于虚拟机的资源调度系统600，包括：训练模块610和推断模块620。

如图5所示，所述训练模块610，包括：特征编码单元6101，用于对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵；卷积神经网络单元6102，用于分别将所述特征编码单元6101获得的所述度矩阵和所述特征编码单元获得的所述邻接矩阵通过第一卷积神经网络和第二卷积神经网络以获得度特征图和邻接特征图；构造单元6103，用于基于所述卷积神经网络单元6102获得的所述度特征图和所述卷积神经网络单元获得的所述邻接特征图构造拉普拉斯特征图，其中，所述拉普拉斯特征图的沿其高度维度的各个特征矩阵用于表示各个物理节点的拓扑信息在高维特征空间的分布式特征表示；性能参数处理单元6104，用于获取各个所述物理节点的各个虚拟机的多个使用性能参数并将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量；拼接单元6105，用于将各个所述性能参数处理单元6104获得的所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量；矩阵相乘单元6106，用于将各个所述拼接单元6105获得的所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述构造单元6103获得的所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量；编码单元6107，用于将各个所述矩阵相乘单元1606获得的所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量；分类器处理单元6108，用于将各个所述编码单元6107获得的所述虚拟机的分类特征向量通过包括多个全连接层的分类器以获得分类损失函数值，其中，所述分类器的多个全连接层用于对所述分类特征向量进行全连接编码；训练单元6109，用于基于所述分类器处理单元6108获得的所述分类损失函数值的一阶导数并通过梯度下降的反向传播来更新所述第一卷积神经网络、所述第二卷积神经网络、所述编码器模型和所述分类器的参数的同时，使用所述分类器处理单元6108获得的所述分类损失函数值的二阶倒数来解析所述分类器的回归权值扰动对分类损失函数值的影响程度值；以及，剪枝单元6110，用于基于所述训练单元6109获得的所述影响程度值，对所述分类器的多个全连接层之中的部分连接权进行剪枝。

如图5所示，所述推断模块620，包括：矩阵构造单元621，用于对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵；特征图生成单元622，用于分别将所述矩阵构造单元621获得的所述度矩阵和所述矩阵构造单元621获得的所述邻接矩阵通过经训练阶段训练完成的所述第一卷积神经网络和所述第二卷积神经网络以获得度特征图和邻接特征图；拉普拉斯特征图生成单元623，用于基于所述特征图生成单元622获得的所述度特征图和所述特征图生成单元622获得的所述邻接特征图构造拉普拉斯特征图；参数特征向量生成单元624，用于获取各个所述物理节点的各个虚拟机的多个使用性能参数并将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量；特征向量表示生成单元625，用于将各个所述参数特征向量生成单元624获得的所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量；拓扑特征向量生成单元626，用于将各个所述特征向量表示生成单元625获得的所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述拉普拉斯特征图生成单元623获得所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量；分类特征向量生成单元627，用于将各个所述拓扑特征向量生成单元626获得的所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量；以及，分类单元628，用于将各个所述分类特征向量生成单元627获得的所述虚拟机的分类特征向量通过经训练阶段训练完成的分类器以获得分类结果，所述分类结果用于表示虚拟机是否可被迁移。

这里，本领域技术人员可以理解，上述用于云计算的基于虚拟机的资源调度系统600中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的用于云计算的基于虚拟机的资源调度方法的描述中得到了详细介绍，并因此，将省略其重复描述。

如上所述，根据本申请实施例的用于云计算的基于虚拟机的资源调度系统600可以实现在各种终端设备中，例如用于云计算的基于虚拟机的资源调度算法的服务器等。在一个示例中，根据本申请实施例的用于云计算的基于虚拟机的资源调度系统600可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该用于云计算的基于虚拟机的资源调度系统600可以是该终端设备的操作装置中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该用于云计算的基于虚拟机的资源调度系统600同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该用于云计算的基于虚拟机的资源调度系统600与该终端设备也可以是分立的设备，并且该用于云计算的基于虚拟机的资源调度系统600可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种用于云计算的基于虚拟机的资源调度方法，其特征在于，包括：

训练阶段，包括：

推断阶段，包括：

基于所述度特征图和所述邻接特征图构造拉普拉斯特征图；

2.根据权利要求1所述的用于云计算的基于虚拟机的资源调度方法，其中，对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵，包括：

获取所述云计算系统中各个物理节点所包括的虚拟机数量；

将各个所述物理节点所包括的虚拟机数量分别填充入矩阵的对角线位置以获得所述度矩阵；

获取所述云计算系统中各个物理节点之间的连接关系；以及

如果两个所述物理节点之间存在连接，设定所述邻接矩阵中对应位置的特征值为1，如果两个所述物理节点之间不存在连接，则设定所述邻接矩阵中对应位置的特征值为0。

3.根据权利要求2所述的用于云计算的基于虚拟机的资源调度方法，其中，分别将所述度矩阵和所述邻接矩阵通过第一卷积神经网络和第二卷积神经网络以获得度特征图和邻接特征图，包括：

所述第一卷积神经网络的各层在正向传递的过程中基于卷积核对所述度矩阵进行卷积处理、池化处理和激活处理以获得所述度特征图；

所述第二卷积神经网络的各层在正向传递的过程中基于卷积核对所述邻接矩阵进行卷积处理、池化处理和激活处理以获得所述邻接特征图。

4.根据权利要求3所述的用于云计算的基于虚拟机的资源调度方法，其中，基于所述度特征图和所述邻接特征图构造拉普拉斯特征图，包括：

将所述度特征图与所述邻接特征图进行逐位置特征值相减以获得所述拉普拉斯特征图。

5.根据权利要求4所述的用于云计算的基于虚拟机的资源调度方法，其中，所述多个使用性能参数包括CPU利用率、内存利用率和带宽利用率；

其中，将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量，包括：

使用所述编码器模型的嵌入层将各个所述使用性能参数进行向量化转换以获得多个输入向量；以及

将所述多个输入向量输入所述编码器模型的转换器以获得所述多个参数特征向量。

6.根据权利要求5所述的用于云计算的基于虚拟机的资源调度方法，其中，将各个所述虚拟机的分类特征向量通过包括多个全连接层的分类器以获得分类损失函数值，包括：

使用所述分类器的多个全连接层对各个所述虚拟机的分类特征向量进行全连接编码以获得编码分类特征向量；

将所述编码分类特征向量输入所述分类器的Softmax分类函数以获得分类结果；以及

计算所述分类结果与真实值之间的交叉熵值作为所述分类损失函数值。

7.根据权利要求6所述的用于云计算的基于虚拟机的资源调度方法，其中，基于所述影响程度值，对所述分类器的多个全连接层之中的部分连接权进行剪枝，包括：

响应于部分连接权对应的影响程度值小于预设阈值，消除所述分类器的多个全连接层之中的所述部分连接权。

8.一种用于云计算的基于虚拟机的资源调度系统，其特征在于，包括：

训练模块，包括：

特征编码单元，用于对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵；

卷积神经网络单元，用于分别将所述特征编码单元获得的所述度矩阵和所述特征编码单元获得的所述邻接矩阵通过第一卷积神经网络和第二卷积神经网络以获得度特征图和邻接特征图；

构造单元，用于基于所述卷积神经网络单元获得的所述度特征图和所述卷积神经网络单元获得的所述邻接特征图构造拉普拉斯特征图，其中，所述拉普拉斯特征图的沿其高度维度的各个特征矩阵用于表示各个物理节点的拓扑信息在高维特征空间的分布式特征表示；

性能参数处理单元，用于获取各个所述物理节点的各个虚拟机的多个使用性能参数并将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量；

拼接单元，用于将各个所述性能参数处理单元获得的所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量；

矩阵相乘单元，用于将各个所述拼接单元获得的所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述构造单元获得的所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量；

编码单元，用于将各个所述矩阵相乘单元获得的所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量；

分类器处理单元，用于将各个所述编码单元获得的所述虚拟机的分类特征向量通过包括多个全连接层的分类器以获得分类损失函数值，其中，所述分类器的多个全连接层用于对所述分类特征向量进行全连接编码；

训练单元，用于基于所述分类器处理单元获得的所述分类损失函数值的一阶导数并通过梯度下降的反向传播来更新所述第一卷积神经网络、所述第二卷积神经网络、所述编码器模型和所述分类器的参数的同时，使用所述分类器处理单元获得的所述分类损失函数值的二阶倒数来解析所述分类器的回归权值扰动对分类损失函数值的影响程度值；以及

剪枝单元，用于基于所述训练单元获得的所述影响程度值，对所述分类器的多个全连接层之中的部分连接权进行剪枝；以及

推断模块，包括：

矩阵构造单元，用于对云计算系统的各个物理节点进行基于拓扑信息的特征编码以获得用于表示各个物理节点包含的虚拟机个数的度矩阵和用于表示各个物理节点之间的邻接关系的邻接矩阵；

特征图生成单元，用于分别将所述矩阵构造单元获得的所述度矩阵和所述矩阵构造单元获得的所述邻接矩阵通过经训练阶段训练完成的所述第一卷积神经网络和所述第二卷积神经网络以获得度特征图和邻接特征图；

拉普拉斯特征图生成单元，用于基于所述特征图生成单元获得的所述度特征图和所述特征图生成单元获得的所述邻接特征图构造拉普拉斯特征图；

参数特征向量生成单元，用于获取各个所述物理节点的各个虚拟机的多个使用性能参数并将每个所述虚拟机的多个使用性能参数通过包含嵌入层的基于上下文的编码器模型以获得所述多个使用性能参数对应的多个参数特征向量；

特征向量表示生成单元，用于将各个所述参数特征向量生成单元获得的所述虚拟机的多个参数特征向量拼接为用于表示单个虚拟机的特征表示向量；

拓扑特征向量生成单元，用于将各个所述特征向量表示生成单元获得的所述虚拟机的特征表示向量与所述虚拟机归属的物理节点在所述拉普拉斯特征图生成单元获得所述拉普拉斯特征图中对应的特征矩阵进行相乘以获得各个所述虚拟机的拓扑特征向量；

分类特征向量生成单元，用于将各个所述拓扑特征向量生成单元获得的所述虚拟机的拓扑特征向量进行以虚拟机为单位的上下文编码以获得各个所述虚拟机的分类特征向量；以及

分类单元，用于将各个所述分类特征向量生成单元获得的所述虚拟机的分类特征向量通过经训练阶段训练完成的分类器以获得分类结果，所述分类结果用于表示虚拟机是否可被迁移。

9.根据权利要求8所述的用于云计算的基于虚拟机的资源调度系统，其中，所述特征编码单元，包括：

虚拟机数量获取子单元，用于获取所述云计算系统中各个物理节点所包括的虚拟机数量；

填充子单元，用于将各个所述虚拟机数量获取子单元获得的所述物理节点所包括的虚拟机数量分别填充入矩阵的对角线位置以获得所述度矩阵；

连接关系获取子单元，用于获取所述云计算系统中各个物理节点之间的连接关系；以及

设定子单元，用于如果两个所述物理节点之间存在连接，设定所述邻接矩阵中对应位置的特征值为1，如果两个所述物理节点之间不存在连接，则设定所述邻接矩阵中对应位置的特征值为0。

10.根据权利要求8所述的用于云计算的基于虚拟机的资源调度系统，其中，所述卷积神经网络单元，进一步用于：

所述第一卷积神经网络的各层在正向传递的过程中基于卷积核对所述度矩阵进行卷积处理、池化处理和激活处理以获得所述度特征图；所述第二卷积神经网络的各层在正向传递的过程中基于卷积核对所述邻接矩阵进行卷积处理、池化处理和激活处理以获得所述邻接特征图。