CN112068943A

CN112068943A - 一种基于复杂异构环境的微服务调度方法及其实现系统

Info

Publication number: CN112068943A
Application number: CN202010933828.8A
Authority: CN
Inventors: 郭莹; 杨美红; 张虎; 王筠; 陈静; 刘斌; 王长盛; 厉承轩
Original assignee: Shandong Computer Science Center National Super Computing Center in Jinan
Current assignee: Shandong Computer Science Center National Super Computing Center in Jinan
Priority date: 2020-09-08
Filing date: 2020-09-08
Publication date: 2020-12-11
Anticipated expiration: 2040-09-08
Also published as: CN112068943B

Abstract

本发明涉及一种复杂异构环境下的微服务调度方法及其实现系统，包括：(1)第一级调度：实时获取所有物理服务器、虚拟机、服务及微服务的基本信息，将有调用关系的微服务调度到关系距离更近的虚拟机中；保证各个微服务之间调用的高性能；(2)第二级调度：在业务应用运行过程中，统计一个时间段内虚拟机之间通信的延时和微服务之间的调用频繁程度，动态更新虚拟机之间的关系距离矩阵，周期性检查并迁移符合条件的微服务，保证调用频繁的微服务迁移到关系距离较近的虚拟机上。通过对微服务的两级调度之后，保证微服务能够被调度到合适的虚拟机上，尽量减少微服务跨虚拟机、跨物理服务器、跨网段调用，达到微服务之间高效调用的效果。

Description

一种基于复杂异构环境的微服务调度方法及其实现系统

技术领域

本发明涉及一种复杂异构环境下的微服务调度方法及其实现系统，更具体的说，尤其涉及一种复杂异构环境下通过将有调用关系的微服务调度到相同的宿主机或关联较紧密的宿主机上，从而提高多服务集群整体性能的调度方法及实现系统。

背景技术

随着近几年DevOps的日渐火热，微服务架构和容器技术作为DevOps的支撑技术，也逐渐成为软件行业的热点。微服务架构简单来说，就是将原来一个较大的服务，拆分成若干个小的微服务，每一个微服务都能够独立部署，并且独立承担一项功能。这样将服务微服务化之后，不仅能够降低服务之间的耦合性，而且能够有效降低服务的故障率，便于微服务的横向扩展和故障微服务的快速替换。但是，在微服务架构下，微服务和微服务之间、服务与服务之间的调用会更加频繁，本来程序内部通信可以完成的功能，现在需要通过接口请求的方式来完成。因此，如何能够让微服务与微服务之间、服务与服务之间调用更加高效，将是一个非常有价值的研究方向。

目前，在微服务的架构下，为了能够更好的利用有限和异构的物理服务器资源，通常将业务应用服务及其微服务部署到容器中，而容器运行在虚拟机中，最后虚拟机运行在物理服务器中。这种复杂异构的虚拟化部署架构，虽然能够充分的利用物理服务器的各种资源，但是主流的网络虚拟化技术都会在宿主机上建立一个类似于网桥的设备，来完成虚拟资源之间、虚拟资源与外部之间的通信。例如kubernetes的flannel网络插件，openstack的使用Linux Bridge网络模式等，都是类似的实现方式。因此,在微服务架构下，使用复杂异构虚拟化环境来部署业务应用时，如果不考虑微服务所在的虚拟机、物理服务器，将会出现微服务之间相互调用的过程是跨虚拟机、跨物理服务器、跨多个虚拟网段。这样不仅微服务之间调用会非常低效，而且会拖慢整个业务应用的性能，影响用户的体验。而传统的服务调度平台，没有统一考虑微服务所处的位置以及微服务之间是否存在调用关系这两个条件，而是近乎随机的将微服务调度到不同的虚拟机或物理服务器中，这就会导致调用关系频繁的服务被调度到跨虚拟机、跨物理服务器、跨物理网段的情况出现，从而拖慢整个业务应用的运行速度。

通过以上对微服务架构下服务与微服务的调度方法的分析可以看出，传统的调度方法不能有效的考虑微服务之间的调用关系以及微服务所在的虚拟机和物理服务器，从而无法达到微服务之间高效调用的效果。

发明内容

本发明为了解决上述技术问题的难点，提供了一种复杂异构环境下通过将有调用关系的微服务调度到相同的宿主机或关联较紧密的宿主机上，从而提高多服务集群整体性能的调度方法。

本发明还提供了上述调度方法的实现系统。

术语解释：

距离因子：对两台虚拟机之间通信延迟造成影响的因素进行相对定量化的描述。例如，两台虚拟机处在不同的网络的距离因子为2，处在相同网络的距离因子为1。

本发明的技术方案为：

一种基于复杂异构环境的微服务调度方法，运行于基于微服务架构的分布式容器应用平台，基于微服务架构的分布式容器应用平台包括若干台物理服务器，每台物理服务器包括若干台虚拟机，待调度的业务应用中包括若干个服务，每个服务中包括若干个微服务；初始化所有物理服务器、虚拟机、服务及微服务的基本信息，包括步骤如下：

(1)第一级调度：实时获取所有物理服务器、虚拟机、服务及微服务的基本信息，将有调用关系的微服务调度到关系距离更近的虚拟机中；保证各个微服务之间调用的高性能；

(2)第二级调度：在业务应用运行过程中，统计一个时间段内虚拟机之间通信的延时和微服务之间的调用频繁程度，通过虚拟机之间通信的延时动态更新虚拟机之间的关系距离矩阵，根据虚拟机之间的关系距离矩阵和微服务之间的调用频繁程度，周期性检查并迁移符合条件的微服务，保证调用频繁的微服务迁移到关系距离较近的虚拟机上。同时尽量保证各虚拟机的带宽利用率尽量均衡。

通过对微服务的两级调度之后，保证微服务能够被调度到合适的虚拟机上，尽量减少微服务跨虚拟机、跨物理服务器、跨网段调用，最终达到微服务之间高效调用的效果。

根据本发明优选的，步骤(1)中，所有物理服务器的基本信息，包括物理服务器集合PH，PH＝{PH₁,PH₂,PH₃,...,PH_m}，共有m台物理服务器，PH_m是指第m台物理服务器；

所有虚拟机的基本信息，包括虚拟机集合VM及每一台虚拟机能够提供的资源量集合R，VM＝{VM₁,VM₂,VM₃,...,VM_n}，共有n台虚拟机，VM_n是指第n台虚拟机；R＝{R₁,R₂,R₃,...,R_n}，R_n是指第n台虚拟机能够提供的资源量；

服务及微服务的基本信息，包括服务集合S、每个服务包含的微服务集合S_i、微服务占用资源MR_ij、微服务之间的调用关系列表CI、每个微服务需要预留的标准虚拟资源量CR_ij、微服务之间的关系系数、定时调度周期AT、虚拟机关系距离矩阵DL、业务应用微服务调度状态矩阵SL；

S＝{S₁,S₂,S₃,...,S_i,...,S_I}，共有I个服务，S_i是指第i个服务；

S_i＝{MS_i1,MS_i2,MS_i3,...,MS_ij...,MS_iJ}，是指第i个服务中包含J个微服务；

MR_ij是指第i个服务中的第j个微服务所占用的资源量；

CI＝[[(MS_ab,MS_cd),(MS_cd,MS_ef)],[(MS_gh,MS_ij)],...|a,b,c,d,e,f,g,h,i,j...＝1,2,3,...]；

(MS_gh,MS_ij)代表第g个服务中第h个微服务会调用第i个服务中第j个微服务；假设CI是根据微服务调用关系链条的服务节点的个数降序排序，即微服务调用关系链条长的被优先调度，微服务调用关系链条是一系列有先后调用关系的微服务；例如，A服务调用B服务，B服务调用C服务，则这样就组成一个有三个服务节点的链条，一个关系链条最少有两个服务节点；CI包含了一个业务应用中所有微服务调用关系。该列表是一个二维列表，每一个子列表代表一个微服务调用关系分支。微服务调用关系列表按照子列表元素的数量降序排列，即调用关系分支元素越多，则会优先调度该分支上的服务。

每个微服务需要预留的标准虚拟资源量为CR_ij，CR_ij表示第i个服务的第j个微服务所占用的虚拟资源；

微服务之间的关系系数是指一个定时调度周期AT微服务之间调用的次数，反应了微服务之间调用的频繁程度；例如，在AT时间内第i个服务中的第j个微服务调用第k个服务中的第l个微服务的次数，表示为C_ij,kl。微服务之间的关系系数都初始化为0；

初始化定时调度周期AI，定时调度周期AI初始化值为10分钟；调度实现系统会在定时调度周期AT内统计各微服务之间调用的次数，并且在周期结束时触发自动调度，将调用较频繁的微服务迁移到相同的虚拟机中。

DL＝{{D₁₁,D₁₂,D₁₃,...,D_1n},{D₂₁,D₂₂,D₂₃,...,D_2n},...,{D_n1,D_n2,D_n3,...,D_nn}}，D_nn是指第n台虚拟机与第n台虚拟机的关系距离，初始化为0；

假设第n台虚拟机与第n台虚拟机有m个距离因子,即:E₁,E₂,E₃,...,E_m，则

距离因子为大于等于0的值；影响距离因子的因素包括：虚拟机所处物理服务器、虚拟机所处网络、物理服务器所处网络、物理服务器所处机架、物理服务器所处网络中心。

进一步优选的，距离因子的数值定义如下：处在相同物理服务器的两台虚拟机的距离因子为1；处在不同物理服务器的两台虚拟机距离因子为2；处在相同网络的两台虚拟机的距离因子为1；处在不同网络的两台虚拟机的距离因子为2；分别处在两台物理服务器中且两台物理服务器处在相同网络的两台虚拟机的距离因子为1；分别处在两台物理服务器中且两台物理服务器处在不同网络的两台虚拟机的距离因子为2；分别处在两台物理服务器中且两台物理服务器处在相同机架的两台虚拟机的距离因子为1；分别处在两台物理服务器中且两台物理服务器处在不同机架的两台虚拟机的距离因子为2；分别处在两台物理服务器中且两台物理服务器处在相同网络中心的两台虚拟机的距离因子为1；分别处在两台物理服务器中且两台物理服务器处在不同网络中心的两台虚拟机的距离因子为2。

业务应用微服务调度状态矩阵SL用于查找微服务的调度状态，第i个服务中的第j个微服务调度状态表示为MSI_ij，状态包括：是否已调度is_scheduled、调度到的虚拟机VM；

该虚拟机关系距离矩阵可以方便查询两台虚拟机之间的关系距离。初始化时，虚拟机关系距离是由两台虚拟机所处物理机、虚拟机网段、物理机网段等距离因子因素确定。运行过程中，通过虚拟机之间的网络延时来确定。关系距离值越小，则代表两台虚拟机之间的网络延时越小。第i台虚拟机与第i台虚拟机的关系距离为0。

根据本发明优选的，步骤(1)中，将有调用关系的微服务调度到关系距离更近的虚拟机中，包括步骤如下：

a、用户提交待调度业务应用的信息，包括服务及微服务的基本信息；

b、判断虚拟机提供的总资源能否承载业务应用服务所占用总资源，虚拟机提供的总资源为

业务应用服务所占用总资源为

如果不能承载，则调度失败；否则，正式开始调度，进入步骤c；

c、依次进行三层嵌套循环，遍历所有有调用关系的微服务；

三层嵌套循环包括：第一层嵌套循环是：微服务之间的调用关系列表CI中的所有微服务调用关系链条；第二层嵌套循环是：遍历每一个调用关系链条中微服务调用关系；第三层嵌套循环是：遍历每一个微服务调用关系中的微服务；

将一个微服务调用关系链条中有调用关系的微服务调度到关系距离较近的虚拟机中；注意：第一层嵌套循环钟，在对每一个微服务调用关系链条进行调度之前，会按提供资源量来对虚拟机进行逆序排列，这样可以使一个链条中的微服务尽量调度到关系距离较近的虚拟机中。对于不同链条中存在微服务交叉调用的情况，在交叉点确定已经被调度的微服务所在的虚拟机，将该链条中其他的微服务调度到与该虚拟机距离较近的虚拟机中，这样可以让有交叉关系的链条中的微服务尽量在关系距离较近的虚拟机中。

d、根据虚拟机能够提供的资源量，对每一台虚拟机能够提供的资源量集合R重新按降序排序；记录当前待调度虚拟机索引p＝1；

e、遍历业务应用微服务调度状态矩阵SL，查找未调度的微服务，并且将其调度资源充足的虚拟机中；

遍历业务应用微服务调度状态矩阵SL中所有的微服务，判断该微服务是否已经被调度，是的话，进入步骤f，否则，判断虚拟机能否承载该微服务，可以承载，将该微服务调度到该虚拟机上，不可以承载，则切换下一个虚拟机，p加1，继续判断虚拟机能否承载该微服务。

f、确认所有的微服务都已经被调度完成，第一级调度结束。

判断业务应用微服务调度状态矩阵SL中的微服务是否全部遍历完成，是的话，第一调度结束，否则，返回步骤e。

进一步优选的，步骤c，包括步骤如下：

①遍历微服务之间的调用关系列表CI中的所有微服务调用关系链条；

②根据每一台虚拟机能够提供的资源量，降序排列每一台虚拟机能够提供的资源量集合R；

③初始化当前待调度虚拟机索引p＝1；

④遍历当前微服务调用关系链条中所有微服务调用关系；微服务调用关系，例如，微服务之间的调用关系列表CI中(MS_gh,MS_ij)代表第g个服务中第h个微服务会调用第i个服务中第j个微服务；

⑤遍历当前微服务调用关系中的微服务；例如，第i个服务中第j个微服务会调用第k个服务中第l个微服务中第j个微服务和第l个微服务；

⑥根据业务应用微服务调度状态矩阵SL判断当前微服务是否已被调度，如果是，记录调度到的虚拟机VM的索引p为当前微服务所在虚拟机；否则，进入步骤i；

⑦判断当前待调度虚拟机能否承载该当前微服务，如果能，则将当前微服务调度到当前待调度虚拟机上，否则，通过虚拟机关系距离矩阵DL找到与当前待调度虚拟机关系距离最近且能够承载当前微服务的虚拟机，记录待调度虚拟机索引p为该找到的虚拟机；

⑧判断微服务调用关系中的微服务是否全部遍历，如果是，进入步骤⑨，否则，返回步骤⑤；

⑨判断微服务调用关系链条中微服务调用关系是否全部遍历，如果是，进入步骤⑩，否则，返回步骤④；

⑩判断微服务之间的调用关系列表CI中的所有微服务调用关系链条是否全部遍历，如果是，进入步骤d，否则，返回步骤①。

通过第一级调度，可以达到以下效果：首先，根据调用关系链条的长短，将较长链条上的微服务调度到距离较近且能够承载该微服务的虚拟机中；其次，对于不同链条中存在微服务交叉调用的情况，在交叉点确定已经被调度的微服务所在的虚拟机，将该链条中其他的微服务调度到与该虚拟机距离较近的虚拟机中。这样可以使得一个链条中的微服务尽量处在相同或距离较近的虚拟机中，同时满足了不同链条中存在交叉调用的微服务也能够处在相同或距离较近的虚拟机中，最终提高了微服务之间的调用性能。

根据本发明优选的，步骤(2)中，调度器将根据定时调度周期AT内统计的虚拟机之间通信的延时和虚拟机关系距离矩阵DL，并生成微服务之间的关系系数列表C和按关系系数逆序排列的微服务之间的关系系数列表C_so_rt，将微服务之间的关系系数较大的微服务尽量调度到关系距离较近的虚拟机中，包括步骤如下：

g、到达定时调度周期AT时间节点，开始周期调度，获得上一定时调度周期AT内统计的微服务调用关系系数列表C、排序后的微服务关系系数列表C_so_rt和更新后的虚拟机关系距离矩阵DL；

微服务调用关系系数列表C是指所有的微服务的微服务之间调用的次数；排序后计算微服务之间的关系系数，假设第1组微服务关系一个周期内调用了F₁次，则第1组微服务调用关系系数为1；第2组在一个周期内调用了F₂次，则第2组微服务调用关系系数为F₂/F₁；第n组在一个周期内调用了F_n次，则第n组微服务调用关系系数为F_n/F₁,这样形成了排序后的微服务调用关系系数列表为C_so_rt。

将定时调度周期AT内的虚拟机之间的网络延时作为虚拟机之间的关系距离，并更新虚拟机关系距离矩阵DL；例如，可以使用较轻量级的ping工具，来获得虚拟机之间的网络延时；也可以使用服务器客户端模式的qper工具。

h、依次遍历排序后的微服务调用关系列表CI_so_rt；

i、判断当前微服务关系系数是否大于微服务之间的关系系数的平均值，如果是，启动微服务的迁移，进入步骤j，否则，进入步骤l；微服务之间的关系系数的平均值C_ave是指在一个定时调度周期AT内所有微服务关系系数的平均值；

j、通过业务应用微服务调度状态矩阵SL判断两个微服务是否在同一个虚拟机中，如果是，进入步骤l，否则，则将占用资源较少的微服务作为待迁移微服务，将占用资源较多的微服务所在的虚拟机作为目的虚拟机；

k、判断目的虚拟机是否能够承载该微服务，如果是，将待迁移微服务迁移到目的虚拟机中，进入步骤l，否则，根据关系距离矩阵DL查找能够承载该微服务且与目的虚拟机距离较近的虚拟机作为新目的虚拟机，将待迁移微服务迁移到新目的虚拟机中；

l、判断微服务调用关系列表是否全部遍历，是的话，第二级调度结束，否则，返回步骤h。

通过周期性的更新微服务调用关系系数和虚拟机关系距离矩阵，为第二级调度方法提供了必要的调度和迁移数据。第二级调度方法将周期性的执行，并且根据微服务调用关系系数和虚拟机关系距离矩阵，将相互调用频繁的微服务迁移到距离较近的虚拟机中。优先保证了相互调用频繁的微服务之间的调用性能，同时也能够均衡的使用虚拟机的网络资源。

上述调度方法的实现系统，包括依次连接的初始化模块、第一调度模块、第二调度模块；

所述初始化模块用于：初始化实时获取所有物理服务器、虚拟机、服务及微服务的基本信息；所述第一调度模块用于：根据实时获取的所有物理服务器、虚拟机、服务及微服务的基本信息，将有调用关系的微服务调度到关系距离更近的虚拟机中；所述第二调度模块用于：在业务应用运行过程中，统计一个时间段内虚拟机之间通信的延时和微服务之间的调用频繁程度，通过虚拟机之间通信的延时动态更新虚拟机之间的关系距离矩阵，根据虚拟机之间的关系距离矩阵和微服务之间的调用频繁程度，周期性检查并迁移符合条件的微服务，保证调用频繁的微服务迁移到关系距离较近的虚拟机上。

进一步优选的，所述第一调度模块、第二调度模块均为调度器。

进一步优选的，所述第一调度模块执行所述步骤a至步骤f；所述第二调度模块执行所述步骤g至步骤l。

本发明的有益效果为：

1.初始调度后，将有调用关系的微服务调度到关系距离近的虚拟机中，一定程度上提高了微服务之间的调用效率。

2.微服务之间的关系系数，会根据周期AT内的每个微服务的负载情况进行动态调整。依据动态的关系系数进行服务迁移，这样保证了不同时间段内调用最频繁的微服务会在距离较近的虚拟机中运行。

3.虚拟机直接的关系距离，会根据周期AT内虚拟机之间的网络延时进行动态调整。这样保证了每次周期性迁移时，虚拟机之间的关系距离都是最新的，不会出现虚拟机之间的网络延时很高，而虚拟机之间的距离缺很低的情况。

附图说明

图1为本发明基于复杂异构环境的微服务调度方法的实现框图；

图2为本发明基于复杂异构环境的微服务调度方法中第一级调度的流程示意图；

图3为本发明基于复杂异构环境的微服务调度方法中第二级调度的流程示意图；

图4为本发明应用于Flume+HDFS构架海量日志文件存储系统的示意图；

图5为Flume+HDFS框架海量日志文件存储系统分别使用本发明的调度方法和原始的调度方法调度系统的服务，并测试上传128M日志文件的上传时间对比曲线图；

图6为Flume+HDFS框架海量日志文件存储系统分别使用本发明的调度方法和原始的调度方法调度系统的服务，并测试上传256M日志文件的上传时间对比曲线图；

图7为Flume+HDFS框架海量日志文件存储系统分别使用本发明的调度方法和原始的调度方法调度系统的服务，并测试上传1G日志文件的上传时间对比曲线图；

图8为Flume+HDFS框架海量日志文件存储系统分别使用本发明的调度方法和原始的调度方法调度系统的服务，并测试上传3G日志文件的上传时间对比曲线图；

图9为本发明基于复杂异构环境的微服务调度方法的实现系统的结构框图。

具体实施方式

下面结合说明书附图和实施例对本发明作进一步限定，但不限于此。

实施例1

一种基于复杂异构环境的微服务调度方法，运行于基于微服务架构的分布式容器应用平台，基于微服务架构的分布式容器应用平台包括若干台物理服务器，每台物理服务器包括若干台虚拟机，待调度的业务应用中包括若干个服务，每个服务中包括若干个微服务；如图1所示，底层一共有N台物理服务器，这N台物理服务器中有M台虚拟机，每台虚拟机所能提供的资源各不相同；中间调度器可以直接将待调度的微服务调度到不同的虚拟机中；上层待调度的业务应用中，包含了两个服务，每个服务中又包含了4个微服务，并且微服务与微服务之间存在调用的关系。初始化所有物理服务器、虚拟机、服务及微服务的基本信息，包括步骤如下：

实施例2

根据实施例1所述的一种基于复杂异构环境的微服务调度方法，其区别在于：步骤(1)中，

所有物理服务器的基本信息，包括物理服务器集合PH，PH＝{PH₁,PH₂,PH₃,...,PH_m}，共有m台物理服务器，PH_m是指第m台物理服务器；

MR_ij是指第i个服务中的第j个微服务所占用的资源量；

距离因子的数值定义如下：处在相同物理服务器的两台虚拟机的距离因子为1；处在不同物理服务器的两台虚拟机距离因子为2；处在相同网络的两台虚拟机的距离因子为1；处在不同网络的两台虚拟机的距离因子为2；分别处在两台物理服务器中且两台物理服务器处在相同网络的两台虚拟机的距离因子为1；分别处在两台物理服务器中且两台物理服务器处在不同网络的两台虚拟机的距离因子为2；分别处在两台物理服务器中且两台物理服务器处在相同机架的两台虚拟机的距离因子为1；分别处在两台物理服务器中且两台物理服务器处在不同机架的两台虚拟机的距离因子为2；分别处在两台物理服务器中且两台物理服务器处在相同网络中心的两台虚拟机的距离因子为1；分别处在两台物理服务器中且两台物理服务器处在不同网络中心的两台虚拟机的距离因子为2。

本实施例中出现的具体字符及该字符的名称、含义，如表1所述：

表1

步骤(1)中，将有调用关系的微服务调度到关系距离更近的虚拟机中，如图2所示，调度器根据虚拟机可以提供的资源、虚拟机之间的距离、业务应用服务中各微服务的调用关系、各微服务占用的资源等信息完成业务应用服务的调度过程，包括步骤如下：

业务应用服务所占用总资源为

c、依次进行三层嵌套循环，遍历所有有调用关系的微服务；

f、确认所有的微服务都已经被调度完成，第一级调度结束。

步骤c，包括步骤如下：

③初始化当前待调度虚拟机索引p＝1；

根据虚拟机及物理服务器的初始化信息，以及业务应用的服务信息，进行第一级服务的调度。第一级调度将业务应用服务中的各个微服务分别调度到虚拟机中，尽力满足有关联的微服务被调度到相同的虚拟机中。第一级调度方法若调度成功返回True，否则则返回False。调度方法具体如下：

注：(1)函数update()功能为更新微服务调度状态矩阵。

(2)函数length()功能为计算列表的长度。

(3)函数count()功能为计算微服务占用资源量。

(4)函数min()功能为检索列表中最小的值。

(5)函数index()功能为获取元素在列表中的索引值。

(6)函数chech_vm()功能为查找服务所在的虚拟机。

实施例3

根据实施例1或2所述的一种基于复杂异构环境的微服务调度方法，其区别在于：

步骤(2)中，调度器将根据定时调度周期AT内统计的虚拟机之间通信的延时和虚拟机关系距离矩阵DL，并生成微服务之间的关系系数列表C和按关系系数逆序排列的微服务之间的关系系数列表C_so_rt，将微服务之间的关系系数较大的微服务尽量调度到关系距离较近的虚拟机中，如图3所示，包括步骤如下：

h、依次遍历排序后的微服务调用关系列表CI_so_rt；

通过第二级周期性的调度，将彼此之间调用频繁的微服务调度到关系距离较近的虚拟机中，可以尽量保证调用频繁的微服务之间通信的高性能。

周期性的第二级调度方法如下：

注：is_on_same_ph()函数作用为判断两个微服务是否在同一台虚拟机中。在同一台物理服务中返回True；不在同一台虚拟机中返回False。

图4为本发明应用于Flume+HDFS构架海量日志文件存储系统的示意图；该场景中，待调度的业务应用服务是一个海量日志文件存储系统。为简化问题，Flume将直接从本地读取固定大小的日志文件。Flume通过HDFS的Namenode获取相关信息后，会将读取的本地日志文件转存到HDFS的Datanode中，Datanode之间也会进行通信传输相关的文件。因为HDFS是一个分布式的文件系统，因此在该场景中部署了三个节点的Datanode。在该场景中，Flume是一个服务，Flume服务下只有一个微服务即Flume服务(MS₁₁)；HDFS是一个服务，HDFS服务下有四个微服务即Datanode1服务(MS₂₁)、Datanode2服务(MS₂₂)、Datanode3服务(MS₂₃)、Namenode服务(MS₂₄)。根据微服务之间的调用关系，可以得到微服务调用关系列表CI＝[[(MS₁₁,MS₂₁),(MS₂₁,MS₂₂),(MS₂₂,MS₂₃)],[MS₁₁,MS₂₄]],可以看到CI中包含了两个调用关系链条，其中从Flume到HDFS Datanode是最长的一个链条，排在了CI的第一个元素。通过图4中的虚拟机集合可以看出，一共有5台虚拟机，分别处在4台物理服务器中，其中VM03和VM04处在相同的物理服务器中；5台虚拟机所处网段相同，4台物理服务器所处网段相同。假设虚拟机在相同物理服务器、虚拟机在不同物理服务器、虚拟机网段、物理机网段这三个虚拟机距离影响因素的值分别是0.5、1、1、1，则这5台虚拟机的关系距离矩阵DL＝[[0,1,1,1,1],[1,0,1,1,1],[1,1,0,0.5,1],[1,1,0.5,0,1],[1,1,1,1,0]]，通过关系距离矩阵，可以方便得到两台虚拟机之间的距离，例如VM03和VM05之间的关系距离为DL[3][5]＝1。

图5为Flume+HDFS框架海量日志文件存储系统分别使用本发明的调度方法和原始的调度方法调度系统的服务，并测试上传128M日志文件的上传时间对比曲线图；图6为Flume+HDFS框架海量日志文件存储系统分别使用本发明的调度方法和原始的调度方法调度系统的服务，并测试上传256M日志文件的上传时间对比曲线图；图7为Flume+HDFS框架海量日志文件存储系统分别使用本发明的调度方法和原始的调度方法调度系统的服务，并测试上传1G日志文件的上传时间对比曲线图；图8为Flume+HDFS框架海量日志文件存储系统分别使用本发明的调度方法和原始的调度方法调度系统的服务，并测试上传3G日志文件的上传时间对比曲线图。使用默认调度方法以及本发明调度方法，分别转存128M、256M、1G、3G的日志文件到HDFS中，分别测试20次上传时间的效果曲线。为了更好地凸显效果，默认调度方法将没有调用关系的Namenode和Datanode1两个微服务调度到VM03和VM04上，其余的微服务可以任意调度到不同的虚拟机中。本发明的调度方法也是测试两种情况，第一种情况是假设一台虚拟机能够承载所有的微服务；第二种情况是假设VM03和VM04两台虚拟机能够承载所有的微服务。其中使用默认调度方法调度的效果曲线在图中用实线表示；本发明的调度方法将服务调度到相同虚拟机的效果曲线在图中用点线表示；本发明的调度方法将服务调度到关系距离较近虚拟机的效果曲线在图中用虚线表示。最终，通过测试效果曲线可以整体看出，通过本调度方法调度后的业务应用在上传日志文件时，整体的上传时间更短，即业务应用的性能更加优秀。

实施例4

实施例3所述调度方法的实现系统，如图9所示，包括依次连接的初始化模块、第一调度模块、第二调度模块；

初始化模块用于：初始化实时获取所有物理服务器、虚拟机、服务及微服务的基本信息；第一调度模块用于：根据实时获取的所有物理服务器、虚拟机、服务及微服务的基本信息，将有调用关系的微服务调度到关系距离更近的虚拟机中；第二调度模块用于：在业务应用运行过程中，统计一个时间段内虚拟机之间通信的延时和微服务之间的调用频繁程度，通过虚拟机之间通信的延时动态更新虚拟机之间的关系距离矩阵，根据虚拟机之间的关系距离矩阵和微服务之间的调用频繁程度，周期性检查并迁移符合条件的微服务，保证调用频繁的微服务迁移到关系距离较近的虚拟机上。

第一调度模块、第二调度模块均为调度器。

第一调度模块执行步骤a至步骤f；第二调度模块执行步骤g至步骤l。

显然，在具体实施方式中所列举的示例只是本发明的一部分示例，而不是所有的示例。基于本发明的示例，技术人员在没有做创造性劳动的前提下所获得的所有其他示例，都应当属于本发明的保护范围。

Claims

1.一种基于复杂异构环境的微服务调度方法，其特征在于，运行于基于微服务架构的分布式容器应用平台，基于微服务架构的分布式容器应用平台包括若干台物理服务器，每台物理服务器包括若干台虚拟机，待调度的业务应用中包括若干个服务，每个服务中包括若干个微服务；初始化所有物理服务器、虚拟机、服务及微服务的基本信息，包括步骤如下：

(1)第一级调度：实时获取所有物理服务器、虚拟机、服务及微服务的基本信息，将有调用关系的微服务调度到关系距离更近的虚拟机中；

(2)第二级调度：在业务应用运行过程中，统计一个时间段内虚拟机之间通信的延时和微服务之间的调用频繁程度，通过虚拟机之间通信的延时动态更新虚拟机之间的关系距离矩阵，根据虚拟机之间的关系距离矩阵和微服务之间的调用频繁程度，周期性检查并迁移符合条件的微服务，保证调用频繁的微服务迁移到关系距离较近的虚拟机上。

2.根据权利要求1所述的一种基于复杂异构环境的微服务调度方法，其特征在于，步骤(1)中，所有物理服务器的基本信息，包括物理服务器集合PH，PH＝{PH₁,PH₂,PH₃,...,PH_m}，共有m台物理服务器，PH_m是指第m台物理服务器；

MR_ij是指第i个服务中的第j个微服务所占用的资源量；

(MS_gh,MS_ij)代表第g个服务中第h个微服务会调用第i个服务中第j个微服务；假设CI是根据微服务调用关系链条的服务节点的个数降序排序，即微服务调用关系链条长的被优先调度，微服务调用关系链条是一系列有先后调用关系的微服务；

CR_ij表示第i个服务的第j个微服务所占用的虚拟资源；

微服务之间的关系系数是指一个定时调度周期AT微服务之间调用的次数，反应了微服务之间调用的频繁程度；微服务之间的关系系数都初始化为0；

初始化定时调度周期AI，DL＝{{D₁₁,D₁₂,D₁₃,...,D_1n},{D₂₁,D₂₂,D₂₃,...,D_2n},...,{D_n1,D_n2,D_n3,...,D_nn}}，D_nn是指第n台虚拟机与第n台虚拟机的关系距离，初始化为0；

距离因子为大于等于0的值；

业务应用微服务调度状态矩阵SL用于查找微服务的调度状态，第i个服务中的第j个微服务调度状态表示为MSI_ij，状态包括：是否已调度is_scheduled、调度到的虚拟机VM。

3.根据权利要求2所述的一种基于复杂异构环境的微服务调度方法，其特征在于，步骤(1)中，将有调用关系的微服务调度到关系距离更近的虚拟机中，包括步骤如下：

业务应用服务所占用总资源为

c、依次进行三层嵌套循环，遍历所有有调用关系的微服务；

将一个微服务调用关系链条中有调用关系的微服务调度到关系距离较近的虚拟机中；

d、根据虚拟机能够提供的资源量，对每一台虚拟机能够提供的资源量集合R重新按降序排序；

f、确认所有的微服务都已经被调度完成，第一级调度结束。

4.根据权利要求3所述的一种基于复杂异构环境的微服务调度方法，其特征在于，步骤c，包括步骤如下：

③初始化当前待调度虚拟机索引p＝1；

④遍历当前微服务调用关系链条中所有微服务调用关系；

⑤遍历当前微服务调用关系中的微服务；

5.根据权利要求2-4任一所述的一种基于复杂异构环境的微服务调度方法，其特征在于，步骤(2)中，根据定时调度周期AT内统计的虚拟机之间通信的延时和虚拟机关系距离矩阵DL，并生成微服务之间的关系系数列表C和按关系系数逆序排列的微服务之间的关系系数列表C_sort，将微服务之间的关系系数较大的微服务尽量调度到关系距离较近的虚拟机中，包括步骤如下：

g、到达定时调度周期AT时间节点，开始周期调度，获得上一定时调度周期AT内统计的微服务调用关系系数列表C、排序后的微服务关系系数列表C_sort和更新后的虚拟机关系距离矩阵DL；微服务调用关系系数列表C是指所有的微服务的微服务之间调用的次数；将定时调度周期AT内的虚拟机之间的网络延时作为虚拟机之间的关系距离，并更新虚拟机关系距离矩阵DL；

h、依次遍历排序后的微服务调用关系列表CI_sort；

6.根据权利要求2所述的一种基于复杂异构环境的微服务调度方法，其特征在于，定时调度周期AI初始化值为10分钟。

7.根据权利要求2所述的一种基于复杂异构环境的微服务调度方法，其特征在于，距离因子的数值定义如下：处在相同物理服务器的两台虚拟机的距离因子为1；处在不同物理服务器的两台虚拟机距离因子为2；处在相同网络的两台虚拟机的距离因子为1；处在不同网络的两台虚拟机的距离因子为2；分别处在两台物理服务器中且两台物理服务器处在相同网络的两台虚拟机的距离因子为1；分别处在两台物理服务器中且两台物理服务器处在不同网络的两台虚拟机的距离因子为2；分别处在两台物理服务器中且两台物理服务器处在相同机架的两台虚拟机的距离因子为1；分别处在两台物理服务器中且两台物理服务器处在不同机架的两台虚拟机的距离因子为2；分别处在两台物理服务器中且两台物理服务器处在相同网络中心的两台虚拟机的距离因子为1；分别处在两台物理服务器中且两台物理服务器处在不同网络中心的两台虚拟机的距离因子为2。

8.权利要求5所述调度方法的实现系统，其特征在于，包括依次连接的初始化模块、第一调度模块、第二调度模块；

9.根据权利要求8所述调度方法的实现系统，其特征在于，所述第一调度模块、第二调度模块均为调度器。

10.根据权利要求8或9所述调度方法的实现系统，其特征在于，所述第一调度模块执行所述步骤a至步骤f；所述第二调度模块执行所述步骤g至步骤l。