CN112073239A - 一种云计算环境分布式应用性能预测方法 - Google Patents

一种云计算环境分布式应用性能预测方法 Download PDF

Info

Publication number
CN112073239A
CN112073239A CN202010921199.7A CN202010921199A CN112073239A CN 112073239 A CN112073239 A CN 112073239A CN 202010921199 A CN202010921199 A CN 202010921199A CN 112073239 A CN112073239 A CN 112073239A
Authority
CN
China
Prior art keywords
performance
application
indexes
service
interference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010921199.7A
Other languages
English (en)
Other versions
CN112073239B (zh
Inventor
赵来平
周贤
杨亚南
李克秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202010921199.7A priority Critical patent/CN112073239B/zh
Publication of CN112073239A publication Critical patent/CN112073239A/zh
Application granted granted Critical
Publication of CN112073239B publication Critical patent/CN112073239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • H04L43/55Testing of service level quality, e.g. simulating service usage
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network

Abstract

本发明公开了一种云计算环境分布式应用性能预测方法,步骤1、进行数据训练,即:将采集的所有应用单独运行下的各个容器资源层、微体系结构层的指标以及多应用混合运行干扰后的真实性能下降作为机器学习的训练数据集,对该训练数据集进行指标刻画,进而建立性能指标与应用性能之间的预测模型;步骤2、应用针对无干扰情况下的性能指标以及各个应用组件间的“时空重叠”编码信息输入训练好的模型中,从而得到应用在混部干扰下的性能下降预测结果。与现有技术相比,本发明可在4毫秒时间内完成预测的机器学习算法,并达到了98.48%的准确度;弥补了相关技术的不足,并且可以用于各种场景下的多分布式应用干扰的性能预测。

Description

一种云计算环境分布式应用性能预测方法
技术领域
本发明涉及大数据和云计算技术领域,特别涉及分布式计算的任务调度技术。
背景技术
近年来云计算飞速发展。然而随着云上业务的增加,系统的资源利用率却不高。目前技术中,通过混合放置云工作负载是提高云资源利用率的有效方法。但由于工作负载之间存在严重的资源争用,尤其是对于LC(latency-critical)服务,在服务器中的混合负载很容易导致违反QoS(Quality ofService)的问题。因此,对云计算环境混合负载下的应用性能预测至关重要。
由于精确的性能预测有助于有效地调度混合负载,因此,目前已经广泛地存在很多关于性能预测问题探讨。几乎所有工作都受限于在单服务器上构建干扰预测模型,因此现有的性能预测方法还不够实用。随着云工作负载的复杂性和规模不断增加,以分布式方式部署工作负载非常普遍,现有模型还无法处理分布式工作负载的“服务组件敏感性不一致”和“时空重叠”带来的干扰问题。
现有方法大多不能适用于当前最流行的分布式应用场景下的时空干扰问题,现存的性能预测模型多是针对“全重叠”的干扰场景,它们忽略了“部分重叠”的干扰场景,特别是对于分布式云服务而言,“部分重叠”的干扰场景尤为明显。
发明内容
为了解决云计算环境分布式应用在时空干扰下的性能预测问题,本发明提出一种云计算环境分布式应用性能预测方法,构建性能指标与应用性能之间的预测模型,并对“时空重叠”信息进行编码作为模型输入,准确而又迅速地预测出云计算环境中分布式应用在混合负载干扰下的性能下降情况。
本发明一种云计算环境分布式应用性能预测方法,包括以下步骤:
步骤1、进行数据训练,即:将采集的所有应用单独运行下的各个容器资源层、微体系结构层的指标以及多应用混合运行干扰后的真实性能下降作为机器学习的训练数据集,对该训练数据集进行指标刻画,进而建立性能指标与应用性能之间的预测模型;
步骤1-1、进行指标刻画,即为了更好地刻画云服务的负载特征,从应用层、资源层和微体系结构层采集应用性能相关的指标;具体的:分布式应用的各个组件服务跨服务器分布式地部署在多台机器所构成的容器之中,各个容器的配置可以不一样,但是必须满足应用服务的初始配置要求,使其可以成功运行;给每个容器分配一定量的资源以保障应用的初始配置使其可以成功运行,记录下此刻每个容器的CPU内核、内存、LLC和网络带宽的分配量;
在服务器上不加干扰地单独运行该应用,记录该应用运行时所部署的各个容器的性能指标使用情况,至少包括CPU内核、内存、网络、内存带宽和磁盘IO带宽等应用层指标以及指令未命中数、上下文切换次数、缓存未命中数、MLP,IPC在内的微体系结构层指标;同时记录这些容器的初始资源配置情况;
排除了相关系数绝对值小于0.1的指标,最后选择剩余的14个性能指标进行训练;
步骤1-2、建立性能指标与应用性能之间的预测模型:
在B,C,...的干扰下预测应用A的性能模型,表达式如下:
Figure BDA0002666791070000021
其中,RA,RB,RC,...分别表示应用程序A,B,C,...的组件配置的资源分配向量;UA,UB,UC,...分别表示采集的应用各种资源的实际利用率向量;DA,DB,DC,...分别表示应用A,B,C,...之间的启动延迟,DA=0,并且DB,DC,..分别表示应用程序B,C,....与A相比的启动延迟;
Ri和Ui
Figure BDA0002666791070000031
都是二维向量,专门为应用程序组件之间的空间重叠信息编码而设计的,Ui的表达式如下:
Figure BDA0002666791070000032
其中,m表示应用程序组件的最大数量,而uk il表示Ui的在第l个组件上采集的第k个指标;如果不存在Ui的第l个分量,则(u1 il,u2 il,...,u13 il)全部设置为0;对于任何两个应用程序的Ui和Uj,采用uk il
Figure BDA0002666791070000035
共享相同的下标l表示它们混部的组件;
同样的,以相同的方式设计向量Ri
对于BE(best-effort)任务,计算在其生命周期内各个容器性能指标的均值,并记录该任务的运行时长;而对于LC服务,测量其最大服务请求数,然后不断地改变LC服务的QPS,进行重复无干扰运行实验,并记录LC服务在不同QPS下的各个容器的性能指标使用情况;当多个分布式应用混合运行彼此间发生干扰时,记录下它们的性能下降情况,并记录应用间各个容器的干扰发生位置;对于BEs+BEs的混合场景,记录下各个任务之间的启动时间间隔;
针对不同的应用负载混部场景,性能指标与应用性能之间的预测模型具有不同的表现形式:
模型表现形式一、LCs+LCs:如果在混部应用中没有BE任务,则Di=0和Ti=0
Figure BDA0002666791070000033
Figure BDA0002666791070000034
因为LC通常是长期运行的服务,所以干扰性能的主要因素是QPS而不是启动延迟;此外,PA∪{B,C,...}代表A的IPC;
模型表现形式二、LCs+BEs:如果在混部应用中同时存在LC和BE,则将第一个到达的BE的启动延迟设置为0,而其它BE的延迟通过将它们的到达时间与第一个BE的到达时间进行比较来设置;同时,对于LC的Di和Ti,有Di=0和Ti=0;
模型表现形式三、BEs+BEs:如果在混部应用中没有LC工作负载,则将第一个到达的BE的启动延迟设置为0并且Ti≠0
Figure BDA0002666791070000041
此外,PA∪{B,C,...}代表A的JCT;
步骤2、应用针对无干扰情况下的性能指标以及各个应用组件间的“时空重叠”编码信息输入训练好的模型中,从而得到应用在混部干扰下的性能下降预测结果,具体步骤如下:
步骤2-1、通过不断构建数据集训练模型,然后部署训练好的模型;
步骤2-2、当一个新来应用要与系统中已经在运行着的服务发生干扰时,先将新应用单独运行一段时间,并记录其各个容器的性能指标使用情况;
步骤2-3、采集系统中运行着的服务的性能指标使用情况;
步骤2-4、将这些性能指标与“时空重叠”编码信息一并输入到已经训练好的模型之中,就可以预测出新来应用与系统中应用混合运行发生干扰后的性能下降情况。
相较于现有技术,本发明所达成的有益技术效果如下:
1、可在4毫秒时间内完成预测的机器学习算法,并达到了98.48%的准确度;
2、综合考虑了分布式应用组件的不一致性和时空干扰等影响性能的因素,弥补了相关技术的不足,并且可以用于各种场景下的多分布式应用干扰的性能预测。
附图说明
图1为本发明的一种云计算环境分布式应用性能预测方法整体流程示意图;
图2为在不同混部场景下模型利用五种不同的算法和一种现有方法在不同的数据集大小下进行模型训练得到的预测误差的概率密度分布曲线示意图;
图3为在不同混部场景中不同数量应用混部下模型利用RFR算法在90%训练数据集大小下进行模型训练得到的预测误差的概率密度分布曲线示意图。
具体实施方式
以下结合附图和实施例对本发明进行详细说明
如图1所示,为本发明的一种基于机器学习的分布式应用在时空干扰下的精确性能预测方法,具体包括以下步骤:
步骤1、进行数据训练,即:将采集的所有应用单独运行下的各个容器资源层、微体系结构层的指标以及多应用混合运行干扰后的真实性能下降作为机器学习的训练数据集,对该训练数据集进行指标刻画,进而建立性能指标与应用性能之间的预测模型;
步骤1-1、进行指标刻画,即为了更好地刻画云服务的负载特征,主要从应用层、资源层和微体系结构层采集应用性能相关的指标(指标包括IPC、CPU、Memory、Network、LLC、Memory IO、Disk IO、Branch MPKI、Context-switches、MLP、L1D MKPI、ITLB MKPI、L1IMPKI、L2 MPKI、L3 MPKI、DTLB MPKI等,如表1所示。此外,采用IPC和作业完成时间JCT作为衡量应用性能的指标。);具体为:分布式应用的各个组件服务跨服务器分布式地部署在多台机器所构成的容器之中,各个容器的配置可以不一样,但是必须满足应用服务的初始配置要求,使其可以成功运行;给每个容器分配一定量的资源以保障应用的初始配置使其可以成功运行,记录下此刻每个容器的CPU内核、内存、LLC和网络带宽的分配量;
在服务器上不加干扰地单独运行该应用,记录该应用运行时所部署的各个容器的性能指标使用情况,包括CPU内核、内存、网络、内存带宽和磁盘IO带宽等应用层指标以及指令未命中数、上下文切换次数、缓存未命中数、MLP,IPC等微体系结构层指标;同时也记录这些容器的初始资源配置情况。为了标准化,采用每千条指令(MPKI)收集它们的指令未命中数。此外,采用IPC作为衡量LC性能的指标,以及工作完成时间(JCT)作为衡量BE性能的指标。
然而,在模型中纳入所有指标的蛮力方法是有问题的,因为不相关的指标很容易导致过度拟合,从而导致准确性下降。而且,高维输入还导致较长的预测时间。因此,它需要使用与固有特性或干扰高度相关的性能指标进行训练。为此,采用在机器学习领域中广泛使用的Pearson相关系数和Spearman相关系数来评估目标性能与其它性能指标之间的相关性。系数越大,指标与性能的相关性越高。如表1所示,为性能指标与性能之间的相关性列表,其中列出了所有指标和性能之间的相关性,并排除了相关系数绝对值小于0.1的指标。最后,选择剩余的14个性能指标进行训练。
表1
Metric Pearson Spearman Metric Pearson Spearman
Branch MPKI -0.60 -0.72 L1I MPKI 0.38 0.45
Context-switches 0.96 0.96 L2 MPKI 0.54 0.81
MLP 0.02 0.03 L3 MPKI 0.54 0.78
L1D MKPI -0.37 -0.56 DTLB MPKI -0.75 -0.85
ITLB MKPI -0.38 -0.54 IPC 0.85 0.89
CPU 0.81 0.82 LLC 0.83 0.84
Memory 0.11 0.19 Memory IO<sup>*</sup> 0.04 0.05
Network 0.94 0.94 Disk IO<sup>*</sup> 0.08 0.08
步骤1-2、建立性能指标与应用性能之间的预测模型:
利用机器学习技术,本发明提出了一种回归模型,该模型可以预测干扰下任意数量的混合工作负载的性能下降。以下描述了在B,C,...的干扰下预测应用A的性能模型。
Figure BDA0002666791070000071
其中,RA,RB,RC,...分别表示应用程序A,B,C,...的组件(容器或VM)配置的资源分配向量;UA,UB,UC,...分别表示采集的应用各种资源的实际利用率向量;DA,DB,DC,...分别表示应用A,B,C,...之间的启动延迟。特别地,其中DA=0,并且DB,DC,..分别表示应用程序B,C,....与A相比的启动延迟。注意到Ri和Ui
Figure BDA0002666791070000072
都是二维向量,这是专门为应用程序组件之间的空间重叠信息编码而设计的,如下所示。
Figure BDA0002666791070000073
其中,m表示应用程序组件的最大数量,而uk il(1≤l≤m,1≤k≤13)表示Ui的在第l个组件上采集的第k个指标。如果不存在Ui的第l个分量,则(u1 il,u2 il,...,u13 il)全部设置为0。对于任何两个应用程序的Ui和Uj,采用uk il
Figure BDA0002666791070000074
共享相同的下标l表示它们混部的组件。通过这种方式,能够在预测模型中对部分空间重叠信息进行编码。如果同一服务器中有多个组件,只需将它们的指标汇总在一起,生成一个“虚拟的较大组件”。同样的,以相同的方式设计向量Ri。虽然无法用可变数量的输入变量来训练机器学习模型,但只需固定PA∪{B,C,...}中的工作负载数量为n即可,表示系统中允许的最大混部应用个数。如果混部工作负载的实际数量少于n,则将虚构工作负载的指标均设置为0。
特别地,对于BE(best-effort)任务,需要计算在其生命周期内各个容器性能指标的均值,并记录该任务的运行时长。而对于LC服务,需要测量其最大服务请求数,然后不断地改变LC服务的QPS(queries per second),进行重复无干扰运行实验,并记录LC服务在不同QPS下的各个容器的性能指标使用情况。当多个分布式应用混合运行彼此间发生干扰时,记录下它们的性能下降情况,并记录应用间各个容器的干扰发生位置。对于BEs+BEs的混合场景,记录下各个任务之间的启动时间间隔。
针对不同的应用负载混部场景,性能指标与应用性能之间的预测模型具有不同的表现形式:
模型表现形式一、LCs+LCs:如果在混部应用中没有BE任务,则Di=0和Ti=0
Figure BDA0002666791070000081
Figure BDA0002666791070000082
因为LC通常是长期运行的服务,所以干扰性能的主要因素是QPS而不是启动延迟。此外,PA∪{B,C,...}代表A的IPC。
模型表现形式二、LCs+BEs:如果在混部应用中同时存在LC和BE,则将第一个到达的BE的启动延迟设置为0,而其它BE的延迟通过将它们的到达时间与第一个BE的到达时间进行比较来设置。同时,对于LC的Di和Ti,有Di=0和Ti=0。
模型表现形式三、BEs+BEs:如果在混部应用中没有LC工作负载,则将第一个到达的BE的启动延迟设置为0并且Ti≠0
Figure BDA0002666791070000083
此外,PA∪{B,C,...}代表A的JCT。
步骤2、应用针对无干扰情况下的性能指标以及各个应用组件间的“时空重叠”编码信息输入训练好的模型中,从而得到应用在混部干扰下的性能下降预测结果。具体步骤如下。
步骤2-1、通过不断构建数据集训练模型,然后部署训练好的模型;
步骤2-2、当一个新来应用要与系统中已经在运行着的服务发生干扰时,先将新应用单独运行一段时间,并记录其各个容器的性能指标使用情况;
步骤2-3、采集系统中运行着的服务的性能指标使用情况;
步骤2-4、将这些性能指标与“时空重叠”编码信息一并输入到已经训练好的模型之中,就可以预测出新来应用与系统中应用混合运行发生干扰后的性能下降情况。
本发明采用了五种典型的机器学习算法(包括K-Nearest Neighbor(KNN)Regression,Logistic Regression(LR),Random Forest Regression(RFR),SupportVector Regression(SVR)和Multi-layer Perceptron Neural Network(MLPNN)建立模型,并和现有的预测方法ESP进行比较。
如图2所示,为在不同混部场景下模型利用五种不同的算法和一种现有方法在不同的数据集大小下进行模型训练得到的预测误差的概率密度分布曲线示意图。当模型采用RFR算法进行性能预测时要优于其它算法,也比现有的ESP预测方法具有更小的预测误差。
此外,如图3所示,为在不同混部场景中不同数量应用混部下模型利用RFR算法在90%训练数据集大小下进行模型训练得到的预测误差的概率密度分布曲线示意图。该模型同样适用于多应用混部场景下的性能预测,且依旧具有较低的预测误差。

Claims (1)

1.一种云计算环境分布式应用性能预测方法,其特征在于,该方法包括以下步骤:
步骤1、进行数据训练,即:将采集的所有应用单独运行下的各个容器资源层、微体系结构层的指标以及多应用混合运行干扰后的真实性能下降作为机器学习的训练数据集,对该训练数据集进行指标刻画,进而建立性能指标与应用性能之间的预测模型;
步骤1-1、进行指标刻画,即为了更好地刻画云服务的负载特征,从应用层、资源层和微体系结构层采集应用性能相关的指标;具体的:分布式应用的各个组件服务跨服务器分布式地部署在多台机器所构成的容器之中,各个容器的配置可以不一样,但是必须满足应用服务的初始配置要求,使其可以成功运行;给每个容器分配一定量的资源以保障应用的初始配置使其可以成功运行,记录下此刻每个容器的CPU内核、内存、LLC和网络带宽的分配量;
在服务器上不加干扰地单独运行该应用,记录该应用运行时所部署的各个容器的性能指标使用情况,至少包括CPU内核、内存、网络、内存带宽和磁盘IO带宽等应用层指标以及指令未命中数、上下文切换次数、缓存未命中数、MLP,IPC在内的微体系结构层指标;同时记录这些容器的初始资源配置情况;
排除了相关系数绝对值小于0.1的指标,最后选择剩余的14个性能指标进行训练;
步骤1-2、建立性能指标与应用性能之间的预测模型:
在B,C,...的干扰下预测应用A的性能模型,表达式如下:
Figure FDA0002666791060000011
其中,RA,RB,RC,...分别表示应用程序A,B,C,...的组件配置的资源分配向量;UA,UB,UC,...分别表示采集的应用各种资源的实际利用率向量;DA,DB,DC,...分别表示应用A,B,C,...之间的启动延迟,DA=0,并且DB,DC,..分别表示应用程序B,C,....与A相比的启动延迟;
Ri
Figure FDA0002666791060000022
都是二维向量,专门为应用程序组件之间的空间重叠信息编码而设计的,Ui的表达式如下:
Figure FDA0002666791060000021
其中,m表示应用程序组件的最大数量,而uk il表示Ui的在第l个组件上采集的第k个指标;如果不存在Ui的第l个分量,则(u1 il,u2 il,...,u13 il)全部设置为0;对于任何两个应用程序的Ui和Uj,采用uk il和uk jl共享相同的下标l表示它们混部的组件;
同样的,以相同的方式设计向量Ri
对于BE(best-effort)任务,计算在其生命周期内各个容器性能指标的均值,并记录该任务的运行时长;而对于LC服务,测量其最大服务请求数,然后不断地改变LC服务的QPS,进行重复无干扰运行实验,并记录LC服务在不同QPS下的各个容器的性能指标使用情况;当多个分布式应用混合运行彼此间发生干扰时,记录下它们的性能下降情况,并记录应用间各个容器的干扰发生位置;对于BEs+BEs的混合场景,记录下各个任务之间的启动时间间隔;
针对不同的应用负载混部场景,性能指标与应用性能之间的预测模型具有不同的表现形式:
模型表现形式一、LCs+LCs:如果在混部应用中没有BE任务,则Di=0和
Figure FDA0002666791060000023
Figure FDA0002666791060000024
因为LC通常是长期运行的服务,所以干扰性能的主要因素是QPS而不是启动延迟;此外,PA∪{B,C,...}代表A的IPC;
模型表现形式二、LCs+BEs:如果在混部应用中同时存在LC和BE,则将第一个到达的BE的启动延迟设置为0,而其它BE的延迟通过将它们的到达时间与第一个BE的到达时间进行比较来设置;同时,对于LC的Di和Ti,有Di=0和Ti=0;
模型表现形式三、BEs+BEs:如果在混部应用中没有LC工作负载,则将第一个到达的BE的启动延迟设置为0并且
Figure FDA0002666791060000031
此外,PA∪{B,C,...}代表A的JCT;
步骤2、应用针对无干扰情况下的性能指标以及各个应用组件间的“时空重叠”编码信息输入训练好的模型中,从而得到应用在混部干扰下的性能下降预测结果,具体步骤如下:
步骤2-1、通过不断构建数据集训练模型,然后部署训练好的模型;
步骤2-2、当一个新来应用要与系统中已经在运行着的服务发生干扰时,先将新应用单独运行一段时间,并记录其各个容器的性能指标使用情况;
步骤2-3、采集系统中运行着的服务的性能指标使用情况;
步骤2-4、将这些性能指标与“时空重叠”编码信息一并输入到已经训练好的模型之中,就可以预测出新来应用与系统中应用混合运行发生干扰后的性能下降情况。
CN202010921199.7A 2020-09-04 2020-09-04 一种云计算环境分布式应用性能预测方法 Active CN112073239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010921199.7A CN112073239B (zh) 2020-09-04 2020-09-04 一种云计算环境分布式应用性能预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010921199.7A CN112073239B (zh) 2020-09-04 2020-09-04 一种云计算环境分布式应用性能预测方法

Publications (2)

Publication Number Publication Date
CN112073239A true CN112073239A (zh) 2020-12-11
CN112073239B CN112073239B (zh) 2022-04-22

Family

ID=73666016

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010921199.7A Active CN112073239B (zh) 2020-09-04 2020-09-04 一种云计算环境分布式应用性能预测方法

Country Status (1)

Country Link
CN (1) CN112073239B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102227121A (zh) * 2011-06-21 2011-10-26 中国科学院软件研究所 基于机器学习的分布式缓存策略自适应切换方法及系统
CN103383655A (zh) * 2012-01-13 2013-11-06 埃森哲环球服务有限公司 用于在qos感知云中管理合并的工作负载的性能干扰模型
US20140089509A1 (en) * 2012-09-26 2014-03-27 International Business Machines Corporation Prediction-based provisioning planning for cloud environments
CN105260794A (zh) * 2015-10-12 2016-01-20 上海交通大学 一种云数据中心的负载预测方法
US9852150B2 (en) * 2010-05-03 2017-12-26 Panzura, Inc. Avoiding client timeouts in a distributed filesystem
CN109144724A (zh) * 2018-07-27 2019-01-04 众安信息技术服务有限公司 一种微服务资源调度系统及方法
CN109408321A (zh) * 2018-09-12 2019-03-01 国网江西省电力有限公司电力科学研究院 基于云服务组件性能预测的云服务性能保障方法及系统
EP3544236A1 (en) * 2018-03-21 2019-09-25 Telefonica, S.A. Method and system for training and validating machine learning algorithms in data network environments
CN110531988A (zh) * 2019-08-06 2019-12-03 新华三大数据技术有限公司 应用程序的状态预测方法及相关装置
US20200034197A1 (en) * 2016-10-19 2020-01-30 Nutanix, Inc. Adapting a pre-trained distributed resource predictive model to a target distributed computing environment
WO2020042721A1 (zh) * 2018-08-30 2020-03-05 华为技术有限公司 一种资源配置的预测方法及设备
CN110968495A (zh) * 2018-09-29 2020-04-07 浙江大学 一种容器云平台性能评估方法及装置
CN111030861A (zh) * 2019-12-11 2020-04-17 中移物联网有限公司 一种边缘计算分布式模型训练方法、终端和网络侧设备
CN111181773A (zh) * 2019-12-13 2020-05-19 西安交通大学 面向异构边云协同智能系统的多组件应用的延迟预测方法
US20200162316A1 (en) * 2016-03-18 2020-05-21 Plume Design, Inc. Optimization of distributed wi-fi networks estimation and learning
CN111404951A (zh) * 2020-03-23 2020-07-10 星环信息科技(上海)有限公司 一种云网络的租户创建方法、计算机设备及存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9852150B2 (en) * 2010-05-03 2017-12-26 Panzura, Inc. Avoiding client timeouts in a distributed filesystem
CN102227121A (zh) * 2011-06-21 2011-10-26 中国科学院软件研究所 基于机器学习的分布式缓存策略自适应切换方法及系统
CN103383655A (zh) * 2012-01-13 2013-11-06 埃森哲环球服务有限公司 用于在qos感知云中管理合并的工作负载的性能干扰模型
US20140089509A1 (en) * 2012-09-26 2014-03-27 International Business Machines Corporation Prediction-based provisioning planning for cloud environments
CN105260794A (zh) * 2015-10-12 2016-01-20 上海交通大学 一种云数据中心的负载预测方法
US20200162316A1 (en) * 2016-03-18 2020-05-21 Plume Design, Inc. Optimization of distributed wi-fi networks estimation and learning
US20200034197A1 (en) * 2016-10-19 2020-01-30 Nutanix, Inc. Adapting a pre-trained distributed resource predictive model to a target distributed computing environment
EP3544236A1 (en) * 2018-03-21 2019-09-25 Telefonica, S.A. Method and system for training and validating machine learning algorithms in data network environments
CN109144724A (zh) * 2018-07-27 2019-01-04 众安信息技术服务有限公司 一种微服务资源调度系统及方法
WO2020042721A1 (zh) * 2018-08-30 2020-03-05 华为技术有限公司 一种资源配置的预测方法及设备
CN109408321A (zh) * 2018-09-12 2019-03-01 国网江西省电力有限公司电力科学研究院 基于云服务组件性能预测的云服务性能保障方法及系统
CN110968495A (zh) * 2018-09-29 2020-04-07 浙江大学 一种容器云平台性能评估方法及装置
CN110531988A (zh) * 2019-08-06 2019-12-03 新华三大数据技术有限公司 应用程序的状态预测方法及相关装置
CN111030861A (zh) * 2019-12-11 2020-04-17 中移物联网有限公司 一种边缘计算分布式模型训练方法、终端和网络侧设备
CN111181773A (zh) * 2019-12-13 2020-05-19 西安交通大学 面向异构边云协同智能系统的多组件应用的延迟预测方法
CN111404951A (zh) * 2020-03-23 2020-07-10 星环信息科技(上海)有限公司 一种云网络的租户创建方法、计算机设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BINLEI CAI,LAIPING ZHAO,XIAOBO ZHOU, RONGQI ZHANG,KEQIU LI: "On evaluating the resource usage effectiveness of multi-tenant cloud storage", 《JOURNAL OF SYSTEMS ARCHITECTURE》 *
周俊: "基于任务统计特征的云计算系统资源管理方法研究", 《中国优秀硕士学位论文全文数据库》 *
移动云计算研究进展与趋势: "崔勇,宋健,缪葱葱,唐俊", 《计算机学报》 *

Also Published As

Publication number Publication date
CN112073239B (zh) 2022-04-22

Similar Documents

Publication Publication Date Title
CN108829494B (zh) 基于负载预测的容器云平台智能资源优化方法
CN106776005B (zh) 一种面向容器化应用的资源管理系统及方法
US9111232B2 (en) Portable workload performance prediction for the cloud
CN110737529B (zh) 一种面向短时多变大数据作业集群调度自适应性配置方法
Bhattacharjee et al. Barista: Efficient and scalable serverless serving system for deep learning prediction services
WO2021088207A1 (zh) 云计算集群混部作业调度方法、装置、服务器及存储装置
US20200257968A1 (en) Self-learning scheduler for application orchestration on shared compute cluster
Kousiouris et al. The effects of scheduling, workload type and consolidation scenarios on virtual machine performance and their prediction through optimized artificial neural networks
CN101697141B (zh) 网格中基于历史数据建模的作业性能预测方法
US20100083248A1 (en) Optimizing a prediction of resource usage of multiple applications in a virtual environment
US11579933B2 (en) Method for establishing system resource prediction and resource management model through multi-layer correlations
CN109586954B (zh) 一种网络流量预测方法、装置及电子设备
US20210209481A1 (en) Methods and systems for dynamic service performance prediction using transfer learning
CN111314120A (zh) 基于迭代QoS模型的云软件服务资源自适应管理框架
CN110825522A (zh) Spark参数自适应优化方法及系统
CN113806018A (zh) 基于神经网络和分布式缓存的Kubernetes集群资源混合调度方法
CN115904666A (zh) 面向gpu集群的深度学习训练任务调度系统
CN112732444A (zh) 一种面向分布式机器学习的数据划分方法
CN113867843A (zh) 一种基于深度强化学习的移动边缘计算任务卸载方法
CN113158435B (zh) 基于集成学习的复杂系统仿真运行时间预测方法与设备
CN112073239B (zh) 一种云计算环境分布式应用性能预测方法
US20220035665A1 (en) Sharing of compute resources between the virtualized radio access network (vran) and other workloads
KR100935361B1 (ko) 가중치 기반 멀티큐 부하분산 병렬처리 시스템 및 방법
CN115277249B (zh) 一种多层异构网络协同的网络安全态势感知方法
CN114466014B (zh) 一种服务调度方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant