CN109254865A - 一种基于统计分析的云数据中心服务异常根因定位方法 - Google Patents

一种基于统计分析的云数据中心服务异常根因定位方法 Download PDF

Info

Publication number
CN109254865A
CN109254865A CN201811113774.XA CN201811113774A CN109254865A CN 109254865 A CN109254865 A CN 109254865A CN 201811113774 A CN201811113774 A CN 201811113774A CN 109254865 A CN109254865 A CN 109254865A
Authority
CN
China
Prior art keywords
node
abnormal
data center
monitoring
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811113774.XA
Other languages
English (en)
Inventor
周博
吴昊
王钟沛
张晓洲
刘延新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Run He Software Inc Co
Original Assignee
Jiangsu Run He Software Inc Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Run He Software Inc Co filed Critical Jiangsu Run He Software Inc Co
Priority to CN201811113774.XA priority Critical patent/CN109254865A/zh
Publication of CN109254865A publication Critical patent/CN109254865A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

发明涉及一种基于统计分析的云数据中心异常根因定位方法。监测云数据中心节点的多维度资源度量,使用向量自回归模型预测节点的资源使用情况,通过比较度量预测值与监测值来检测云服务的度量异常,根据数据中心节点之间复杂依赖关系的知识建立依赖图,对组件异常程度进行排序以减少报警风暴。

Description

一种基于统计分析的云数据中心服务异常根因定位方法
技术领域
本发明涉及一种基于统计分析的云数据中心服务异常根因定位方法,属于软件技术领域。
背景技术
云数据中心时常会出现大规模服务降级和服务中断,从而严重影响服务可靠性与性能。服务性能衰减通常会表现为系统层的度量异常,以反映服务内部或底层基础设施中存在的问题,例如DDoS攻击、服务升级以及工作负载激增带来的异常资源使用。虚拟化技术将应用服务整合到少量的服务器中以降低操作成本(如,能源消耗)并最大化资源使用。然而,基于虚拟化的资源共享会造成相同主机上共享资源的服务之间竞争有限的系统资源(如,计算、带宽或内存),从而造成性能衰减。因此,不断检测系统异常(如异常的资源行为)以防止服务降级,并通过快速控制意外服务中断来提高服务可靠性,成为云服务监测的主要目标。然而,云服务规模巨大、体系结构复杂性,以及工作负载呈现多样性和动态性,使得在线异常检测具有挑战性。首先,异常检测方法需要在不明确正常状态或异常定义的情况下,能够自动适应云服务行为的变化。此外,能够应对多个层次的云服务抽象,从而分析处理多个服务度量。
当前的异常检测方法通常基于假设分布预先定义度量的阈值(M. Peiris, J. H.Hill, J. Thelin, S. Bykov, G. Kliot, and C. Konig, “PAD:Performance AnomalyDetection in Multi-server Distributed Systems,”in 7th IEEE InternationalConference on Cloud Computing.IEEE, 2014, pp. 769–776.),然而,阈值对工作负载的变化非常敏感,并且很难扩展到数百个度量。某些方法基于统计学方法自动设定阈值(P.Xiong, C. Pu, X. Zhu, and R. Griffith, “vPerfGuard: an Automated Model-drivenFramework for Application Performance Diagnosis in Consolidated CloudEnvironments,” in Proceedings of the 4th ACM/SPEC International Conference onPerformance Engineering. ACM, 2013, pp. 271–282.),然而其分别考虑单个资源度量,忽略了度量之间依赖关系。某些方法建模资源使用率和工作负载之间的关联关系(T.Wang, J. Wei, W. Zhang, H. Zhong, and T. Huang, “Workload aware AnomalyDetection for Web Applications,” Journal of Systems and Software, vol. 89,pp. 19–32, 2014.),然而其依赖于QoS和资源度量之间的相关性。基于多变量统计的机器学习方法建立多个指标之间的关联(T. Huang, Y. Zhu, Y. Wu, S. Bressan, and G.Dobbie, “Anomaly Detection and Identification Scheme for VM Live Migration inCloud Infrastructure,” Future Generation Computer Systems, vol. 56, pp. 736–745, 2016.),但是当QoS和工作负载度量无法获取时,该方法就难以适用。云计算运营商投入大量精力监测资源,发现异常的资源使用模式。然而,虚拟化云数据中心的复杂性对异常检测技术提出了要求:(1)非侵入,云服务提供者通常不知道租户的源码;(2)无监督学习,能够处理未分类为正常或异常的无标注数据;(3)在线自适应不断变化的系统行为,而不需要离线训练和人工干预。
发明内容
本发明的原理:提出了一种基于统计分析的云数据中心服务异常根因定位方法,监测云数据中心节点的多维度资源度量,使用向量自回归模型预测节点的资源使用情况,通过比较度量预测值与监测值来检测云服务的度量异常,根据数据中心节点之间复杂依赖关系的知识建立依赖图,对组件异常程度进行排序以减少报警风暴。
本发明技术解决方案:一种基于统计分析的云数据中心服务异常根因定位方法,如图1所示,实现步骤如下:
1.节点资源预测
本发明提出一种自适应向量自回归方法刻画基于滑动窗口的数据中心节点的序列化监测数据的资源使用模式,建模度量之间的关联关系,从历史数据中估计正常资源使用,用作预测近期的资源使用作为基准。
假设为在时间t监测得到的(1×n)向量,是度量m在 时间t的监测数据,n是监测度量数量,向量可以表示为历史监测数据的线性组合:
, (1)
其中,p表示滞后监测数据的数量,即需要考虑的此前监测周期数量,表示在t时 刻之前的第j个监测周期的监测数据。公式(1)由n个方程组成,每个监测度量表示该度量以 及其他度量滞后值的线性组合。参数表示的常数向量, 构成系数矩阵,表示的白噪声向量。
需要确定模型中包含滞后监测数据数量p,该参数会影响模型的复杂性。由于滞后值会随时间改变,本发明使用长度为k的时间序列窗口,将历史资源使用进行分段,构建了基准训练模型,以在线方式更新模型。
假设为保存最近的正常行为数据的时间窗口,即在t时刻,产生时间窗口w,包 含时间间隔的最近k个监测数据:
本发明定义最大滞后监测数据以限制探测空间,在范围中搜索p, 从而最小化信息准则(IC),基于最小二乘法,通过参数调整以最小化预测误差:
(2)
其中,n表示度量数量,表示训练数据集的大小,表示残差的协方差矩阵估计。
给定训练集X的最优值为:
(3)
p区间内时,误差项集合为多元正态零均值满秩协方差矩阵,表示 根据最近观察的正常行为定义为:
(4)
2.节点异常资源检测
计算多维空间中预期残差的统计距离,作为识别异常数据点的依据,当检测到异常则发出警报。在每个时间点,本发明使用基准P w 来检测异常时间点,预期下个时间周期的资源使用:
, (5)
计算预测误差为监测与预测之间的差值:
(6)
检测异常资源使用的问题可以抽象为多元基于距离的离群点检测,使用预测误差到训练集中残差的统计距离以表示异常程度:
(7)
其中,E的均值,E的协方差矩阵。
为了异常值计算具有鲁棒性,本发明使用协方差最小行列式估计协方差矩阵而 不是最大似然估计。而且,由于监测度量具有不同的取值范围,
使用min-max规范化E和到相同的取值范围,为相对于E稀疏性。当,表示观察值与预测值产生了较大偏差,则认为出现了异常。其中, 表示训练残差距离的集合,参数L为训练残差集合E距离的z分数分布的99%分位数。
3.自适应模型演化
本发明由一系列长度为k的滑动窗口构建而成,每个窗口包含最新的监测数据以估计 时变参数,如最优滞后数量。然后,使用该模型进行预测,基于残差值将监测数据实例 分为正常和异常。为了正确学习序列化正常行为,本发明通过在各时间点用预测值替换异 常监测数据,以保持监测的时间连续性,这些点的残差是训练残差的期望值。滑动窗口每移 动一步,本发明以训练测试交叉周期重复整个过程。该策略具有两个技术优势:(1)在线学 习最近少量监测数据集合,而不是整个测量监测数据集合;(2)短期预测使模型能够更好跟 踪趋势和微小变化数据,从而能够快速检测出现性能下降的时间。
假设滑动窗口大小k,k值较大,由于模型系数增加的时间平滑,会忽略数据中的 瞬时变化。当k值较小,由于在时间窗口内未出现变量之间的时间相关性,会忽略数据中的 动态变化。因此,k应该能够捕获数据中有用的时序变化以及变量间的动态依赖性。对于具 有时间滞后数量为p和变量数量为n的预测模型,需要估计个系数,因此,以确 保有足够的数据点能够正确拟合模型。由于每个分布式节点异常检测代理只为每个节点构 建模型,运行时需求对于在线部署是合理的,该过程可以进行并行化计算以消除计算瓶颈。
4.全局异常资源排序
将所有警报从分布式节点合并,以固定周期进行异常报警,基于空间依赖性产生关联映射到异常或发现可能引起该异常的组件。由于节点之间具有依赖关系,表现为级联行为,例如,一个节点的异常资源使用可以传播到其他节点。虚拟化数据中心规模巨大,系统运维管理员会被多个警报所淹没,因此需要基于领域知识将警报或问题关联到数据中心内部或外部的依赖关系以隔离问题根源。此外,为了减少服务降级,自动化的云计算管理系统可以采取纠正措施,如通过自动伸缩调整资源容量或通过自动迁移实现跨数据中心的重新负载分配。同时,当警报太多,无法判断哪个警报更重要。因此,由于处理重要异常可能解决其他共同发生的警报,需要在集群级别自动对异常警报进行排序,以便于进行根源分析,从而提高纠正措施的效果。
本发明使用依赖关系图表示数据中心拓扑结构,描述了异常节点如何在给定的时 间内与其他共同发生异常节点的关联关系,然后根据节点之间的因果关系对警报进行排 序。景观图是一个有向无环图G = (V,E),其中,节点表示数据中心组件(例如,服务、 VM、网络函数或物理服务器)的节点或属性,边表示每个层内部或者层之间的依赖关 系。假设异常节点列表集合,通过深度优先搜索遍历提取异常子图并构建 路径,包含异常节点和从可达的物理节点,因此异常子图是从出发或者到达的可能 异常传播路径。假设所有子图的集合,影响计数出现在异常子图中的数 量,根据进行排序,具有高影响值的节点会影响或被更多异常所影响。
附图说明
图1为方法步骤。
图2为部署实施环境。
具体实施方式
系统实施的部署环境如图2所示,包括Web服务器、数据库服务器、监测代理、背景服务以及负载发生器,实施具体分为以下阶段:
(1) 应用部署:物理机配置8个2.66GHz Intel Xeon处理器、16GB内存和250GB磁盘,虚拟化两台Xen虚拟机(VM),分别部署Web服务器Apache 2.0和数据库服务器MySQL 5.0。部署类似于e-Bay的二层电子商务应用RUBiS(http://rubis.ow2.org/index.html),提供出售、浏览、出价等服务。
(2) 数据采集:监测代理部署在云数据中心的虚拟基础设施的每个节点(VM和PM)上,基于Unix的开源监测工具dstat (https://github.com/dagwieers/dstat)和psutil(https://pythonhosted.org/psutil/),以固定时间间隔采样(1分钟),实时监测计算、内存、磁盘IO和网络资源等度量。
(3) 负载生成:使用开源HTTP负载生成器httpmon (https://github.com/cloud-control/httpmon)模拟虚拟Web用户并发与应用程序交互,采用支持封闭和开放模型,以指数分布发出不同密度的HTTP GET或POST请求,动态模拟产生真实的应用行为。
(4) 异常注入:在VM中部署资源使用工具,通过占用额外资源以模拟资源竞争,导致目标服务的异常资源使用或性能衰减,包括以下三种资源竞争情况:
1)CPU资源竞争:在给定的一段时间内,自动运行并行Sudoku(http://norvig.com/sudoku.html),以解决随机猜谜问题。每个求解器的数量和持续时间,符合以某个设定值为均值的泊松分布。基于符合指数分布的运行间隔时间和平均运行次数,重复进行该实验过程。
2)网络拥塞:在VM上的单个iperf服务器和客户端之间建立串行TCP通信,设定每个串行连接之间为随机等待时间,模拟过量的网络带宽占用,每次运行的持续时间符合设定均值的指数分布。
3)磁盘IO饱和:通过间歇性生成应用程序stress-ng(http://kernel.ubuntu.com/ cking/stress-ng/)以模拟后台备份操作,从而导致磁盘I/O资源使用率过高。一个进程向磁盘写入平均50MB的数据,而另一个进程以特定周期执行线性搜索32位整数,操作时间的间隔符合以设定值为均值的指数分布。
(5)异常检测:分阶段进行3个小时,采样周期为30秒,每个实验节点搜集360个监测数据,基于交叉训练、测试策略,使用最近1.5小时的监测数据(180个实例)作为基准,设置参数k = 180,n = 4和p max = 10,剩余时间在线检测异常。基于statsmodels(http://statsmodels.sourceforge.net)实现度量的在线预测,基于scikit-learn(http://scikit-learn.org)实现基于距离的异常检测,对节点以及度量的异常程度进行排序:
1)定时搜集各节点的多度量监测数据,为在时间t监测得到的(1 ×n)向量,是度量m在时间t的监测数据,n是监测度量数量;
2)根据历史监测数据,使用线性组合建模并预测度量值,其中,p表示滞后监测数据的 数量,参数表示(n×1)的常数向量,(n>i> 0)构成(n×n)系数矩阵,表示(n×1) 的白噪声向量,使用n个方程组成求解参数值
3)计算预测误差为监测与预测之间的差值:,其中,为预测值,为监测值,这样检测异常资源使用的问题可以抽象为多元基于距离的离群点检测,使用预测误差到训练集中残差的统计距离以表示异常程度:,其中,为E的均值,S E E的协方差矩阵;
4)建立有向无环图G = (V,E),其中,节点v∈V表示数据中心组件的节点或属性,边e∈E表示每个层内部或者层之间的依赖关系;
5)异常节点列表集合,通过深度优先搜索遍历提取异常子图并构建路径, 包含异常节点和从可达的物理节点,异常子图是从出发或者到达的可能异常传播路径;
6)中所有异常节点的集合,对于每个节点,影响计数出现在 异常子图中的数量,根据IC*进行排序,具有高影响值的节点会影响或被更多异常所影响。

Claims (1)

1.一种基于统计分析的云数据中心服务异常根因定位方法,方法特征在于实现步骤如下:
第一步,定时搜集各节点的多度量监测数据,为在时间t监测得 到的(1×n)向量,是度量m在时间t的监测数据,n是监测度量数量;
第二步,根据历史监测数据,使用线性组合建模并预测度量值,其中,p表示滞后监测数据的数量,参数θ 0 表示(n×1)的常 数向量, 构成(n×n)系数矩阵,表示的白噪声向量,使用n个方程 组成求解参数值
第三步,计算预测误差为监测与预测之间的差值:,其中,为预测值,为监测值,这样检测异常资源使用的问题可以抽象为多元基于距 离的离群点检测,使用预测误差到训练集中残差的统计距离以表示异常程度:,其中,E的均值,E的协方差矩阵;
第四步,建立有向无环图,其中,节点表示数据中心组件的节点或属 性,边表示每个层内部或者层之间的依赖关系;
第五步,异常节点列表集合,通过深度优先搜索遍历提取异常子图并构 建路径,包含异常节点和从可达的物理节点,异常子图是从出发或者到达的可能异 常传播路径;
第六步,中所有异常节点的集合,对于每个节点,影响计数 I C* 出现在异常子图中的数量,根据进行排序,具有高影响值的节点会影响或被更多异 常所影响。
CN201811113774.XA 2018-09-25 2018-09-25 一种基于统计分析的云数据中心服务异常根因定位方法 Pending CN109254865A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811113774.XA CN109254865A (zh) 2018-09-25 2018-09-25 一种基于统计分析的云数据中心服务异常根因定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811113774.XA CN109254865A (zh) 2018-09-25 2018-09-25 一种基于统计分析的云数据中心服务异常根因定位方法

Publications (1)

Publication Number Publication Date
CN109254865A true CN109254865A (zh) 2019-01-22

Family

ID=65047850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811113774.XA Pending CN109254865A (zh) 2018-09-25 2018-09-25 一种基于统计分析的云数据中心服务异常根因定位方法

Country Status (1)

Country Link
CN (1) CN109254865A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109933452A (zh) * 2019-03-22 2019-06-25 中国科学院软件研究所 一种面向异常传播的微服务智能监测方法
CN109992479A (zh) * 2019-03-31 2019-07-09 西安电子科技大学 一种多维度kpi数据异常定位方法、装置及计算机设备
CN110888755A (zh) * 2019-11-15 2020-03-17 亚信科技(中国)有限公司 一种微服务系统异常根因节点的查找方法及装置
CN111064614A (zh) * 2019-12-17 2020-04-24 腾讯科技(深圳)有限公司 一种故障根因定位方法、装置、设备及存储介质
CN111314173A (zh) * 2020-01-20 2020-06-19 腾讯科技(深圳)有限公司 监控信息异常的定位方法、装置、计算机设备及存储介质
CN112817785A (zh) * 2019-11-15 2021-05-18 亚信科技(中国)有限公司 一种微服务系统的异常检测方法及装置
CN114077510A (zh) * 2020-08-11 2022-02-22 腾讯科技(深圳)有限公司 一种故障根因定位和故障根因显示的方法和装置
WO2022242595A1 (en) * 2021-05-17 2022-11-24 International Business Machines Corporation Detecting resource redundancy and conflicts in heterogeneous computing environment

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150095718A1 (en) * 2013-09-30 2015-04-02 Fujitsu Limited Locational Prediction of Failures
CN105677538A (zh) * 2016-01-11 2016-06-15 中国科学院软件研究所 一种基于故障预测的云计算系统自适应监测方法
CN107707431A (zh) * 2017-10-31 2018-02-16 河南科技大学 一种面向云平台的数据安全监测方法及系统
CN108282360A (zh) * 2017-12-28 2018-07-13 深圳先进技术研究院 一种长短期预测融合的故障检测方法
CN108508865A (zh) * 2018-03-06 2018-09-07 宁波大学 一种基于分散式osc-pls回归模型的故障检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150095718A1 (en) * 2013-09-30 2015-04-02 Fujitsu Limited Locational Prediction of Failures
CN105677538A (zh) * 2016-01-11 2016-06-15 中国科学院软件研究所 一种基于故障预测的云计算系统自适应监测方法
CN107707431A (zh) * 2017-10-31 2018-02-16 河南科技大学 一种面向云平台的数据安全监测方法及系统
CN108282360A (zh) * 2017-12-28 2018-07-13 深圳先进技术研究院 一种长短期预测融合的故障检测方法
CN108508865A (zh) * 2018-03-06 2018-09-07 宁波大学 一种基于分散式osc-pls回归模型的故障检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘光帅等: "基于多尺度核函数的散乱点云数据过滤方法", 《计算机应用研究》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109933452A (zh) * 2019-03-22 2019-06-25 中国科学院软件研究所 一种面向异常传播的微服务智能监测方法
CN109933452B (zh) * 2019-03-22 2020-06-19 中国科学院软件研究所 一种面向异常传播的微服务智能监测方法
CN109992479A (zh) * 2019-03-31 2019-07-09 西安电子科技大学 一种多维度kpi数据异常定位方法、装置及计算机设备
CN110888755A (zh) * 2019-11-15 2020-03-17 亚信科技(中国)有限公司 一种微服务系统异常根因节点的查找方法及装置
CN110888755B (zh) * 2019-11-15 2023-04-11 亚信科技(中国)有限公司 一种微服务系统异常根因节点的查找方法及装置
CN112817785A (zh) * 2019-11-15 2021-05-18 亚信科技(中国)有限公司 一种微服务系统的异常检测方法及装置
CN111064614B (zh) * 2019-12-17 2020-12-08 腾讯科技(深圳)有限公司 一种故障根因定位方法、装置、设备及存储介质
CN111064614A (zh) * 2019-12-17 2020-04-24 腾讯科技(深圳)有限公司 一种故障根因定位方法、装置、设备及存储介质
CN111314173A (zh) * 2020-01-20 2020-06-19 腾讯科技(深圳)有限公司 监控信息异常的定位方法、装置、计算机设备及存储介质
CN111314173B (zh) * 2020-01-20 2022-04-08 腾讯科技(深圳)有限公司 监控信息异常的定位方法、装置、计算机设备及存储介质
CN114077510A (zh) * 2020-08-11 2022-02-22 腾讯科技(深圳)有限公司 一种故障根因定位和故障根因显示的方法和装置
WO2022242595A1 (en) * 2021-05-17 2022-11-24 International Business Machines Corporation Detecting resource redundancy and conflicts in heterogeneous computing environment
US11593192B2 (en) 2021-05-17 2023-02-28 International Business Machines Corporation Detecting resource redundancy and conflicts in a heterogeneous computing environment
GB2620705A (en) * 2021-05-17 2024-01-17 Ibm Detecting resource redundancy and conflicts in heterogeneous computing environment
GB2620705B (en) * 2021-05-17 2024-06-12 Ibm Detecting resource redundancy and conflicts in a heterogeneous computing environment

Similar Documents

Publication Publication Date Title
CN109254865A (zh) 一种基于统计分析的云数据中心服务异常根因定位方法
Wen et al. Fog orchestration for internet of things services
Silva et al. Cloudbench: Experiment automation for cloud environments
US8806487B2 (en) Calculating virtual machine resource utilization information
Novaković et al. {DeepDive}: Transparently identifying and managing performance interference in virtualized environments
US20140372347A1 (en) Methods and systems for identifying action for responding to anomaly in cloud computing system
US20180121822A1 (en) Determining performance in a distributed application or system
Bashar Autonomic scaling of cloud computing resources using BN-based prediction models
Kang et al. {DAPA}: Diagnosing Application Performance Anomalies for Virtualized Infrastructures
Liu et al. CSSAP: Software aging prediction for cloud services based on ARIMA-LSTM hybrid model
Samir et al. A controller architecture for anomaly detection, root cause analysis and self-adaptation for cluster architectures
Becker et al. Towards aiops in edge computing environments
Aral et al. Quality of service channelling for latency sensitive edge applications
Cremonesi et al. Indirect estimation of service demands in the presence of structural changes
Ghanbari et al. Tracking adaptive performance models using dynamic clustering of user classes
Wu et al. Causal inference techniques for microservice performance diagnosis: Evaluation and guiding recommendations
Colmant et al. WattsKit: Software-defined power monitoring of distributed systems
Samir et al. Detecting and predicting anomalies for edge cluster environments using hidden markov models
US11212173B2 (en) Model-driven technique for virtual network function rehoming for service chains
US20210263718A1 (en) Generating predictive metrics for virtualized deployments
KR20200126766A (ko) Ict 인프라의 운용 관리 장치 및 방법
Amannejad et al. Predicting Web service response time percentiles
Kianpisheh et al. Resource availability prediction in distributed systems: An approach for modeling non-stationary transition probabilities
KR20210058468A (ko) 지능형 에지 네트워킹의 인공지능 운용자 지원 시스템 장치 및 방법
Samir et al. A controller for anomaly detection, analysis and management for self-adaptive container clusters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190122