CN109254865A - 一种基于统计分析的云数据中心服务异常根因定位方法 - Google Patents
一种基于统计分析的云数据中心服务异常根因定位方法 Download PDFInfo
- Publication number
- CN109254865A CN109254865A CN201811113774.XA CN201811113774A CN109254865A CN 109254865 A CN109254865 A CN 109254865A CN 201811113774 A CN201811113774 A CN 201811113774A CN 109254865 A CN109254865 A CN 109254865A
- Authority
- CN
- China
- Prior art keywords
- node
- abnormal
- data center
- monitoring
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
发明涉及一种基于统计分析的云数据中心异常根因定位方法。监测云数据中心节点的多维度资源度量,使用向量自回归模型预测节点的资源使用情况,通过比较度量预测值与监测值来检测云服务的度量异常,根据数据中心节点之间复杂依赖关系的知识建立依赖图,对组件异常程度进行排序以减少报警风暴。
Description
技术领域
本发明涉及一种基于统计分析的云数据中心服务异常根因定位方法,属于软件技术领域。
背景技术
云数据中心时常会出现大规模服务降级和服务中断,从而严重影响服务可靠性与性能。服务性能衰减通常会表现为系统层的度量异常,以反映服务内部或底层基础设施中存在的问题,例如DDoS攻击、服务升级以及工作负载激增带来的异常资源使用。虚拟化技术将应用服务整合到少量的服务器中以降低操作成本(如,能源消耗)并最大化资源使用。然而,基于虚拟化的资源共享会造成相同主机上共享资源的服务之间竞争有限的系统资源(如,计算、带宽或内存),从而造成性能衰减。因此,不断检测系统异常(如异常的资源行为)以防止服务降级,并通过快速控制意外服务中断来提高服务可靠性,成为云服务监测的主要目标。然而,云服务规模巨大、体系结构复杂性,以及工作负载呈现多样性和动态性,使得在线异常检测具有挑战性。首先,异常检测方法需要在不明确正常状态或异常定义的情况下,能够自动适应云服务行为的变化。此外,能够应对多个层次的云服务抽象,从而分析处理多个服务度量。
当前的异常检测方法通常基于假设分布预先定义度量的阈值(M. Peiris, J. H.Hill, J. Thelin, S. Bykov, G. Kliot, and C. Konig, “PAD:Performance AnomalyDetection in Multi-server Distributed Systems,”in 7th IEEE InternationalConference on Cloud Computing.IEEE, 2014, pp. 769–776.),然而,阈值对工作负载的变化非常敏感,并且很难扩展到数百个度量。某些方法基于统计学方法自动设定阈值(P.Xiong, C. Pu, X. Zhu, and R. Griffith, “vPerfGuard: an Automated Model-drivenFramework for Application Performance Diagnosis in Consolidated CloudEnvironments,” in Proceedings of the 4th ACM/SPEC International Conference onPerformance Engineering. ACM, 2013, pp. 271–282.),然而其分别考虑单个资源度量,忽略了度量之间依赖关系。某些方法建模资源使用率和工作负载之间的关联关系(T.Wang, J. Wei, W. Zhang, H. Zhong, and T. Huang, “Workload aware AnomalyDetection for Web Applications,” Journal of Systems and Software, vol. 89,pp. 19–32, 2014.),然而其依赖于QoS和资源度量之间的相关性。基于多变量统计的机器学习方法建立多个指标之间的关联(T. Huang, Y. Zhu, Y. Wu, S. Bressan, and G.Dobbie, “Anomaly Detection and Identification Scheme for VM Live Migration inCloud Infrastructure,” Future Generation Computer Systems, vol. 56, pp. 736–745, 2016.),但是当QoS和工作负载度量无法获取时,该方法就难以适用。云计算运营商投入大量精力监测资源,发现异常的资源使用模式。然而,虚拟化云数据中心的复杂性对异常检测技术提出了要求:(1)非侵入,云服务提供者通常不知道租户的源码;(2)无监督学习,能够处理未分类为正常或异常的无标注数据;(3)在线自适应不断变化的系统行为,而不需要离线训练和人工干预。
发明内容
本发明的原理:提出了一种基于统计分析的云数据中心服务异常根因定位方法,监测云数据中心节点的多维度资源度量,使用向量自回归模型预测节点的资源使用情况,通过比较度量预测值与监测值来检测云服务的度量异常,根据数据中心节点之间复杂依赖关系的知识建立依赖图,对组件异常程度进行排序以减少报警风暴。
本发明技术解决方案:一种基于统计分析的云数据中心服务异常根因定位方法,如图1所示,实现步骤如下:
1.节点资源预测
本发明提出一种自适应向量自回归方法刻画基于滑动窗口的数据中心节点的序列化监测数据的资源使用模式,建模度量之间的关联关系,从历史数据中估计正常资源使用,用作预测近期的资源使用作为基准。
假设为在时间t监测得到的(1×n)向量,是度量m在
时间t的监测数据,n是监测度量数量,向量可以表示为历史监测数据的线性组合:
, (1)
其中,p表示滞后监测数据的数量,即需要考虑的此前监测周期数量,表示在t时
刻之前的第j个监测周期的监测数据。公式(1)由n个方程组成,每个监测度量表示该度量以
及其他度量滞后值的线性组合。参数表示的常数向量,和 构成系数矩阵,表示的白噪声向量。
需要确定模型中包含滞后监测数据数量p,该参数会影响模型的复杂性。由于滞后值会随时间改变,本发明使用长度为k的时间序列窗口,将历史资源使用进行分段,构建了基准训练模型,以在线方式更新模型。
假设为保存最近的正常行为数据的时间窗口,即在t时刻,产生时间窗口w,包
含时间间隔的最近k个监测数据:。
本发明定义最大滞后监测数据以限制探测空间,在范围中搜索p,
从而最小化信息准则(IC),基于最小二乘法,通过参数调整和以最小化预测误差:
(2)
其中,n表示度量数量,表示训练数据集的大小,表示残差的协方差矩阵估计。
给定训练集X,的最优值为:
(3)
当p在区间内时,误差项集合为多元正态零均值满秩协方差矩阵,表示
根据最近观察的正常行为定义为:
(4)
2.节点异常资源检测
计算多维空间中预期残差的统计距离,作为识别异常数据点的依据,当检测到异常则发出警报。在每个时间点,本发明使用基准P w 来检测异常时间点,预期下个时间周期的资源使用:
, (5)
计算预测误差为监测与预测之间的差值:
(6)
检测异常资源使用的问题可以抽象为多元基于距离的离群点检测,使用预测误差到训练集中残差的统计距离以表示异常程度:
(7)
其中,为E的均值,为E的协方差矩阵。
为了异常值计算具有鲁棒性,本发明使用协方差最小行列式估计协方差矩阵而
不是最大似然估计。而且,由于监测度量具有不同的取值范围,
使用min-max规范化E和到相同的取值范围,为相对于E的稀疏性。当,表示观察值与预测值产生了较大偏差,则认为出现了异常。其中,
表示训练残差距离的集合,参数L为训练残差集合E距离的z分数分布的99%分位数。
3.自适应模型演化
本发明由一系列长度为k的滑动窗口构建而成,每个窗口包含最新的监测数据以估计
时变参数,如最优滞后数量。然后,使用该模型进行预测,基于残差值将监测数据实例
分为正常和异常。为了正确学习序列化正常行为,本发明通过在各时间点用预测值替换异
常监测数据,以保持监测的时间连续性,这些点的残差是训练残差的期望值。滑动窗口每移
动一步,本发明以训练测试交叉周期重复整个过程。该策略具有两个技术优势:(1)在线学
习最近少量监测数据集合,而不是整个测量监测数据集合;(2)短期预测使模型能够更好跟
踪趋势和微小变化数据,从而能够快速检测出现性能下降的时间。
假设滑动窗口大小k,当k值较大,由于模型系数增加的时间平滑,会忽略数据中的
瞬时变化。当k值较小,由于在时间窗口内未出现变量之间的时间相关性,会忽略数据中的
动态变化。因此,k应该能够捕获数据中有用的时序变化以及变量间的动态依赖性。对于具
有时间滞后数量为p和变量数量为n的预测模型,需要估计个系数,因此,以确
保有足够的数据点能够正确拟合模型。由于每个分布式节点异常检测代理只为每个节点构
建模型,运行时需求对于在线部署是合理的,该过程可以进行并行化计算以消除计算瓶颈。
4.全局异常资源排序
将所有警报从分布式节点合并,以固定周期进行异常报警,基于空间依赖性产生关联映射到异常或发现可能引起该异常的组件。由于节点之间具有依赖关系,表现为级联行为,例如,一个节点的异常资源使用可以传播到其他节点。虚拟化数据中心规模巨大,系统运维管理员会被多个警报所淹没,因此需要基于领域知识将警报或问题关联到数据中心内部或外部的依赖关系以隔离问题根源。此外,为了减少服务降级,自动化的云计算管理系统可以采取纠正措施,如通过自动伸缩调整资源容量或通过自动迁移实现跨数据中心的重新负载分配。同时,当警报太多,无法判断哪个警报更重要。因此,由于处理重要异常可能解决其他共同发生的警报,需要在集群级别自动对异常警报进行排序,以便于进行根源分析,从而提高纠正措施的效果。
本发明使用依赖关系图表示数据中心拓扑结构,描述了异常节点如何在给定的时
间内与其他共同发生异常节点的关联关系,然后根据节点之间的因果关系对警报进行排
序。景观图是一个有向无环图G = (V,E),其中,节点表示数据中心组件(例如,服务、
VM、网络函数或物理服务器)的节点或属性,边表示每个层内部或者层之间的依赖关
系。假设异常节点列表集合,通过深度优先搜索遍历提取异常子图并构建
路径,包含异常节点和从可达的物理节点,因此异常子图是从出发或者到达的可能
异常传播路径。假设所有子图的集合,影响计数为出现在异常子图中的数
量,根据进行排序,具有高影响值的节点会影响或被更多异常所影响。
附图说明
图1为方法步骤。
图2为部署实施环境。
具体实施方式
系统实施的部署环境如图2所示,包括Web服务器、数据库服务器、监测代理、背景服务以及负载发生器,实施具体分为以下阶段:
(1) 应用部署:物理机配置8个2.66GHz Intel Xeon处理器、16GB内存和250GB磁盘,虚拟化两台Xen虚拟机(VM),分别部署Web服务器Apache 2.0和数据库服务器MySQL 5.0。部署类似于e-Bay的二层电子商务应用RUBiS(http://rubis.ow2.org/index.html),提供出售、浏览、出价等服务。
(2) 数据采集:监测代理部署在云数据中心的虚拟基础设施的每个节点(VM和PM)上,基于Unix的开源监测工具dstat (https://github.com/dagwieers/dstat)和psutil(https://pythonhosted.org/psutil/),以固定时间间隔采样(1分钟),实时监测计算、内存、磁盘IO和网络资源等度量。
(3) 负载生成:使用开源HTTP负载生成器httpmon (https://github.com/cloud-control/httpmon)模拟虚拟Web用户并发与应用程序交互,采用支持封闭和开放模型,以指数分布发出不同密度的HTTP GET或POST请求,动态模拟产生真实的应用行为。
(4) 异常注入:在VM中部署资源使用工具,通过占用额外资源以模拟资源竞争,导致目标服务的异常资源使用或性能衰减,包括以下三种资源竞争情况:
1)CPU资源竞争:在给定的一段时间内,自动运行并行Sudoku(http://norvig.com/sudoku.html),以解决随机猜谜问题。每个求解器的数量和持续时间,符合以某个设定值为均值的泊松分布。基于符合指数分布的运行间隔时间和平均运行次数,重复进行该实验过程。
2)网络拥塞:在VM上的单个iperf服务器和客户端之间建立串行TCP通信,设定每个串行连接之间为随机等待时间,模拟过量的网络带宽占用,每次运行的持续时间符合设定均值的指数分布。
3)磁盘IO饱和:通过间歇性生成应用程序stress-ng(http://kernel.ubuntu.com/ cking/stress-ng/)以模拟后台备份操作,从而导致磁盘I/O资源使用率过高。一个进程向磁盘写入平均50MB的数据,而另一个进程以特定周期执行线性搜索32位整数,操作时间的间隔符合以设定值为均值的指数分布。
(5)异常检测:分阶段进行3个小时,采样周期为30秒,每个实验节点搜集360个监测数据,基于交叉训练、测试策略,使用最近1.5小时的监测数据(180个实例)作为基准,设置参数k = 180,n = 4和p max = 10,剩余时间在线检测异常。基于statsmodels(http://statsmodels.sourceforge.net)实现度量的在线预测,基于scikit-learn(http://scikit-learn.org)实现基于距离的异常检测,对节点以及度量的异常程度进行排序:
1)定时搜集各节点的多度量监测数据,为在时间t监测得到的(1
×n)向量,是度量m在时间t的监测数据,n是监测度量数量;
2)根据历史监测数据,使用线性组合建模并预测度量值,其中,p表示滞后监测数据的
数量,参数表示(n×1)的常数向量,和(n>i> 0)构成(n×n)系数矩阵,表示(n×1)
的白噪声向量,使用n个方程组成求解参数值;
3)计算预测误差为监测与预测之间的差值:,其中,为预测值,为监测值,这样检测异常资源使用的问题可以抽象为多元基于距离的离群点检测,使用预测误差到训练集中残差的统计距离以表示异常程度:,其中,为E的均值,S E 为E的协方差矩阵;
4)建立有向无环图G = (V,E),其中,节点v∈V表示数据中心组件的节点或属性,边e∈E表示每个层内部或者层之间的依赖关系;
5)异常节点列表集合,通过深度优先搜索遍历提取异常子图并构建路径,
包含异常节点和从可达的物理节点,异常子图是从出发或者到达的可能异常传播路径;
6)为中所有异常节点的集合,对于每个节点,影响计数为出现在
异常子图中的数量,根据IC*进行排序,具有高影响值的节点会影响或被更多异常所影响。
Claims (1)
1.一种基于统计分析的云数据中心服务异常根因定位方法,方法特征在于实现步骤如下:
第一步,定时搜集各节点的多度量监测数据,为在时间t监测得
到的(1×n)向量,是度量m在时间t的监测数据,n是监测度量数量;
第二步,根据历史监测数据,使用线性组合建模并预测度量值,其中,p表示滞后监测数据的数量,参数θ 0 表示(n×1)的常
数向量,和 构成(n×n)系数矩阵,表示的白噪声向量,使用n个方程
组成求解参数值;
第三步,计算预测误差为监测与预测之间的差值:,其中,为预测值,为监测值,这样检测异常资源使用的问题可以抽象为多元基于距
离的离群点检测,使用预测误差到训练集中残差的统计距离以表示异常程度:,其中,为E的均值,为E的协方差矩阵;
第四步,建立有向无环图,其中,节点表示数据中心组件的节点或属
性,边表示每个层内部或者层之间的依赖关系;
第五步,异常节点列表集合,通过深度优先搜索遍历提取异常子图并构
建路径,包含异常节点和从可达的物理节点,异常子图是从出发或者到达的可能异
常传播路径;
第六步,为中所有异常节点的集合,对于每个节点,影响计数 I C* 为出现在异常子图中的数量,根据进行排序,具有高影响值的节点会影响或被更多异
常所影响。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811113774.XA CN109254865A (zh) | 2018-09-25 | 2018-09-25 | 一种基于统计分析的云数据中心服务异常根因定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811113774.XA CN109254865A (zh) | 2018-09-25 | 2018-09-25 | 一种基于统计分析的云数据中心服务异常根因定位方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109254865A true CN109254865A (zh) | 2019-01-22 |
Family
ID=65047850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811113774.XA Pending CN109254865A (zh) | 2018-09-25 | 2018-09-25 | 一种基于统计分析的云数据中心服务异常根因定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109254865A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109933452A (zh) * | 2019-03-22 | 2019-06-25 | 中国科学院软件研究所 | 一种面向异常传播的微服务智能监测方法 |
CN109992479A (zh) * | 2019-03-31 | 2019-07-09 | 西安电子科技大学 | 一种多维度kpi数据异常定位方法、装置及计算机设备 |
CN110888755A (zh) * | 2019-11-15 | 2020-03-17 | 亚信科技(中国)有限公司 | 一种微服务系统异常根因节点的查找方法及装置 |
CN111064614A (zh) * | 2019-12-17 | 2020-04-24 | 腾讯科技(深圳)有限公司 | 一种故障根因定位方法、装置、设备及存储介质 |
CN111314173A (zh) * | 2020-01-20 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 监控信息异常的定位方法、装置、计算机设备及存储介质 |
CN112817785A (zh) * | 2019-11-15 | 2021-05-18 | 亚信科技(中国)有限公司 | 一种微服务系统的异常检测方法及装置 |
CN114077510A (zh) * | 2020-08-11 | 2022-02-22 | 腾讯科技(深圳)有限公司 | 一种故障根因定位和故障根因显示的方法和装置 |
WO2022242595A1 (en) * | 2021-05-17 | 2022-11-24 | International Business Machines Corporation | Detecting resource redundancy and conflicts in heterogeneous computing environment |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150095718A1 (en) * | 2013-09-30 | 2015-04-02 | Fujitsu Limited | Locational Prediction of Failures |
CN105677538A (zh) * | 2016-01-11 | 2016-06-15 | 中国科学院软件研究所 | 一种基于故障预测的云计算系统自适应监测方法 |
CN107707431A (zh) * | 2017-10-31 | 2018-02-16 | 河南科技大学 | 一种面向云平台的数据安全监测方法及系统 |
CN108282360A (zh) * | 2017-12-28 | 2018-07-13 | 深圳先进技术研究院 | 一种长短期预测融合的故障检测方法 |
CN108508865A (zh) * | 2018-03-06 | 2018-09-07 | 宁波大学 | 一种基于分散式osc-pls回归模型的故障检测方法 |
-
2018
- 2018-09-25 CN CN201811113774.XA patent/CN109254865A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150095718A1 (en) * | 2013-09-30 | 2015-04-02 | Fujitsu Limited | Locational Prediction of Failures |
CN105677538A (zh) * | 2016-01-11 | 2016-06-15 | 中国科学院软件研究所 | 一种基于故障预测的云计算系统自适应监测方法 |
CN107707431A (zh) * | 2017-10-31 | 2018-02-16 | 河南科技大学 | 一种面向云平台的数据安全监测方法及系统 |
CN108282360A (zh) * | 2017-12-28 | 2018-07-13 | 深圳先进技术研究院 | 一种长短期预测融合的故障检测方法 |
CN108508865A (zh) * | 2018-03-06 | 2018-09-07 | 宁波大学 | 一种基于分散式osc-pls回归模型的故障检测方法 |
Non-Patent Citations (1)
Title |
---|
刘光帅等: "基于多尺度核函数的散乱点云数据过滤方法", 《计算机应用研究》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109933452A (zh) * | 2019-03-22 | 2019-06-25 | 中国科学院软件研究所 | 一种面向异常传播的微服务智能监测方法 |
CN109933452B (zh) * | 2019-03-22 | 2020-06-19 | 中国科学院软件研究所 | 一种面向异常传播的微服务智能监测方法 |
CN109992479A (zh) * | 2019-03-31 | 2019-07-09 | 西安电子科技大学 | 一种多维度kpi数据异常定位方法、装置及计算机设备 |
CN110888755A (zh) * | 2019-11-15 | 2020-03-17 | 亚信科技(中国)有限公司 | 一种微服务系统异常根因节点的查找方法及装置 |
CN110888755B (zh) * | 2019-11-15 | 2023-04-11 | 亚信科技(中国)有限公司 | 一种微服务系统异常根因节点的查找方法及装置 |
CN112817785A (zh) * | 2019-11-15 | 2021-05-18 | 亚信科技(中国)有限公司 | 一种微服务系统的异常检测方法及装置 |
CN111064614B (zh) * | 2019-12-17 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 一种故障根因定位方法、装置、设备及存储介质 |
CN111064614A (zh) * | 2019-12-17 | 2020-04-24 | 腾讯科技(深圳)有限公司 | 一种故障根因定位方法、装置、设备及存储介质 |
CN111314173A (zh) * | 2020-01-20 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 监控信息异常的定位方法、装置、计算机设备及存储介质 |
CN111314173B (zh) * | 2020-01-20 | 2022-04-08 | 腾讯科技(深圳)有限公司 | 监控信息异常的定位方法、装置、计算机设备及存储介质 |
CN114077510A (zh) * | 2020-08-11 | 2022-02-22 | 腾讯科技(深圳)有限公司 | 一种故障根因定位和故障根因显示的方法和装置 |
WO2022242595A1 (en) * | 2021-05-17 | 2022-11-24 | International Business Machines Corporation | Detecting resource redundancy and conflicts in heterogeneous computing environment |
US11593192B2 (en) | 2021-05-17 | 2023-02-28 | International Business Machines Corporation | Detecting resource redundancy and conflicts in a heterogeneous computing environment |
GB2620705A (en) * | 2021-05-17 | 2024-01-17 | Ibm | Detecting resource redundancy and conflicts in heterogeneous computing environment |
GB2620705B (en) * | 2021-05-17 | 2024-06-12 | Ibm | Detecting resource redundancy and conflicts in a heterogeneous computing environment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109254865A (zh) | 一种基于统计分析的云数据中心服务异常根因定位方法 | |
Wen et al. | Fog orchestration for internet of things services | |
Silva et al. | Cloudbench: Experiment automation for cloud environments | |
US8806487B2 (en) | Calculating virtual machine resource utilization information | |
Novaković et al. | {DeepDive}: Transparently identifying and managing performance interference in virtualized environments | |
US20140372347A1 (en) | Methods and systems for identifying action for responding to anomaly in cloud computing system | |
US20180121822A1 (en) | Determining performance in a distributed application or system | |
Bashar | Autonomic scaling of cloud computing resources using BN-based prediction models | |
Kang et al. | {DAPA}: Diagnosing Application Performance Anomalies for Virtualized Infrastructures | |
Liu et al. | CSSAP: Software aging prediction for cloud services based on ARIMA-LSTM hybrid model | |
Samir et al. | A controller architecture for anomaly detection, root cause analysis and self-adaptation for cluster architectures | |
Becker et al. | Towards aiops in edge computing environments | |
Aral et al. | Quality of service channelling for latency sensitive edge applications | |
Cremonesi et al. | Indirect estimation of service demands in the presence of structural changes | |
Ghanbari et al. | Tracking adaptive performance models using dynamic clustering of user classes | |
Wu et al. | Causal inference techniques for microservice performance diagnosis: Evaluation and guiding recommendations | |
Colmant et al. | WattsKit: Software-defined power monitoring of distributed systems | |
Samir et al. | Detecting and predicting anomalies for edge cluster environments using hidden markov models | |
US11212173B2 (en) | Model-driven technique for virtual network function rehoming for service chains | |
US20210263718A1 (en) | Generating predictive metrics for virtualized deployments | |
KR20200126766A (ko) | Ict 인프라의 운용 관리 장치 및 방법 | |
Amannejad et al. | Predicting Web service response time percentiles | |
Kianpisheh et al. | Resource availability prediction in distributed systems: An approach for modeling non-stationary transition probabilities | |
KR20210058468A (ko) | 지능형 에지 네트워킹의 인공지능 운용자 지원 시스템 장치 및 방법 | |
Samir et al. | A controller for anomaly detection, analysis and management for self-adaptive container clusters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190122 |