CN107133142B - 一种基于关联分析的监控数据智能采样方法 - Google Patents

一种基于关联分析的监控数据智能采样方法 Download PDF

Info

Publication number
CN107133142B
CN107133142B CN201710254162.1A CN201710254162A CN107133142B CN 107133142 B CN107133142 B CN 107133142B CN 201710254162 A CN201710254162 A CN 201710254162A CN 107133142 B CN107133142 B CN 107133142B
Authority
CN
China
Prior art keywords
stability bandwidth
character
node
fluctuation status
monitoring data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710254162.1A
Other languages
English (en)
Other versions
CN107133142A (zh
Inventor
尹建伟
吴昊
邓水光
李莹
吴健
吴朝晖
易峥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Hithink Royalflush Information Network Co Ltd
Original Assignee
Zhejiang University ZJU
Hithink Royalflush Information Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU, Hithink Royalflush Information Network Co Ltd filed Critical Zhejiang University ZJU
Priority to CN201710254162.1A priority Critical patent/CN107133142B/zh
Publication of CN107133142A publication Critical patent/CN107133142A/zh
Application granted granted Critical
Publication of CN107133142B publication Critical patent/CN107133142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于关联分析的监控数据智能采样方法,包括四个关键步骤:时序数据编码、关联关系挖掘、计算状态转移矩阵、状态预测。本发明方法可以根据对未来主机资源利用率的预测,动态地调整监控周期,达到在资源利用率变化平稳时减小采样频率,在资源利用率变化剧烈时增大采样频率以节约计算及存储资源的目的。与现有技术相比,本发明方法可以在机器平稳运行,增大监控周期,减小采样率;机器运行出现波动时,需要减小监控周期,增大采样率;这样获得的更多是有意义的监控数据,有效地减少无用数据的采集,防止浪费大部分计算资源在无用数据的采集和计算等处理上,提高效率,并在减少无用数据采集的同时,保持高准确率。

Description

一种基于关联分析的监控数据智能采样方法
技术领域
本发明属于智能采样技术领域,具体涉及一种基于关联分析的监控数据智能采样方法。
背景技术
随着云计算和移动互联网的进一步普及和深入应用,各类网络应用和服务正在各行各业中扮演着更为重要的角色。有些网络服务对于负载的波动有着敏感的变化,合理设计的采样率算法可以保障宿主机中网络等资源利用的低开销,同时使得监控系统后端的计算资源尤其是存储资源的压力减小,以及对于关键信息不丢失,因此是系统性能优化方向的一个关键的问题,其效率的好坏直接影响着系统优化的效率。目前采样的方式大致分为三类,即固定周期采样、可变周期采样和动态周期采样。
固定周期采样最好理解,即采样的频率是一个固定的周期,一般写在配置文件中。传统的Nagios和Ganglia以及Google Dapper就是如此。这类采样率策略优点就是实现简单,易于操作,但是如果需要修改监控周期,往往需要更改配置文件后重启系统。
可变周期采样在固定周期采样的基础上实现了系统采样周期的热更新,即修改采样周期可以在系统运行时进行热更新,而不需要重启系统,往往通过向系统发送外部命令的方式实现。优点自然是可以在系统运行时修改采样周期,缺点是采样周期的设置和修改往往需要系统管理员判断,准确率和效率都不高。
动态周期采样相比于可变周期采样再次发展而来,使得系统自身根据监控对象的运行状态自动调整采样周期,达到解决系统计算及存储资源的目的。而动态调整采样周期的算法往往基于预测,在系统运行状态平稳时,增大采样周期,减小采样率;系统运行波动时,减小采样周期,增大采样率。从而实现采集更多的有效数据,摒弃更多的无用数据的目的。
在对大规模分布式集群的性能监控中,考虑到节约计算及存储资源的目的,往往只获取监控对象的部分而非全部数据,相邻采样点的时间间隔便是监控周期,一般是通过静态或动态设定监控周期进行采样。在动态采样过程中,准确率与效率是一个相互制约的因素,通常提高准确度的同时意味着效率的下降。极端的情况便是全采样的方法,因为未作筛选所以无用数据的占比是很客观的,效率很低。
一般情况下,减小监控周期、增加采样的频率可以提高采样的准确度,但会降低采样的效率,增加无用数据的采样比率。因此在动态采样中,需要根据一定的策略在合适的时机调整监控周期,避免盲目采样。
发明内容
鉴于上述情况,本发明提出了一种基于关联分析的监控数据智能采样方法,能够在性能监控过程中动态调整监控周期。
一种基于关联分析的监控数据智能采样方法,包括如下步骤:
(1)对节点的监控数据进行归一化,并对归一化后的监控数据进行波动率标记,得到节点的波动率字符流;
(2)对同一数据中心内任一对节点组合的波动率字符流进行错位拟合标记,得到该对节点组合的错位拟合码;
(3)统计所述错位拟合码中每一模式的支持度,取支持度大于设定阈值的模式作为频繁模式,进而利用Apriori算法计算每一频繁模式的置信度;所述模式为错位拟合码中两个及两个以上连续的编码;
(4)根据步骤(2)和(3)遍历所有节点组合;对于任一节点,根据其波动率字符流并综合马尔科夫链和频繁模式置信度,预测其下一时刻的波动状态,进而动态调整该节点的监控采样周期。
所述步骤(1)中根据以下关系式对归一化后的监控数据进行波动率标记:
其中:Vi和Vi-1分别为归一化后监控数据中当前时刻和前一时刻的采样值,Si为归一化后监控数据中当前时刻采样点的波动率字符,Threshold为设定的阈值,R、L、F对应表示高、中、低三种波动状态。
所述步骤(2)中的错位拟合标记方法为:使两个节点的波动率字符流错开一位形成对应关系,对于前后两个单独错位的波动率字符标记为X,对于中间两两对应的波动率字符根据以下标准进行标记,从而得到错位拟合码;
波动率字符R与R,则标记为0;波动率字符R与L,则标记为1;
波动率字符R与F,则标记为2;波动率字符L与R,则标记为3;
波动率字符L与L,则标记为4;波动率字符L与F,则标记为5;
波动率字符F与R,则标记为6;波动率字符F与L,则标记为7;
波动率字符F与F,则标记为8。
所述步骤(3)中模式的支持度为该模式在错位拟合码中的出现次数占错位拟合码总编码数量的比值。
所述步骤(4)中预测节点下一时刻的波动状态,具体过程如下:
4.1根据该节点最近三个时刻的波动率字符标记,建立这三个时刻的波动状态概率向量,进而根据以下公式计算下一时刻的波动状态概率向量:
其中:P(Si)~P(Si-2)分别为该节点对应i时刻、i-1时刻、i-2时刻的波动状态概率向量,i表示当前时刻,P(Si+1)为该节点下一时刻的波动状态概率向量,Q为马尔科夫链状态转移矩阵(其与历史时间长度相关);
4.2统计与该节点相关的所有频繁模式,提取这些频繁模式中对应该节点的波动率字符串;
4.3使该节点波动率字符流中的末尾字符串与步骤4.2提取得到的波动率字符串逐一进行匹配:若查找到相匹配的波动率字符串,则执行步骤4.4;若未找到相匹配的波动率字符串,则使波动状态概率向量P(Si+1)中最大概率值所对应的波动状态作为该节点下一时刻的波动状态;
4.4使波动状态概率向量P(Si+1)中的最大概率值与相匹配的波动率字符串所在频繁模式的置信度进行比较:若最大概率值大,则使该最大概率值所对应的波动状态作为该节点下一时刻的波动状态;若置信度大,则使该相匹配的波动率字符串中最末位字符所对应的波动状态作为该节点下一时刻的波动状态。
与现有技术相比,本发明方法可以在机器平稳运行,增大监控周期,减小采样率;机器运行出现波动时,需要减小监控周期,增大采样率;这样获得的更多是有意义的监控数据,有效地减少无用数据的采集,防止浪费大部分计算资源在无用数据的采集和计算等处理上,提高效率,并在减少无用数据采集的同时,保持高准确率。
本发明方法可以根据对未来主机资源利用率的预测,动态地调整监控周期,达到在资源利用率变化平稳时减小采样频率,在资源利用率变化剧烈时增大采样频率以节约计算及存储资源的目的。
附图说明
图1为本发明方法的步骤流程示意图。
图2为本发明中关联关系挖掘的流程示意图。
图3为马尔科夫链结合关联关系的决策流程示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
如图1所示,本发明基于关联分析的监控数据智能采样方法包括如下步骤:
(1)时序数据编码。
时序数据编码是将连续的、原始的数据经过指定规则的编码后可以由Apriori算法挖掘的字符流结构,具体如图2所示。
1.1数据归一化:利用如下公式对数据进行正规化,保留数据的相对大小及趋势,去除数据绝对大小对算法的影响。
其中:Vmin为V的最小值,Vmax为V的最大值,计算后RVi的范围为[0,1];这样做的主要原因是数据的相对大小是关键数据,而具体大小不需关心。
1.2粒度选择:对于数据点Vi,Si为其符号表示,通过计算Vi相对于Vi-1的变化率并设置Threshold,将Vi作三值映射。
1.3错位拟合:对于数据流A,B,Ternary函数将符号R、L、F映射成三进制数值0、1、2,R(A~B)表示A对B错位拟合后的数据流,Decimal(X)表示数值X的十进制表示。
Ri(A~B)=Decimal(Ternaryi(Si(Ai))+Ternaryi(Si+i(Bi+i)))
(2)关联规则挖掘。
错位拟合后得到的是由{0,1,…,8}组成的无规则字符串。设置支持度阈值为Thresholdsupport置信度阈值为Thresholdconfidence,Lk表示由k个长度的频繁模式组成的集合。
2.1连接步:为找出Lk,通过将Lk-1与自身连接(自连接和右连接)产生候选k项集的集合Ck,Lk中元素采用时间顺序关系。对于(k-1)项集li,这意味着把项排序,使得li[1]<li[2]<…<li[k-1];执行连接操作其中Lk-1的元素是可连接的,如果它们前(k-2)个项相同,即Lk-1的元素l1和l2是可连接的,如果(l1[1]=l2[1])∧(l1[2]=l2[2])∧...∧(l1[k-1]=l2[k-1])。
2.2剪枝步:Ck是Lk的超集,Ck的成员可以是频繁的也可以不是频繁的,但所有的频繁k项都包含在Ck中。根据任何非频繁的(k-1)项集都不是频繁k项集的子集。如果一个候选k项集的(k-1)项子集不在Lk-1中,则该候选也不可能是频繁的,从而可以从Ck中删除。
(3)计算状态转移矩阵。
状态矩阵表示任意两个状态之间转移的概率,pij表示第i个状态转移到第j个状态的概率。
3.1历史统计:通过对历史数据抽样统计得到状态转移矩阵。
3.2状态转移:采用1×n行向量I表示第i个状态,行向量的第i列为1,其余列为0;下一个状态为具有最大概率的转移状态。
k=Max{I·Pk|1≤k≤n}
(4)状态预测。
4.1均值马尔科夫链预测:采用过去三个状态来预测下一个状态。
4.2关联关系预测:假设时序数据流A,B存在频繁模式(置信度为confidence)那么:
P(SB=S′|SA=S)=confidence
4.3联合概率公式:如图3所示,对于选择具有更大概率的决策结果来作为最终输出。
其中:P(Si)为下一时刻波动率标记的概率向量,Q为马尔科夫链状态转移矩阵。
综合了马尔科夫链和关联关系的预测结果进行下一个状态的判断,选取概率高的状态作为输出,并根据判断的状态来动态的调整监控周期。
上述对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims (4)

1.一种基于关联分析的监控数据智能采样方法,包括如下步骤:
(1)对节点的监控数据进行归一化,并对归一化后的监控数据进行波动率标记,得到节点的波动率字符流;
(2)对同一数据中心内任一对节点组合的波动率字符流进行错位拟合标记,得到该对节点组合的错位拟合码;
(3)统计所述错位拟合码中每一模式的支持度,取支持度大于设定阈值的模式作为频繁模式,进而利用Apriori算法计算每一频繁模式的置信度;所述模式为错位拟合码中两个及两个以上连续的编码;
(4)根据步骤(2)和(3)遍历所有节点组合;对于任一节点,根据其波动率字符流并综合马尔科夫链和频繁模式置信度,通过以下步骤预测其下一时刻的波动状态,进而动态调整该节点的监控采样周期;
4.1 根据该节点最近三个时刻的波动率字符标记,建立这三个时刻的波动状态概率向量,进而根据以下公式计算下一时刻的波动状态概率向量:
其中:P(Si)~P(Si-2)分别为该节点对应i时刻、i-1时刻、i-2时刻的波动状态概率向量,i表示当前时刻,P(Si+1)为该节点下一时刻的波动状态概率向量,Q为马尔科夫链状态转移矩阵;
4.2 统计与该节点相关的所有频繁模式,提取这些频繁模式中对应该节点的波动率字符串;
4.3 使该节点波动率字符流中的末尾字符串与步骤4.2提取得到的波动率字符串逐一进行匹配:若查找到相匹配的波动率字符串,则执行步骤4.4;若未找到相匹配的波动率字符串,则使波动状态概率向量P(Si+1)中最大概率值所对应的波动状态作为该节点下一时刻的波动状态;
4.4 使波动状态概率向量P(Si+1)中的最大概率值与相匹配的波动率字符串所在频繁模式的置信度进行比较:若最大概率值大,则使该最大概率值所对应的波动状态作为该节点下一时刻的波动状态;若置信度大,则使该相匹配的波动率字符串中最末位字符所对应的波动状态作为该节点下一时刻的波动状态。
2.根据权利要求1所述的监控数据智能采样方法,其特征在于:所述步骤(1)中根据以下关系式对归一化后的监控数据进行波动率标记:
其中:Vi和Vi-1分别为归一化后监控数据中当前时刻和前一时刻的采样值,Si为归一化后监控数据中当前时刻采样点的波动率字符,Threshold为设定的阈值,R、L、F对应表示高、中、低三种波动状态。
3.根据权利要求2所述的监控数据智能采样方法,其特征在于:所述步骤(2)中的错位拟合标记方法为:使两个节点的波动率字符流错开一位形成对应关系,对于前后两个单独错位的波动率字符标记为X,对于中间两两对应的波动率字符根据以下标准进行标记,从而得到错位拟合码;
波动率字符R与R,则标记为0;波动率字符R与L,则标记为1;
波动率字符R与F,则标记为2;波动率字符L与R,则标记为3;
波动率字符L与L,则标记为4;波动率字符L与F,则标记为5;
波动率字符F与R,则标记为6;波动率字符F与L,则标记为7;
波动率字符F与F,则标记为8。
4.根据权利要求1所述的监控数据智能采样方法,其特征在于:所述步骤(3)中模式的支持度为该模式在错位拟合码中的出现次数占错位拟合码总编码数量的比值。
CN201710254162.1A 2017-04-18 2017-04-18 一种基于关联分析的监控数据智能采样方法 Active CN107133142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710254162.1A CN107133142B (zh) 2017-04-18 2017-04-18 一种基于关联分析的监控数据智能采样方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710254162.1A CN107133142B (zh) 2017-04-18 2017-04-18 一种基于关联分析的监控数据智能采样方法

Publications (2)

Publication Number Publication Date
CN107133142A CN107133142A (zh) 2017-09-05
CN107133142B true CN107133142B (zh) 2019-08-27

Family

ID=59715507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710254162.1A Active CN107133142B (zh) 2017-04-18 2017-04-18 一种基于关联分析的监控数据智能采样方法

Country Status (1)

Country Link
CN (1) CN107133142B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019109352A1 (zh) * 2017-12-08 2019-06-13 华为技术有限公司 对设备的性能数据进行采样的方法和装置
CN108989082A (zh) * 2018-06-04 2018-12-11 曙光信息产业(北京)有限公司 高性能计算集群系统的可靠性评估方法及评估装置
CN110654399B (zh) * 2018-06-29 2021-09-03 比亚迪股份有限公司 系统监控方法及装置
CN109271396B (zh) * 2018-09-27 2020-06-12 杭州数梦工场科技有限公司 一种调用链数据的处理方法、装置、设备及存储介质
CN111200828B (zh) * 2018-11-20 2023-12-29 中兴通讯股份有限公司 一种路测数据的动态抽样方法
CN109947147A (zh) * 2019-03-18 2019-06-28 东华大学 一种加热系统的差别采样温度控制方法
CN111130504B (zh) * 2019-12-23 2023-03-03 成都理工大学 一种自我调整采样频率的数据采集方法
CN113672447B (zh) * 2020-05-15 2024-02-27 杭州海康威视系统技术有限公司 数据采集方法及装置
CN112269336B (zh) * 2020-10-19 2022-03-08 张家宁 异常控制发现方法、装置、电子设备及存储介质
CN114428803B (zh) * 2020-10-29 2023-05-26 上海浦昊节能环保科技有限公司 空压站运行优化方法、系统、存储介质及终端
CN115294745B (zh) * 2022-05-23 2023-09-29 电子科技大学 一种基于神经网络与数据差分的锂电池热失控分层预警方法
CN117596366B (zh) * 2024-01-18 2024-03-29 北京睿企信息科技有限公司 一种人员状态监测系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102809965A (zh) * 2012-07-30 2012-12-05 燕山大学 一种基于故障频繁模式的液压设备故障预警方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7512496B2 (en) * 2002-09-25 2009-03-31 Soheil Shams Apparatus, method, and computer program product for determining confidence measures and combined confidence measures for assessing the quality of microarrays

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102809965A (zh) * 2012-07-30 2012-12-05 燕山大学 一种基于故障频繁模式的液压设备故障预警方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于隐忍马尔科夫树模型的小波域压缩采样信号重构方法;赵贻玖;《电子测量与仪器学报》;20100430;第24卷(第4期);第314-318页 *

Also Published As

Publication number Publication date
CN107133142A (zh) 2017-09-05

Similar Documents

Publication Publication Date Title
CN107133142B (zh) 一种基于关联分析的监控数据智能采样方法
Li et al. Approximate holistic aggregation in wireless sensor networks
Wang et al. Adaptive approximate data collection for wireless sensor networks
CN110460656B (zh) 一种工业环保物联网远程监测云平台
EP2895968B1 (en) Optimal data representation and auxiliary structures for in-memory database query processing
US20230369855A1 (en) Method, internet of things system and storage medium for government power supply regulation in smart city
US20110225116A1 (en) Systems and methods for policy based execution of time critical data warehouse triggers
Saeedi et al. An energy-saving data aggregation method for wireless sensor networks based on the extraction of extrema points
WO2022042152A1 (zh) 多维网络指标的关联规则分析方法、设备和存储介质
Li et al. Learning-based delay-aware caching in wireless D2D caching networks
Gu et al. Research on efficient top-k query based on ARIMA time series model
CN109976974B (zh) 一种针对运行状态判断的云计算环境下系统监测方法
US10311061B2 (en) Quality-driven processing of out-of-order data streams
Huang et al. PKF: A communication cost reduction schema based on kalman filter and data prediction for wireless sensor networks
CN106452822B (zh) 一种大规模服务器集群的在线能耗管理方法与装置
CN103955192A (zh) 一种用于污水处理厂的曲线报表数据采样方法
CN109976271B (zh) 一种利用信息表征方法计算信息结构有序度的方法
CN109508433B (zh) 基于匹配算法性能调整的负载波动应对方法和系统
Zhang et al. A lifetime optimization mobile data gathering strategy with adaptive compressive sensing in WSN
Li et al. Sampling based δ-approximate data aggregation in sensor equipped iot networks
CN108959521B (zh) 基于n-of-N流模型的不确定轮廓查询并行处理方法及系统
Liu et al. Differentially Private Distributed Online Convex Optimization Towards Low Regret and Communication Cost
Sun Qos parameterization algorithm in data collection for wireless sensor networks
Shi et al. Optimization Study on Outlet Pressure of Water Supply Pumping Station Based on Relative Entropy Theory
Soltani et al. Utilization of convex optimization for data fusion-driven sensor management in WSNs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant