CN106254175A - 一种集群异常节点检测方法、应用和计算设备 - Google Patents

一种集群异常节点检测方法、应用和计算设备 Download PDF

Info

Publication number
CN106254175A
CN106254175A CN201610596853.5A CN201610596853A CN106254175A CN 106254175 A CN106254175 A CN 106254175A CN 201610596853 A CN201610596853 A CN 201610596853A CN 106254175 A CN106254175 A CN 106254175A
Authority
CN
China
Prior art keywords
node
cluster
similarity
anomaly
performance indications
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610596853.5A
Other languages
English (en)
Inventor
阮松松
吴海珊
刘麒贇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Oneapm Communication Technology Co Ltd
Original Assignee
Beijing Oneapm Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Oneapm Communication Technology Co Ltd filed Critical Beijing Oneapm Communication Technology Co Ltd
Priority to CN201610596853.5A priority Critical patent/CN106254175A/zh
Publication of CN106254175A publication Critical patent/CN106254175A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1042Peer-to-peer [P2P] networks using topology management mechanisms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种集群异常节点检测方法,包括:获取集群中每一个节点的性能数据;根据所述性能数据确定集群中的每一对节点的相似性;根据每一对节点的相似性将集群中的节点划分为多个节点类,并将所包括的节点数目最多的节点类确定为最大节点类;当最大节点类中的节点数目大于等于集群所包括的节点数目的一半时,将不属于最大节点类的节点判定为异常节点。本发明还公开了能够实施上述方法的集群异常节点检测应用,和包括上述应用的计算设备。

Description

一种集群异常节点检测方法、应用和计算设备
技术领域
本发明涉及集群性能监控技术领域,尤其涉及一种集群异常节点检测方法、应用和计算设备。
背景技术
集群是一组相互独立、通过高速网络互联的计算设备的集合,并以单一系统的模式加以管理,从外部看来像是一个独立的服务器。集群具有高可用性和高可扩展性,通常具有大量的设备节点。为了保证集群的正常、高效运行,集群中通常配置有适当的调度算法,以使集群实现负载均衡,集群的各节点平均地分摊处理各项负载任务,各节点的行为是高度一致的。
在正常情况下,集群中各节点均保持一致,当某些节点出现异常时,异常节点的行为将与大部分正常节点不同,因此,可以将集群中与大部分节点的行为不一致的节点判定为异常节点。在现有的集群异常节点检测方法中,首先获取集群中各节点的性能数据,然后求取性能数据的中位数,将距中位数的距离大于一定阈值的节点判定为异常节点。该方法虽然计算简便,但不同的阈值将得出不同的异常检测结果,对于阈值的设定缺少系统的方法,导致该方法受人为因素的干扰较大,往往准确性不高。
发明内容
为此,本发明提供一种集群异常节点检测方法、应用和计算设备,以力图解决或至少缓解上面存在的问题。
根据本发明的一个方面,提供一种集群异常节点检测方法,包括:获取集群中每一个节点的性能数据;根据所述性能数据确定集群中的每一对节点的相似性;根据每一对节点的相似性将集群中的节点划分为多个节点类,并将所包括的节点数目最多的节点类确定为最大节点类;当最大节点类中的节点数目大于等于集群所包括的节点数目的一半时,将不属于最大节点类的节点判定为异常节点。
可选地,在根据本发明的集群异常节点检测方法中,在获取集群中每一个节点的性能数据的步骤后,还包括:将性能数据进行归一化处理。
可选地,在根据本发明的集群异常节点检测方法中,性能数据包括固定数量的一个或多个性能指标,一对节点的相似性按照以下步骤确定:分别确定该对节点的各性能指标的相似性;当相似的性能指标的数目大于等于预设的阈值时,将该对节点判定为相似。
可选地,在根据本发明的集群异常节点检测方法中,固定数量为6,预设的阈值为3。
可选地,在根据本发明的集群异常节点检测方法中,性能指标的相似性按照如下步骤确定:采用KS检验算法确定性能指标的相似度;当相似度大于相似度阈值时,将性能指标判定为相似。
可选地,在根据本发明的集群异常节点检测方法中,采用KS检验算法确定性能指标的相似度的步骤包括:分别计算该对节点的该性能指标的累积分布函数F1(x)和F2(x);按照以下公式计算相似度
D=max(F1(xj)-F2(xj))
其中,D表示相似度,xj为F1(x)曲线和F2(x)曲线对应的横坐标上的任意一点。
可选地,在根据本发明的集群异常节点检测方法中,根据每一对节点的相似性将集群中的节点划分为多个节点类,并将所包括的节点数目最多的节点类确定为最大节点类的步骤包括:以集群中的节点为点建立网络图;在每一对相似的节点之间建立一条边;确定所述网络图的最大连通子图,所述最大连通子图即为最大节点类。
根据本发明的一个方面,提供一种集群异常节点检测应用,包括:数据获取模块,适于获取集群中每一个节点的性能数据;相似性分析模块,适于根据所述性能数据确定集群中的每一对节点的相似性;节点类划分模块,适于根据每一对节点的相似性将集群中的节点划分为多个节点类,并将所包括的节点数目最多的节点类确定为最大节点类;异常判定模块,适于判断最大节点类中的节点数目是否大于等于集群所包括的节点数目的一半,若是,则将不属于最大节点类的节点判定为异常节点。
可选地,在根据本发明的集群异常节点检测分析应用中,还包括数据预处理模块,适于将性能数据进行归一化处理。
可选地,在根据本发明的集群异常节点检测分析应用中,性能数据包括固定数量的一个或多个性能指标,所述相似性分析模块适于按照以下步骤确定一对节点的相似性:分别确定该对节点的各性能指标的相似性;当相似的性能指标的数目大于等于预设的阈值时,将该对节点判定为相似。
可选地,在根据本发明的集群异常节点检测分析应用中,固定数量为6,预设的阈值为3。
可选地,在根据本发明的集群异常节点检测分析应用中,相似性分析模块适于按照以下步骤确定性能指标的相似性:采用KS检验算法确定性能指标的相似度;当相似度大于相似度阈值时,将性能指标判定为相似。
可选地,在根据本发明的集群异常节点检测分析应用中,相似性分析模块适于按照以下步骤确定性能指标的相似度:分别计算该对节点的该性能指标的累积分布函数F1(x)和F2(x);按照以下公式计算相似度
D=max(F1(xj)-F2(xj))
其中,D表示相似度,xj为F1(x)曲线和F2(x)曲线对应的横坐标上的任意一点。
可选地,在根据本发明的集群异常节点检测分析应用中,节点类划分模块进一步适于按照以下步骤确定最大节点类:以集群中的节点为点建立网络图;在每一对相似的节点之间建立一条边;确定所述网络图的最大连通子图,所述最大连通子图即为最大节点类。
根据本发明的一个方面,提供一种计算设备,包括如上所述的集群异常节点检测应用。
根据本发明的技术方案,对于集群中的节点,两两进行相似性分析,根据每对节点的相似性将集群中的节点划分为多个节点类,并将节点数目最多的节点类作为最大节点类。若最大节点类中的节点数目大于等于集群所包括的节点数目的一半,则将最大节点类中的节点判定为正常节点,将不属于最大节点类的节点判定为异常节点。
本发明在判定两个节点是否相似时,综合考虑了多个性能指标,避免了仅由单一性能指标来确定节点相似性的片面性,提高了异常检测的准确性。此外,在确定性能指标的相似性时,采用了KS检验算法,无需像传统的基于中位数偏离的检测方法一样设置阈值,降低了人为因素对于异常检测结果的影响,准确度较高。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的集群100的示意图;
图2示出了根据本发明一个实施例的集群异常节点检测应用200的结构图;
图3A和图3B示出了根据本发明两个实施例的节点类划分和异常节点判定的示意图;以及
图4示出了根据本发明一个实施例的集群异常节点检测方法400的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的集群100的示意图。如图1所示,集群100包括多个计算设备110-160,每个计算设备均为集群中的一个节点。计算设备110-160可以是服务器、工作站、桌面电脑、笔记本电脑等,但不限于此。集群100中的一个或多个节点中部署有资源调度应用,适于对集群中的节点进行资源调度管理,以实现各节点的负载均衡。
计算设备160中驻留有集群异常节点检测应用200和性能数据采集器300。性能数据采集器300适于采集集群100的性能数据。性能数据中包括固定数量的一个或多个性能指标,性能指标例如可以是CPU利用率、内存使用量、任务吞吐量、任务响应时间、某个Web事务的调用次数、垃圾回收频率等,但不限于此。性能数据为各性能指标在不同时刻的观测值,每个性能指标均对应于一个由多个观测值构成的时间序列。
根据一种实施例,固定数量为6,即性能数据采集器300适于采集集群100中每个节点的6个性能指标数据,这6个性能指标可以是同一类型,也可以是不同类型。例如,性能数据可以包括针对于某个Web事务的调用次数、平均响应时间、平均执行时间、最大响应时间、最小响应时间和响应时间的方差这6个同一类型的性能指标,也可以包括CPU利用率、内存使用量、磁盘剩余空间、任务吞吐量、任务响应时间和垃圾回收频率这6个不同类型的指标,本发明对性能数据中所包括的性能指标的具体项目不做限制。此外,尽管在上述实施例中将性能数据所包括的性能指标的固定数量设为6,在其他的实施例中,也可以将固定数量设为其他数值,本发明对固定数量的取值亦无限制。
集群异常节点检测应用200适于根据性能数据采集器300所采集到的性能数据来检测集群100中的异常节点。
需要说明的是,尽管图1示出的驻留有集群异常节点检测应用200和性能数据采集器300的计算设备160是集群100的一个节点,但在其他的实施例中,计算设备160也可以设置于集群100之外。此外,集群异常节点检测应用200和性能数据采集器300也不局限于驻留于单个计算设备和同一个计算设备,例如,计算设备110上也可以部署有应用200和300,计算设备120中驻留有应用200,计算设备130中驻留有应用300。
图2示出了根据本发明一个实施例的集群异常节点检测应用200的结构图。如图2所示,集群异常节点检测应用200包括数据获取模块210、相似性分析模块220、节点类划分模块230和异常判定模块240。
数据获取模块210适于获取集群中每一个节点在预定时间段内的性能数据,性能数据中包括固定数量的一个或多个性能指标。例如,预定时间段为180分钟,固定数量为6,即,数据获取模块210可以获取6个性能指标在最近180分钟的观测值序列。根据一种实施例,数据获取模块210可以从性能数据采集器300处获取性能数据。
根据一种实施例,为了方便后续的异常节点检测过程,由数据预处理模块250(图2中未示出)对数据获取模块210获取到的性能数据进行归一化处理。归一化处理指的是将原本不具有可比性的性能指标处理成具有可比性的性能指标。例如,对于CPU利用率这一性能指标,节点1的CPU利用率为60%,节点2的CPU利用率为80%,但我们并不能简单地认为节点1的CPU利用率优于节点2,因为可能节点1占用60%的CPU资源处理了2000个请求,而节点2占用了80%的CPU资源处理了5000个请求,这时,节点2处理每个请求所消耗的CPU资源小于节点1,因此,虽然单从CPU利用率的数据上显示节点1优于节点2,而实际上节点2的性能却是优于节点1的。为了消除上述数据与结果不一致的情况,需要对CPU利用率进行归一化处理,处理办法是将CPU利用率除以吞吐量。除了CPU利用率,调用次数、平均响应时间、平均执行时间、最大响应时间、最小响应时间等性能指标也需要除以吞吐量,以保证异常节点检测结果的准确性。
在数据获取模块210获取了性能数据并由数据预处理模块250对性能数据执行归一化处理之后,相似性分析模块220根据性能数据来确定集群中每一对节点的相似性。例如,对于有1、2、3、4四个节点的集群,需要分别确定1和2、1和3、1和4、2和3、2和4、3和4的相似性。
当性能数据中仅包括一个性能指标时,相似性分析模块220在确定某一对节点的相似性时,首先计算该对节点的该性能指标的相似性,然后将该性能指标的相似性作为该对节点的相似性。此时,性能指标的相似性与节点的相似性是一致的,若某对节点的性能指标相似,则该对节点就相似。
性能数据包括固定数量的多个性能指标时,相似性分析模块220在确定某一对节点的相似性时,要综合考虑该对节点的多个性能指标的相似性。
根据一种实施例,相似性分析模块220采用KS检验算法来确定性能指标的相似性。确定性能指标的相似性的具体步骤为:分别计算某对节点的某个性能指标的累计分布函数F1(x)和F2(x),随后,按照以下公式计算相似度
D=max(F1(xj)-F2(xj)) (1)
其中,D表示相似度,xj为F1(x)曲线和F2(x)曲线对应的横坐标上的任意一点。若相似度D大于相似度阈值,则将该性能指标判定为相似;否则,将该性能指标判定为不相似。相似度阈值一般取一个比较小的数,例如,10^(-10)。
例如,对于节点1和节点2的CPU利用率这一性能指标,数据获取模块210获取节点1和节点2的CPU利用率的观测值序列y1、y2后,相似性分析模块220根据序列y1、y2分别计算节点1和节点2的CPU利用率的累积分布函数F1(x)和F2(x)。随后,按照公式(1)计算相似度D,若D>10^(-10),则相似性分析模块220判定节点1和节点2的CPU利用率相似;若D≤10^(-10),则判定节点1和节点2的CPU利用率不相似。
在确定了各性能指标的相似性后,相似性分析模块220根据各性能指标的相似性来确定节点的相似性。根据一种实施例,当相似的性能指标的数目大于等于预设的阈值时,相似性分析模块220将一对节点判定为相似。例如,性能数据中包括6个性能指标(即固定数量为6),预设的阈值为3,若这6个性能指标中至少有3个性能指标相似,则判定该对节点相似;若相似的性能指标的数目小于3,则判定该对节点不相似。应当指出,上述固定数量和预设的阈值的取值仅是示例性的,用户可以自行设置二者的取值。
在相似性分析模块220确定了集群中每一对节点的相似性后,节点类划分模块230根据每一对节点的相似性将集群中的节点划分为多个节点类,并将所包括的节点数目最多的节点类确定为最大节点类。根据一种实施例,节点类划分模块230采用图论的思想来划分节点类,并确定最大节点类。将集群看作一个网络图,集群中的节点即为网络图中的点,根据集群中节点的相似性来确定网络图中的边,若某一对节点相似,则在该对节点之间建立一条边。在将集群问题映射为网络图之后,求取最大节点类的问题即转化为求取网络图的最大连通子图的问题。节点类划分模块230可以计算出网络图的所有连通子图,相应地,也确定了最大连通子图(节点数目最多的连通子图即为最大连通子图)。网络图的最大连通子图即对应于集群的最大节点类。当然,在其他实施例中,节点类划分模块230也可以采用其他算法对集群进行节点类划分并确定最大节点类,本发明对实现节点类划分的具体算法不做限制。
节点类划分模块230确定了最大节点类后,异常判定模块240判断最大节点类中的节点数目是否大于等于集群所包括的节点数目的一半,若是,则将最大节点类中的节点判定为正常节点,将不属于最大节点类的节点判定为异常节点;若否,则认为本次异常节点检测失败,抛弃本次检测结果,并自动执行下一次异常节点检测(或由用户指定是否进行下一次异常节点检测)。
图3A和图3B示出了根据本发明两个实施例的节点类划分和异常节点判定的示意图。如图3A所示,集群中包括1-7七个节点。经过相似性分析模块220的分析,节点1和2相似,1和4相似,2和4相似,2和5相似,3和6相似。节点类划分模块230根据各节点的相似性将集群中的节点划分为3个节点类,第一个节点类包括1、2、4、5四个节点,第二个节点类包括3、6两个节点,第三个节点类仅包括节点7一个节点。第一个节点类中的节点数目最多,即第一个节点类为最大节点类。由于最大节点类中的节点数目为4,大于集群节点数目的一半,因此,异常判定模块240将不属于最大节点类的节点3、6、7均判定为异常节点。
图3B所示的集群中包括1-7七个节点。经过分析,1和2相似,1和4相似,2和4相似,3和6相似,5和7相似。根据各节点的相似性,集群中的节点被划分为3个节点类,第一个节点类包括1、2、4三个节点,第二个节点类包括3、6两个节点,第三个节点类包括5、7两个节点。第一个节点类中的节点数目最多,因此,第一个节点类为最大节点类。由于最大节点类中仅有3个节点,未达到集群节点数目的一半,因此,本次异常节点检测失败,抛弃本次检测结果,并自动执行下一次异常节点检测(或由用户指定是否进行下一次异常节点检测)。
图4示出了根据本发明一个实施例的集群异常节点检测方法400的流程图。如图4所示,该方法始于步骤S410。
在步骤S410中,获取集群中每一个节点的性能数据。根据一种实施例,
根据一种实施例,性能数据中包括固定数量的一个或多个性能指标。固定数量的取值会对异常检测结果的效率和准确性有一定的影响,当固定数量的取值较小时,异常检测消耗的时间、空间资源较少,但是准确性会有所欠缺;当固定数量的取值较大时,异常检测消耗的资源较多,准确性更好。用户可以根据需要自行设置固定数量的取值。
根据一种实施例,在步骤S410之后,执行步骤S450(图4中未示出)。在步骤S450中,对获取到的性能数据进行归一化处理。归一化处理的过程可以参考前述对数据预处理模块250的描述,此处不再赘述。在步骤S450后,执行步骤S420。
在步骤S420中,根据性能数据确定集群中的每一对节点的相似性。
根据一种实施例,某对节点的相似性根据该对节点的各性能指标的相似性来确定。当性能数据中仅包括一个性能指标时,性能指标的相似性与节点的相似性是一致的,即,若某对节点的性能指标相似,则该对节点就相似。当性能数据包括固定数量的多个性能指标时,若相似的性能指标的数目大于等于预设的阈值,则判定该对节点相似。根据一种实施例,固定数量为6,预设的阈值为3。
根据一种实施例,性能指标的相似性采用KS检验算法来确定。分别计算一对节点的某个性能指标的累积分布函数F1(x)和F2(x),并按照公式(1)计算相似度D,若D大于相似度阈值,则将该性能指标判定为相似,否则,将该性能指标判定为不相似。相似度阈值一般取一个比较小的数,例如,10^(-10)。
随后,在步骤S430中,根据每一对节点的相似性将集群中的节点划分为多个节点类,并将所包括的节点数目最多的节点类确定为最大节点类。
根据一种实施例,以集群中的节点为点建立网络图,并在每一对相似的节点之间建立一条边。求解该网络图的最大连通子图,最大连通子图即对应于集群的最大节点类。当然,在其他实施例中,也可以采用其他算法对集群进行节点类划分并确定最大节点类,本发明对实现节点类划分的具体算法不做限制。
随后,在步骤S440中,当最大节点类中的节点数目大于等于集群所包括的节点数目的一半时,将不属于最大节点类的节点判定为异常节点。若最大节点类中的节点数目未达到集群节点数目的一半,则本次异常节点检测失败,抛弃本次检测结果,并自动执行下一次异常节点检测(或由用户指定是否进行下一次异常节点检测)。
据本发明的技术方案,对于集群中的节点,两两进行相似性分析,根据每对节点的相似性将集群中的节点划分为多个节点类,并将节点数目最多的节点类作为最大节点类。若最大节点类中的节点数目大于等于集群所包括的节点数目的一半,则将最大节点类中的节点判定为正常节点,将不属于最大节点类的节点判定为异常节点。
本发明在判定两个节点是否相似时,综合考虑了多个性能指标,避免了仅由单一性能指标来确定节点相似性的片面性,提高了异常检测的准确性。此外,在确定性能指标的相似性时,采用了KS检验算法,无需像传统的基于中位数偏离的检测方法一样设置阈值,降低了人为因素对于异常检测结果的影响,准确度较高。
A6:A5所述的集群异常节点检测方法,其中,采用KS检验算法确定性能指标的相似度的步骤包括:
分别计算该对节点的该性能指标的累积分布函数F1(x)和F2(x);
按照以下公式计算相似度
D=max(F1(xj)-F2(xj))
其中,D表示相似度,xj为F1(x)曲线和F2(x)曲线对应的横坐标上的任意一点。
A7:A1所述的集群异常节点检测方法,其中,根据每一对节点的相似性将集群中的节点划分为多个节点类,并将所包括的节点数目最多的节点类确定为最大节点类的步骤包括:
以集群中的节点为点建立网络图;
在每一对相似的节点之间建立一条边;
确定所述网络图的最大连通子图,所述最大连通子图即为最大节点类。
B12:B10所述的集群异常节点检测应用,其中,所述相似性分析模块适于按照以下步骤确定性能指标的相似性:
采用KS检验算法确定性能指标的相似度;
当相似度大于相似度阈值时,将性能指标判定为相似。
B13:B12所述的集群异常节点检测应用,其中,所述相似性分析模块适于按照以下步骤确定性能指标的相似度:
分别计算该对节点的该性能指标的累积分布函数F1(x)和F2(x);
按照以下公式计算相似度
D=max(F1(xj)-F2(xj))
其中,D表示相似度,xj为F1(x)曲线和F2(x)曲线对应的横坐标上的任意一点。
B14:B8所述的集群异常节点检测应用,其中,所述节点类划分模块进一步适于按照以下步骤确定最大节点类:
以集群中的节点为点建立网络图;
在每一对相似的节点之间建立一条边;
确定所述网络图的最大连通子图,所述最大连通子图即为最大节点类。
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种集群异常节点检测方法,包括:
获取集群中每一个节点的性能数据;
根据所述性能数据确定集群中的每一对节点的相似性;
根据每一对节点的相似性将集群中的节点划分为多个节点类,并将所包括的节点数目最多的节点类确定为最大节点类;
当最大节点类中的节点数目大于等于集群所包括的节点数目的一半时,将不属于最大节点类的节点判定为异常节点。
2.如权利要求1所述的集群异常节点检测方法,其中,在所述获取集群中每一个节点的性能数据的步骤后,还包括:将所述性能数据进行归一化处理。
3.如权利要求1所述的集群异常节点检测方法,其中,所述性能数据包括固定数量的一个或多个性能指标,一对节点的相似性按照以下步骤确定:
分别确定该对节点的各性能指标的相似性;
当相似的性能指标的数目大于等于预设的阈值时,将该对节点判定为相似。
4.如权利要求3所述的集群异常节点检测方法,其中,所述固定数量为6,所述预设的阈值为3。
5.如权利要求3所述的集群异常节点检测方法,其中,性能指标的相似性按照如下步骤确定:
采用KS检验算法确定性能指标的相似度;
当相似度大于相似度阈值时,将性能指标判定为相似。
6.一种集群异常节点检测应用,包括:
数据获取模块,适于获取集群中每一个节点的性能数据;
相似性分析模块,适于根据所述性能数据确定集群中的每一对节点的相似性;
节点类划分模块,适于根据每一对节点的相似性将集群中的节点划分为多个节点类,并将所包括的节点数目最多的节点类确定为最大节点类;
异常判定模块,适于判断最大节点类中的节点数目是否大于等于集群所包括的节点数目的一半,若是,则将不属于最大节点类的节点判定为异常节点。
7.如权利要求6所述的集群异常节点检测应用,其中,还包括数据预处理模块,适于将所述性能数据进行归一化处理。
8.如权利要求6所述的集群异常节点检测应用,其中,所述性能数据包括固定数量的一个或多个性能指标,所述相似性分析模块适于按照以下步骤确定一对节点的相似性:
分别确定该对节点的各性能指标的相似性;
当相似的性能指标的数目大于等于预设的阈值时,将该对节点判定为相似。
9.如权利要求8所述的集群异常节点检测应用,其中,所述固定数量为6,所述预设的阈值为3。
10.一种计算设备,包括如权利要求6-9中任一项所述的集群异常节点检测应用。
CN201610596853.5A 2016-07-26 2016-07-26 一种集群异常节点检测方法、应用和计算设备 Pending CN106254175A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610596853.5A CN106254175A (zh) 2016-07-26 2016-07-26 一种集群异常节点检测方法、应用和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610596853.5A CN106254175A (zh) 2016-07-26 2016-07-26 一种集群异常节点检测方法、应用和计算设备

Publications (1)

Publication Number Publication Date
CN106254175A true CN106254175A (zh) 2016-12-21

Family

ID=57604757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610596853.5A Pending CN106254175A (zh) 2016-07-26 2016-07-26 一种集群异常节点检测方法、应用和计算设备

Country Status (1)

Country Link
CN (1) CN106254175A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106817700A (zh) * 2017-03-02 2017-06-09 中国人民解放军信息工程大学 基于多重完整性远程证明的异常节点检测方法
CN106850346A (zh) * 2017-01-23 2017-06-13 北京京东金融科技控股有限公司 用于监控节点变化及辅助识别黑名单的方法、装置及电子设备
CN108710540A (zh) * 2018-05-23 2018-10-26 深信服网络科技(深圳)有限公司 一种分布式集群中的资源调度方法、装置及设备
CN109844749A (zh) * 2018-08-29 2019-06-04 区链通网络有限公司 一种基于图算法的节点异常检测方法、装置及存储装置
CN110019978A (zh) * 2017-11-17 2019-07-16 阿里巴巴集团控股有限公司 一种数据处理方法及装置
CN110403582A (zh) * 2019-07-23 2019-11-05 宏人仁医医疗器械设备(东莞)有限公司 一种用于分析脉波波形品质的方法
CN111401959A (zh) * 2020-03-18 2020-07-10 多点(深圳)数字科技有限公司 风险群体的预测方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070015197A1 (en) * 2000-07-31 2007-01-18 The Government of the U.S.A as represented by the Secretary of the Dept. of Health & Human Services Specific binding agents for KSHV vIL-6 that neutralize a biological activity
CN102075941A (zh) * 2009-11-25 2011-05-25 中国移动通信集团北京有限公司 基站优化的实现方法和装置
CN102664961A (zh) * 2012-05-04 2012-09-12 北京邮电大学 MapReduce环境下的异常检测方法
CN103414711A (zh) * 2013-08-05 2013-11-27 哈尔滨工业大学 基于信任的网络群体异常感知方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070015197A1 (en) * 2000-07-31 2007-01-18 The Government of the U.S.A as represented by the Secretary of the Dept. of Health & Human Services Specific binding agents for KSHV vIL-6 that neutralize a biological activity
CN102075941A (zh) * 2009-11-25 2011-05-25 中国移动通信集团北京有限公司 基站优化的实现方法和装置
CN102664961A (zh) * 2012-05-04 2012-09-12 北京邮电大学 MapReduce环境下的异常检测方法
CN103414711A (zh) * 2013-08-05 2013-11-27 哈尔滨工业大学 基于信任的网络群体异常感知方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
柯登峰等: "基于KS同分布检验的基频归一化算法评估", 《第八届中国语音学学术会议暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106850346A (zh) * 2017-01-23 2017-06-13 北京京东金融科技控股有限公司 用于监控节点变化及辅助识别黑名单的方法、装置及电子设备
CN106850346B (zh) * 2017-01-23 2020-02-07 北京京东金融科技控股有限公司 用于监控节点变化及辅助识别黑名单的方法、装置及电子设备
CN106817700B (zh) * 2017-03-02 2019-06-28 中国人民解放军信息工程大学 基于多重完整性远程证明的异常节点检测方法
CN106817700A (zh) * 2017-03-02 2017-06-09 中国人民解放军信息工程大学 基于多重完整性远程证明的异常节点检测方法
CN110019978A (zh) * 2017-11-17 2019-07-16 阿里巴巴集团控股有限公司 一种数据处理方法及装置
CN108710540A (zh) * 2018-05-23 2018-10-26 深信服网络科技(深圳)有限公司 一种分布式集群中的资源调度方法、装置及设备
CN109844749B (zh) * 2018-08-29 2023-06-20 区链通网络有限公司 一种基于图算法的节点异常检测方法、装置及存储装置
CN109844749A (zh) * 2018-08-29 2019-06-04 区链通网络有限公司 一种基于图算法的节点异常检测方法、装置及存储装置
WO2020042024A1 (zh) * 2018-08-29 2020-03-05 区链通网络有限公司 一种基于图算法的节点异常检测方法、装置及存储装置
CN110403582A (zh) * 2019-07-23 2019-11-05 宏人仁医医疗器械设备(东莞)有限公司 一种用于分析脉波波形品质的方法
CN110403582B (zh) * 2019-07-23 2021-12-03 宏人仁医医疗器械设备(东莞)有限公司 一种用于分析脉波波形品质的方法
CN111401959A (zh) * 2020-03-18 2020-07-10 多点(深圳)数字科技有限公司 风险群体的预测方法、装置、计算机设备及存储介质
CN111401959B (zh) * 2020-03-18 2023-09-29 多点(深圳)数字科技有限公司 风险群体的预测方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN106254175A (zh) 一种集群异常节点检测方法、应用和计算设备
US8607018B2 (en) Memory usage configuration based on observations
CN108683530B (zh) 多维度数据的数据分析方法、装置及存储介质
EP2095236B1 (en) Method, system and computer program for testing software applications based on multiple data sources
US8572621B2 (en) Selection of server for relocation of application program based on largest number of algorithms with identical output using selected server resource criteria
WO2014074162A1 (en) Optimized settings in a configuration database with boundaries
CN102187327B (zh) 趋势确定和识别
WO2014074169A1 (en) Optimized memory configuration deployed on executing code
EP3267311B1 (en) System, controller, method, and program for executing simulation jobs
US10635765B2 (en) Cluster drawing on divided display region allocated to cluster
CN103150250B (zh) 应用程序性能检测系统和应用程序性能检测方法
US9471383B2 (en) Task allocation in a computing environment
CN112202617B (zh) 资源管理系统监控方法、装置、计算机设备和存储介质
JP2005135130A (ja) 負荷監視条件決定プログラム,負荷監視条件決定システム,負荷監視条件決定方法および負荷監視プログラム
KR20170084445A (ko) 시계열 데이터를 이용한 이상 감지 방법 및 그 장치
CN113158435B (zh) 基于集成学习的复杂系统仿真运行时间预测方法与设备
JP2010224754A (ja) リソース割当装置、リソース割当方法、及びプログラム
Fourati et al. Epma: Elastic platform for microservices-based applications: Towards optimal resource elasticity
US11113364B2 (en) Time series data analysis control method and analysis control device
US9665636B2 (en) Data partioning based on end user behavior
Chen et al. Towards resource-efficient cloud systems: Avoiding over-provisioning in demand-prediction based resource provisioning
WO2019153188A1 (en) Gpu power modeling using system performance data
WO2023154051A1 (en) Determining root causes of anomalies in services
US20180052728A1 (en) Root cause candidate determination in multiple process systems
Mdhaffar et al. CEP4CMA: multi-layer cloud performance monitoring and analysis via complex event processing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161221

RJ01 Rejection of invention patent application after publication