CN103428011A - 一种分布式系统中的节点状态探测方法、系统和装置 - Google Patents

一种分布式系统中的节点状态探测方法、系统和装置 Download PDF

Info

Publication number
CN103428011A
CN103428011A CN2012101512629A CN201210151262A CN103428011A CN 103428011 A CN103428011 A CN 103428011A CN 2012101512629 A CN2012101512629 A CN 2012101512629A CN 201210151262 A CN201210151262 A CN 201210151262A CN 103428011 A CN103428011 A CN 103428011A
Authority
CN
China
Prior art keywords
node
detection
detection element
response
tested
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101512629A
Other languages
English (en)
Other versions
CN103428011B (zh
Inventor
黄明生
曾波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Shenzhen Tencent Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Computer Systems Co Ltd filed Critical Shenzhen Tencent Computer Systems Co Ltd
Priority to CN201210151262.9A priority Critical patent/CN103428011B/zh
Priority to PCT/CN2013/074904 priority patent/WO2013170701A1/en
Publication of CN103428011A publication Critical patent/CN103428011A/zh
Priority to US14/290,555 priority patent/US9419872B2/en
Application granted granted Critical
Publication of CN103428011B publication Critical patent/CN103428011B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols

Abstract

本发明实施例公开了一种分布式系统中的节点状态探测方法、系统和装置。包括:按照探测序列中各个探测元素的排列顺序,向每个被测节点依次发送探测序列中的探测元素,根据接收到的被测节点返回的响应,计算在一时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值、以及在该时间段结束时每个被测节点最后返回的响应对应的探测元素与所述探测元素的平均值之间的差值;根据所述差值所在的差值范围,确定所述差值对应的被测节点的状态。应用本发明能够提高节点状态探测的准确性。

Description

一种分布式系统中的节点状态探测方法、系统和装置
技术领域
本发明涉及网络技术领域,尤其涉及一种分布式系统中的节点状态探测方法、系统和装置。
背景技术
分布式系统在当前网络中应用较为广泛,例如,内容传送网络(ContentDelivery Network,CDN)系统就是一种典型的分布式系统。分布式系统包括大量的网络节点,在实际应用中,常常需要监控分布式系统中的各个网络节点,从而及时发现状态异常的节点,即发现异常节点。其中,引起网络节点状态异常的常见原因有网络质量异常和节点进度状态异常。目前,常用的探测异常节点的方法主要有两种,其一是依据节点的网络质量探测异常节点,其二是依据节点的进度状态探测异常节点,下面分别进行介绍。
当各式各样的数据在网络介质中通过TCP/IP等网络协议进行传输时,如果信息量过大,则超额的网络流量将导致网络节点设备的处理速度变慢,进而产生网络时延。因此,衡量网络质量的一个典型指标是网络时延。
目前,依据网络质量探测分布式系统中的异常节点的典型方法为:向被测网络节点发送因特网控制报文协议(Internet Control Message Protocol,ICMP)数据包,根据被测节点针对该ICMP数据包的返回信息,例如网络时延,探测出节点的网络质量,进而可以发现异常节点。
具体地,目前预先设置固定的网络时延阈值,通过向被测网络节点发送ICMP数据包,获得被测节点的网络时延,将该网络时延与预设的阈值进行比较,当小于该阈值时,判定被测节点为正常节点,当大于或等于该阈值时,判定被测节点为异常节点。
由上述方案可见,通过发送ICMP数据包并预先设置固定的网络时延阈值,来探测分布式系统中的异常节点的方法,存在以下的不足:
现有技术中预先设置的阈值是固定的,不能适应网络情况的变化,因此,当由于整个网络的数据传输量过大等并非网络节点本身的问题,而导致网络时延增加时,将导致探测异常节点的准确性降低。
例如,当前有1000个节点,在某一时刻,有999台节点的网络时延是10ms,最后一台节点X的网络时延是1s。如果预先设置的检测阀值是1s,则这时会上报最后一台节点X异常,此时的检测结果是正常的。
但是,如果有999台节点因为某种末知的原因,例如整个网络的数据传输量过大等,其网络时延都达到了1s,最后一台节点X的网络时延达到了10s,则会上报这1000节点均异常的告警,显然,这种检测结果并没有将网络质量较差的真正异常节点X检测出来。
因此,目前通过设置固定阈值来探测异常节点的方法,无法探测出被测节点在当前网络状态下相对于其他网络节点是否异常,异常节点探测的准确性较低。
另外,在分布式系统中,常常会存在数据的分发路径被约束的情况,例如,数据从源节点A发送到目标节点C的过程中,虽然从节点A到节点C存在多条路径,但是从源节点A发出的数据只能从其中的一条专门路径到达节点C,而按照目前的协议,ICMP数据包不会受到路径约束,也就是说,ICMP数据包可能采用与数据传输路径不同的另一路径达到节点C,由于ICMP所采用的路径与数据传输路径不同,因此,采用发送ICMP数据包的方法测得的网络时延,也不能真实地反映数据传输时的网络时延,因而异常节点的探测结果也不够准确。
衡量节点状态的另一个典型指标是节点处理数据的进度状态,因此,也可以通过节点处理数据的进度状态检测异常节点。目前,通过获取节点的CPU使用率等指标,利用这些指标的值来推断节点的进度状态是否正常,进而推断节点是否是异常节点。然而,获得节点的CPU使用率等指标,又存在着较多的系统调用和运算开销,因此提高了检测成本。
发明内容
有鉴于此,本发明提供了一种分布式系统中的节点状态探测方法、系统和装置,以便提高节点状态探测的准确性。
本发明的技术方案具体是这样实现的:
一种分布式系统中的节点状态探测方法,该方法包括:
按照探测序列中各个探测元素的排列顺序,向每个被测节点依次发送探测序列中的探测元素,接收被测节点在接收到该探测元素后返回的响应;
根据接收到的被测节点返回的响应,计算在一时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值、以及在该时间段结束时每个被测节点最后返回的响应对应的探测元素与所述探测元素的平均值之间的差值;
根据所述差值所在的差值范围,确定所述差值对应的被测节点的状态。
一种分布式系统中的节点状态探测系统,该系统包括探测装置和多个被测节点;
所述探测装置,用于按照探测序列中各个探测元素的排列顺序,向每个被测节点依次发送探测序列中的探测元素,接收被测节点在接收到该探测元素后返回的响应,根据接收到的被测节点返回的响应,计算在一时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值、以及在该时间段结束时每个被测节点最后返回的响应对应的探测元素与所述探测元素的平均值之间的差值,根据所述差值所在的差值范围,确定所述差值对应的被测节点的状态;
每个被测节点,用于接收所述探测装置发来的探测元素,并在接收到该探测元素后向所述探测装置返回响应。
一种分布式系统中的节点状态探测装置,该装置包括探测序列发送模块、响应接收模块、差值计算模块和节点状态判断模块;
所述探测序列发送模块,用于按照探测序列中各个探测元素的排列顺序,向每个被测节点依次发送探测序列中的探测元素;
所述响应接收模块,用于接收被测节点在接收到探测元素后返回的响应;
所述差值计算模块,用于根据所述响应接收模块接收到的响应,计算在一时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值、以及在该时间段结束时每个被测节点最后返回的响应对应的探测元素与所述探测元素的平均值之间的差值;
所述节点状态判断模块,用于根据所述差值所在的差值范围,确定所述差值对应的被测节点的状态。
由上述技术方案可见,本发明中,按照探测序列中各个探测元素的排列顺序,向每个被测节点依次发送探测序列中的探测元素,根据多个被测节点在接收到探测元素后返回的响应,计算在一时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值、以及在该时间段结束时每个被测节点最后返回的响应对应的探测元素与所述探测元素的平均值之间的差值,上述的平均值和差值都有其技术含义,基于其技术含义,可以根据所述差值所在的差值范围,确定所述差值对应的被测节点的状态。
其中,本发明中所指的某一节点的状态,是指该节点的节点质量相对于其他节点的节点质量而言,是否是异常状态,即是指节点质量的相对状态。如果某一节点的节点质量异常,则说明该节点的网络状态或处理能力等可能出现了问题。
具体地,上述的平均值和差值具有如下的技术含义:时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值,能够反映多个被测节点的平均质量,或者说,多个被测节点中大部分被测节点的质量,而所述差值,则能够反映单个被测节点与平均质量或者说大部分被测节点的质量之间的偏差,因此,通过该偏差所在的偏差范围,能够确定出被测节点的状态,例如确定出异常节点。
本发明中,所述差值是动态获得的,即需要根据在一时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值,以及在该时间段结束时单个被测节点最后返回的响应对应的探测元素值,来获得所述差值,因此,所述差值能够反映在当前的整体网络状况下,各个被测节点之间的质量差异,从而能够较为准确地测量出被测节点的相对状态,提高节点状态探测的准确性。
附图说明
图1是本发明提供的分布式系统中的节点状态探测方法流程图。
图2是本发明提供的探测实例的第一示意图。
图3是本发明提供的探测实例的第二示意图。
图4是本发明提供的探测实例的第三示意图。
图5是本发明提供的探测实例的第四示意图。
图6是本发明提供的分布式系统中的节点状态探测系统组成示意图。
图7是本发明提供的分布式系统中的节点状态探测装置结构图。
具体实施方式
本发明通过向多个被测节点发送探测序列,根据多个被测节点返回的响应情况,测量当前的整体网络状况,根据单个被测节点返回的响应情况与所述多个被测节点返回的响应情况之间的差别,测量该单个被测节点在当前整体网络状况下的相对状态,与现有技术中通过设置固定的阈值来探测异常节点相比,能够提高节点状态探测的准确性。
图1是本发明提供的分布式系统中的节点状态探测方法流程图。
如图1所示,该流程包括:
步骤101,按照探测序列中各个探测元素的排列顺序,向每个被测节点依次发送探测序列中的探测元素。
步骤102,接收被测节点在接收到该探测元素后返回的响应。
步骤103,根据接收到的被测节点返回的响应计算差值。
本步骤中,计算在一时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值、以及在该时间段结束时每个被测节点最后返回的响应对应的探测元素与所述探测元素的平均值之间的差值。
其中,所述差值能够反映单个被测节点在当前整体网络状况下的相对状态,例如,相对于其他大部分节点而言,该被测节点是否是异常节点。
步骤104,根据所述差值所在的差值范围,确定所述差值对应的被测节点的状态。
其中,不同的差值范围对应不同的节点状态。所述差值范围可以根据预设的用于划分节点状态的阈值确定。
其中,所述阈值的个数可以为1个,则可以计算所述差值的绝对值是否大于所述阈值,如果是,则判定所述差值对应的被测节点为异常节点,否则,则可以判定该被测节点不是异常节点。
可见,当仅设置1个阈值时,可以方便快捷地检测出异常节点。
所述阈值的个数也可以为2个以上,以便对节点的状态进行细化。当阈值的个数是2个以上时,判断异常节点的方法与阈值的个数为1个时类似,也是将差值的绝对值与阈值进行比较,根据比较结果确定异常节点的状态,此处不赘述。
本发明中所述的探测序列,可以是多种形式,例如,可以是步长恒定且有序的数字序列,例如等差数列(可以是步长恒定的递增数列,也可以是步长恒定的递减数列),也可以是步长恒定且有序的字母序列,例如由a-z这种字母组成的26进制序列。
其中,所述平均值可以是所述时间段结束时多个被测节点最后返回的响应对应的探测元素对应的序号的平均值,所述差值是在该时间段结束时每个被测节点最后返回的响应对应的探测元素对应的序号与所述平均值之间的差值。
为了便于计算差值,优选地,被测节点在收到探测元素后返回的响应就是该探测元素本身。
为了进一步简化差值的计算,进而加快节点网络质量的探测速度,优选地,可以采用起点为1、且步长为1的递增数列作为探测序列,被测节点在收到探测元素后返回的响应就是该探测元素本身,下面举具体的例子进行详细介绍,具体请参见图2~图5。
在图2-图5所示的例子中,假设在分布式系统中有服务器A和被测节点B、C、D。服务器A依次下发一个步长恒定且有序的数字(图2-图5所示的例子中,依次下发以1为起点且步长为1的递增数列中的数字)给被测节点B、C、D。如果在服务器A向给被测节点发送数字或接收被测节点返回的响应的过程中有问题,则可直接判断被测节点有异常,如果没有问题,则被测节点在收到服务器A发来的数字后,再直接将收到的数字回复给服务器A。服务器A只需要收集一段时间内最后从被测节点B、C、D收到的数字并取平均值,再分别将在这一段时间内收到的被测节点B、C、D最后返回的数字与该平均值相减,将相减所得结果取绝对值从而得到一个偏差。这个偏差表示了相应被测节点在当前网络状态下的相对状态,因此,利用这个偏差判断被测节点是否是异常节点,不会出现现有技术中根据固定的检测阈值判断异常节点时的误报情况。
图2是本发明提供的探测实例的第一示意图。
如图2所示,在该探测实例中,服务器A将以数字1起始、且步长为1的递增数列中的各个元素,依次向每个被测节点B、C、D发送。
图3是本发明提供的探测实例的第二示意图。
如图3所示,在该探测实例中,被测节点B、C、D在收到服务器A发来的数字后,需要直接将该数字返回给服务器A,由图3可见,这时的被测节点B、C完成了将数字1返回给服务器A的工作,但是被测节点D因为网络质量较差、或者处理能力有限等原因,导致没有及时将数字1回复给服务器A。
图4是本发明提供的探测实例的第三示意图。
如图4所示,在该探测实例中,服务器A已经将数字1-10都依次发给了被测节点B、C、D。
图5是本发明提供的探测实例的第四示意图。
如图5所示,这时的被测节点B、C完成了将数字10返回给服务器A的工作,但是被测节点D因为网络质量较差、或者处理能力有限等原因,刚刚将之前没有及时回复的数字1返回给服务器A。
在图2-图5的探测实例中,假设预设的阈值是5,则服务器A可以计算在图2-图5的时间段内,被测节点B、C、D最后返回的数字的平均值为(10+10+1)/3,即所述平均值为7,这时,将被测节点B、C、D最后返回的数字与所述平均值7相减,将所得结果取绝对值后在于阈值5进行判断,会得出以下两种情况:
对于被测节点B和C,有|10-7|<5,因此被测节点B和C的质量较好。
对于被测节点D,有|1-7|>5,因此被测节点D的质量较差,可以判定被测节点D为异常节点。
关于图2-图5所示探测实例,也可以归结出以下的探测公式:
假设在一段时间t内,有n个被测节点最后返回的数字分别为s1、s2…sn,则有平均值:average=(s1+s2+…+sn)/n。我们根据实际的节点情况可以设定一个阈值threshold,被测节点i在时间段t内最后返回的数字是si,则有:
当|si-average|<threshold时,表示被测节点i的质量较好。
当|si-average|>threshold时,表示被测节点i的质量较差,为异常节点。
也可以依据实际的节点情况设定多个阀值,比如,可以设置两个阈值:threshold0、threshold1且threshold0<threshold1,则有:
当|si-average|<threshold0时,表示被测节点i质量非常好。
当|si-average|>=threshold0&|si-average|<threshold1时,表示被测节点i质量一般。
当|sn-average|>=threshold1时,表示被测节点i质量不好。
依次类推可根据实际的需要设置多个阀值,此处不赘述。
另外,本发明所提供的技术方案可以在应用层实现,此时,根据在一时间段内最后向单个被测节点发送的探测元素、以及在该时间段结束时最后收到该单个被测节点返回的响应对应的探测元素,也可以较为准确地反映出该单个被测节点的进度状态。
例如,在图2-图5的探测实例中,也可以判断出被测节点D的进度状态不正常。
可见,本发明提供的探测方法能够根据当前被探测节点的整体质量状况与各个被探测节点的质量状况得出一个相对状态,而且,由于本发明是采用探测序列进行探测,该探测序列与普通的数据包所走的路径相同,而发送ICMP包的路径未必是实际的普通数据包所走的路径,因此,与发送ICMP数据包相比,能够提高探测准确性。另外,由于本发明提供的方案不需要获得节点的CPU使用率等指标,因此不需要系统调用,能够减少运算开销,从而降低了检测成本。
根据本发明提供的上述方法,本发明还提供了相应的系统和装置,具体请参见图6-图7。
图6是本发明提供的分布式系统中的节点状态探测系统组成示意图。
如图6所示,该系统包括探测装置601和多个被测节点602。
探测装置601,用于按照探测序列中各个探测元素的排列顺序,向每个被测节点602依次发送探测序列中的探测元素,接收被测节点602在接收到该探测元素后返回的响应,根据接收到的被测节点602返回的响应,计算在一时间段结束时多个被测节点602最后返回的响应对应的探测元素的平均值、以及在该时间段结束时每个被测节点602最后返回的响应对应的探测元素与所述探测元素的平均值之间的差值,根据所述差值所在的差值范围,确定所述差值对应的被测节点602的状态。
每个被测节点602,用于接收探测装置601发来的探测元素,并在接收到该探测元素后向探测装置601返回响应。
其中,不同的差值范围对应不同的节点状态。所述差值范围可以根据预设的用于划分节点状态的阈值确定。
图7是本发明提供的分布式系统中的节点网络质量探测装置结构图。
如图7所示,该装置包括探测序列发送模块701、响应接收模块702、差值计算模块703和状态判断模块704。
探测序列发送模块701,用于按照探测序列中各个探测元素的排列顺序,向每个被测节点依次发送探测序列中的探测元素。
响应接收模块702,用于接收被测节点在接收到探测元素后返回的响应。
差值计算模块703,用于根据响应接收模块702接收到的响应,计算在一时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值、以及在该时间段结束时每个被测节点最后返回的响应对应的探测元素与所述探测元素的平均值之间的差值。
状态判断模块704,用于根据所述差值所在的差值范围,确定所述差值对应的被测节点的状态。
其中,不同的差值范围对应不同的节点状态。所述差值范围可以根据预设的用于划分节点状态的阈值确定。
其中,所述阈值的个数是1个或2个以上。当所述阈值的个数是1个时,所述状态判断模块,用于计算所述差值的绝对值是否大于所述阈值,如果是,则判定所述差值对应的被测节点为异常节点。
所述探测序列是步长恒定且有序的序列。
所述探测序列具体可以为等差数列,例如具体可以是起点为1、且步长为1的递增数列。被测节点在接收到探测元素后返回的响应可以是该探测元素。
其中,所述平均值可以是所述时间段结束时多个被测节点最后返回的响应对应的探测元素对应的序号的平均值,所述差值是在该时间段结束时每个被测节点最后返回的响应对应的探测元素对应的序号与所述平均值之间的差值。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (13)

1.一种分布式系统中的节点状态探测方法,其特征在于,该方法包括:
按照探测序列中各个探测元素的排列顺序,向每个被测节点依次发送探测序列中的探测元素,接收被测节点在接收到该探测元素后返回的响应;
根据接收到的被测节点返回的响应,计算在一时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值、以及在该时间段结束时每个被测节点最后返回的响应对应的探测元素与所述探测元素的平均值之间的差值;
根据所述差值所在的差值范围,确定所述差值对应的被测节点的状态。
2.根据权利要求1所述的方法,其特征在于,不同的差值范围对应不同的节点状态,所述差值范围根据预设的用于划分节点状态的阈值确定。
3.根据权利要求1或2所述的方法,其特征在于,所述阈值的个数为1个或2个以上。
4.根据权利要求1所述的方法,其特征在于,所述探测序列为步长恒定且有序的序列。
5.根据权利要求4所述的方法,其特征在于,所述探测序列为等差数列,被测节点在接收到探测元素后返回的响应是该探测元素。
6.根据权利要求4所述的方法,其特征在于,所述平均值是该段时间结束时多个被测节点最后返回的响应对应的探测元素对应的序号的平均值,所述差值是在该时间段结束时每个被测节点最后返回的响应对应的探测元素对应的序号与所述平均值之间的差值。
7.一种分布式系统中的节点状态探测系统,其特征在于,该系统包括探测装置和多个被测节点;
所述探测装置,用于按照探测序列中各个探测元素的排列顺序,向每个被测节点依次发送探测序列中的探测元素,接收被测节点在接收到该探测元素后返回的响应,根据接收到的被测节点返回的响应,计算在一时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值、以及在该时间段结束时每个被测节点最后返回的响应对应的探测元素与所述探测元素的平均值之间的差值,根据所述差值所在的差值范围,确定所述差值对应的被测节点的状态;
每个被测节点,用于接收所述探测装置发来的探测元素,并在接收到该探测元素后向所述探测装置返回响应。
8.一种分布式系统中的节点状态探测装置,其特征在于,该装置包括探测序列发送模块、响应接收模块、差值计算模块和状态判断模块;
所述探测序列发送模块,用于按照探测序列中各个探测元素的排列顺序,向每个被测节点依次发送探测序列中的探测元素;
所述响应接收模块,用于接收被测节点在接收到探测元素后返回的响应;
所述差值计算模块,用于根据所述响应接收模块接收到的响应,计算在一时间段结束时多个被测节点最后返回的响应对应的探测元素的平均值、以及在该时间段结束时每个被测节点最后返回的响应对应的探测元素与所述探测元素的平均值之间的差值;
所述状态判断模块,用于根据所述差值所在的差值范围,确定所述差值对应的被测节点的状态。
9.根据权利要求8所述的装置,其特征在于,不同的差值范围对应不同的节点状态,所述差值范围根据预设的用于划分节点状态的阈值确定。
10.根据权利要求8或9所述的装置,其特征在于,所述阈值的个数是1个或2个以上。
11.根据权利要求8所述的装置,其特征在于,
所述探测序列为步长恒定且有序的序列。
12.根据权利要求11所述的装置,其特征在于,所述探测序列为等差数列,被测节点在接收到探测元素后返回的响应是该探测元素。
13.根据权利要求11所述的装置,其特征在于,所述平均值是该段时间结束时多个被测节点最后返回的响应对应的探测元素对应的序号的平均值,所述差值是在该时间段结束时每个被测节点最后返回的响应对应的探测元素对应的序号与所述平均值之间的差值。
CN201210151262.9A 2012-05-16 2012-05-16 一种分布式系统中的节点状态探测方法、系统和装置 Active CN103428011B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201210151262.9A CN103428011B (zh) 2012-05-16 2012-05-16 一种分布式系统中的节点状态探测方法、系统和装置
PCT/CN2013/074904 WO2013170701A1 (en) 2012-05-16 2013-04-27 Method, system, and apparatus for node status detection in distributed system
US14/290,555 US9419872B2 (en) 2012-05-16 2014-05-29 Method, system, and apparatus for node status detection in distributed system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210151262.9A CN103428011B (zh) 2012-05-16 2012-05-16 一种分布式系统中的节点状态探测方法、系统和装置

Publications (2)

Publication Number Publication Date
CN103428011A true CN103428011A (zh) 2013-12-04
CN103428011B CN103428011B (zh) 2016-03-09

Family

ID=49583111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210151262.9A Active CN103428011B (zh) 2012-05-16 2012-05-16 一种分布式系统中的节点状态探测方法、系统和装置

Country Status (3)

Country Link
US (1) US9419872B2 (zh)
CN (1) CN103428011B (zh)
WO (1) WO2013170701A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106533722A (zh) * 2015-09-11 2017-03-22 北京国双科技有限公司 网络监测方法和装置
CN109168092A (zh) * 2018-09-17 2019-01-08 深圳市网心科技有限公司 流媒体数据传输状态判定方法、节点、系统及存储介质
CN109688023A (zh) * 2018-12-04 2019-04-26 成都知道创宇信息技术有限公司 一种以anycast方式部署的CDN监控可用性的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101577626A (zh) * 2009-06-05 2009-11-11 西北工业大学 基于eMule的主动式特定信息传播监测方法
CN101764838A (zh) * 2009-12-30 2010-06-30 重庆大学 一种Email蠕虫检测方法
CN102025635A (zh) * 2010-12-16 2011-04-20 浪潮(北京)电子信息产业有限公司 一种工作在全双工模式下的网络流量控制方法及装置
US20110231545A1 (en) * 2008-12-02 2011-09-22 Nobuyuki Enomoto Communication network management system, method and program, and management computer

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5631935A (en) * 1993-05-06 1997-05-20 Run-Rad Unlimited Networking, Ltd. Method and apparatus for governing information transfer using an efficient transport protocol
GB2395856A (en) * 2002-11-26 2004-06-02 King S College London Method for reducing packet congestion at a network node
US7689686B2 (en) * 2003-05-30 2010-03-30 Microsoft Corporation Active probing for sustainable capacity estimation of networked dataflows
US7457868B1 (en) * 2003-12-30 2008-11-25 Emc Corporation Methods and apparatus for measuring network performance
US8345561B2 (en) * 2006-08-22 2013-01-01 Rueters America Inc. Time monitor
JP2009038444A (ja) * 2007-07-31 2009-02-19 Hitachi Kokusai Electric Inc ネットワークシステム、制御方法及びゲートウェイ装置
US8667126B2 (en) * 2010-12-03 2014-03-04 International Business Machines Corporation Dynamic rate heartbeating for inter-node status updating

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110231545A1 (en) * 2008-12-02 2011-09-22 Nobuyuki Enomoto Communication network management system, method and program, and management computer
CN101577626A (zh) * 2009-06-05 2009-11-11 西北工业大学 基于eMule的主动式特定信息传播监测方法
CN101764838A (zh) * 2009-12-30 2010-06-30 重庆大学 一种Email蠕虫检测方法
CN102025635A (zh) * 2010-12-16 2011-04-20 浪潮(北京)电子信息产业有限公司 一种工作在全双工模式下的网络流量控制方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106533722A (zh) * 2015-09-11 2017-03-22 北京国双科技有限公司 网络监测方法和装置
CN106533722B (zh) * 2015-09-11 2019-06-21 北京国双科技有限公司 网络监测方法和装置
CN109168092A (zh) * 2018-09-17 2019-01-08 深圳市网心科技有限公司 流媒体数据传输状态判定方法、节点、系统及存储介质
CN109688023A (zh) * 2018-12-04 2019-04-26 成都知道创宇信息技术有限公司 一种以anycast方式部署的CDN监控可用性的方法
CN109688023B (zh) * 2018-12-04 2021-10-12 成都知道创宇信息技术有限公司 一种以anycast方式部署的CDN监控可用性的方法

Also Published As

Publication number Publication date
US9419872B2 (en) 2016-08-16
US20140269346A1 (en) 2014-09-18
CN103428011B (zh) 2016-03-09
WO2013170701A1 (en) 2013-11-21

Similar Documents

Publication Publication Date Title
CN101926154B (zh) 帧丢失测定方法、系统以及装置
CN102215144B (zh) 丢包率的测量方法和系统
US8340022B2 (en) Wireless location determination system and method
CN103326893A (zh) 一种极限测速的方法
CN105281969A (zh) 一种统计信息获取方法及装置
CN104732799A (zh) 一种车位状态检测方法及装置
WO2015087751A1 (ja) 時刻補正装置、計測装置、時刻補正方法
CN101964727A (zh) 一种利用混合报文测量可用带宽的方法和装置
CN103428011A (zh) 一种分布式系统中的节点状态探测方法、系统和装置
CN105791144A (zh) 链路流量分担的方法和装置
CN105681124B (zh) 一种网速检测方法及装置
CN105353337B (zh) 一种基于云端计算的校表方法以及装置
CN101385292B (zh) 质量恶化部分估计装置、方法及程序
CN105021663A (zh) 一种盐度测量方法
CN101377440B (zh) 温度测量装置及其温度校验方法
CN104486786A (zh) 一种无线传感器网络的故障检测方法
CN112150851B (zh) 地磁检测器的测试方法和装置
CN107315826A (zh) 一种定位系统盲区动态检测方法
CN102843276A (zh) 一种分布式部署的网络时延采集方法
CN101106444B (zh) 数据传输电路中误码等级实时测试的方法
CN109840366A (zh) 一种市政桥梁状态检测装置
CN105388512A (zh) 一种地震数据采集勘探时间的校准方法和装置
CN107911259A (zh) 一种配电自动化终端通信状态诊断方法
CN114858250A (zh) 一种智慧水表的故障检测方法、系统及可读存储介质
CN110244253B (zh) 省级计量中心标准量传在线管控方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant