CN110198228A - 一种故障监控方法、装置、服务器及存储介质 - Google Patents

一种故障监控方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN110198228A
CN110198228A CN201810326953.5A CN201810326953A CN110198228A CN 110198228 A CN110198228 A CN 110198228A CN 201810326953 A CN201810326953 A CN 201810326953A CN 110198228 A CN110198228 A CN 110198228A
Authority
CN
China
Prior art keywords
data packet
packet amount
real
time
network node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810326953.5A
Other languages
English (en)
Inventor
何维兵
候贝
杨建新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810326953.5A priority Critical patent/CN110198228A/zh
Publication of CN110198228A publication Critical patent/CN110198228A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种故障监控方法、装置、服务器及存储介质,所述方法包括:获取网络节点端口实时的输入/输出数据包量,确定网络节点端口的输入数据包量与输出数据包量之间实时差异量;监测所述实时差异量是否大于等于预设阈值,当监测的结果为是时,确定所述网络节点发生故障。本发明能够快速全面的发现网络节点的故障,避免了现有故障监控方法存在的故障监控盲区、故障定位效率低等问题,大大提升了故障定位处理效率。

Description

一种故障监控方法、装置、服务器及存储介质
技术领域
本发明涉及互联网通信技术领域,尤其涉及一种故障监控方法、装置、服务器及存储介质。
背景技术
随着计算机和互联网技术的快速发展,人们的日常生活对数据通信网络的依赖程度越来越高,网络通信出现故障造成影响的严重性日渐增强,这种影响会随着故障持续时间的增加而增加。因此,出现网络通信故障时,能快速准确的定位网络故障,进而可以排除网络故障,日渐成为网络设备用户关注的焦点。
目前,比较常用的故障监控方法是基于系统日志的事件上报机制。具体的,在网络系统中的路由器、交换机等设备的系统日志(System Log)可以记录设备系统中任何时间发生的大小事件。在进行故障监控处理时,可以对设备系统的事件的系统日志信息进行监控,当监控到系统日志信息与预设的故障日志信息相匹配时,可以基于该故障日志信息定位出相应的故障事件。但上述现有的故障监控方法中,故障日志信息依赖于网络设备厂商对其各个协议进程、功能组件的故障事件的明确识别,以及对应系统日志信息的准确定义;对于已经明确定义且能上报系统日志信息的故障事件,能及时发现;但是对于未曾识别的事件,则无法及时发现。因此,需要提供更可靠或更有效的方案,以便更快速全面的发现设备系统中的故障事件。
发明内容
为了解决现有技术应用在对网络系统设备进行故障监控中存在的故障监控盲区、故障定位效率低等问题,本发明提供了一种故障监控方法、装置、服务器及存储介质:
第一方面,本发明提供了一种故障监控方法,所述方法包括:
获取网络节点端口实时的出入数据包量,所述出入数据包量包括输入数据包量和输出数据包量;
确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量;
监测所述实时差异量是否大于等于预设阈值,当监测的结果为是时,确定所述网络节点发生故障。
第二方面提供了一种故障监控装置,所述装置包括:
出入数据包量获取模块,用于获取网络节点端口实时的出入数据包量,所述出入数据包量包括输入数据包量和输出数据包量;
实时差异量确定模块,用于确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量;
第一监测模块,用于监测所述实时差异量是否大于等于预设阈值;
第一故障确定模块,用于当所述第一监测模块监测的结果为是时,确定所述网络节点发生故障。
第三方面提供了一种故障监控服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的故障监控方法。
第四方面提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如第一方面所述的故障监控方法。
本发明提供的故障监控方法、装置、服务器及存储介质,具有如下技术效果:
本发明能够及时全面的发现网络节点的故障情况,无需关注具体的故障事件、日志信息,直接聚焦于网络节点整体功能运营是否正常,可以避免了有故障监控方法存在的故障监控盲区、故障定位效率低等问题,大大提升了故障定位处理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明实施例提供的一种应用环境的示意图;
图2是本发明实施例提供的一种网络节点端口输入/输出数据包量统计示例的示意图;
图3是本发明实施例提供的一种故障监控方法的流程示意图;
图4是本发明实施例提供的获取网络节点端口实时的出入数据包量的一种流程示意图;
图5是本发明实施例提供的确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量的一种流程示意图;
图6是本发明实施例提供的确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量的另一种流程示意图;
图7是本发明实施例提供的确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量的另一种流程示意图;
图8是本发明实施例提供的另一种故障监控方法的流程示意图;
图9是本发明实施例提供的一种故障监控装置的结构示意图;
图10是本发明实施例提供的出入数据包量获取模块的一种组成框图;
图11是本发明实施例提供的实时差异量确定模块的一种组成框图;
图12是本发明实施例提供的实时差异量确定模块的另一种组成框图;
图13是本发明实施例提供的实时差异量确定模块的另一种组成框图;
图14是本发明实施例提供的另一种故障监控装置的结构示意图;
图15是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参阅图1,图1是本发明实施例提供的一种应用环境的示意图,如图1所示,该应用环境至少包括网络节点01和网络节点02两个网络节点。
具体的,网络节点01和网络节点02可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备等类型的实体设备,也可以包括运行于实体设备中的软体,例如虚拟机等。本发明实施例中网络节点上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、windows等。
在实际应用中,网络节点01和网络节点02之间可以进行通信,网络节点 01和网络节点02之间需要先建立网络连接。在网络连接建立过程中和网络连接建立之后,网络节点之间可以进行数据交互,且网络节点之间的数据交互往往是以相互发送数据包的形式,一般的,数据包是通过网络节点上的端口进行传输的,且网络节点可以包括一个或多个端口。
具体的,图1中,假设网络节点01为源网络节点,且网络节点01是台式电脑客户端;网络节点02为目的网络节点,且网络节点02是服务器。在网节节点01向网络节点02发送数据包的过程中,网络节点01和网络节点02之间通过路由协议互通,网络中每一网络节点的端口都将根据相应的传输规则接收上游发给它的数据包,并将数据包从一个出端口发送给其下游的网络节点的端口,直至将源网络节点的数据包发送至目的网络节点。
需要说明的是,图1仅仅是一种示例,本发明实施例中源网络节点(网络节点01)与目的网络节点(网络节点02)之间的中转网络节点并不仅限于图1 中所示,还可以包括多个中转网络节点,且中转网络节点也并不仅限于图1中的交换机的形式。
一般的,在三层网络环境下,数据包的传输常常是采用单播的形式,即,在网络节点的系统正常运行下,有数据包从网络节点的一个端口输入,就会有数据包从该网络节点的另一端口输出。因此,从网络节点的端口输入的数据包量和输出的数据包量基本相等;反之,在网络节点的系统出现故障的情况下,从网络节点的端口的输入数据包量和的输出数据包量存在较大差异;且对于三层单播模式的网络环境下,网络节点的系统出现故障时,从网络节点的端口的输入数据包量会大于的输出数据包量。基于此,如图2所示,本发明实施例中可以将网络节点各个端口的输入/输出数据包量统计后,作为该网络节点的输入/ 输出数据包量,并基于对网络节点的输入数据包量和的输出数据包量之间的比较来监控当前的网络节点是否出现故障。
以下介绍本发明在网络环境中对网络节点的故障监控方法,图3是本发明实施例提供的一种故障监控方法的流程示意图,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图3所示,所述方法可以包括:
S301:获取网络节点端口实时的出入数据包量,所述出入数据包量包括输入数据包量和输出数据包量。
在实际应用中,网络节点会同时承载大量的数据包的传输。相应的,网络节点的端口上会同时承载大量的数据包的传输,这些数据包可以在端口输入/输出时统计下来。具体的,这里数据包量的单位可以包括但不限于个数,相应的,每个数据包的大小可以为结合实际应用中数据链路层所能承受的最大数据长度,即MTU确定(Maximum Transmission Unit,最大传输单元)的一特定的字节数。
另外,本发明实施例中所述的实时是一个相对于故障监控精度的时间,具体的可以结合对端口出入数据包量的统计精度确定,例如需要统计每秒的输入/ 输出数据包量,这里的实时就可以为每秒。
在一个具体的实施例中,如图4所示,所述获取网络节点端口实时的出入数据包量可以包括:
S3011:采集所述网络节点端口的累计出入数据包量,所述累计出入数据包量包括累计的输入数据包量和累计的输出数据包量,所述网络节点端口包括所述网络节点的多个端口。
在实际应用中,通过端口的数据包的数据包量可以基于SNMP(简单网络管理协议,Simple Network Management Protocol)采集统计。基于SNMP采集的端口的输入/输出数据包量都是某一端口从建立通信连接开始累计的输入/输出数据包量。相应的,本实施例中,可以将采集的累计的出/入数据包量转换成实时的出/入数据包量。
另外,需要说明的是,本发明实施例中,采集端口的输入/输出数据包量并不仅限于上述的基于SNMP的采集方式,还可以采用其他形式,例如基于GRPC (google RemoteProcedure Call,一个高性能、通用的开源RPC框架)的采集方式等,本发明实施例并不以上述为限。
S3013:基于所述网络节点的每个端口的累计的输入数据包量计算所述网络节点的每个端口的实时的输入数据包量。
具体的,在基于网络节点的每个端口累积的输入数据包量计算相应端口的实时的输入数据包量时,可将采集的某一端口某一时刻(t时刻)累计的输入数据包量减去该端口上一时刻(t-1时刻)累计的输入数据包量,得到的数据包量差可以作为该端口t-1时刻至t时刻的实时的输入数据包量。
需要说明的是,上述t时刻与t-1时刻之间时间间隔可以与上述实时的定义相一致,例如上述的实时为每秒,这里的时间间隔可以为1秒。
S3015:基于所述网络节点的每个端口的累计的输出数据包量计算所述网络节点的每个端口的实时的输出数据包量。
具体的,在基于网络节点的每个端口累积的输出数据包量计算相应端口的实时的输出数据包量时,可将采集某一端口某一时刻(t时刻)的累计的输出数据包量减去该端口上一时刻(t-1时刻)累计的输出数据包量,得到的数据包量差可以作为该端口t-1时刻至t时刻的实时的输出数据包量。
需要说明的是,上述t时刻与t-1时刻之间时间间隔可以与上述实时的定义相一致,例如上述的实时为每秒,这里的时间间隔可以为1秒。
S3017:将所述网络节点的多个端口的实时的输入数据包量相加,作为所述网络节点端口的实时的输入数据包量。
S3019:将所述网络节点的多个端口的实时的输出数据包量相加,作为所述网络节点端口的实时的输出数据包量。
另外,需要说明的是,本发明实施例中获取网络节点端口实时的出入数据包量并不仅限于上述通过采集端口累计输入/输出数据包量后,计算出实时的输入/输出数据包量的方式,在实际应用中,还可以包括其他方式,例如直接采集网络节点端口实时的出入数据包量的方式。
S303:确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量。
本说明书实施例中,所述输入数据包量与输出数据包量之间实时差异量可以包括能够用于表征输入数据包量与输出数据包量之间差异程度的特定值。所述实时差异量与输入/输出数据包量之间的差异程度成正比。
在一个具体的实施例中,所述实时差异量可以为数据包量差;相应的,如图5所示,所述确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量可以包括:
S501:将所述网络节点端口实时的输入数据包量减去实时的输出数据包量得到实时的出入数据包量差。
S503:将所述数据包量差作为所述实时差异量。
在另一个具体的实施例中,所述实时差异量可以为入出数据包量比;相应的,如图6所示,所述确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量可以包括:
S601:将所述网络节点端口实时的输入数据包量除以实时的输出数据包量得到实时的入出数据包量比。
S603:将所述入出数据包量比作为所述实时差异量。
在另一个具体的实施例中,所述实时差异量可以为相邻两个时间点的入出数据包量比之间的变化率的绝对值;相应的,如图7所示,所述确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量可以包括:
S701:将所述网络节点端口实时的输入数据包量除以实时的输出数据包量得到实时的入出数据包量比。
S703:计算相邻两个时间点的入出数据包量比之间的变化率的绝对值。
具体的,这里相邻两个时间点的确定可以结合实际一种对实时的定义,例如,当所述实时为每秒时,所述相邻两个时间点可以为当前一秒与下一秒。
在一个具体的实施例中,假设t时刻的入出数据包量比为x(t),下一时刻,即t+1时刻的入出数据包量比为x(t+1),相应的,相邻的t时刻和t+1时刻两个时间点的入出数据包量比之间的变化率可以为[x(t+1)-x(t)]/x(t)。
如图8所示,图8是本发明实施例提供的实时的入出数据包量比的曲线示意图。从图8中可见,在10日的10:00至11:30左右入出数据包量比有明显的变化,即这段时间输入数据包量与输出数据包量之间差异程度较大。
S705:将所述变化率的绝对值作为所述实时差异量。
此外,需要说明的是,本发明实施例中,所述实时差异量并不仅限于上述的几种形式,在实际应用中还可以包括其他能够表征输入数据包量与输出数据包量之间差异程度的特定值,本发明实施例并不以上述为限。
S305:监测所述实时差异量是否大于等于预设阈值。
本发明实施例中,可以监测所述实时差异量是否大于等于预设阈值。具体的,这里预设阈值可以结合实际应用中网络节点的正常情况下输入和/或输出数据包量进行设定。一般的,预设阈值越大,漏检故障的概率越高;反之,预设阈值越小,漏检故障的概率越低。另外,这里的预设阈值具体的数值的度量单位可以结合实际应用中实时差异量进行相应的调整。
在一个具体的实施例中,当所述实时差异量为数据包量差时,所述预设阈值的度量单位与所述数据包量的度量单位一致。具体的,例如设置为正常情况下输入数据包量的5%。
在另一个具体的实施例中,当所述实时差异量为实时的入出数据包量比,所述预设阈值的度量单位可以为百分数。具体的,例如设置为102%。
在另一个具体的实施例中,当所述实时差异量为相邻两个时间点的入出数据包量比之间的变化率的绝对值时,所述预设阈值的度量单位可以为百分数。具体的,例如设置为5%。
S307:当监测的结果为是时,确定所述网络节点发生故障。
本发明实施例中,当步骤S305监测的结果为是时,即监测到实时差异量大于等于预设阈值时,可以确定当前时刻网络节点的端口输入数据包量与输出数据包量之间差异较大,一般的,在三层网络的单播环境下,可以确定当前时刻网络节点的端口输入数据包量大于输出数据包量,相应的,可以确定所述网络节点发生故障。
在一个具体的实施例中,假设所述实时差异量为入出数据包量比,所述预设阈值为102%,在10日的10:10左右出现一次入出数据包量比等于预设阈值102%的情况,在10日的11:00至11:15左右入出数据包量比大于等于预设阈值 102%,因此,可确定出在10日的10:10左右以及在10日的11:00至11:15左右网络节点出现故障。
在实际应用中,确定所述网络节点发生故障,可以通过发出警报等方式提醒用户,以便用户可以及时定位出相应的故障,并及时采取相应的补救措施,避免因各个协议之间依赖、关联关系,出现一旦有故障发生,往往会伴随多个网络事件的异常,触发更多的故障,影响系统实务处理效率。
由以上本说明书实施例提供的技术方案可见,本说明书实施例中通过监测网络节点端口的输入数据包量与输出数据包量之间实时差异情况,可以及时全面的发现网络节点的故障情况,无需关注具体的故障事件、日志信息,而是直接聚焦于网络节点整体功能运营是否正常,可以避免了现有故障监控方法存在的故障监控盲区、故障定位效率低等问题,大大提升了故障定位处理效率。
在另一实施例中,考虑到在采集累计的输入/输出数据包时,由于网络节点的端口数量较多,常常需要采用分批轮询采集的方式。因此,不同端口的同一时刻的累计数据包量的采集时间必然存在一定的时间误差,导致按照累计的输入/输出数据包量计算得到的不同端口的实时输入/输出数据包量之间存在一定的时间差,且实时输入数据包量与实时输出数据包量之间也存在一定的时间误差,若实时所对应的时间段与分批轮询采集导致的时间误差比较接近时,实时输入数据包量与实时数据包量之间本身存在一定的差异量。基于此,本发明提供故障监控的另一实施例,以克服因分批轮询采集方式带来的实时输入数据包量与实时数据包量之间本身存在的差异量,而导致的故障误判问题。
图8是本发明实施例提供的另一种故障监控方法的流程示意图,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图8所示,所述方法可以包括:
S801:获取网络节点端口实时的出入数据包量,所述出入数据包量包括输入数据包量和输出数据包量。
S803:确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量;
S805:监测所述实时差异量是否大于等于预设阈值;
S807:当监测的结果为是时,监测与当前时刻相邻的预设数量的时间点的输入数据包量与输出数据包量之间实时差异量是否大于等于预设阈值。
本发明实施例中,在监测到实时差异量大于等于预设阈值后,为了避免该实时差异量是由分批轮询采集方式带来的时间误差,所导致的实时输入数据包量和实时输出数据包量之间的本身的差异量,可以通过增加监测时间的方式,达到缩小分批轮询采集方式带来的时间误差,所导致的实时输入数据包量和实时输出数据包量之间的本身的差异量。
具体的,可以监测与当前时刻相邻的预设数量的时间点的输入数据包量与输出数据包量之间实时差异量是否大于等于预设阈值,即监测当前时刻往后的相邻的一个或多个时间点的输入数据包量与输出数据包量之间实时差异量是否依然大于等于预设阈值。
S809:当监测到与当前时刻的相邻的预设数量的时间点的输入数据包量与输出数据包量之间实时差异量大于等于预设阈值时,确定所述网络节点发生故障。
本发明实施例中,当步骤S807监测的结构为是,即当监测到与当前时刻的相邻的预设数量的时间点的输入数据包量与输出数据包量之间实时差异量大于等于预设阈值时,可以确定当前时刻网络节点的端口输入数据包量与输出数据包量之间差异较大,一般的,在三层网络的单播环境下,可以确定当前时刻网络节点的端口输入数据包量大于输出数据包量,相应的,可以确定所述网络节点发生故障。
在一个具体的实施例中,假设所述实时差异量为入出数据包量比,所述预设阈值为102%,在10日的10:10左右出现一次入出数据包量比等于预设阈值 102%的情况,在10日的11:00至11:15左右入出数据包量比大于等于预设阈值 102%。但在10日的10:10左右出现的入出数据包量比等于预设阈值102%之后相邻的几个时间点没有出现入出数据包量比大于等于预设阈值的情况。因此,可以确定在10日的11:00至11:15左右网络节点出现故障。
另外,需要说明的是,当本发明实施例中,所述实时所对应的时间段远大于分批轮询采集方式所带来的时间误差时,分批轮询采集方式所带来的时间误差对实时输入数据包量和实时数据包量所带来的差异量可以忽略不计。
由上述本发明实施例提供的技术方案可见,本发明通过增加监测时间的方式,达到缩小分批轮询采集方式带来的时间误差,所导致的实时输入数据包量和实时输出数据包量之间的本身的差异量,保证监测到的网络节点端口的输入数据包量与输出数据包量之间实时差异情况是由故障导致,在快速全面的发现网络节点的故障情况下,保证了故障监测的准确率。
本发明实施例还提供了一种故障监控装置,如图9所示,所述装置包括:
出入数据包量获取模块910,可以用于获取网络节点端口实时的出入数据包量,所述出入数据包量包括输入数据包量和输出数据包量。
实时差异量确定模块920,可以用于确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量;
第一监测模块930,可以用于监测所述实时差异量是否大于等于预设阈值;
第一故障确定模块940,可以用于当所述第一监测模块监测的结果为是时,确定所述网络节点发生故障。
具体的,如图10所示,在另一实施例中,所述出入数据包量获取模块910 可以包括:
累计出入数据包量采集单元911,可以用于采集所述网络节点端口的累计出入数据包量,所述累计出入数据包量包括累计的输入数据包量和累计的输出数据包量,所述网络节点端口包括所述网络节点的多个端口;
第一输入数据包量计算单元912,可以用于基于所述网络节点的每个端口的累计的输入数据包量计算所述网络节点的每个端口的实时的输入数据包量;
第一输出数据包量计算单元913,可以用于基于所述网络节点的每个端口的累计的输出数据包量计算所述网络节点的每个端口的实时的输出数据包量;
第二输入数据包量计算单元914,可以用于将所述网络节点的多个端口的实时的输入数据包量相加,作为所述网络节点端口的实时的输入数据包量;
第二输出数据包量计算单元915,可以用于将所述网络节点的多个端口的实时的输出数据包量相加,作为所述网络节点端口的实时的输出数据包量。
具体的,如图11所示,在另一实施例中,所述实时差异量确定模块920可以包括:
出入数据包量差计算单元921,可以用于将所述网络节点端口实时的输入数据包量减去实时的输出数据包量得到实时的出入数据包量差;
第一实时差异量确定单元922,可以用于将所述数据包量差作为所述实时差异量。
具体的,如图12所示,在另一实施例中,所述实时差异量确定模块920可以包括:
第一入出数据包量比计算单元923,可以用于将所述网络节点端口实时的输入数据包量除以实时的输出数据包量得到实时的入出数据包量比;
第二实时差异量确定单元924,可以用于将所述入出数据包量比作为所述实时差异量。
具体的,如图13所示,在另一实施例中,所述实时差异量确定模块920可以包括:
第二入出数据包量比计算单元925,可以用于将所述网络节点端口实时的输入数据包量除以实时的输出数据包量得到实时的入出数据包量比;
变化率计算单元926,可以用于计算相邻两个时间点的入出数据包量比之间的变化率的绝对值;
第三实时差异量确定单元927,可以用于将所述变化率的绝对值作为所述实时差异量。
所述的装置实施例中的装置与方法实施例基于同样地发明构思。
本发明实施例还提供了一种故障监控装置,如图14所示,所述装置可以包括:
出入数据包量获取模块910,可以用于获取网络节点端口实时的出入数据包量,所述出入数据包量包括输入数据包量和输出数据包量;
实时差异量确定模块920,可以用于确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量;
第一监测模块930,可以用于监测所述实时差异量是否大于等于预设阈值;
第二监测模块950,可以用于当所述第一监测模块监测的结果为是时,监测与当前时刻相邻的预设数量的时间点的输入数据包量与输出数据包量之间实时差异量是否大于等于预设阈值;
第二故障确定模块960,可以用于当所述第二监测模块监测到与当前时刻的相邻的预设数量的时间点的输入数据包量与输出数据包量之间实时差异量大于等于预设阈值时,确定所述网络节点发生故障。
所述的装置实施例中的装置与方法实施例基于同样地发明构思。
本发明实施例提供了一种故障监控服务器,该故障监控服务器包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现如上述方法实施例所提供的故障监控方法。
存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
本发明实施例还提供了一种服务器的结构示意图,请参阅图15,该服务器 1500用于实施上述实施例中提供的故障监控方法,具体来讲,所述服务器结构可以包括上述故障监控装置。该服务器1500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,CPU) 1510(例如,一个或一个以上处理器)和存储器1530,一个或一个以上存储应用程序1523或数据1522的存储介质1520(例如一个或一个以上海量存储设备)。其中,存储器1530和存储介质1520可以是短暂存储或持久存储。存储在存储介质1520的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1510可以设置为与存储介质1520 通信,在服务器1500上执行存储介质1520中的一系列指令操作。服务器1500 还可以包括一个或一个以上电源1560,一个或一个以上有线或无线网络接口 1550,一个或一个以上输入输出接口1540,和/或,一个或一个以上操作系统 1521,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM 等等。
本发明的实施例还提供了一种存储介质,所述存储介质可设置于服务器之中以保存用于实现方法实施例中一种故障监控方法相关的至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现上述方法实施例提供的故障监控方法。
可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
由上述本发明提供的故障监控方法、装置、服务器或存储介质的实施例可见,本发明中通过对监测网络节点端口的输入数据包量与输出数据包量之间实时差异情况,可以及时全面的发现网络节点的故障情况,通过监测网络节点端口的输入数据包量与输出数据包量之间实时差异情况,可以快速全面的发现网络节点的故障情况,以便及时定位和修复相应的故障,避免因各个协议之间依赖、关联关系,出现一旦有故障发生,就会伴随多个网络事件的异常,触发更多的故障,影响系统实务处理效率。与现有的故障监控方法相比,可以无需关注具体的故障事件、日志信息,而直接聚焦于网络节点整体功能运营是否正常,避免了现有故障监控方法存在的故障监控盲区、故障定位效率低等问题,大大提升了故障定位处理效率。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置和服务器实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种故障监控方法,其特征在于,所述方法包括:
获取网络节点端口实时的出入数据包量,所述出入数据包量包括输入数据包量和输出数据包量;
确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量;
监测所述实时差异量是否大于等于预设阈值,当监测的结果为是时,确定所述网络节点发生故障。
2.根据权利要求1所述的方法,其特征在于,所述获取网络节点端口实时的出入数据包量包括:
采集所述网络节点端口的累计出入数据包量,所述累计出入数据包量包括累计的输入数据包量和累计的输出数据包量,所述网络节点端口包括所述网络节点的多个端口;
基于所述网络节点的每个端口的累计的输入数据包量计算所述网络节点的每个端口的实时的输入数据包量;
基于所述网络节点的每个端口的累计的输出数据包量计算所述网络节点的每个端口的实时的输出数据包量;
将所述网络节点的多个端口的实时的输入数据包量相加,作为所述网络节点端口的实时的输入数据包量;
将所述网络节点的多个端口的实时的输出数据包量相加,作为所述网络节点端口的实时的输出数据包量。
3.根据权利要求1所述的方法,其特征在于,所述确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量包括:
将所述网络节点端口实时的输入数据包量减去实时的输出数据包量得到实时的出入数据包量差;
将所述数据包量差作为所述实时差异量。
4.根据权利要求1所述的方法,其特征在于,所述确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量包括:
将所述网络节点端口实时的输入数据包量除以实时的输出数据包量得到实时的入出数据包量比;
将所述入出数据包量比作为所述实时差异量。
5.根据权利要求1所述的方法,其特征在于,所述确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量包括:
将所述网络节点端口实时的输入数据包量除以实时的输出数据包量得到实时的入出数据包量比;
计算相邻两个时间点的入出数据包量比之间的变化率的绝对值;
将所述变化率的绝对值作为所述实时差异量。
6.根据权利要求1至5任一所述的方法,其特征在于,在确定所述网络节点发生故障之前,所述方法还包括:
当监测的结果为是时,监测与当前时刻相邻的预设数量的时间点的输入数据包量与输出数据包量之间实时差异量是否大于等于预设阈值;
当监测到与当前时刻的相邻的预设数量的时间点的输入数据包量与输出数据包量之间实时差异量大于等于预设阈值时,执行确定所述网络节点发生故障的步骤。
7.一种故障监控装置,其特征在于,所述装置包括:
出入数据包量获取模块,用于获取网络节点端口实时的出入数据包量,所述出入数据包量包括输入数据包量和输出数据包量;
实时差异量确定模块,用于确定所述网络节点端口实时的输入数据包量与输出数据包量之间实时差异量;
第一监测模块,用于监测所述实时差异量是否大于等于预设阈值;
第一故障确定模块,用于当所述第一监测模块监测的结果为是时,确定所述网络节点发生故障。
8.根据权利要求7所述的装置,其特征在于,所述出入数据包量获取模块包括:
累计出入数据包量采集单元,用于采集所述网络节点端口的累计出入数据包量,所述累计出入数据包量包括累计的输入数据包量和累计的输出数据包量,所述网络节点端口包括所述网络节点的多个端口;
第一输入数据包量计算单元,用于基于所述网络节点的每个端口的累计的输入数据包量计算所述网络节点的每个端口的实时的输入数据包量;
第一输出数据包量计算单元,用于基于所述网络节点的每个端口的累计的输出数据包量计算所述网络节点的每个端口的实时的输出数据包量;
第二输入数据包量计算单元,用于将所述网络节点的多个端口的实时的输入数据包量相加,作为所述网络节点端口的实时的输入数据包量;
第二输出数据包量计算单元,用于将所述网络节点的多个端口的实时的输出数据包量相加,作为所述网络节点端口的实时的输出数据包量。
9.根据权利要求7所述的装置,其特征在于,所述实时差异量确定模块包括:
出入数据包量差计算单元,用于将所述网络节点端口实时的输入数据包量减去实时的输出数据包量得到实时的出入数据包量差;
第一实时差异量确定单元,用于将所述数据包量差作为所述实时差异量。
10.根据权利要求7所述的装置,其特征在于,所述实时差异量确定模块包括:
第一入出数据包量比计算单元,用于将所述网络节点端口实时的输入数据包量除以实时的输出数据包量得到实时的入出数据包量比;
第二实时差异量确定单元,用于将所述入出数据包量比作为所述实时差异量。
11.根据权利要求7所述的装置,其特征在于,所述实时差异量确定模块包括:
第二入出数据包量比计算单元,用于将所述网络节点端口实时的输入数据包量除以实时的输出数据包量得到实时的入出数据包量比;
变化率计算单元,用于计算相邻两个时间点的入出数据包量比之间的变化率的绝对值;
第三实时差异量确定单元,用于将所述变化率的绝对值作为所述实时差异量。
12.根据权利要求7至11任一所述的装置,其特征在于,所述装置还包括:
第二监测模块,用于在确定所述网络节点发生故障之前,当所述第一监测模块监测的结果为是时,监测与当前时刻相邻的预设数量的时间点的输入数据包量与输出数据包量之间实时差异量是否大于等于预设阈值;
第二故障确定模块,用于当所述第二监测模块监测到与当前时刻的相邻的预设数量的时间点的输入数据包量与输出数据包量之间实时差异量大于等于预设阈值时,执行确定所述网络节点发生故障的步骤。
13.一种故障监控服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至6任一所述的故障监控方法。
14.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至6任一所述的故障监控方法。
CN201810326953.5A 2018-04-12 2018-04-12 一种故障监控方法、装置、服务器及存储介质 Pending CN110198228A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810326953.5A CN110198228A (zh) 2018-04-12 2018-04-12 一种故障监控方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810326953.5A CN110198228A (zh) 2018-04-12 2018-04-12 一种故障监控方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN110198228A true CN110198228A (zh) 2019-09-03

Family

ID=67751033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810326953.5A Pending CN110198228A (zh) 2018-04-12 2018-04-12 一种故障监控方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN110198228A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113726555A (zh) * 2021-08-02 2021-11-30 华迪计算机集团有限公司 一种适用于数据通信网络辅助解析告警的系统及方法
CN114844801A (zh) * 2022-03-29 2022-08-02 中国信息通信研究院 用于实时业务网络丢包测试的方法及装置、电子设备、存储介质
CN117574869A (zh) * 2023-10-19 2024-02-20 镁佳(北京)科技有限公司 自动化生成诊断应用数据包的方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101594265A (zh) * 2009-06-30 2009-12-02 北京星网锐捷网络技术有限公司 一种网络故障诊断方法、装置和网络设备
CN101969661A (zh) * 2010-10-27 2011-02-09 北京握奇数据系统有限公司 一种移动Ad hoc网络中数据传输方法、装置及系统
US9455885B2 (en) * 2011-10-13 2016-09-27 General Electric Company Systems, methods, and apparatus for modifying sensor time stamp data
CN106464520A (zh) * 2014-03-31 2017-02-22 西门子公司 对网络中的有故障的节点的检测
CN107888455A (zh) * 2017-12-04 2018-04-06 北京星河星云信息技术有限公司 一种数据检测方法、装置和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101594265A (zh) * 2009-06-30 2009-12-02 北京星网锐捷网络技术有限公司 一种网络故障诊断方法、装置和网络设备
CN101969661A (zh) * 2010-10-27 2011-02-09 北京握奇数据系统有限公司 一种移动Ad hoc网络中数据传输方法、装置及系统
US9455885B2 (en) * 2011-10-13 2016-09-27 General Electric Company Systems, methods, and apparatus for modifying sensor time stamp data
CN106464520A (zh) * 2014-03-31 2017-02-22 西门子公司 对网络中的有故障的节点的检测
CN107888455A (zh) * 2017-12-04 2018-04-06 北京星河星云信息技术有限公司 一种数据检测方法、装置和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113726555A (zh) * 2021-08-02 2021-11-30 华迪计算机集团有限公司 一种适用于数据通信网络辅助解析告警的系统及方法
CN114844801A (zh) * 2022-03-29 2022-08-02 中国信息通信研究院 用于实时业务网络丢包测试的方法及装置、电子设备、存储介质
CN114844801B (zh) * 2022-03-29 2023-06-16 中国信息通信研究院 用于实时业务网络丢包测试的方法及装置、电子设备、存储介质
CN117574869A (zh) * 2023-10-19 2024-02-20 镁佳(北京)科技有限公司 自动化生成诊断应用数据包的方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN110222091B (zh) 一种海量数据实时统计分析方法
CN109656574B (zh) 交易时延度量方法、装置、计算机设备及存储介质
CN107769943B (zh) 一种主备集群切换的方法和设备
CN108989136A (zh) 业务端到端性能监控方法及装置
CN110198228A (zh) 一种故障监控方法、装置、服务器及存储介质
CN112003763B (zh) 网络链路的监测方法、监测装置、监测设备及存储介质
CN110493362A (zh) 请求量控制方法、装置、存储介质和计算机设备
CN109728981A (zh) 一种云平台故障监测方法及装置
US20110172963A1 (en) Methods and Apparatus for Predicting the Performance of a Multi-Tier Computer Software System
CN112751772B (zh) 数据传输方法和系统
CN102929773A (zh) 信息采集方法和装置
US10282245B1 (en) Root cause detection and monitoring for storage systems
CN109729073B (zh) 一种电网信息物理系统中的网络异常识别方法及系统
Simoncelli et al. Stream-monitoring with blockmon: convergence of network measurements and data analytics platforms
JP6889784B2 (ja) データトラフィックを監視するための方法、装置、およびシステム
CN115150460B (zh) 一种节点安全注册方法、装置、设备及可读存储介质
CN110932892A (zh) 基于区块链的信息预警方法、装置、相关节点及存储介质
CN113704018A (zh) 应用运维数据处理方法、装置、计算机设备及存储介质
CN103995901B (zh) 一种确定数据节点失效的方法
CN110750425A (zh) 数据库监控方法、装置、系统和存储介质
US10223189B1 (en) Root cause detection and monitoring for storage systems
CN105357026B (zh) 一种资源信息收集方法和计算节点
KR101152315B1 (ko) 네트워크 감시 카메라용 서버 가상화 방법
CN102368729A (zh) 一种在非实时系统上精确网络限速的方法
CN112751722A (zh) 数据传输质量监控方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190903