CN115378795A - 服务器网络质量监控方法、装置和电子设备及存储介质 - Google Patents
服务器网络质量监控方法、装置和电子设备及存储介质 Download PDFInfo
- Publication number
- CN115378795A CN115378795A CN202210999353.1A CN202210999353A CN115378795A CN 115378795 A CN115378795 A CN 115378795A CN 202210999353 A CN202210999353 A CN 202210999353A CN 115378795 A CN115378795 A CN 115378795A
- Authority
- CN
- China
- Prior art keywords
- server
- packet loss
- loss rate
- current
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012544 monitoring process Methods 0.000 title claims abstract description 35
- 238000001514 detection method Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 239000000523 sample Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0823—Errors, e.g. transmission errors
- H04L43/0829—Packet loss
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请实施例提供一种服务器网络质量监控方法、装置和电子设备及存储介质,其中服务器网络质量监控方法,包括:按照预设时间周期检测服务器网络中每个服务器的丢包率;针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率稳定性指标;根据每个服务器当前的丢包率稳定性指标进行告警。采用本申请实施例,可以实现在服务器网络出现故障之前进行告警。
Description
技术领域
本申请涉及计算机领域,尤其涉及一种服务器网络质量监控方法、装置和电子设备及存储介质。
背景技术
尽管现有的网络设备监控以及网络线路监控已经比较完善,但收集到的监控数据多用于历史故障分析和严重故障发生时的事后告警,达不到事前告警、网络连通性隐患尽早发现、尽早解决以及防止故障扩大化的效果。
发明内容
根据本申请的一方面,提供了一种服务器网络质量监控方法,包括:按照预设时间周期检测服务器网络中每个服务器的丢包率;针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率稳定性指标;根据每个服务器当前的丢包率稳定性指标进行告警。
可选地,还包括:针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率趋势。
可选地,根据每个服务器当前的丢包率稳定性指标进行告警,包括:根据每个服务器当前的丢包率稳定性指标和丢包率趋势进行告警。
可选地,根据每个服务器当前的丢包率稳定性指标进行告警,包括:针对每个服务器,在该服务器当前的丢包率稳定性指标小于预设稳定性阈值的情况下,进行告警。
可选地,根据每个服务器当前的丢包率稳定性指标和丢包率趋势指标进行告警,包括:针对每个服务器,在该服务器当前的丢包率稳定性指标小于预设稳定性阈值,且当前的丢包率趋势为丢包率增大的情况下,进行告警。
可选地,按照预设时间周期检测服务器网络中每个服务器的丢包率,包括:针对服务器网络中每个服务器,按照预设时间周期在每个时间周期内对该服务器进行多次探测,根据每个时间周期内多次探测的结果,确定该服务器每个时间周期的丢包率。
可选地,所述丢包率稳定性指标基于所述服务器在当前时间窗口内的丢包率的标准差,其中,丢包率的标准差越大,丢包率稳定性越低。
可选地,当前窗口与下一窗口之间的滑动时间为预设值。
根据本申请的另一方面,提供了一种服务器网络质量监控装置,包括:检测模块,用于按照预设时间周期检测服务器网络中每个服务器的丢包率;确定模块,用于针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率稳定性指标;告警模块,用于根据每个服务器当前的丢包率稳定性指标进行告警。
根据本申请的又一方面,提供了一种电子设备,包括:处理器;以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行本申请的方法。
根据本申请的再一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本申请的方法。
本申请实施例中提供的一个或多个技术方案,按照预设时间周期检测服务器网络中每个服务器的丢包率;针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率稳定性指标;根据每个服务器当前的丢包率稳定性指标进行告警。可以实现在服务器网络出现故障之前进行告警。
附图说明
在下面结合附图对于示例性实施例的描述中,本申请的更多细节、特征和优点被公开,在附图中:
图1示出了根据本申请示例性实施例的可以在其中实施本文描述的各种方法的示例系统的示意图;
图2示出了根据本申请示例性实施例的服务器网络质量监控方法的流程图;
图3示出了根据本申请示例性实施例的服务器网络质量监控方法的流程图;
图4示出了根据本申请示例性实施例的丢包率趋势图;
图5示出了根据本申请示例性实施例的丢包率稳定性指标计算的示意图;
图6示出了根据本申请示例性实施例的服务器网络质量监控装置的示意性框图;
图7示出了能够用于实现本申请的实施例的示例性电子设备的结构框图。
具体实施方式
下面将参照附图更详细地描述本申请的实施例。虽然附图中显示了本申请的某些实施例,然而应当理解的是,本申请可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本申请。应当理解的是,本申请的附图及实施例仅用于示例性作用,并非用于限制本申请的保护范围。
应当理解,本申请的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本申请的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本申请中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本申请中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本申请实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
以下参照附图描述本申请的方案。
通过几代网络技术的发展,现在的网络已发展成为高度融合网络,包含物理网络、云网络、容器网络等,网络监控更加繁杂。针对服务器的网络联通性探活技术愈发的重要。探活是指通过某种网络探测或者服务探测的命令来检查目的服务器的网络或者应用服务的健康状态。从网络侧针对服务器进行探活,以确定服务器的网络连通性正常并可以提供投入运营使用。
Ping探测类型的网络故障发现。通过互联网控制协议(Internet ControlMessage Protocol,简称为ICMP)对服务器的探测是常用的服务器网络探活方式,目前是比较稳定且高效发现现有网络问题的方案。但现有基于Ping探测的告警技术仍然停留在通和不通上,比如常用的告警逻辑就是:每10s探测一次,发生3-5次的连续性丢包久判断为服务器失联进行告警。但服务器失联前往往探测的丢包已经开始发生了,或者探测延迟增高,但告警逻辑却无法发出服务器网络质量变差的警告。
通过网络设备异常指标的故障发现。这种基于网络设备端口循环冗余校验(Cyclic Redundancy Check,简称为CRC)指数、带宽利用率等参数监控,都是在网络通信中断或严重故障后发出的事后报警。基于网络设备的告警无法判断整个网络环境的质量变差,这种基于某设备发出的告警只是针对于设备上所发生的事情,而无法顾及服务器网络全局。而如果想要对整体网络质量进行评估,则需要很多的数据分析才能有所结论,但当分析出结果后再进行改善,可能故障已经发生了。
鉴于上述问题,本申请实施例提供了一种服务器网络质量监控的技术方案。
图1示出了根据本申请示例性实施例的可以在其中实施本文描述的各种方法的示例系统的示意图,如图1所示,该系统包括:服务器和网络设备。其中,服务器为运行程序的计算机设备,可提供CPU、内存、磁盘、网络、GPU等硬件资源给程序使用。网络设备可包括路由器、交换机等,实现服务器之间、服务器网络与外部设备之间的通信。服务器和网络设备组成服务器网络。
如图1所示,在一些实施例中,该系统还可包括负载均衡器。负载均衡器把网络请求分散到多个服务器(通常称为服务器集群)中的可用服务器上去。负载均衡器有多种多样的形式,除了作为独立意义上的负载均衡器外,有些负载均衡器集成在网络设备(例如,交换设备)中,置于服务器与外部设备之间。
本申请实施例提供了一种服务器网络质量监控方法,该方法可由服务器、网络设备、负载均衡器等网络侧设备实施,本实施例对此不作限定。
图2示出了根据本申请示例性实施例的服务器网络质量监控方法的流程图,如图2所示,服务器网络质量监控方法包括步骤S201至步骤S203。
步骤S201,按照预设时间周期检测服务器网络中每个服务器的丢包率。
在本申请实施例中,可预先配置检测服务器的丢包率的时间周期,例如,时间周期可为每30秒、每分钟、每2分钟、每10分钟等。本申请实施例对于检测服务器的丢包率的时间周期不作限定。应当理解,该时间周期越小,检测的数据越多,同时执行监测消耗的网络资源也越多。
作为一种实施方式,步骤S201,包括:针对服务器网络中每个服务器,按照预设时间周期在每个时间周期内对该服务器进行多次探测,根据每个时间周期内多次探测的结果,确定该服务器每个时间周期的丢包率。作为一种示例,进行多次ping探测。
步骤S202,针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率稳定性指标。
在本申请实施例中,可预先配置窗口大小。例如,窗口大小为10分钟、30分钟、1小时等时间长度,本申请实施例对窗口大小不作限定。
在本申请实施例中,窗口可为滑动窗口。可预先配置滑动窗口的滑动时间,例如,1分钟、5分钟、10分钟等,本申请实施例对滑动时间不作限定。当前窗口与下一窗口、上一窗口之间的时间间隔为滑动时间,例如,滑动时间为5分钟,窗口大小为1小时,可实现每5分钟基于服务器最近1小时的丢包率确定该服务器的丢包率稳定性指标。
在本申请实施例中,可以动态调整窗口大小和/或滑动时间,也可设置固定的窗口大小和/或滑动时间。
作为一种实施方式,丢包率稳定性指标基于丢包率的标准差,丢包率的标准差越大,丢包率稳定性越低。作为一个示例,丢包率稳定性指标为丢包率的标准差的倒数,丢包率的标准差越大,丢包率稳定性指标的取值越小,丢包率稳定性越低。作为另一个示例,丢包率稳定性指标为丢包率的标准差,丢包率的标准差越大,丢包率稳定性指标的取值越大,丢包率稳定性越低。
步骤S203,根据每个服务器当前的丢包率稳定性指标进行告警。
采用本申请实施例,按照预设时间周期检测服务器网络中每个服务器的丢包率;针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率稳定性指标。通常情况下丢表率较为稳定,丢包率稳定性指标表征一段时间内的丢包率波动程度,丢包率波动程度较高意味着网络的质量发生变化,相当于对服务器网络质量趋势的预测,可以实现在服务器网络出现故障之前进行告警。
作为一种实施方式,根据每个服务器当前的丢包率稳定性指标进行告警,包括:针对每个服务器,在该服务器当前的丢包率稳定性指标小于预设稳定性阈值,进行告警。作为一个示例,丢包率稳定性指标为丢包率的标准差,预设稳定性阈值为标准差阈值,丢包率稳定性指标小于预设稳定性阈值对应于丢包率的标准差大于预设标准差阈值。作为另一个示例,丢包率稳定性指标为丢包率的标准差的倒数,丢包率稳定性指标小于预设稳定性阈值。
在一些实施例中,针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率趋势。按照预设时间周期检测服务器网络中服务器的丢包率,可得到服务器的丢包率的时间序列。在本申请实施例中,可对时间序列中当前窗口内的丢包率进行时间序列趋势分析,以确定服务器当前的丢包率趋势。示例性的,丢包率趋势可包括增长和下降等。
在一些实施例中,针对每个服务器,在该服务器在当前窗口内的丢包率大于告警阈值的情况下,进行告警。由此,对丢包率较为稳定但丢包率偏大的情况进行告警。可预先配置告警阈值,例如,告警阈值设置为50%,也就是在当前窗口内的丢包率大于50%的情况下,进行告警。作为一种实施方式,在服务器在当前窗口内的丢包率的平均值大于告警阈值的情况下,进行告警。作为另一种实施方式,在服务器在当前窗口内的丢包率中预设数目的丢包率大于告警阈值的情况下,进行告警。
图3示出了根据本申请示例性实施例的服务器网络质量监控方法的流程图,如图3所示,服务器网络质量监控方法包括步骤S301至步骤S304。
步骤S301,按照预设时间周期检测服务器网络中每个服务器的丢包率。
在本申请实施例中,可预先配置检测服务器的丢包率的时间周期,例如,时间周期可为每30秒、每分钟、每2分钟、每10分钟等。本申请实施例对于检测服务器的丢包率的时间周期不作限定。应当理解,该时间周期越小,检测的数据越多,同时执行监测消耗的网络资源也越多。
作为一种实施方式,步骤S301,包括:针对服务器网络中每个服务器,按照预设时间周期在每个时间周期内对该服务器进行多次探测,根据每个时间周期内多次探测的结果,确定该服务器每个时间周期的丢包率。作为一种示例,进行多次ping探测。作为一个例子,每次ping探测,可得到发送的数据包的数目和接收的数据包的数目。基于每次ping探测发送和接收的数据包的数目,可确定每次ping探测的丢包率,多次ping探测的丢包率为每次ping探测的丢包率均值。作为另一个例子,基于多次ping探测发送和接收的数据包的数目,可确定多次探测丢失的数据表的数目,基于此确定多次ping探测的丢包率。
步骤S302,针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率稳定性指标。
在申请本实施例中,可预先配置窗口大小。例如,窗口大小为10分钟、30分钟、1小时等时间长度,本申请实施例对窗口大小不作限定。
在本申请实施例中,窗口可为滑动窗口。可预先配置滑动窗口的滑动时间,例如,1分钟、5分钟、10分钟等,本申请实施例对滑动时间不作限定。
在本申请实施例中,可以动态调整窗口大小和/或滑动时间,也可设置固定的窗口大小和/或滑动时间。
作为一种实施方式,丢包率稳定性指标基于丢包率的标准差,丢包率的标准差越大,丢包率稳定性越低。作为一个示例,丢包率稳定性指标为丢包率的标准差的倒数,丢包率的标准差越大,丢包率稳定性指标的取值越小,丢包率稳定性越低。作为另一个示例,丢包率稳定性指标为丢包率的标准差,丢包率的标准差越大,丢包率稳定性指标的取值越大,丢包率稳定性越低。
步骤S303,针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率趋势。
按照预设时间周期检测服务器网络中服务器的丢包率,可得到服务器的丢包率的时间序列。在本申请实施例中,可对时间序列中当前窗口内的丢包率进行时间序列趋势分析,以确定服务器当前的丢包率趋势。
步骤S304,根据每个服务器当前的丢包率稳定性指标和丢包率趋势进行告警。
采用本申请实施例,按照预设时间周期检测服务器网络中每个服务器的丢包率;针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率稳定性指标。丢包率稳定性指标表征一段时间内的丢包率波动程度,丢包率波动程度较高意味着网络的质量发生变化,通常情况下丢表率较为稳定,丢包率稳定性指标表征一段时间内的丢包率波动程度,丢包率波动程度较高意味着网络的质量发生变化,结合丢包率趋势可确定丢包率是变高还是变低等变化特征,可以实现在服务器网络出现故障之前进行告警。
作为一种实施方式,根据每个服务器当前的丢包率稳定性指标和丢包率趋势进行告警,包括:针对每个服务器,在该服务器当前的丢包率稳定性指标小于预设稳定性阈值,且当前的丢包率趋势为丢包率增大的情况下,进行告警,由此避免在丢包率下降时进行告警。作为一个示例,丢包率稳定性指标为丢包率的标准差,预设稳定性阈值为标准差阈值,丢包率稳定性指标小于预设稳定性阈值对应于丢包率的标准差大于预设标准差阈值。作为另一个示例,丢包率稳定性指标为丢包率的标准差的倒数,丢包率稳定性指标小于预设稳定性阈值。
在一些实施例中,针对每个服务器,在该服务器在当前窗口内的丢包率大于告警阈值的情况下,进行告警。由此,对丢包率较为稳定但丢包率偏大的情况进行告警。可预先配置告警阈值,例如,告警阈值设置为50%,也就是在当前窗口内的丢包率大于50%的情况下,进行告警。作为一种实施方式,在服务器在当前窗口内的丢包率的平均值大于告警阈值的情况下,进行告警。作为另一种实施方式,在服务器在当前窗口内的丢包率中预设数目的丢包率大于告警阈值的情况下,进行告警。
下面对本申请实施例的一个示例进行说明。
针对服务器网络中每个服务器,每分钟对该服务器进行30次Ping探测,然后算出每分钟的丢包率。计算出的丢包率形成丢包率时间序列数据。
获取每个服务器的一段时间内探测数据进行分析,然后对探测数据进行分段计算,得到一段时间的丢包率稳定性指标。在本示例中,采用1小时的数据作为一个窗口,对一小时内的丢包率,以一天的时间做为横轴,丢包率作为纵轴,得到一小时内该服务器的丢包趋势图,如图4所示,图4中仅示出了一小时内部分时间的丢包率。
在本示例中,每隔预设时间计算一次丢包率稳定性指标。例如,每10分钟(也就是滑动时间为10分钟)计算一次标准差,每次计算的窗口为1小时。如图5所示,在12:00时,获取11:00至11:59内每分钟的丢包率,计算12:00的丢包率的标准差,基于标准差进行告警;在12:10时,获取11:10至12:09内每分钟的丢包率,计算12:10的丢包率的标准差,基于标准差进行告警。
进一步的,在12:00时,获取11:00至11:59内每分钟的丢包率,确定12:00的丢包率趋势,基于12:10的标准差和丢包率趋势进行告警;在12:10时,获取11:10至12:09内每分钟的丢包率,确定12:10的丢包率趋势,基于12:10的标准差和丢包率趋势进行告警。
在该示例中,如果是单一的一台服务器丢包率增加,可以结合SNMP的网络设备侧的端口CRC以及端口带宽占用等信息可以获得端口网络质量恶化的信息,在该服务器发生网络故障前提示比如丢包率到达50%就报告发现问题。
在该示例中,如果是大量服务器丢包率一起增加到达50%,结合设备CRC信息和设备SNMP发出的信息,则基本可以判断网类的某核心设备的出现问题或者接入交换机出现问题。
在该示例中,在服务器出现离线或者一定区域内的网络设备故障问题出现前,能做到提前发现,提前告警。可以有效减少故障损失。
本申请实施例还提供了一种服务器网络质量监控装置。
图6示出了根据本申请示例性实施例的服务器网络质量监控装置的示意性框图,如图6所示,该装置包括:检测模块10,用于按照预设时间周期检测服务器网络中每个服务器的丢包率;确定模块20,与检测模块10相连,用于针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率稳定性指标;告警模块30,与确定模块20相连,用于根据每个服务器当前的丢包率稳定性指标进行告警。
采用本申请实施例,检测模块按照预设时间周期检测服务器网络中每个服务器的丢包率;确定模块针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率稳定性指标。通常情况下丢表率较为稳定,丢包率稳定性指标表征一段时间内的丢包率波动程度,丢包率波动程度较高意味着网络的质量发生变化,相当于对服务器网络质量趋势的预测,可以实现在服务器网络出现故障之前进行告警。
作为一种实施方式,告警模块30根据每个服务器当前的丢包率稳定性指标进行告警,具体包括:针对每个服务器,在该服务器当前的丢包率稳定性指标小于预设稳定性阈值的情况下,进行告警。作为一个示例,丢包率稳定性指标为丢包率的标准差,预设稳定性阈值为标准差阈值,丢包率稳定性指标小于预设稳定性阈值对应于丢包率的标准差大于预设标准差阈值。作为另一个示例,丢包率稳定性指标为丢包率的标准差的倒数,丢包率稳定性指标小于预设稳定性阈值。
在一些实施例中,确定模块20,还用于针对每个服务器,根据该服务器在当前窗口内的丢包率,确定该服务器当前的丢包率趋势。按照预设时间周期检测服务器网络中服务器的丢包率,可得到服务器的丢包率的时间序列。在本申请实施例中,可对时间序列中当前窗口内的丢包率进行时间序列趋势分析,以确定服务器当前的丢包率趋势。示例性的,丢包率趋势可包括增长和下降等。
在一些实施例中,告警模块30,用于根据每个服务器当前的丢包率稳定性指标和丢包率趋势进行告警。
作为一种实施方式,告警模块30根据每个服务器当前的丢包率稳定性指标和丢包率趋势指标进行告警,具体包括:针对每个服务器,在该服务器当前的丢包率稳定性指标小于预设稳定性阈值,且当前的丢包率趋势为丢包率增大的情况下,进行告警。
作为一种实施方式,检测模块10按照预设时间周期检测服务器网络中每个服务器的丢包率,具体包括:针对服务器网络中每个服务器,按照预设时间周期在每个时间周期内对该服务器进行多次探测,根据每个时间周期内多次探测的结果,确定该服务器每个时间周期的丢包率。
作为一种实施方式,丢包率稳定性指标基于服务器在当前时间窗口内的丢包率的标准差,其中,丢包率的标准差越大,丢包率稳定性越低。
在一些实施例中,告警模块30,还用于针对每个服务器,在该服务器在当前窗口内的丢包率大于告警阈值的情况下,进行告警。由此,对丢包率较为稳定但丢包率偏大的情况进行告警。可预先配置告警阈值,例如,告警阈值设置为50%,也就是在当前窗口内的丢包率大于50%的情况下,进行告警。作为一种实施方式,在服务器在当前窗口内的丢包率的平均值大于告警阈值的情况下,进行告警。作为另一种实施方式,在服务器在当前窗口内的丢包率中预设数目的丢包率大于告警阈值的情况下,进行告警。
本申请示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序,所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本申请实施例的方法。
本申请示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本申请实施例的方法。
本申请示例性实施例还提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本申请实施例的方法。
参考图7,现将描述可以作为本申请的服务器等网络侧设备的电子设备700的结构框图,其是可以应用于本申请的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、服务器、刀片式服务器、大型计算机、和其它适合的计算机。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,电子设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
电子设备700中的多个部件连接至I/O接口705,包括:输入单元706、输出单元707、存储单元708以及通信单元709。输入单元706可以是能向电子设备700输入信息的任何类型的设备,输入单元706可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元707可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元708可以包括但不限于磁盘、光盘。通信单元709允许电子设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理。例如,在一些实施例中,服务器网络质量监控方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到电子设备700上。在一些实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行服务器网络质量监控方法。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
如本申请使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
Claims (11)
1.一种服务器网络质量监控方法,其特征在于,包括:
按照预设时间周期检测所述服务器网络中每个服务器的丢包率;
针对每个服务器,根据所述服务器在当前窗口内的丢包率,确定所述服务器当前的丢包率稳定性指标;
根据每个服务器当前的丢包率稳定性指标进行告警。
2.如权利要求1所述的服务器网络质量监控方法,其特征在于,还包括:
针对每个服务器,根据所述服务器在当前窗口内的丢包率,确定所述服务器当前的丢包率趋势。
3.如权利要求2所述的服务器网络质量监控方法,其特征在于,根据每个服务器当前的丢包率稳定性指标进行告警,包括:
根据每个服务器当前的丢包率稳定性指标和丢包率趋势进行告警。
4.如权利要求1所述的服务器网络质量监控方法,其特征在于,根据每个服务器当前的丢包率稳定性指标进行告警,包括:
针对每个服务器,在所述服务器当前的丢包率稳定性指标小于预设稳定性阈值的情况下,进行告警。
5.如权利要求3所述的服务器网络质量监控方法,其特征在于,根据每个服务器当前的丢包率稳定性指标和丢包率趋势指标进行告警,包括:
针对每个服务器,在所述服务器当前的丢包率稳定性指标小于预设稳定性阈值,且当前的丢包率趋势为丢包率增大的情况下,进行告警。
6.如权利要求1至5中任一项所述的服务器网络质量监控方法,其特征在于,按照预设时间周期检测所述服务器网络中每个服务器的丢包率,包括:
针对所述服务器网络中每个服务器,按照预设时间周期在每个时间周期内对所述服务器进行多次探测,根据每个时间周期内多次探测的结果,确定所述服务器每个时间周期的丢包率。
7.如权利要求1至5中任一项所述的服务器网络质量监控方法,其特征在于,所述丢包率稳定性指标基于所述服务器在当前时间窗口内的丢包率的标准差,其中,所述丢包率的标准差越大,所述丢包率稳定性越低。
8.如权利要求1至5中任一项所述的服务器网络质量监控方法,当前窗口与下一窗口之间的滑动时间为预设值。
9.一种服务器网络质量监控装置,其特征在于,包括:
检测模块,用于按照预设时间周期检测所述服务器网络中每个服务器的丢包率;
确定模块,用于针对每个服务器,根据所述服务器在当前窗口内的丢包率,确定所述服务器当前的丢包率稳定性指标;
告警模块,用于根据每个服务器当前的丢包率稳定性指标进行告警。
10.一种电子设备,包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-8中任一项所述的方法。
11.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210999353.1A CN115378795B (zh) | 2022-08-19 | 2022-08-19 | 服务器网络质量监控方法、装置和电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210999353.1A CN115378795B (zh) | 2022-08-19 | 2022-08-19 | 服务器网络质量监控方法、装置和电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115378795A true CN115378795A (zh) | 2022-11-22 |
CN115378795B CN115378795B (zh) | 2024-02-13 |
Family
ID=84065912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210999353.1A Active CN115378795B (zh) | 2022-08-19 | 2022-08-19 | 服务器网络质量监控方法、装置和电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115378795B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009143748A1 (zh) * | 2008-05-30 | 2009-12-03 | 华为技术有限公司 | 一种数据传输的方法、系统及装置 |
CN101640629A (zh) * | 2008-07-29 | 2010-02-03 | 华为技术有限公司 | 一种链路丢包监控的方法和双向转发探测设备 |
WO2011150651A1 (zh) * | 2010-12-29 | 2011-12-08 | 华为技术有限公司 | 一种数据传输的拥塞控制方法及装置 |
WO2015016919A1 (en) * | 2013-07-31 | 2015-02-05 | Adaptive Spectrum And Signal Alignment, Inc. | Method and apparatus for continuous access network monitoring and packet loss estimation |
CN110730111A (zh) * | 2019-10-23 | 2020-01-24 | 北京锐安科技有限公司 | 一种网络质量监测方法、装置、服务器及介质 |
CN111629281A (zh) * | 2020-04-13 | 2020-09-04 | 北京创享苑科技文化有限公司 | 一种视频传输中基于网络丢包率分布的在线连续检验方法 |
CN112492646A (zh) * | 2020-11-27 | 2021-03-12 | 清华大学 | 基于拥塞成因识别的拥塞控制方法及装置 |
CN113778805A (zh) * | 2021-09-15 | 2021-12-10 | 中国建设银行股份有限公司 | 一种dcgw集群告警方法及系统 |
-
2022
- 2022-08-19 CN CN202210999353.1A patent/CN115378795B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009143748A1 (zh) * | 2008-05-30 | 2009-12-03 | 华为技术有限公司 | 一种数据传输的方法、系统及装置 |
CN101640629A (zh) * | 2008-07-29 | 2010-02-03 | 华为技术有限公司 | 一种链路丢包监控的方法和双向转发探测设备 |
WO2011150651A1 (zh) * | 2010-12-29 | 2011-12-08 | 华为技术有限公司 | 一种数据传输的拥塞控制方法及装置 |
WO2015016919A1 (en) * | 2013-07-31 | 2015-02-05 | Adaptive Spectrum And Signal Alignment, Inc. | Method and apparatus for continuous access network monitoring and packet loss estimation |
CN110730111A (zh) * | 2019-10-23 | 2020-01-24 | 北京锐安科技有限公司 | 一种网络质量监测方法、装置、服务器及介质 |
CN111629281A (zh) * | 2020-04-13 | 2020-09-04 | 北京创享苑科技文化有限公司 | 一种视频传输中基于网络丢包率分布的在线连续检验方法 |
CN112492646A (zh) * | 2020-11-27 | 2021-03-12 | 清华大学 | 基于拥塞成因识别的拥塞控制方法及装置 |
CN113778805A (zh) * | 2021-09-15 | 2021-12-10 | 中国建设银行股份有限公司 | 一种dcgw集群告警方法及系统 |
Non-Patent Citations (2)
Title |
---|
蔡凌;汪晋宽;王翠荣;: "基于丢包率预测的多路径网络负载均衡策略", 东北大学学报(自然科学版), no. 06 * |
贾晓燕;: "一种基于通信网络的车队控制方法", 兰州理工大学学报, no. 02 * |
Also Published As
Publication number | Publication date |
---|---|
CN115378795B (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10601643B2 (en) | Troubleshooting method and apparatus using key performance indicator information | |
JP7009560B2 (ja) | プロセス制御システムに冗長性を提供するための方法および装置 | |
US20190205153A1 (en) | System and method of dynamically assigning device tiers based on application | |
US20130308471A1 (en) | Detecting error conditions in standby links | |
CN108377201B (zh) | 网络异常感知方法、装置、设备及计算机可读存储介质 | |
Cotroneo et al. | A fault correlation approach to detect performance anomalies in virtual network function chains | |
US10545817B2 (en) | Detecting computer system anomaly events based on modified Z-scores generated for a window of performance metrics | |
US11544138B2 (en) | Framework for anomaly detection and resolution prediction | |
EP2741439B1 (en) | Network failure detecting method and monitoring center | |
US20160119181A1 (en) | Network state monitoring system | |
KR102469441B1 (ko) | 가상 게이트웨이 클러스터 전역 장애에 대한 모니터링 방법 및 장치 | |
CN112702198B (zh) | 异常根因定位方法、装置、电子设备及存储介质 | |
US11388109B2 (en) | Hierarchical capacity management in a virtualization environment | |
KR20200014255A (ko) | 네트워크 장애 모니터링 서버 및 그 동작 방법 | |
CN115378795B (zh) | 服务器网络质量监控方法、装置和电子设备及存储介质 | |
CN110198230A (zh) | 应用的监控方法、装置、存储介质和电子装置 | |
KR20200007912A (ko) | 데이터 트래픽을 모니터링하기 위한 방법, 장치 및 시스템 | |
CN108616423B (zh) | 一种脱网设备监测方法以及装置 | |
US20230216771A1 (en) | Algorithm for building in-context report dashboards | |
CN115002001B (zh) | 一种检测集群网络亚健康的方法、装置、设备及介质 | |
CN116016266A (zh) | 一种基于api网关的健康检查实现方法及装置 | |
US11314573B2 (en) | Detection of event storms | |
CN114095394A (zh) | 网络节点故障检测方法、装置、电子设备及存储介质 | |
CN113518020A (zh) | 一种断线回报侦测方法、装置、设备及可读存储介质 | |
JP2011205276A (ja) | 故障検出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |