CN111601329B - 一种端口中断告警的处理方法及装置 - Google Patents

一种端口中断告警的处理方法及装置 Download PDF

Info

Publication number
CN111601329B
CN111601329B CN202010296129.7A CN202010296129A CN111601329B CN 111601329 B CN111601329 B CN 111601329B CN 202010296129 A CN202010296129 A CN 202010296129A CN 111601329 B CN111601329 B CN 111601329B
Authority
CN
China
Prior art keywords
port
bandwidth
communication device
access point
downlink
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010296129.7A
Other languages
English (en)
Other versions
CN111601329A (zh
Inventor
刘晨星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wangsu Science and Technology Co Ltd
Original Assignee
Wangsu Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wangsu Science and Technology Co Ltd filed Critical Wangsu Science and Technology Co Ltd
Priority to CN202010296129.7A priority Critical patent/CN111601329B/zh
Publication of CN111601329A publication Critical patent/CN111601329A/zh
Application granted granted Critical
Publication of CN111601329B publication Critical patent/CN111601329B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/16Central resource management; Negotiation of resources or communication parameters, e.g. negotiating bandwidth or QoS [Quality of Service]
    • H04W28/18Negotiating wireless communication parameters
    • H04W28/20Negotiating bandwidth

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种端口中断告警的处理方法及装置,其中,所述方法包括:在获取到接入点中通信设备端口中断且端口流量不均的告警信息之后,判断中断端口是上联端口还是下联端口;如果是上联端口,则基于所述接入点的剩余可用带宽确定接入点带宽的降量值,并更新所述接入点带宽;如果是下联端口,则基于所述通信设备中非中断下联端口的带宽确定下联通信设备带宽的降量值,并更新所述下联通信设备带宽,其中,所述下联通信设备为所述通信设备下联的下一级通信设备。本发明能够自动化处理线上通信设备的端口中断及流量不均的问题,形成问题的自闭环处理,并且降低了人工成本和异常时间跨度,以及避免了人工处理的失误。

Description

一种端口中断告警的处理方法及装置
技术领域
本发明涉及通信技术领域,特别涉及一种端口中断告警的处理方法及装置。
背景技术
接入点(Point Of Presence,POP)是指在因特网内,由因特网服务提供商为用户接入因特网而提供的点。接入点包括交换机、路由器、服务器和其他通信设备。目前,如果接入点内通信设备的端口发生中断,只有等到客户投诉之后,才会发现,然后由维护人员对中断端口进行处理。但是人工处理方式会存在处理不及时的问题,例如,涉及非工作日处理时间漏洞长达3-4天,客户体验较差。
发明内容
为了解决现有针对端口中断情况的人工处理方式处理不及时的问题,本发明实施例提供了一种端口中断告警的处理方法及装置。所述技术方案如下:
第一方面,提供了一种端口中断告警的处理方法,所述方法包括:
在获取到接入点中通信设备端口中断且端口流量不均的告警信息之后,判断中断端口是上联端口还是下联端口;
如果是上联端口,则基于所述接入点的剩余可用带宽确定接入点带宽的降量值,并更新所述接入点带宽;
如果是下联端口,则基于所述通信设备中非中断下联端口的带宽确定下联通信设备带宽的降量值,并更新所述下联通信设备带宽,其中,所述下联通信设备为所述通信设备下联的下一级通信设备。
可选的,基于所述接入点的剩余可用带宽确定接入点带宽的降量值的步骤,包括:
利用以下公式计算所述接入点带宽的降量值:
接入点带宽的降量值等于预估流量高峰峰值减去所述剩余可用带宽之和与第一降量系数的乘积;
如果计算得到的降量值是正数,则取该值,否则确定该降量值等于所述剩余可用带宽之和与第二降量系数的乘积。
可选的,其特征在于,如果发生端口中断的通信设备是核心交换机,则所述剩余可用带宽等于所述核心交换机中非中断上联端口的带宽之和。
可选的,如果发生端口中断的通信设备不是核心交换机,而是第n级通信设备则利用以下公式计算所述剩余可用带宽,其中,n为大于等于2的整数,并规定有核心交换机为第1级通信设备,核心交换机下的第n-1级通信设备为第n级通信设备;
其中,Bpop表示所述接入点的剩余可用带宽;表示通信设备/>中非中断上联端口的带宽之和;BDn表示通信设备/>的下联通信设备中除通信设备/>之外其余通信设备的带宽之和;/>表示通信设备/>上联的上一级通信设备。
可选的,基于所述通信设备的非中断下联端口的带宽确定下联通信设备带宽的降量值的步骤包括:
利用以下公式计算所述下联通信设备带宽的降量值:
下联通信设备带宽的降量值等于所述通信设备中非中断下联端口的带宽之和与第三降量系数的乘积。
可选的,基于该降量值更新所述接入点带宽的步骤之后,或者基于该降量值更新所述下联通信设备带宽的步骤之后,包括:
在预设时间段之后检测告警是否已消除;
如果没有消除,判断是否已经连续检测预设次数;
如果已经连续检测预设次数,则反馈处理失败结果,否则执行所述在获取到接入点中通信设备端口中断且端口流量不均的告警信息之后,判断中断端口是上联端口还是下联端口的步骤。
可选的,所述在预设时间段之后检测告警是否已消除的步骤之后,包括:
如果告警已消除并且所述中断端口是上联端口,则判断当前接入点上限带宽是否小于等于所述接入点的剩余可用带宽与第四降量系数的乘积;
如果是,则不更新所述接入点上限带宽,否则将所述接入点上限带宽更新为所述接入点的剩余可用带宽与第四降量系数的乘积。
可选的,所述在预设时间段之后检测告警是否已消除的步骤之后,还包括:
将所述中断端口的状态更新为关闭状态。
第二方面,提供了一种端口中断告警的处理装置,所述装置包括:
获取模块,用于获取接入点中通信设备端口中断且端口流量不均的告警信息;
判断模块,用于在获取到所述告警信息之后,判断中断端口是上联端口还是下联端口;
确定模块,用于当所述中断端口是上联端口时,基于所述接入点的剩余可用带宽确定接入点带宽的降量值;
所述更新模块,用于基于所述接入点带宽的降量值更新所述接入点带宽;
所述确定模块,还用于当所述中断端口是下联端口时,基于所述通信设备中非中断下联端口的带宽确定下联通信设备带宽的降量值,其中,所述下联通信设备为所述通信设备下联的下一级通信设备;
所述更新模块,还用于基于所述下联通信设备带宽的降量值更新所述下联通信设备带宽。
可选的,所述确定模块,用于:
利用以下公式计算所述接入点带宽的降量值:
接入点带宽的降量值等于预估流量高峰峰值减去所述剩余可用带宽之和与第一降量系数的乘积;
如果计算得到的降量值是正数,则取该值,否则确定该降量值等于所述剩余可用带宽之和与第二降量系数的乘积。
可选的,如果发生端口中断的通信设备是核心交换机,则所述剩余可用带宽等于所述核心交换机中非中断上联端口的带宽之和。
可选的,所述确定模块,用于:
当发生端口中断的通信设备不是核心交换机,而是第n级通信设备时,利用以下公式计算所述剩余可用带宽,其中,n为大于等于2的整数,并规定有核心交换机为第1级通信设备,核心交换机下的第n-1级通信设备为第n级通信设备;
其中,Bpop表示所述接入点的剩余可用带宽;表示通信设备/>中非中断上联端口的带宽之和;BDn表示通信设备/>的下联通信设备中除通信设备/>之外其余通信设备的带宽之和;/>表示通信设备/>上联的上一级通信设备。
可选的,所述确定模块,用于:
利用以下公式计算所述下联通信设备带宽的降量值:
下联通信设备带宽的降量值等于所述通信设备中非中断下联端口的带宽之和与第三降量系数的乘积。
可选的,所述装置还包括检测模块,所述检测模块用于:
在预设时间段之后检测告警是否已消除;
如果没有消除,判断是否已经连续检测预设次数;
如果已经连续检测预设次数,则反馈处理失败结果,否则调用所述判断模块,以判断中断端口是上联端口还是下联端口。
可选的,所述更新模块还用于:
如果告警已消除并且所述中断端口是上联端口,则判断当前接入点上限带宽是否小于等于所述接入点的剩余可用带宽与第四降量系数的乘积;
如果是,则不更新所述接入点上限带宽,否则将所述接入点上限带宽更新为所述接入点的剩余可用带宽与第四降量系数的乘积。
可选的,所述更新模块还用于:
如果在预设时间段之后检测到告警已消除,则将所述中断端口的状态更新为关闭状态。
第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面所述的端口中断告警的处理方法。
本发明实施例能够自动化处理线上通信设备的端口中断及流量不均的问题,形成问题的自闭环处理,并且降低了人工成本和异常时间跨度,以及避免了人工处理的失误,具体的,在获取到接入点中通信设备端口上联端口中断且端口流量不均的告警信息之后,能够基于接入点的剩余可用带宽确定接入点带宽的降量值,并基于该降量值更新所述接入点带宽,从而降低引流到该接入点的流量,解决由于上联端口中断影响网络服务的问题;并在获取到接入点中通信设备端口下联端口中断且端口流量不均的告警信息之后,基于该通信设备中非中断下联端口的带宽确定下联通信设备带宽的降量值,并基于该降量值更新下联通信设备带宽,下联通信设备带宽调低之后,能够降低流入发生端口中断的通信设备的下行流量,从而解决下联端口中断对服务的影响。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种端口中断告警的处理方法的流程图;
图2是本发明实施例提供的一种接入点网络框架结构示意图;
图3是本发明实施例提供的一种端口中断告警的处理装置的结构框图;
图4是本发明实施例提供的一种电子设备的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
参照图1,为本发明实施例提供的一种端口中断告警的处理方法的流程图,该方法应用于告警处理系统,也即由告警处理系统来执行,该告警处理系统可以是单独的服务器也可以是服务器组,该方法可以包括以下步骤。
步骤101,获取到接入点中通信设备端口中断且端口流量不均的告警信息。
在实施中,监控系统用于监控接入点中各通信设备端口中断或端口流量不均的情况,并生成告警信息。端口中断告警的原理有:监控系统的流量采集服务器周期性采集各通信设备中每个端口的流量,如果最近一端时间内,例如5分钟内流出流量小于预设流量,例如100B则生成端口终端的告警信息。对于接入点中的服务器,可以采集服务器网卡流量。
端口流量不均告警的原理有:当有一个上联端口或下联端口的端口流量超过本身端口带宽的第一预设百分比,例如90%时,检查该交换机所有上联端口或所有下联端口的端口流量,如果最大值和最小值的差值在该端口带宽的第二预设百分比,例如10%以上,则报这个端口流量不均。
告警信息至少包括发生端口中断的通信设备的IP地址和中断端口号。告警处理系统可以定期从监控系统获取告警信息。
步骤102,在获取到接入点中通信设备端口中断且端口流量不均的告警信息之后,判断中断端口是上联端口还是下联端口。
告警处理系统在获取到告警信息之后,从资源管理平台获取中断端口信息,以判断中断端口是上联端口还是下联端口。本实施例中的上联端口是指连接上行线的端口,下联端口是指连接下行线的端口。
通常通信设备的某个端口发生中断之后,会将本该流入该端口的流量切量到其他端口,从而加重其他端口的负载,从而影响网络服务质量。不过在通信设备的端口发生中断之后,如果流入接入点的流量较低,可能不会影响服务,也不会出现端口流量不均的问题,所以可以暂不进行处理。本实施例在获取到通信设备端口中断且端口流量不均的告警信息之后,也就是说,端口中断问题影响到服务之后才进行告警处理,而不是一旦出现端口中断告警就进行处理,能够避免接入点带宽频繁改动影响日常运营的情况。
在一种实施方式中,告警处理系统还可以在获取到通信设备端口中断的告警信息之后,便可以针对该告警进行处理,即判断中断端口是上联端口还是下联端口,然后继续执行以下步骤。
步骤103,如果是上联端口,则基于所述接入点的剩余可用带宽确定接入点带宽的降量值,并更新所述接入点带宽。
接入点是因特网服务提供商的本地接入点,是流量调度、规划的最小单位。一般情况下一个节点对应一个接入点,但也可以对应多个接入点。在实施中,系统资源运营分析平台可以基于接入点带宽调度切量到该接入点的流量,如果接入点中的某个上联端口中断,会导致接入点的流量处理能力下降,所以可以基于确定的降量值调低原本的接入点带宽,使资源运营分析平台可以少引流一些流量到这个接入点中,以解决端口中断对服务的影响。
接入点通常包括一个核心交换机,核心交换机位于接入点的核心层(网络主干部分),核心交换机下可以连接多个分支链路,以实现网络扩展。参照图2,为接入点的网络框架结构示意图,核心交换机连接多个交换机,核心交换机的下联交换机连接服务器和客户端。需要说明的是,图2所示的接入点网络框架结构示意图为示例性说明,本发明实施例不对接入点的网络框架结构进行具体限定。
告警处理系统在确定接入点带宽的降量值时,可以利用以下公式计算接入点带宽的降量值:
接入点带宽的降量值等于预估流量高峰峰值减去所述剩余可用带宽之和与第一降量系数的乘积。
如果利用上述公式计算得到的降量值是正数,则取该值,否则确定该降量值等于所述剩余可用带宽之和与第二降量系数的乘积。
上述第一降量系数与第二降量系数是通过实验得出的经验值,并且可以根据不同的情况取不同的值,例如第一降量系统为0.93,第二降量系统为0.07。本发明实施例不对第一降量系数与第二降量系数的取值进行具体限定。
以下具体说明接入点的剩余可用带宽的计算方式。
如果发生端口中断的通信设备是核心交换机,则接入点的剩余可用带宽等于核心交换机中非中断上联端口的带宽之和。
如果发生端口中断的通信设备不是核心交换机,而是第n级通信设备则利用以下公式计算所述剩余可用带宽,其中,n为大于等于2的整数,并规定有核心交换机为第1级通信设备,核心交换机下的第n-1级通信设备为第n级通信设备;
其中,Bpop表示所述接入点的剩余可用带宽;表示通信设备/>中非中断上联端口的带宽之和;BDn表示通信设备/>的下联通信设备中除通信设备/>之外其余通信设备的带宽之和;/>表示通信设备/>上联的上一级通信设备。
基于上述计算接入点剩余可用带宽的公式,可得,如果第2级的某个通信设备的端口发生中断,则/>其中,/>表示通信设备/>中非中断上联端口的带宽之和;BD2表示核心交换机的下联通信设备中,也即第2级通信设备中除通信设备/>之外其余通信设备的带宽之和。
例如,在如图2的接入点网络框架中,如果交换机A的某个上联端口发生中断,那么等于交换机A中非中断上联端口的带宽之和,BD2等于交换机B的带宽。也就是说,当前接入点的剩余可用带宽等于交换机A中非中断上联端口的带宽之和加上交换机B的带宽。
基于上述计算接入点剩余可用带宽的公式,还可得,如果第3级的某个通信设备的端口发生中断,则/>其中,/>表示通信设备/>中非中断上联端口的带宽之和;BD3表示通信设备/>的下联通信设备中除通信设备/>之外其余通信设备的带宽之和;/>表示通信设备/>上联的上一级通信设备;BD2表示第2级通信设备中除通信设备/>之外其余通信设备的带宽之和。
例如,在如图2的接入点网络框架中,如果交换机A1的某个上联端口发生中断,那么等于交换机A1中非中断上联端口的带宽之和,BD3等于交换机A2至交换机Am这些交换机的带宽之和,BD2等于交换机B的带宽。也就是说,当前接入点的剩余可用带宽等于交换机A中非中断上联端口的带宽之和加上交换机B的带宽。
告警处理系统在确定接入点带宽的降量值时,可以通过资源运营分析平台查询预估流量高峰峰值。所述预估流量高峰峰值是指当天单位时间内流入接入点流量的最高值。告警处理系统还可以从基于告警信息从资源管理平台获取发生端口中断的通信设备中非中断上联端口信息列表,以计算该通信设备中非中断下联端口的带宽之和。以及,从资源管理平台获取所需的通信设备的带宽,以计算接入点的剩余可用带宽。
告警处理系统在计算得到接入点带宽的降量值之后,可以将接入点名称和降量值传递给资源运营分析平台,从而通过调用资源运营分析平台更新接入点带宽,新的接入点带宽等于原接入点带宽减去降量值。接入点带宽降低,能够使资源运营分析平台可以少引流一些流量到这个接入点中,解决端口中断对服务的影响。
步骤104,如果是下联端口,则基于所述通信设备中非中断下联端口的带宽确定下联通信设备带宽的降量值,并更新所述下联通信设备带宽。
其中,所述下联通信设备为发生端口中断的通信设备下联的下一级通信设备。
告警处理系统在确定下联通信设备带宽的降量值时,可以利用以下公式计算下联通信设备带宽的降量值:
下联通信设备带宽的降量值等于所述通信设备中非中断下联端口的带宽之和与第三降量系数的乘积。
上述第三降量系数是通过实验得出的经验值,并且可以根据不同的情况取不同的值,例如第三降量系统为0.1。本发明实施例不对第三降量系数取值进行具体限定
例如,在如图2所示的接入点网络框架图中,如果核心交换机的某个下联端口发生中断,那么核心交换机的下联交换机带宽的降量值等于核心交换机中剩余非中断下联端口的带宽之和。此处计算得到的降量值为交换机A与交换机B需调低的带宽之和。
再例如,在如图2所示的接入点网络框架图中,如果交换机A的某个下联端口发生中断,那么交换机A的下联交换机带宽的降量值等于交换机A中剩余非中断下联端口的带宽之和。此处计算得到的降量值为交换机A1至交换机Am需调低的带宽之和。
告警处理系统在确定下联通信设备带宽的降量值时,可以基于告警信息从资源管理平台获取发生端口中断的通信设备中非中断下联端口信息列表,以计算该通信设备中非中断下联端口的带宽之和。
告警处理系统在计算得到下联通信设备带宽的降量值之后,可以将全部下联通信设备的IP地址以及降量值传递给资源运营分析平台,从而通过调用资源运营分析平台更新下联通信设备带宽,新的下联通信设备带宽等于原下联通信设备带宽减去降量值。此处告警处理系统计算得到的降量值是所有下联通信设备需调低的带宽之和,所以在计算得到下联通信设备带宽的降量值之后,可以将该降量值分摊到每个下联通信设备中,从而确定每个下联通信设备需要调低的带宽。下联通信设备带宽调低之后,能够降低流入发生端口中断的通信设备的下行流量,从而解决下联端口中断对服务的影响。
告警处理系统在更新完接入点带宽,或者在更新完下联通信设备带宽的预设时间段之后,检测告警是否已消除。如果没有消除,判断是否已经连续检测预设次数。如果已经连续检测预设次数,则反馈处理失败结果,否则执行步骤102以及后续相应步骤,继续告警处理。
如果连续检测预设次数之后,告警依然没有消除,则反馈处理失败结果。具体的,告警处理系统可以将处理失败结果返回给监控系统,运维值班人员通过监控上的告警状态,决定是否人工介入处理。
如果在更新完接入点带宽,或者在更新完下联通信设备带宽的预设时间段之后,检测到告警已消除,则更新中断端口的状态,即将中断端口的状态更新为关闭(down)状态。中断端口的状态更新为关闭状态之后,流量就不会被引流到该端口上,从而解决中断端口跑平,以及响应失败的问题。在实施中,告警处理系统可以通过调用资源管理平台更新端口状态。
对于中断端口是上联端口的情况,如果在更新完接入点带宽的预设时间段之后,检测到告警已消除,则更新接入点上限带宽。资源运营分析平台在调度全网流量的分发时,会保证引流到该接入点的带宽,即上述接入点带宽低于接入点上限带宽,以确保接入点网络服务质量。
告警处理系统确定接入点上限带宽的流程包括:调用资源管理平台查询当前接入点上限带宽,然后判断当前接入点上限带宽是否小于等于所述接入点的剩余可用带宽与第四降量系数的乘积;如果是,则不更新所述接入点上限带宽,否则将所述接入点上限带宽更新为所述接入点的剩余可用带宽与第四降量系数的乘积,并调用资源管理平台更新接入点上限带宽。该第四降量系数是通过实验得出的经验值,并且可以根据不同的情况取不同的值,例如第四降量系统为0.9。本发明实施例不对第四降量系数的取值进行具体限定。
针对中断端口的状态的更新或者接入点上限带宽的更新,如果资源管理平台处理失败,并且经过几次重试之后仍失败,告警处理系统可以将处理失败结果反馈给监控系统,运维值班人员可以通过告警信息识别问题,然后进行人工处理。
本发明实施例能够自动化处理线上通信设备的端口中断及流量不均的问题,形成问题的自闭环处理,并且降低了人工成本和异常时间跨度,以及避免了人工处理的失误,具体的,在获取到接入点中通信设备端口上联端口中断且端口流量不均的告警信息之后,能够基于接入点的剩余可用带宽确定接入点带宽的降量值,并基于该降量值更新所述接入点带宽,从而降低引流到该接入点的流量,解决由于上联端口中断影响网络服务的问题;并在获取到接入点中通信设备端口下联端口中断且端口流量不均的告警信息之后,基于该通信设备中非中断下联端口的带宽确定下联通信设备带宽的降量值,并基于该降量值更新下联通信设备带宽,下联通信设备带宽调低之后,能够降低流入发生端口中断的通信设备的下行流量,从而解决下联端口中断对服务的影响。
参照图3,为本发明实施例提供的一种端口中断告警的处理装置的结构框图,该装置包括:
获取模块301,用于获取接入点中通信设备端口中断且端口流量不均的告警信息;
判断模块302,用于在获取到所述告警信息之后,判断中断端口是上联端口还是下联端口;
确定模块303,用于当所述中断端口是上联端口时,基于所述接入点的剩余可用带宽确定接入点带宽的降量值;
所述更新模块304,用于基于所述接入点带宽的降量值更新所述接入点带宽;
所述确定模块303,还用于当所述中断端口是下联端口时,基于所述通信设备中非中断下联端口的带宽确定下联通信设备带宽的降量值,其中,所述下联通信设备为所述通信设备下联的下一级通信设备;
所述更新模块304,还用于基于所述下联通信设备带宽的降量值更新所述下联通信设备带宽。
优选的,所述确定模块303,用于:
利用以下公式计算所述接入点带宽的降量值:
接入点带宽的降量值等于预估流量高峰峰值减去所述剩余可用带宽之和与第一降量系数的乘积;
如果计算得到的降量值是正数,则取该值,否则确定该降量值等于所述剩余可用带宽之和与第二降量系数的乘积。
优选的,如果发生端口中断的通信设备是核心交换机,则所述剩余可用带宽等于所述核心交换机中非中断上联端口的带宽之和。
优选的,所述确定模块303,用于:
当发生端口中断的通信设备不是核心交换机,而是第n级通信设备时,利用以下公式计算所述剩余可用带宽,其中,n为大于等于2的整数,并规定有核心交换机为第1级通信设备,核心交换机下的第n-1级通信设备为第n级通信设备;
其中,Bpop表示所述接入点的剩余可用带宽;表示通信设备/>中非中断上联端口的带宽之和;BDn表示通信设备/>的下联通信设备中除通信设备/>之外其余通信设备的带宽之和;/>表示通信设备/>上联的上一级通信设备。
优选的,所述确定模块303,用于:
利用以下公式计算所述下联通信设备带宽的降量值:
下联通信设备带宽的降量值等于所述通信设备中非中断下联端口的带宽之和与第三降量系数的乘积。
优选的,所述装置还包括检测模块,所述检测模块用于:
在预设时间段之后检测告警是否已消除;
如果没有消除,判断是否已经连续检测预设次数;
如果已经连续检测预设次数,则反馈处理失败结果,否则调用所述判断模块302,以判断中断端口是上联端口还是下联端口。
优选的,所述更新模块304还用于:
如果告警已消除并且所述中断端口是上联端口,则判断当前接入点上限带宽是否小于等于所述接入点的剩余可用带宽与第四降量系数的乘积;
如果是,则不更新所述接入点上限带宽,否则将所述接入点上限带宽更新为所述接入点的剩余可用带宽与第四降量系数的乘积。
优选的,所述更新模块304还用于:
如果在预设时间段之后检测到告警已消除,则将所述中断端口的状态更新为关闭状态。
本发明实施例能够自动化处理线上通信设备的端口中断及流量不均的问题,形成问题的自闭环处理,并且降低了人工成本和异常时间跨度,以及避免了人工处理的失误,具体的,在获取到接入点中通信设备端口上联端口中断且端口流量不均的告警信息之后,能够基于接入点的剩余可用带宽确定接入点带宽的降量值,并基于该降量值更新所述接入点带宽,从而降低引流到该接入点的流量,解决由于上联端口中断影响网络服务的问题;并在获取到接入点中通信设备端口下联端口中断且端口流量不均的告警信息之后,基于该通信设备中非中断下联端口的带宽确定下联通信设备带宽的降量值,并基于该降量值更新下联通信设备带宽,下联通信设备带宽调低之后,能够降低流入发生端口中断的通信设备的下行流量,从而解决下联端口中断对服务的影响。
本发明实施例还提供了一种电子设备,如图4所示,包括处理器001、通信接口002、存储器003和通信总线004,其中,处理器001,通信接口002,存储器003通过通信总线004完成相互间的通信,
存储器003,用于存放计算机程序;
处理器001,用于执行存储器003上所存放的程序时,实现上述端口中断告警的处理方法,该方法包括:
在获取到接入点中通信设备端口中断且端口流量不均的告警信息之后,判断中断端口是上联端口还是下联端口;
如果是上联端口,则基于所述接入点的剩余可用带宽确定接入点带宽的降量值,并基于该降量值更新所述接入点带宽;
如果是下联端口,则基于所述通信设备中非中断下联端口的带宽确定下联通信设备带宽的降量值,并基于该降量值更新所述下联通信设备带宽,其中,所述下联通信设备为所述通信设备下联的下一级通信设备。
本发明实施例能够自动化处理线上通信设备的端口中断及流量不均的问题,形成问题的自闭环处理,并且降低了人工成本和异常时间跨度,以及避免了人工处理的失误,具体的,在获取到接入点中通信设备端口上联端口中断且端口流量不均的告警信息之后,能够基于接入点的剩余可用带宽确定接入点带宽的降量值,并基于该降量值更新所述接入点带宽,从而降低引流到该接入点的流量,解决由于上联端口中断影响网络服务的问题;并在获取到接入点中通信设备端口下联端口中断且端口流量不均的告警信息之后,基于该通信设备中非中断下联端口的带宽确定下联通信设备带宽的降量值,并基于该降量值更新下联通信设备带宽,下联通信设备带宽调低之后,能够降低流入发生端口中断的通信设备的下行流量,从而解决下联端口中断对服务的影响。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种端口中断告警的处理方法,其特征在于,所述方法包括:
在获取到接入点中通信设备端口中断且端口流量不均的告警信息之后,判断中断端口是上联端口还是下联端口;
如果是上联端口,则基于所述接入点的剩余可用带宽确定接入点带宽的降量值,并更新所述接入点带宽;
如果是下联端口,则基于所述通信设备中非中断下联端口的带宽确定下联通信设备带宽的降量值,并更新所述下联通信设备带宽,其中,所述下联通信设备为所述通信设备下联的下一级通信设备。
2.根据权利要求1所述的方法,其特征在于,基于所述接入点的剩余可用带宽确定接入点带宽的降量值的步骤,包括:
利用以下公式计算所述接入点带宽的降量值:
接入点带宽的降量值等于预估流量高峰峰值减去所述剩余可用带宽之和与第一降量系数的乘积;
如果计算得到的降量值是正数,则取该值,否则确定该降量值等于所述剩余可用带宽之和与第二降量系数的乘积。
3.根据权利要求2所述的方法,其特征在于,如果发生端口中断的通信设备是核心交换机,则所述剩余可用带宽等于所述核心交换机中非中断上联端口的带宽之和。
4.根据权利要求2所述的方法,其特征在于,如果发生端口中断的通信设备不是核心交换机,而是第n级通信设备则利用以下公式计算所述剩余可用带宽,其中,n为大于等于2的整数,并规定有核心交换机为第1级通信设备,核心交换机下的第n-1级通信设备为第n级通信设备;
其中,Bpop表示所述接入点的剩余可用带宽;表示通信设备/>中非中断上联端口的带宽之和;BDn表示通信设备/>的下联通信设备中除通信设备/>之外其余通信设备的带宽之和;/>表示通信设备/>上联的上一级通信设备。
5.根据权利要求1所述的方法,其特征在于,基于所述通信设备的非中断下联端口的带宽确定下联通信设备带宽的降量值的步骤包括:
利用以下公式计算所述下联通信设备带宽的降量值:
下联通信设备带宽的降量值等于所述通信设备中非中断下联端口的带宽之和与第三降量系数的乘积。
6.根据权利要求1所述的方法,其特征在于,基于该降量值更新所述接入点带宽的步骤之后,或者基于该降量值更新所述下联通信设备带宽的步骤之后,包括:
在预设时间段之后检测告警是否已消除;
如果没有消除,判断是否已经连续检测预设次数;
如果已经连续检测预设次数,则反馈处理失败结果,否则执行所述在获取到接入点中通信设备端口中断且端口流量不均的告警信息之后,判断中断端口是上联端口还是下联端口的步骤。
7.根据权利要求6所述的方法,其特征在于,所述在预设时间段之后检测告警是否已消除的步骤之后,包括:
如果告警已消除并且所述中断端口是上联端口,则判断当前接入点上限带宽是否小于等于所述接入点的剩余可用带宽与第四降量系数的乘积;
如果是,则不更新所述接入点上限带宽,否则将所述接入点上限带宽更新为所述接入点的剩余可用带宽与第四降量系数的乘积。
8.根据权利要求6所述的方法,其特征在于,所述在预设时间段之后检测告警是否已消除的步骤之后,还包括:
如果告警已消除,则将所述中断端口的状态更新为关闭状态。
9.一种端口中断告警的处理装置,其特征在于,所述装置包括:
获取模块,用于获取接入点中通信设备端口中断且端口流量不均的告警信息;
判断模块,用于在获取到所述告警信息之后,判断中断端口是上联端口还是下联端口;
确定模块,用于当所述中断端口是上联端口时,基于所述接入点的剩余可用带宽确定接入点带宽的降量值;
更新模块,用于基于所述接入点带宽的降量值更新所述接入点带宽;
所述确定模块,还用于当所述中断端口是下联端口时,基于所述通信设备中非中断下联端口的带宽确定下联通信设备带宽的降量值,其中,所述下联通信设备为所述通信设备下联的下一级通信设备;
所述更新模块,还用于基于所述下联通信设备带宽的降量值更新所述下联通信设备带宽。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-8任一所述的方法步骤。
CN202010296129.7A 2020-04-15 2020-04-15 一种端口中断告警的处理方法及装置 Active CN111601329B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010296129.7A CN111601329B (zh) 2020-04-15 2020-04-15 一种端口中断告警的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010296129.7A CN111601329B (zh) 2020-04-15 2020-04-15 一种端口中断告警的处理方法及装置

Publications (2)

Publication Number Publication Date
CN111601329A CN111601329A (zh) 2020-08-28
CN111601329B true CN111601329B (zh) 2023-08-18

Family

ID=72192017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010296129.7A Active CN111601329B (zh) 2020-04-15 2020-04-15 一种端口中断告警的处理方法及装置

Country Status (1)

Country Link
CN (1) CN111601329B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112583819B (zh) * 2020-12-08 2023-03-24 支付宝(杭州)信息技术有限公司 一种网络接口状态检测方法、装置及设备
CN112667425B (zh) * 2020-12-30 2022-11-11 锐捷网络股份有限公司 端口震荡的处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103179599A (zh) * 2011-12-26 2013-06-26 中国移动通信集团河北有限公司 Wlan性能的监控方法、设备及系统
JP2017063388A (ja) * 2015-09-25 2017-03-30 富士通株式会社 帯域制御装置及び帯域制御システム
CN107306231A (zh) * 2016-04-20 2017-10-31 中国移动通信集团广东有限公司 业务调度方法、设备及系统
CN109218857A (zh) * 2018-07-02 2019-01-15 北京市天元网络技术股份有限公司 网络设备端口状态的检测方法和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004008693A1 (en) * 2002-07-10 2004-01-22 Koninklijke Philips Electronics N.V. Interface selection from multiple networks
US7995493B2 (en) * 2008-12-23 2011-08-09 Airvana, Corp. Estimating bandwidth in communication networks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103179599A (zh) * 2011-12-26 2013-06-26 中国移动通信集团河北有限公司 Wlan性能的监控方法、设备及系统
JP2017063388A (ja) * 2015-09-25 2017-03-30 富士通株式会社 帯域制御装置及び帯域制御システム
CN107306231A (zh) * 2016-04-20 2017-10-31 中国移动通信集团广东有限公司 业务调度方法、设备及系统
CN109218857A (zh) * 2018-07-02 2019-01-15 北京市天元网络技术股份有限公司 网络设备端口状态的检测方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
电力通信网管系统告警标准化研究;施健等;《电力信息与通信技术》;20131015(第10期);全文 *

Also Published As

Publication number Publication date
CN111601329A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
CN109039833B (zh) 一种监控带宽状态的方法和装置
US10855514B2 (en) Fixed line resource management
CN109257200B (zh) 大数据平台监控的方法和装置
CN111601329B (zh) 一种端口中断告警的处理方法及装置
KR101476081B1 (ko) 네트워크 이벤트 관리
JPH08307524A (ja) 通信ネットワークの構成要素の異常状態のリスクを識別する方法と装置
JP2001057555A (ja) ネットワーク異常検出方法及び装置
US20150004964A1 (en) Method and apparatus for telecommunications network performance anomaly events detection and notification
CN108989368B (zh) 一种链路质量的控制方法及监控设备
CN111104260B (zh) 服务升级的监测方法、装置、服务器及存储介质
CN111949421B (zh) Sdk调用方法、装置、电子设备和计算机可读存储介质
JP5271761B2 (ja) 障害対処方法及び装置
AU2019293863B2 (en) Automated network monitoring and control
CN110955587A (zh) 一种待更换设备确定方法及装置
CN111277805B (zh) 一种针对olt上联链路crc错误的处理方法及装置
CN113923096B (zh) 网元故障预警方法、装置、电子设备及存储介质
CN115422504A (zh) 一种配电设备故障风险辨识方法及装置
CN114036032A (zh) 一种实时程序的监控方法及装置
CN111327442B (zh) 基于控制图的投诉预警阈值获取方法及装置
CN107360013A (zh) 一种告警同步方法及系统
CN114422332B (zh) 网络切片控制方法、装置、处理设备及存储介质
CN115834436B (zh) 网络连通性检测方法、装置及存储介质
CN111190788B (zh) 一种数据监控方法、装置、电子设备以及可读介质
CN112099949B (zh) 一种任务分发的控制方法、装置、电子设备及存储介质
US11329868B2 (en) Automated network monitoring and control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant