CN110830284A - 一种基于sdn网络的业务故障监测的方法和装置 - Google Patents

一种基于sdn网络的业务故障监测的方法和装置 Download PDF

Info

Publication number
CN110830284A
CN110830284A CN201810922564.9A CN201810922564A CN110830284A CN 110830284 A CN110830284 A CN 110830284A CN 201810922564 A CN201810922564 A CN 201810922564A CN 110830284 A CN110830284 A CN 110830284A
Authority
CN
China
Prior art keywords
service
sdn
data packets
sdn switch
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810922564.9A
Other languages
English (en)
Inventor
方鹏
庞俊英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Layer Peak Network Technology Co ltd
Original Assignee
Hangzhou Da Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Da Technology Co Ltd filed Critical Hangzhou Da Technology Co Ltd
Priority to CN201810922564.9A priority Critical patent/CN110830284A/zh
Publication of CN110830284A publication Critical patent/CN110830284A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于SDN网络的业务故障监测的方法,包括:获取整个网络上各个SDN交换机的信息;当一条业务建立之后,获取该条业务建立时设定的数据包的数量信息;采集该条业务上的各个SDN交换机上收到的数据包数量信息;对该条业务上的各个SDN交换机上收到的数据包的数量信息进行监控。采用本申请提供的一种基于SDN网络的业务故障监测的方法,通过监测和推送每台设备数据包的数量,通过对比每台设备上数据包的数量,来监控某台SDN交换机的数据包的数量下跌情况,从而监控SDN交换机的故障信息。当网络拓扑较大,设备出现故障时,能快速告诉用户是哪台设备出现故障,从而使得用户快速处理故障,从侧面提升SDN网络的SLA质量。

Description

一种基于SDN网络的业务故障监测的方法和装置
技术领域
本发明涉及SDN领域,具体涉及一种基于SDN网络的业务故障监测的方法。本发明同时涉及一种基于SDN网络的业务故障监测的装置。
背景技术
SDN的组网中一般会有大量且不同类型的交换机组成一张张网络拓扑图。图1是一个非常复杂的网络拓扑图,当网络拓扑较大,且虚拟专线用户数量较多情况下,当某条或者一批业务出现故障,用户如何能快速知道问题出现在哪里,从而去快速处理故障。
传统的做法是,通过traceroute ping的方式来监测网络,但在SDN场景中存在大多数的带外网,所以当网络未发生故障时,业务的交换机发生故障,traceroute的功能是无法满足SDN监测故障的场景,需要用户登录到业务所在的每台设备上去排障,此种做法会大大的降低网络的SLA质量。
在复杂的网络拓扑图中,如果某一台设备出现故障且无法转发的情况下,人工去定位问题会花费大量的时间,从而会严重影响SDN的网络质量。
发明内容
本发明提供一种基于SDN网络的业务故障监测的方法,以解决现有SDN中业务的交换机发生故障时无法满足SDN监测故障的问题。本发明另外提供一种基于SDN网络的业务故障监测的装置。
本发明提供一种基于SDN网络的业务故障监测的方法,包括:
获取整个网络上各个SDN交换机的信息;
当一条业务建立之后,获取该条业务建立时设定的数据包的数量信息;
采集该条业务上的各个SDN交换机上收到的数据包数量信息;
对该条业务上的各个SDN交换机上收到的数据包的数量信息进行监控。
较佳地,所述对该条业务上的各个SDN交换机上收到的数据包数量信息进行监控,具体包括:
判断该条业务上的各个SDN交换机上收到的数据包的数量是否正常,若正常,则展示收到的数据包的数量;若不正常,则定位故障设备的ID并告警。
较佳地,所述判断该条业务上的各个SDN交换机上的收到的数据包的数量是否正常,具体包括:
根据从该条业务上的各个SDN交换机上采集的数据包的数量信息,和该条业务建立时设定的数据包的数量信息,判断该条业务上的SDN交换机上收到的数据包的数量信息与所述业务建立时设定的数据包的数量信息是否相等,若相等,则该条业务上的SDN交换机上的收到的数据包的数量正常,若不相等,则该条业务上的SDN交换机上的收到的数据包的数量不正常。
较佳地,所述告警通过以下方式实现:
在SDN控制器层面是以事件的方式发送,程序会自动处理后,在业务层面以钉钉或微信或邮件方式发送。
较佳地,所述监控通过以下方式实现:
运维监控平台,邮件平台或自主研发的系统监控平台。
本发明还提供一种基于SDN网络的业务故障监测的装置,包括:
获取单元,用于获取整个网络上各个SDN交换机的信息,还用于当一条业务建立之后,获取该条业务建立时设定的数据包的数量信息;
采集单元,用于采集该条业务上的各个SDN交换机上收到的数据包数量信息;
监控单元,用于对该条业务上的各个SDN交换机上收到的数据包的数量信息进行监控。
较佳地,所述监控单元,具体包括:
判断单元,用于判断该条业务上的各个SDN交换机上收到的数据包的数量是否正常;
展示单元,用于若所述判断单元判断正常时,则展示收到的数据包的数量;
告警单元,用于若所述判断单元判断不正常时,则定位获得故障设备的ID并告警。
较佳地,所述判断单元具体用于根据从该条业务上的各个SDN交换机上采集的数据包的数量信息,和该条业务建立时设定的数据包的数量信息,判断该条业务上的SDN交换机上收到的数据包的数量信息与所述业务建立时设定的数据包的数量信息是否相等,若相等,则该条业务上的SDN交换机上的收到的数据包的数量正常,若不相等,则该条业务上的SDN交换机上的收到的数据包的数量不正常。
较佳地,所述告警通过以下方式实现:
在SDN控制器层面是以事件的方式发送,程序会自动处理后,在业务层面以钉钉或微信或邮件方式发送。
较佳地,所述监控通过以下方式实现:
运维监控平台,邮件平台或自主研发的系统监控平台。
与现有技术相比,本发明具有以下优点:
本发明SDN场景中的故障监测是针对网络拓扑中的每台设备通过不同的手段去监控,以告警的方式来通知网络管理,进行故障修复。本发明提供的基于SDN网络的业务故障监测方法,SDN控制器监测和推送每台SDN交换机上数据包的数量,通过对比每台SDN交换机上数据包的数量,来监控某台SDN交换机上数据包的数量下跌情况,从而监控设备故障信息。当网络拓扑较大,设备出现故障时,能快速告诉用户是哪台设备出现故障,从而使得用户快速处理故障,从侧面提升SDN网络的SLA质量。
附图说明
图1是网络拓扑的结构示意图;
图2是本发明实施例一提供的基于SDN网络的业务故障监测的方法的流程示意图;
图3是本发明的具体实施例一提供的SDN场景的结构示意图;
图4是本发明的具体实施例二提供的设备正常的结构示意图;
图5是本发明的具体实施例三提供的设备故障的结构示意图;
图6是本发明的实施例二提供的基于SDN网络的业务故障监测的装置的结构示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。
SDN(Software Defined Network):软件定义网络,由美国斯坦福大学cleanslate计划资助的一个开放式标准协议,后演变成GENI的子项目。SDN技术提出分离网络的控制平面和数据平面,其核心技术openflow将控制功能从网络设备之中分离出来,取而代之的是SDN网元设备维护流表(flow-table),数据报文按照流表中的优先级、匹配规则、转发策略进行转发。
VLL(Virtual Leased Line):虚拟租用专线
SSW(Service Switch):交换机
SLA:正常运行时间保障
Traceroute:是一种计算机网络工具。它可显示数据包在IP网络经过的路由器的IP地址。通过traceroute我们可以知道信息从你的计算机到互联网另一端的主机是走的什么路径。
SDN场景中的故障监测是针对网络拓扑中的每台设备通过不同的手段去监控,以告警的方式来通知网络管理,进行故障修复。
SDN的组网中都会有大量且不同类型的交换机组成一张张网络拓扑图,在复杂的网络拓扑图中,如果某一台设备出现故障且无法转发的情况下,人工去定位问题会花费大量的时间,从而会严重影响SDN的网络质量,本发明将会呈现出一种基于SDN网络的业务故障监测的方法,来解决该问题。
实施例一提供了一种基于SDN网络的业务故障监测方法,如图2所示,包括以下步骤:
步骤S101,SDN控制器获取整个网络上各个SDN交换机的信息。
SDN网络在启动初始化时,会主动获取整个网络上各个SDN交换机的信息,所述信息包括但不限于SDN交换机的网络信息,状态信息,故障信息。
SDN控制器在运行过程中会自动监听接收网络上各个SDN交换机的信息更新上报信息。
SDN控制器将获取的各个SDN交换机的网络信息,状态信息,故障信息,上报给网管中心控制器系统。所述网管中心控制器系统用于显示,管理,配置整个网络上所有SDN交换机和所有业务的网络信息,状态信息和故障信息。
步骤S102,当一条业务建立之后,获取该条业务建立时设定的数据包的数量信息;
所述该条业务建立时设定的数据包的数量信息是指,SDN控制器在每条业务建立之后,SDN控制器会获取该条业务的Meter值,就是每个业务建立时设定的数据包的数量信息。一条业务新建完成之后,SDN交换机会上报给SDN控制器流表中其Meter值是多少,SDN控制器就获取到了对应的Meter限速值,由于限速是固定的,只需要对比一次即可,如果带宽发生变化,SDN交换机会自动向SDN控制器汇报其Meter值从多少变成多少,这时就有一个新的Meter值。
步骤S103,SDN控制器采集该条业务上的各个SDN交换机上收到的数据包数量信息。
SDN控制器通过openflow协议采集已建立的该条业务上的各个SDN交换机的各个端口上接收和发送的数据包数量。
SDN控制器采集SDN交换机上相关端口的接收和发送数据包有两种方式:一种是SDN控制器按业务进行采集;一种是SDN控制按照SDN交换机进行顺序采集。
两种采集方式适合的场景是不同的,SDN控制器按照业务进行采集适合SDN控制同步进行采集,即网管中心控制器系统要求SDN控制以最快的速度获取与业务相关的所有SDN交换机的相关接口的数据包的数量信息。
SDN控制器按照SDN交换机进行顺序采集适合在SDN控制器在空闲时,周期性地发起获取全网或部分SDN交换机的所有端口的数据包的数量信息。
两种采集方式的发起端是不同的,SDN控制器按照业务进行采集适合SDN控制同步进行采集的发起端是网管中心控制器系统。
SDN控制器按照SDN交换机进行顺序采集的发起端是SDN控制器本身。SDN控制器可以使用定时器进行周期性地按照SDN交换机进行顺序采集。
SDN控制器按照业务采集的流程如下:首先SDN控制获取业务标识,根据所述业务标识,SDN控制器可以查询到整个业务所经过的所有SDN交换机,然后SDN控制器查询到每个SDN交换机的状态和网络信息。根据获取的网络和状态信息,SDN控制器依次向每一个SDN交换机发送获取SDN交换机的端口接收和发送数据包的数量的请求。所述获取SDN交换机的端口可以分为两种方式,一种是获取所有端口信息,一种是获取指定与业务相关的端口信息。SDN交换机接收到SDN控制器的查询端口接收和发送数据包数量的请求后,对查询端口接收和发送数据包数量的请求进行分析,获取其中的需要查询的端口信息和查询命令信息。所述查询命令信息分类为:查询接收数据包数量,查询发送数据包数量,查询接收发送数据包数量。SDN交换机根据获取的查询的端口信息和查询命令信息,对自身相关端口接收和发送数据包进行计算,获取相关数量;SDN交换机获取到相关端口的接收和发送数量后,通过openflow协议,将数据发送给SDN控制器。SDN控制器接收到SDN交换机的openflow消息后,进行解析,获取与SDN交换机相关的数据后,完成信息的采集。
SDN控制器按照交换机进行顺序采集的流程如下:首先SDN控制获取需要查询的SDN交换机的状态和网络信息。根据获取的网络和状态信息,SDN控制器依次向每一个SDN交换机发送获取SDN交换机的端口接收和发送数据包的数量。SDN交换机接收到SDN控制器的查询端口接收和发送数据包数量的请求后,对查询端口接收和发送数据包数量的请求进行分析,获取其中的需要查询的端口信息和查询命令信息。SDN交换机根据获取的查询的端口信息和查询命令信息,对SDN交换机相关端口接收和发送数据包进行计算,获取相关数据;SDN交换机获取到相关端口的接收和发送数量后,通过openflow协议,将数据发送给SDN控制器。SDN控制器接收到SDN交换机的openflow消息后,进行解析,获取与SDN交换机相关的数据后,完成信息的采集。
所述SDN交换机相关端口接收和发送数据包进行计算包括但不限于以下两种方式,一种为同步计算,一种为定时更新计算。
所述同步计算即是指,当SDN交换机准备统计相关端口的接收或发送数据包数量时,首先获取当前待查端口的接收或发送数据包数量,然后启动定时器,当定时器超时后,再次统计当前待查端口的接收或发送数据包数量。两个数量的差值,即是SDN控制器需要的数据包的数量信息。
所述统计当前待查端口的接收或发送数据包数量,是指SDN交换机中有个计数器,例如B点在接收A点发送的数据包,就拿在某一时刻B点已经接收的包的总数与在某一时刻后过了一个固定时间粒度B点接收的A点的数据包的总数来说,后者减前者就是在一个固定时间粒度(比如:1分钟,15分钟等)里总共的包数量,拿到的包是字节数,在转换成kb或M。
所述定时更新计算,是指SDN交换机自动维护每一个端口的数据包的数量信息。所述自动维护每一个端口的数据包的数量信息,即是指SDN交换机启动后,设定一个定时器,当定时器超时时,SDN交换机将所有的端口的收发数据包数量保存起来。当定时器第二次超时时,根据当前所有端口的接收发送数据包数量和上次保存的数据包数量,计算出每个端口的接收发送数据包的数量信息。SDN交换机将所有端口的数据包的数量信息保存起来。在以后每次定时器超时后,SDN交换机都更新自己保存的所有的端口的收发数据包数量信息和所有端口的数据包的数量信息.
所述定时更新计算方法可以更加快速的获取所述SDN交换机所有端口的数据包的数量信息。
所述SDN控制器的定时器的时长是可以配置的。所述配置方式可以包括但不限于二种,一种是SDN控制器初始化时根据配置文件获取定时器的时长,然后进行配置。一种是SDN控制器接收网管中心控制器系统配置的定时器时长,然后更新相关的定时器时长;
所述SDN交换机的定时器是可配的。所述配置方式可以包括但不限于二种,一种是SDN交换机初始化时根据配置文件获取定时器的时长,然后进行配置。一种是SDN交换机接收SDN控制器下发的配置的定时器时长,然后更新相关的定时器时长;SDN控制器下发的配置的定时器时长数据可以来自SDN控制器或者网管中心控制器系统。
步骤S104,SDN控制器对该条业务上的各个SDN交换机上收到的数据包的数量信息进行监控。
SDN控制器监听SDN交换机发送的openflow消息,收到openflow消息后,SDN控制器对openflow消息进行解析,获取openflow消息中的SDN交换机标识,端口标识和端口上收到的数据包的数量信息,并对端口的数据包的数量信息进行判断。
监控方式包括但不限于通过运维监控平台,邮件平台或自主研发的系统监控平台等平台进行监控。
较佳地,步骤S103具体包括:判断该条业务上的各个SDN交换机上的收到的数据包的数量是否正常,若正常,则展示收到的数据包的数量;若不正常,则定位获得故障设备的ID并告警。
SDN控制器根据从该条业务上的各个SDN交换机上采集的数据包的数量信息,和每该条业务建立时设定的数据包的数量信息,判断该条业务上的SDN交换机上的收到的数据包的数量信息与所述业务建立时设定的数据包的数量信息是否相等,若该条业务上的SDN交换机上的收到的数据包的数量信息与所述业务建立时设定的数据包的数量信息相等,则该条业务上的SDN交换机上的收到的数据包的数量正常,若该条业务上的任一台或多台SDN交换机上的收到的数据包的数量信息与所述业务建立时设定的数据包的数量信息不相等,则该条业务上的SDN交换机上的收到的数据包的数量不正常,用户的业务将会中断。例如业务经过设备ABC三个节点,拿三台上获取的数据包的数量包的数量对比,如果A设备拿到10万个包,理论上B/C节点一定是10万个包,如果不等于,SDN控制器就会认为B/C节点出故障,发异常的告警。
告警的具体实现可以在SDN控制器层面是以事件的方式发送,程序会自动处理后,在业务层面以钉钉或微信或邮件方式发送。SDN控制器发送一个事件,第三方监控平台收到后会将该事件转换为告警。
由于采用数据包统计的方法可能存在误差,所以在判读是否为告警时,可以增加误差门限的判断。例如:如果误差设置为10%,则当端口数据包的数量少于预期的10%以内,不产生异常告警。
所说误差门限的设置,可以通过网管中心控制器系统进行配置。
所说误差门限可以设置为具体的数量或者设置为百分比。
所说误差门限的统计方法可以设置为多于,少于或者多于少于。所说多于是指数据包的数量大于预期数据包的数量,所述少于是指数据包的数量小于预期数据包的数量。
具体实例一
下面以具体实例对实施例一进行详细说明。
如图3所示,用户的接入侧在OF-SSW3(A端)和OF-SSW7(Z端),当交换机OF-SSW5出现单点故障时,用户的业务将会中断,此时就需要有最快速和最高级别的告警来通知网络管理员来处理,让业务受故障的时间降到最低,下面将详细介绍如何去监控该设备出现故障。
首先SDN控制启动后,获取网路中OF-SSW1,OF-SSW2,OF-SSW3,OF-SSW4,OF-SSW5,OF-SSW6,OF-SSW7,OF-SSW8,OF-SSW9的网络信息,状态信息,故障信息,SDN控制器根据上述信息,生成整个SDN网络拓扑信息,并保存到自己的数据库中。然后将上述信息上报给网管中心控制器系统。所述网络信息包括但不限于网络标识信息,各个端口网速信息,各个端口使用状况信息。
用户A向SDN控制器发送建立业务消息,SDN控制器接收到用户A发送的建立业务消息后,进行解析,获取业务的两端网络标识,SDN控制器根据业务的两端网络标识后,查询整个SDN网络拓扑信息,以及已经存在的业务信息,计算出最优的业务路径。并获取最优路径中的所有节点,也就是OF-SSW3、OF-SSW6、OF-SSW5、OF-SSW8、OF-SSW7,和限速数据为10M.SDN控制器构建openflow消息,并将待配置的流表信息中的Meter值设置为10M,然后SDN控制器通过openflow协议向OF-SSW3、OF-SSW6、OF-SSW5、OF-SSW8、OF-SSW7下发流表配置信息,完成本条VLL(虚拟专线)的建立,并通过流表信息中Meter控制限速为10M,通过流表控制后,通过openflow协议在用户的接入侧两端将会进行限速为10M,也就意味如果用户跑10M的数据包的数量从A到Z,那么这条业务的任何一个节点上数据包的数量不会高于10M。
SDN控制分别向OF-SSW3、OF-SSW6、OF-SSW5、OF-SSW8、OF-SSW7发送openflow消息,用来采集用户的数据包的数量,分别采集OF-SSW3、OF-SSW6、OF-SSW5、OF-SSW8、OF-SSW7和反方向的OF-SSW7、OF-SSW8、OF-SSW5、OF-SSW6、OF-SSW3的数据包的数量。采集数据包的数量的目的:一、为了数据包的数量展示;二、如果某个点的数据包的数量和其他点相比,下跌之后,我们就知道哪个节点或者链路出现故障;
OF-SSW3、OF-SSW6、OF-SSW5、OF-SSW8、OF-SSW7在收到SND控制器的数据包的数量采集消息后,对与业务相关的端口中的数据包进行统计。首先获取与A到Z这各业务相关的接收和发送端口的数据包数量,然后启动定时器,例如设定时时长为1分钟,当到达1分钟时,定时器超时后,通过定时的回调函数,再次统计与A到Z这各业务相关的接收和发送端口的数据包数量。相关端口中两个数量的差值,即是SDN控制器需要的A到Z这个各业务相关的数据包的数量信息。
OF-SSW3、OF-SSW6、OF-SSW5、OF-SSW8、OF-SSW7将计算得到的A到Z这各业务相关的数据包的数量信息发送给SDN控制器。SDN控制器对收到的数据包的数量信息进行判断,如果A到Z这个各业务的限速为10M,SDN控制器采集的过程中发现,OF-SSW5这个点采集到了0M,而OF-SSW3、OF-SSW6、OF-SSW8、OF-SSW7采集的数据包的数量信息为10M,则由此判读,在OF5这个点出现故障,从而通过告警手段通知给网管中心控制器系统,网管中心控制器系统更新显示相关业务和故障的状态,然后网管中心控制器系统通过微信或者短信的接口通过给用户。
如果SDN控制器设置的误差门限为10%,OF-SSW5的采集到了9M,而OF-SSW3、OF-SSW6、OF-SSW8、OF-SSW7采集的数据包的数量信息为10M,则由此判读,在OF5这个点时正常的,不要上报给网管中心控制器系统。
具体实例二
图4为设备正常,数据包的数量正常的示意图;
图4中共有3台SDN交换机第一台交换机,业务接入端可以支持的最大速度为100M,但SDN控制根据整个网络状态设置业务的限速为10M,所以入端数据包的数量被限速到10M,出端数据包的数量被限速到10M,SDN控制器采集每台SDN交换机的数据包的数量,如果获取到的数据包的数量都是10M,说明数据包的数量通行正常。
具体实例三
图5为设备故障,数据包的数量异常的示意图。
图5中共有3台SDN交换机第一台交换机,业务接入端可以支持的最大速度为100M,但SDN控制根据整个网络状态设置业务的限速为10M,所以入端数据包的数量被限速到10M,出端数据包的数量被限速到10M,SDN控制器采集每台SDN交换机的数据包的数量,如果从中间一台SDN交换机获取数据包的数量小于10M,说明设备已经出现故障,此时业务的数据包的数量一定会跌到0,一个端点出现故障会导致整条业务不通,数据包的数量中断,此时借助监控手段可以快速知道问题出现在哪个节点,快速响应了网络或设备故障,保证了SLA的质量。
实施例二
在上述的实施例一中,提供了一种基于SDN网络的业务故障监测方法,与之相对应的,本申请同时提供一种基于SDN网络的业务故障监测装置,请参看图6。
本发明的实施例二提供的一种基于SDN网络的业务故障监测装置,如图6所示,包括:
获取单元11,用于获取整个网络上各个SDN交换机的信息,还用于当一条业务建立之后,获取该条业务建立时设定的数据包的数量信息;
较佳地,在启动初始化时,获取单元11会主动获取整个网络上各个SDN交换机的信息,所述信息包括但不限于SDN交换机的网络信息,状态信息,故障信息。
采集单元12,用于采集该条业务上的各个SDN交换机上收到的数据包数量信息;
较佳地,通过openflow协议采集各SDN交换机的各个端口上接收和发送的数据包数量。
监控单元13,用于对该条业务上的各个SDN交换机上收到的数据包的数量信息进行监控。
较佳地,监控单元16监听SDN交换机发送的openflow消息,收到openflow消息后,对openflow消息后,SDN控制器对消息进行解析,获取其中的SDN交换机标识,端口标识和端口的数据包的数量信息,并对端口的数据包的数量信息进行判断。
监控方式包括但不限于通过运维监控平台,邮件平台或自主研发的系统监控平台等平台进行监控。
较佳地,所述监控单元13,具体包括:判断单元131,展示单元132和告警单元133,具体地,
判断单元131,用于判断该条业务上的各个SDN交换机上收到的数据包的数量是否正常;
较佳地,所述判断单元13具体用于根据从该条业务上的各个SDN交换机上采集的数据包的数量信息,和该条业务建立时设定的数据包的数量信息,判断该条业务上的SDN交换机上收到的数据包的数量信息与所述业务建立时设定的数据包的数量信息是否相等,若相等,则该条业务上的SDN交换机上的收到的数据包的数量正常,若不相等,则该条业务上的SDN交换机上的收到的数据包的数量不正常。
所述每个业务建立时设定的数据包的数量信息是指,SDN控制器在每条业务建立之后,SDN控制器会获取该条业务的Meter值,就是每个业务建立时设定的数据包的数量信息。一条业务新建完成之后,SDN交换机会上报给SDN控制器流表中其Meter值是多少,SDN控制器就获取到了对应的Meter限速值,由于限速是固定的,只需要对比一次即可,如果带宽发生变化,SDN交换机会自动向SDN控制器汇报其Meter值从多少变成多少,这时就有一个新的Meter值。
展示单元132,用于若判断单元131判断正常时,则展示收到的数据包的数量;
告警单元133,用于若判断单元131判断不正常时,则定位获得故障设备的ID并告警。
较佳地,告警的具体实现可以在SDN控制器层面是以事件的方式发送,程序会自动处理后,在业务层面以钉钉或微信或邮件方式发送。
由于采用数据包统计的方法可能存在误差,所以在判读是否为告警时,可以增加误差门限的判断。例如:如果误差设置为10%,则当端口数据包的数量少于预期的10%以内,不产生异常告警。
综上,采用本发明的方法和装置,SDN控制器监测和推送每台SDN交换机的数据包的数量,通过对每台设备上数据包的数量进行对比来监控某台设备数据包的数量下跌情况,从而监控设备故障信息,加强了SLA的质量。
本发明虽然以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (10)

1.一种基于SDN网络的业务故障监测的方法,其特征在于,包括:
获取整个网络上各个SDN交换机的信息;
当一条业务建立之后,获取该条业务建立时设定的数据包的数量信息;
采集该条业务上的各个SDN交换机上收到的数据包数量信息;
对该条业务上的各个SDN交换机上收到的数据包的数量信息进行监控。
2.根据权利要求1所述的基于SDN网络的业务故障监测的方法,其特征在于,所述对该条业务上的各个SDN交换机上收到的数据包数量信息进行监控,具体包括:
判断该条业务上的各个SDN交换机上收到的数据包的数量是否正常,若正常,则展示收到的数据包的数量;若不正常,则定位故障设备的I D并告警。
3.根据权利要求2所述的基于SDN网络的业务故障监测的方法,其特征在于,所述判断该条业务上的各个SDN交换机上的收到的数据包的数量是否正常,具体包括:
根据从该条业务上的各个SDN交换机上采集的数据包的数量信息,和该条业务建立时设定的数据包的数量信息,判断该条业务上的SDN交换机上收到的数据包的数量信息与所述业务建立时设定的数据包的数量信息是否相等,若相等,则该条业务上的SDN交换机上的收到的数据包的数量正常,若不相等,则该条业务上的SDN交换机上的收到的数据包的数量不正常。
4.根据权利要求2所述的基于SDN网络的业务故障监测的方法,其特征在于,所述告警通过以下方式实现:
在SDN控制器层面是以事件的方式发送,程序会自动处理后,在业务层面以钉钉或微信或邮件方式发送。
5.根据权利要求1所述的基于SDN网络的业务故障监测的方法,其特征在于,所述监控通过以下方式实现:
运维监控平台,邮件平台或自主研发的系统监控平台。
6.一种基于SDN网络的业务故障监测的装置,其特征在于,包括:
获取单元,用于获取整个网络上各个SDN交换机的信息,还用于当一条业务建立之后,获取该条业务建立时设定的数据包的数量信息;
采集单元,用于采集该条业务上的各个SDN交换机上收到的数据包数量信息;
监控单元,用于对该条业务上的各个SDN交换机上收到的数据包的数量信息进行监控。
7.根据权利要求6所述的基于SDN网络的业务故障监测的装置,其特征在于,所述监控单元,具体包括:
判断单元,用于判断该条业务上的各个SDN交换机上收到的数据包的数量是否正常;
展示单元,用于若所述判断单元判断正常时,则展示收到的数据包的数量;
告警单元,用于若所述判断单元判断不正常时,则定位获得故障设备的I D并告警。
8.根据权利要求7所述的基于SDN网络的业务故障监测的装置,其特征在于,所述判断单元具体用于根据从该条业务上的各个SDN交换机上采集的数据包的数量信息,和该条业务建立时设定的数据包的数量信息,判断该条业务上的SDN交换机上收到的数据包的数量信息与所述业务建立时设定的数据包的数量信息是否相等,若相等,则该条业务上的SDN交换机上的收到的数据包的数量正常,若不相等,则该条业务上的SDN交换机上的收到的数据包的数量不正常。
9.根据权利要求7所述的基于SDN网络的业务故障监测的装置,其特征在于,所述告警通过以下方式实现:
在SDN控制器层面是以事件的方式发送,程序会自动处理后,在业务层面以钉钉或微信或邮件方式发送。
10.根据权利要求6所述的基于SDN网络的业务故障监测的装置,其特征在于,所述监控通过以下方式实现:
运维监控平台,邮件平台或自主研发的系统监控平台。
CN201810922564.9A 2018-08-14 2018-08-14 一种基于sdn网络的业务故障监测的方法和装置 Pending CN110830284A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810922564.9A CN110830284A (zh) 2018-08-14 2018-08-14 一种基于sdn网络的业务故障监测的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810922564.9A CN110830284A (zh) 2018-08-14 2018-08-14 一种基于sdn网络的业务故障监测的方法和装置

Publications (1)

Publication Number Publication Date
CN110830284A true CN110830284A (zh) 2020-02-21

Family

ID=69547265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810922564.9A Pending CN110830284A (zh) 2018-08-14 2018-08-14 一种基于sdn网络的业务故障监测的方法和装置

Country Status (1)

Country Link
CN (1) CN110830284A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115046A (zh) * 2020-08-25 2020-12-22 深圳市优必选科技股份有限公司 一种软件故障定位方法、装置及终端
CN112787857A (zh) * 2020-12-29 2021-05-11 中国航空工业集团公司西安飞机设计研究所 一种远程数据集中器数据监控与故障定位方法
CN114650306A (zh) * 2020-12-21 2022-06-21 上汽通用汽车有限公司 一种车载以太网通信系统和方法及车辆

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102355383A (zh) * 2011-09-28 2012-02-15 深圳市深信服电子科技有限公司 一种检测网络节点故障的方法和系统
CN105429822A (zh) * 2015-11-30 2016-03-23 东南大学 基于软件定义网络的端到端路径上逐跳链路丢包测量方法
CN105723657A (zh) * 2014-09-26 2016-06-29 华为技术有限公司 交换机、控制器、系统及链路质量检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102355383A (zh) * 2011-09-28 2012-02-15 深圳市深信服电子科技有限公司 一种检测网络节点故障的方法和系统
CN105723657A (zh) * 2014-09-26 2016-06-29 华为技术有限公司 交换机、控制器、系统及链路质量检测方法
CN105429822A (zh) * 2015-11-30 2016-03-23 东南大学 基于软件定义网络的端到端路径上逐跳链路丢包测量方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115046A (zh) * 2020-08-25 2020-12-22 深圳市优必选科技股份有限公司 一种软件故障定位方法、装置及终端
CN112115046B (zh) * 2020-08-25 2023-12-29 深圳市优必选科技股份有限公司 一种软件故障定位方法、装置及终端
CN114650306A (zh) * 2020-12-21 2022-06-21 上汽通用汽车有限公司 一种车载以太网通信系统和方法及车辆
CN112787857A (zh) * 2020-12-29 2021-05-11 中国航空工业集团公司西安飞机设计研究所 一种远程数据集中器数据监控与故障定位方法

Similar Documents

Publication Publication Date Title
US6978302B1 (en) Network management apparatus and method for identifying causal events on a network
US8989002B2 (en) System and method for controlling threshold testing within a network
CA2493525C (en) Method and apparatus for outage measurement
US10270699B2 (en) Automated flow devolvement in an aggregate flow environment
US11570107B2 (en) Method and system for triggering augmented data collection on a network device based on traffic patterns
US12015543B2 (en) Method for configuring performance measurement indication information and related device
JP2006229967A (ja) 高速マルチキャスト・パス切り替え
CN109889350A (zh) 一种用于sdn网络故障中切换路径的方法及装置
EP1999890A1 (en) Automated network congestion and trouble locator and corrector
JP2023126364A (ja) スライスベースネットワークにおける輻輳回避
CN110830284A (zh) 一种基于sdn网络的业务故障监测的方法和装置
US20060168263A1 (en) Monitoring telecommunication network elements
US11882037B2 (en) Entry processing method, network device, and control device
KR20140106235A (ko) 오픈플로우 스위치 및 그 패킷 처리 방법
JP7500770B2 (ja) ネットワーク性能監視方法、ネットワークデバイス、および記憶媒体
EP3132567B1 (en) Event processing in a network management system
US10129086B2 (en) Collection of performance data in a communications network
CN116248479A (zh) 网络路径探测方法、装置、设备及存储介质
WO2018177003A1 (zh) 一种计费方法、相关设备和系统
CN115118635A (zh) 一种时延检测方法、装置、设备及存储介质
CN110380912B (zh) 一种基于snmp的大规模网络链路性能测量方法及系统
CN110113268B (zh) 流量控制方法、装置和服务器
Senthilkumaran et al. Memory and load-aware traffic rerouting (mltr) in openflow-based sdn
CN107248935B (zh) 一种网管发现并监控网元的系统及方法
JP4158480B2 (ja) ネットワーク品質劣化判断システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200415

Address after: 200040 room 1013, No. 250, JIANGCHANG Third Road, Jing'an District, Shanghai

Applicant after: Shanghai layer peak Network Technology Co.,Ltd.

Address before: 310012 506, room 4, 998 West Wen Yi Road, Wuchang Street, Yuhang District, Hangzhou, Zhejiang.

Applicant before: HANGZHOU DAHU TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20200221

RJ01 Rejection of invention patent application after publication