CN107196854A - 一种软件定义网络中数据平面异常处理方法 - Google Patents
一种软件定义网络中数据平面异常处理方法 Download PDFInfo
- Publication number
- CN107196854A CN107196854A CN201710470593.1A CN201710470593A CN107196854A CN 107196854 A CN107196854 A CN 107196854A CN 201710470593 A CN201710470593 A CN 201710470593A CN 107196854 A CN107196854 A CN 107196854A
- Authority
- CN
- China
- Prior art keywords
- flow table
- link
- stream
- path
- flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/28—Routing or path finding of packets in data switching networks using route fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/12—Shortest path evaluation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/22—Alternate routing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/74—Address processing for routing
- H04L45/745—Address table lookup; Address filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/28—Flow control; Congestion control in relation to timing considerations
- H04L47/283—Flow control; Congestion control in relation to timing considerations in response to processing delays, e.g. caused by jitter or round trip time [RTT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/29—Flow control; Congestion control using a combination of thresholds
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
一种软件定义网络中数据平面异常处理方法,针对SDN数据平面中的故障、拥塞问题,通过合理分配或重分配底层资源的方式,使在发生故障、拥塞问题的情况下仍能保证网络服务的健壮性,具体方法为借助SDN的高度逻辑集中可视化特性按需调用路由策略,从而实时确保底层链路的均衡性和健壮性;在为流重新下发需求时,采用了修改流表尽可能少的方式,实现了减少南向接口时延的目的;在拥塞发生后调整策略,在链路达到阈值时便进行调整,且阈值的选取与历史带宽变化有关,通过为具体的流需求寻找新路径,实现了增大流接受率、降低丢包率和时延的目的;本方法借助SDN的可编程性和开放特性,通过软件实现满足了大部分控制器的适配性。
Description
技术领域
本发明涉及软件定义网络中的控制功能研究,特别涉及一种软件定义网络中数据平面异常处理方法;针对SDN(Software Defined Network,软件定义网络) 架构中数据平面内的故障和拥塞问题,做出判断和处理,充分利用SDN的可编程性和全局可控性。
背景技术
随着计算机网络的不断扩大,互联网已经从早期的局部资源共享平台发展到今天覆盖全球的数据通信网络,用户需求也从早期的单纯可达到现在对服务质量、流量工程等多方面的需求,为了解决现有TCP/IP体系结构面临的诸多难题,未来互联网的研究大规模展开,其中包括基于OpenFlow的SDN 技术。ONF组织(开放网络基金会),它认为SDN的最终目标是为软件应用提供一套完整的编程接口,上层的软件可以通过这套接口控制网络中的资源以及经过这些网络资源的流量,并按照应用需求灵活调度流量。2008年,斯坦福大学的Nick Mckeown教授提出了OpenFlow技术,经过多年发展,已经成为SDN的主流南向接口协议之一。
故障和拥塞问题是SDN流量工程下研究的主要问题之一。
故障问题包括控制层故障和数据层故障,数据层故障处理有两种机制,一种是恢复机制,交换机发现链路失效后,将失效信息发送给控制器,控制器为经过失效路径的流重新计算路径,将新的路径添加到交换机上;一种是保护机制,控制器预先计算备份路径,并下发给交换机,节省了交换机和控制器之间的时延。保护机制即主动式故障恢复,包括SDN自带的Fast Failover 机制;已有研究在备份路径方面做出的改进有:前一跳路由、审议式故障恢复。其中前一跳路由仍无法解决备份路径无效的问题;审议式故障恢复结合了保护机制和恢复机制,避免了两者存在的问题,但增加了网络复杂性。为了更快的发现故障,需要进行故障检测,故障检测是为故障恢复服务的。常见的链路故障检测机制,包括LoS(Lossof Signal),LLDP和BFD(Bidirectional Forwarding Detection)等其他技术。其中LLDP和LoS应用于链路恢复机制,能够检测到所有的故障,均需要控制器的参与。BFD专注于转发平面的故障检测,使网络能够快速检测故障,主要用于链路保护机制。BFD提升了故障检测时间,但是需要和路由协议、MPLS等协议进行交互,开发实现部署需要的接口难度和工作量都很大。
SDN网络中的拥塞又分为控制层拥塞、数据链路层拥塞、接口拥塞。对于数据链路层的拥塞,产生原因包括数据在交换机中滞留时间过长、节点缓存空间太小、对整个网络的无序使用、选路算法的不当、大象流的出现以及处理不当等原因,本质来说都是对底层资源的不合理运用引起的。对于接口的拥塞,产生原因为控制器与底层链路的大量通信导致的,本质来说也是由于选路的不合理引起。
对于处理拥塞问题,最终都归结为重新选路的问题,现在有的解决方案有以下几种,针对大象流到来而引起的链路拥塞,提出改进的多路径路由算法解决,但都过度强调通过数据流的拆分来进行负载均衡,且没有提出相应有效地子流重组的方法;利用AQM算法,通过SDN提供的全局视图和集中式管控的能力,来解决由于交换机缓存引起的拥塞问题,但不能达到预防拥塞的目的;通过蚁群算法实现负载均衡,达到网络避免拥塞的目的,但仅在流初始到来时进行选路,不考虑过后会产生的链路变化;同时这些方案大多均考虑单种网络状况,但实际上进行拥塞避免后仍可能会发生拥塞,故都应该进行考虑。
到目前为止,当前SDN网络异常问题的解决方案,分别是链路恢复策略和链路保护策略。链路恢复策略即资源非预留型,当异常出现之后,需要一个特殊的信号来通知建立恢复路径,需要有控制器的参与。缺点是发生异常后要引入控制器,并且从新下发流表,增加了恢复的延迟。链路保护策略即预留资源方式,发生异常时不需要触发额外的信号,不需要控制器的参与。缺点是牺牲部分存储开销,有点是降低故障恢复延迟和故障恢复过程的通信开销。
发明内容
为了克服上述现有技术的缺陷,本发明的目的在于提供一种软件定义网络中数据平面异常处理方法,针对SDN网络环境中数据平面内的异常问题,包括故障问题和拥塞问题,针对故障问题,提出了根据周期性底层信息发现故障的模块,设计基于路径保护机制的数据平面故障处理策略;针对拥塞问题,主要通过解决已发生的拥塞和避免拥塞进行,设计一种基于动态阈值的链路拥塞处理策略;本发明利用SDN的特性,通过获得的底层状况,进行自动化处理故障和拥塞的操作。
为了达到上述目的,本发明的具体技术方案如下:
一种软件定义网络中数据平面异常处理方法,包括以下步骤:
(1)、控制器获取底层链路的拓扑信息,应用层各模块进行信息的分析和处理;使用深度优先搜索算法,计算出拓扑中两两节点对的所有可达路径,存储在表SPT(switchpath table)中;将两两节点对之间的最短路径长度存储在表SML(switch min Length)中;将各链路的带宽信息存储在表LCT(link capacity table)中;两两节点之间下发的路径存储在表HRT(history road table) 中;
(2)、控制器周期性地获取底层拓扑信息和交换机上维护的端口信息 (Port-Status),控制器与应用平面之间利用北向接口实现交互,若链路拓扑发生变化,判断并确定故障类型。
(3)、对于由于故障受影响的流要进行重新选路,根据数据流的发送速度和新信息出现频率,为流表项设置idle_time的值,在重路由下发路径时,多条可选路径中在保证路径短的同时,下发和删除流表少的路径;设计LET 选路方法,并在LET选路结束后增加了检测内容,避免节点重复;
(4)、根据获取的交换机计数器信息,计算出各链路的带宽情况,对比 LCT判断是否发生拥塞;若未达到拥塞处理阈值,则采用拥塞避免的方式进行选路;若达到拥塞处理阈值,则找到需要重新分配带宽资源的流需求,进行重新选路;除了根据底层信息为旧的流重新选路外,当新的流需求到达时,在交换机中查询流表,若有对应的流表,则直接进行转发;否则通过packet_in 消息发送给控制器,控制器重新根据当前状态选路。
所述的步骤二具体如下:
控制器周期性地获取底层拓扑信息和交换机上维护的端口信息 (Port-Status),根据控制器获取的交换机、端口的信息,与原始信息对比后分析故障的具体类型,将故障分为:交换机故障、端口故障、链路故障,若故障为端口故障或链路故障,则受影响的流为通过该链路的流;若故障为交换机故障,则受影响的流为所有经过该交换机的流,即可能为通过多条链路的流。
步骤三所述的对于由于故障受影响的流要进行重新选路,具体步骤如下:
(1)结合SML表和SPT表,找出某一源节点到某一目的节点路径相对短的路径,通过参考表LCT,避免带宽已经不足的路径;通过参考表HRT,找出和原路径重合度较高的新路径,使得下发流表和删除流表的数目减少,从而减少南向接口传输的时延。
(2)通过SDN对数据平面集中管理特性,找到下发和删除流表最少的新路径,即设计了LET选路方法,利用idle_time以及前几种选路的方式,选取下发流表最少且跳数相对较短的路径。
所述的步骤四中拥塞处理阈值的选取方法通过控制器周期性地发送查询请求,进行对底层链路的探知,动态确定阈值,具体为:
(1)采用等时间间隔的方式进行获取,设定时间间隔为t,对于每一个交换机,每隔时间t收集一次其上的统计信息;
(2)根据得到的rx_bytes(收到的比特数)和tx_bytes(传出的比特数),算出端口的发送流量和接受流量,进而得到两端口间的流量;用端口最大带宽减去当前流量带宽,可得到端口剩余流量;具体的,设链路i在时间t的带宽为Ut,获取数据平面链路状态的周期为T,在t+nT时刻阈值设置为公式1 所示,其中为之前每隔T带宽减少的平均值,ΔU为最近一次带宽减少的值,用两者之间较大的值作为判断某条链路拥塞避免的阈值,当在t+nT时刻测量到某链路的带宽值小于其阈值时,暂时将其链路设置为不可用,避免将其继续分配给新到来的流:
所述的步骤四中重新选路,具体为:
(1)控制器周期性地获取了底层信息,假设已达到拥塞避免阈值,则找出需要控制流量的链路,找出需要控制流量的链路上的交换机,并通过控制器查出这些交换机上的流表,根据流表信息获取流的源节点和目的节点。
(2)由选路算法为这些需求进行重新选路,重新下发流表,并将旧流表删除;当下发了流表时,规定其生命时间timeout为t,即流表项的idle_time 字段设置为t;当长时间未有流到来,t时间过后,对应的流表被自动删除;若有流到来,则将其存在时间重新归零;由此,已存在的流表即说明近期有该流表对应的流到来,当控制器要重新进行流表下发的时候,通过这些流表项找寻对应的需求。
(3)当有流请求到来并查询不到对应流表的时候,通过packet_in消息将流的需求告知算法,算法计算并通过控制器下发流表。
所述的步骤四中重新选路时,针对SDN环境做了如下改进:
(1)进行选路时,控制所选路径为最短路径的X(可由网络管理人员进行配置)倍范围内,从而防止过多绕路,避免传输时延过高。
(2)通过选路时,在满足条件的基础上尽可能多地和旧路径重合,从而防止大量流表下发而引起的南向接口拥塞。
(3)通过最短路径进行选路时,同时结合底层链路状态进行判断,选取满足条件的最短路径。
本发明实现了对SDN中数据平面的异常处理,从底到上具体涉及数据平面、控制平面和应用平面。根据软件定义网络具体实现架构,本发明提出了在应用层面进行故障和拥塞处理的理念。通过在应用层引入底层数据获取分析和算法,打破了原有的改变控制层和数据链路层的方式,充分利用软件定义网络的可编程性和开放特性,使得该方案能够方便快捷的部署使用,将来可方便地更换其他控制器,简化网络管理人员的工作。
本发明具有以下有益效果:
本发明提出软件定义网络中数据平面异常处理方法。对于数据平面内故障问题,已存在的策略基本为重新选路,但没有一个细致故障分类算法,并且没有考虑到控制层到数据层流表下发和数据层流表删除的时延,没有考虑新路径的过度绕路;对于数据平面内拥塞问题,基本局限于集中特定情况产生的拥塞,且很多解决局限于算法,却不考虑是否能在SDN架构中实现。而在本发明中,首先根据底层拓扑和交换机端口计数器信息来判断是否发生拥塞或故障,并对故障和拥塞程度进行了分类和分情况,本发明关注了故障选路中新路径生成时延,利用SMLT表减少这一时延,并关注了新路径流表下发和删除的时延,在选择路径时避免节点重复;本发明提出的故障处理模块能够及时获取故障信息,并为受影响的流安排新路径,使数据不会因为故障产生更多的丢失,同时减少重新选路的延时;本发明提出的动态阈值设定,根据网络的实时变化设定阈值,具有很高的灵活性、实时性;本发明获取底层信息的方式,通过控制器提供的接口获取并计算,不需借用第三方的应用,减少了安装和使用费用。与已存在的异常处理方案,需要对底层和协议进行改变相比,本发明的执行将更加上层化,更容易进行部署和实施。
附图说明:
图1为整体框架图;
图2为基于可靠性的选路策略框架示意图;
图3为基于路径保护机制的故障处理整体流程图
图4为故障类型判断流程图;
图5为故障处理中寻找新路径的流程图
图6为拥塞处理方法流程图
图7为OpenFlow v3.0中流表项结构图
具体实施方式:
下面结合附图对本发明进一步地详细阐述。
参考图1中展示了本发明的整体框架,策略的主体部分通过北向接口获得所需的数据,将数据上发到应用层进行处理,充分利用了网络的可编程性,对网络进行的拥塞避免也通过北向接口来进行下发实现,具体地由控制层和数据链路层之间的协议来实现。该发明的优势在于网络管理人员只需进行配置和部署即可方便地实现功能,使得底层的控制器和网络面向管理人员透明。图2是基于可靠性的选路策略的框架示意图。三部分均部署在控制层之上。信息收集部分负责对底层数据进行收集和存储,方便下一步的使用,即为图 1当中的数据处理模块和数据库存储模块;触发判断部分则根据信息收集部分的数据进行底层拓扑分析和链路带宽等量的计算,并进行故障和拥塞判断;处理部分为对应的处理,发生故障,则直接进行故障处理;出现拥塞,则根据链路的带宽情况合理的进行拥塞避免或拥塞处理的操作。
一种软件定义网络中数据平面异常处理方法,包括以下步骤:
(1)、控制器获取底层链路的拓扑信息,应用层各模块进行信息的分析和处理;使用深度优先搜索算法,计算出拓扑中两两节点对的所有可达路径,存储在表SPT(switchpath table)中;将两两节点对之间的最短路径长度存储在表SML(switch min Length)中;将各链路的带宽信息存储在表LCT(link capacity table)中;两两节点之间下发的路径存储在表HRT(history road table) 中;
(2)、以Floodlight为例,控制器通过自身FloodlightProvider、TopologyService等模块,处理与交换机之间的连接,控制器周期性地获取底层拓扑信息和交换机上维护的端口信息(Port-Status),控制器与应用平面之间利用北向接口实现交互,若链路拓扑发生变化,判断并确定故障类型。
参考图3,本图为故障处理的整体流程图,由图可见,本发明中的故障处理策略是基于底层信息分析、故障类型判断、故障处理于一体的方式,本发明的故障处理方式是根据具体故障,分析受影响的流之后为其重新下发的新路径的过程,本质来说即为在备份路径中查询符合条件的新路径。本发明所提出的基于路径保护机制的故障处理策略,对故障的发现、判断、重新选路的过程进行了详细的设计,在重新选路的过程中,创造性的不仅关注路径的跳数,还关注新下发流表的数目。在进行故障处理时,所述方案首先进行了故障类型判断,图4描述了根据链路信息来判断故障类型的过程。Floodlight 中可以实现对端口故障的发现,当交换机端口发生故障时,会发送port-status 消息给控制器,控制器通过周期性的监听实现对故障的发现。由于Floodlight 没有将这个功能开放成北向接口,所以通过Floodlight开放的接口来设计判断故障及其类型的方案。本文关注数据平面的交换故障、端口故障、链路故障。无论发生哪种故障,最终均会造成链路与初始链路信息发生变化。当发生变化后,再根据获取的交换机信息、端口信息具体分析故障是由哪种类型产生的。
(3)、对于由于故障受影响的流要进行重新选路,根据数据流的发送速度和新信息出现频率,为流表项设置idle_time的值,在重路由下发路径时,多条可选路径中在保证路径短的同时,下发和删除流表少的路径;设计LET 选路方法,并在LET选路结束后增加了检测内容,避免节点重复;
参考图5,本图描述了在判断出故障类型后为受影响的流进行重新选路的过程。分析了三种不同的选路思想,发生故障重新选路的方式有几种思想,一为从源节点重新进行选路(FND),但这种方式在路径很长的情况下将造成下发流表过多;二为从故障处进行最短路径选路(LND);三为绕过故障的选路(PBD)。结合FND、LND、PBD三种选路方式,形成优化的选路方式LET 选路方式,对比选出三种选路方式结果中满足最少更换流表的新路由。同时,为避免前后路段的重复,提出了绕路检测。
(4)、根据获取的交换机计数器信息,计算出各链路的带宽情况,对比 LCT判断是否发生拥塞;若未达到拥塞处理阈值,则采用拥塞避免的方式进行选路;若达到拥塞处理阈值,则找到需要重新分配带宽资源的流需求,进行重新选路;除了根据底层信息为旧的流重新选路外,当新的流需求到达时,在交换机中查询流表,若有对应的流表,则直接进行转发;否则通过packet_in 消息发送给控制器,控制器重新根据当前状态选路。
参考图6,本图为拥塞处理的整体流程图,当拥塞发生后的处理过程与故障处理类似,同样是为流需求重新选路的过程。但与故障不同的是,拥塞的判断、阈值的计算以及新路径的计算均需要底层带宽的信息。图中未达到拥塞处理阈值时,选择最大带宽利用率最小的路径,通过这样的选路方式方式,为网络维持了一定的负载均衡,是拥塞避免的操作。具体为:初始化后求得的SPT(switch path table)表以及SML(switch min Length)表。算法初始时,由控制器得到底层的拓扑信息,通过深度优先搜索和最短路径算法可以得到SPT表和SML表的内容,由SPT表每一行可得从一个源节点到其他所有目的节点的所有可能路径,从某一列可得到从其他节点到某一目的节点的所有路径,由SML表可快速查的某源节点的目的节点的最短路径长度。通过这两个表的内容,结合算法获取的底层链路信息,可以求得符合条件的路径。虽然随着网络的增大,SPT表会变得异常庞大,但由于此表只在初始化时经计算获得,后续只作为查询使用,且通过此表能够将选路变得简单快捷,同时充分应用了SDN的特性,所以效益较大。
所述的步骤二具体如下:
控制器周期性地获取底层拓扑信息和交换机上维护的端口信息 (Port-Status),根据控制器获取的交换机、端口的信息,与原始信息对比后分析故障的具体类型,将故障分为:交换机故障、端口故障、链路故障,若故障为端口故障或链路故障,则受影响的流为通过该链路的流;若故障为交换机故障,则受影响的流为所有经过该交换机的流,即可能为通过多条链路的流。
步骤三所述的对于由于故障受影响的流要进行重新选路,具体步骤如下:
(1)结合SML表和SPT表,找出某一源节点到某一目的节点路径相对短的路径,通过参考表LCT,避免带宽已经不足的路径;通过参考表HRT,找出和原路径重合度较高的新路径,使得下发流表和删除流表的数目减少,从而减少南向接口传输的时延。表1即为SPT表。表2即为SML表。
表1
SML | S1 | S2 | S3 | … |
S1 | null | 3 | 4 | … |
S2 | 3 | 1 | 6 | … |
S3 | 4 | 6 | null | … |
… | … | … | … | … |
表2
(2)通过SDN对数据平面集中管理特性,找到下发和删除流表最少的新路径,即设计了LET选路方法,利用idle_time以及前几种选路的方式,选取下发流表最少且跳数相对较短的路径。
所述的步骤四中拥塞处理阈值的选取方法通过控制器周期性地发送查询请求,进行对底层链路的探知,动态确定阈值,具体为:
(1)采用等时间间隔的方式进行获取,设定时间间隔为t,对于每一个交换机,每隔时间t收集一次其上的统计信息;
(2)根据得到的rx_bytes(收到的比特数)和tx_bytes(传出的比特数),算出端口的发送流量和接受流量,进而得到两端口间的流量;用端口最大带宽减去当前流量带宽,可得到端口剩余流量;具体的,设链路i在时间t的带宽为Ut,获取数据平面链路状态的周期为T,在t+nT时刻阈值设置为公式1 所示,其中为之前每隔T带宽减少的平均值,ΔU为最近一次带宽减少的值,用两者之间较大的值作为判断某条链路拥塞避免的阈值,当在t+nT时刻测量到某链路的带宽值小于其阈值时,暂时将其链路设置为不可用,避免将其继续分配给新到来的流:
所述的步骤四中重新选路,具体为:
(1)控制器周期性地获取了底层信息,假设已达到拥塞避免阈值,则找出需要控制流量的链路,找出需要控制流量的链路上的交换机,并通过控制器查出这些交换机上的流表,根据流表信息获取流的源节点和目的节点。
(2)由选路算法为这些需求进行重新选路,重新下发流表,并将旧流表删除;当下发了流表时,规定其生命时间timeout为t,即流表项的idle_time 字段设置为t;当长时间未有流到来,t时间过后,对应的流表被自动删除;若有流到来,则将其存在时间重新归零;由此,已存在的流表即说明近期有该流表对应的流到来,当控制器要重新进行流表下发的时候,通过这些流表项找寻对应的需求。
(3)当有流请求到来并查询不到对应流表的时候,通过packet_in消息将流的需求告知算法,算法计算并通过控制器下发流表。
所述的步骤四中重新选路时,针对SDN环境做了如下改进:
(1)进行选路时,控制所选路径为最短路径的X(可由网络管理人员进行配置)倍范围内,从而防止过多绕路,避免传输时延过高。
(2)通过选路时,在满足条件的基础上尽可能多地和旧路径重合,从而防止大量流表下发而引起的南向接口拥塞。
(3)通过最短路径进行选路时,同时结合底层链路状态进行判断,选取满足条件的最短路径。
参考图7,图中为OpenFlow v3.0中流表项结构。通过流表可以将算法计算出的结果下发给底层交换机,通过对流表的查询和修改可以辅助算法的执行。具体如下,设置流表可以通过交换机超时删除,若我们查询到某流表还在交换机中,说明该流表服务的流正在传输或刚结束传输,如此通过查询流表的匹配域字段,可得到源节点和目的节点,通过流表项的查询,算法获取了那些流需求需要重新规划路径。
Claims (6)
1.一种软件定义网络中数据平面异常处理方法,其特征在于,包括以下步骤:
(1)、控制器获取底层链路的拓扑信息,应用层各模块进行信息的分析和处理;使用深度优先搜索算法,计算出拓扑中两两节点对的所有可达路径,存储在表SPT中;将两两节点对之间的最短路径长度存储在表SML中;将各链路的带宽信息存储在表LCT中;两两节点之间下发的路径存储在表HRT中;
(2)、控制器周期性地获取底层拓扑信息和交换机上维护的端口信息,控制器与应用平面之间利用北向接口实现交互,若链路拓扑发生变化,判断并确定故障类型;
(3)、对于由于故障受影响的流要进行重新选路,根据数据流的发送速度和新信息出现频率,为流表项设置idle_time的值,在重路由下发路径时,多条可选路径中在保证路径短的同时,下发和删除流表少的路径;设计LET选路方法,并在LET选路结束后增加了检测内容,避免节点重复;
(4)、根据获取的交换机计数器信息,计算出各链路的带宽情况,对比LCT判断是否发生拥塞;若未达到拥塞处理阈值,则采用拥塞避免的方式进行选路;若达到拥塞处理阈值,则找到需要重新分配带宽资源的流需求,进行重新选路;除了根据底层信息为旧的流重新选路外,当新的流需求到达时,在交换机中查询流表,若有对应的流表,则直接进行转发;否则通过packet_in消息发送给控制器,控制器重新根据当前状态选路。
2.根据权利要求1所述的一种软件定义网络中数据平面异常处理方法,其特征在于,所述的步骤二具体如下:
控制器周期性地获取底层拓扑信息和交换机上维护的端口信息,根据控制器获取的交换机、端口的信息,与原始信息对比后分析故障的具体类型,将故障分为:交换机故障、端口故障、链路故障,若故障为端口故障或链路故障,则受影响的流为通过该链路的流;若故障为交换机故障,则受影响的流为所有经过该交换机的流,即可能为通过多条链路的流。
3.根据权利要求1所述的一种软件定义网络中数据平面异常处理方法,其特征在于,步骤三所述的对于由于故障受影响的流要进行重新选路,具体步骤如下:
(1)结合SML表和SPT表,找出某一源节点到某一目的节点路径相对短的路径,通过参考表LCT,避免带宽已经不足的路径;通过参考表HRT,找出和原路径重合度较高的新路径,使得下发流表和删除流表的数目减少,从而减少南向接口传输的时延;
(2)通过SDN对数据平面集中管理特性,找到下发和删除流表最少的新路径,即设计了LET选路方法,利用idle_time以及前几种选路的方式,选取下发流表最少且跳数相对较短的路径。
4.根据权利要求1所述的一种软件定义网络中数据平面异常处理方法,其特征在于,所述的步骤四中拥塞处理阈值的选取方法通过控制器周期性地发送查询请求,进行对底层链路的探知,动态确定阈值,具体为:
(1)采用等时间间隔的方式进行获取,设定时间间隔为t,对于每一个交换机,每隔时间t收集一次其上的统计信息;
(2)根据得到的rx_bytes—收到的比特数和tx_bytes—传出的比特数,算出端口的发送流量和接受流量,进而得到两端口间的流量;用端口最大带宽减去当前流量带宽,可得到端口剩余流量;具体的,设链路i在时间t的带宽为Ut,获取数据平面链路状态的周期为T,在t+nT时刻阈值设置为公式1所示,其中为之前每隔T带宽减少的平均值,ΔU为最近一次带宽减少的值,用两者之间较大的值作为判断某条链路拥塞避免的阈值,当在t+nT时刻测量到某链路的带宽值小于其阈值时,暂时将其链路设置为不可用,避免将其继续分配给新到来的流:
。
5.根据权利要求1所述的一种软件定义网络中数据平面异常处理方法,其特征在于,所述的步骤四中重新选路,具体为:
(1)控制器周期性地获取了底层信息,假设已达到拥塞避免阈值,则找出需要控制流量的链路,找出需要控制流量的链路上的交换机,并通过控制器查出这些交换机上的流表,根据流表信息获取流的源节点和目的节点;
(2)由选路算法为这些需求进行重新选路,重新下发流表,并将旧流表删除;当下发了流表时,规定其生命时间timeout为t,即流表项的idle_time字段设置为t;当长时间未有流到来,t时间过后,对应的流表被自动删除;若有流到来,则将其存在时间重新归零;由此,已存在的流表即说明近期有该流表对应的流到来,当控制器要重新进行流表下发的时候,通过这些流表项找寻对应的需求;
(3)当有流请求到来并查询不到对应流表的时候,通过packet_in消息将流的需求告知算法,算法计算并通过控制器下发流表。
6.根据权利要求1所述的一种软件定义网络中数据平面异常处理方法,其特征在于,所述的步骤四中重新选路时,针对SDN环境做了如下改进:
(1)进行选路时,控制所选路径为最短路径的X倍范围内,从而防止过多绕路,避免传输时延过高;
(2)通过选路时,在满足条件的基础上尽可能多地和旧路径重合,从而防止大量流表下发而引起的南向接口拥塞;
(3)通过最短路径进行选路时,同时结合底层链路状态进行判断,选取满足条件的最短路径。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710470593.1A CN107196854B (zh) | 2017-06-20 | 2017-06-20 | 一种软件定义网络中数据平面异常处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710470593.1A CN107196854B (zh) | 2017-06-20 | 2017-06-20 | 一种软件定义网络中数据平面异常处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107196854A true CN107196854A (zh) | 2017-09-22 |
CN107196854B CN107196854B (zh) | 2020-08-25 |
Family
ID=59878626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710470593.1A Active CN107196854B (zh) | 2017-06-20 | 2017-06-20 | 一种软件定义网络中数据平面异常处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107196854B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108566295A (zh) * | 2018-03-22 | 2018-09-21 | 西安交通大学 | 一种基于软件定义网络的平面式控制架构的一致性构建方法 |
CN109768924A (zh) * | 2019-02-14 | 2019-05-17 | 山东省计算中心(国家超级计算济南中心) | 一种面向多流共存的sdn网络多链路故障恢复方法及系统 |
CN109981363A (zh) * | 2019-03-22 | 2019-07-05 | 烽火通信科技股份有限公司 | 一种南向接口的适配方法及系统 |
CN109996130A (zh) * | 2018-01-02 | 2019-07-09 | 中国移动通信有限公司研究院 | 基于sdn的光传送网保护恢复方法、设备及存储介质 |
CN110708246A (zh) * | 2019-10-17 | 2020-01-17 | 山东健康医疗大数据有限公司 | 一种基于sdn网络的医疗健康数据传输优化方法及系统 |
CN111164938A (zh) * | 2017-09-29 | 2020-05-15 | 芬基波尔有限责任公司 | 使用选择性多路径分组流喷射的弹性网络通信 |
CN113225241A (zh) * | 2021-04-19 | 2021-08-06 | 中国科学院计算技术研究所 | 面向环形数据报文网络的数据传输拥塞控制方法及系统 |
US11178262B2 (en) | 2017-09-29 | 2021-11-16 | Fungible, Inc. | Fabric control protocol for data center networks with packet spraying over multiple alternate data paths |
WO2021233262A1 (zh) * | 2020-05-21 | 2021-11-25 | 北京三快在线科技有限公司 | 通信控制 |
US20220060966A1 (en) * | 2018-12-18 | 2022-02-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and Controller for Managing a Microwave Network |
CN114095421A (zh) * | 2020-07-30 | 2022-02-25 | 深信服科技股份有限公司 | 一种网络选路方法、装置、设备及计算机可读存储介质 |
CN115150324A (zh) * | 2022-06-09 | 2022-10-04 | 南京邮电大学 | 一种基于可编程数据平面实现可变重路由阈值的方法及系统 |
US11777839B2 (en) | 2017-03-29 | 2023-10-03 | Microsoft Technology Licensing, Llc | Data center network with packet spraying |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103346922A (zh) * | 2013-07-26 | 2013-10-09 | 电子科技大学 | 基于sdn的确定网络状态的控制器及其确定方法 |
CN103428031A (zh) * | 2013-08-05 | 2013-12-04 | 浙江大学 | 一种基于软件定义网络的域间链路快速故障恢复方法 |
CN105959217A (zh) * | 2016-06-06 | 2016-09-21 | 北京邮电大学 | 一种sdn移动自组网的数据处理方法及装置 |
CN106411766A (zh) * | 2016-09-30 | 2017-02-15 | 赛特斯信息科技股份有限公司 | 基于sdn的流量调度系统及方法 |
CN106533960A (zh) * | 2016-12-23 | 2017-03-22 | 重庆邮电大学 | 一种基于Fat‑Tree结构的数据中心网络路由方法 |
-
2017
- 2017-06-20 CN CN201710470593.1A patent/CN107196854B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103346922A (zh) * | 2013-07-26 | 2013-10-09 | 电子科技大学 | 基于sdn的确定网络状态的控制器及其确定方法 |
CN103428031A (zh) * | 2013-08-05 | 2013-12-04 | 浙江大学 | 一种基于软件定义网络的域间链路快速故障恢复方法 |
CN105959217A (zh) * | 2016-06-06 | 2016-09-21 | 北京邮电大学 | 一种sdn移动自组网的数据处理方法及装置 |
CN106411766A (zh) * | 2016-09-30 | 2017-02-15 | 赛特斯信息科技股份有限公司 | 基于sdn的流量调度系统及方法 |
CN106533960A (zh) * | 2016-12-23 | 2017-03-22 | 重庆邮电大学 | 一种基于Fat‑Tree结构的数据中心网络路由方法 |
Non-Patent Citations (3)
Title |
---|
S. SONG, J. LEE, K. SON, H. JUNG, J. LEE: "A congestion avoidance algorithm in SDN environment", 《PROC. INT. CONF. INF. NETW(ICOIN)》 * |
洪硕果,沈苏彬: "一种SDN 网络的故障自动恢复方案", 《计算机技术及发展》 * |
王力,赵季红,曲桦,郭涯: "软件定义承载网中基于负载均衡的虚拟网络资源分配算法", 《电信科学》 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11777839B2 (en) | 2017-03-29 | 2023-10-03 | Microsoft Technology Licensing, Llc | Data center network with packet spraying |
CN111164938A (zh) * | 2017-09-29 | 2020-05-15 | 芬基波尔有限责任公司 | 使用选择性多路径分组流喷射的弹性网络通信 |
US11178262B2 (en) | 2017-09-29 | 2021-11-16 | Fungible, Inc. | Fabric control protocol for data center networks with packet spraying over multiple alternate data paths |
US11601359B2 (en) | 2017-09-29 | 2023-03-07 | Fungible, Inc. | Resilient network communication using selective multipath packet flow spraying |
CN109996130A (zh) * | 2018-01-02 | 2019-07-09 | 中国移动通信有限公司研究院 | 基于sdn的光传送网保护恢复方法、设备及存储介质 |
WO2019134572A1 (zh) * | 2018-01-02 | 2019-07-11 | 中国移动通信有限公司研究院 | 基于sdn的光传送网保护恢复方法、设备及存储介质 |
CN108566295A (zh) * | 2018-03-22 | 2018-09-21 | 西安交通大学 | 一种基于软件定义网络的平面式控制架构的一致性构建方法 |
CN108566295B (zh) * | 2018-03-22 | 2020-03-24 | 西安交通大学 | 一种基于软件定义网络的平面式控制架构的一致性构建方法 |
US20220060966A1 (en) * | 2018-12-18 | 2022-02-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and Controller for Managing a Microwave Network |
CN109768924A (zh) * | 2019-02-14 | 2019-05-17 | 山东省计算中心(国家超级计算济南中心) | 一种面向多流共存的sdn网络多链路故障恢复方法及系统 |
CN109768924B (zh) * | 2019-02-14 | 2021-06-08 | 山东省计算中心(国家超级计算济南中心) | 一种面向多流共存的sdn网络多链路故障恢复方法及系统 |
CN109981363A (zh) * | 2019-03-22 | 2019-07-05 | 烽火通信科技股份有限公司 | 一种南向接口的适配方法及系统 |
CN110708246A (zh) * | 2019-10-17 | 2020-01-17 | 山东健康医疗大数据有限公司 | 一种基于sdn网络的医疗健康数据传输优化方法及系统 |
WO2021233262A1 (zh) * | 2020-05-21 | 2021-11-25 | 北京三快在线科技有限公司 | 通信控制 |
CN114095421A (zh) * | 2020-07-30 | 2022-02-25 | 深信服科技股份有限公司 | 一种网络选路方法、装置、设备及计算机可读存储介质 |
CN114095421B (zh) * | 2020-07-30 | 2023-12-29 | 深信服科技股份有限公司 | 一种网络选路方法、装置、设备及计算机可读存储介质 |
CN113225241B (zh) * | 2021-04-19 | 2022-09-06 | 中国科学院计算技术研究所 | 面向环形数据报文网络的数据传输拥塞控制方法及系统 |
CN113225241A (zh) * | 2021-04-19 | 2021-08-06 | 中国科学院计算技术研究所 | 面向环形数据报文网络的数据传输拥塞控制方法及系统 |
CN115150324A (zh) * | 2022-06-09 | 2022-10-04 | 南京邮电大学 | 一种基于可编程数据平面实现可变重路由阈值的方法及系统 |
CN115150324B (zh) * | 2022-06-09 | 2024-05-10 | 南京邮电大学 | 一种基于可编程数据平面实现可变重路由阈值的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107196854B (zh) | 2020-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107196854A (zh) | 一种软件定义网络中数据平面异常处理方法 | |
CN108600102B (zh) | 一种基于智慧协同网络的柔性数据传输系统 | |
CN105379196B (zh) | 用于容错和负载平衡路由的方法、系统和计算机存储介质 | |
CN106100999B (zh) | 一种虚拟化网络环境中镜像网络流量控制方法 | |
CN105227481B (zh) | 基于路径开销和流调度代价最小化的sdn拥塞控制路由方法 | |
CN103179046B (zh) | 基于openflow的数据中心流量控制方法及系统 | |
CN107959633A (zh) | 一种工业实时网络中基于价格机制的多路径负载均衡方法 | |
CN104734878B (zh) | 软件定义联网灾难恢复的方法和系统 | |
US9301026B2 (en) | Affinity modeling in a data center network | |
CN107682258A (zh) | 一种基于虚拟化的多路径网络传输方法及装置 | |
EP2774048B1 (en) | Affinity modeling in a data center network | |
CN108289064A (zh) | 一种数据中心网中混合式负载均衡方法 | |
CN106130767A (zh) | 一种业务路径故障监控及故障解决的系统和方法 | |
CN106936645B (zh) | 基于排队论的树形网络拓扑结构的优化方法 | |
CN105406988A (zh) | 一种软件定义抗毁网络构建方法 | |
CN106685835A (zh) | 一种在数据中心的计算节点间实现高速分布式路由的方法 | |
CN109067592A (zh) | 一种面向智能配用电的智能管控装置及管控方法 | |
CN109286528A (zh) | 一种基于时延的sdn网络多控制器部署方法 | |
CN108243123A (zh) | 广播报文的处理方法、装置、控制器和交换机 | |
CN105790990A (zh) | 一种监管配用电通信业务的方法及其系统 | |
Wang et al. | Designing efficient high performance server-centric data center network architecture | |
CN111130928A (zh) | 广域网中基于带内探测的网络测量方法 | |
CN107018018A (zh) | 一种基于sdn的服务器增量在线升级方法及系统 | |
Jhaveri et al. | Managing industrial communication delays with software-defined networking | |
CN104767778A (zh) | 任务处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |