CN106953747A - 一种基于深度学习的sdn网络自愈方法 - Google Patents

一种基于深度学习的sdn网络自愈方法 Download PDF

Info

Publication number
CN106953747A
CN106953747A CN201710118488.1A CN201710118488A CN106953747A CN 106953747 A CN106953747 A CN 106953747A CN 201710118488 A CN201710118488 A CN 201710118488A CN 106953747 A CN106953747 A CN 106953747A
Authority
CN
China
Prior art keywords
module
self
healing
application
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710118488.1A
Other languages
English (en)
Other versions
CN106953747B (zh
Inventor
周静静
鹿如强
张胜龙
王伟明
郑月燃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Gongshang University
Original Assignee
Zhejiang Gongshang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Gongshang University filed Critical Zhejiang Gongshang University
Priority to CN201710118488.1A priority Critical patent/CN106953747B/zh
Publication of CN106953747A publication Critical patent/CN106953747A/zh
Application granted granted Critical
Publication of CN106953747B publication Critical patent/CN106953747B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/12Shortest path evaluation
    • H04L45/123Evaluation of link metrics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing

Abstract

本发明公开了一种基于深度学习的SDN网络自愈方法,包括如下步骤:在SDN各层分别添加相应的自愈模块;当应用层出现应用故障时,应用层自愈模块和控制层自愈模块互相协作配合解决故障,恢复网络的正常运行。当转发层出现链路故障时,控制层自愈模块和转发层自愈模块互相协作配合解决故障,恢复网络的正常运行。本发明创新性的提出了一种SDN网络的自愈框架,并且基于此自愈框架设计了一套完整的自愈机制,能很好的处理应用层故障和转发层故障。优化了网络结构,节约了网络成本,提高了网络的运行效率,弥补了当前SDN网络中自愈相关方面的不足。

Description

一种基于深度学习的SDN网络自愈方法
技术领域
本发明提出了一种基于深度学习的SDN网络自愈方法,针对SDN网络出现链路故障及应用故障时提供防御及恢复服务。
背景技术
随着互联网规模的快速增长,网络底层的路由交换设备目前已经达到了上万台的规模。与此同时,其相关网络业务也变得越来越复杂。复杂的网络业务也相应地导致了各种复杂的网络协议和网络管理策略。当网络中的故障出现时,调试网络也变得越来越困难。网络协议因素或者人为因素等都有可能成为引起不同网络故障的原因。当网络出现故障时,不仅会影响用户体验、导致服务不可用,严重时会导致整个网络的瘫痪。因此,保障网络的正常运行是保障网络安全与稳定工作的最重要的一环。在传统故障维护中,通常需要网络维护人员使用相关故障检测工具去维护网络。但随着网络设备的大量增加,仅仅借助人工去维护网络故障将需要较大的成本,并且效率也会变得越来越低。为了能够保证业务的安全运行,当故障出现时,人们需要一个更加成熟可靠的工具与策略去检测网络中的相关故障,并能够自动地对故障进行识别、定位直至修复。
软件定义网络(Software Defined Networking,SDN)是一种控制与数据相分离、软件可编程的新型网络体系架构,并且具有全网控制视图。它能够从传统网络设备中将控制功能分离出来,嵌入到具有逻辑集中功能的软件——控制器中,用户能够通过编写软件的方式灵活定义网络设备的转发功能与转发策略。这种控制结构实现了对网络的全局集中控制,这种情况下,如果发生了故障不能及时发现和处理,将会导致整个SDN网络的瘫痪。因此,当发生故障时,希望能够根据SDN网络系统自身的状况以做到系统的自动维护,最终使得SDN网络系统能够正常运行。一个自主网络的自愈属性能够将网络从非正常的状态恢复到正常的状态。
SDN感知参数化自愈框架的研究。到目前为止,对自愈系统的研究主要集中在底层拓扑中,并有可能请求底层网络中的任何一对节点之间的连接。通过对故障更为广泛的定义和扩大各种可能的自愈动作来对基本模型进行扩展,例如,为了对自愈成果进行评价,一个新的成本模型必须制定量化收益和成本,并与服务质量权衡比较,从而产生一个参数化的自愈框架。参数化自愈框架必须适应SDN管理网络的具体要求,并能够解决自愈系统在应用层、控制层、数据层的接口分离问题、部署后的系统弹性与灵活性问题以及各层之间的连接模式问题。
SDN网络自愈性能管理的研究。通过重新配置路由网络用于处理组件故障、拥塞链路和过载的交换机,以此来扩展基本自愈范例。这些技术将利用SDN控制平面收集来自网络交换机动态负载的信息并且能够下发必要的重配置操作信息到相应受影响的交换机中。SDN自愈系统将能够正式地分析及时性与负载信息量之间的权衡关系,并且有必要控制输入的效率与粒度从而达到快速重新配置。
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
发明内容
本发明针对现有技术的不足,提出了一种基于深度学习的SDN网络自愈方法,针对SDN网络出现链路故障及应用故障时提供防御及恢复服务,包括如下步骤:
步骤一:在SDN各层分别添加相应的自愈模块;
应用层自愈模块包括应用服务管理模块和应用告警模块;
控制层自愈模块包括最优自愈模块、拓扑发现与管理模块、网络统计模块、路径管理模块、策略管理模块和流与动作管理模块;
转发层自愈模块包括快速恢复模块和告警模块。
步骤二:当应用层出现应用故障时,应用层自愈模块和控制层自愈模块互相协作配合解决故障,恢复网络的正常运行,具体包括如下步骤:
(1)应用告警模块将故障信息发送给应用服务管理模块,应用服务管理模块基于应用告警模块的告警对应用进行状态服务、客户端连接、服务模型以及应用流量特征的收集及初分析,得到应用特征;所述应用特征包括:应用状态、应用故障类型等。
(2)应用服务管理模块将分析后获取的应用特征发送给最优自愈模块,最优自愈模块基于应用特征和深度学习模型对应用进行分类识别。
(3)策略管理模块基于最优自愈模块分析结果,针对异常应用制定相应的策略。
(4)策略管理模块将策略发送回应用服务管理模块,最终对异常应用进行恢复。
步骤三:当转发层出现链路故障时,控制层自愈模块和转发层自愈模块互相协作配合解决故障,恢复网络的正常运行,具体包括如下步骤:
(1)当底层链路故障(链路中断或者端口失效等)发生时,告警模块将直接激活快速恢复模块,快速恢复模块中能够直接将受影响的流根据预置的备用路径通过邻居节点转发到故障节点的其他端口中,以实现故障的快速恢复。但此时的恢复并没有达到最优恢复的目标。
(2)告警模块执行步骤(1)的同时,将向最优自愈模块发送告警信息,请求计算一条最优路径。
(3)最优自愈模块启动拓扑发现与管理模块,以获取故障点。
(4)路径管理模块根据拓扑发现与管理模块获取的故障点进行可用路径的计算,统计出故障发生后的可用路径。
(5)路径管理模块将统计出的可用路径信息发送给网络统计模块,网络统计模块针对每一条可用路径进行相关链路特征值的统计。
(6)网络统计模块将得到的可用路径的相关链路特征值发送给最优自愈模块,最优自愈模块基于深度学习模型选择出一条最优路径,并给出最优路径的路径标识。
(7)策略管理模块根据最优路径的路径标识为受故障影响的流设计出最优路径的流表转发策略。
(9)策略管理模块将最优路径的流表转发策略发送给流与动作管理模块。
(9)流与动作管理模块根据流表转发策略将对应流表下发到交换机中,并存入交换机的转发信息库,受故障影响的流就可以依据最优路径进行转发。
本发明的有益效果是:本发明创新性的提出了一种SDN网络的自愈框架,并且基于此自愈框架设计了一套完整的自愈机制,能很好的处理应用层故障和转发层故障。优化了网络结构,节约了网络成本,提高了网络的运行效率,弥补了当前SDN网络中自愈相关方面的不足。
附图说明
图1为SDN自愈框架;
图2为SDN网络自愈机制。
具体实施方式
下面结合附图对本发明作进一步的说明。
本发明提供的一种基于深度学习的SDN网络自愈方法,针对SDN网络出现链路故障及应用故障时提供防御及恢复服务,包括如下步骤:
在SDN各层分别添加相应的自愈模块,如图1所示:
应用层自愈模块包括应用服务管理模块和应用告警模块;
控制层自愈模块包括最优自愈模块、拓扑发现与管理模块、网络统计模块、路径管理模块、策略管理模块和流与动作管理模块;
转发层自愈模块包括快速恢复模块和告警模块。
当应用层出现应用故障时,应用层自愈模块和控制层自愈模块互相协作配合解决故障,恢复网络的正常运行,如图2所示,具体包括如下步骤:
(1)应用告警模块将故障信息发送给应用服务管理模块,应用服务管理模块基于应用告警模块的告警对应用进行状态服务、客户端连接、服务模型以及应用流量特征的收集及初分析,得到应用特征。这里的应用特征包括:应用状态、应用故障类型等等。
(2)应用服务管理模块将分析后获取的应用特征发送给最优自愈模块,最优自愈模块基于应用特征和深度学习模型对应用进行分类识别。
(3)策略管理模块基于最优自愈模块分析结果,针对异常应用制定相应的策略。
(4)策略管理模块将策略发送回应用服务管理模块,最终对异常应用进行恢复。
当转发层出现链路故障时,控制层自愈模块和转发层自愈模块互相协作配合解决故障,恢复网络的正常运行,如图2所示,具体步骤如下:
(1)当底层链路故障(链路中断或者端口失效等)发生时,告警模块将直接激活快速恢复模块,快速恢复模块中能够直接将受影响的流根据预置的备用路径通过邻居节点转发到故障节点的其他端口中,以实现故障的快速恢复。但此时的恢复并没有达到最优恢复的目标。
(2)告警模块执行步骤(1)的同时,将向最优自愈模块发送告警信息,请求计算一条最优路径。
(3)最优自愈模块启动拓扑发现与管理模块,以获取故障点。
(4)路径管理模块根据拓扑发现与管理模块获取的故障点进行可用路径的计算,统计出故障发生后的可用路径。
(5)路径管理模块将统计出的可用路径信息发送给网络统计模块,网络统计模块将针对每一条可用路径进行相关链路特征值的统计。
(6)网络统计模块将得到的可用路径的相关链路特征值发送给最优自愈模块,最优自愈模块基于深度学习模型选择出一条最优路径,并给出最优路径的路径标识。
(7)策略管理模块根据最优路径的路径标识为受故障影响的流设计出最优路径的流表转发策略。
(8)策略管理模块将最优路径的流表转发策略发送给流与动作管理模块。
(9)流与动作管理模块根据流表转发策略将对应流表下发到交换机中,并存入交换机的转发信息库,受故障影响的流就可以依据最优路径进行转发。

Claims (1)

1.一种基于深度学习的SDN网络自愈方法,其特征在于,包括如下步骤:
步骤一:在SDN各层分别添加相应的自愈模块;
应用层自愈模块包括应用服务管理模块和应用告警模块;
控制层自愈模块包括最优自愈模块、拓扑发现与管理模块、网络统计模块、路径管理模块、策略管理模块和流与动作管理模块;
转发层自愈模块包括快速恢复模块和告警模块。
步骤二:当应用层出现应用故障时,应用层自愈模块和控制层自愈模块互相协作配合解决故障,恢复网络的正常运行,具体包括如下步骤:
(1)应用告警模块将故障信息发送给应用服务管理模块,应用服务管理模块基于应用告警模块的告警对应用进行状态服务、客户端连接、服务模型以及应用流量特征的收集及初分析,得到应用特征;所述应用特征包括:应用状态、应用故障类型等。
(2)应用服务管理模块将分析后获取的应用特征发送给最优自愈模块,最优自愈模块基于应用特征和深度学习模型对应用进行分类识别。
(3)策略管理模块基于最优自愈模块分析结果,针对异常应用制定相应的策略。
(4)策略管理模块将策略发送回应用服务管理模块,最终对异常应用进行恢复。
步骤三:当转发层出现链路故障时,控制层自愈模块和转发层自愈模块互相协作配合解决故障,恢复网络的正常运行,具体包括如下步骤:
(1)当底层链路故障(链路中断或者端口失效等)发生时,告警模块将直接激活快速恢复模块,快速恢复模块中能够直接将受影响的流根据预置的备用路径通过邻居节点转发到故障节点的其他端口中,以实现故障的快速恢复。但此时的恢复并没有达到最优恢复的目标。
(2)告警模块执行步骤(1)的同时,将向最优自愈模块发送告警信息,请求计算一条最优路径。
(3)最优自愈模块启动拓扑发现与管理模块,以获取故障点。
(4)路径管理模块根据拓扑发现与管理模块获取的故障点进行可用路径的计算,统计出故障发生后的可用路径。
(5)路径管理模块将统计出的可用路径信息发送给网络统计模块,网络统计模块针对每一条可用路径进行相关链路特征值的统计。
(6)网络统计模块将得到的可用路径的相关链路特征值发送给最优自愈模块,最优自愈模块基于深度学习模型选择出一条最优路径,并给出最优路径的路径标识。
(7)策略管理模块根据最优路径的路径标识为受故障影响的流设计出最优路径的流表转发策略。
(8)策略管理模块将最优路径的流表转发策略发送给流与动作管理模块。
(9)流与动作管理模块根据流表转发策略将对应流表下发到交换机中,并存入交换机的转发信息库,受故障影响的流就可以依据最优路径进行转发。
CN201710118488.1A 2017-03-01 2017-03-01 一种基于深度学习的sdn网络自愈方法 Active CN106953747B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710118488.1A CN106953747B (zh) 2017-03-01 2017-03-01 一种基于深度学习的sdn网络自愈方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710118488.1A CN106953747B (zh) 2017-03-01 2017-03-01 一种基于深度学习的sdn网络自愈方法

Publications (2)

Publication Number Publication Date
CN106953747A true CN106953747A (zh) 2017-07-14
CN106953747B CN106953747B (zh) 2020-04-28

Family

ID=59466702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710118488.1A Active CN106953747B (zh) 2017-03-01 2017-03-01 一种基于深度学习的sdn网络自愈方法

Country Status (1)

Country Link
CN (1) CN106953747B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108880888A (zh) * 2018-06-20 2018-11-23 浙江工商大学 一种基于深度学习的sdn网络流量预测方法
CN109257204A (zh) * 2018-08-06 2019-01-22 浙江工商大学 一种软件定义网络中基于深度学习的网络节能装置及方法
CN109768882A (zh) * 2018-12-21 2019-05-17 杭州全维技术股份有限公司 一种基于网络设备的自动组网系统及其故障自排查方法
CN111010341A (zh) * 2019-12-19 2020-04-14 南京大学 一种基于深度学习的覆盖网络路由决策方法
CN112948184A (zh) * 2021-02-03 2021-06-11 重庆大学 一种基于多通信模式的信息收发控制系统
US20220391300A1 (en) * 2020-12-18 2022-12-08 Express Scripts Strategic Development, Inc. Machine learning models for automated anomaly detection for application infrastructure components
CN115967667A (zh) * 2021-10-08 2023-04-14 中移(杭州)信息技术有限公司 链路确定方法、装置、控制器及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104158753A (zh) * 2014-06-12 2014-11-19 南京工程学院 基于软件定义网络的动态流调度方法及系统
US20160119255A1 (en) * 2014-05-12 2016-04-28 Futurewei Technologies, Inc. Partial Software Defined Network Switch Replacement in IP Networks
CN105978741A (zh) * 2016-07-15 2016-09-28 清华大学深圳研究生院 一种网络故障处理方法和处理系统
CN106411766A (zh) * 2016-09-30 2017-02-15 赛特斯信息科技股份有限公司 基于sdn的流量调度系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160119255A1 (en) * 2014-05-12 2016-04-28 Futurewei Technologies, Inc. Partial Software Defined Network Switch Replacement in IP Networks
CN104158753A (zh) * 2014-06-12 2014-11-19 南京工程学院 基于软件定义网络的动态流调度方法及系统
CN105978741A (zh) * 2016-07-15 2016-09-28 清华大学深圳研究生院 一种网络故障处理方法和处理系统
CN106411766A (zh) * 2016-09-30 2017-02-15 赛特斯信息科技股份有限公司 基于sdn的流量调度系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SONG SJ,ZHU H: ""Operational Softwarized Networks Reliability Management"", 《IEEE INTERNATIONAL SYMPOSIUM ON SOFTWARE RELIABILITY ENGINEERING WORKSHOPS 》 *
THORAT, P: ""Optimized Self-healing Framework for Software Defined Networks"", 《9TH INTERNATIONAL CONFERENCE ON UBIQUITOUS INFORMATION MANAGEMENT AND COMMUNICATION 》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108880888A (zh) * 2018-06-20 2018-11-23 浙江工商大学 一种基于深度学习的sdn网络流量预测方法
CN109257204A (zh) * 2018-08-06 2019-01-22 浙江工商大学 一种软件定义网络中基于深度学习的网络节能装置及方法
CN109257204B (zh) * 2018-08-06 2021-06-04 浙江工商大学 一种软件定义网络中基于深度学习的网络节能装置及方法
CN109768882A (zh) * 2018-12-21 2019-05-17 杭州全维技术股份有限公司 一种基于网络设备的自动组网系统及其故障自排查方法
CN111010341A (zh) * 2019-12-19 2020-04-14 南京大学 一种基于深度学习的覆盖网络路由决策方法
CN111010341B (zh) * 2019-12-19 2020-10-27 南京大学 一种基于深度学习的覆盖网络路由决策方法
US20220391300A1 (en) * 2020-12-18 2022-12-08 Express Scripts Strategic Development, Inc. Machine learning models for automated anomaly detection for application infrastructure components
US11940894B2 (en) * 2020-12-18 2024-03-26 Express Scripts Strategic Development, Inc. Machine learning models for automated anomaly detection for application infrastructure components
CN112948184A (zh) * 2021-02-03 2021-06-11 重庆大学 一种基于多通信模式的信息收发控制系统
CN112948184B (zh) * 2021-02-03 2023-07-21 重庆大学 一种基于多通信模式的信息收发控制系统
CN115967667A (zh) * 2021-10-08 2023-04-14 中移(杭州)信息技术有限公司 链路确定方法、装置、控制器及存储介质

Also Published As

Publication number Publication date
CN106953747B (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
CN106953747A (zh) 一种基于深度学习的sdn网络自愈方法
CN103544093B (zh) 监控报警控制方法及其系统
CN106100999A (zh) 一种虚拟化网络环境中镜像网络流量控制协议
CN106230650A (zh) SDN Overlay网络故障定位系统及方法
EP2798782B1 (en) Technique for handling a status change in an interconnect node
CN107735784A (zh) 软件定义网络中的通信链路故障检测
CN112564964B (zh) 一种基于软件定义网络的故障链路检测与恢复方法
CN102088363B (zh) 告警处理方法和系统
JP2002525943A (ja) 電気通信ネットワークにおけるネットワーク・デバイスの統合監視・管理のためのインターフェースシステム
CN103945432B (zh) 集群系统基站的工作模式转换方法
CN104243239B (zh) 一种sdn集群中控制器的状态检测方法和装置
CN110891283A (zh) 一种基于边缘计算模型的小基站监控装置及方法
CN103166778A (zh) 一种故障自动化智能处理方法及其装置
CN106411617A (zh) 电力通信网络故障告警关联处理方法
CN105847083A (zh) 一种业务集中监控方法及系统
CN106789630B (zh) 一种网络保护方法及系统、控制器、设备
CN108650140A (zh) 光传输设备业务故障的自动化辅助分析方法和系统
CN105790990A (zh) 一种监管配用电通信业务的方法及其系统
CN104954153A (zh) 节点故障检测方法及装置
CN101764706A (zh) 基于epa网桥的链路冗余控制方法
CN105072101B (zh) 基于入侵容忍的sdn控制器端系统和安全通信方法
CN110286300A (zh) 一种多分支输电线路故障定位方法、装置、设备及系统
CN116455729A (zh) 一种基于链路质量评估模型的故障链路检测与恢复方法
EP3154238A1 (en) Policy-based m2m terminal device monitoring and control method and device
CN103885372B (zh) 一种开关电源整流模块监控预警方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant