CN107241211B - 改善数据中心覆盖网络和底层网络间关联性的方法和系统 - Google Patents

改善数据中心覆盖网络和底层网络间关联性的方法和系统 Download PDF

Info

Publication number
CN107241211B
CN107241211B CN201611226199.5A CN201611226199A CN107241211B CN 107241211 B CN107241211 B CN 107241211B CN 201611226199 A CN201611226199 A CN 201611226199A CN 107241211 B CN107241211 B CN 107241211B
Authority
CN
China
Prior art keywords
network
information
control information
overlay
underlay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611226199.5A
Other languages
English (en)
Other versions
CN107241211A (zh
Inventor
G·钱德安古达尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wipro Ltd
Original Assignee
Wipro Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wipro Ltd filed Critical Wipro Ltd
Publication of CN107241211A publication Critical patent/CN107241211A/zh
Application granted granted Critical
Publication of CN107241211B publication Critical patent/CN107241211B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/024Standardisation; Integration using relational databases for representation of network management data, e.g. managing via structured query language [SQL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • H04L41/0816Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0859Retrieval of network configuration; Tracking network configuration history by keeping history of different configuration generations or by rolling back to previous configuration versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/40Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/20Arrangements for monitoring or testing data switching networks the monitoring system or the monitored elements being virtualised, abstracted or software-defined entities, e.g. SDN or NFV

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明总体涉及改善数据中心覆盖网络和底层网络间关联性的方法和系统。在一种实施方式中,所述方法包括:从所述多个网络中的第一网络获取所述第一网络的控制信息,并从所述多个网络中的第二网络获取所述第二网络的控制信息;将所述第一网络的控制信息与所述第二网络的控制信息相关联,以生成一关系矩阵;响应于所述关系矩阵的生成而确定所述第一网络和第二网络内的至少一个问题;执行一个或多个纠正动作,以解决所述第一网络和第二网络中的一者或两者内的所述一个或多个问题。

Description

改善数据中心覆盖网络和底层网络间关联性的方法和系统
技术领域
本发明总体涉及数据中心,尤其涉及改善数据中心覆盖网络和底层网络之间关联性的方法和系统。
背景技术
在数据中心环境中,可在底层网络之上构建覆盖网络。覆盖网络内的节点可通过虚拟和/或逻辑链路相连接,而这些节点和链路可与底层网络中的节点和物理链路相对应。通常,这些覆盖网络和底层网络利用不同供应商提供的工具实现其自身的构建、管理和组织。这给数据中心环境中的故障排除、工作分配管理及修复问题调度造成了很大的不便。此外,平均修复时间(MTTR)的增加导致数据中心环境的性能下降。
因此,需要在促进覆盖网络和底层网络间的协调性或关联性方面,或在简化管理和提高性能方面做出技术改进。
发明内容
在一种实施方式中,公开一种由网络管理系统对多个网络进行管理的方法。该方法包括:由所述网络管理系统从所述多个网络中的第一网络获取所述第一网络的控制信息,所述第一网络的控制信息包括所述第一网络的数据传输信息以及所述第一网络的网络资源信息;由所述网络管理系统从所述多个网络中的第二网络获取所述第二网络的控制信息,所述第二网络的控制信息包括所述第二网络的数据传输信息以及所述第二网络的网络资源信息;由所述网络管理系统将所述第一网络的控制信息与所述第二网络的控制信息相关联,以生成一关系矩阵;由所述网络管理系统响应于所述关系矩阵的生成而确定所述第一网络和所述第二网络中的至少一个网络内的至少一个问题;以及由所述网络管理系统执行至少一个纠正动作,以解决所述第一网络和所述第二网络中的至少一个网络内的所述至少一个问题。
在另一实施方式中,公开一种管理多个网络的网络管理系统。该系统包括:一数据库,包括一历史数据库和一解决方案数据库;以及一处理器,以可操作方式连接于所述数据库,该处理器设置为:从所述多个网络中的第一网络获取所述第一网络的控制信息,所述第一网络的控制信息包括所述第一网络的数据传输信息以及所述第一网络的网络资源信息;从所述多个网络中的第二网络获取所述第二网络的控制信息,所述第二网络的控制信息包括所述第二网络的数据传输信息以及所述第二网络的网络资源信息;将所述第一网络的控制信息与所述第二网络的控制信息相关联,以生成一关系矩阵;响应于所述关系矩阵的生成而确定所述第一网络和所述第二网络中的至少一个网络内的至少一个问题;以及执行至少一个纠正动作,以解决所述第一网络和所述第二网络中的至少一个网络内的所述至少一个问题。
在另一实施方式中,公开一种用于实施对多个网络进行管理的方法的非暂时性计算机可读存储介质,当其由计算装置执行时,使得该计算装置:从所述多个网络中的第一网络获取所述第一网络的控制信息,所述第一网络的控制信息包括所述第一网络的数据传输信息以及所述第一网络的网络资源信息;从所述多个网络中的第二网络获取所述第二网络的控制信息,所述第二网络的控制信息包括所述第二网络的数据传输信息以及所述第二网络的网络资源信息;将所述第一网络的控制信息与所述第二网络的控制信息相关联,以生成一关系矩阵;响应于所述关系矩阵的生成而确定所述第一网络和所述第二网络中的至少一个网络内的至少一个问题;以及执行至少一个纠正动作,以解决所述第一网络和所述第二网络中的至少一个网络内的所述至少一个问题。
应当理解的是,以上概略描述与以下详细描述均仅在于例示和说明,而不在于限制所要求保护的发明。
附图说明
所附各图并入本发明之内并构成本发明的一部分,用于对例示实施方式进行描述,并与说明书一道阐明所公开的原理。
图1为可采用本发明概念各种实施方式的数据中心环境(例示)框图。
图2为根据一种实施方式由数据中心网络管理系统管理多个网络的方法的流程图。
图3为根据一种实施方式生成关系矩阵的方法流程图。
图4为根据一种实施方式生成问题警报的方法流程图。
图5为根据一种实施方式在解决方案数据库内存储纠正动作的方法流程图。
图6为根据一种实施方式生成报告的方法流程图。
图7为根据一种实施方式设置为对多个网络进行管理的网络管理系统的框图。
图8为用于实现各种实施方式的例示计算机系统框图。
具体实施方式
以下参考附图,对例示实施方式进行描述。在任何方便之处,各图中均采用相同附图标记指代相同或类似部件。虽然本文中描述了所公开原理的实施例和特征,但是在不脱离所公开实施方式的精神和范围的前提下,还可进行修改、调整以及做出其他实施方式。以下具体描述意在仅视作例示,而真正的范围及精神如权利要求书所述。
在各种实施方式中,提供对数据中心内的多个网络进行管理的方法和系统。具体而言,该方法可改善所述多个网络中的底层网络和覆盖网络之间的关联性。该方法包括从所述多个网络中的第一网络获取控制信息,以及从所述多个网络中的第二网络获取控制信息。所述第一网络例如包括底层网络,而且所述第二网络例如包括覆盖网络。在该方法中,将所述第一网络的控制信息与所述第二网络的控制信息相关联,以生成关系矩阵。该方法还包括响应于所述关系矩阵的生成而确定所述第一网络和第二网络中的一者或两者内的一个或多个问题。该方法还包括执行一个或多个纠正动作,以解决所述第一网络和第二网络中的一者或两者内的所述一个或多个问题。
图1为可采用本发明概念实施方式的数据中心环境100的框图。数据中心环境100的设备可共同设置于单个本地站点,或者分布于两个或更多的不同站点。数据中心环境100可包括一个或多个主计算机102-n,例如主计算机102-1,主计算机102-2,主计算机102-3等,这些主计算机彼此连接,从而形成底层网络104。所述一个或多个主计算机102-n中的每一个均可以为服务器或刀片服务器等物理计算装置的实施方式。此外,所述一个或多个主计算机102-n中的每一个均可分立设置或与其他主计算机安装于同一机箱内,例如机架服务器或刀片服务器。
存储器和所述一个或多个主计算机102-n的CPU(图1未示出)等物理部件之间的通信,以及该一个或多个主计算机102-n之间在底层网络104内的通信可通过一个或多个总线、连接器、转接头以及其他本领域普通技术人员已知的类似元件实现。底层网络104也称为物理网络。
所述一个或多个主计算机102-n中的每一个可运行虚拟化系统106-n,该虚拟化系统可选包括管理程序或虚拟机管理器(VMM)。举例而言,主计算机102-1运行虚拟化系统106-1,主计算机102-2运行虚拟化系统106-2,主计算机102-3运行虚拟化系统106-3,依此类推。在一种实施方式中,所述一个或多个主计算机102-n可以为非虚拟化服务器或刀片服务器。
在底层网络104之上可构建覆盖网络108。“覆盖网络”一词是指建构于底层网络之上且使用该底层网络的数据传输功能,但具有与该底层网络不同的路由功能的网络。因此,覆盖网络108中的节点可通过虚拟和/或逻辑链路相连接,而该节点和链路可与底层网络104内的节点和物理链路相对应。覆盖网络108可划分为多个虚拟网络实例(图1中未示出),这些实例可同时利用底层网络104执行不同应用和服务。此外,计算、存储和/或网络元件等虚拟资源可在整个覆盖网络108中灵活地重新分布或移动。覆盖网络108主要通过在连接有多个终端站的所述数据中心环境的服务器、边缘网络交换机和网关之间建立隧道的方式形成。
所述一个或多个主计算机102-n中的每一个均通过接入交换机110-n与覆盖网络108相连接。例如,如图1所示,主计算机102-1通过接入交换机110-1连接至覆盖网络108,主计算机102-2通过接入交换机110-2连接至覆盖网络108,主计算机102-3通过接入交换机110-3连接至覆盖网络108。所述一个或多个接入交换机110-n中的每一个均可分立设置,或者与所述一个或多个主计算机102-n安装于同一机箱内。
数据中心环境100还可包括设置于所述一个或多个接入交换机110-n和覆盖网络108之间的一个或多个路由器112-n。例如,路由器112-1设置于接入交换机110-1、接入交换机110-2和覆盖网络108之间。同样地,路由器112-2设置于接入交换机110-2、接入交换机110-3和覆盖网络108之间。所述一个或多个路由器112-n可提供与其他数据中心环境(图1中未示出)相连接的网管。所述一个或多个接入交换机110-n中的每一个可配置有管理模块114-n,该管理模块用于执行管理程序内虚拟机间的切换等。此外,所述一个或多个接入交换机110-n中的每一个可包括覆盖代理器116-n,该覆盖代理器设置为执行虚拟网络覆盖操作。
图2为根据一种实施方式由数据中心网络管理系统管理多个网络的方法的流程图。下文中,参考图7,对所述网络管理系统进行详细描述。所述多个网络例如可包括但不限于底层网络和覆盖网络。在步骤202中,所述网络管理系统从所述多个网络中的第一网络获取控制信息。来自所述第一网络的控制信息包括该第一网络的数据传输信息以及该第一网络的网络资源信息。与所述第一网络关联的所述数据传输信息包括其路由信息、流量流信息和网络流信息。所述第一网络的网络资源信息包括但不限于网络拓扑信息,链路和节点等网络部件的信息,以及网络性能信息。
从所述第一网络获取控制信息后,在步骤204中,所述网络管理系统从所述多个网络中的第二网络获取控制信息。来自所述第二网络的控制信息包括该第二网络的数据传输信息以及该第二网络的网络资源信息。与所述第二网络关联的所述数据传输信息包括其路由信息、流量流信息和网络流信息。所述第二网络的网络资源信息包括但不限于网络拓扑信息,链路和节点等网络部件的信息,以及网络性能信息。
与所述第一网络和第二网络关联的控制信息可通过所述数据中心基础架构的主动探测或被动探测获得。所述网络管理系统为了获取所述控制信息而采用的被动探测技术例如包括,但不限于,远程监控(RMON)、简单网络监控协议(SNMP)、事件和错误日志、流数据、命令行接口(CLI)和应用程序接口(API)。在一种实施方式中,所述网络管理系统可采用主动探测和被动探测的组合来获取所述控制信息。
在此之后,在步骤206中,所述网络管理系统将所述第一网络的控制信息与所述第二网络的控制信息相关联,以生成关系矩阵。为了生成该关系矩阵,所述网络管理系统对所述第一网络内发生的事件以及所述第二网络内发生的相应事件进行探测,以对这些事件之间的关系进行识别。例如,所述网络管理系统可检测所述底层网络中在特定时间发生的事件以及所述覆盖网络中在该特定时间发生的相应事件,以对该底层网络和覆盖网络的事件之间的关系进行识别。同样地,当所述底层网络中发生流量移动时,所述网络管理系统可对所述覆盖网络内发生的事件进行检测。在一种实施方式中,所述网络管理系统可采用一个或多个算法,以了解一个网络中的变化和需求如何影响另一个网络。例如,可采用所述一个或多个算法了解所述底层网络如何响应所述覆盖网络内的变化和需求。作为一例,一种算法可利用网络流数据将所述底层网络内发生的链路或节点故障或性能阈值突破与流经该链路或节点的覆盖网络流实时关联。作为另一例,一种算法可将网络流数据与网络转发信息库数据相映射,以将覆盖网络性能下降与底层网络内发生的与链路利用、节点或链路故障及底层网络内的路由变更等一组事件相关联。
在一种实施方式中,所述网络管理系统可在生成所述关系矩阵之前将所述控制信息分类。通过将所述控制信息分类,可加速所述关联步骤,以及加速对所述多个网络内事件的检测。所述控制信息可分类为,但不限于,拓扑信息、故障信息、性能信息和网络流信息。所述拓扑信息包括与底层网络节点、覆盖网络节点、底层网络链路、覆盖网络链路、底层网络和覆盖网络之间的邻近关系、底层网络和覆盖网络内的端点关联关系相关联的信息,底层网络和覆盖网络的路由表信息,以及底层网络和覆盖网络的转发表信息。
在步骤208中,所述网络管理系统响应于所述关系矩阵的生成而确定一个或多个问题。所述一个或多个问题可确定为所述第一网络内的问题,或所述第二网络内的问题。例如,在生成所述关系矩阵后,所述网络管理系统可确定所述底层网络内的一个或多个问题。类似地,通过生成所述关系矩阵,所述网络管理系统可确定所述覆盖网络内的一个或多个问题。
确定所述一个或多个问题后,在步骤210中,所述网络管理系统可执行一个或多个纠正动作,以解决该一个或多个问题。所述一个或多个纠正动作的目的在于解决所述第一网络或第二网络的所述一个或多个问题。例如,所述网络管理系统可执行纠正动作,以解决所述底层网络的一个或多个问题。同样地,所述网络管理系统可执行纠正动作,以解决所述覆盖网络的一个或多个问题。
上述方法利用极易获取且常用的故障、性能和流量监控工具实时收集数据并参考历史数据。此外,该方法可实现端到端操作的可见性,从而消除了所述底层网络和覆盖网络中的盲点。此外,该方法还提高了所述数据中心内的多个网络的总体性能。其次,针对所述底层网络和覆盖网络,该方法无需使用其他的配置、监测及管理工具。再次,该方法可以快速无缝方式实现所述底层网络和覆盖网络内问题的故障排除,从而减少了平均修复时间(MTTR)值。
图3为根据一种实施方式生成关系矩阵的方法流程图。在步骤302中,所述网络管理系统从所述第一网络和第二网络获得控制信息。之后,在步骤304中,所述网络管理系统对该控制信息进行分析,以判断为了生成所述关系矩阵,是否需要与已获得的所述控制信息关联的其他控制信息或其他数据。
如果需要与已获得的所述控制信息关联的其他控制信息或其他数据,则在步骤306中,所述网络管理系统从历史数据库中获取与已获得的所述控制信息关联的其他控制信息或其他数据。该历史数据库为一种用于对所述控制信息和与该控制信息关联的其他数据进行存储和管理的数据库。在一种实施方式中,所述多个网络中的每个网络可分别具有历史数据库。
在此之后,在步骤308中,根据从所述第一网络和第二网络获得的控制信息以及从所述历史数据库获得的控制信息,生成所述关系矩阵。生成该关系矩阵后,所述网络管理系统将所述第一网络的控制信息和所述第二网络的控制信息传送至所述历史数据库,以用于对该控制信息进行存储和管理。所述控制信息可以固定时间间隔传送至所述历史数据库,或者动态地在当指定条件满足时传送至所述历史数据库。此外,当将所述控制信息存储于所述历史数据库中时,可对其加时间戳。
再次参考步骤304,如果不需要与已获得的所述控制信息关联的其他控制信息或其他数据,该方法直接进入步骤308。对于本领域技术人员而言容易理解的是,可将所述控制信息与一个或多个标签相关联,或者可对该控制信息进行处理,以促进其在所述历史数据库内的有效存储。
图4为根据一种实施方式生成问题警报的方法流程图。在步骤402中,所述网络管理系统将所述第一网络的控制信息和所述第二网络的控制信息相关联,以生成所述关系矩阵。生成所述关系矩阵后,在步骤404中,所述网络管理系统确定所述第一网络和第二网络中的一者或两者内的一个或多个问题。在一种实施方式中,可要求所述网络管理系统确定在稍后时间点可能发生的一个或多个问题。因此,在步骤406中,所述网络管理系统可预测在稍后时间点可能发生于所述第一网络和第二网络中的一者或两者内的一个或多个问题。所述网络管理系统还可提供其他细节,例如,所述一个或多个问题可能发生的时间以及该一个或多个问题的可预测性得分,该得分表示该一个或多个问题在将来发生的概率。
在步骤408中,所述网络管理系统根据步骤404中确定的一个或多个问题以及步骤406中预测的一个或多个问题生成一个或多个警报。所生成的该一个或多个警报就已确定的所述一个或多个问题对所述网络管理系统的用户进行通知,或者就被预测为可能在稍后时间点发生的所述一个或多个问题对所述用户进行通知。因此,所述一个或多个警报可提前通知所述用户当网络不能或无法满足另一网络的需求时可能发生的问题。例如,可通知所述用户所述底层网络在稍后时间点上将不能或无法满足所述覆盖网络的需求,反之亦然。所述一个或多个警报可以通知的形式传递至所述用户,该通知可包括但不限于用户界面上的提示、短信、电子邮件和警告。
图5为根据一种实施方式在解决方案数据库内存储纠正动作的方法流程图。在所述网络管理系统确定了所述第一网络和第二网络中的一者或两者内一个或多个问题后,该网络管理系统可在步骤502中执行一个或多个纠正动作,以解决所述一个或多个问题。在一种实施方式中,可根据所述网络管理系统针对相同或类似问题在之前执行的纠正动作,衍生出所述一个或多个纠正动作。在另一实施方式中,所述一个或多个纠正动作可以为所述网络管理系统在之前未执行过的新的解决方案。因此,在步骤504中,将针对所述一个或多个问题的所述一个或多个纠正动作存储于解决方案数据库内。该解决方案数据库设置为对所述一个或多个纠正动作进行存储和管理。所述一个或多个纠正动作中的每个纠正动作可映射于设计为由该纠正动作解决的一个或多个问题。因此,在所述解决方案数据库中,纠正动作可具有一对一或一对多的映射关系。
图6为根据一种实施方式生成报告的方法流程图。在步骤602中,所述网络管理系统可根据所述关系矩阵确定所述第一网络和第二网络中的一者或两者内的一个或多个问题。在此之后,在步骤604中,所述网络管理系统可通过执行一个或多个纠正动作而解决所述一个或多个问题。执行该一个或多个纠正动作后,在步骤606中,所述网络管理系统可生成针对所述第一网络和第二网络中的一者或两者生成报告。
所述报告可包括一组网络端点之间的当前路径健康度可视化结果,所述一组网络端点之间的预测路径健康度可视化结果,所确定的所述第一网络和第二网络中的一者或两者内的所述一个或多个问题的细节,以及为了解决所述一个或多个问题而执行的所述一个或多个纠正动作的细节。所述报告内的当前路径健康度可视化结果表明所述第一网络和第二网络中的一者或两者内的当前流量所流经的网络节点和链路的健康度。所述当前路径健康度可视化结果通过对路径内数据发送和接收所涉及的边缘或节点进行跟踪和监控的方式确定。当所述数据被成功传送时,则表明该路径为健康路径。
如此,可实现对所述多个网络内路径的实时监测,并为所述多个网络内的每条路径创建当前路径健康度可视化结果。同样地,所述报告内的预测路径健康度可视化结果表明所述第一网络和第二网络中的一者或两者内的预期流量以预测方式所流经的网络节点和链路的健康度。在所述报告中,可使用预定义的第一颜色编码表示健康的路径、链路、边缘和/或节点,并以预定义的第二颜色编码表示非健康的路径、链路、边缘和/或节点。
在一种实施方式中,所述网络管理系统可利用所述多个网络中的传输层对在网络间传送的数据的传输进行映射。其中,所述网络管理系统可通过使用所述传输层内的信息对同一网络内的两个端点之间或不同网络间的两个端点之间的路径健康度可视化结果进行动态绘制。此外,所述网络管理系统还可将所述动态生成的路径健康度可视化结果与历史路径健康度可视化结果数据相结合,以对各种边缘和节点进行基准测试,描绘趋势,或在一段时间内检测流量流模式。
图7为根据一种实施方式设置为对多个网络进行管理的网络管理系统700的框图。网络管理系统700包括数据库702和处理器704。此外,数据库702包括历史数据库706和解决方案数据库708。历史数据库706和解决方案数据库708以可操作方式彼此连接并均连接至处理器704。处理器704包括关联引擎710和分析引擎712。网络管理系统700可设置于单个本地站点,或者分布于两个或更多的不同站点。此外,网络管理系统700可以为底层网络714的一部分或覆盖网络716的一部分。在一种实施方式中,网络管理系统700可既为底层网络714的一部分,也为覆盖网络716的一部分。
关联引擎710设置为从多个网络获取控制信息。所述多个网络例如包括但不限于底层网络714和覆盖网络716。在一种实施方式中,关联引擎710从底层网络714获得所述控制信息。从底层网络714获得的该控制信息包括底层网络714的数据传输信息和网络资源信息。与底层网络714相关联的所述数据传输信息包括其路由信息、流量流信息和网络流信息。所述网络资源信息包括但不限于网络拓扑信息,链路和节点等网络部件的信息,以及网络性能信息。
从底层网络714获得所述控制信息后,关联引擎710从覆盖网络716获取控制信息。来自覆盖网络716的控制信息包括覆盖网络716的数据传输信息及网络资源信息。与覆盖网络716相关联的所述数据传输信息包括其路由信息、流量流信息和网络流信息。
在此之后,关联引擎710将底层网络714的控制信息与覆盖网络716的控制信息相关联,以生成关系矩阵。为了生成该关系矩阵,关联引擎710对底层网络714内发生的事件以及覆盖网络716内发生的相应事件进行探测,以对这些事件之间的关系进行识别。例如,关联引擎710可检测底层网络714中在特定时间发生的事件以及覆盖网络716中在该特定时间发生的相应事件,以对底层网络714和覆盖网络716的事件之间的关系进行识别。
在一种实施方式中,关联引擎710对该控制信息进行分析,以判断为了生成所述关系矩阵,是否需要与已获得的所述控制信息关联的其他控制信息或其他数据。当不需要与已获得的所述控制信息关联的其他控制信息或其他数据时,关联引擎710可继续生成所述关系矩阵。当需要与已获得的所述控制信息关联的其他控制信息或其他数据时,关联引擎710可从历史数据库706中获取与已获得的所述控制信息关联的其他控制信息或其他数据。历史数据库706设置为对所述控制信息和与该控制信息相关联的其他数据进行存储和管理。
在一种实施方式中,关联引擎710可将从底层网络714获取的控制信息以及从覆盖网络716获取的控制信息传送至历史数据库706,以用于对所述控制信息进行存储和管理。所述控制信息可以固定间隔传送至历史数据库706,或者动态地在当指定条件满足时传送至该历史数据库。
生成所述关系矩阵后,关联引擎710确定底层网络714和覆盖网络716中的一者或两者内的一个或多个问题。例如,在生成所述关系矩阵后,关联引擎710可确定底层网络714内的一个或多个问题。类似地,通过生成所述关系矩阵,关联引擎710可确定覆盖网络716内的一个或多个问题。
在一种实施方式中,关联引擎710可确定在稍后时间点可能发生于底层网络714和覆盖网络716中的一者或两者内的一个或多个问题。换言之,关联引擎710可预测上述一个或多个问题。此外,关联引擎710还可提供其他细节,例如,所述一个或多个问题可能发生的时间以及该一个或多个问题的可预测性得分,该得分表示该一个或多个问题在将来发生的概率。
随后,在接收关于底层网络714和覆盖网络716中的一者或两者内的一个或多个问题的信息后,分析引擎712可生成一个或多个警报。所生成的该一个或多个警报就已确定的所述一个或多个问题对网络管理系统700的用户进行通知,或者就被预测为可能在稍后时间点发生的所述一个或多个问题对所述用户进行通知。所述一个或多个警报可以通知的形式传递至所述用户,该通知可包括但不限于用户界面上的提示、短信、电子邮件和警告。
在此之后,所述分析引擎712可通过执行一个或多个纠正动作解决所述一个或多个问题。所述一个或多个纠正动作的目的在于解决底层网络714或覆盖网络716的所述一个或多个问题。可根据分析引擎712针对相同或类似问题在之前执行的纠正动作,衍生出所述一个或多个纠正动作。在一种实施方式中,所述一个或多个纠正动作可以为分析引擎712在之前未执行过的新的解决方案。因此,根据一种实施方式,分析引擎712可将所述一个或多个新的纠正动作存储于解决方案数据库708内。解决方案数据库708设置为对所述一个或多个纠正动作进行存储和管理。每个纠正动作可映射于设计为由该纠正动作解决的一个或多个问题。因此,在解决方案数据库708中,纠正动作可具有一对一或一对多的映射关系。
在另一实施方式中,分析引擎712可通过之前执行过的纠正动作更新解决方案数据库708。如此,可提高网络管理系统700的准确性、性能和速度。
执行所述一个或多个纠正动作之后,分析引擎712可生成针对所述多个网络生成报告。该报告可包括一组网络端点之间的当前路径健康度可视化结果,所述一组网络端点之间的预测路径健康度可视化结果,所确定的底层网络714和覆盖网络716中的一者或两者内的所述一个或多个问题的细节,以及为了解决所述一个或多个问题而执行的所述一个或多个纠正动作的细节。所述报告内的当前路径健康度可视化结果表明底层网络714和覆盖网络716中的一者或两者内的当前流量所流经的网络节点和链路的健康度。同样地,所述报告内的预测路径健康度可视化结果表明底层网络714和覆盖网络716中的一者或两者内的预期流量以预测方式所流经的网络节点和链路的健康度。
图8为用于实现各种实施方式的例示计算机系统框图。计算机系统802可包括中央处理单元(“CPU”或“处理器”)804。处理器804可包括至少一个用于执行程序组件的数据处理器,该程序组件用于执行用户或系统生成的请求。用户可包括个人,使用设备(例如,本发明范围内的设备)的个人,或此类设备本身。所述处理器可包括专用处理单元,例如集成系统(总线)控制器、存储器管理控制单元、浮点单元、图形处理单元、数字信号处理单元等。所述处理器可包括微处理器,例如AMD速龙(Athlon)、毒龙(Duron)或皓龙(Opteron),ARM应用处理器,嵌入式或安全处理器,IBM PowerPC,Intel Core、安腾(Itanium)、至强(Xeon)、赛扬(Celeron)或其他处理器产品线等。处理器804可通过主机、分布式处理器、多核、并行、网格或其他架构实现。一些实施方式可采用专用集成电路(ASIC)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)等嵌入式技术。
处理器804可设置为通过输入/输出(I/O)接口806与一个或多个I/O设备通信。I/O接口806可采用通信协议/方法,例如但不限于,音频、模拟、数字、单声道、RCA、立体声、IEEE-1394、串行总线、通用串行总线(USB)、红外、PS/2、BNC、同轴、组件、复合、数字视觉接口(DVI)、高清晰度多媒体接口(HDMI)、射频天线、S-视频,VGA、IEEE 802.n/b/g/n/x、蓝牙、蜂窝(例如码分多址(CDMA)、高速分组接入(HSPA+)、移动通信全球系统(GSM)、长期演进(LTE)、WiMax等)等。
通过使用I/O接口806,计算机系统802可与一个或多个I/O设备进行通信。举例而言,输入设备808可以为天线、键盘、鼠标、操纵杆、(红外)遥控、摄像头、读卡器、传真机、加密狗、生物计量阅读器、麦克风、触摸屏、触摸板、轨迹球、传感器(例如加速度计、光传感器、GPS、陀螺仪、接近传感器等)、触控笔、扫描仪、存储设备、收发器、视频设备/视频源、头戴式显示器等。输出设备810可以为打印机、传真机、视频显示器(例如阴极射线管(CRT)、液晶显示器(LCD)、发光二极管(LED)、等离子等)、音频扬声器等。在一些实施方式中,收发器812可与处理器804连接。收发器812可促进各类无线传输或接收。例如,收发器812可包括以可操作方式连接至收发器芯片(例如德州仪器(Texas Instruments)WiLink WL1283、博通(Broadcom)BCM4750IUB8、英飞凌科技(Infineon Technologies)X-Gold 618-PMB9800等)的天线,以实现IEEE 802.11a/b/g/n、蓝牙、FM、全球定位系统(GPS)、2G/3G HSDPA/HSUPA通信等。
在一些实施方式中,处理器804可配置为通过网络接口816与通信网络814通信。网络接口816可与通信网络814通信。网络接口816可采用连接协议,包括但不限于,直接连接,以太网(例如双绞线10/100/1000BaseT),传输控制协议/网际协议(TCP/IP),令牌环,IEEE802.11a/b/g/n/x等。通信网络814可包括,但不限于,直接互连、局域网(LAN)、广域网(WAN)、无线网络(例如使用无线应用协议)、因特网等。通过网络接口816和通信网络814,计算机系统802可与设备818、820和822通信。这些设备可包括,但不限于,个人计算机、服务器、传真机、打印机、扫描仪以及各种移动设备,例如蜂窝电话、智能电话(例如苹果公司(Apple)的iPhone、黑莓手机(Blackberry)、基于安卓(Android)系统的电话等)、平板电脑、电子书阅读器(亚马逊(Amazon)Kindle,Nook等)、膝上型计算机、笔记本电脑、游戏机(微软(Microsoft)Xbox、任天堂(Nintendo)DS,索尼(Sony)PlayStation等)等。在一些实施方式中,计算机系统802本身可包含一个或多个上述设备。
在一些实施方式中,处理器804可配置为通过存储接口824与一个或多个存储设备(例如RAM 826、ROM 828等)通信。存储接口824可采用串行高级技术连接(SATA)、集成驱动电子设备(IDE)、IEEE 1394、通用串行总线(USB)、光纤通道、小型计算机系统接口(SCSI)等连接协议连接至存储设备,该存储设备包括,但不限于,存储驱动器、可移除磁盘驱动器等。所述存储驱动器还可包括磁鼓、磁盘驱动器、磁光驱动器、光盘驱动器、独立磁盘冗余阵列(RAID)、固态存储设备、固态驱动器等。
存储设备830可存储一系列程序或数据库组件,包括但不限于,操作系统832、用户界面834、网页浏览器836、邮件服务器838、邮件客户端840、用户/应用程序数据842(例如本发明中所述的任何数据变量或数据记录)等。操作系统832可促进计算机系统802的资源管理和运行。操作系统832例如包括,但不限于,苹果公司的麦金塔(Macintosh)OS X、Unix、类Unix系统套件(例如伯克利软件套件(BSD)、FreeBSD、NetBSD、OpenBSD等)、Linux套件(如红帽(Red Hat)、Ubuntu、Kubuntu等)、IBM OS/2、微软Windows(XP,Vista/7/8等)、苹果iOS、谷歌公司(Google)的安卓、黑莓操作系统等。用户界面834可利用文本或图形工具促进程序组件的显示、执行、互动、操控或操作。例如,用户界面可在以可操作方式连接至计算机系统802的显示系统上提供光标、图标、复选框、菜单、滚动条、窗口、窗口部件等计算机交互界面元件。还可采用图形用户界面(GUI),包括但不限于,苹果Macintosh操作系统的Aqua、IBMOS/2、微软Windows(例如Aero、Metro等)、Unix X-Windows、网页界面库(例如ActiveX、Java、Javascript、AJAX、HTML、Adobe Flash等)等。
在一些实施方式中,计算机系统802可执行网页浏览器836存储的程序组件。网页浏览器836可以为超文本浏览应用程序,如微软因特网浏览器(Internet Explorer)、谷歌浏览器(Chrome)、谋智(Mozilla)火狐(Firefox)、苹果浏览器(Safari)等。安全网页浏览可通过安全超文本传输协议(HTTPS)、安全套接字层(SSL)、安全传输层(TLS)等实现。网页浏览器可使用AJAX、DHTML、Adobe Flash、JavaScript、Java、应用程序编程接口(API)等工具。在一些实施方式中,计算机系统802可执行邮件服务器838存储的程序组件。邮件服务器838可以为微软Exchange等因特网邮件服务器。所述邮件服务器可使用ASP、ActiveX、ANSI C++/C#、微软.NET、CGI脚本、Java、JavaScript、PERL、PHP、Python、WebObjects等工具。所述邮件服务器还可使用因特网信息访问协议(IMAP)、邮件应用程序编程接口(MAPI)、微软Exchange、邮局协议(POP)、简单邮件传输协议(SMTP)等通信协议。在一些实施方式中,计算机系统802可执行邮件客户端840存储的程序组件。邮件客户端840可为苹果Mail、微软Entourage、微软Outlook、谋智Thunderbird等邮件查看程序。
在一些实施方式中,计算机系统802可存储用户/应用程序数据842,例如本发明中所述数据、变量、记录等。此类数据库可以为容错、关系、可扩展、安全数据库,例如甲骨文(Oracle)或赛贝斯(Sybase)。或者,上述数据库可通过数组、散列、链表、结构、结构化文本文件(例如XML)、表格等标准化数据结构实现,或者实施为面向对象的数据库(例如通过ObjectStore、Poet、Zope等)。上述数据库可以为合并或分布数据库,有时分布于本发明所讨论的上述各种计算机系统之间。应该理解的是,可以以任何可工作的组合形式对上述任何计算机或数据库组件的结构及操作进行组合、合并或分布。
可以理解的是,为了清楚起见,以上已参考不同功能单元和处理器对本发明实施方式进行了描述。然而,容易理解的是,在不影响本发明的前提下,还可将功能在不同功能单元、处理器或域之间进行任何合适的分布。例如,描述为由各不同处理器或控制器实现的功能也可由同一处理器或控制器实现。因此,所指的特定功能单元仅视为指代用于提供所描述功能的合适手段,而不严格表示逻辑上或物理上的结构或组织。
在各种实施方式中,提供了通过动态管理多个网络而改善底层网络和覆盖网络之间的关联性的方法,系统和计算机程序产品。所述方法利用极易获取且常用的故障、性能和流量监控工具实时收集数据并参考历史数据。此外,该方法可实现端到端操作的可见性,从而消除了所述底层和覆盖网络中的盲点。此外,该方法还提高了所述数据中心内的多个网络的总体性能。其次,针对所述底层和覆盖网络,该方法无需使用其他的配置、监测及管理工具。再次,该方法可以快速无缝方式实现所述底层网络和覆盖网络内问题的故障排除,从而减少了平均修复时间(MTTR)值。
本说明书已对通过动态管理多个网络而改善底层网络和覆盖网络之间的关联性的方法,系统和计算机程序产品进行了描述。所示步骤用于说明所述例示实施方式,并且应当预想到的是,随着技术的不断发展,特定功能的执行方式也将发生改变。本文所呈现的上述实施例用于说明而非限制目的。此外,为了描述的方便性,本文对各功能构建模块边界的定义为任意性的,只要其上述功能及其关系能够获得适当执行,也可按其他方式定义边界。根据本申请的启示内容,替代方案(包括本申请所述方案的等同方案、扩展方案、变形方案、偏差方案等)对于相关领域技术人员是容易理解的。这些替代方案均落入所公开实施方式的范围和精神内。
此外,一个或多个计算机可读存储介质可用于实施本发明的实施方式。计算机可读存储介质是指可对处理器可读取的信息或数据进行存储的任何类型的物理存储器。因此,计算机可读存储介质可对由一个或多个处理器执行的指令进行存储,包括用于使处理器执行根据本申请实施方式的步骤或阶段的指令。“计算机可读介质”一词应理解为包括有形物件且不包括载波及瞬态信号,即为非临时性介质,例如随机存取存储器(RAM)、只读存储器(ROM)、易失性存储器、非易失性存储器、硬盘驱动器、只读光盘存储器(CD-ROM)、数字化视频光盘(DVD)、闪存驱动器、磁盘以及其他任何已知物理存储介质。
以上发明及实施例旨在于仅视为示例性内容及实施例,所公开实施方式的真正范围和精神由以下权利要求指出。

Claims (19)

1.一种由网络管理系统对多个网络进行管理的方法,其特征在于,该方法包括:
由所述网络管理系统从所述多个网络中的底层网络获取所述底层网络的控制信息,所述底层网络的控制信息包括所述底层网络的数据传输信息以及所述底层网络的网络资源信息;
由所述网络管理系统从所述多个网络中的覆盖网络获取所述覆盖网络的控制信息,其中,所述覆盖网络是指建构于所述底层网络之上且使用所述底层网络的数据传输功能,以及具有与所述底层网络不同的路由功能的网络,所述覆盖网络的控制信息包括所述覆盖网络的数据传输信息以及所述覆盖网络的网络资源信息;
由所述网络管理系统将所述底层网络的控制信息与所述覆盖网络的控制信息相关联,以生成一关系矩阵;
由所述网络管理系统响应于所述关系矩阵的生成而确定所述底层网络和所述覆盖网络中的至少一个网络内的至少一个问题;以及
由所述网络管理系统执行至少一个纠正动作,以解决所述底层网络和所述覆盖网络中的至少一个网络内的所述至少一个问题。
2.如权利要求1所述的方法,其特征在于,所述底层网络的控制信息和所述覆盖网络的控制信息是从一历史数据库中获取的。
3.如权利要求2所述的方法,其特征在于,对所述历史数据库定期更新,以纳入所述底层网络的控制信息和所述覆盖网络的控制信息。
4.如权利要求1所述的方法,其特征在于,确定所述至少一个问题包括预测所述底层网络和所述覆盖网络中的至少一个网络内的所述至少一个问题。
5.如权利要求1所述的方法,其特征在于,确定所述至少一个问题包括生成所述至少一个问题的至少一个警报。
6.如权利要求1所述的方法,其特征在于,执行所述至少一个纠正动作包括将与所述至少一个问题相对应的所述至少一个纠正动作存储于一解决方案数据库内。
7.如权利要求1所述的方法,其特征在于,还包括生成所述多个网络的报告,该报告包括一组网络端点之间的一当前路径健康度可视化结果,以及该一组网络端点之间的一预测路径健康度可视化结果。
8.如权利要求1所述的方法,其特征在于,所述底层网络的数据传输信息和所述覆盖网络的数据传输信息均包括路由信息、网络流信息以及流量流信息。
9.如权利要求1所述的方法,其特征在于,所述底层网络的网络资源信息和所述覆盖网络的网络资源信息均包括网络拓扑信息、网络部件的信息以及性能信息,所述网络部件包括链路和节点。
10.一种管理多个网络的网络管理系统,其特征在于,该网络管理系统包括:
一数据库,包括一历史数据库和一解决方案数据库;以及
一处理器,以可操作方式连接于所述数据库,该处理器设置为:
从所述多个网络中的底层网络获取所述底层网络的控制信息,所述底层网络的控制信息包括所述底层网络的数据传输信息以及所述底层网络的网络资源信息;
从所述多个网络中的覆盖网络获取所述覆盖网络的控制信息,其中,所述覆盖网络是指建构于所述底层网络之上且使用所述底层网络的数据传输功能,以及具有与所述底层网络不同的路由功能的网络,所述覆盖网络的控制信息包括所述覆盖网络的数据传输信息以及所述覆盖网络的网络资源信息;
将所述底层网络的控制信息与所述覆盖网络的控制信息相关联,以生成一关系矩阵;
响应于所述关系矩阵的生成而确定所述底层网络和所述覆盖网络中的至少一个网络内的至少一个问题;以及
执行至少一个纠正动作,以解决所述底层网络和所述覆盖网络中的至少一个网络内的所述至少一个问题。
11.如权利要求10所述的网络管理系统,其特征在于,所述处理器还设置为从所述历史数据库获取所述底层网络的控制信息和所述覆盖网络的控制信息。
12.如权利要求10所述的网络管理系统,其特征在于,所述处理器还设置为定期更新所述历史数据库,以纳入所述底层网络的控制信息和所述覆盖网络的控制信息。
13.如权利要求10所述的网络管理系统,其特征在于,所述处理器还设置为预测所述底层网络和所述覆盖网络中的至少一个网络内的所述至少一个问题。
14.如权利要求10所述的网络管理系统,其特征在于,所述处理器还设置为生成所述至少一个问题的至少一个警报。
15.如权利要求10所述的网络管理系统,其特征在于,所述处理器还设置为将与所述至少一个问题相对应的所述至少一个纠正动作存储于所述解决方案数据库内。
16.如权利要求10所述的网络管理系统,其特征在于,所述处理器还设置为生成所述多个网络的报告,该报告包括一组网络端点之间的一当前路径健康度可视化结果,以及该一组网络端点之间的一预测路径健康度可视化结果。
17.如权利要求10所述的网络管理系统,其特征在于,所述底层网络的数据传输信息和所述覆盖网络的数据传输信息均包括路由信息、网络流信息以及流量流信息。
18.如权利要求10所述的网络管理系统,其特征在于,所述底层网络的网络资源信息和所述覆盖网络的网络资源信息均包括网络拓扑信息、网络部件的信息以及性能信息,所述网络部件包括链路和节点。
19.一种用于实施对多个网络进行管理的方法的非暂时性计算机可读存储介质,该非暂时性计算机可读存储介质中存储指令,其特征在于,该指令被处理器执行时实现以下步骤:
从所述多个网络中的底层网络获取所述底层网络的控制信息,所述底层网络的控制信息包括所述底层网络的数据传输信息以及所述底层网络的网络资源信息;
从所述多个网络中的覆盖网络获取所述覆盖网络的控制信息,其中,所述覆盖网络是指建构于所述底层网络之上且使用所述底层网络的数据传输功能,以及具有与所述底层网络不同的路由功能的网络,所述覆盖网络的控制信息包括所述覆盖网络的数据传输信息以及所述覆盖网络的网络资源信息;
将所述底层网络的控制信息与所述覆盖网络的控制信息相关联,以生成一关系矩阵;
响应于所述关系矩阵的生成而确定所述底层网络和所述覆盖网络中的至少一个网络内的至少一个问题;以及
执行至少一个纠正动作,以解决所述底层网络和所述覆盖网络中的至少一个网络内的所述至少一个问题。
CN201611226199.5A 2016-03-29 2016-12-27 改善数据中心覆盖网络和底层网络间关联性的方法和系统 Active CN107241211B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN201641010852 2016-03-29
IN201641010852 2016-03-29

Publications (2)

Publication Number Publication Date
CN107241211A CN107241211A (zh) 2017-10-10
CN107241211B true CN107241211B (zh) 2020-06-30

Family

ID=56561216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611226199.5A Active CN107241211B (zh) 2016-03-29 2016-12-27 改善数据中心覆盖网络和底层网络间关联性的方法和系统

Country Status (3)

Country Link
US (1) US9960954B2 (zh)
EP (1) EP3226471B1 (zh)
CN (1) CN107241211B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10862777B2 (en) * 2016-09-28 2020-12-08 Amazon Technologies, Inc. Visualization of network health information
US10410424B1 (en) * 2017-07-31 2019-09-10 EMC IP Holding Company LLC System health awareness using augmented reality
US10409523B1 (en) 2017-07-31 2019-09-10 EMC IP Holding Company LLC Storage device monitoring using augmented reality
US10673765B2 (en) 2018-09-11 2020-06-02 Cisco Technology, Inc. Packet flow classification in spine-leaf networks using machine learning based overlay distributed decision trees
DE112019007229T5 (de) 2019-04-18 2022-01-13 Hewlett Packard Enterprise Development Lp Heuristische sd-wan-routen-neukonfiguration
US11888738B2 (en) 2019-08-15 2024-01-30 Juniper Networks, Inc. System and method for determining a data flow path in an overlay network
US11302078B2 (en) 2019-10-03 2022-04-12 EMC IP Holding Company LLC Three-dimensional map generation with metadata overlay for visualizing projected workflow impact in computing environment
CN113587975A (zh) 2020-04-30 2021-11-02 伊姆西Ip控股有限责任公司 用于管理应用环境的方法、设备和计算机程序产品
CN113865587A (zh) 2020-06-30 2021-12-31 伊姆西Ip控股有限责任公司 用于监控现场设备的方法、电子设备和计算机程序产品
US10999142B1 (en) * 2020-06-30 2021-05-04 Juniper Networks, Inc. Correlation of virtual network traffic across bare metal servers
CN113868102A (zh) 2020-06-30 2021-12-31 伊姆西Ip控股有限责任公司 用于信息显示的方法、电子设备和计算机程序产品
US11444855B2 (en) 2020-07-07 2022-09-13 Juniper Networks, Inc. System and method for determining a data flow path in an overlay network
US11533216B2 (en) * 2020-08-28 2022-12-20 Ciena Corporation Aggregating alarms into clusters to display service-affecting events on a graphical user interface
CN114124789A (zh) * 2021-11-22 2022-03-01 广东电网有限责任公司 一种网络协同探测方法、装置、设备及计算机介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2407451A (en) * 2003-10-24 2005-04-27 Agilent Technologies Inc Automatically analysing network events using matrices
US8661295B1 (en) * 2011-03-31 2014-02-25 Amazon Technologies, Inc. Monitoring and detecting causes of failures of network paths

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020174207A1 (en) * 2001-02-28 2002-11-21 Abdella Battou Self-healing hierarchical network management system, and methods and apparatus therefor
US8208381B2 (en) * 2007-07-27 2012-06-26 Eg Innovations Pte. Ltd. Root-cause approach to problem diagnosis in data networks
US8699355B2 (en) * 2007-12-20 2014-04-15 Verizon Patent And Licensing Inc. Method and system for performing network diagnostics utilizing a secondary communications medium
US9210079B2 (en) 2012-08-14 2015-12-08 Vmware, Inc. Method and system for virtual and physical network integration
US10193742B2 (en) * 2015-10-29 2019-01-29 Kodacloud Inc. Selecting a corrective action for a network connection problem based on historical data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2407451A (en) * 2003-10-24 2005-04-27 Agilent Technologies Inc Automatically analysing network events using matrices
US8661295B1 (en) * 2011-03-31 2014-02-25 Amazon Technologies, Inc. Monitoring and detecting causes of failures of network paths

Also Published As

Publication number Publication date
EP3226471A1 (en) 2017-10-04
US20170288945A1 (en) 2017-10-05
EP3226471B1 (en) 2019-05-15
US9960954B2 (en) 2018-05-01
CN107241211A (zh) 2017-10-10

Similar Documents

Publication Publication Date Title
CN107241211B (zh) 改善数据中心覆盖网络和底层网络间关联性的方法和系统
US11314574B2 (en) Techniques for managing and analyzing log data
WO2021129367A1 (zh) 一种监控分布式存储系统的方法及装置
EP3489828B1 (en) Method and system for resolving anomaly events occurring in a virtual environment in real-time
KR102312354B1 (ko) 클라우드 스트리밍 서비스를 위한 서비스 품질 모니터링 시스템 및 방법, 그리고 컴퓨터 프로그램이 기록된 기록매체
JP2019503525A (ja) 連続クエリ処理におけるイベントバッチ処理、出力シーケンス化、およびログベースの状態記憶
US11656928B2 (en) Detecting datacenter mass outage with near real-time/offline using ml models
US11797414B2 (en) Method and system for failure prediction in cloud computing platforms
CN113328872A (zh) 故障修复方法、装置和存储介质
US11012298B2 (en) Methods, systems, and computer readable mediums for selecting and configuring a computing system to support a replicated application
US10185614B2 (en) Generic alarm correlation by means of normalized alarm codes
US11416321B2 (en) Component failure prediction
CN111078695B (zh) 计算企业内元数据关联关系的方法及装置
US11012317B2 (en) Visualization for monitoring infrastructure entities
US10819604B2 (en) Change to availability mapping
US20200134534A1 (en) Method and system for dynamically avoiding information technology operational incidents in a business process
US11563628B1 (en) Failure detection in cloud-computing systems
JP2024521357A (ja) Mlモデルを用いて準リアルタイムデータ/オフラインデータでデータセンタの大規模な故障の検出
US11663102B2 (en) Event-based operational data collection for impacted components
US20230385279A1 (en) Dynamic classification and optimization of computing resource utilization
CN117992264A (zh) 宿主机故障修复方法及装置、系统、电子设备和存储介质
US9634884B2 (en) Monitoring apparatus, monitoring method and monitoring program
KR20170059733A (ko) 물리적 노드의 데이터 처리 방법 및 그 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant