CN111083005A - 针对网络设备的健康数据的可扩展可视化 - Google Patents

针对网络设备的健康数据的可扩展可视化 Download PDF

Info

Publication number
CN111083005A
CN111083005A CN201910569778.7A CN201910569778A CN111083005A CN 111083005 A CN111083005 A CN 111083005A CN 201910569778 A CN201910569778 A CN 201910569778A CN 111083005 A CN111083005 A CN 111083005A
Authority
CN
China
Prior art keywords
health state
group
health
data
state values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910569778.7A
Other languages
English (en)
Other versions
CN111083005B (zh
Inventor
A·K·钦塔拉
N·K·西玛里亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Juniper Networks Inc
Original Assignee
Juniper Networks Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Juniper Networks Inc filed Critical Juniper Networks Inc
Priority to CN202410476837.7A priority Critical patent/CN118138484A/zh
Publication of CN111083005A publication Critical patent/CN111083005A/zh
Application granted granted Critical
Publication of CN111083005B publication Critical patent/CN111083005B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/321Display for diagnostics, e.g. diagnostic result display, self-test user interface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/328Computer systems status display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Environmental & Geological Engineering (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开的实施例涉及针对网络设备的健康数据的可扩展可视化。本公开描述了包括呈现视觉信息的技术,该视觉信息传达关于与大量网络设备或一个或多个网络设备的大量属性相关联的健康数据的信息。在一个示例中,本公开描述了一种方法,该方法包括收集性能指标数据,以及基于健康状态规则来确定多个健康状态值;基于多个健康状态值中有多少健康状态值,而将健康状态值分组成多个健康状态组,其中健康状态组中的每个健康状态组包括健康状态值的子集,并且其中每个子集内的健康状态值中的每个健康状态值与子集中的其他健康状态值中的每个其他健康状态值相关;以及针对健康状态组中的每个健康状态组确定组健康状态值。

Description

针对网络设备的健康数据的可扩展可视化
技术领域
本公开涉及呈现关于数据中心和/或网络中的设备的性能、健康和/或操作的信息。
背景技术
随着网络的持续激增,数目不断增加的各自发出可通过遥测和其他方法收集的数据的网络设备已经产生了巨大量的数据。这种数据中的至少一些可以被认为是关键性能指标(KPI)数据,其反映与网络设备的操作有关的性能和/或其他操作属性。为了评估网络设备(无论是物理的还是虚拟的)的健康和/或状态,可以收集和分析针对该网络设备的一种或多种类型的KPI数据。对KPI数据的分析可以提供对网络设备的当前健康或状态的有用且富有洞察力的评估,从而指示网络设备正在例如正常或不良地操作。
发明内容
本公开描述了包括生成和呈现视觉信息的技术,该视觉信息传达关于大量网络设备或一个或多个网络设备的大量属性的健康状态的数据。在一些示例中,这种技术可以涉及收集关于一个或多个网络设备的数据(例如,KPI或其他度量),基于所收集的数据确定健康状态值,以及对健康状态值的逻辑相关的集合进行分组。可以针对每个组确定集体或复合组健康状态值,并且可以在用户界面中呈现组健康状态值中的每一个作为显示元素,该显示元素传达(例如,通过颜色、形状、动画或其他方式)关于每个组的状态的信息。以这种方式,该技术可以允许通过基于被分析的相应属性或网络设备的数目而动态地扩展显示元素以涵盖更多健康状态值来增加呈现给用户的信息。
本文描述的技术可以提供某些技术优势。例如,通过以可扩展、方便和有意义的方式呈现数据,管理员可以能够容易地和/或高效地评估大型系统的状态,并标识性能指标和基于规则的健康状态,以精确定位系统、网络或设备的有问题的属性。通过高效地标识有问题的区域,管理员可以配置或重新配置系统、网络和/或设备以纠正或改善受影响或有问题的区域的性能和效率,从而产生更高效的系统、网络和/或设备。
在一个示例中,本公开描述了一种方法,包括由计算系统收集针对一个或多个网络设备的性能指标数据;由计算系统确定多个健康状态值,其中健康状态值中的每个健康状态值基于多个健康状态规则中的一个被确定,多个健康状态规则评估性能指标数据的子集;由计算系统基于多个健康状态值中有多少健康状态值,将健康状态值分组成多个健康状态组,其中健康状态组中的每一个包括两个或更多个健康状态值,并且其中健康状态组内的健康状态值中的每一个与健康状态组中的其他健康状态值中的每一个相关;由计算系统并且针对健康状态组中的每一个确定组健康状态值,其中针对每个健康状态组的组健康状态值基于健康状态组内的健康状态值中的至少一个被确定;由计算系统输出包括针对健康状态组中的每一个的显示元素的用户界面,其中显示元素中的每一个提供与每个相应的健康状态组相关联的组健康状态值的视觉指示。
在另一示例中,本公开描述了一种系统,包括确定多个健康状态值,其中健康状态值中的每个健康状态值基于多个健康状态规则中的一个被确定,多个健康状态规则评估性能指标数据的子集;基于多个健康状态值中有多少健康状态值,将健康状态值分组成多个健康状态组,其中健康状态组中的每一个包括两个或更多个健康状态值,并且其中健康状态组内的健康状态值中的每一个与健康状态组中的其他健康状态值中的每一个相关,针对健康状态组中的每一个确定组健康状态值,其中针对每个健康状态组的组健康状态值基于健康状态组内的健康状态值中的至少一个被确定;并且输出包括针对健康状态组中的每一个的显示元素的用户界面,其中显示元素中的每一个提供与每个相应的健康状态组相关联的组健康状态值的视觉指示。
在另一示例中,本公开描述了一种计算机可读存储介质,包括指令,指令在被执行时将计算系统的处理电路配置成:确定多个健康状态值,其中健康状态值中的每个健康状态值基于多个健康状态规则中的一个被确定,多个健康状态规则评估性能指标数据的子集,基于多个健康状态值中有多少健康状态值,将健康状态值分组成多个健康状态组,其中健康状态组中的每一个包括两个或更多个健康状态值,并且其中健康状态组内的健康状态值中的每一个与健康状态组中的其他健康状态值中的每一个相关,针对健康状态组中的每一个确定组健康状态值,其中针对每个健康状态组的组健康状态值基于健康状态组内的健康状态值中的至少一个被确定;以及输出包括针对健康状态组中的每一个的显示元素的用户界面,其中显示元素中的每一个提供与每个相应的健康状态组相关联的组健康状态值的视觉指示。
附图说明
图1是图示根据本公开的一个或多个方面的包括示例数据中心的示例网络的概念图,在该示例数据中心中监控用于物理的和基于云的计算环境的基础设施元件的性能指标。
图2是图示根据本公开的一个或多个方面的示例系统的框图,该示例系统用于收集关于关键性能指标的信息并基于关键性能指标呈现健康状态信息。
图3A是根据本公开的一个或多个方面的示例用户界面,其图示了从网络上的设备收集的数据的可视化。
图3B是根据本公开的一个或多个方面的图示了弹出窗口的示例用户界面,该弹出窗口提供关于图3A的用户界面内所示的显示元素的细节。
图3C是根据本公开的一个或多个方面的示例用户界面,其图示了响应于用户输入而对用户界面内呈现的信息的过滤。
图4是图示用于所收集的关键性能指标的示例分层数据模型的概念图。
图5A是根据本公开的一个或多个方面的示例性用户界面,其图示了从网络上的设备组收集的数据的可视化。
图5B是根据本公开的一个或多个方面的图示了弹出窗口的示例用户界面,该弹出窗口提供关于图5A的用户界面内所图示的显示元素中的一个显示元素的细节。
图5C是根据本公开的一个或多个方面的示例用户界面,其图示了响应于用户输入而对在图5B的用户界面内呈现的表格式信息的修改。
图6是根据本公开的一个或多个方面的示例用户界面,其图示了从网络上的另一分组的设备收集的数据的可视化。
图7是图示根据本发明的一个或多个方面的由示例控制器执行的操作的流程图。
具体实施方式
随着遥测使能的端点的可用性,网络设备发出的大量数据可供监控和分析解决方案使用。监控和分析应用通常包含控制面板,该控制面板可以包含一组用户界面,其呈现应用正在监控的一些或所有设备的状态的概要图。为了调查特定设备的健康状态,可能需要对与该设备相关联的关键性能指标或度量进行分析。然而,取决于KPI和系统配置以及KPI信息的粒度,针对给定系统、机架或设备而监控的关键性能指标(KPI)的数目可以多达数十万或更多。
用于显示或呈现与KPI相关联的状态信息的一种方式是通过表或列表,其中每个KPI作为列表中的条目与其状态一起被添加在列中。当KPI的列表较小时,这种呈现方案可能是有效的,但是当系统包括经扩展的设备/KPI组合时,相同的方案可能导致许多页数据。寻找关于特定设备的特定KPI的信息的管理员可能需要进行滚动或以其他方式导航大量数据的繁琐过程。可能优选的是能够在单个视图中监控KPI,而不需要过多的滚动或数据导航以找到可疑或有问题的KPI。另外,可能优选的是能够在单个视图中监控KPI以能够“一目了然”地定位系统或网络设备的具有不良健康状态的属性。因此,本文描述了用于使扩展的KPI或度量数据以及可能基于KPI或度量数据的其他数据可视化的技术。
在一些示例中,可以以每个设备为基础、或者以对应于各种设备的一组健康状态值为基础来使KPI数据可视化。可以基于捕获的KPI数据和对这种KPI数据的分析(将规则应用于KPI数据以生成健康状态值)来确定健康状态值。可以分层地和/或按主题来组织规则,并将规则应用于相关的KPI以确定健康状态。例如,规则可以与被称为“接口”的主题相关联,并且可以应用于与针对给定接口标识的错误相关的KPI数据。然后,规则可以基于特定时间帧期间的错误的数目来确定接口的状态。由规则确定的状态可以由数字或颜色表示,该数字或颜色指示与由规则确定的状态相关联的严重性水平,并且表示针对每个规则的状态的数字或颜色可以在用户界面中呈现以供管理员评阅。例如,在一个示例中,由规则确定的正常的状态值可以在用户界面中用绿色区块呈现,并且与不良健康相对应的健康状态值可以在用户界面中用红色区块呈现。接近不良健康状态值(或有处于成为不良健康状态值的风险)的健康状态值可能用黄色区块呈现。
图1是图示根据本公开的一个或多个方面的示例网络105的概念图,示例网络105包括示例数据中心110,在示例数据中心110中监控用于物理的和基于云的计算环境的基础设施元件的性能指标。图1图示了网络105和数据中心110的一个示例实现,其托管一个或多个计算网络、计算域或项目、和/或基于云的计算网络(在本文通常称为云计算集群)。基于云的计算集群可以共同位于共同的整体计算环境(诸如单个数据中心)中,或者跨环境分布,诸如跨不同的数据中心分布。例如,基于云的计算集群可以是不同的云环境,诸如OpenStack云环境、Kubernetes云环境或其他计算集群、域、网络等的各种组合。在其他实例中,网络105和数据中心110的其他实现可能是合适的。这种实现可以包括图1的示例中包括的组件的子集和/或可以包括图1中未示出的附加组件。
在图1的示例中,数据中心110为通过服务提供方网络106而耦合到数据中心110的客户104提供应用和服务的操作环境。尽管结合
图1的网络105描述的功能和操作可以被图示成跨图1中的多个设备分布,但在其他的一些示例中,属于图1中的一个或多个设备的特征和技术可以由这种设备中的一个或多个的本地组件在内部执行。类似地,这种设备中的一个或多个可以包括某些组件并且执行各种技术,其在本文的描述中可以以其他方式属于一个或多个其他设备。另外,某些操作、技术、特征和/或功能可以结合图1进行描述,或被描述为由特定组件、设备和/或模块执行。在其他的一些示例中,这种操作、技术、特征和/或功能可以由其他组件、设备或模块执行。因此,属于一个或多个组件、设备或模块的一些操作、技术、特征和/或功能可以属于其他组件、设备和/或模块,即使本文没有以这种方式具体描述。
数据中心110托管基础设施设备,诸如联网和存储系统、冗余电源和环境控制。服务提供方网络106可以耦合到由其他提供方管理的一个或多个网络,并且因此可以形成大规模公共网络基础设施(例如,互联网)的一部分。
在一些示例中,数据中心110可以表示许多地理上分布的网络数据中心中的一个。如图1的示例中所示,数据中心110是为客户104提供网络服务的设施。客户104可以是诸如企业和政府或个人的集合实体。例如,网络数据中心可以为多个企业和最终用户托管web服务。其他示例性服务可以包括数据存储、虚拟专用网络、流量工程、文件服务、数据挖掘、科学或超级计算等。在一些示例中,数据中心110是单独的网络服务器、网络对等体或其他。
在图1的示例中,数据中心110包括一组存储系统、应用服务器、计算节点或其他设备,包括网络设备126A到网络设备126N(统称为“网络设备126”,并表示任意数目的网络设备)。设备126可以通过由一层或多层物理网络交换机和路由器提供的高速交换结构121而互连。网络设备126可以是许多不同类型的设备中的任何一种,但是在一些示例中,一个或多个设备126可以用作数据中心的物理计算节点。例如,设备126中的一个或多个可以提供用于执行一个或多个客户特定虚拟机148(图1中的“VM”)或其他虚拟化实例(诸如容器)的操作环境。在这样的一个示例中,设备126中的一个或多个可以替代地称为主机计算设备,或者更简单地称为主机。因此,网络设备126可以执行一个或多个虚拟化实例,诸如虚拟机、容器或用于运行一个或多个服务(诸如虚拟化网络功能(VNF))的其他虚拟执行环境。
然而,网络设备126中的每一个可以是可以在网络上操作并且可以生成可通过遥测或其他方式访问的数据的任何类型的设备,遥测或其他方式可以包括任何类型的计算设备、传感器、相机、节点、监视设备或其他设备。另外,网络设备126中的一些或全部可以表示另一设备的组件,其中这种组件可以生成可通过遥测或其他方式收集的数据。例如,网络设备126中的一些或全部可以表示物理或虚拟网络设备,诸如交换机、路由器、集线器、网关、诸如防火墙的安全设备、入侵检测和/或入侵防御设备。
虽然没有具体示出,但是交换结构121可以包括耦合到机箱交换机的分布层的架顶式(TOR)交换机,并且数据中心110可以包括一个或多个非边缘交换机、路由器、集线器、网关、诸如防火墙的安全设备、入侵检测和/或入侵防御设备、服务器、计算机终端、膝上型计算机、打印机、数据库、无线移动设备(诸如蜂窝电话或个人数字助理)、无线接入点、网桥、电缆调制解调器、应用加速器或其他网络设备。交换结构121可以执行第3层路由以通过服务提供方网络106在数据中心110和客户104之间路由网络流量。网关108用于在交换结构121和服务提供方网络106之间转发和接收分组。
根据本公开的一个或多个示例,软件定义网络(“SDN”)控制器132提供逻辑上并且在一些情况下物理上集中化的控制器,以用于促进数据中心110内的一个或多个虚拟网络的操作。在一些示例中,SDN控制器132响应于经由北向API 131从编排引擎130接收的配置输入而操作,北向API 131又可以响应于从与用户界面设备129交互和/或操作用户界面设备129的管理员128接收的配置输入而操作。
用户界面设备129可以被实现为用于呈现输出和/或接受用户输入的任何合适的设备。例如,用户界面设备129可以包括显示器。用户界面设备129可以是计算系统,诸如由用户和/或管理员128操作的移设动或非移动计算备。根据本公开一个或多个方面,用户界面设备129可以例如表示工作站、膝上型计算机或笔记本计算机、台式计算机、平板计算机或可以由用户操作和/或呈现用户界面的任何其他计算设备。在一些示例中,用户界面设备129可以与控制器201在物理上分离和/或在不同的位置。在这种示例中,用户界面设备129可以通过网络或其他通信方式与控制器201通信。在其他的一些示例中,用户界面设备129可以是控制器201的本地外围设备,或者可以集成到控制器201中。
在一些示例中,编排引擎130管理数据中心110的功能,诸如计算、存储、联网和应用资源。例如,编排引擎130可以为数据中心110内或跨数据中心的租户创建虚拟网络。编排引擎130可以将虚拟机(VM)附接到租户的虚拟网络。编排引擎130可以将租户的虚拟网络连接到外部网络,例如,互联网或VPN。编排引擎130可以跨VM组实现安全策略或者对租户网络的边界实现安全策略。编排引擎130可以在租户的虚拟网络中部署网络服务(例如,负载平衡器)。
在一些示例中,SDN控制器132管理网络和联网服务(诸如负载平衡、安全性)并且可以经由南向API 133将来自用作主机设备的设备126的资源分配给各种应用。即,南向API133表示由SDN控制器132使用的一组通信协议,以使网络的实际状态等于由编排引擎130指定的期望状态。例如,SDN控制器132可以通过配置物理交换机(例如TOR交换机、机箱交换机和交换结构121)、物理路由器、物理服务节点(诸如防火墙和负载平衡器)、和虚拟服务(诸如VM中的虚拟防火墙)来实现来自编排引擎130的高级请求。SDN控制器132维护状态数据库内的路由、联网和配置信息。
在图1的示例中,数据中心110还包括可以为数据中心110提供监控功能的控制器201。例如,控制器201可以监控与网络105内的包括网络设备126的设备相关联的各种关键性能指标。控制器201可以以多种方式中的任一方式执行监控。例如,在一个示例中,网络设备126中的一个或多个可以以各种格式暴露遥测数据,并且控制器201可以通过建立到相关网络设备的连接、选择可用传输以及配置设备来收集这种数据,以使得控制器201能够收集性能指标数据。在一些示例中,网络设备126中的一个或多个可以使用遥测接口(诸如,例如,瞻博遥测接口或JTI)。可以用于从一个或多个网络设备126收集性能指标数据或度量的其他方法包括NETCONF、TCP、UDP等。用于从网络设备126收集数据的这些方法中的一些可以依赖于推送模型来异步地递送数据,而不需要轮询网络设备126。在这样的一个示例中,用于发送数据的请求可以由控制器201单次发送,从而将网络设备126配置成流式周期更新。在一些情况中,这种方法可以是高度可扩展的,并且可以支持监控网络中的数千个对象。
在一些示例中,性能指标或度量的收集可以依赖于在网络设备126中的每一个上执行的用于监控和数据收集的代理模块。在这样的一个示例中,控制器201与部署在相应物理设备126中的至少一些内的监控代理交互,以用于监控针对网络设备126的性能指标、度量或资源使用统计。以这种方式,监控代理可以提供用于收集各种性能指标或使用度量的分布式机制。在一些实现中,监控代理在数据中心110的基础设施的最低水平“计算节点”上运行,该计算节点提供执行应用工作负载的计算资源。例如,计算节点可以是设备或服务器126的裸机主机、在网络设备126中的一个或多个上执行的虚拟机、容器等。关于基于代理的度量监控的更多细节可以在2017年6月29日提交的题为“Network Dashboard WithMultifaceted Utilization Visualizations”(代理人案卷号1014-958US01)的美国专利申请No.15/637686和在2017年6月29日提交的题为“Network Dashboard WithMultifaceted Utilization Visualizations”(代理人案卷号1014-960US01)的美国专利申请No.15/637716中找到,这两个申请中的每一个的全部内容通过引用并入本文。
控制器201从网络设备126(例如,从监控代理、通过遥测接口或以其他方式)获得性能指标,并构建一个或多个用户界面以提供对数据中心110以及具体是网络设备126的操作性能和基础设施资源的可见性。控制器201可以例如将一个或多个用户界面203传送到UI设备129以用于呈现给管理员128(例如,使用显示设备)。另外,控制器201可以将分析和机器学习应用于所收集的性能指标,以提供接近或看似接近实时和历史监控、性能可见性和动态优化,以改进数据中心110内的编排、安全性、计费和规划。
如图1的示例中所示,控制器201可以定义和维护一组健康状态规则或规则202。控制器201可以基于该组规则202来管理网络设备126中的每一个的一般监控和/或健康状态监控。可以响应于管理员128的输入或者响应于由控制器201执行的操作而创建或得到规则202。例如,控制器201可以观察数据中心110随时间的操作并应用机器学习技术来生成一个或多个规则202。控制器201可以在进行关于数据中心110的进一步观察时,周期性地、偶尔地或不断地细化规则202。
控制器201可以被实现为任何合适的计算设备或被实现在任何合适的计算设备内,或跨多个计算设备被实现。控制器201或控制器201的组件可以被实现为计算设备的一个或多个模块。在一些示例中,控制器201可以包括在数据中心110内包括的一类计算节点(例如,“基础设施节点”)上执行的多个模块。这种节点可以是OpenStack基础设施服务节点或Kubernetes主节点,和/或可以被实现为虚拟机。在一些示例中,控制器201可以具有到数据中心110内的一些或所有其他计算节点的网络连接性,并且还可以具有到管理数据中心110的其他基础设施服务的网络连接性。尽管本文主要在执行与监控关键性能指标、评估与这些性能指标相关联的健康状态规则以及生成提供健康状态值的可视化的用户界面相关的功能方面进行描述,但控制器201可以执行其他功能。例如,在一些示例中,控制器201还可以提供调度和性能管理功能。
一个或多个规则202可以定义针对网络设备126而监控的关键性能指标的值如何转换成与设备相关联的健康状态值。在一些示例中,一个或多个规则可能相对复杂,并且可以包括基于跨多个网络设备126收集的多个度量的公式。在一些示例中,规则202中的每一个可以是面向网络的,但是可以依赖于或涉及其他类型的性能指标。由控制器201收集并用于评估一个或多个规则202的信息可以包括由一个或多个规则202指定或要求的原始数据、总结数据和采样数据。在一个示例中,规则可以将正常接口定义为在给定时间帧期间具有不多于一定数目的错误,并且在错误的数目超过该数目的情况下,接口可以被表征为具有“有风险”状态。如果错误的数目足够高,则可以认为接口的状态为“差”。
在一些示例中,用户界面203可以是用户界面的集合,其呈现关于如由规则202定义的许多网络设备126的健康状态、关于设备组的健康状态、关于关键性能指标或关键性能指标的组的信息、和/或其他信息。用户界面203可以包括多个用户界面,或者由用户界面设备129呈现的用户界面底层的数据。可以主要由控制器201,或由在控制器201上执行的控制面板模块,或备选地由控制器201和用户界面设备129的组合创建、更新和/或维护用户界面203中的每一个。用户界面203和相关联的用户界面或可视化模块可以通过在存储器中实例化的软件对象而共同实现,存储器具有相关联的数据和/或可执行的软件指令,其提供用于在显示器上呈现的输出数据。
用户界面设备129可以检测与用户界面203的交互作为用户输入(例如,来自管理员128)。响应于与一个或多个用户界面203的用户交互,控制器201可以使修改的用户界面呈现在用户界面设备129处。另外,这种交互可以导致对数据中心110或在数据中心110的一个或多个网络设备126上执行的应用程序或服务的各方面进行配置,涉及网络资源、数据传递限制或成本、存储限制或成本,和/或计费报告。
在图1的示例中,并且根据本公开的一个或多个方面,控制器201可以监控针对一个或多个网络设备126的关键性能指标。例如,在图1的示例中,控制器201与网络设备126中的每一个交互以将网络设备126中的每一个配置成支持从网络设备126收集关键性能指标、度量或其他信息。基于网络设备126中的每一个的类型和/或在这种网络设备126上执行的软件,控制器201与网络设备126中的每一个交互以创建或建立订阅或其他数据收集机制。控制器201可以配置网络设备126中的一个或多个,使得控制器201可以通过遥测、通过基于代理的通信、通过轮询技术、通过推送数据收集技术和/或通过收集针对网络设备126的关键性能指标的任何其他方式来收集关键性能指标数据。此后,控制器201连续地、周期性地和/或偶尔地从网络设备126中的每一个收集数据。在一些示例中,控制器201通过与网络设备126中的每一个的直接连接来收集这种数据,如图1中所图示的。在其他的一些示例中,控制器201可以通过交换结构121上的通信或通过其他方式来收集这种数据。
控制器201可以生成包括针对网络设备126的健康状态信息的一个或多个用户界面底层的数据。例如,在图1中,控制器201收集与网络设备126相关联的性能指标数据。控制器201分析关于所收集的数据的信息并构建一个或多个用户界面203底层的数据。在输出到显示器或其他设备时,这样的用户界面呈现基于所收集的关键性能指标的健康状态信息。在一些示例中,健康状态信息被呈现为显示元素的集合,显示元素各自表示应用于关键性能指标的健康状态规则或多个健康状态规则的结果。在一些示例中,根据与一个或多个设备相关联的主题(topics),将显示元素布置在用户界面内。另外,在一些示例中,控制器201可以生成包括显示元素的用户界面,该显示元素表示与多个关键性能指标和/或多个网络设备126相对应的健康状态信息的组或健康状态值的组。控制器201可以将健康状态值分组,以确保用户界面中包括的显示元素的数目使得健康状态信息能够有效地被呈现。在一些示例中,控制器201将用户界面203构建成使得用户界面内的显示元素足够大,以便易于看到和彼此区分,并且还使得显示元素不会太多以至于不能在单个视图(例如,单个信息屏幕)中呈现显示元素。在一些示例中,通过对健康状态信息进行分组,控制器201能够实现这种目标。
用户界面设备129可以将用户界面203呈现给管理员128。例如,再次参考图1,控制器201将用户界面203底层的数据传送给用户界面设备129。用户界面设备129使用该数据在与用户界面设备129相关联的输出设备(例如,显示器)处呈现一个或多个用户界面,从而将与网络设备126相关联的健康状态信息呈现给管理员128。
图2是图示根据本公开的一个或多个方面的示例系统的框图,该示例系统用于收集关于关键性能指标的信息并基于关键性能指标呈现健康状态信息。图2的系统200可以被描述为图1的网络105的一个示例或备选实现。在本文中,可以在图1的上下文中描述图2的一个或多个方面。
在图2的示例中,系统200包括控制器201、网络106和一个或多个网络设备126(对应于图2中的网络设备126A至126N,并且表示任意数目的网络设备)、以及用户界面设备129(可以由管理员128操作,并且可以呈现用户界面301)。为了便于说明,图2中图示了一个控制器201、一个网络106和有限数目的网络设备126,然而可以利用更多的这种系统来执行根据本公开的一个或多个方面的技术。
另外,在图2中,控制器201和管理员128可以各自对应于图1中的相同附图标记的要素。这些设备、系统和/或组件可以以与结合图1提供的对应系统的描述一致的方式实现,然而在一些示例中,这种系统可以涉及具有更多、更少和/或不同能力的备选实现。通常,本文图中的系统、设备、组件、用户界面元素和其他项可以对应于其他图中所图示的相同附图标记的系统、设备、组件和项,并且可以以与结合其他图提供的描述一致的方式来描述。
图2的网络106可以对应于图1的网络105、图1的交换结构121、或者图1的网络105和交换结构121的组合。在其他的一些示例中,网络105可以涵盖其他网络,其可以包括互联网,或者可以包括或表示任何公共或私人通信网络或其他网络。例如,网络106可以包括或涵盖蜂窝、
Figure BDA0002110473700000141
ZigBee、蓝牙、近场通信(NFC)、卫星、企业、服务提供方和/或使得传输数据能够在计算系统、服务器和计算设备之间传递的其他类型的网络。客户端设备、服务器设备或其他设备中的一个或多个可以使用任何合适的通信技术跨网络106传输和接收数据、命令、控制信号和/或其他信息。网络106可以包括一个或多个网络集线器、网络交换机、网络路由器、卫星天线或任何其他网络设备。这样的设备或组件可以可操作地相互耦合,从而提供信息在计算机、设备或其他组件之间(例如,在一个或多个客户端设备或系统与一个或多个服务器设备或系统之间)的交换。可以使用一个或多个网络链路将图2中所图示的设备或系统中的每一个可操作地耦合到网络106。将这样的设备或系统耦合到网络106的链路可以是以太网、异步传输模式(ATM)或其他类型的网络连接,并且这种连接可以是无线连接和/或有线连接。图2中图示的或以其他方式处于网络106上的设备或系统中的一个或多个可以相对于一个或多个其他图示的设备或系统处于远程位置。
控制器201表示为虚拟主机、虚拟机、容器和/或其他虚拟化计算资源提供执行环境的物理计算设备或计算节点。在一些示例中,控制器201可以是向客户端设备和其他设备或系统提供服务的云计算系统、服务器群和/或服务器群集(或其一部分)的组件。尽管在本文主要被描述为物理计算设备,但是在其他的一些示例中,主机270本身可以被实现为虚拟化计算设备(例如,被实现为虚拟机或容器)。
在图2的示例中,控制器201包括底层物理计算硬件,其包括电源211、一个或多个处理器213、一个或多个通信单元215、一个或多个输入设备216、一个或多个输出设备217、以及一个或多个存储设备220。存储设备220可以包括监控模块222、可视化模块224、数据存储库226和可视化数据228。控制器201的设备、模块、存储区域或其他组件中的一个或多个可以互连以支持组件间通信(物理地、通讯地和/或可操作地)。在一些示例中,可以通过通信信道(例如,通信信道212)、系统总线、网络连接、进程间通信数据结构或用于传送数据的任何其他方法来提供这种连接性。
电源211可以向控制器201的一个或多个组件提供功率。电源211可以从建筑物、数据中心或其他位置中的初级交流(AC)电源接收功率。在其他的一些示例中,电源211可以是提供直流(DC)的电池或设备。在又一些示例中,控制器201和/或电源211可以从另一源接收功率。在控制器201内图示的设备或组件中的一个或多个可以连接到电源211,和/或可以从电源211接收功率。电源211可以具有智能功率管理或消耗能力,并且可以由控制器201的一个或多个模块和/或由一个或多个处理器213控制、访问或调整这样的特征,以智能地消费、分配、供应或以其他方式管理功率。
控制器201的一个或多个处理器213可以实现功能和/或执行与控制器201相关联或与本文所示和/或下面描述的一个或多个模块相关联的指令。一个或多个处理器213可以是根据本公开的一个或多个方面执行操作的处理电路,可以是根据本公开的一个或多个方面执行操作的处理电路的一部分,和/或可以包括根据本公开的一个或多个方面执行操作的处理电路。处理器213的示例包括微处理器、应用处理器、显示控制器、辅助处理器、一个或多个传感器集线器、以及被配置成用作处理器、处理单元或处理设备的任何其他硬件。中央监控系统210可以使用一个或多个处理器213来使用驻留在控制器201中和/或在控制器201处执行的软件、硬件、固件或硬件、软件和固件的混合来执行根据本公开的一个或多个方面的操作。
控制器201的一个或多个通信单元215可以通过发射和/或接收数据而与控制器201外部的设备通信,并且可以在某些方面作为输入设备和输出设备两者操作。在一些示例中,通信单元215可以通过网络与其他设备通信。在其他的一些示例中,通信单元215可以在诸如蜂窝无线电网络的无线电网络上发送和/或接收无线电信号。在其他的一些示例中,控制器201的通信单元215可以在诸如全球定位系统(GPS)网络的卫星网络上发射和/或接收卫星信号。通信单元215的示例包括网络接口卡(例如,诸如以太网卡)、光学收发器、射频收发器、GPS接收器或可以发送和/或接收信息的任何其他类型的设备。通信单元215的其他一些示例可以包括能够通过
Figure BDA0002110473700000161
GPS、NFC、ZigBee和蜂窝网络(例如,3G、4G、5G)和移动设备以及通用串行总线(USB)控制器等中发现的
Figure BDA0002110473700000162
无线电进行通信的设备。这种通信可以依附于、实现或遵守合适的协议,包括传输控制协议/互联网协议(TCP/IP)、以太网、蓝牙、NFC或其他技术或协议。
一个或多个输入设备216可以表示控制器201的任何输入设备,本文中不另外单独描述。一个或多个输入设备216可以生成、接收和/或处理来自能够检测来自人或机器的输入的任何类型的设备的输入。例如,一个或多个输入设备216可以生成、接收和/或处理以电、物理、音频、图像和/或视觉输入(例如,外围设备、键盘、麦克风、相机)的形式的输入。
一个或多个输出设备217可以表示控制器201的任何输出设备,本文中不另外单独描述。一个或多个输出设备217可以生成、接收和/或处理来自能够检测来自人或机器的输入的任何类型的设备的输入。例如,一个或多个输出设备217可以生成、接收和/或处理以电和/或物理输出(例如,外围设备、致动器)的形式的输出。
控制器201内的一个或多个存储设备220可以存储用于在控制器201的操作期间进行处理的信息。存储设备220可以存储与根据本公开的一个或多个方面描述的模块中的一个或多个相关联的程序指令和/或数据。一个或多个处理器213和一个或多个存储设备220可以为这种模块提供操作环境或平台,该模块可以被实现为软件,但是在一些示例中可以包括硬件、固件和软件的任何组合。一个或多个处理器213可以执行指令,并且一个或多个存储设备220可以存储一个或多个模块的指令和/或数据。处理器213和存储设备220的组合可以取回、存储和/或执行一个或多个应用、模块或软件的指令和/或数据。处理器213和/或存储设备220还可以可操作地耦合到一个或多个其他软件和/或硬件组件,包括但不限于控制器201的组件中的一个或多个和/或被图示为连接到控制器201的一个或多个设备或系统。
在一些示例中,一个或多个存储设备220是临时存储器,意味着一个或多个存储设备的主要目的不是长期存储。控制器201的存储设备220可以被配置为易失性存储器以用于信息的短期存储,并且因此如果去激活则不保留所存储的内容。易失性存储器的示例包括随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)以及本领域中已知的其他形式的易失性存储器。在一些示例中,存储设备220还包括一个或多个计算机可读存储介质。存储设备220可以被配置成存储比易失性存储器更大量的信息。存储设备220还可以被配置为非易失性存储器空间以用于信息的长期存储并且在激活/关闭循环之后保留信息。非易失性存储器的示例包括磁性硬盘、光盘、闪存,或电可编程存储器(EPROM)或电可擦除和可编程(EEPROM)存储器的形式。
监控模块222可以执行与从一个或多个网络设备(例如,网络设备126)收集关键性能指标和/或度量相关的功能,以用于确定关于这种网络设备的健康状态的信息。监控模块222可以与一个或多个网络设备126交互,以建立订阅或数据收集过程或协议,这可以包括遥测接口(例如,JTI)、NETCONF、TCP、UDP或其他机制的使用。监控模块222可以备选地或附加地收集基于代理的数据收集方案中的性能指标和/或度量,由此控制器201从在网络设备126上执行的一个或多个代理接收包括性能指标数据的信息或度量信息。在这样的一个示例中,监控模块222的方面可以被包括在网络设备126上执行的这种代理内,因此在一些实现中,监控模块222可以跨控制器201和网络设备126分布。监控模块222可以通过网络106接收所收集的性能指标和/或度量,并且可以将所收集的性能指标或度量信息存储在数据存储库226中。监控模块222还可以向可视化模块224输出数据,以用于基于性能指标或度量信息生成可视化。在一些示例中,由监控模块222执行的功能可以由软件或由执行软件的硬件设备来执行。在其他的一些示例中,由监控模块222执行的功能可以主要或部分地通过硬件来实现。
可视化模块224可以执行与生成用户界面(或这样的用户界面底层的数据)有关的功能,用户界面包括与系统、网络、设备或系统、网络和/或设备的组相关联的健康状态信息的可视化。可视化模块224可以从监控模块222和/或数据存储库226接收关于关键性能指标或度量的信息。可视化模块224可以分析这种信息,并应用健康状态规则以确定与关键性能指标或健康状态规则相关联的健康状态值。可视化模块224可以基于呈现给管理员的健康状态规则的数目,确定有效地呈现关于系统的健康状态的信息可能要求对应于一个或多个关键性能指标的某些健康状态值应当被分组在一起,并在用户界面中呈现为单个显示元素或视觉指示符(或较小数目的显示元素或视觉指示符)。可视化模块224可以生成用户界面底层的信息(例如,可视化数据228),其可以由用户界面设备(例如,用户界面设备129)使用以在显示器上呈现健康状态信息的可视化。
可视化数据228可以包括从与一个或多个网络设备126通信中接收的信息得到的信息,并且可以包括与健康状态规则相关联的关键性能指标、度量或健康状态值的可视化底层的信息。当生成呈现健康状态信息的用户界面时,可视化模块224可以创建或更新可视化数据228。可视化数据228可以包括关于应当在用户界面中一起呈现的健康状态值的组的信息,以用于有效地传送针对大量设备、关键性能指标和/或健康状态规则的健康状态信息。
数据存储库226可以表示用于存储与关联于各种网络设备(例如,网络设备126)的关键性能指标和/或度量相关的信息的任何合适的数据结构或存储介质。数据存储库226还可以存储关于健康状态规则的信息,该健康状态规则可以应用于关键性能指标以生成健康状态值或健康状态值的组。存储在数据存储库226中的信息可以是可搜索和/或分类的,使得控制器201内的一个或多个模块可以提供请求来自数据存储库226的信息的输入,并且响应于该输入,接收存储在数据存储库226中的信息。数据存储库226可以主要由监控模块222维护。数据存储库226可以向其他模块提供对存储在数据存储库226内的数据的访问,和/或可以分析存储在数据存储库226中的数据并代表控制器201的其他模块输出这种信息。
在图2中图示的模块(例如,监控模块222和可视化模块224)和/或在本公开的其他地方图示或描述的模块可以执行使用驻留在一个或多个计算设备中和/或在一个或多个计算设备处执行的软件、硬件、固件或硬件、软件和固件的混合描述的操作。例如,计算设备可以利用多个处理器或多个设备执行这种模块中的一个或多个。计算设备可以执行这种模块中的一个或多个作为在底层硬件上执行的虚拟机。这种模块中的一个或多个可以作为操作系统或计算平台的一个或多个服务执行。这种模块中的一个或多个可以作为在计算平台的应用层处的一个或多个可执行程序执行。在其他的一些示例中,由模块提供的功能可以由专用硬件设备实现。
尽管可以单独图示一个或多个存储设备内包括的某些模块、数据存储库、组件、程序、可执行文件、数据项、功能单元和/或其他项,但是这样的项中的一个或多个可以组合并且作为单个模块、组件、程序、可执行文件、数据项或功能单元操作。例如,可以组合或部分组合一个或多个模块或数据存储库,使得它们作为单个模块操作或提供功能。另外,一个或多个模块可以彼此交互和/或相互结合操作,使得例如一个模块充当另一个模块的服务或扩展。另外,存储设备内图示的每个模块、数据存储库、组件、程序、可执行文件、数据项、功能单元或其他项可以包括多个组件、子组件、模块、子模块、数据存储库和/或未图示的其他组件或模块或数据存储库。
另外,存储设备内图示的每个模块、数据存储库、组件、程序、可执行文件、数据项、功能单元或其他项可以以各种方式实现。例如,存储设备内图示的每个模块、数据存储库、组件、程序、可执行文件、数据项、功能单元或其他项可以被实现为可下载或预安装的应用或“应用程序”。在其他的一些示例中,存储设备内图示的每个模块、数据存储库、组件、程序、可执行文件、数据项、功能单元或其他项可以被实现为在计算设备上执行的操作系统的一部分。
图3A、图3B和图3C是图示根据本公开的一个或多个方面的由用户界面设备呈现的示例用户界面的概念图。如图3A中所示,用户界面301A可以对应于由图1和/或图2的用户界面设备129呈现的用户界面,并且可以呈现关于健康状态的信息或关于图1和/或图2中图示的一个或多个网络设备126的其他信息。尽管图3A至图3C所图示的用户界面被示出为图形用户界面,但在其他的一些示例中可以呈现其他类型的界面,包括基于文本的用户界面、控制台或基于命令的用户界面、语音提示用户界面或任何其他合适的用户界面。图3A、图3B和图3C中图示的用户界面的一个或多个方面在本文中可以在图2的系统200的上下文中进行描述。
图3A是根据本公开的一个或多个方面的示例用户界面,其图示了从网络上的设备收集的数据的可视化。图3的用户界面301A可以由显示设备300呈现,显示设备300可以与图2的用户界面设备129相关联。例如,参考可以在图2的上下文中描述的一个示例,控制器201的监控模块222将每个网络设备126配置成使得控制器201能够监控针对网络设备126的性能数据(例如,关键性能指标)。此后,通信单元215检测网络106上的一系列信号并将一系列信号指示输出给监控模块222。监控模块222确定信号包括与网络设备126相关联的数据。监控模块222将这种数据存储在数据存储库226中。监控模块222连续地、周期性地和/或偶尔地向可视化模块224输出关于所收集的数据的信息。可视化模块224分析关于所收集的数据的信息和/或访问数据存储库226内的附加信息。可视化模块224所访问的数据存储库226内的一些信息可以包括关于要应用于所收集的数据的规则的信息和关于如何解释所收集的数据以及如何将数据转换为健康状态值的类别的信息。可视化模块224使用来自数据存储库226的信息和存储的数据来构建用户界面底层的可视化数据228。可视化模块224使通信单元215通过网络106输出信号。用户界面设备129检测网络106上的信号并确定该信号包括足以呈现用户界面的信息。用户界面设备129在显示设备300处呈现用户界面301A,如图3A所图示的。
在图3A中,用户界面301A包括多个显示元素集310,各自布置在对应的主题表头311下方。例如,图3A中将显示元素集310A示出为布置在主题表头311A下方,显示元素集310D布置在主题表头311D下方。类似地,在主题表头311B、311C、311E和311F中的每一个下方,图示了其他显示元素集(但未具体标记)。显示元素集310中的每一个包括可变数目的显示元素,这取决于与每个主题相关联的健康状态的数目。例如,显示元素集310A包括16个显示元素,包括显示元素312A、显示元素313A和显示元素314A。
在图3A的示例中,显示元素中的每一个的尺寸取决于在给定主题下方的显示元素的总数目(例如,对应于解释KPI的规则)。在一些示例中,当显示元素的总数目未超过给定阈值数量或量时,控制器201将每个显示元素表示为方块(例如,显示元素集310)中的单个区块,其中由颜色、图案或其他指示图示的每个区块对应于与显示元素相关联的规则的状态。尽管本文主要参考不同颜色来描述健康状态值指示,但是显示元素可以使用其他视觉指示来提供健康状态值的视觉指示,其他视觉指示诸如图案、值(例如,整数)、单词(例如,“好”、“差”)、三维字形、形状等。当显示元素的数目大于显示元素的阈值量时,控制器201可以将与显示元素相关联的健康状态值分组,并针对每个组显示一个显示元素。在一些示例中,与健康状态值的组相对应的区块的颜色将取决于该组的成员中的每一个的状态。如果组中的任何成员具有“有风险”或“不良健康状态”的值,则在一些示例中,组区块的颜色将指示这种状态,使得由用户界面呈现的可视化倾向于捕获管理员的注意,并提醒管理员最不利的健康状态。如果组内的健康状态的所有实例都正常,则控制器201可以将用户界面配置成使得以与正常健康状态一致的方式标记或图示与该组相关联的组区块。
在图3A的示例中,主题表头311A可以对应于具有四个处理器的系统,每个处理器具有四个核。因此,在主题表头311A下方的显示元素集310A内示出的16个显示元素中的每一个可以对应于四个处理器中的每个处理器内的核。基于应用于针对处理器核的关键性能指标或度量的规则,对应于每个核的显示元素的颜色表示该核的健康状况。另一方面,显示元素集310D仅包括单个显示元素。显示元素集310内所示的显示元素中的每一个呈现关于所选择的网络、网络机架、系统和/或其他设备的上下文内的设备、组件,或成组的设备或组件的健康状态信息。在图3A中,上下文选择器302使得用户能够改变和/或选择针对用户界面301A内显示的信息的上下文。例如,用户界面301A可以呈现关于图3A中名为“brackla5”的设备机架内的设备或组件的信息。然而,响应于与上下文选择器302的交互,用户界面设备129可以呈现关于可能被包括在不同机架中的不同的一组设备的信息。刷新速率选择器304可以支持调整更新用户界面301A的速率。
表380(也在图3A的示例的用户界面301A中图示)呈现对应于所显示的主题表头311和显示元素集310的信息。表380包括表头390,其包括主题列391、设备列392、规则列393、状态列394和消息列395。可以以多种方式响应于用户输入来操纵表380。例如,用户界面设备129可以响应于滚动条381交互来更新表380,并且将附加和/或不同的信息呈现在视图中。控制器201(或用户界面设备129)还可以响应于用户输入(例如,用光标303对列的选择),通过对表380的列进行排序来更新表380。控制器201(或用户界面设备129)还可以响应于用户输入将文本输入到表头390的每个列表头下方的一个或多个框中,通过过滤表380内显示的行来更新表380。例如,将“CPU”键入到主题列391下方的框可以过滤表380,使得仅显示具有“CPU”作为主题的行。控制器201(或用户界面设备129)还可以响应于选择主题表头311中的一个或多个的输入而生成更新的表380。例如,响应于对主题表头311A的选择(例如,使用光标303),用户界面设备129可以在表380内仅呈现与“CPU”主题有关的信息。备选地,响应于对主题表头311B的选择,控制器201(或用户界面设备129)可以在表380内仅呈现与“接口”主题有关的信息。
图3B是根据本公开的一个或多个方面的图示了弹出窗口的示例用户界面,该弹出窗口提供关于图3A的用户界面内所示的显示元素的细节。可以响应于指示光标303已经移动到图3中的显示元素312A之上的输入,而在显示设备300处呈现图3B的用户界面301B。例如,参考图2和图3A,用户界面设备129检测输入并通过网络106输出信号。控制器201的通信单元215检测信号并向可视化模块224输出信号的指示。可视化模块224确定该信号对应于光标303已经移动到显示元素312A之上的指示。可视化模块224使通信单元215通过网络106输出信号。用户界面设备129检测信号并确定该信号包括用于更新用户界面301A的信息。用户界面设备129更新用户界面301A以包括弹出窗口315A,并在显示设备300处呈现用户界面301B,如图3B中所图示的。
在图3B中,弹出窗口315A包括与由显示元素312A呈现的信息有关的另外的细节。在所示的示例中,对于系统200中包括的给定设备,显示元素312A对应于处理器1内的核1。在一个示例中,处理器1内的核1可以对应于网络设备126A内包括的处理器内的核。在图3A和图3B的示例中,两个规则与处理器1的核1相关联。第一规则对应于核的利用率(在该示例中为74%),并且第二规则对应于核的温度(55C)。与这两个规则中的每一个相关联的信息呈现在图3B中的弹出窗口315A中。尽管在该示例中弹出窗口315A被描述为响应于在光标303移动到主题表头311A之上之后由用户界面设备129与控制器201的通信而呈现,但是在其他的一些示例中,可以以其他方式呈现弹出窗口315A,包括作为在用户界面设备129处的用户输入的本地处理的结果而呈现(即,可能不需要通过网络106与控制器201的通信)。
图3C是根据本公开的一个或多个方面的示例用户界面,其图示了响应于用户输入而对用户界面内呈现的信息的过滤。可以响应于在图3B中选择显示元素312A(例如,使用光标303)的输入,而在显示设备300处呈现图3C的用户界面301C。例如,参考图2和图3B,用户界面设备129检测输入并通过网络106输出信号。控制器201的通信单元215检测可视化模块224确定的信号,该信号对应于已经在用户界面301B内被选择的显示元素312A(例如,使用光标303)的指示。可视化模块224使通信单元215通过网络106输出用户界面设备129确定的信号,该信号包括足以更新用户界面301B的信息。用户界面设备129更新用户界面301B以修改表380内呈现的数据,并在显示设备300处呈现用户界面301C,如图3C中所图示的那样。
在图3C中,已经响应于对显示元素312A的选择,而对表380进行过滤以仅包括与显示元素312A相关联的那些行。因此,表380呈现了在图3B的弹出窗口315A内包括的许多相同信息,并且包括与处理器1的核1的利用率和处理器1的核1的温度相对应的健康状态信息。再次,尽管表380被描述为响应于在检测到选择显示元素312A的用户输入之后由用户界面设备129与控制器201的通信而更新,但在其他的一些示例中,可以以其他方式更新表380,包括作为在用户界面设备129处的用户输入的本地处理的结果而更新。
图4是图示针对所收集的关键性能指标的示例分层数据模型的概念图。图4图示了数据模型主题树400,其可以是在图3A至图3C中所图示的、与在图3A的主题表头311A下方呈现的显示元素集310A相对应的CPU主题的一种可能的数据模型。在图4所示的示例中,系统内每个CPU的健康状况可以由其组件、子组件或属性(例如,利用率)的健康状况来定义。例如,每个CPU(例如,节点401、节点402)可以包括M个处理器(由节点411、节点412等表示),并且每个处理器可以包括四个核(例如,对于处理器1,由节点421至424表示)。每个核可以具有使得多个健康状态值能够针对每个核被确定的性能指标数据。在图4中所示的示例中,每个核具有两个健康状态值:一个针对核利用率,另一个针对核温度。应用于性能指标的规则(即,核利用率和核温度)可以用于确定与每个这种性能指标相关联的健康状态。
处理器1的核1的健康可以通过其利用率和温度健康状态值来定义。在图4的示例中,处理器1的核1的温度是“正常的”,但是利用率被显示为“有风险”。因此,与节点421相关联的健康状态值可能被认为是“有风险”,因为这是节点421下的子节点的最不利的健康状态值。类似地,节点422和节点424都被图示为具有“不良健康状态”,因为与这些节点相关联的两个核具有被显示为指示“不良健康状态”的利用率。以类似的方式,在处理器节点继承其属性的最不利的健康状态的示例中,因为子节点422和424都具有不良健康状态,因此也可以认为节点411的健康状态不良。类似的方法还向节点401指派“不良健康状态”,因为节点411是节点401的子节点,并且节点411具有不良健康状态。
图4的层级针对KPI的一种类别(或“主题”)图示了用于基于子节点的健康状态值将组健康状态值分配给父节点的一种方法。其他主题可以具有相似或对应的数据模型主题树。因此,通过使用如图4中图示的一个或多个数据模型主题树400,控制器201可以将逻辑相关的设备或健康状态值的集合分组在一起,并为该组确定的合适的健康状态值。健康状态值在结合图4图示或描述的意义上可以逻辑相关,和/或还可以基于设备的类型、所收集的性能指标或度量信息的类型、或者基于任何其他关系,而在逻辑上相关。在存在太多个体健康状态值(在节点421、422、424、425等的水平下有太多节点)而无法在单个窗格用户界面中实际地或有效地呈现关于那些健康状态值中的每一个的信息的情况下,使用针对更高水平节点的健康状态值(例如,涵盖子节点)作为组健康状态值来构建有用的用户界面。
图5A、图5B和图5C是图示了根据本公开的一个或多个方面的由用户界面设备呈现的示例用户界面的概念图。图5A至图5C中图示的用户界面501中的每一个可以对应于由图1和/或图2的用户界面设备129呈现的用户界面,并且可以呈现关于图1和/或图2中图示的一个或多个网络设备126的健康状态的信息或其他信息。尽管图5A至图5C中图示的用户界面被示出为图形用户界面,但在其他的一些示例中可以呈现其他类型的界面,包括基于文本的用户界面、控制台或基于命令的用户界面、语音提示用户界面或任何其他合适的用户界面。在本文中,可以在图2的系统200的上下文中描述图5A、图5B和图5C中图示的用户界面的一个或多个方面。
图5A是根据本公开的一个或多个方面的示例性用户界面,其图示了从网络上的设备的组收集的数据的可视化。如图3A至图3C中图示的用户界面那样,图5A的用户界面501A可以由显示设备300呈现,显示设备300可以与图2的用户界面设备129相关联。
在呈现用户界面501A时,控制器201可以将某些数据分组以用于在用户界面501A内呈现。例如,参考可以在图2和图5A的上下文中描述的一个示例,可视化模块224从监控模块222接收关于从网络设备126收集的数据的信息。可视化模块224分析关于所收集的数据的信息并确定所收集的数据是基于包括各自具有4个核的64个处理器的一组网络设备126。可视化模块224还基于所收集的数据的数量和/或处理器核的总数目来确定该组网络设备126中存在的CPU核的数目较大,并且在用户界面中针对CPU核中的每一个呈现视觉指示很可能导致显示元素太小以至于不够清晰并且不易与其他显示元素区分。换句话说,对于给定的方形区域,诸如图5A中图示的主题表头311中的每一个下方的区域(例如,显示元素集310A或显示元素集310D被显示的区域),可视化模块224可以被配置成仅呈现多达一定数目(即,阈值数目)的显示元素。
在图5A的示例中并且参考图2,当健康状态值的总数目超过区块的总数目的阈值时,可视化模块224可以开始对健康状态值进行分组。与给定区块相关联的健康状态值的数目可以取决于要在用户界面内渲染的健康状态值的总数目。可视化模块224可以计算分组因子,其可以涉及将“上限”函数应用于健康状态值的总数目除以可以在主题表头311中的每一个下方的区域中呈现的区块的最大数目。可视化模块224可以基于表示给定块或显示元素集的健康状态值的数目来动态地计算每个区块或显示元素的尺寸。可视化模块224可以使用健康状态值的总数目的平方根来计算将给定数目的健康状态值适配到方块中所需的列数。然而,块310不需要具有相同数目的行和列。可视化模块224可以在渲染时调整区块边距,并计算合适的区块尺寸。在计算了分组因子之后,可视化模块224可以对健康状态值进行分组、将组名称标记给每个组并将每个组呈现为具有颜色的区块,该颜色表示设备中的每一个的状态、它包含的性能指标、度量或规则。在一个特定示例中,对于具有150像素的边的正方形区域,仅可以呈现220个显示元素,这可以是足够小的数字以确保作为个体区块而呈现的显示元素的颜色清晰且易于与其他显示元素(即,图5A的示例中的区块)区分。然而,在其他的一些示例中,基于显示元素中的每一个的尺寸和所需的视觉负载水平,更高或更低密度的显示元素可能是合适的。
可视化模块224可以生成用于对CPU核进行分组的用户界面的数据。例如,仍然参考图2和图5A,受上面描述的尺寸的限制,可视化模块224生成呈现针对与64个处理器相关联的健康状态值的显示元素的用户界面的底层的数据。为了解决这些尺寸限制,可视化模块224确定针对CPU数据的合适的分组,以便减少要在用户界面501A内呈现的显示元素的数目。在图5A的示例中,可视化模块224确定每个处理器的四个核中的每个核的健康状态数据将被组合在一起作为健康状态组,并且每个健康状态组将具有表示每个处理器内的所有四个核的集体健康状态值的组健康状态值。因此,可视化模块224生成在用户界面底层的可视化数据228,其中显示元素集310A具有64个显示元素,各自表示组健康状态值,其指示与每个处理器内的核中的每个核相关联的健康状态值。在图5A的示例中,显示元素312A可以对应于图4的节点411,因为节点411涵盖处理器1的所有四个核。
用户界面设备129可以呈现用户界面,该用户界面呈现用户界面501A。例如,再次参考图2和图5A,可视化模块224使通信单元215通过网络106输出信号。用户界面设备129检测网络106上的信号并确定该信号包括足以呈现用户界面的信息。用户界面设备129在显示设备300处呈现用户界面501A,如图5A中所图示的那样。在图5B中,在主题表头311A下方呈现的64个显示元素中的每一个被着色或阴影化,以表示组健康状态值,每个组健康状态值表示64个处理器中的一个处理器和与每个相应的处理器相关联的四个核的健康状态。
图5B是根据本公开的一个或多个方面的图示了弹出窗口的示例用户界面,该弹出窗口提供关于图5A的用户界面内所图示的显示元素中的一个显示元素的细节。可以响应于将光标303移动到图5A中的显示元素512A之上的输入,而在显示设备300处呈现图5B的用户界面501B。例如,参考图2和图5A,用户界面设备129检测输入并访问信息以更新用户界面501A。用户界面设备129更新用户界面501A以包括弹出窗口515A,并在显示设备300处呈现用户界面501B,如图5B中所图示的那样。
在图5B中,弹出窗口515A包括在显示元素512A底层的另外的细节。在所示的示例中,对于包括在系统200中的给定设备,显示元素512A对应于处理器1内的四个核,并且可以由图4的数据模型主题树400中的节点411表示。在这样的一个示例中,基于利用率和温度来评估每个核。例如,由显示元素512A表示的处理器1包括四个核,每个核具有与利用率和温度相关联的健康状态值。在弹出窗口515A内示出了每个健康状态值底层的细节,另外,还在弹出窗口515A内(沿着弹出窗口515A的左手侧)示出了与处理器1的每个核相关联的显示元素。在弹出窗口515A内图示的每个这种显示元素被着色或阴影化,以指示处理器1的每个对应的核的健康状态。在图5A中,显示元素512A被呈现为具有“不良健康状态”,因为在该示例中,组健康状态由组的成员的健康状态值定义,并且处理器1的核中的任何核的最不利的健康状态是“不良健康状态”,并且因此,该状态被用作针对处理器1的组健康状态(参见图4的节点411)。
图5C是根据本公开的一个或多个方面的示例用户界面,其图示了响应于用户输入而对图5B的用户界面内呈现的表格式信息的修改。可以响应于选择图5B中的显示元素512A(例如,使用光标303)的输入,而在显示设备300处呈现图5C的用户界面501C。例如,参考图2和图5B,用户界面设备129检测输入并且作为响应,确定用户正在寻求在表380中仅呈现与显示元素512A相关联的信息。用户界面设备129更新用户界面501B以修改表380内呈现的数据,以仅包括与处理器1相关联的信息(由显示元素512A表示),并在显示设备300处呈现用户界面501C,如图5C中所图示的那样。
在图5C中,已经对表380进行过滤以仅包括与显示元素512A相关联的那些行。由显示元素512A表示的组健康状态值所涵盖的信息对应于处理器1内的四个核中的每个核的利用率和温度健康状态值,如图5C的表380中所示的那样。
图6是根据本公开的一个或多个方面的示例用户界面,其图示了从网络上的设备的另一分组收集的数据的可视化。在图6中,控制器201可以确定该组网络设备126包括总共128个处理器,每个处理器具有4个核,并且还可以确定用于针对128个处理器和相关联的核呈现健康状态信息的合适的方案。例如,再次参考图2,可视化模块224分析指示从网络设备126收集的数据的信息。可视化模块224还基于所收集的数据的数量和被监控的处理器核的总数目来确定将与处理器的对相关联的健康状态信息分组是合适的。可视化模块224生成针对每对处理器的健康状态值进行分组的一个或多个用户界面。可视化模块224使通信单元215通过网络106输出关于所生成的用户界面的信息。用户界面设备129接收关于用户界面的信息,并确定该信息足以呈现一个或多个用户界面。用户界面设备129在显示设备300处呈现用户界面601,如图6中所图示的那样。
在图6中,主题表头311A下方的显示元素集310A中的区块中的每一个对应于一对处理器和由该对处理器涵盖的核的健康状态信息。图6还图示了光标303在显示元素612A之上移动,使弹出窗口615A被呈现。如果用户界面设备129检测到由光标303对显示元素612A的选择,则用户界面设备129可以更新用户界面601内的表380,使得表380仅包括与显示元素612A(表示处理器127和128)相对应的信息,如图6中所示的那样。
图7图示根据本发明的一个或多个方面的由示例控制器执行的操作的流程图。下面在图2的控制器201的上下文中描述图7。在其他的一些示例中,可以由一个或多个其他组件、模块、系统或设备执行图7中描述的操作。另外,在其他的一些示例中,结合图7描述的操作可以合并、以不同的顺序执行、省略,或者可以涵盖未具体图示或描述的附加操作。
控制器201可以收集针对一个或多个网络设备的性能指标数据(701)。例如,在一些示例中,控制器201的监控模块222使通信单元215通过网络106输出信号。网络设备126A检测网络106上的信号。网络设备126A确定该信号包括建立到网络设备126A的连接以用于收集关于网络设备126A的性能的数据(包括关于网络设备126A内的CPU的性能的数据)的请求。网络设备126A通过网络106输出响应信号。控制器201的通信单元215检测信号并将该信号的指示输出给监控模块222。监控模块222确定该信号是对由控制器201输出的较早信号的响应。监控模块222可以使通信单元215通过网络106输出另外的信号,并且可以在选择、协商和/或配置用于从网络设备126A接收信息(诸如作为关键性能指标信息的信息)的合适传输方法或机制的过程中接收响应信号。监控模块222建立传输并开始接收可以用于评价针对网络设备126A的一个或多个健康状态规则的性能指标。
控制器201可以确定多个健康状态值(702)。例如,在一些示例中,控制器201的可视化模块224基于评估性能指标数据的子集的多个健康状态规则中的一个来确定多个健康状态值。在一个示例中,健康状态规则可以评价处理器核利用率性能指标并确定特定处理器核具有“有风险”健康状态。在另一示例中,健康状态规则可评价处理器核温度值并确定另一处理器核具有“正常”健康状态值。
控制器201可以将健康状态值分组成多个健康状态组(703)。例如,在一些示例中,监控模块222向可视化模块224输出从自网络设备126中的每一个收集的信息而得到的数据。可视化模块224评价数据,并基于多个健康状态值中有多少健康状态值,确定健康状态值的数目超过可以在用户界面内有效地显示以呈现给管理员的值的阈值数量。可视化模块224可以基于界面的尺寸和/或预期的管理员128来确定阈值数量以用于呈现用户界面。在图5A中图示的示例中,例如,可视化模块224确定针对CPU的健康状态值的数目超过用于在用户界面内呈现的阈值数量(例如,图5A的示例中的64)。可视化模块224将健康状态值的子集分组成组,其中每个组包括逻辑上相关的健康值的集合。在图5A的示例中,可视化模块224将与处理器1(参见图4)有关的所有性能指标分组成一组。
控制器201可以针对健康状态组中的每一个确定组健康状态值(704)。例如,在一些示例中,控制器201的可视化模块224针对健康状态组中的每一个标识包括在该组内的具有最差健康状况的健康状态值。例如,如果组内的健康状态值中的一个或多个具有“不良”健康状态,则可视化模块224确定针对该组的组健康状态值也具有“不良”健康状态。再次参考图4和图5A的示例,可视化模块224可以针对处理器1确定核2利用率和核4利用率具有“不良”健康状态。因此,可视化模块224将最不利的健康状态值标识为针对与处理器1相关联的性能指标的组的组健康状态值。在所描述的示例中,如果任何性能指标具有最低的健康状态值,则可视化模块224可以确定组健康状态值为最不利的健康状况状态值,而不管其他性能指标的值如何。在其他的一些示例中,可视化模块224可以应用在这种情况下考虑其他性能指标的健康状态值的不同算法或过程。
控制器201可以输出包括针对健康状态组中的每一个的显示元素的用户界面(705)。例如,再次参考图2和图5A的示例,可视化模块224可以使通信单元215通过网络106输出信号。用户界面设备129可以检测网络106上的信号。用户界面设备129可以确定该信号包括足以生成和呈现用户界面的信息。用户界面设备129输出用户界面,其中用户界面包括针对每个组健康状态的显示元素。图5A中的每个显示元素被呈现为被着色或阴影化的块,以表示组健康状态值。对于不同的健康状态值,颜色或阴影不同。在一个示例中,红色可以用于与表示低或不良健康状况的组健康状态值相对应的区块。绿色可以用于与正常的组健康状态值相对应的区块。一个或多个其他颜色(诸如黄色)可以用于与在正常(绿色)和低(红色)之间的组健康状态值相对应的区块。虽然图5A将对应于组健康状态值的显示元素图示为彩色或阴影区块,但是可以使用呈现组健康状态值的其他方式(例如,涉及尺寸、动画、数字、形状)。
对于包括在任意流程图表或流程图中的本文所描述的过程、装置和其他示例或图示,本文所描述的任何技术中包括的某些操作、动作、步骤或事件可以以不同序列执行,可以被添加、合并或完全忽略(例如,并非所有描述的动作或事件对于技术的实践都是必需的)。另外,在某些示例中,操作、动作、步骤或事件可以例如通过多线程处理、中断处理或多个处理器同时地而不是顺序地被执行。另外的某些操作动作、步骤或事件可以自动被执行,即使没有明确标识为自动地被执行。另外,被描述为自动地被执行的某些操作、动作、步骤或事件可以备选地不自动被执行,而是在一些示例中,这种操作、动作、步骤或事件可以响应于输入或另一事件而被执行。
为了便于说明,在附图和/或本文中引用的其他图示中仅示出了有限数目的设备(例如,控制器201、网络设备126、用户界面设备129、网络106以及其他设备)。然而,根据本公开的一个或多个方面的技术可以与更多这样的系统、组件、设备、模块和/或其他项一起被执行,并且对这样的系统、组件、设备、模块和/或其他项的集体引用可以表示任何数目的这样的系统、组件、设备、模块和/或其他项。
本文包括的附图均图示了本公开的一个方面的至少一个示例实现。然而,本公开的范围不限于这样的实现。因此,除了图中所图示的那些之外,本文描述的系统、方法或技术的其他示例或备选实现在其他情况下可能是合适的。这种实现可以包括附图中包括的设备和/或组件的子集和/或可以包括附图中未示出的附加设备和/或组件。
以上阐述的详细描述旨在作为各种配置的描述,并且不旨在表示可以实践本文描述的概念的仅有配置。详细描述包括具体细节,以便提供对各种概念的充分理解。然而,可以在没有这些具体细节的情况下实践这些概念。在一些实例中,在引用的图中以框图形式示出了公知的结构和组件,以避免模糊这种概念。
因此,尽管可以参考特定附图描述各种系统、设备和/或组件的一个或多个实现,但是这种系统、设备和/或组件可以以多种不同方式实现。例如,在本文的图(例如,图1和/或图2)中作为分离的设备而图示的一个或多个设备可以备选地被实现为单个设备;作为分离的组件而图示的一个或多个组件可以备选地被实现为单个组件。另外,在一些示例中,在本文的图中作为单个设备而图示的一个或多个设备可以备选地被实现为多个设备;作为单个组件而图示的一个或多个组件可以备选地被实现为多个组件。这样的多个设备和/或组件中的每一个可以经由有线或无线通信而直接耦合和/或经由一个或多个网络而远程耦合。另外,可以在本文的各个图中图示的一个或多个设备或组件可以备选地被实现为这样的图中未示出的另一设备或组件的一部分。以这种方式和其他方式,本文描述的一些功能可以通过两个或更多个设备或组件的分布式处理来执行。
另外,某些操作、技术、特征和/或功能在本文中可以被描述为由特定组件、设备和/或模块执行。在其他的一些示例中,这种操作、技术、特征和/或功能可以由不同的组件、设备或模块来执行。因此,可以在本文中被描述为属于一个或多个组件、设备或模块的一些操作、技术、特征和/或功能可以在其他的一些示例中属于其他组件、设备和/或模块,即使本文没有以这种方式具体描述。
尽管已经结合一些示例的描述标识了特定优点,但是各种其他示例可以包括所列举的优点中的一些、没有或全部。根据本公开,技术或其他方面的其他优点对本领域技术人员变得显而易见。另外,尽管本文已经公开了特定示例,但是可以使用任何数目的技术来实现本公开的方面,无论当前是否已知,因此,本公开不限于本公开中具体描述和/或图示的示例。
在一个或多个示例中,所描述的功能可以以硬件、软件、固件或其任意组合来实现。如果以软件实现,则功能可以作为一个或多个指令或代码存储在计算机可读介质上和/或通过计算机可读介质进行传输并且由基于硬件的处理单元执行。计算机可读介质可以包括:对应于诸如数据存储介质的有形介质的计算机可读存储介质、或包括促进将计算机程序从一处传递到另一处(例如,依照通信协议)的任意介质的通信介质。以这种方式,计算机可读介质通常可以对应于(1)非暂态的有形计算机可读存储介质或(2)诸如信号或载波的通信介质。数据存储介质可以是可以由一个或多个计算机或者一个或多个处理器访问以获取用于实现本公开中描述的技术的指令、代码和/或数据结构的任意可用介质。计算机程序产品可以包括计算机可读介质。
作为示例而非限制,这样的计算机可读存储介质可以包括RAM、ROM、EEPROM、CDROM或其它光盘存储器、磁盘存储或其它磁存储设备、闪存或可以用于以指令或数据结构的形式存储期望的程序代码并可以由计算机访问的任意其他介质。另外,任何连接都被适当地称为计算机可读介质。例如,如果指令使用同轴电缆、光纤电缆、双绞线、数字订户线路(DSL)或诸如红外线、无线电和微波的无线技术从网站、服务器或其他远程源传输,则同轴电缆、光纤电缆、双绞线、DSL或诸如红外、无线电和微波的无线技术都包括在介质的定义中。然而,应当理解的是,计算机可读存储介质和数据存储介质不包括连接、载波、信号或其它瞬态介质,而是代之针对非瞬态、有形的存储介质。如使用的盘和碟包括压缩碟(CD)、激光碟、光学碟、数字多功能碟(DVD)、软盘和蓝光碟,其中盘通常以磁性方式再现数据,而碟利用激光以光学方式再现数据。上述的组合也应当包括在计算机可读介质的范围内。
指令可以由诸如一个或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其他等价的集成或离散逻辑电路的一个或多个处理器执行。因此,本文使用的术语“处理器”或“处理电路”可以均指代任何前述结构或适于所描述的技术的实现的任何其他结构。另外,在一些示例中,所描述的功能可以在专用硬件和/或软件模块内提供。另外,这些技术可以完全在一个或多个电路或逻辑元件中实现。
本公开的技术可以在各种各样的设备或装置中实现,包括无线电话、移动或非移动计算设备、可穿戴或不可穿戴计算设备、集成电路(IC)或IC(例如芯片组)集合。在本公开中描述了各种组件、模块或单元以强调被配置成执行所公开的技术的设备的功能方面,但是不一定需要通过不同的硬件单元来实现。相反,如上所述,各种单元可以组合在硬件单元中或者通过包括如上所述的一个或多个处理器的互操作硬件单元的集合结合合适的软件和/或固件来提供。

Claims (20)

1.一种方法,包括:
由计算系统收集针对一个或多个网络设备的性能指标数据;
由所述计算系统确定多个健康状态值,其中所述健康状态值中的每个健康状态值基于多个健康状态规则中的一个健康状态规则被确定,所述多个健康状态规则评估所述性能指标数据的子集;
由所述计算系统基于所述多个健康状态值中有多少健康状态值,将所述健康状态值分组成多个健康状态组,其中所述健康状态组中的每个健康状态组包括两个或更多个健康状态值,并且其中健康状态组内的所述健康状态值中的每个健康状态值与所述健康状态组中的其他健康状态值中的每个其他健康状态相关;
由所述计算系统并且针对所述健康状态组中的每个健康状态组,确定组健康状态值,其中针对每个健康状态组的所述组健康状态值基于所述健康状态组内的所述健康状态值中的至少一个健康状态值被确定;以及
由所述计算系统输出包括针对所述健康状态组中的每个健康状态组的显示元素的用户界面,其中所述显示元素中的每个显示元素提供与每个相应的健康状态组相关联的所述组健康状态值的视觉指示。
2.根据权利要求1所述的方法,其中将所述健康状态值分组成所述多个健康状态组包括:
确定存在太多健康状态值而无法在单个用户界面内有效地呈现关于所有所述健康状态值的视觉信息。
3.根据权利要求1所述的方法,其中数量表示所述多个健康状态值中有多少健康状态值,并且其中将所述健康状态值分组成所述多个健康状态组包括:
确定所述数量超过阈值,其中所述阈值对应于能够在单个用户界面内有效地呈现关于健康状态值的视觉信息的显示元素的最大数量。
4.根据权利要求1-3中的任一项所述的方法,其中所述性能指标数据被组织成分层数据模型,并且其中将所述健康状态值分组成所述多个健康状态组包括:
将所述健康状态值分组成所述分层数据模型的子树。
5.根据权利要求1-3中的任一项所述的方法,其中针对所述健康状态组中的每个健康状态组确定所述组健康状态值包括:
标识在所述健康状态组内的所述健康状态值中的最差的健康状态值,以及将所述最差的健康状态值指派为针对所述健康状态组的所述组健康状态值。
6.根据权利要求1-3中的任一项所述的方法,其中每个健康状态组内的所述健康状态值中的每个健康状态值至少由于所述健康状态组内的所述健康状态值基于针对相同的网络设备的性能指标数据,而与所述健康状态组内的其他健康状态值中的每个其他健康状态值相关。
7.根据权利要求1-3中的任一项所述的方法,其中每个健康状态组内的所述健康状态值中的每个健康状态值至少由于所述健康状态组内的所述健康状态值是共同类型的性能指标信息,而与所述健康状态组内的其他健康状态值中的每个其他健康状态值相关。
8.根据权利要求1-3中的任一项所述的方法,其中所述性能指标数据包括中央处理单元(CPU)利用率数据、CPU温度数据、接口数据、应用数据、机箱数据、物理接口卡数据、系统数据中的至少一项。
9.一种系统,包括:
存储设备;以及
处理电路,所述处理电路能够访问所述存储设备并且被配置成:
收集针对一个或多个网络设备的性能指标数据,
确定多个健康状态值,其中所述健康状态值中的每个健康状态值基于多个健康状态规则中的一个健康状态规则被确定,所述多个健康状态规则评估所述性能指标数据的子集,
基于所述多个健康状态值中有多少健康状态值,将所述健康状态值分组成多个健康状态组,其中所述健康状态组中的每个健康状态组包括两个或更多个健康状态值,并且其中健康状态组内的所述健康状态值中的每个健康状态值与所述健康状态组中的其他健康状态值中的每个其他健康状态值相关,
针对所述健康状态组中的每个健康状态组确定组健康状态值,其中针对每个健康状态组的所述组健康状态值基于所述健康状态组内的所述健康状态值中的至少一个健康状态值被确定,以及
输出包括针对所述健康状态组中的每个健康状态组的显示元素的用户界面,其中所述显示元素中的每个显示元素提供与每个相应的健康状态组相关联的所述组健康状态值的视觉指示。
10.根据权利要求9所述的系统,其中为了将所述健康状态值分组成所述多个健康状态组,所述处理电路还被配置成:
确定存在太多健康状态值而无法在单个用户界面内有效地呈现关于所有所述健康状态值的视觉信息。
11.根据权利要求9所述的系统,其中数量表示所述多个健康状态值中有多少健康状态值,并且其中为了将所述健康状态值分组成所述多个健康状态组,所述处理电路还被配置成:
确定所述数量超过阈值,其中所述阈值对应于能够在单个用户界面内有效地呈现关于健康状态值的视觉信息的显示元素的最大数量。
12.根据权利要求9-11中的任一项所述的系统,其中所述性能指标数据被组织成分层数据模型,并且其中为了将所述健康状态值分组成所述多个健康状态组,所述处理电路还被配置成:
将所述健康状态值分组成所述分层数据模型的子树。
13.根据权利要求9-11中的任一项所述的系统,其中为了针对所述健康状态组中的每个健康状态组确定所述组健康状态值,所述处理电路还被配置成:
标识在所述健康状态组内的所述健康状态值中的最差的健康状态值,以及将所述最差的健康状态值指派为针对所述健康状态组的所述组健康状态值。
14.根据权利要求9-11中的任一项所述的系统,其中每个健康状态组内的所述健康状态值中的每个健康状态值至少由于所述健康状态组内的所述健康状态值基于针对相同的网络设备的性能指标数据,而与所述健康状态组内的其他健康状态值中的每个其他健康状态值相关。
15.根据权利要求9-11中的任一项所述的系统,其中每个健康状态组内的所述健康状态值中的每个健康状态值至少由于所述健康状态组内的所述健康状态值是共同类型的性能指标信息,而与所述健康状态组内的其他健康状态值中的每个其他健康状态值相关。
16.根据权利要求9-11中的任一项所述的系统,其中所述性能指标数据包括中央处理单元(CPU)利用率数据、CPU温度数据、接口数据、应用数据、机箱数据、物理接口卡数据、系统数据中的至少一项。
17.一种计算机可读存储介质,包括指令,所述指令在被执行时将计算系统的处理电路配置成:
确定多个健康状态值,其中所述健康状态值中的每个健康状态值基于多个健康状态规则中的一个健康状态规则被确定,所述多个健康状态规则评估所述性能指标数据的子集;
基于所述多个健康状态值中有多少健康状态值,将所述健康状态值分组成多个健康状态组,其中所述健康状态组中的每个健康状态组包括两个或更多个健康状态值,并且其中健康状态组内的所述健康状态值中的每个健康状态值与所述健康状态组中的其他健康状态值中的每个其他健康状态值相关,
针对所述健康状态组中的每个健康状态组确定组健康状态值,其中针对每个健康状态组的所述组健康状态值基于所述健康状态组内的所述健康状态值中的至少一个健康状态值被确定,以及
输出包括针对所述健康状态组中的每个健康状态组的显示元素的用户界面,其中所述显示元素中的每个显示元素提供与每个相应的健康状态组相关联的所述组健康状态值的视觉指示。
18.根据权利要求17所述的计算机可读存储介质,其中为了将所述健康状态值分组成所述多个健康状态组,所述指令还将所述处理电路配置成:
确定存在太多健康状态值而无法在单个用户界面内有效地呈现关于所有所述健康状态值的视觉信息。
19.根据权利要求17所述的计算机可读存储介质,其中数量表示所述多个健康状态值中有多少健康状态值,并且其中为了将所述健康状态值分组成所述多个健康状态组,所述指令还将所述处理电路配置成:
确定所述数量超过阈值,其中所述阈值对应于能够在单个用户界面内有效地呈现关于健康状态值的视觉信息的显示元素的最大数量。
20.根据权利要求17-19中的任一项所述的计算机可读存储介质,其中所述性能指标数据被组织成分层数据模型,并且其中为了将所述健康状态值分组成所述多个健康状态组,所述指令还将所述处理电路配置成:
将所述健康状态值分组成所述分层数据模型的子树。
CN201910569778.7A 2018-10-22 2019-06-27 针对网络设备的健康数据的可扩展可视化的方法和系统 Active CN111083005B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410476837.7A CN118138484A (zh) 2018-10-22 2019-06-27 针对网络设备的健康数据的可扩展可视化

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/167,358 US10911336B2 (en) 2018-10-22 2018-10-22 Scalable visualization of health data for network devices
US16/167,358 2018-10-22

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202410476837.7A Division CN118138484A (zh) 2018-10-22 2019-06-27 针对网络设备的健康数据的可扩展可视化

Publications (2)

Publication Number Publication Date
CN111083005A true CN111083005A (zh) 2020-04-28
CN111083005B CN111083005B (zh) 2024-04-26

Family

ID=67220616

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202410476837.7A Pending CN118138484A (zh) 2018-10-22 2019-06-27 针对网络设备的健康数据的可扩展可视化
CN201910569778.7A Active CN111083005B (zh) 2018-10-22 2019-06-27 针对网络设备的健康数据的可扩展可视化的方法和系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202410476837.7A Pending CN118138484A (zh) 2018-10-22 2019-06-27 针对网络设备的健康数据的可扩展可视化

Country Status (3)

Country Link
US (2) US10911336B2 (zh)
EP (2) EP3644557B1 (zh)
CN (2) CN118138484A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112596991A (zh) * 2020-12-27 2021-04-02 卡斯柯信号有限公司 一种基于机器健康状态的热备倒切方法
CN112768075A (zh) * 2021-01-20 2021-05-07 西安闻泰电子科技有限公司 用户健康监控方法、系统、计算机设备及存储介质
CN113221023A (zh) * 2021-05-24 2021-08-06 中国农业银行股份有限公司 信息推送方法及装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10581687B2 (en) 2013-09-26 2020-03-03 Appformix Inc. Real-time cloud-infrastructure policy implementation and management
US10917324B2 (en) * 2016-09-28 2021-02-09 Amazon Technologies, Inc. Network health data aggregation service
US10868742B2 (en) * 2017-03-29 2020-12-15 Juniper Networks, Inc. Multi-cluster dashboard for distributed virtualization infrastructure element monitoring and policy control
US11323327B1 (en) 2017-04-19 2022-05-03 Juniper Networks, Inc. Virtualization infrastructure element monitoring and policy control in a cloud environment using profiles
US10911336B2 (en) 2018-10-22 2021-02-02 Juniper Networks, Inc. Scalable visualization of health data for network devices
US11258661B2 (en) * 2019-04-26 2022-02-22 Juniper Networks, Inc. Initializing server configurations in a data center
US11095504B2 (en) 2019-04-26 2021-08-17 Juniper Networks, Inc. Initializing network device and server configurations in a data center
US10979767B2 (en) * 2019-04-29 2021-04-13 See A Star LLC Audio-visual content monitoring and quarantine system and method
US11271835B2 (en) * 2019-05-10 2022-03-08 Cisco Technology, Inc. Composite key performance indicators for network health monitoring
US11489613B2 (en) * 2019-05-14 2022-11-01 Infinera Corporation Out-of-band communication channel for subcarrier-based optical communication systems
US11469942B2 (en) 2019-08-15 2022-10-11 At&T Intellectual Property I, L.P. System and method for SDN orchestration validation
US11012326B1 (en) * 2019-12-17 2021-05-18 CloudFit Software, LLC Monitoring user experience using data blocks for secure data access
US11005721B1 (en) * 2020-06-30 2021-05-11 Juniper Networks, Inc. Scalable control plane for telemetry data collection within a distributed computing system
US11277315B2 (en) 2020-07-02 2022-03-15 Juniper Networks, Inc. Dashboard for display of state information in a graphic representation of network topology
US11582099B1 (en) * 2022-03-31 2023-02-14 Juniper Networks, Inc. Predictive pipeline analytics for a network management system

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090313508A1 (en) * 2008-06-17 2009-12-17 Microsoft Corporation Monitoring data categorization and module-based health correlations
US20130151692A1 (en) * 2011-12-09 2013-06-13 Christopher J. White Policy aggregation for computing network health
CN106209432A (zh) * 2016-06-30 2016-12-07 中国人民解放军国防科学技术大学 基于动态阈值的网络设备亚健康预警方法及装置
CN106992904A (zh) * 2017-05-19 2017-07-28 湖南省起航嘉泰网络科技有限公司 基于动态综合权重的网络设备健康度评估方法
US20180046995A1 (en) * 2016-08-12 2018-02-15 Mastercard International Incorporated Systems and Methods for Monitoring Health Indicators Associated With Applications
WO2018064107A1 (en) * 2016-09-28 2018-04-05 Amazon Technologies, Inc. Network health data aggregation service
WO2018064111A1 (en) * 2016-09-28 2018-04-05 Amazon Technologies, Inc. Visualization of network health information

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6054987A (en) * 1998-05-29 2000-04-25 Hewlett-Packard Company Method of dynamically creating nodal views of a managed network
US7185076B1 (en) * 2000-05-31 2007-02-27 International Business Machines Corporation Method, system and program products for managing a clustered computing environment
US20020069241A1 (en) * 2000-12-06 2002-06-06 Girija Narlikar Method and apparatus for client-side proxy selection
CN1221898C (zh) * 2002-08-13 2005-10-05 国际商业机器公司 刷新网络代理高速缓存服务器对象的系统和方法
US20050060574A1 (en) * 2003-09-13 2005-03-17 Finisar Corporation Network analysis graphical user interface
EP1716665B1 (en) * 2004-02-18 2009-05-27 Telefonaktiebolaget LM Ericsson (publ) Method and device for reliable broadcast
US8051170B2 (en) * 2005-02-10 2011-11-01 Cisco Technology, Inc. Distributed computing based on multiple nodes with determined capacity selectively joining resource groups having resource requirements
JP2007207173A (ja) * 2006-02-06 2007-08-16 Fujitsu Ltd 性能分析プログラム、性能分析方法、および性能分析装置
US20110016423A1 (en) * 2009-07-16 2011-01-20 Synopsys, Inc. Generating widgets for use in a graphical user interface
US8655985B2 (en) * 2010-11-15 2014-02-18 International Business Machines Corporation Content delivery using multiple sources over heterogeneous interfaces
US9407521B1 (en) 2012-05-16 2016-08-02 Veritas Technologies Llc Method and system to visually represent the status of a data center
US10367694B2 (en) * 2014-05-12 2019-07-30 International Business Machines Corporation Infrastructure costs and benefits tracking
US9848041B2 (en) * 2015-05-01 2017-12-19 Amazon Technologies, Inc. Automatic scaling of resource instance groups within compute clusters
US10291463B2 (en) * 2015-10-07 2019-05-14 Riverbed Technology, Inc. Large-scale distributed correlation
US10606857B2 (en) * 2016-09-26 2020-03-31 Splunk Inc. In-memory metrics catalog
US10862777B2 (en) * 2016-09-28 2020-12-08 Amazon Technologies, Inc. Visualization of network health information
EP3560145B1 (en) 2016-12-23 2020-11-25 Telefonaktiebolaget LM Ericsson (PUBL) Apparatus and method for identifying network object groups
US10361935B2 (en) 2017-01-31 2019-07-23 Cisco Technology, Inc. Probabilistic and proactive alerting in streaming data environments
US10361943B2 (en) * 2017-02-06 2019-07-23 Ca, Inc. Methods providing performance management using a proxy baseline and related systems and computer program products
US10868742B2 (en) * 2017-03-29 2020-12-15 Juniper Networks, Inc. Multi-cluster dashboard for distributed virtualization infrastructure element monitoring and policy control
US10673714B1 (en) 2017-03-29 2020-06-02 Juniper Networks, Inc. Network dashboard with multifaceted utilization visualizations
US10756993B2 (en) * 2018-01-30 2020-08-25 International Business Machines Corporation Storage system root cause analysis and monitoring
US10911336B2 (en) 2018-10-22 2021-02-02 Juniper Networks, Inc. Scalable visualization of health data for network devices
US10637956B1 (en) * 2019-10-01 2020-04-28 Metacluster It, Uab Smart proxy rotator
US11165646B1 (en) * 2020-11-19 2021-11-02 Fujitsu Limited Network node clustering

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090313508A1 (en) * 2008-06-17 2009-12-17 Microsoft Corporation Monitoring data categorization and module-based health correlations
US20130151692A1 (en) * 2011-12-09 2013-06-13 Christopher J. White Policy aggregation for computing network health
CN106209432A (zh) * 2016-06-30 2016-12-07 中国人民解放军国防科学技术大学 基于动态阈值的网络设备亚健康预警方法及装置
US20180046995A1 (en) * 2016-08-12 2018-02-15 Mastercard International Incorporated Systems and Methods for Monitoring Health Indicators Associated With Applications
WO2018064107A1 (en) * 2016-09-28 2018-04-05 Amazon Technologies, Inc. Network health data aggregation service
WO2018064111A1 (en) * 2016-09-28 2018-04-05 Amazon Technologies, Inc. Visualization of network health information
CN106992904A (zh) * 2017-05-19 2017-07-28 湖南省起航嘉泰网络科技有限公司 基于动态综合权重的网络设备健康度评估方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112596991A (zh) * 2020-12-27 2021-04-02 卡斯柯信号有限公司 一种基于机器健康状态的热备倒切方法
CN112596991B (zh) * 2020-12-27 2023-09-08 卡斯柯信号有限公司 一种基于机器健康状态的热备倒切方法
CN112768075A (zh) * 2021-01-20 2021-05-07 西安闻泰电子科技有限公司 用户健康监控方法、系统、计算机设备及存储介质
CN113221023A (zh) * 2021-05-24 2021-08-06 中国农业银行股份有限公司 信息推送方法及装置
CN113221023B (zh) * 2021-05-24 2023-09-15 中国农业银行股份有限公司 信息推送方法及装置

Also Published As

Publication number Publication date
US11616703B2 (en) 2023-03-28
EP3863226A1 (en) 2021-08-11
US10911336B2 (en) 2021-02-02
EP3644557B1 (en) 2021-05-05
CN118138484A (zh) 2024-06-04
EP3644557A1 (en) 2020-04-29
US20210160158A1 (en) 2021-05-27
CN111083005B (zh) 2024-04-26
US20200127903A1 (en) 2020-04-23
EP3863226B1 (en) 2024-03-27

Similar Documents

Publication Publication Date Title
CN111083005B (zh) 针对网络设备的健康数据的可扩展可视化的方法和系统
US11394628B1 (en) Monitoring and performance improvement of enterprise applications
US11070452B1 (en) Network dashboard with multifaceted utilization visualizations
US11126523B1 (en) Agent-based monitoring of network resources
US11200139B2 (en) Automatic configuration of software systems for optimal management and performance using machine learning
WO2019133763A1 (en) System and method of application discovery
US20100110932A1 (en) Network optimisation systems
US20150256413A1 (en) Network system with live topology mechanism and method of operation thereof
US8634330B2 (en) Inter-cluster communications technique for event and health status communications
US11765014B2 (en) Intent-based distributed alarm service
CN114244676A (zh) 一种智能it综合网关系统
US20200158810A1 (en) Partial phase vectors as network sensors
CN113867884B (zh) 用于计算机网络的方法和系统及存储介质
US10819604B2 (en) Change to availability mapping
US20140280804A1 (en) Relationship driven dynamic workflow system
Das et al. Performance Analysis of an OpenFlow-Enabled Network with POX, Ryu, and ODL Controllers
EP4184880A1 (en) Cloud network failure auto-correlator
US20230385279A1 (en) Dynamic classification and optimization of computing resource utilization
US20240193439A1 (en) Automonous digital twin generation using edge-nodes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant