CN115378812A - 用于数据中心网络设备维护的方法和系统 - Google Patents
用于数据中心网络设备维护的方法和系统 Download PDFInfo
- Publication number
- CN115378812A CN115378812A CN202210553546.4A CN202210553546A CN115378812A CN 115378812 A CN115378812 A CN 115378812A CN 202210553546 A CN202210553546 A CN 202210553546A CN 115378812 A CN115378812 A CN 115378812A
- Authority
- CN
- China
- Prior art keywords
- network
- network devices
- network device
- tag
- data center
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000008520 organization Effects 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 description 39
- 238000007726 management method Methods 0.000 description 28
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
- H04L41/0836—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability to enhance reliability, e.g. reduce downtime
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
- G06F8/65—Updates
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0813—Configuration setting characterised by the conditions triggering a change of settings
- H04L41/082—Configuration setting characterised by the conditions triggering a change of settings the condition being updates or upgrades of network functionality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0866—Checking the configuration
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0876—Aspects of the degree of configuration automation
- H04L41/0886—Fully automatic configuration
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0893—Assignment of logical groups to network elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/30—Managing network names, e.g. use of aliases or nicknames
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Automation & Control Theory (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
一种用于维护数据中心中的网络设备的方法和系统,涉及耦合到CMDB、规则DB、升级路径DB和网络配置器的网络升级工具。网络升级工具被配置成从网络设备收集/获取信息,从自动化维护中移除那些不符合的网络设备,将剩余的网络设备群集成冗余网络设备的组,并且对于所有这些组,依次升级组中存在的网络设备的网络操作系统。
Description
技术领域
本技术涉及信息技术,更具体地涉及用于数据中心中的网络设备的自动化维护的方法和系统。
背景技术
已经开发了旨在支持网络设备诸如数据中心中的交换机、路由器等的维护的系统。如本文所用,“维护”可以包括例如执行将设备从当前网络操作系统升级到目标(例如:最新的)网络操作系统。如本文所用,“数据中心”不限于位于一个服务器场的物理边界内的基础设施,而是包括组织部署、控制和维护以给该组织自己的内部服务或给第三方实体即该组织的所有客户提供基于计算机群集的服务的所有基础设施,无论是本地的还是远程的。对在节省所需人力、避免人为错误和管理客户影响的同时实现数据中心中的网络设备的维护的自动化的系统的需求已久。
然而,开发此类系统所面临的挑战不仅在于要解决的网络设备的数目,还在于数据中心中的此类设备的多样性,包括它们的特性和它们的作用。例如,数据中心网络可能由不同的架构组成,这些架构并肩工作以提供连接性和服务,其中这些架构中的每个架构都设计有特定的特性、硬件型号、使能特征和/或冗余级别并针对该特定的特性、硬件型号、使能特征和/或冗余级别而设计,并且所有这些并行架构已连接到更中心的架构或核心网络。
这种开发的挑战还在于使对数据中心的功能的中断最小化,并确保尽可能限制由于网络设备的维护而导致的部分或全部数据中心的不可用性。这又允许使组织提供给客户的网络连接性服务中的中断最小化,从而视情况而定满足合同服务质量承诺。
因此,需要一种方法和系统,该方法和系统通过提供要升级的网络设备列表以及如果需要和在需要的时候输入一些简单的选项来允许没有特定网络知识的数据中心运营商使用简单的入口点来使大规模网络设备维护活动自动化。
一般而言,本技术旨在通过将自动化维护失败风险较高的那些网络设备从自动化维护中移除并利用剩余网络设备的冗余以便限制数据中心中由于维护操作导致的停机时间来使数据中心中的网络设备的维护自动化。
背景技术部分中讨论的主题不应仅仅因为其在背景技术部分中提及而被认为是现有技术。类似地,不应假定在背景技术部分中提到的或与背景技术部分的主题相关联的问题先前已在现有技术中被认识到。背景技术部分中的主题仅表示不同的方法。
发明内容
本技术的实施方式是基于开发者对与现有技术相关联的缺点的认识而开发的。
在一个实施方式中,本技术的各种实施方案提供了一种用于维护数据中心中的网络设备的方法,该方法包括:
-针对维护列表上的网络设备中的每个网络设备收集:
-管理IP(MANAGEMENTIP)信息,其中MANAGEMENTIP表示与网络设备唯一相关联的虚拟标识;以及
-任何标签和位置(LOCATION)信息,其中标签表示与网络设备相关联的键值元组,其中键是BU、ROLE或INFRA中的任一者,并且值是实际数据或键的数据的指针,其中BU值表示网络设备的与网络设备在数据中心中所用于的业务或产品供应相关的特性,ROLE值表示网络设备的与网络设备在数据中心中所占据的位置和功能相关的特性,并且INFRA值表示网络设备的与网络设备在其中运行的数据中心基础设施的版本或代相关的特性,并且其中LOCATION信息表示网络设备的与网络设备的实际物理位置相关的特性;
-针对维护列表上的网络设备中的每个网络设备,使用对应的MANAGEMENTIP,获取该网络设备的硬件型号和当前网络操作系统级别;
-从维护列表中移除具有不受支持的硬件型号或当前网络操作系统级别或BU、ROLE或INFRA标签或LOCATION信息中的任一者中有错误的网络设备;
-将维护列表上的剩余网络设备群集成:具有相同BU标签的网络设备的i个集群BUi,在BUi集群内的具有相同ROLE标签的网络设备的j个集群ROLEj,以及具有相同INFRA标签的网络设备的ROLEj集群内的k个集群Clusterijk;
-根据适用于INFRAk的冗余规则,在每个Clusterijk集群内创建冗余的网络设备的组;
-在每个创建的组中验证是否符合适用于组中网络设备的数目的组合BUi-ROLEj-INFRAk的大小规则,以及组中的所有网络设备是否共享相同LOCATION信息;
-从维护列表中移除没有集群或分组成组、或者存在于不符合冗余规则或大小规则的组中、或者当存在于相同组中时没有共享相同LOCATION信息的网络设备;以及
-使用对应的MANAGEMENTIP和升级规则,针对所有Clusterijk集群内的所有组,将每个创建的组中的剩余网络设备从网络操作系统的当前版本依次升级到操作系统的目标版本。
在实施方式中,收集和获取是使用由数据中心运营商在部署数据中心时分配给维护列表上的网络设备中的每个网络设备的唯一ID来执行的,并且该唯一ID与每个网络设备的标签中的任一标签以及MANAGEMENTIP和LOCATION信息相关联。
在实施方式中,从维护列表中移除还包括移除对于BU、ROLE和INFRA标签中的每个标签不具有恰好一个值的网络设备。
在实施方式中,从维护列表中移除还包括创建填充有移除的网络设备的ID的错误列表。
在实施方式中,错误列表还包括能够由数据中心运营商纠正的错误以及链接到故障网络设备的错误的子列表。
在实施方式中,依次升级还包括调整并行处理的Clusterijk集群的数目以使数据中心的停机时间最小化。
在实施方式中,依次升级还包括调整处理Clusterijk集群的顺序以优化对部署、控制和维护数据中心的组织的客户的服务的连续性。
在又一实施方式中,本技术的各种实施方案提供了一种用于维护数据中心中的网络设备的系统,该系统包括耦合到CMDB、规则DB、升级路径DB和网络配置器的网络升级工具,该网络升级工具被配置成:
-从CMDB中针对维护列表上的网络设备中的每个网络设备收集:
-MANAGEMENTIP信息,其中MANAGEMENTIP表示与网络设备唯一相关联的虚拟标识,以及
-任何标签和LOCATION信息,其中标签表示与网络设备相关联的键值元组,其中键是BU、ROLE或INFRA中的任一者,并且值是实际数据或键的数据的指针,其中BU表示网络设备的与网络设备在数据中心中所用于的业务或产品供应相关的特性,ROLE表示网络设备的与网络设备在数据中心中所占据的位置和功能相关的特性,并且INFRA表示网络设备的与网络设备在其中运行的数据中心基础设施的版本或代相关的特性,并且其中LOCATION表示网络设备的与网络设备的实际物理位置相关的特性;
-针对维护列表上的网络设备中的每个网络设备,使用对应的MANAGEMENTIP,获取该网络设备的硬件型号和当前网络操作系统级别;
-从维护列表中移除具有不受支持的硬件型号或当前网络操作系统级别或BU、ROLE或INFRA标签或LOCATION信息中的任一者中有错误的网络设备;
-将维护列表上的剩余网络设备群集成:具有相同BU标签的网络设备的i个集群BUi,在BUi集群内具有相同ROLE标签的网络设备的j个集群ROLEj,以及具有相同INFRA标签的网络设备的ROLEj集群内的k个集群Clusterijk;
-根据从规则DB中收集的适用于INFRAk的冗余规则,在每个Clusterijk集群内创建冗余的网络设备的组;
-在每个创建的组中验证是否符合从规则DB中收集的适用于组中网络设备的数目的组合BUi-ROLEj-INFRAk的大小规则,以及组中的所有网络设备是否共享相同LOCATION信息;
-从维护列表中移除没有集群或分组成组、或者存在于不符合冗余规则或大小规则的组中、或者当存在于相同组中时没有共享相同LOCATION信息的网络设备;以及
-通过网络配置器,使用对应的MANAGEMENTIP和从规则DB中收集的升级规则,针对所有Clusterijk集群内的所有组,将每个创建的组中的剩余网络设备从网络操作系统的当前版本依次升级到操作系统的目标版本。
在实施方式中,网络升级工具还被配置成使用由数据中心运营商在部署数据中心时分配给维护列表上的网络设备中的每个网络设备的唯一ID来进行收集和获取,并且该唯一ID与每个网络设备的标签中的任一标签以及MANAGEMENTIP和LOCATION信息相关联。
在实施方式中,网络升级工具还被配置成创建错误列表,该错误列表填充有从维护列表中移除的网络设备的ID。
在实施方式中,错误列表还包括能够由数据中心运营商纠正的错误以及链接到故障网络设备的错误的子列表。
在实施方式中,网络升级工具还被配置成调整并行处理的Clusterijk集群的数目以使数据中心的停机时间最小化。
在实施方式中,网络升级工具还被配置成调整处理Clusterijk集群的顺序以优化对部署、控制和维护数据中心的组织的客户的服务的连续性。
在实施方式中,冗余规则和大小规则被硬编码在网络升级工具中。
在又一实施方式中,本技术的各种实现方式提供了一种计算机可读介质,该计算机可读介质包括使计算系统执行上述方法的指令。
在又一实施方式中,本技术的各种实施方式提供了一种用于维护数据中心中的多个网络设备的方法。该方法包括针对多个网络设备中的至少一个网络设备收集下述,该至少一个网络设备选自维护列表:-MANAGEMENTIP,该MANAGEMENTIP是与至少一个网络设备唯一相关联的虚拟标识;-LOCATION,该LOCATION是表示至少一个网络设备的实际物理位置的信息;-标签,该标签是与至少一个网络设备相关联的键值元组,键值是数据和数据的指针中的一者,
标签是下述中的一者:-BU标签,该BU标签是表示数据中心中的至少一个网络设备的产品供应应用的信息;-ROLE标签,该ROLE标签是表示至少一个网络设备在数据中心中所占据的功能的信息;以及-INFRA标签,该INFRA标签是表示至少一个网络设备在其中运行的数据中心的版本的信息;针对维护列表上的至少一个网络设备,基于至少一个网络设备的MANAGEMENTIP,获取至少一个网络设备的硬件型号和当前网络操作系统级别;以及响应于确定下述中的至少一项:至少一个网络设备的硬件型号不受支持,至少一个网络设备的当前网络操作系统级别不受支持,BU标签、ROLE标签、INFRA标签和LOCATION标签中的至少一者中的错误,从维护列表中移除至少一个网络设备。
在一些实施方案中,该方法还包括确定下述中的至少一项:至少一个网络设备的硬件型号不受支持,至少一个网络设备的当前网络操作系统级别不受支持,BU标签、ROLE标签、INFRA标签和LOCATION标签中的至少一者中的错误。
在一些实施方案中,该方法还包括针对多个网络设备中的每个网络设备收集:MANAGEMENTIP、LOCATION和标签;响应于从维护列表中移除至少一个网络设备,将维护列表上的剩余网络设备群集成:在剩余网络设备的相关联标签之一中具有相同BU标签值的网络设备的i个集群BUi;在剩余网络设备的相关联标签之一中具有相同ROLE键值的网络设备的j个集群ROLEj,以及在剩余网络设备的相关联标签之一中具有相同INFRA标签值的网络设备的ROLEj集群内的k个集群Clusterijk;在每个Clusterijk集群内创建冗余的多个网络设备的组;根据适用于INFRAk的冗余规则,验证每个创建的组中的冗余网络设备的数目是否与第一数量相匹配;以及根据适用于组合BUi-ROLEj-INFRAk的大小规则,验证每个组中的网络设备的数目是否与第二数量相匹配。
在一些实施方案中,该方法还包括验证每个组的网络设备是否共享相同LOCATION;从维护列表中移除在给定组中存在且冗余的数量与第一数量不匹配的、在另一给定组中存在的数量与第二数量不匹配的、或者在另一组中存在且不共享相同LOCATION的至少一个网络设备。
在一些实施方案中,该方法还包括使用升级规则和相应的MANAGEMENTIP,将所有Clusterijk集群内的每个组中的剩余网络设备从网络操作系统的当前版本升级到操作系统的目标版本。
在一些实施方案中,收集和获取是使用由数据中心运营商在部署数据中心时分配给维护列表上的网络设备中的每个网络设备的唯一ID来执行的,并且该唯一ID与每个网络设备的相关联标签中的任一相关联标签、MANAGEMENTIP和LOCATION相关联。
在一些实施方案中,从维护列表中移除还包括移除对于BU、ROLE和INFRA标签中的每个标签不具有恰好一个值的网络设备。
在一些实施方案中,从维护列表中移除还包括创建填充有移除的网络设备的ID的错误列表。
在一些实施方案中,错误列表还包括能够由数据中心运营商纠正的错误以及链接到故障网络设备的错误的子列表。
在一些实施方案中,升级还包括调整并行处理的Clusterijk集群的数目以使数据中心的停机时间最小化。
在一些实施方案中,升级还包括调整处理Clusterijk集群的顺序以优化对部署、控制和维护数据中心的组织的客户的服务的连续性。
在又一实施方案中,本技术的各种实施方案提供了一种用于维护数据中心中的网络设备的系统,该系统包括耦合到CMDB、规则DB、升级路径DB和网络配置器的网络升级工具,该网络升级工具被配置成:-从CMDB中针对维护列表上的多个网络设备中的每个网络设备收集:-MANAGEMENTIP,该MANAGEMENTIP是与给定网络设备唯一相关联的虚拟标识;-LOCATION,该LOCATION是表示给定网络设备的实际物理位置的信息;以及-标签,该标签是与给定网络设备相关联的键值元组,其中,该标签是下述中的一者:-表示数据中心中网络设备被用于的业务或产品供应的信息,BU;-表示网络设备在数据中心中所占据的位置和功能的信息,ROLE;以及-表示网络设备在其中运行的数据中心的版本或代的信息,INFRA;用于标签的值是实际数据或数据的指针;-针对维护列表上的网络设备中的每个网络设备,使用相应的MANAGEMENTIP,获取给定网络设备的硬件型号和当前网络操作系统级别;-从维护列表中移除具有不受支持的硬件型号或当前网络操作系统级别或者在其相应的相关联的BU、ROLE和INFRA标签中的任一标签中或在其LOCATION中的任一LOCATION中有错误的网络设备;-将维护列表上的剩余网络设备群集成:在剩余网络设备的相关联标签之一中具有相同BU键值的网络设备的i个集群BUi,在BUi集群内的剩余网络设备的相关联标签之一中具有相同ROLE键值的网络设备的j个集群ROLEj,以及在剩余网络设备的相关联标签之一中具有相同INFRA键值的网络设备的ROLEj集群内的k个集群Clusterijk;-根据从规则DB中收集的适用于INFRAk的冗余规则,在每个Clusterijk集群内创建冗余的网络设备的组;-根据适用于INFRAk的冗余规则,验证每个组中的冗余网络设备的数目是否与第一数量相匹配;-根据适用于组合BUi-ROLEj-INFRAk的大小规则,验证每个组中的网络设备的数目是否与第二数量相匹配;-验证每个创建的组中的所有网络设备是否共享相同LOCATION;-从维护列表中移除在组中的一个组中存在且冗余的数量与第一数量不匹配的、在组中的一个组中存在的数量与第二数量不匹配的、或者在组中的一个组中存在且不共享相同LOCATION的网络设备;以及-通过网络配置器,使用从升级路径DB中收集的升级规则和相应的MANAGEMENTIP,针对所有Clusterijk集群内的所有组,将每个组中的剩余网络设备从网络操作系统的当前版本升级到操作系统的目标版本。
在一些实施方案中,网络升级工具还被配置成使用由数据中心运营商在部署数据中心时分配给维护列表上的多个网络设备中的每个网络设备的唯一ID来进行收集和获取,并且该唯一ID与每个网络设备的相关联标签中的任一相关联标签、所述MANAGEMENTIP和所述LOCATION相关联。
在一些实施方案中,冗余和大小规则被硬编码在网络升级工具中。
本技术提供了一种方法和系统,当网络设备符合相同的参数(架构、角色、硬件型号、运行的软件版本和/或使能的特征等)时,该方法和系统将执行完全相同的维护过程,从而可以移除人为错误的风险。调整后的并行执行的量将限制数据中心不可用的影响。通过识别共享某些参数或特性的网络设备的基础设施中的冗余以及对此类网络设备的非同时维护以便可能地使服务降级但不会完全中断它,将使向客户提供的网络连接服务的中断最小化。此外,这样的方法和系统将允许数据中心运营商容易地考虑新设备硬件或设备之间的新架构。
在本说明书的上下文中,除非另有明确规定,否则系统可以指但不限于适合手头相关任务的“电子设备”、“操作系统”、“计算系统”、“基于计算机的系统”、“控制器单元”、“监控装置”、“控制装置”和/或其任何组合。
在本说明书的上下文中,图中所示的功能步骤可以通过使用专用硬件以及能够执行与适当软件相关联的软件的硬件来提供。此外,图中所示的各种功能块诸如标签为“网络设备”、“工具”、“配置器”等的功能,可以通过使用专用硬件以及能够执行与适当软件相关联的软件的硬件来提供。当由“处理器”提供时,功能可以由单个专用处理器、单个共享处理器或多个单独的处理器提供,其中一些可以共享。在本技术的一些实施方式中,处理器可以是通用处理器,诸如中央处理单元(CPU)或专用于特定用途的处理器,诸如数字信号处理器(DSP)。在前述中,术语“处理器”的明确使用不应被解释为专门指能够执行软件的硬件,并且可以隐含地包括但不限于专用集成电路(ASIC)、现场可编程门阵列(FPGA)、用于存储软件的只读存储器(ROM)、随机存取存储器(RAM)和非易失性存储器。也可以包括其他硬件,传统的和/或定制的。
在本说明书的上下文中,“标签”旨在表示与每个数据中心网络设备相关联并且存储在数据库例如配置管理数据库(CMDB)中的键值元组。键唯一标识数据元素,并且是值实际数据或数据的指针(pointer),视情况而定。标签是数据中心网络设备的某些特性的便捷键。
在本说明书的上下文中,“BU”(用于业务单元)旨在,作为数据中心网络设备的标签的一部分,表示与数据中心网络设备所用于的业务或产品供应有关的特性。业务或产品供应可以是部署、控制和维护基础设施的组织的业务或产品供应或该组织的客户的业务或产品供应。例如,BU可以是服务器、云、主机等,并且取决于业务或产品供应的目录的粒度、多样性和复杂性。
在本说明书的上下文中,“ROLE”旨在,作为数据中心网络设备的标签的一部分,表示与数据中心网络设备在数据中心网络基础设施中占据的位置和功能有关的特性。例如,ROLE可以是但不限于:“聚合”、“架顶”(ToR)、“行尾”(EoR)、“脊椎”、“巨型脊椎”等。
在本说明书的上下文中,“INFRA”旨在,作为数据中心网络设备的标签的一部分,表示与数据中心网络设备意在于其中运行的、可能随着时间的推移随着增强和演进而演进的基础设施的版本或代有关的特性。
在本说明书的上下文中,“LOCATION”旨在,作为与数据中心网络设备相关联的信息的一部分,表示与数据中心网络设备在数据中心中的实际物理位置有关的特性。例如LOCATION可以是但不限于:数据中心建筑物的名称、特定的数据中心房间等。
在本说明书的上下文中,“MANAGEMENTIP”旨在,作为与数据中心网络设备相关联的信息的一部分,表示与数据中心网络设备唯一相关联的并且允许通过使用例如自动化工具到达数据中心网络设备并使用它执行操作诸如例如检索信息、改变配置、升级等的虚拟标识,诸如例如IP地址。
仍然在本说明书的上下文中,“一个”计算机可读介质和“该”计算机可读介质不应被解释为同一计算机可读介质。相反,只要适当,“一个”计算机可读介质和“该”计算机可读介质也可以被解释为第一计算机可读介质和第二计算机可读介质。
仍然在本说明书的上下文中,除非另有明确规定,否则词语“第一”、“第二”、“第三”等已被用作形容词,仅是为了允许在它们所修饰的名词彼此之间进行区分,而不是为了描述这些名词之间的任何特定关系。
本技术的实施方案各自具有上述目的和/或方面中的至少一个,但不一定具有所有这些目的和/或方面。应当理解,由于试图实现上述目的而产生的本技术的一些方面可能不满足该目的和/或可能满足本文未具体列举的其他目的。
本技术的实施方式的附加和/或替代特征、方面和优点将从以下描述、附图和所附权利要求变得明显。
附图说明
为了更好地理解本技术以及它的其他方面和进一步的特征,参考将结合附图使用的以下描述,其中:
图1描绘了其中可以使用本技术的数据中心环境;
图2呈现了根据本技术的方法的广泛概述;
图3a至图3c提供了根据本技术的方法的更详细视图;
图4提供了数据中心中的网络设备的集群/子集群的逻辑图示;以及
图5图示了可以在本技术中使用的计算系统。
应当注意,除非本文另有明确说明,否则附图不是按比例绘制的。此外,从一个图到下一个图相同的元件共享相同的附图标签。
具体实施方式
本文中列举的示例和条件语言主要旨在帮助读者理解本技术的原理,而不是将其范围限制于这些具体列举的示例和条件。将理解,本领域的技术人员可以设计尽管在本文中没有明确地描述或示出但是体现了本技术的原理并且被包括在本技术的精神和范围内的各种布置。
此外,为了帮助理解,以下描述可以描述本技术的相对简化的实施方案。如本领域技术人员将理解的,本技术的各种实施方案可能具有更大的复杂性。
在一些情况下,还可以阐述被认为是对本技术的修改的有用示例。这样做仅仅是为了帮助理解,并且再次,不是为了限定本技术的范围或阐明本技术的界限。这些修改不是详尽的列表,并且本领域的技术人员可以进行其他修改,同时仍然保持在本技术的范围内。此外,在没有阐述修改的示例的情况下,不应解释为没有修改是可能的和/或所描述的是实现本技术的该元素的唯一方式。
此外,本文中列举本技术的原理、方面和实施方案及其具体示例的所有陈述旨在涵盖其结构和功能等同物,无论它们是当前已知的还是未来开发的。因此,例如,本领域技术人员将理解,本文中的任何框图表示体现本技术的原理的说明性电路的概念视图。类似地,将理解,任何流程图、作业图、状态转换图、伪代码等表示可以在非暂时性计算机可读介质中实质上表示并且因此由计算机或处理器执行的各种过程,无论是否明确示出这样的计算机或处理器。
软件模块或暗示为软件的简单模块在本文中可以表示为流程图元素或指示过程步骤和/或文本描述的执行的其他元素的任何组合。这样的模块可以由明确或隐含地示出的硬件执行。此外,应该理解,模块可以包括例如但不限于提供所需能力的计算机程序逻辑、计算机程序指令、软件、堆栈、固件、硬件电路或其组合。
有了这些基本原理,我们现在将考虑一些非限制性示例来说明本技术的各个方面的各种实施方案。图1描绘了其中可以使用本技术的数据中心环境。网络升级工具100向数据中心运营商101提供输入/输出接口,该输入/输出接口允许该数据中心运营商输入用于网络设备维护活动的自动化的输入和选项并接收关于这种活动的状态和结果。网络升级工具100可以使用YAQL语言(又一种查询语言)开发,并且可以被解释为用于启动和组织任务、子任务和独立动作的开源软件编排器内的工作流。例如,网络升级工具100可以是软件堆栈102一部分,诸如为OpenStack项目(可在https://docs.openstack.org/mistral/latest/获得)的部件之一的Mistra。对本领域技术人员来说将明显的是,在本公开的教导内仍然可以使用其他语言、软件和软件框架。
网络升级工具100可以进一步与作为抽象和统一的应用程序编程接口(API)系统的网络配置器105接口,该网络配置器提供与数据中心中的网络设备交互的能力,而不管它们的硬件型号或网络操作系统的多样性。网络配置器105可以具有与数据中心网络设备的接口106。
网络升级工具100可以进一步与CMDB 103耦合并接口,该CMDB可以引用数据中心中的网络设备,并且存储例如网络升级工具100可以检索的与此类被引用的网络设备中的每个网络设备相关联的标签和MANAGEMENTIP。例如,在数据中心中部署每个新网络设备时,每个新网络设备例如可以由数据中心运营商101给予唯一的网络设备ID,并且这种网络设备ID可以用于从CMDB 103中检索与部署的网络设备相关联的标签和MANAGEMENTIP。
网络升级工具100可以进一步与升级路径DB 104接口,该升级路径DB可以引用数据中心中的网络设备,并且视情况而定与此类被引用的网络设备中的每个网络设备或此类网络设备的组相关联地存储网络升级工具100可以检索并用于自动化维护的到目标网络操作系统级别的路径(即:在当前级别和目标级别之间的所有必要的中间操作系统级别)。
网络升级工具100可以进一步与规则DB 112接口,该规则DB可以存储网络升级工具100可以检索和用于自动维护的规则。例如,网络升级工具100可以检查某些网络设备是否符合某些规则。例如,规则可以详细说明数据中心中共享相同INFRA标签值的网络设备的预期冗余。例如,其他规则可能适用于共享BU-ROLE-INFRA标签值的相同组合的网络设备。
本领域技术人员将理解,尽管被表示为三个单独的物理和逻辑实体,但CMDB 103、升级路径DB 104和规则DB112可以全部或部分地形成相同物理和/或逻辑数据库的一部分,或者在物理上是网络升级工具100的一部分,而不影响本文教导的一般性。此外,根据部署、控制和维护基础设施的组织的公司和开发环境,规则DB 112甚至可能不是单独的数据库,并且规则可能被硬编码,例如被硬编码在网络升级工具100中。
数据中心可以包括通过基础设施中的连接110互连的多个网络设备109,如图1所示,仅作为简化示例。每个网络设备109可以与作为其标签的一部分的它相关联:
-ROLE;
-INFRA 111;以及
-BU 108。
此外,LOCATION信息107a-107b也与每个网络设备109相关联。
图2呈现了根据本技术的方法的广泛概述。在步骤201和202,可以收集/获取数据中心中要维护的网络设备109(其可以存在于要维护的设备的列表中)的某些参数。这包括在步骤201:与网络设备109中的每个网络设备相关联的一个或多个标签,包括它们的BU、ROLE、INFRA以及它们的MANAGEMENTIP和LOCATION信息。并且这包括在步骤202:使用网络设备109的对应的MANAGEMENTIP信息从网络设备获取与它们的硬件型号和它们的当前网络操作系统有关的某些参数。
在步骤203,可以从维护列表中移除具有不受支持的硬件和软件特性(诸如不受支持的硬件型号或当前网络操作系统)的即不易受本技术的自动化维护影响的或者其BU、ROLE、INFRA标签或LOCATION信息有错误的那些网络设备109。例如,它们的网络操作系统级别可能不是受支持的级别,或者它们的硬件型号可能已过时或无法识别。例如,它们的标签可能不具有本技术的自动维护系统所识别的值,或者对于BU、ROLE或INFRA标签等中的任一者而言(严格地)具有多于或少于一个单个值。
在步骤204,列表上的剩余网络设备109可以如下群集:
-形成共享相同BU标签的网络设备109的i个集群BUi;
-在每个BUi集群内,形成共享相同ROLE标签的网络设备109的j个集群ROLEj;
-在每个ROLEj集群内,形成共享相同的INFRA标签的网络设备109的k个集群Clusterijk。
本领域技术人员将理解,与所描述的不同的群集网络设备109的另一顺序可以用于得出集群Clusterijk的构造,这仍在本公开的教导内。例如,集群可以首先由共享相同ROLE标签的网络设备109组成,然后由共享相同BU标签的网络设备109组成等。
在步骤205,在每个形成的Clusterijk中,可以识别网络设备109之间的冗余。该冗余可以在INFRAk级别处、以本技术的自动化系统可以应用以将冗余网络设备109分组成每个Clusterijk内的组的冗余规则限定。一个组可以包括1个(该网络设备没有冗余)或2个或更多个网络设备109。
在步骤206,在集群Clusterijk中的每个形成的组中,可以利用适用于BUi-ROLEj-INFRAk的特定组合的特定大小规则来检查存在于该组中的网络设备109的符合度。例如,大小规则可以指示集群Clusterijk中的所有组必须包括3个网络设备109。属于包括(严格地)多于或少于3个网络设备109的组的所有网络设备109都是不符合的。此外,可以执行组中的所有网络设备109是否共享相同LOCATION信息的检查。
在步骤207,可以从维护列表中移除在步骤204和205没有被群集或分组、不符合冗余规则或大小规则或者在步骤205和206之后当存在于同一组中时不共享相同LOCATION信息的那些网络设备109。
在步骤208,根据本技术的自动化过程可以依次升级组中的所有剩余网络设备109。由于这些网络设备109是冗余的网络设备,因此对数据中心的功能的中断以及对提供给部署、控制和维护数据中心的组织的客户的网络连接性服务的中断被最小化,并且数据中心的由于网络设备的维护的部分或全部的技术不可用性被尽可能地限制。可以对Clusterijk中的所有创建的组以及对所有形成的Clusterijk集群执行相同的操作。对于经过调整的多个Clusterijk集群,可以并行执行相同的操作以增加维护过程的速度,同时使数据中心的整体停机时间以及对部署、控制和维护数据中心的组织的客户的服务的中断最小化。此外,还可以调整处理Clusterijk集群的顺序,以优化对组织的客户的服务的持续性。
图3a至图3c提供了根据本技术的方法的更详细视图。参考图3a,在步骤301,可以尝试获取要在数据中心中维护的网络设备的当前网络操作系统的级别和硬件型号的信息。这些网络设备可以通过维护列表上的ID列表列出。返回参考图1,这可以例如通过以下方式执行:(i)(由数据中心运营商101或以其他方式)向网络升级工具100提供网络设备ID的维护列表,(ii)网络升级工具100收集来自CMDB 103的对应的MANAGEMENTIP,以及(iii)网络升级工具100使用检索到的对应的MANAGEMENTIP来查询要维护的网络设备以获得当前网络操作系统的级别和硬件型号的信息。收集/获取不一定成功,可以在步骤302和307将收集/获取不成功的网络设备的ID添加到错误列表,并从维护列表中移除。
在步骤303,可以对维护列表上的剩余网络设备(即:在步骤301/302之后ID没有被添加到错误列表的那些网络设备)进行确定,在步骤301获取的硬件型号是否是受支持的硬件型号。如本文所用,“受支持的硬件型号”是指数据中心的维护操作能够处理的硬件型号。返回参考图1,这可以例如通过以下方式执行:(i)(由数据中心运营商101或以其他方式)在规则DB112中存储受支持的硬件型号,(ii)网络升级工具100从规则DB 112中检索那些受支持的硬件型号,以及(iii)网络升级工具100将检索到的受支持的硬件型号与在步骤301获取的硬件型号进行比较。如果确定不成功或者硬件型号是不受支持的硬件型号,则可以在步骤304和307将对应网络设备的ID添加到错误列表,并从维护列表中移除。
在步骤305,可以尝试收集维护列表上要在数据中心中维护的剩余网络设备的标签的信息以及LOCATION和MANAGEMENTIP信息。这可以由网络升级工具100从CMDB 103中收集该信息来执行。收集不一定成功,并且可以在步骤306和307将收集不成功的网络设备的ID添加到错误列表,并从维护列表中移除。
参考图3b,在步骤310,可以对维护列表上的剩余网络设备进行确定,这些网络设备是否分别具有一个且仅一个标签BU、ROLE和INFRA的值(如在步骤305获取的)。可以在步骤311和312将在BU、ROLE或INFRA标签中的任一者中没有值或具有不止一个值的网络设备的ID添加到错误列表中,并从维护列表中移除。
在步骤313,可以将维护列表上的剩余网络设备分组成共享相同BU标签的集群。可以在步骤314和312将在BU中具有未知/未识别值的网络设备的ID添加到错误列表,并且从维护列表中移除。
在步骤316,可以在每个BU集群中将维护列表上的剩余网络设备分组成共享相同ROLE标签的子集群。在ROLE中具有未知/识别值的网络设备的ID可以在步骤317和312被添加到错误列表中,并从维护列表中移除。
图4提供了根据图3b中的步骤313和316群集/子群集数据中心中的网络设备的逻辑图示。仅表示了数据中心网络设备401的一部分。网络设备401各自拥有已经被图示为“NDxx”的唯一的ID。作为步骤313的结果,网络设备401各自被群集成被图示为BU01和BU11的BU集群402。作为步骤316的结果,网络设备401各自被子群集成被图示为ROLE01、ROLE07、ROLE13等的ROLE子集群403。
现在返回图3c,在步骤320,对于在步骤313创建的每个集群BUi和在步骤316创建的每个子集群ROLEj,网络设备可以进一步被分组成共享相同INFRA标签k(INFRAk)的子子集群Clusterijk。
在步骤321,根据适用于对应INFRAk的冗余规则,可以进一步将在每个Clusterijk中看起来是冗余的网络设备分组成冗余网络设备的组。返回参考图1,这可以例如通过以下方式执行:(i)(由数据中心运营商101或以其他方式)在规则DB 112中存储特定于INFRAk的冗余规则,(ii)网络升级工具100从规则DB 112中检索那些冗余规则,以及(iii)网络升级工具100根据那些冗余规则将网络设备分组成每个Clusterijk中的组。例如,规则可以是将固有地携带冗余信息的网络设备ID的规范化。例如,规则可以是INFRAk中的冗余网络设备的ID以特定于该INFRAk的相同字符链结尾。
在步骤322,可以根据适用于对应组合BUi-ROLEj-INFRAk的规则,检查每个组中存在的网络设备的硬件型号是否是一个或几个预期硬件型号之一。返回参考图1,这可以例如通过以下方式执行:(i)(由数据中心运营商101或以其他方式)在规则DB 112中存储特定于BUi-ROLEj-INFRAk的硬件型号预期规则,(ii)网络升级工具100从规则DB 112中检索那些硬件型号预期规则,以及(iii)网络升级工具100根据那些硬件型号预期规则检查每个Clusterijk中的组中的网络设备。
在步骤323,可以根据适用于对应组合BUi-ROLEj-INFRAk的大小规则,检查每个组中存在的网络设备的实际数目。返回参考图1,这可以例如通过以下方式执行:(i)(由数据中心运营商101或以其他方式)在规则DB112中存储特定于BUi-ROLEj-INFRAk的大小(网络设备预期的数目)规则,(ii)网络升级工具100从规则DB 112中检索那些大小规则,以及(iii)网络升级工具100根据那些大小规则检查每个Clusterijk中的组中的网络设备的数目。
在步骤324,可以验证每个组中存在的所有网络设备是否共享相同LOCATION信息。从步骤305起,网络升级工具100可以使用该LOCATION信息。
在步骤325和326,可以将没有在步骤320或321被分组、在步骤322与预期硬件型号之一不匹配、在步骤323没有在组中总计达到预期数目、或者当在相同组中时没有共享相同LOCATION的所有网络设备添加到错误列表中,并从维护列表中移除。
在步骤327,可以维护维护列表上的剩余网络设备:对于组中的所有网络设备,对于所有Clusterijk,这是依次执行的。返回参考图1,这可以例如通过以下方式执行:(i)(由数据中心运营商101或以其他方式)在升级路径DB 104中存储用于将网络设备从当前网络操作系统级别带到目标网络操作系统级别的升级规则,(ii)网络升级工具100从升级路径DB 104中检索那些升级规则,以及(iii)网络升级工具100通过网络配置器105应用升级。
通过本技术,对数据中心的相同客户提供相同服务所涉及的网络设备已被识别并分组在一起,并且在移除不符合且对于其的自动化维护风险太大的那些网络设备之后,对属于一个组中的所有网络设备依次执行维护。因此,服务并没有完全中断,只是视情况而定降级。
本领域技术人员将理解,通过跟踪错误原因,在步骤307、312和326所指的错误列表的粒度可以更高。例如,错误列表可以分解为子列表,该子列表允许在(i)数据中心运营商101可能能够纠正的错误诸如标签、分类、标识与(ii)链接到故障网络设备诸如通过其网络操作系统级别链接到故障网络设备的错误等之间进行区分。
图5图示了可以在本技术中使用的计算系统。呈现了可以用于网络升级工具100和/或网络配置器105的计算系统500的实施方案的示例。如本领域技术人员将理解的,这样的计算系统可以在任何其他合适的硬件、软件和/或固件或其组合中实现,并且可以是单个物理实体或者具有分布式功能的几个单独的物理实体。
在本技术的一些方面,计算系统500可以包括各种硬件部件,包括共同由处理器501表示的一个或多个单核或多核处理器、固态驱动器502、存储器503和输入/输出接口504。在该上下文中,处理器501可以被或可以不被包括在FPGA中。在一些其他方面,计算系统500可以是“现成的”通用计算系统。在一些方面,计算系统500也可以分布在多个系统中。计算系统500也可以专门用于本技术的实施方案。如本技术领域的技术人员可以理解的,在不背离本技术的范围的情况下,可以设想关于如何实现计算系统500的多种变化。
计算系统500的各种部件之间的通信可以通过各种硬件部件以电子方式耦合到的一个或多个内部和/或外部总线505(例如PCI总线、通用串行总线、IEEE 1394“火线”总线、SCSI总线、串行ATA总线、ARINC总线等)来实现。
输入/输出接口504可以允许使能联网能力,诸如有线或无线访问。作为示例,输入/输出接口504可以包括联网接口,诸如但不限于网络端口、网络插口、网络接口控制器等。可以如何实现联网接口的多个示例对于本技术领域的技术人员将变得明显。根据本技术的实施方案,固态驱动器502可以存储程序指令,诸如适合加载到存储器503并由处理器501执行以用于根据本技术的方法和过程步骤的库、应用等的那些部分。
尽管已经参照以特定顺序执行的特定步骤描述和示出了上述实施方案,但是将理解,在不背离本公开的教导的情况下,这些步骤可以被组合、细分或重新排序。步骤中的至少一些步骤可以并行或串行执行。因此,步骤的顺序和分组不是本技术的限制。还应明确理解,并非本文提到的所有技术效果都需要在本技术的每个实施方式中都享有。
对本技术的上述实施方案的修改和改进对于本领域技术人员来说可以是明显的。前面的描述旨在是示例性的而不是限制性的。因此,本技术的范围旨在仅由所附权利要求的范围来限制。
Claims (15)
1.一种用于维护数据中心中的多个网络设备的方法,包括:
针对所述多个网络设备中的至少一个网络设备收集下述,所述至少一个网络设备选自维护列表:
-管理IP,所述管理IP是与所述至少一个网络设备唯一相关联的虚拟标识;
-位置,所述位置是表示所述至少一个网络设备的实际物理位置的信息;以及
-标签,所述标签是与所述至少一个网络设备相关联的键值元组,所述键值是数据和所述数据的指针中的一者,
所述标签是下述中的一者:
-BU标签,所述BU标签是表示所述数据中心中的所述至少一个网络设备的产品供应应用的信息;
-ROLE标签,所述ROLE标签是表示所述至少一个网络设备在所述数据中心中所占据的功能的信息;以及
-INFRA标签,所述INFRA标签是表示所述数据中心的版本的信息,所述至少一个网络设备在所述数据中心中运行;
针对所述维护列表上的所述至少一个网络设备,基于所述至少一个网络设备的所述管理IP,获取所述至少一个网络设备的硬件型号和当前网络操作系统级别;以及
响应于确定下述中的至少一项:
所述至少一个网络设备的所述硬件型号不受支持,
所述至少一个网络设备的所述当前网络操作系统级别不受支持,以及
所述BU标签、所述ROLE标签、所述INFRA标签和所述位置标签中的至少一者中的错误,
从所述维护列表中移除所述至少一个网络设备。
2.根据权利要求1所述的方法,还包括确定下述中的至少一项:
所述至少一个网络设备的所述硬件型号不受支持,
所述至少一个网络设备的所述当前网络操作系统级别不受支持,以及
所述BU标签、所述ROLE标签、所述INFRA标签和所述位置标签中的至少一者中的错误。
3.根据权利要求1所述的方法,还包括:
针对所述多个网络设备中的每个网络设备收集:
所述管理IP,
所述位置,以及
所述标签;
响应于从所述维护列表中移除所述至少一个网络设备,将所述维护列表上的剩余网络设备群集成:
在所述剩余网络设备的相关联标签之一中具有相同BU标签值的网络设备的i个集群BUi,
在所述剩余网络设备的相关联标签之一中具有相同ROLE键值的网络设备的j个集群ROLEj,以及在所述剩余网络设备的相关联标签之一中具有相同INFRA标签值的网络设备的ROLEj集群内的k个集群Clusterijk;
在每个Clusterijk集群内创建冗余的所述多个网络设备的组;以及
根据适用于INFRAk的冗余规则,验证每个创建的组中的冗余网络设备的数目是否与第一数量相匹配;以及
根据适用于组合BUi-ROLEj-INFRAk的大小规则,验证每个组中的网络设备的数目是否与第二数量相匹配。
4.根据权利要求3所述的方法,还包括:
验证每个组的网络设备是否共享相同位置;
从所述维护列表中移除下述网络设备:在给定组中存在的且冗余的数量与所述第一数量不匹配的至少一个网络设备;在另一给定组中存在的数量与所述第二数量不匹配的至少一个网络设备;或者在另一组中存在的且不共享所述相同位置的至少一个网络设备。
5.根据权利要求4所述的方法,还包括:
使用升级规则和相应的管理IP,将所有Clusterijk集群内的每个组中的剩余网络设备从网络操作系统的当前版本升级到操作系统的目标版本。
6.根据权利要求1所述的方法,其中,所述收集和所述获取是使用由数据中心运营商在部署所述数据中心时分配给所述维护列表上的所述网络设备中的每个网络设备的唯一ID来执行的,并且所述唯一ID与每个网络设备的相关联标签中的任一相关联标签、所述管理IP和所述位置相关联。
7.根据权利要求5所述的方法,其中,从所述维护列表中移除还包括:移除对于BU标签、ROLE标签和INFRA标签中的每个标签不具有恰好一个值的网络设备。
8.根据权利要求6所述的方法,其中,从所述维护列表中移除还包括:创建填充有被移除的网络设备的ID的错误列表。
9.根据权利要求8所述的方法,其中,所述错误列表还包括:能够由所述数据中心运营商纠正的错误以及链接到故障网络设备的错误的子列表。
10.根据权利要求6所述的方法,其中,所述升级还包括:调整并行处理的Clusterijk集群的数目,以使所述数据中心的停机时间最小化。
11.根据权利要求5所述的方法,其中,所述升级还包括:调整处理Clusterijk集群的顺序,以优化对部署、控制和维护所述数据中心的组织的客户的服务的连续性。
12.一种用于维护数据中心中的网络设备的系统,所述系统包括耦合到CMDB、规则DB、升级路径DB和网络配置器的网络升级工具,所述网络升级工具被配置成:
-从所述CMDB中针对维护列表上的多个网络设备中的每个网络设备收集下述:
-管理IP,所述管理IP是与给定网络设备唯一相关联的虚拟标识;
-位置,所述位置是表示所述给定网络设备的实际物理位置的信息;以及
-标签,所述标签是与所述给定网络设备相关联的键值元组,
其中,所述标签是下述中的一者:
-表示所述数据中心中所述网络设备被用于的业务或产品供应的信息,BU;
-表示所述网络设备在所述数据中心中所占据的位置和功能的信息,ROLE;以及
-表示所述数据中心的版本或代的信息,INFRA,所述网络设备在所述数据中心中运行;
用于所述标签的值是实际数据或数据的指针;
-针对所述维护列表上的所述网络设备中的每个网络设备,使用相应的管理IP,获取所述给定网络设备的硬件型号和当前网络操作系统级别;
-从所述维护列表中移除:具有不受支持的硬件型号的网络设备;或者具有不受支持的当前网络操作系统级别的网络设备;或者在网络设备的相应的相关联的BU标签、ROLE标签和INFRA标签中的任一标签中或在网络设备的位置中的任一位置中有错误的网络设备;
-将所述维护列表上的剩余网络设备群集成:在所述剩余网络设备的相关联标签之一中具有相同BU键值的网络设备的i个集群BUi;在BUi集群内的所述剩余网络设备的相关联标签之一中具有相同ROLE键值的网络设备的j个集群ROLEj;以及在所述剩余网络设备的相关联标签之一中具有相同INFRA键值的网络设备的ROLEj集群内的k个集群Clusterijk;
-根据从所述规则DB中收集的适用于INFRAk的冗余规则,在每个Clusterijk集群内创建冗余的网络设备的组;
-根据适用于INFRAk的冗余规则,验证每个组中的冗余网络设备的数目是否与第一数量相匹配;
-根据适用于组合BUi-ROLEj-INFRAk的大小规则,验证每个组中的网络设备的数目是否与第二数量相匹配;
-验证每个创建的组中的所有网络设备是否共享相同位置;
-从所述维护列表中移除下述网络设备:在所述组中的一个组中存在的且冗余的数量与所述第一数量不匹配的网络设备;在所述组中的一个组中存在的数量与所述第二数量不匹配的网络设备;或者在所述组中的一个组中存在的且不共享相同位置的网络设备;以及
-通过所述网络配置器,使用从所述升级路径DB中收集的升级规则和相应的管理IP,针对所有Clusterijk集群内的所有组,将每个组中的所述剩余网络设备从网络操作系统的当前版本升级到操作系统的目标版本。
13.根据权利要求12所述的系统,其中,所述网络升级工具还被配置成:使用由数据中心运营商在部署所述数据中心时分配给所述维护列表上的所述多个网络设备中的每个网络设备的唯一ID来进行收集和获取,并且所述唯一ID与每个网络设备的相关联标签中的任一相关联标签、所述管理IP和所述位置相关联。
14.根据权利要求12所述的系统,其中,所述冗余规则和所述大小规则被硬编码在所述网络升级工具中。
15.一种计算机可读介质,所述计算机可读介质包括指令,所述指令使计算系统执行根据权利要求1所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21305662.5A EP4092963B1 (en) | 2021-05-20 | 2021-05-20 | Method and system for datacenter network device maintenance |
EP21305662.5 | 2021-05-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115378812A true CN115378812A (zh) | 2022-11-22 |
Family
ID=76325461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210553546.4A Pending CN115378812A (zh) | 2021-05-20 | 2022-05-20 | 用于数据中心网络设备维护的方法和系统 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220376985A1 (zh) |
EP (1) | EP4092963B1 (zh) |
CN (1) | CN115378812A (zh) |
CA (1) | CA3159474A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116684303B (zh) * | 2023-08-01 | 2023-10-27 | 聪育智能科技(苏州)有限公司 | 一种基于数字孪生的数据中心运维方法及系统 |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8346897B2 (en) * | 2008-02-25 | 2013-01-01 | Jon Jaroker | System and method for deploying and maintaining software applications |
US8407689B2 (en) * | 2010-06-25 | 2013-03-26 | Microsoft Corporation | Updating nodes considering service model constraints |
US20120102543A1 (en) * | 2010-10-26 | 2012-04-26 | 360 GRC, Inc. | Audit Management System |
US10326645B2 (en) * | 2011-11-11 | 2019-06-18 | Level 3 Communications, Llc | System and methods for configuration management |
US8935375B2 (en) * | 2011-12-12 | 2015-01-13 | Microsoft Corporation | Increasing availability of stateful applications |
US9201933B2 (en) * | 2014-04-01 | 2015-12-01 | BizDox, LLC | Systems and methods for documenting, analyzing, and supporting information technology infrastructure |
US10044795B2 (en) * | 2014-07-11 | 2018-08-07 | Vmware Inc. | Methods and apparatus for rack deployments for virtual computing environments |
US9893940B1 (en) * | 2015-05-26 | 2018-02-13 | Amazon Technologies, Inc. | Topologically aware network device configuration |
US11088912B2 (en) * | 2015-12-26 | 2021-08-10 | Intel Corporation | Distributed framework for resilient machine-to-machine system management |
US9948521B2 (en) * | 2016-01-11 | 2018-04-17 | Equinix, Inc. | Architecture for data center infrastructure monitoring |
US10089178B2 (en) * | 2016-02-29 | 2018-10-02 | International Business Machines Corporation | Developing an accurate dispersed storage network memory performance model through training |
US11941279B2 (en) * | 2017-03-10 | 2024-03-26 | Pure Storage, Inc. | Data path virtualization |
US10498608B2 (en) * | 2017-06-16 | 2019-12-03 | Cisco Technology, Inc. | Topology explorer |
US10862749B1 (en) * | 2017-07-21 | 2020-12-08 | Vmware, Inc. | Systems for and methods of network management and verification using intent inference |
US11089113B2 (en) * | 2017-08-07 | 2021-08-10 | Citrix Systems, Inc. | Systems and methods to retain existing connections so that there is no connection loss when nodes are added to a cluster for capacity or when a node is taken out from the cluster for maintenance |
US11082296B2 (en) * | 2017-10-27 | 2021-08-03 | Palo Alto Networks, Inc. | IoT device grouping and labeling |
WO2019113308A1 (en) * | 2017-12-05 | 2019-06-13 | Franchitti Jean Claude | Active adaptation of networked compute devices using vetted reusable software components |
US10528343B2 (en) * | 2018-02-06 | 2020-01-07 | Smartshift Technologies, Inc. | Systems and methods for code analysis heat map interfaces |
US10698674B2 (en) * | 2018-02-06 | 2020-06-30 | Smartshift Technologies, Inc. | Systems and methods for entry point-based code analysis and transformation |
US10740075B2 (en) * | 2018-02-06 | 2020-08-11 | Smartshift Technologies, Inc. | Systems and methods for code clustering analysis and transformation |
US11461203B2 (en) * | 2018-07-10 | 2022-10-04 | Here Data Technology | Systems and methods of handling node failure in a distributed data storage using multi-layer consistent hashing |
US10742501B1 (en) * | 2018-12-21 | 2020-08-11 | Juniper Networks, Inc. | Automation of maintenance mode operations for network devices |
US10938660B1 (en) * | 2018-12-21 | 2021-03-02 | Juniper Networks, Inc. | Automation of maintenance mode operations for network devices |
US10958517B2 (en) * | 2019-02-15 | 2021-03-23 | At&T Intellectual Property I, L.P. | Conflict-free change deployment |
CA3222582A1 (en) * | 2019-02-20 | 2020-08-27 | Level 3 Communications, Llc | Systems and methods for communications node upgrade and selection |
US11799888B2 (en) * | 2019-06-07 | 2023-10-24 | Hewlett Packard Enterprise Development Lp | Automatic identification of roles and connection anomalies |
US20210012239A1 (en) * | 2019-07-12 | 2021-01-14 | Microsoft Technology Licensing, Llc | Automated generation of machine learning models for network evaluation |
US10996938B2 (en) * | 2019-07-15 | 2021-05-04 | Juniper Networks, Inc. | Automated selection of software images for network devices |
US11140035B2 (en) * | 2019-12-11 | 2021-10-05 | Oracle International Corporation | System and method for automating zero touch provisioning of cloud networks |
EP3926891B1 (en) * | 2020-06-19 | 2024-05-08 | Accenture Global Solutions Limited | Intelligent network operation platform for network fault mitigation |
US20210405902A1 (en) * | 2020-06-30 | 2021-12-30 | Portworx, Inc. | Rule-based provisioning for heterogeneous distributed systems |
US11520673B2 (en) * | 2020-07-21 | 2022-12-06 | Hewlett Packard Enterprise Development Lp | Maintenance operations based on analysis of collected data |
US20220057947A1 (en) * | 2020-08-20 | 2022-02-24 | Portworx, Inc. | Application aware provisioning for distributed systems |
US20220239648A1 (en) * | 2020-10-16 | 2022-07-28 | Somos, Inc. | Systems and methods for an internet of things device registry display |
US20220337410A1 (en) * | 2021-04-16 | 2022-10-20 | Somos, Inc. | Systems and methods for an internet of things device registry |
-
2021
- 2021-05-20 EP EP21305662.5A patent/EP4092963B1/en active Active
-
2022
- 2022-05-18 US US17/748,002 patent/US20220376985A1/en active Pending
- 2022-05-19 CA CA3159474A patent/CA3159474A1/en active Pending
- 2022-05-20 CN CN202210553546.4A patent/CN115378812A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3159474A1 (en) | 2022-11-20 |
EP4092963A1 (en) | 2022-11-23 |
EP4092963B1 (en) | 2024-05-08 |
US20220376985A1 (en) | 2022-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8429645B2 (en) | Method for optimizing migration of software applications to address needs | |
US9354961B2 (en) | Method and system for supporting event root cause analysis | |
US10216514B2 (en) | Identification of a component for upgrade | |
US20170178020A1 (en) | Machine for development and deployment of analytical models | |
US11483218B2 (en) | Automating 5G slices using real-time analytics | |
US7870169B2 (en) | Method for enabling traceability and recovery from errors during migration of software applications | |
CN106970880A (zh) | 一种分布式自动化软件测试方法及系统 | |
US20230246913A1 (en) | System and method for commissioning a network element | |
CN115378812A (zh) | 用于数据中心网络设备维护的方法和系统 | |
US20140173065A1 (en) | Automated configuration planning | |
US7475164B2 (en) | Apparatus, system, and method for automated device configuration and testing | |
US11656977B2 (en) | Automated code checking | |
CN105706103B (zh) | 数据中心中返修商品的自动标识 | |
CN109120674B (zh) | 大数据平台的部署方法及装置 | |
US20240103824A1 (en) | Server management apparatus and server management method | |
US10868717B2 (en) | Concurrent profile deployments | |
US20240154875A1 (en) | Network system construction device, communication system, network system construction method, and non-transitory computer-readable medium | |
CN114143235A (zh) | Nfv自动测试方法、装置、设备及存储介质 | |
CN113553097B (zh) | 模型版本管理方法及装置 | |
KR20190118064A (ko) | 서버 검증 자동화 및 관리시스템 | |
CN114500268B (zh) | chart资源的部署方法、装置、服务器及存储介质 | |
US10374898B2 (en) | Network revision evaluator | |
WO2023276038A1 (ja) | サーバ管理装置、サーバ管理方法およびプログラム | |
CN115022317B (zh) | 基于云平台的应用管理方法、装置、电子设备及存储介质 | |
US20240078467A1 (en) | Predicting the intent of a network operator for making config changes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |