CN106716926B - 硬件库存的自动化独立式引导电路 - Google Patents
硬件库存的自动化独立式引导电路 Download PDFInfo
- Publication number
- CN106716926B CN106716926B CN201580052029.7A CN201580052029A CN106716926B CN 106716926 B CN106716926 B CN 106716926B CN 201580052029 A CN201580052029 A CN 201580052029A CN 106716926 B CN106716926 B CN 106716926B
- Authority
- CN
- China
- Prior art keywords
- hardware inventory
- rack
- hardware
- provisioning
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims abstract description 87
- 238000004891 communication Methods 0.000 claims abstract description 41
- 238000003860 storage Methods 0.000 claims abstract description 18
- 238000012795 verification Methods 0.000 claims description 39
- 238000010200 validation analysis Methods 0.000 claims description 23
- 230000007246 mechanism Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 10
- 230000003068 static effect Effects 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 6
- 230000000977 initiatory effect Effects 0.000 claims description 5
- 238000012546 transfer Methods 0.000 claims description 3
- 238000013475 authorization Methods 0.000 claims description 2
- 230000001960 triggered effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 description 24
- 238000007726 management method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000004519 manufacturing process Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000012384 transportation and delivery Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 239000004744 fabric Substances 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- VOWAEIGWURALJQ-UHFFFAOYSA-N Dicyclohexyl phthalate Chemical compound C=1C=CC=C(C(=O)OC2CCCCC2)C=1C(=O)OC1CCCCC1 VOWAEIGWURALJQ-UHFFFAOYSA-N 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000000779 smoke Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 229920003245 polyoctenamer Polymers 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/085—Retrieval of network configuration; Tracking network configuration history
- H04L41/0853—Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
- H04L41/0856—Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information by backing up or archiving configuration information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/161—Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0866—Checking the configuration
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/085—Retrieval of network configuration; Tracking network configuration history
- H04L41/0853—Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S40/00—Systems for electrical power generation, transmission, distribution or end-user application management characterised by the use of communication or information technologies, or communication or information technology specific aspects supporting them
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computer And Data Communications (AREA)
- Small-Scale Networks (AREA)
- Stored Programmes (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明的实施例提供用于包括发现、验证和配置硬件库存的供应工作流的硬件库存的自动化独立引导的系统、方法和计算机存储介质。在示例性实施例中,机架中计算设备(诸如机箱管理器或者所选择的刀片)初始化与机架的硬件库存的机架内通信网络。机架中计算设备使用机架内通信网络利用机架内的硬件库存发起机架内通信以发现至少硬件库存中的计算单元集合。机架内通信包括从计算单元集合接收的流量。机架中计算设备基于将期望的操作配置参数与实际的操作配置参数相比较来验证硬件库存的操作配置,操作配置参数的至少一部分在从所述计算单元集合接收的流量内所携带的信息中被检索。
Description
背景技术
一般地,分布式服务应用托管在云计算网络(跨越各个节点)中并且主要旨在通过服务应用部件的冗余、动态可扩展性和自动修复功能促进高可用性。这些服务应用常常被分为包括一组服务应用部件的部分。这些服务应用部件可以被托管在一个或多个数据中心的节点(例如,物理机和虚拟机)上。常常地,存在创建或者扩大这些数据中心的计算/存储能力以适应服务应用的使用需求并且帮助确保整个服务应用由于缺乏对底层硬件的支持而不会变得不可用的需要。
数据中心的扩大可以涉及各种场景(诸如配置新硬件集或者重新配置现有的硬件集以与数据中心内的现有节点协同操作)。在一个示例中,各自容纳多个刀片的新机架集合可以独立地引导并且可选地随后集成在互连数据中心节点的结构内。重要的是,新机架集合中的硬件(例如,网络设备(L2/3交换机、路由器)、电力和串行设备和刀片)被适当地供应-即使用限制人类介入的自动化过程来组装和准备。
当进行数据中心的扩大时,用于为数据中心供应新硬件的步骤有时是手动进行的。这些手动进行的步骤常常是耗费时间的、低效的并且在结果中不一致的,如此,这潜在地导致未适当地供应的新硬件上的资源的浪费或者在硬件部件必须替换时引起延迟。因此,包括发现、验证和配置硬件集的供应工作流的用于引导的自动化独立过程将帮助实现硬件库存的高效并且鲁棒的供应。
发明内容
提供本发明内容以用简化形式介绍在下面详细描述中进一步描述的概念的选择。该发明内容不旨在标识所要求保护的主题的关键特征或必要特征,其也不旨在单独地被用作帮助确定所要求保护的主题的范围。
本文所描述的实施例涉及用于执行硬件库存的自动化独立引导的方法、系统和计算机存储介质。供应的独立引导的工作流包括发现、验证和配置该硬件。在示例性实施例中,建造到机架中的内置计算设备(例如,机箱管理器或者所选择的刀片)初始化与机架的硬件库存的机架内通信网络。利用本文所描述的实施例预期不同类型的机架内通信网络(例如,前端网络、后端网络、嵌入式机架网络)。内置计算设备使用机架内通信网络利用机架内的硬件库存发起机架内通信以发现硬件库存中的至少计算单元集合。机架内通信包括从计算单元集合所接收的流量。机架内通信的流量可以安全地与外部基础设施隔离。内置计算设备验证硬件库存的操作配置。在实施例中,内置计算设备访问描述硬件库存的拓扑模式的模板文件并且通过将模板文件与在从计算单元集合所接收的流量内的携带的信息相比较来验证计算单元集合的位置并且基于预期和实际的带宽、吞吐量、延时、抖动、误码率和因素的相互作用,进一步验证操作配置参数。
附图说明
下面参考附图详细描述了本发明,其中:
图1是适于在本文所描述的实现实施例中使用的示例性计算环境的框图;
图2是根据本文所描述的实施例的示出用于执行硬件库存的自动化独立引导的方法的流程图;
图3是根据本文所描述的实施例的示出用于执行硬件库存的自动化独立引导的示例性操作环境的示意图;
图4是根据本文所描述的实施例的示出用于执行硬件库存的自动化独立引导的示例性操作环境的示意图;
图5A-B是根据本文所描述的实施例的示出用于执行硬件库存的自动化独立引导的方法的流程图;
图6是根据本文所描述的实施例的示出用于执行硬件库存的自动化独立引导的方法的流程图;以及
图7是根据本文所描述的实施例的示出用于执行硬件库存的自动化独立引导的方法的流程图。
具体实施方式
本文中具体描述本发明的实施例的主题以满足法定要求。然而,描述本身不旨在限制本专利的范围。相反,发明人已预期到,结合其他目前或者未来的技术,所要求保护的主题还可以以其他方式实施以包括与本文档中所描述的步骤类似的不同的步骤或者步骤的组合。而且,虽然术语“步骤”和/或“框”可以在本文中被用于暗示所采用的方法的不同的元素,但是除非并且除了当明确地描述了各个步骤的顺序时,该术语不应当被解释为暗示本公开中各步骤中间或者之间的任何特定顺序。
为了本公开的目的,词语“包括(including)”具有与词语“包括(comprising)”相同的广泛意义。另外,除非另有相反指示,诸如“一”和“一个”的词语包括复数以及单数。因此,例如,其在存在一个或多个特征的情况下满足“特征”的要求。而且,术语“或者”包括连接词、反意连接词和二者(a或者b因此包括要么a要么b,以及a和b)。
为了下面的详细讨论的目的,参考包括基于用于独立部署或者数据中心的供应工作流供应机架内硬件库存的独立引导过程描述实施例。独立引导和供应工作流可以被用于引导和供应针对各种不同的类型的硬件服务的新机架中硬件库存,并且独立部署或者数据中心引导仅是示例性的。应预期到,所描述的技术可以被扩展到其他实现环境。
引导框架可以指代综合工作流以发现、证实和配置设备、机架和数据中心以使得云计算结构的引导和部署能够管理包括计算单元和网络设备的硬件库存。一般地,引导框架可以包括:基于端口的范围发现到串行设备的串行和网络连接;发现电力分布单元(PDU)以验证到PDU的串行和网络连接;和发现刀片以检查刀片的布线、收集MAC地址和检查刀片库存保持单元(SKU)。引导框架引导机架中的硬件库存,其被布线到前端、管理网络、带外网络或者网络设备并且然后利用适当的配置完全地配置硬件库存。在该方面,引导过程取决于在不提供基本自动化和独立式发现、验证和配置的情况下复杂并且耗费时间的数个附加配置步骤。
本文所描述的实施例针对硬件库存的供应提供简单并且高效的独立引导和供应工作流。供应工作流包括有利地在硬件库存的数据中心部署或者硬件库存的自主部署之前发现、验证和配置硬件库存。指代相互连接的硬件和软件部件的多个不同的供应生态系统可以促进供应工作流。与端到端引导框架相反,基于这些独立供应生态系统,有利地实现供应工作流。如此,可以在OEM(原始设备制造商)位置处、在数据中心位置处或者其中机架中硬件可以接收电力的任何其他位置处执行独立式引导和供应工作流。独立引导过程可以指包括可以被描述为即插即用实现的供应工作流的自我维持的过程,因为供应工作流基于自动化过程促进硬件库存的制备。
具有本文所描述的实施例的独立式引导通常指至少部分基于本文所描述的发现、验证和配置步骤,标识、供应、布置并且制备硬件库存。独立引导过程在源或者在交付时间提供早期检测问题以避免由于供应工作流中的稍后的硬件问题的构建延迟。如本文所使用的,短语硬件库存不旨在限于部件的任何特定配置,但是广泛地指代机架中的设备的任何集合(例如,网络设备、计算设备和电源供应设备)。在一个实例中,机架可以被配置为在没有与云提供商交互的情况下以独立的方式操作,使得机架可以自我管理(例如,因特网服务提供商(ISP)、办公楼和购物中心)。在另一实例中,机架可以最终被集成在计算结构内。
引导和供应工作流充当在发现、验证和配置硬件库存中的第一质量把关人。引导特别地支持硬件库存的操作配置的验证。操作配置指代支持它的功能性的硬件库存的布置、安排和属性。硬件库存的操作配置的验证基于将预期的操作配置参数或者与其相关联的阈值与实际的操作配置参数相比较,操作配置参数的至少一部分在从计算单元集合接收的流量内携带的信息中被检索。验证可以进一步具体地包括验证机箱、布线、设备和机架内的刀片、执行针对机架中部件的烟雾测试并且运行硬盘驱动或者SSD烧机测试、配置机箱、布线、设备和机架中的刀片,并且更新设备、刀片和硬件BIOS和固件。
在该方面,操作配置参数包括与性能相关联的值(诸如带宽(最大速率信息被传送)、吞吐量(实际速率信息被传送)、延时(发送器与接收器之间的延迟)、抖动(信息的到达时间中的变化)、误码率(损坏的比特数)和硬件库存的因素的相互作用)。操作配置参数还可以包括与针对供应商提供的机架的硬件库存特性相关联的值。硬件库存特性可以至少部分基于给定SKU规格。在实施例中,在SKU规格中所描述的机架和部件是用于性能和属性的被特别地批准的部件。SKU指代用于特定硬件的期望的操作配置;SKU可以实施与硬件相关联的属性(例如,制造商、产品描述、BIOS、固件、配置、材料、大小、颜色、封装、HDD的数目、版本、模型和保修期)并且将硬件与其他硬件区分。应预期到,SKU还可以指代唯一标识符或者代码,其指代特定库存保持单元。利用本发明的实施例预期其他类型的操作配置参数。在一个实施例中,描述硬件库存的拓扑模式的模板文件可以被用于通过将模板文件与从计算单元集合内所接收的流量内所携带的信息相比较验证操作配置(例如,计算单元集合的位置的物理拓扑)。
参考硬件库存,硬件库存可以被定位在由云计算网络服务提供商的顾客所管理的私有企业网络内,其中实现供应工作流并且然后引导过程虑及数据中心与私有企业网络之间的远程可达性。在另一示例中,硬件库存可以被定位在由云计算网络服务提供商所管理的数据中心内,其中实现供应工作流并且然后引导过程虑及建造出数据中心的本地存储/计算容量。
供应工作流的报告机制处理用于接收和传递与硬件库存相关联的状态和事件的程序和例程。应预期到,硬件库存的状态或者事件可以特别地基于与硬件库存相关联的本文所描述的验证步骤。报告机制可以利用快速的反馈环路迭代以向运营商或者OEM供应商报告硬件问题,并且提供重新运行针对故障或者经修理的硬件的验证和配置的能力。报告机制可以利用硬件库存(例如,机箱管理器或者刀片)上的LED灯和LED屏幕(例如,滚动文本标记)报告设备的可用性。报告机制可以进一步被配置为通过网络将警报发送到一些其他位置(利用报告或者仅错误信息)并且警报可以通过各种装置(诸如寻呼机、手机、电子邮件)被递送到运营商。进一步地,OEM技术人员可以被期望运行供应工作流作为对硬件库存的请求者手动节断服务器机架的一部分。然后,执行建造的数据中心团队可以在成功执行供应工作流时接受机架。
在本文所描述的实施例中,供应工作流不包括特定机架外的任何特殊串行或者管理网络。在该方面,供应工作流独立于外部的基础设施并且可以特别地使用布线配置隔离。在示例性的隔离的供应生态系统中,机架中机箱管理者或者用户设备可以利用机架中的相互连接的硬件库存的机架内通信网络。初始化机架内网络包括标识在机架内用于配置硬件库存的网络参数以不包括外部网络基础设施。机箱管理器或者用户设备可以执行引导服务以经由对机架TOR交换机的直接连接促进引导。应预期到,所选择的硬件库存(例如,机架中的刀片)可以执行机箱管理器的功能性,如下面更详细地讨论的。还应预期到,用户设备可以经由附加交换机被连接到TOR,如下面更详细地讨论的。
消除机架内通信网络中的特殊的串行或者管理网络可以基于硬件库存的初步配置。硬件配置的初步配置可以包括特别地针对TOR和机架中串行设备的设置。TOR交换机可以被配置有静态管理IP以用于从机箱管理器或者用户设备访问。TOR交换机可以被配置为经由DHCP(动态主机配置协议)向自身提供IP。机架中串行设备可以被配置为经由DCHP请求IP。机箱管理器或者用户设备还可以通过串行被连接到TOR交换机以通过串行接口配置TOR交换机IP。应进一步预期到,在没有对任何网络的任何连接的情况下,可以使得直接串行连接TOR交换机可用。
在示例性实施例中,独立引导和供应工作流在服务器机架被连接到数据中心网络和管理基础设施(例如,网络骨架、串行聚合器)之前被运行,因此可以在独立的模式中验证服务器机架。另外,在交叉机架网络设备连接性被建立以提供简单的数据中心网络配置之前,运行供应工作流。特别地,配置VLAN和IP助手被延迟直到供应工作流之后。具有非默认配置的机架中硬件库存可以防止提供服务运行。在该方面,应预期到,硬件库存将具有初始出厂默认设置(例如,由OEM供应商所配置的)。供应工作流包括访问针对网络验证的TOR管理端口。如此,提供服务被提供对TOR上行链路的访问。在供应工作流完成时,引导框架过程可以跟随扩建数据中心中的硬件库存。
因此,在本文所描述的第一实施例中,提供了用于独立式引导硬件库存的计算机实现的方法。该方法包括使用机箱管理器初始化与机架中的硬件库存的机架内通信网络。该方法还包括在机架内通信网络中发起机箱管理器与机架中的硬件库存之间的通信以发现机架中的硬件库存。机架内通信包括从至少计算单元集合接收的流量。该方法进一步包括基于将期望的操作配置参数与实际的操作配置参数相比较以验证硬件库存的操作配置,所比较的操作配置参数的至少一部分基于模板文件和从计算单元集合所接收的数据分组内所携带的信息。
在本文所描述的第二实施例中,一个或多个计算机存储介质存储当由一个或多个计算设备使用时使得一个或多个计算设备执行用于独立引导机架硬件库存的方法的计算机可用指令。该方法包括确定机架顶(TOR)交换机是经由基于串行的连接可访问的。该方法还包括确定TOR交换机的配置是默认配置还是自定义配置,使得当TOR交换机处于默认配置时,供应服务继续为硬件库存的发现、验证和配置供应TOR交换机,并且使得当TOR交换机处于自定义配置时,供应服务终止供应TOR交换机。
该方法还包括初始化与机架中的TOR交换机和附加硬件库存的机架内通信网络。该方法进一步包括指示TOR交换机和串行访问设备以监听信号来发现被互连在TOR交换机与串行访问设备之间的计算单元集合。该方法还包括将串行访问设备配置为引导计算单元集合以递归地将流量发送到TOR交换机。该方法包括访问描述硬件库存的物理拓扑的模板文件并且通过将模板文件与从计算单元集合所接收的流量内所携带的信息相比较相应地验证计算单元集合的位置。
在本文所描述的第三实施例中,提供了用于执行用于独立式引导机架硬件库存的方法的计算机系统。该计算机系统包括机架。该机架包括驻留在机架内的至少一个网络设备。该至少一个网络设备选自:(a)机架顶(TOR)交换机,其用于能过基于网络的连接发送数据分组;和(b)串行访问设备,其用于在接收到基于串行的连接上的指令时调用数据分组的生成。该系统进一步包括插入机架内的刀片集。该刀片集包括被配置为在分别地接收到电力时单独地生成数据分组一个或多个计算单元。该系统还包括电力分布单元(PDU),其用于选择性地向刀片集供电。
该系统包括至少一个提供服务设备,提供服务设备选自以下各项之一:内置机箱管理器或者所选择的刀片,其经由基于网络的连接通信地被耦合到TOR交换机;和用户设备,其经由基于网络的连接通信地被耦合到TOR交换机、经由基于串行的连接通信地被耦合到串行访问设备。该内置机箱管理器和用户设备被配置为执行供应。供应包括(a)发现网络设备和该组刀片;和(b)基于将期望的操作配置参数与实际的操作配置参数相比较来验证硬件库存的操作配置,所比较的操作配置参数的至少一部分基于模板文件和从计算单元集合所接收的数据分组内所携带的信息,。应预期到,在一个实施例中,用户设备可以是计算单元集合内的计算单元,其中所选择的计算单元被配置为执行本文所描述的供应操作。
已经简要地描述本发明的实施例的概述,下面描述在其中可以实现本发明的实施例的示例性操作环境以便提供针对本发明的各方面的一般上下文。初始地参考图1,特别地,用于实现本发明的实施例的示例性操作环境被示出并且一般地被指定为计算设备100。计算设备100仅是适合的计算环境的一个示例并且不旨在提出关于本发明的使用或者功能性的范围的任何限制。计算设备100也不应当被解释为具有与所图示的部件中的任何一个或者组合有关的任何依存性或者要求。
可以在计算机代码或者机器可用指令(包括计算机可执行指令(诸如正由计算机或者其他机器(诸如个人数据助理或者其他手持式设备)执行的程序模块))的一般上下文中描述本发明。一般地,包括例程、程序、对象、组件、数据结构等的程序模块指代执行特定任务或者实现特定抽象数据类型的代码。可以在各种系统配置中实践本发明,包括手持式设备、消费者电子产品、通用计算机、更多的专业计算设备等。本发明还可以实践在分布式计算环境中,其中任务由通过通信网络链接的远程处理设备执行。
参考图1,计算设备100包括直接或者间接地耦合以下设备的总线110:存储器112、一个或多个处理器114、一个或多个呈现部件116、输入/输出端口118、输入/输出部件120和示例性的电源122。总线110表示什么可以是一个或多个总线(诸如地址总线、数据总线或者其组合)。虽然出于简洁的缘故图1的各种框被用线示出,但是实际上,描绘各种部件不是这样清楚的,并且隐喻地,线将更准确地是灰色并且模糊的。例如,可以将呈现部件(诸如显示设备)认为是I/O部件。而且,处理器具有存储器。我们认识到这样是本领域的本质,并且重申图1的示图仅是可以结合本发明的一个或多个实施例使用的示例性计算设备的说明。未在诸如“工作站”、“服务器”、“膝上型电脑”、“手持式设备”等的类别之间进行区分,因为全部被预期在图1的范围内并且参考“计算设备”。
计算设备100通常包括各种计算机可读介质。计算机可读介质可以是可以由计算机设备100访问的任何可用介质并且包括易失性和非易失性介质、可移除和不可移除介质二者。以示例而非限制的方式,计算机可读介质可以包括计算机存储介质和通信介质。
计算机存储介质包括以任何方法或者技术实现的用于诸如计算机可读指示、数据结构、程序模块或者其他数据的信息的存储的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪速存储器或其他存储器技术、CD-ROM、数字通用光盘(DVD)或其他光盘存储、磁带盒、磁带、磁盘存储或其他磁性存储设备或可以被用于存储期望信息并且可以由计算设备100访问的任何其他介质。计算机存储介质不包括信号自身。
通信介质通常实现计算机可读指示、数据结构、程序模块或者经调制的数据信号(诸如载波或者其他传输机制)中的其他数据并且包括任何信息传递介质。术语“经调制的数据信号”意指具有以在信号中编码信息的方式设定或改变的其特点中的一个或多个的信号。以示例而非限制的方式,通信介质包括有线介质(诸如有线网络或直接有线连接)和无线介质(诸如声学、RF、红外和其他无线介质)。以上任何组合还应当被包括在计算机可读媒体的范围内。
存储器112包括以易失性和/或非易失性存储器的形式的计算机存储介质。该存储器可以是可移除的、不可移除的或者其组合。示例性硬件设备包括固态存储器、硬盘驱动器、光盘驱动器等。计算设备100包括从各种实体(诸如存储器112或者I/O部件120)读取数据的一个或多个处理器。呈现部件116将数据指示呈现给用户或者其他设备。示例性呈现部件包括显示设备、扬声器、打印部件、振动部件等。
I/O端口118允许计算设备100逻辑地被耦合到包括I/O部件120的其他设备,其中的一些可以内置。说明性部件包括麦克风、操纵杆、游戏板、卫星盘、扫描器、打印机、无线设备等。
可以在数个阶段中执行用于建立硬件的库存与数据中心的云计算结构之间的互操作的端到端引导过程。用户设备连同硬件库存、数据中心和/或其他网络设备协调一致以形成各种生态系统,其各自实现引导过程的一个或多个阶段。引导过程的阶段被描述在2012年1月30日提交的并且题为AUTOMATED BUILD-OUT OF A CLOUD-COMPUTING STAMP的专利申请序列号13/360,876中,其以其整体内容并入本文。
一般地,端到端引导框架提供综合自动化端到端过程以发现、证实和配置设备、机架和数据中心以使得云计算结构的引导和部署能够管理硬件库存和网络设备。在比较中,本文所描述的实施例使用针对机架中的硬件库存的发现、验证和配置的独立供应操作来自动化独立供应生态系统的硬件库存的独立引导。例如,与具有包括指定导致机架的硬件库存的初始设置的硬件库存的初始设置的供应工作流的独立引导过程相比较,端到端引导过程可以包括指定导致生成部署结构网络所需要的逻辑/物理配置的硬件库存的初始设置。
机箱管理器或者用户设备可以执行供应服务以促进供应根据本文所描述的实施例的硬件库存。如此,供应工作流可以获得关于硬件库存的初始配置的理解以验证硬件库存的初始配置,确保硬件库存独立于数据中心基础设施,并且特别是数据中心网络部件,与期望的硬件布局(例如,设备位置、IP地址、VLAN和布线)相符合。
在一个实施例中,应预期到,硬件库存中的所选择的刀片可以被配置用于执行供应工作流。从机架中的多个机箱管理器中选择的机箱管理器还可以被选择用于执行供应工作流。刀片或者机箱管理器可以基于领导选举机制被选择。领导选举机制定义用于标识被用于执行供应工作流的所选择的刀片或者机箱管理器的程序和例程。领导选举机制可以基于刀片或者机箱管理器到机架(例如,TOR交换机)内的物理耦合或者布线,使得其区分刀片或者机箱管理器并且使其容易地可标识为领导。在另一实施例中,领导选举机制可以是领导选举协议(例如,经由广播)。通过示例,领导选举协议过程可以将刀片或者机箱管理器指定为用于提供供应的领导。如此,硬件库存内的多个刀片或者机箱管理器可以被配置为执行检测哪个刀片或者机箱管理器是被指定在供应角色中使用的供应刀片或者机箱管理器的方法。在该方面,刀片可以执行如本文所描述的机箱管理器或者用户设备的提供功能。
参考图2,图2图示了根据本发明的实施例的高层供应工作流。初始地,在步骤210处,可以为供应工作流准备硬件库存的初始配置。通过示例,基于模板文件,可以标识针对机架的硬件库存。模板文件可以包括针对硬件库存的特定SKUs。供应工作流将基于指定的硬件库存的原始设置准备初始配置作为在验证期间咨询的模板文件。初始地,原始设备制造商(OEM)被期望(例如,作为订货合同的一部分)在运输硬件库存之前证实设备间布线。进一步地,OEM可以被期望以采用提供描述安装在硬件库存的设备内的配置和/或软件的属性的货单的工具。布线验证和软件属性货单被维持与硬件库存相关联以用于帮助适当的硬件库存的选择。
在实际的示例性场景中,针对硬件库存的顺序可以由管理员自动地或者手动地发起以补偿存储/计算能力不足。在一个实例中,发起顺序包括生成具有围绕用于满足性能不足的设备集(例如,设备、机架和软件)的非特定数据的表格(例如,XML文档)。初步值可以由管理员自动地或者手动地被输入到该表格,其中初步值反映数据中心特定细节(例如,VLAN范围、端口范围和IP地址)或者自定义的拓扑模式。拓扑模式定义硬件库存的软件和网络设备的类型、数量和布线模式并且指示被用于运行设备的附加信息(例如,机架的数目、VLAN范围、端口的数目和支持资源)。
在输入值时,表格可以被转换为符号表示。符号标志用作设备(例如,设备)和它们之间的路由(例如,布线)的高级逻辑蓝图。例如,符号表示可以指示哪些设备被分组在公共VLAN内。
符号表示可以被发送到OEM、顾客或者管理员--基于场景--以选择适当的硬件库存。在一个实例中,适当的硬件库存选择包括将符号表示与在OEM处与硬件库存相关联维持的布线验证和/或软件属性清单相比较。在选择适当的硬件库存时,则可以通过顾客或者管理员经由提供给OEM的供应服务使用供应工作流检查所选择的硬件库存。在实施例中,在硬件库存到达数据中心时在递送站处,在OEM切换之前发生的供应服务还可以在装运之前在工厂被运行。该早期检查可以检测在运输期间可以已经引入到硬件库存的任何问题。
在从OEM运送之后,在收到硬件库存的交付时,则管理员可以视觉地验证设备和设备的布线满足符号表示。进一步地,管理员可以视觉地检查硬件库存的布线(例如,串行和网络电缆连接性)基于检查确定硬件库存的实际值(例如,端口数目、IP地址、VLAN成员和设备位置),并且利用实际值替换/转换被输入在符号表示内的初步值。除了通过管理员的手动检查之外,如果针对网络设备的驱动器是可用的,则检查可以自动化,其中自动化可以被用于根据符号表示规格配置网络设备。具有在引导过程期间替换或者转换为从递送的硬件库存开采的实际值的初步值的该符号表示在本文中被称为“模板文件”。如下面更完全地讨论的,模板文件被用于指示用户设备如何被连接到硬件库存并且提供硬件库存被适当地配置的保证。
配置准备可以进一步包括标识IP地址的列表以分配到硬件库存。IP地址可以被用于对来自具有可路由的非冲突的IP地址的硬件库存的动态主机配置协议(DHCP)请求作出反应。应预期到,机架中机箱管理器或者用户设备可以执行提供服务以提供机箱管理器或者用户设备的操作系统中的应用接口协议以促进供应工作流。如此,初始配置准备通常涉及标识针对存储在模板文件中的硬件库存的初始逻辑资源。
在框220处,回答来自硬件库存的DHCP请求。针对机架中的串行设备DHCP请求可以被特别地回答。用户设备可以从TOR MAC表收集串行设备(例如,DIGI网关设备)的MAC地址。MAC地址可以被添加到供应服务(例如,Windows Deployment Services-WDS)作为用于配置IP地址的合格候选。特别地,来自串行设备的DHCP请求可以利用动态地分配的IP地址回答来与用户设备建立连接性。待被用于回答来自硬件库存的DHCP的IP地址和子网掩码可以被添加到供应服务。如本文进一步讨论的,硬件库存的不同的独立式提供生态系统中的机箱管理器和用户设备可以执行特别地为其架构规定的以支持本发明的实施例的操作。
在步骤230处,发现、验证并且配置硬件库存。特别地,可以证实到一个或多个PDU的串行和/或网络连接。在使用用户设备的架构中,独立于机箱管理器的电源分配单元(PDU)设备然后被配置为使用来自串行设备的串行访问的静态IP,并且然后发现和验证网络设备,并且布线检查可以被实现在硬件库存上。在实施例中,应预期到,PDU设备可以基于DHCP接收IP。应进一步预期到,可以实现与TOR交换机、串行访问设备和PDU相关联的IP的静态配置,使得静态配置信息被接收并且因此设备被访问。在该方面,硬件库存可以基于多个不同的技术进行配置,包括通过集成机箱管理器或者用户设备的串行访问、DHCP或者静态配置信息。机箱管理器或者用户设备然后可以使用集成机架机制(例如,到TOR交换机的网络连接)与机架顶(TOR)交换机通信或者用户设备可以经由基于串行的连接和基于网络的连接与机架顶(TOR)交换机和网络设备的串行访问设备通信。
进一步地,供应工作流可以涉及通过促进TOR交换机和/或串行访问设备选择性地引起硬件设备(例如,处理器、处理单元、计算设备、服务器和插入机架中的刀片)将流量发送到用户设备用于分析的连接中的一个或多个发送指示并且可以涉及PDU的使用(例如,与机箱管理器集成的PDU或者独立的PDU)以选择性地使设备电力循环以重置其状态。验证硬件库存采用从硬件设备携带到机箱管理器或者用户设备的数据分组。供应工作流可以涉及解析数据分组的内容(例如,有效载荷和报头)以确定硬件库存的内部连接、位置、缺少、配置。
在实施例中,供应工作流还可以将特定工作流、工具等发送到各种设备和/或刀片以执行设备/刀片自身内的硬件和/或软件组件(例如,BIOS和设备固件)的验证、更新和/或配置。在其他实施例中,供应工作流可以执行用于证实具有设备/刀片的部件是功能的并且满足预定要求的组件的“烟雾测试”。进一步地,供应工作流可以标识用于记录和最终使用的设备/刀片的模型、制造商和固件版本。
在实施例中,供应工作流进一步涉及发现机架内的刀片的布线模式,并且能过预定义模板文件验证布线模式,并且批准刀片配置。实际上,供应刀片有助于确保机架内的任何延时布线问题或者硬件问题(例如,物理缺陷缺少部件、部件的无效版本或者不适当的配置)被检测到并且被解决,从而确保数据中心内的刀片的合并将不利地影响正由数据中心提供给运行在其上的服务的实时底层支持。
在硬件库存的供应期间,机箱管理器或者用户设备请求聚集在硬件库存中的计算设备(例如,物理机器和/或虚拟机器)的状态。硬件库存表示计算设备或者其他设备(例如,网络、PDU和串行设备)。请求状态可以涉及将请求分别通信到运行在计算设备上的代理,并且作为回报接收到指示计算设备的状态的健康信息。
本文所描述的实施例预期其中硬件库存可以被认为是由机箱管理器或者用户设备不可到达的(例如,不可操作的或者断开的)场景。如果出于任何原因机箱管理器或者用户设备不能够到达特定计算设备,则报告机制(例如,提供服务的模块或者部件)提供用于管理不可到达的硬件库存的程序和例程。例如,机箱管理器或者用户设备可以发出指示硬件库存是不可到达的警报。一旦将硬件库存识别为不可到达的,则机箱管理器或者用户设备可以发起自动修复程序。在实施例中,自动修复程序包括至少针对不可到达的硬件库存触发的本文所描述的验证步骤和报告机制。
供应工作流验证包括验证驻留在硬件库存内的部件的配置设置并且根据期望的硬件库存的物理拓扑(例如,被提供在模板文件内)交叉参考所检测的硬件库存的物理拓扑(例如,部件之间的链接和设备之间的布线)。如此,验证的步骤确定硬件库存是否被适当地配置。硬件库存的验证进一步包括:通过请求串行访问设备选择性地向其驱动电力(经由PDU)操纵到刀片的电力流(接通和断开);从操纵的刀片发送的流量收集信息;从在流量内发送的数据分组的内容提取信息(例如,刀片的MAC地址);并且通过根据模板文件评价所提取的信息和执行验证来验证刀片的位置和布线。
在向刀片选择性地驱动电力的示例中,机箱管理器可以对馈送未知/无效硬件库存的刀片的一系列端口断开电力。然后,机箱管理器可以操作为PDU以对链接到对象刀片的所选择的端口接通电力。然后,机箱管理器可以读取来自从当前发送流量的对象刀片正发送的数据分组的MAC地址。因此,当所选择的端口符合模板文件的期望端口时,验证对象刀片的连接。除了验证用于从PDU接收电力的所选择的端口之外,验证的步骤可以进一步涉及可以确定哪个端口——在分配给未知的硬件库存的刀片的一系列端口内——被连接到对象刀片的TOR交换机。通过标识将接收正从对象刀片传送的数据分组的端口范围的对象端口做出该确定。
现在将参考图3和图4讨论支持发现、验证和配置硬件库存的网络和硬件设备的硬件库存的独立式引导提供生态系统(“提供生态系统”)。一般地,图3描绘了图示用于发现、验证和配置机架中的硬件库存310的拓扑的第一类型的提供生态系统300的图形表示,同时图4描绘了图示的用于发现、验证和配置机架中的硬件库存410的拓扑的第二类型的供应生态系统400的图形表示。
如所图示的,供应生态系统300包括用户设备320,其通信地与硬件库存310的部件耦合。通信耦合被组织为基于网络的连接和基于串行的连接。基于串行的连接涉及经由串行网关设备340用户设备320与串行访问设备312之间的通信路径,其中串行网关设备320负责适当地将来自用户设备310的指示分布到适当的串行访问设备312(例如,通过处理从用户设备320流出的数据分组内所携带的地址)。应预期到,当不包括串行网关设备340时,串行访问设备312可以被连接到316和/或314。
基于网络的连接涉及经由交换机330用户设备320与top-of-rack(TOR)交换机316之间的通信路径,其中交换机330负责将数据分组从TOR交换机适当地递送到用户设备310(例如,聚集来自多个网络设备的数据分组)。应当注意,也可以经由串行网关设备340完成与TOR交换机316的通信。供应生态系统300的实施例可以不包括对现有基础设施的链接。因此,当在如在图3中所指示的操作中时,提供生态系统可以与现有基础设施的剩余部分隔离。这样,供应生态系统300以限制向用户设备320与硬件库存310之间的相互通信发消息的自含式方式操作以便确保正被供应的硬件库存310之间的适当的隔离。该隔离在至少以下两个方面中是有用的:通过限制外部干扰在供应工作流期间提供更高的可靠性,并且确保现有基础设施内的任何当前地实况硬件未由供应工作流影响。
继续参考图3,提供生态系统300包括用于链接到并且控制硬件库存310的功能性的用户设备320。关于硬件库存310(例如,高密度机架),存在电力分布单元(PDU)314、计算单元/设备(例如,刀片318)和网络设备(例如,TOR交换机316、串行访问设备312)。在一个实施例中,PDU可以利用提供自主电力以及管理和监测能力的带外电源替换。以示例的方式,智能平台管理界面(IPMI)可以支持远程加电、断电、循环、硬重置、进行电力状态查询、执行脉冲诊断中断或者通过IPMI over LAN协议发起OS的软关断。来自DELL INCORPORATED的iDRAC和来自HP的集成式无人打点(Integrated Lights Out)(iLo)还可以支持包括电力管理的带外管理。
应当注意,每个机架可以存在附加的TOR交换机(例如,上和下TOR设备)。以示例的方式,可以存在后端TOR交换机。上/下TOR交换机可以被用于将物理机架组合为逻辑机架概念(例如,节省物理空间但是具有双倍密度)。利用本文所描述的实施例预期TOR交换机的其他变型和组合。进一步地,计算设备318被设计为执行计算/存储任务的处理器并且由OEM被配置为基于相应地接收到电力,单独地生成数据分组,同时PDU被设计为选择性地向计算设备318供电。TOR交换机316被配置用于通过基于网络的连接发送数据分组,同时串行访问设备312被配置用于在通过基于串行的连接接收到指示时调用数据分组的生成。在实施例中,串行访问设备312被配置为对机架内的设备(例如,PDU、TOR交换机和刀片)进行配置。
用户设备320包括被设计为驱动供应工作流的配置软件(例如,供应服务)。配置软件经由基于网络的连接(带内信道)通信地耦合到TOR交换机316并且经由基于串行的连接(带外信道)通信地耦合到串行访问设备312。在实施例中,供应工作流包括:发现网络设备(TOR交换机316和串行访问设备312)和刀片集(计算设备318);以及通过将数据分组内所携带的信息与描述硬件库存310的物理拓扑的模板文件相比较验证刀片集的位置。如上文所讨论的,在完成指定硬件库存360的初始设置的阶段时,则生成模板文件。
串行访问设备312进一步被配置为从配置软件接收指示,并且在处理指示时分别控制PDU 314。在一个实例中,控制PDU 314涉及向其传达指示。在接收并且读取指示时,PDU314可以被配置为将电力递送到计算单元318的至少一个所选择的刀片并且制止来自计算单元318的至少一个非选择的刀片的电力。作为响应,所选择的(一个或多个)刀片可以开始在TOR交换机316处聚集,并且随后在被路由到配置软件之前在交换机330处聚集的数据分组的生成。
另一方面,非选择的刀片将可能地放弃发送数据分组。因此,配置软件能够根据由指示所选择的刀片的位置与硬件库存内生成的数据分组的原始地址之间的比较,确认网络设备330、340和312、计算单元318和PDU 314之间的内部连接。此外,计算单元318可以被配置为通过串行输出发射数据到串行访问设备312,其然后能够验证从刀片到串行路径和到PDU 314的内部连接。
虽然已经描述网络设备330、340和312的各种不同的配置,但是应当理解并且领会,可以使用分布或者聚集消息的其他类型的适合的设备和/或机器,并且本发明的实施例不限于本文所描述的串行访问设备312和TOR交换机316。例如,单个串行访问设备可以被提供用于整个硬件库存机架310,其中串行访问设备充当到PDU 314的串行连接/接口,并且充当对刀片中的每个刀片的串行连接/接口。在另一实例中,串行访问设备和PDU可以被组合为单个设备(例如,机箱管理器),如下面更详细地讨论的。在又一实例中,可以利用具有以太网接口能力的专用刀片替换TOR交换机316。
因此,可以使用任何数目的网络设备执行发现和验证阶段,使得至少一个网络设备包括针对网络通信的带内能力并且至少一个网络设备包括针对串行通信的带外能力。或者,如果带外能力被采用在以太网上,那么次级网络交换机可以代替串行设备使用。这样,如果功能中的一个功能脱机,带内能力满足带外能力并且允许网络设备的调试和诊断,以及对计算单元318的持续访问。
本领域的普通技术人员将理解并且领会,图3中所示的生态系统300仅是用于执行供应工作流的阶段的环境的一个适合的部分的示例,其不旨在提出关于本文所描述的实施例的使用或者功能性的范围的任何限制。生态系统300也不应当被解释为具有与本文所图示的资源的任何单个资源或者资源的组合有关的任何依存性或者要求。进一步地,虽然出于简洁的缘故图3的各种框被用线示出,但是实际上,描绘各种部件不是这样清楚的,并且比喻地,线将更准确地是灰色并且模糊的。
硬件库存310包括经由基于串行的连接和/或基于网络的连接相互连接到用户设备320的各种设备/资源。如本文所描述的,该设备/资源可以包括软件组件(例如,被安装在网络设备内)以及有形硬件库存310和用户设备320。设备/资源可以以分布式方式跨越各种物理资源放置,因此,为了在其之间建立通信用户设备320可以通过发现和验证阶段识别设备/资源的位置。
提供生态系统300的示例性系统架构包括用户设备320和计算单元318。图3中所示的这些设备320和318中的每一个可以采取各种类型的计算设备的形式(诸如例如参考图1上文所描述的计算设备100)。仅以示例而非限制的方式,设备320和318可以是个人计算机、台式计算机、膝上型计算机、消费者电子设备、手持式设备(例如,个人数字助理)、各种服务器、刀片等。然而,应当注意,本发明不限于实现在这样的计算设备上,但是可以实现在本发明的实施例的范围内的各种不同的类型的计算设备中的任一个上。
通常地,设备320和318中的每一个包括或者链接到某种形式的计算单元(例如,中央处理单元、微处理器等)以支持运行在其上的部件的操作(例如,在接收到信号或者被供电时,则发起数据分组)。如本文所利用的,短语“计算单元”一般地指代具有处理能力和存储器的专用计算设备,其支持在其上的软件、应用和计算机程序的执行的操作软件。在一个实例中,计算单元被配置有有形硬件元件或者机器,其集成或者可操作地耦合到设备320和318以使得每个设备能够执行通信相关的过程和其他操作。
在另一实例中,计算单元可以涵盖耦合到由设备320和318中的每一个容纳的计算机可读介质的处理器(未示出)。一般地,计算机可读介质至少暂时地存储由处理器可执行的多个计算机软件部件。如本文所利用的,术语“处理器”不旨在是限制性的并且可以涵盖在计算能力中起作用的计算单元的任何元件。在这样的能力中,处理器可以被配置为处理指示的有形制品。在示例性实施例中,处理器可以涉及获取、解码/解译、执行和回写指示(例如,通过呈现运动模式的动画重建身体姿势)。
而且,除了处理指示之外,处理器可以将信息传送到其他资源和从其他资源传送信息,该资源与设备320和318集成或者被布置在设备320和318上。一般地,资源指代使得设备320和318能够执行特定功能的软件和硬件机制。仅以示例的方式,资源包括以下机制中的一项或多项:配置软件(例如,提供服务);模板文件;和驻留在计算单元318内的部件。
现在将参考图3讨论用于发现和验证生态系统300内的网络设备330、340和312和计算单元318(例如,刀片)的示例性供应工作流。初始地,配置软件尝试经由基于串行的连接的串行网关设备340获得对硬件库存310的访问权。一旦访问被获得,则做出链接到硬件库存310的串行访问设备(例如,串行访问设备312)的串行网关设备340端口的标识。然后,通过从所标识的端口基于串行的连接发送信号以发现串行访问设备312。根据模板文件交叉参考从所发现的串行访问设备312提取的信息。如上文更充分地讨论的,模板文件包括以下各项:拓扑模式,其表示期望设备(例如,设备330、340、316和312)的蓝本和其之间的期望布线;和硬件模式,其定义被期望驻留在计算单元318中的每个计算单元318内的部件。
在发现经由串行网关设备340串行访问设备312正确连接时,则配置软件可以通过基于串行的连接将指示分发到串行访问设备312。一旦由串行访问设备312处理,则分布的指示允许配置软件经由机架中的硬件库存的内部耦合访问TOR交换机316和PDU 314。在到达PDU 314时,则配置软件可以提供选择性地对计算单元318控制电力的指示。在实施例中,应当注意,在控制串行访问设备312和PDU 314之前,配置软件可以验证设备,可以验证这些设备上的软件(例如,确保固件和OS是支持的版本),并且可以将这些设备配置为针对由云服务的接受所要求的规格。
例如,选择性地控制电力可以涉及对计算单元318中的每个计算单元318关断电力,以模板文件中列出的计算单元318中的一个或多个为目标,并且对目标的计算设备接通电力。一旦电力被供应到目标的计算设备,则数据分组可以从目标的(一个或多个)计算设备生成并且发送。数据分组然后聚集在TOR交换机350处,其可以扫描用于从计算单元318接收数据分组所分配的一系列端口并且从端口范围中标识实际上接收数据分组的端口。而且,TOR交换机316可以标识先前分配到其的地址(例如,MAC地址或者IP地址)。一旦聚集该信息,则TOR交换机316在通过基于网络的连接经由交换机330将其路由返回到配置软件之前,可以将所标识的端口和/或所标识的地址附加到数据分组。
配置软件被设计为从正从硬件库存310发送的流量流捕获数据分组。进一步地,配置软件被设计为验证计算单元318。验证可以涉及以下步骤中的一个或多个:提取数据分组内所携带的信息(例如,目标的计算设备和TOR交换机316的地址,以及被标识为内部地耦合到目标的计算设备的TOR交换机316和串行访问设备312上的端口);并且将所提取的信息与模板文件相比较以确认内部耦合与针对适当的操作设置的拓扑模式和地址相匹配。适当的地址可以包括针对彼此之间的唯一性进行比较的部件的多个唯一标识符(例如,MAC/串行/资产编号/静态IP)。应预期到,唯一标识符可以简单地被采集以提供用于其他服务(例如,开账单或者开发票)并且特别地用于唯一地标识针对RMA或者人类调查研究的硬件库存。
进一步地,数据分组可以递送给配置软件提供对组件的洞察力的信息以及应用到目前驻留在目标的(一个或多个)计算设备上的部件的配置设置。可以将这些递送的配置设置与维持在模板文件的硬件模式内所维持的期望的配置设置相比较。当递送的配置设置不符合期望的配置设置时,可以促进目标的计算设备的重新配置。可以经由串行访问设备361或者经由TOR交换机350的网络连接执行该重新配置。
应当领会和理解,可以迭代地执行用于发现和验证网络和硬件设备的以上步骤,使得可以递归地以计算单元318和网络设备330、330和316为目标以连续地验证设备318、330、340和316中的每一个的位置和连接。因此,可以从简单地重复以上步骤提炼硬件库存310的整个布线模式。
在实施例中,在本文所描述的发现和验证步骤期间或者之后,可以进行重新配置或者初始地配置空白设备的程序。初始地,可以提供描述网络和接口设备的接口的驱动程序开发套件(DDK),其原始设备制造商(OEM)可以用来在递送之前实现硬件库存的网络和硬件设备内的驱动程序。例如,数据中心的服务提供商可以给OEM提供DDK,其中OEM根据DDK合同在适当的网络和硬件设备上安装驱动程序。在操作中,实现的驱动程序促进网络与硬件设备之间的相互作用并且允许配置软件通过向其发送指示控制串行访问设备312。
在验证发现阶段期间,可以检查网络和硬件设备内的这些驱动程序以及部件的其他属性。在实施例中,如果目前已经安装,则检查可以标识安装在网络和硬件设备上的固件和/或操作系统(OS)的类型。如果目前安装的固件和/或OS的类型关于模板文件是不适当的,则调用重新配置程序。在示例性实施例中,重新配置程序通过实现以下工作流执行:刷新目前安装的固件和/或OS;并且部署维护OS,其中维护OS允许快速的安装并且确保适当的驱动程序和部件出现在网络和硬件设备上以便完成验证。在一个实施例中,用户设备310是可以进一步促进实现引导过程的部署和集成阶段的配置软件。
参考图4,图示了用于执行如参考图3所描述的独立引导硬件库存的方法的供应生态系统400。特别地,提供生态系统400包括硬件库存410、机箱管理器420、TOR交换机416和刀片418。机箱管理器420在机箱管理器内具有集成的PDU和串行设备,其执行供应工作流的供应操作。如上文所讨论的,实现可以包括被选择和/或被配置为执行供应操作的硬件库存中的刀片。供应操作可以与参考用户设备320、串行访问设备312和PDU 314讨论的供应操作类似。在该方面,还可以被集成到硬件库存的物理机架框架中的机箱管理器410以集成的方式提供PDU、串行设备和用户设备的功能。机箱管理器420的集成功能性有利地提供独立式硬件库存,其具有在不需要附加硬件或者配置的情况下执行供应操作的机箱管理器420。
特别地,机箱管理器320被配置为执行机箱管理器上的操作系统内的配置软件(例如,提供服务)。应预期到,配置软件可以是机箱管理器文件系统(诸如安装文件(例如,图像文件)或者应用文件)的一部分,其与机箱管理器的操作系统运行使得机箱管理器自动地具有对用于执行供应工作流的资源的访问权。例如,文件系统包括对硬件库存的电力分布和串行访问的提供操作的支持。在操作系统中运行的配置软件可以被配置为当机架接收到电力时自动地运行。在该方面中,硬件库存410可以在很少或者没有附加人类介入、硬件或者部署的情况下操作。供应服务可以在工厂地板、在递送时间或者在硬件替换时自动地执行。机箱管理器可以与电缆验证功能并行地执行硬件库存验证功能以最小化用于验证和修理的时间。
机箱管理器420被配置为使用不包括启用生产的硬件的供应服务执行供应工作流。具有机箱管理器420的供应生态系统400可以包括布线配置,其支持不包括启用生产的硬件。以示例的方式,布线配置可以包括插入TOR交换机自身中的TOR管理连接(例如,使用开放端口或者上行链路端口之一)。TOR带外(串行)连接可以被插入机箱管理器420中。机箱管理器可以通过管理网络、串行访问设备或者通过网络内的环回IP地址对TOR交换机进行配置。在具有多于一个机箱管理器的实施例中,TOR连接可以特别地插入指定的第一机箱管理器。指定的第一机箱管理器被配置为经由TOR管理端口支持供应服务以便开始布线检查和验证操作。如上文所讨论的,机箱管理器还可以连接到次级网络并且获得到独立于TOR交换机的机架中的OOB信道。机箱管理器可以通过次级网络对TOR交换机进行配置。应预期到,单个机箱管理器或者多个机箱管理器可以支持机架内的所有硬件库存。
进一步地,机架中的硬件库存410被配置有工厂默认凭证,使得未经由供应服务没有错误地验证启用生产的硬件。在该方面,机箱管理器420明确地检查默认凭证,如下面所讨论的。应预期到,在如本文所讨论的独立供应工作流完成时,生产服务可以操作以基于验证用于集成到生产中的机架。另外,生产服务还可以经由机箱管理器使用验证服务,例如以扩展验证和RMA能力。如此,生产服务可以支持验证、RMA并且以可扩展的方式包含硬件库存。此外,提供生态系统可与每个机箱管理器320一起扩展。特别地,每个机箱管理器可以被配置为充当独立DHCP/预启动执行环境(PXE)/小型文件传输协议(TFTP)。用于动态地分布网络配置参数(诸如针对接口和服务的IP地址)的DHCP、用于启动硬件库存的PXE和支持供应生态系统中的硬件库存之间的配置或者启动文件的自动化传送的TFTP。每个机箱管理器可以被配置有RACK中的硬件库存310的SKU信息。在组装时,SKU信息可以被安装在机箱管理器中。
虽然已经描述硬件库存的各种不同的配置,但是应当理解并且领会,可以使用虑及增加的存储/计算能力的其他类型的适合的机器和在机器之间路由流量的和适合的设备,并且本发明的实施例不限于本文所描述的生态系统300和400的布局。即,各种其他类型的设备的物理拓扑可以出现在由实施例考虑的硬件库存310和410内。
伴随不同的拓扑,模板文件可以对应地变化,使得用于交叉引用和验证的程序可以适于布线中的修改(网络模式)和设备中的改变(硬件模式)。因此,与每次对待供应的新硬件库存310或者410的物理拓扑做出修改时完全地重写验证代码相反,当用于验证网络和硬件设备的供应工作流在程序中保持不改变时,新模板文件简单地基于新硬件库存310或者410生成。因此,将供应工作流应用到目前存在的各种物理拓扑——以及尚未开发的那些物理拓扑——在未检修工作流的情况下的能力虑及供应超过布线和设备的标准的一致的设置的硬件库存。
参考图5A和图5B,示出了图示用于提供硬件库存的方法的流程图。特别地,方法用于提供控制供应工作流是否被调用以防止与外部基础设施的相互作用的机制。外部基础设施可以有效地指代支持数据中心的服务的生产中的一个或多个计算部件。在框510处,做出供应工作流(例如,提供服务)是否被禁止的确定。确定供应工作流是否被禁止可以基于硬件或者软件部件,其被配置为向用户设备或者机箱管理器指示供应工作流是应当还是不应当被实现。当确定供应工作流被禁止时,供应工作流未被执行,如在框514处所示——没有提供服务被执行。可以实现覆盖用于启用禁止的供应工作流以迫使供应服务被执行。进一步地,当确定供应工作流被启用时,附加步骤被执行以促进继续供应工作流。
在框516处,做出TOR交换机是否是经由基于串行的连接可访问的确定。当TOR交换不是经由基于串行的连接可访问的时,做出TOR交换机是否是经由基于网络的连接可访问的确定,如在框518中所描绘的。当TOR交换机是经由基于网络的连接可访问的时,可以根据本文所描述的方法执行供应工作流,如在框520处所描绘的——执行供应服务。当TOR交换机不是经由基于网络的连接可访问的时,做出硬件库存是否被供电的确定,如在框522处所描绘的。当硬件库存未被供电时,在框524处,执行操作以对硬件库存供电。在对库存中的硬件供电时或者在确定硬件库存被供电时,做出硬件库存是否可以接收DHCP分配的确定,如在框526处所描绘的。当确定硬件库存不能接收DCHP分配时,供应工作流未被执行,如在框514处所示。然而,当确定硬件库存可以接收DHCP分配时,可以在没有任何线检查的情况下执行硬件库存验证检查,如在框528处所描绘的。当单独的硬件库存或者硬件库存的子集需要在不执行整个机架验证的情况下被验证时,可以有利地执行没有线检查的硬件验证检查。
参考框516,当确定TOR交换机基于串行的连接是可访问的时,然后做出TOR交换机是否具有默认配置的确定,如在框530处所描绘的。当确定TOR交换机具有默认配置时,TOR交换机被配置用于提供服务,使得其继续框518处的供应工作流。默认配置还可以指代不包括生产基础设施配置的配置,使得TOR交换机和机架被安全地隔离。例如,可以执行密码比较来确定密码匹配是否存在,因为当匹配存在时,机架配置可能与生产配置相匹配并且此后可以采取适当的动作。然而,当确定TOR交换机不具有默认配置时,供应工作流未被执行,如在框514处所示——没有供应服务被执行。
在框520和528处的操作的完成时,并且参考图5B,框532描绘了供应工作流被完成并且在框534处继续执行可以选择性地包括一个或多个框536、538和540的供应服务后验证步骤。在框536处,使用与一个或多个接口相关联的一个或多个报告机制传递验证结果。验证结果包括硬件库存的验证的结果。例如,验证结果可以标识刀片、刀片的内部配置和刀片的布线。特别地,验证结果可以示出硬件库存中的特定部件是否根据模板文件中的期望的拓扑模式被配置。在该方面,可以突出期望的拓扑模式特征与硬件库存的实际的拓扑之间的差异。此外,可以完成以将实际的硬件拓扑与期望的拓扑对齐的任何配置改变还可以被包括在验证结果中。利用本发明的实施例预期验证结果的其他变型和组合。
使用可以包括与经由接口接收和传递验证结果相关联的例程或者程序的报告机制(例如,供应服务的模块或者部件)传递验证结果。验证结果可以被标识在用户设备或者机箱管理器处并且被传递用于经由与用户设备或者机箱管理器集成的接口显示。验证结果还可以被传递(例如,使用网络接口)为可以访问和评价的验证文件。应预期到,还可以使用硬件库存的照明接口(例如,LED)传递验证结果。例如,使验证中的一个或多个失败的任何硬件库存可以与具有所选择的颜色(例如,红色)的光指示器相关联以视觉地传递与硬件库存相关联的验证结果的结果和/或状态。利用本发明的实施例预期用于传递验证结果的接口的其他变型和组合。在传递验证结果时,可以终止供应工作流,如在框544处所描绘的——结束提供服务。
在框538处,做出确定退货授权(RMA)服务是否存在的确定。RMA服务可以包括标识硬件库存的过程以便返回硬件库存来接收退还、替换或者修理。RAM服务可以在供应服务处内部地关联或者其可以是经由在外部部件处支持RMA服务例程和程序的的供应服务可访问的。当确定RMA服务存在时,验证结果被上传到RMA服务,如在544处所描绘的。例如,不可到达的硬件库存可以被标识在验证结果中或者可以不被重新配置的不正确的配置可以被标识在验证结果中并且被上传到RMA服务中以进一步处理。在将结果上传到RMA服务时或者当确定RMA服务不存在时,供应工作流结束,如在框544处所描绘的——结束提供服务。
在框546处,做出任何硬件库存是否被复位的确定。特别地,在线检查器或者验证操作的首次运行之后,可以检测布线或者硬件库存问题。可以通过包括故障诊断和固定所标识的问题的人类调查解决硬件库存问题。在人类调查研究期间,可以影响(例如,复位)可能潜在地引起关于复位的硬件库存的问题的多个硬件库存设备(例如,网络设备或者刀片)。如此,复位的硬件库存可以由提供服务检测并且重新验证。当确定没有硬件库存被复位时,则供应工作流结束,如在框544处所描绘的——结束供应服务。当确定硬件库存被复位时,在框548处,利用将处理工作流返回到开始的TOR交换机执行硬件库存验证。特别地,供应工作流可以通过复位的行为检测替换或者经修改的设备以便重新启动供应工作流用于重新验证,如在图5A中所示。
现在转到图6,示出了图示用于机架中的独立式引导硬件库存的总体方法600的流程图。虽然术语“步骤”和/或“框”可以在本文中被用于暗示所采用的方法的不同的元素,但是除非并且除了明确地描述单独步骤的顺序之外,术语不应当被解释为隐含本文公开的各步骤中间或者之间的任何特定顺序。
初始地,硬件库存表示机架或者机架集,其中机架可以包括网络设备(例如,机架顶交换机和串行访问设备)和计算单元集合(例如,被插入机架中的刀片集)。刀片集通常地在串行访问设备与TOR交换机之间相互连接。
如在框610处所描绘的,方法600可以涉及使用机箱管理器初始化与机架中的硬件库存的机架内通信网络。该方法可以进一步在机架内通信网络中发起机箱管理器与机架中的硬件库存之间的通信以发现机架中的硬件库存,如在框620处所描绘的。机架内通信包括从计算单元集合接收的流量。有利地,机架内通信和硬件库存与外部基础设施安全地隔离。该方法包括机箱管理器验证硬件库存的操作配置。在实施例中,如在框630处所描绘的,机箱管理器访问描述硬件库存的拓扑模式的模板文件。在框640处,该方法包括基于将期望的操作配置参数与实际的操作配置参数相比较来验证硬件库存的操作配置,所比较的操作配置参数的至少一部分基于模板文件和从计算单元集合所接收的数据分组内所携带的信息。在实施例中,方法涉及通过将模板文件与从计算单元集合所接收的流量内所携带的信息相比较,相应地验证计算单元集合的位置。
现在转到图7,示出了图示用于独立式引导机架硬件库存的方法的流程图。方法700包括确定机架顶(TOR)交换机是经由基于串行的连接可访问的,如在框710处所描绘的。而且,方法包括确定TOR交换机的配置是默认配置还是自定义配置,如在框720处所描绘的。当TOR交换机处于默认配置时,供应服务继续为硬件库存的发现、验证和配置供应TOR交换机,并且当TOR交换机处于自定义配置时,供应服务终止提供TOR交换机。该方法可以进一步涉及初始化与机架中的TOR交换机和附加硬件的库存机架内通信网络,如在框730处所描绘的。
进一步地,如在框740处所描绘的,该方法包括指示TOR交换机和串行访问设备以监听信号来发现被相互连接在TOR交换机与串行访问设备之间的计算单元集合。如在框750处所描绘的,该方法包括将串行访问设备配置为引导计算单元集合以递归地将流量发送到TOR交换机。如在框760处所示,该方法进一步包括访问描述硬件库存的拓扑的模板文件。如在框770处所描绘的,该方法还包括基于将期望的操作配置参数与实际的操作配置参数相比较验证硬件库存的操作配置,所比较的操作配置参数的至少一部分基于模板文件和从计算单元集合所接收的数据分组内所携带的信息。
本文所呈现的实施例已经关于特定实施例进行描述,其在所有方面中旨在是说明性而非限制性的。在不脱离本发明的范围的情况下,备选实施例将对于本发明关于的本领域的普通技术人员而言变得明显。
从前述内容将看到,本发明一体地很适于达到上文所阐述的所有结论和目的以及对于结构明显并且固有的其他优点。
将理解到,某些特征和子组合具有实用性并且可以在不参考其他特征或者子组合的情况下被采用。这由权利要求的范围预期并且在权利要求的范围内。
Claims (20)
1.一种用于机架中独立引导硬件库存的计算机实现的方法,所述方法包括:
使用机架中计算设备初始化与机架中的硬件库存的机架内通信网络;
在所述机架内通信网络中发起所述机架中计算设备与所述机架中的所述硬件库存之间的通信,以发现所述机架中的所述硬件库存,其中机架内通信包括从计算单元集合接收的流量;以及
基于将期望操作配置参数与至少部分地基于以下项所确定的所述硬件库存的实际操作配置参数相比较,来验证所述硬件库存的操作配置:
访问描述所述硬件库存的拓扑的模板文件以验证所述机架中的所发现的硬件库存;
从至少一个所选择的计算单元接收数据分组;
使用所述数据分组以标识所述计算单元集合的操作配置参数;以及
将所标识的操作配置参数与所述硬件库存的所述期望操作配置参数相比较,所述期望操作配置参数的一部分从所述模板文件被检索。
2.根据权利要求1所述的方法,其中所述机架中计算设备是机箱管理器,其中所述机箱管理器被通信地耦合到所述硬件库存并且经由所述机架的物理结构框架被物理地耦合到所述硬件库存。
3.根据权利要求1所述的方法,其中所述机架中计算设备是从所述计算单元集合选择的计算单元,其中所述计算单元基于领导选举机制而被选择。
4.根据权利要求1所述的方法,其中初始化内部通信网络基于所述机架中计算设备接收电力针对所述机架而被自动触发。
5.根据权利要求2所述的方法,其中发起通信进一步包括:
将信号从所述机箱管理器发送到机架顶(TOR)交换机以发现所述硬件库存;
回答来自所述硬件库存的动态主机配置协议(DHCP)请求并且基于以下项分配IP地址:
收集针对所述硬件库存的介质访问控制(MAC)地址;
将所述MAC地址添加到所述DHCP服务器作为用于配置IP地址的合格候选;
将所述IP地址和子网掩码添加到所述DHCP服务器以用于回答DHCP请求;以及
利用动态地分配的IP地址回答来自所述硬件库存的DHCP请求;以及
建立所述硬件库存与所述机箱管理器之间的网络连接。
6.根据权利要求1所述的方法,进一步包括,经由报告机制,接收或传送与硬件库存相关联的状态和事件,其中所述状态和事件与供应服务验证结果有关。
7.根据权利要求1所述的方法,其中所述模板文件包括指定所述至少一个所选择的计算单元的期望位置的拓扑模式,并且其中所述拓扑模式由用户设备采用以验证所述硬件库存被连线,并且其中所述拓扑模式包括布线规则、设备配置或设备位置中的至少一项。
8.根据权利要求1所述的方法,其中所述模板文件包括指定哪些部件被期望驻留在所述至少一个所选择的计算单元内的硬件模式,并且其中所述硬件模式由用户设备采用以验证所述至少一个计算单元的内部配置。
9.根据权利要求1所述的方法,其中所述硬件库存表示所述机架中的部件,其中网络设备表示位于所述机架内的机架顶(TOR)交换机,其中所述计算单元集合表示被插入到所述机架内的刀片集合。
10.根据权利要求1所述的方法,其中所述硬件库存还包括串行访问设备和用户设备,其中刀片集合在所述串行访问设备和所述TOR交换机之间被互联,其中硬件库存机架内通信经由所述串行访问设备而被执行。
11.一种或多种计算机存储介质,其具有实现在其上的计算机可执行指令,所述指令当被执行时执行用于独立引导机架硬件库存的方法,所述方法包括:
确定机架顶(TOR)交换机经由基于串行的连接可访问;
确定所述TOR交换机的配置是默认配置还是自定义配置,其中当TOR交换机处于默认配置时,供应服务继续供应用于所述硬件库存的发现、验证和配置的所述TOR交换机,并且其中当TOR交换机处于自定义配置时,所述供应服务终止供应所述TOR交换机;
初始化与机架中的所述TOR交换机和附加硬件库存的机架内通信网络;
指示所述TOR交换机和串行访问设备监听信号以发现在所述TOR交换机与所述串行访问设备之间被互连的计算单元集合;
访问描述所述硬件库存的拓扑的模板文件;以及
基于将期望操作配置参数与实际操作配置参数相比较,来验证所述硬件库存的操作配置,所比较的所述操作配置参数的至少一部分基于所述模板文件和从所述计算单元集合接收的数据分组内所携带的信息。
12.根据权利要求11所述的介质,还包括:
在接收电力时,确定所述供应服务是否被启用以配置机架的硬件库存,其中当所述供应服务被启用以配置硬件库存时,所述供应服务继续供应所述硬件库存,以及
其中当所述供应服务未被启用以配置硬件库存时,所述供应服务终止供应所述TOR交换机。
13.根据权利要求11所述的介质,还包括经由报告机制接收和传递与硬件库存相关联的状态和事件,其中所述状态和事件基于所述供应服务验证结果。
14.根据权利要求13所述的介质,其中所述报告机制与用于传递验证结果的一个或多个接口相关联,其中所述验证结果基于从以下各项中的至少一项所选择的接口被传递:与机箱管理器集成的显示接口、用户设备的显示接口和网络接口。
15.根据权利要求11所述的介质,确定返回制造商授权(RMA)服务存在,使得与所述硬件库存相关联的验证结果被传递用于基于所述RMA服务的附加处理。
16.一种用于执行用于独立引导机架硬件库存的方法的计算机系统,所述计算机系统包括:
机架;
驻留在所述机架内的至少一个网络设备,其中所述至少一个网络设备从以下中被选择:
(a)机架顶(TOR)交换机,其用于通过基于网络的连接发送数据分组;以及
(b)串行访问设备,其用于在通过基于串行的连接接收到指令时调用所述数据分组的生成;
被插入在所述机架内的刀片集合,其中所述刀片集合包括所述一个或多个计算单元,所述一个或多个计算单元被配置为在分别接收到电力时单独地生成数据分组;
电力分配单元(PDU),其用于选择性地向所述刀片集合供电;以及
至少一个供应服务设备,所述供应服务设备从以下各项之一被选择:
内置机箱管理器,其经由所述基于网络的连接被通信地耦合到所述TOR交换机;
来自所述刀片集合的所选择的刀片,所选择的所述刀片经由所述基于网络的连接被通信地耦合到所述TOR交换机;以及
用户设备,其经由所述基于网络的连接被通信地耦合到所述TOR交换机、经由所述基于串行的连接被通信地耦合到所述串行访问设备,并且
其中所述内置机箱管理器、所选择的刀片和所述用户设备被配置为执行供应,所述供应包括:
(a)发现所述网络设备和所述刀片集合;以及
(b)通过将所述数据分组内所携带的信息与描述所述机架的拓扑的模板文件相比较,来验证所述刀片集合的操作配置,其中验证操作配置包括将所述数据分组内所标识的操作配置参数与所述硬件库存的期望操作配置参数相比较,所述期望操作配置参数的一部分从所述模板文件被检索。
17.根据权利要求16所述的系统,其中所述机架的供应不包括所述机架外部的任何串行或者管理网络,使得供应工作流基于隔离的布线配置独立于外部基础设施。
18.根据权利要求16所述的系统,其中不包括所述机架外部的所述串行或者管理网络基于所述机架的硬件库存的初步配置,其中所述TOR交换机被配置有静态管理IP以访问所述机箱管理器或者所述用户设备,并且所述硬件库存包括工厂默认设置。
19.根据权利要求16所述的系统,其中所述PDU和所述串行访问设备被集成到所述机箱管理器中,所述机箱管理器经由所述基于网络的连接被通信地耦合到所述TOR交换机,使得所述机箱管理器以集成的方式执行针对供应的供应服务。
20.根据权利要求16所述的系统,其中所述机箱管理器还被配置为独立地提供针对所述硬件库存的动态主机配置协议、预启动执行环境和小型文件传输协议。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/496,869 US9917736B2 (en) | 2012-01-30 | 2014-09-25 | Automated standalone bootstrapping of hardware inventory |
US14/496,869 | 2014-09-25 | ||
PCT/US2015/051291 WO2016053665A1 (en) | 2014-09-25 | 2015-09-22 | Automated standalone bootstrapping of hardware inventory |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106716926A CN106716926A (zh) | 2017-05-24 |
CN106716926B true CN106716926B (zh) | 2020-01-24 |
Family
ID=55631264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580052029.7A Active CN106716926B (zh) | 2014-09-25 | 2015-09-22 | 硬件库存的自动化独立式引导电路 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP3198792B1 (zh) |
CN (1) | CN106716926B (zh) |
BR (1) | BR112017005212B1 (zh) |
WO (1) | WO2016053665A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107247596B (zh) * | 2017-06-22 | 2021-11-16 | 联想(北京)有限公司 | 开机方法、装置及电子设备 |
CN109787802B (zh) * | 2017-11-15 | 2022-04-29 | 阿里巴巴集团控股有限公司 | 一种资源操作方法及控制台 |
CN107943438A (zh) * | 2017-12-21 | 2018-04-20 | 国网河北省电力有限公司衡水供电分公司 | 无人值守变电站的办公优化方法 |
US10447539B2 (en) | 2017-12-21 | 2019-10-15 | Uber Technologies, Inc. | System for provisioning racks autonomously in data centers |
US11216047B2 (en) | 2018-10-11 | 2022-01-04 | Vertiv It Systems, Inc. | System and method for detecting relationship between intelligent power strip and device connected thereto |
CN111766797A (zh) * | 2019-04-02 | 2020-10-13 | 海盗船存储器公司 | 微控制器、存储模块及用于更新微控制器的韧件的方法 |
US11956164B2 (en) | 2022-04-29 | 2024-04-09 | Hewlett Packard Enterprise Development Lp | Remote management of a switch stack |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2339778A1 (en) * | 2009-12-28 | 2011-06-29 | Nxp B.V. | Configuration of bus transceiver |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL126552A (en) * | 1998-10-13 | 2007-06-03 | Nds Ltd | Remote administration of smart cards for secure access systems |
US7027820B2 (en) * | 2001-01-31 | 2006-04-11 | Hewlett-Packard Development Company, L.P. | Location data validation by static entities receiving location data items by short-range communication |
US8700187B2 (en) * | 2007-08-28 | 2014-04-15 | Consert Inc. | Method and apparatus for actively managing consumption of electric power supplied by one or more electric utilities |
US20100211656A1 (en) * | 2009-02-17 | 2010-08-19 | International Business Machines Corporation | Configuring A Blade Environment |
US8793351B2 (en) * | 2011-05-24 | 2014-07-29 | Facebook, Inc. | Automated configuration of new racks and other computing assets in a data center |
-
2015
- 2015-09-22 CN CN201580052029.7A patent/CN106716926B/zh active Active
- 2015-09-22 BR BR112017005212-1A patent/BR112017005212B1/pt active IP Right Grant
- 2015-09-22 EP EP15771003.9A patent/EP3198792B1/en active Active
- 2015-09-22 WO PCT/US2015/051291 patent/WO2016053665A1/en active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2339778A1 (en) * | 2009-12-28 | 2011-06-29 | Nxp B.V. | Configuration of bus transceiver |
Also Published As
Publication number | Publication date |
---|---|
BR112017005212A2 (pt) | 2017-12-12 |
CN106716926A (zh) | 2017-05-24 |
WO2016053665A1 (en) | 2016-04-07 |
EP3198792A1 (en) | 2017-08-02 |
BR112017005212B1 (pt) | 2024-01-16 |
EP3198792B1 (en) | 2018-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10700932B2 (en) | Automated standalone bootstrapping of hardware inventory | |
CN106716926B (zh) | 硬件库存的自动化独立式引导电路 | |
EP2904739B1 (en) | Discovering, validating, and configuring hardware-inventory components | |
KR101954480B1 (ko) | 클라우드-컴퓨팅 스탬프의 자동화된 구축 | |
US11611487B2 (en) | Model driven process for automated deployment of domain 2.0 virtualized services and applications on cloud infrastructure | |
EP2932387B1 (en) | Deploying a hardware inventory as a cloud-computing stamp | |
US10038594B2 (en) | Centralized management of access points | |
US11641308B2 (en) | Software defined networking orchestration method and SDN controller | |
CN109039788B (zh) | 网络设备的端口配置方法、装置和存储介质 | |
US10819575B2 (en) | System and method of configuring network elements | |
US20160036638A1 (en) | Provisioning | |
US10630542B2 (en) | Method for automatically initializing network device, remote server and network system using the same | |
CN113938378A (zh) | 云网环境中网络设备配置校验的方法、设备及介质 | |
CN105119772B (zh) | 一种c/s架构ipmi功能测试方法 | |
CN114008563B (zh) | 用于识别机架上的服务器并基于服务器的物理位置给服务器分配适当的ip地址的系统和方法 | |
WO2024089474A1 (en) | Method to efficiently update information regarding network infrastructure | |
CN118426685A (zh) | 集群部署方法和计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240717 Address after: American Texas Patentee after: HEWLETT PACKARD ENTERPRISE DEVELOPMENT L.P. Country or region after: U.S.A. Address before: Washington State Patentee before: MICROSOFT TECHNOLOGY LICENSING, LLC Country or region before: U.S.A. |
|
TR01 | Transfer of patent right |