CN109313583A

CN109313583A - 用于减小对软件定义的基础设施架构的静态和动态分片影响的方法和装置

Info

Publication number: CN109313583A
Application number: CN201780038718.1A
Authority: CN
Inventors: F.吉姆伯纳特; S.M.巴莱; D.里瓦斯巴拉冈; J.C.K.梁; S.普拉布哈卡兰; M.K.纳奇姆图; S.普蒂尔斯基
Original assignee: Intel Corp
Current assignee: Intel Corp
Priority date: 2016-11-17
Filing date: 2017-10-27
Publication date: 2019-02-05
Anticipated expiration: 2037-10-27
Also published as: EP3542270A1; CN109313583B; WO2018132148A1; EP3542270A4

Abstract

描述了用于减小软件定义的基础设施中的分片的技术。计算节点可以被配置成经由构造访问一个或多个远程资源，计算节点可以被配置成接收针对一个或多个远程资源的动态容许分片。计算节点可以被配置成监控一个或多个远程资源的性能。计算节点可以被配置成确定一个或多个远程资源的被监控的性能在由动态容许分片定义的阈值之外。如果一个或多个远程资源在阈值之外长达预先确定的时间段，或者以其他方式，则计算节点可以被配置成确定如此并且采取适当措施，诸如生成指示一个或多个远程资源的性能在由动态容许分片定义的阈值之外的消息。

Description

用于减小对软件定义的基础设施架构的静态和动态分片影响的方法和装置

相关申请

本申请要求下述各项的优先权：2017年7月20日提交的美国专利申请号15/655,846，其是2016年11月29日提交的美国临时专利申请号62/427,268的非临时申请；2016年11月17日提交的美国临时专利申请号62/423,727；2016年8月18日提交的美国临时专利申请号62/376,859；以及2016年7月22日提交的美国临时专利申请号62/365,969，其全部通过引用以其整体并入本文中。

本申请涉及2017年7月20日提交的题为“Methods and Apparatus for CompositeNode Malleability for Disaggregated Architectures”的共同未决的美国申请序列号15/655,855；2017年7月20日提交的题为“Methods and Apparatus for Composite NodeCreation and Management Through SDI Partitions”的共同未决的美国申请序列号15/655,864；2017年7月20日提交的题为“Methods and Apparatus for SDI Support forFast Startup”的共同未决的美国申请序列号15/655,872；以及2017年7月20日提交的题为“Methods and Apparatus for SDI Support for Automatic and TransparentMigration”的共同未决的美国申请序列号15/655,874；其中的每一个通过引用以其整体并入本文中。

背景技术

在数据中心中执行的应用可以使用一组资源以便实现某个目标（例如，处理由用户实行的数据库查询）。应用可能对来自在特定数据中心内可用的全部资源的资源子集是敏感的。例如，数据中心内的数据库可以使用处理器、存储器、磁盘和构造（fabric），但是其可能对处理器和存储器可用性和性能最为敏感。可以通过添加诸如存储器和计算带宽和功率之类的资源来增加数据中心吞吐量。然而，增加诸如构造或磁盘之类的其他资源可能不对吞吐量提供直接益处。此外，存储器或计算带宽的减少可能对吞吐量具有负面影响。数据中心架构已经解决了下述问题：使用可以通过用户或者直接通过应用来提供的应用要求，将正确的的资源量映射到应用，以便进行适当的资源选择和分配。该过程可以包括选择一组资源，并且还确保了一定数量和质量（诸如所需服务质量（QoS））被保留以满足要求。然而，在许多数据中心架构（诸如使用软件定义的基础设施的那些架构）中，仍旧存在关于正确分配和管理资源的挑战。因此，用于管理数据中心架构内的资源的改进技术是合期望的。

附图说明

图1图示了根据实施例的系统的框图。

图2图示了根据实施例的系统的框图。

图3图示了根据实施例的系统的框图。

图4图示了根据实施例的系统的框图。

图5图示了根据实施例的系统的框图。

图6图示了根据实施例的逻辑流程。

图7图示了根据实施例的逻辑流程。

图8图示了根据实施例的逻辑流程。

图9图示了根据实施例的逻辑流程。

图10图示了计算机可读存储介质的实施例。

图11图示了数据中心的示例。

图12图示了机架的示例。

图13图示了数据中心的示例。

图14图示了数据中心的示例。

图15图示了交换基础设施的示例。

图16图示了数据中心的示例。

图17图示了载板的示例。

图18图示了数据中心的示例。

图19图示了数据中心的示例。

图20图示了载板的示例。

图21图示了数据中心的示例。

具体实施方式

各种实施例一般涉及用于管理软件定义的基础设施（SDI）系统的技术。特别地，一些实施例涉及使用静态或动态分区，其可以是基于机器学习技术而确定的或用户定义的，以满足已知应用在数据中心上运行的需要。

一般参考对本文中所使用的符号和术语，可以按照在计算机或计算机网络上执行的程序过程来呈现以下具体实施方式的部分。这些过程描述和表示被本领域技术人员用来向本领域其他技术人员最有效地传达他们工作的主旨。在此并且一般地，一个过程被设想为是导致期望结果的自相一致的操作序列。这些操作是需要对物理量进行物理操纵的那些操作。通常，尽管不一定，但这些量采取电信号、磁信号或光信号的形式，其能够被存储、传递、组合、比较以及以其他方式操纵。这证明了有时主要地出于一般使用的原因，将那些信号称为比特、值、元件、符号、字符、术语、数字等等是方便的。然而，应当注意的是，全部这些和类似的术语要与适当的物理量相关联并且仅仅是被应用于那些量的便捷标注。

此外，这些操纵经常以术语（诸如添加或比较）来指代，该操纵通常与人类操作者实行的智力操作相关联。然而，在形成一个或多个实施例的部分的本文中所描述的任何操作中，在大多数情况下，人类操作者的这样的能力不是必需的或期望的。而是，这些操作是机器操作。用于实行各种实施例的操作的有用机器包括：通用数字计算机，其由存储在其内的根据本文中的教导所编写的计算机程序选择性地激活或者配置；和/或包括针对所需目的专门构造的装置。各种实施例还涉及用于实行这些操作的装置或系统。这些装置可以针对所需目的而被专门构造，或者可以结合通用计算设备。对于各种各样的这些机器所需的结构将根据给出的描述而表现。

本文中描述的设备可以是各种各样类型的计算设备中的任何计算设备，包括但不限于：服务器、工作站、数据中心、膝上型计算机、超极本®计算机、台式计算机、智能电话等等。

在各种实施例中，前面提到的处理器可以包括各种各样商业可得的处理器中的任何处理器，包括但不限于英特尔® Celeron®、Core (2) Duo®、Core (2) Quad®、Corei3®、Core i5®、Core i7®、Atom®、Itanium®、Pentium®、Xeon®或XScale®处理器。此外，这些处理器元件中的一个或多个可以包括多核处理器（无论多核共存在同一管芯还是分离的管芯上），和/或具有某种其他种类的多处理器架构，多个物理分离的处理器通过该多处理器架构以某种方式链接。此外，在各种实施例中，任何数量的处理器元件110、210和/或410可以包括对可信执行环境（例如，英特尔CSE®、英特尔ME®、英特尔VT®、英特尔SGX®、ARM TrustedZone®等等）的支持以提供对敏感信息的处理和/或存储。

在各种实施例中，前文提到的存储装置可以基于各种各样的信息存储技术中的任何信息存储技术，可能包括需要不间断提供电力的易失性技术，以及可能包括需要使用可以是可移除的或可以不是可移除的机器可读存储介质的技术。因此，这些存储装置中的每一个可以包括各种各样类型（或类型组合）的存储设备中的任何存储设备，其包括但不限于：只读存储器（ROM）、随机存取存储器（RAM）、动态RAM（DRAM）、双倍数据速率DRAM（DDR-DRAM）、同步DRAM（SDRAM）、静态RAM（SRAM）、可编程ROM（PROM）、可擦除可编程ROM（EPROM）、电可擦除可编程ROM（EEPROM）、闪速存储器、聚合物存储器（例如，铁电聚合物存储器）、奥式存储器（ovonic memory）、相变或铁电存储器、硅氧化物氮氧化物硅（SONOS）存储器、磁卡或光卡、一个或多个单独的铁磁磁盘驱动器或者被组织到一个或多个阵列中的多个存储设备（例如，被组织到独立磁盘阵列的冗余阵列或RAID阵列中的多个铁磁磁盘驱动器）。应当注意的是，尽管这些存储装置中的每一个被描绘为单个块，但是这些中的一个或多个可以包括基于不同存储技术的多个存储设备。因此，例如，每个这些所描绘的存储装置中的一个或多个可以表示下述各项的组合：光学驱动器或闪速存储器读卡器，通过其可以在某种形式的机器可读存储介质上存储和传达程序和/或数据；用以在相对延长的时段内本地存储程序和/或数据的铁磁盘驱动器；以及能够实现对程序和/或数据的相对快速访问的一个或多个易失性固态存储器设备（例如，SRAM或DRAM）。还应当注意的是，这些存储装置中的每一个可以由基于相同存储技术的多个存储组件组成，但是由于使用中的特殊化的结果，这些存储组件可以被单独地维护（例如，一些DRAM设备被采用为主存储装置，而其他DRAM设备被采用为图形控制器的有区别的帧缓冲器）。

在各种实施例中，网络可以是可能地被限制成在单个建筑物或其他相对受限的区域内扩展的单个网络、可能地扩展相当大的距离的经连接的网络的组合，和/或可以包括互联网。因此，网络可以基于各种各样的互连技术（或其组合）中的任何互连技术，通过该互连技术可以交换信号，该互连技术包括但不限于：采用导电布线和/或光导布线的有线技术，以及采用红外、射频或其他形式无线传输的无线技术。因此，上文提到的接口可以包括提供必备功能性中的至少一些的电路以使得能够实现这样的耦合。然而，上文提到的接口还可以利用由处理器元件执行的指令序列而被至少部分地实现（例如，实现协议堆栈或其他特征）。在网络的一个或多个部分可以采用导电布线和/或光导布线的情况下，接口可以采用遵守各种各样行业标准中的任何行业标准的信令和/或协议，其包括但不限于RS-232C、RS-422、USB、以太网（IEEE-802.3）或IEEE-1394。替换地或附加地，在网络的一个或多个部分需要使用无线信号传输的情况下，这些接口中的对应接口可以采用遵守各种各样行业标准中的任何行业标准的信令和/或协议，其包括但不限于IEEE 802.11a、802.11b、802.11g、802.16、802.20（通常被称为“移动宽带无线接入”）；蓝牙；Zigbee；或者诸如具有通用分组无线电服务的GSM（GSM/GPRS）之类的蜂窝无线电话服务、CDMA/lxRTT、增强数据速率全球演进（EDGE）、演进仅数据/优化（EV-DO）、数据和语音演进（EV-DV）、高速下行链路分组接入（HSDPA）、高速上行链路分组接入（HSUPA）、4G LTE等。应当注意的是，尽管接口被描绘为单个块，但是其可以包括可以基于不同信令技术的多个接口。在这些接口中的一个或多个将组件耦合到多于一个网络的情况下可能尤其是这种情况，其中每一个网络采用不同的通信技术。

现在参考附图，其中自始至终相同参考标号被用来指代相同要素。在以下描述中，出于解释的目的，阐述众多具体细节以便提供对其透彻理解。然而，可能显而易见的是，可以在没有这些具体细节的情况下实践新颖的实施例。在其他情况下，以框图形式示出已知的结构和设备以便促进其描述。意图提供透彻的描述，以使得充分描述在权利要求的范围内的全部修改、等价方式和替换方式。

附加地，可以对诸如“a”、“b”、“c”之类的变量做出引用，这些变量被用来表示其中可以实现多于一个组件的组件。重要的是要注意，不一定需要存在多个组件，并且另外在实现多个组件的情况下，它们不需要是相同的。而是，使用变量来引用附图中的组件是为了呈现的方便和清楚而进行的。此外，如在本申请中和在权利要求中所使用的，由术语“和/或”结合的项目列表可以意指所列项目的任何组合。例如，短语“A、B和/或C”可以意指：A、B、C；A和B；A和C；B和C；或者A、B和C。如在本申请中和在权利要求中使用的，由术语“......中的至少一个”结合的项目列表可以意指所列项目的任何组合。例如，短语“A、B或C中的至少一个”可以意指：A；B；C；A和B；A和C；B和C；或者A、B和C。

图1图示了根据实施例的系统的框图。系统100可以是SDI架构，其中资源可以由应用来定义，并且可以在逐应用的基础上根据一组可用资源来创建复合节点（compositenode）。在一些数据中心中，针对应用的资源选择和分配可以通过资源管理器来完成，该资源管理器可以与协调器（orchestrator）分离地操作或者在协调器内操作。传统架构可以由一组静态平台或节点Ns = {Nl, ... ,Nm}组成，其中资源管理器可以基于特性、属性和/或要求分配到应用。每个节点可以包括一组具有一定特性（例如，性能、容量等）的资源。例如，数据中心可以由具有不同类型资源的不同节点同时组成。

即将描述的数据中心架构可以基于SDI，诸如在图1中图示的架构。在SDI架构中，可以在复合节点的顶部上执行应用，该复合节点可以由SDI管理器102（例如，在一些示例性实施例中，是机架规模设计Pod管理器）动态地创建，或者在一些实施例中基于用户或应用指令来创建。这些复合节点（其可以由从平台解聚并且分布在数据中心的不同部分中的不同资源组成）可以被虚拟化为应用并且被示为隔离的和“本地的”资源。

一般来说，SDI架构可以向协调器104和系统软件堆栈104暴露诸如存储器池118、存储池120和资源池122之类的一组资源池，每一个都包括给定资源的一个或多个节点。基于用户请求或应用请求，协调器104可以请求SDI管理器102基于那些要求来构成复合节点。构成的节点可以由SDI管理器102定义（如本文中详细描述的）并且返回到协调器104。一旦构成的节点由SDI管理器102定义并且由协调器104接收，应用可以被引导并且被部署在构成的节点上，该构成的节点可以包括经由构造116连接的计算载板106和来自存储器池118、存储池120和资源池122的一个或多个资源。虽然图示了三个示例性池，但是可以领会的是，可以在各种实施例中使用更多或更少个池。此外，资源池122可以包括一个或多个数据中心资源，诸如例如现场可编程门阵列（FPGA）。计算载板106可以包括一个或多个组件，诸如主机构造互连/接口（HFI）节点108、MEM存储器节点110、CORES处理节点112和高速缓存代理（CA）节点114，其均可以与本文中描述的实施例中的一个或多个相一致。

在实施例中，（一个或多个）CA节点可以是节点内的一致性代理，其处理来自同一节点内的核心的存储器请求，并且确保数据以一致的方式而被维持在域中。归属代理（HA）可以是负责处理来自CA的存储器请求的节点集群，并且可以担任用于存储器地址空间的部分的归属（一个管芯可以具有多个归属，该多个归属具有分布式地址空间映射）。取决于从其请求数据的地址空间，请求可以从节点的本地存储器的地址空间来履行，统一路径互连（UPI）代理（以前被叫做QPI或KTI）可以将请求路由到同一一致域内的另一处理器的地址空间，或者请求可以从与在一致域外面的通过主机构造接口（HFI）与处理器相关联的地址空间来履行。通过UPI连接的全部处理器可以属于同一一致域。一个系统可以由一个或多个一致域（其是通过构造互连所连接的全部一致域）来组成。例如，高性能计算系统（HPC）或数据中心可以由可以使用构造116彼此通信的N个集群或服务器来组成。使用构造116，每个一致域可以将一些地址区域暴露给其他一致域。在一些实施例中，构造互连允许映射不同一致域之间的存储器范围的地址。

图2图示了根据实施例的系统的框图。如在图2内图示的，SDI系统200（相对于图1具有相同编号的元件）可以包括在计算载板206上运行的应用201。如图示的，应用201正运行在构成的节点上，其可以由SDI管理器202定义为包括计算载板206、来自存储器池218的三个存储器节点、来自存储器池220的四个存储节点以及来自资源池222的两个资源节点。一旦创建了复合节点，可以在节点中引导OS，并且应用可以使用聚合资源开始执行，如同它们在物理上处于同一节点中的那样。

在SDI架构中，诸如218、220和222之类的资源可以跨数据中心分布，并且因此同一类型的资源（被暴露为复合节点的本地资源）可以示出非统一访问。该非统一性可以被称为资源分片：应当提供某种性能（例如，延迟和带宽）的资源可能由于它们在数据中心中的位置而提供较低性能。分片可能表现为异质性效应（如下文图示和描述的），或者表现为距离效应（例如，计算载板远离所选资源）。本文中描述的技术可以使用对SDI架构的一组扩展来减小分片对应用的影响。本文中描述的技术可以致力于至少两种类型的分片：动态的（例如，由于SDI构造负载或资源利用）和静态（例如，资源关于计算护板的物理位置）。静态分片可能由对于资源的不同位置所引起。使资源遍布系统分配而不是在一起分配在若干个节点中可能导致延迟的增加，从而影响性能。动态分片可能被分配资源的地点所影响，并且是由系统的状态所引起的，或者，在更精细的粒度下，由节点（或资源被共享之处的任何物理实体）所引起，即其由特定共享的资源的负载所引起。动态分片可能受分配的影响，因为给定节点被分配的资源越靠近，将在它们的性能上共享的影响越小。

本文中描述的技术致力于分片以允许应用和/或下层软件堆栈来向SDI管理器指定针对某种类型资源的性能要求，以使得数据中心中的备用资源可以被用来满足那些性能要求。此外，本文中描述的技术引入了QoS概念，容许动态分片（tolerated dynamicfragmentation），其涉及静态分片随时间的推移如何改变以及架构如何动态地定义复合节点以满足这些要求。SDI架构可以通过创建复合节点以及将隔离中（从应用的视角）的解聚资源进行关联来实现某种程度的QoS。然而，一些现有SDI架构共享促进对这些解聚资源的访问的资源。例如，访问解聚存储器暗示构造在多个计算载板之间共享，连接存储器服务器的HFI也可以被共享。还可能的是，被示为复合节点的一个组件的资源（即，存储器）实际上由多个池提供的多个资源组成（即，SDI架构具有托管在单独机架中或同一机架的抽屉（drawer）中的四个存储器服务器）。

如上文描述的分片，可以在不考虑IP SLA的情况下而是关于静态分片初始地分配资源。在需要建立IP SLA并且可以实施QoS的情况下，监控动态分片。本文中描述的一些技术可能目标在于维持良好的性能，同时改善资源利用，或者以不同的方式，改善资源利用而不影响性能。

图3图示了根据实施例的系统300的框图。系统300可以包括与上文描述的图2类似的元件和相同编号。除了图2的元件之外，系统300图示了两个存储器机架318和322的延迟。如示出的，作为示例，机架318的延迟和带宽分别是20 ns和12 GB/秒。在另一示例中，机架322的延迟和带宽分别是90 ns和8 GB/秒。如示出的，应用301可以正在复合节点上运行，该复合节点正在利用来自机架318和机架322二者的资源。在该示例中，由于机架318和322之间的延迟和带宽上的差异，可能负面影响应用性能。性能上的减速可能引起在应用运行时间期间跨节点的构造拥堵。

图4图示了根据实施例的系统400的框图。系统400可以包括与图3类似的元件和编号，外加以减小静态和/或动态分片的影响为目标的元件，如上文描述的。在一些实施例中，SDI管理器402可以允许与复合节点相关联的动态容许分片（DTF）的规格。例如，当组装复合节点时，DTF可以被提供给计算载板406。在一些实施例中，可以由应用401使用接口来提供DTF。在其他实施例中，应用401可以经由接口请求资源，并且诸如SDI管理器402或协调器404之类的另一组件可以确定DTF并且提供给计算载板406。在一些实施例中，DTF可以是一定范围的被用于每一个资源的应用所容许的所测量的动态距离，以及离差（dispersion），其可以使用不同度量来定义，该度量诸如是标准偏差、四分位差范围（IQR）等等。例如，可以按照延迟（时间的单位）或带宽来测量动态距离。作为示例而不是限制，应用可以指定针对存储器的容许分片是处于：（1）[300 ns，1200 ns]之间，并且在对于延迟而言与复合节点相关联的不同存储器池之间的标准偏差为100 ns；或者（2）[2 GB/秒，8 GB/秒]之间，并且对于带宽而言不同存储器池之间的标准偏差为0.5 GB/秒。在该范围内，最差的边界（延迟的上边界和带宽的下边界）可以被用作阈值来标记在其之后可能需要采取进一步动作的限度。最好的边界（延迟的下边界和带宽的上边界）可以被用作指示来例如使SDI管理器知道改进的资源不是必需的，这是因为那可能需要更昂贵的SLA而并不提供更好性能。在节点分片的情境中，动态容许分片可以被看作是用以指定QoS的机制。换言之，其允许控制与构成的节点相关联的静态分片随时间的推移如何改变并且可以限制架构的动态性质的影响。

分片优化器415可以被包括在计算载板406中，该计算载板406可以负责跟踪分片随时间的推移如何改变。分片优化器415可以跟踪与潜在地由多个池提供的复合节点相关联的每种资源类型的距离改变（延迟和带宽）。分片优化器415可以为每个资源和不同池跟踪两个度量，并且在适当时存储在计算机可读存储介质内。如果该距离在指定的动态容许分片之外，则分片优化器415可以联系系统层（OS或协调器404），确定采取什么动作，并且联系SDI管理器402，以便动态地改变复合节点定义以便履行要求。在一些实施例中，这一最后的选项可以由软件堆栈来启用、调谐和配置。

SDI管理器402可以被扩展有动态复合节点管理逻辑403和接口，其可以允许计算载板406协商复合节点上的动态改变。使用上文描述的技术，计算载板406可以决定增加或改变与复合节点相关联的物理资源的子集。SDI管理器402可以负责与计算载板406协商以增加违反容许分片的资源的量或者改变被用来满足载板的实际池。如果没有满足该请求，则SDI管理器402或计算载板406可以通知软件堆栈（应用401、OS或协调器404中的一个或多个）针对给定的复合节点的特定容许分片已经超过并且SDI不能对其进行满足。在一些实施例中，该逻辑可以被去激活，并且如果这样的话，协调器404可以实行类似的作用。

沿着这些线，在一些实施例中，构造416和协调器404可以被扩展成支持这些技术。例如，构造416可以包括被用来动态地扩展或改变与复合节点相关联的资源的一个或多个握手机制。同样地，协调器404可以包括分片感知策略405，其可以与本文中描述的去分片技术兼容。协调可以被扩展以便理解静态和动态分片的概念。提供给用户的资源选择策略以及接口可以适应与所描述的技术相关联的语义。因此，用户可以指定关于分片的要求，并且协调器可以在过程或资源选择策略中使用它们（例如，决定什么资源被用来创建复合节点）并且保证给定的QoS（例如，在运行时间期间检查动态容许分片没有被违反并且当它们发生时采取对应的动作）。

图5图示了根据实施例的系统的框图。系统1400图示了计算载板506和分片优化器515，其可以包括分片元数据513和监控数据511。分片元数据可以包括资源标识符、遥测信息、容许分片、定时器、容许偏差、资源类型、SDI池标识符和/或当前偏差。如先前陈述的，SDI管理器可以允许应用指定与复合节点关联的DTF。在一些实施例中，当组装复合节点时，DTF可以被提供给计算载板506。SDI管理器也可以被扩展有逻辑和接口，其允许计算载板协商复合节点上的动态改变。该接口可以允许计算载板要求增加特定资源类型（即，存储器）的量，并且移除将特定资源用于复合节点的特定池，并且请求找到在分片方面满足复合节点要求的新的一个池。

在实施例中，SDI管理器可以具有被存储在分片元数据513内的遥测数据，其可以提供给定资源很可能提供给复合节点的当前负载和性能，诸如带宽和/或延迟。作为使用该接口的示例指令，可以如下做出请求：“由存储器服务器池1提供的存储器是表现不佳的。找到可以提供1.7 GB/秒的范围内的存储器带宽的新的存储器服务器。”如果在架构上或者由协调器实现，先前的接口可以被分片优化器使用。在第二种情况下，假设的是正在复合节点中运行的代表协调器起作用的软件能够检测何时违反容许分片。此外，可以还可能的是向SDI管理器发送使用两个先前接口的请求。

分片优化器515可以负责监控和跟踪与复合节点相关联的全部资源的动态分片随时间的推移如何演化。在实施例中，每个资源可以具有关联的一组监控器（诸如动态资源监控器517），其可以定义被存储在分片元数据513内的容许分片。监控器可以包括：与被监控的资源相对应的ID；与该特定监控器相关联的遥测场；对于提供对该特定资源的访问的池中的每一个池容许的容许分片（即，节点1和节点2必须提供1.7 GB/秒的存储器带宽）；计时器，其指定逻辑必须等待多久来采取任何动作；或者计时器加附加逻辑（即，当容许分片被违反时生成SW中断或者使用动态资源提供方）；在全部不同的池当中所容许的偏差（即，由节点1提供的存储器BW中所容许的标准偏差，并且节点必须在1 GB/秒内）；资源类型；正提供该特定资源的SDI池/服务器（即，节点1和节点2正在提供存储器），以及在该特定时间跨全部资源提供方的当前偏差。在示例中，如果当前偏差高于容许分片长达多于“计时器”时间，则分片优化器515可以联系软件堆栈或动态资源提供方。在一些实施例中，可以使用当前性能而不是当前偏差，并且在其他实施例中，可以使用针对当前性能的当前偏差和度量二者。

如果容许分片被违反，则分片优化器515可以附加地采取对应的动作。如刚刚已经描述的，复合节点可以被配置成自动地尝试通过使用动态资源供应器519来解决问题，或者其可以向软件通知对软件堆栈的中断。在一些实施例中，动态资源供应器519可以是可选的。动态资源供应器519，一旦它从动态资源监控逻辑517得到关于特定DTF已经被违反的通知，它就可以与SDI管理器交互以修复该违反。在一些实施例中，分片优化器515可以向SDI管理器发送信息以使得其保持更新，以便改善其针对违反解决的未来决策。更新周期可以是可变的，并且可以取决于先前的信息是否过时或者构造或SDI管理器是否似乎拥堵。因此，SDI管理器具有用以改善对决策制定的启发性（heuristics）的总体形势（overallpicture），但是它不具有完美信息，以便将冗长性（verbosity）保持较低。

被包括在本文中的是一组流程图，其表示用于实行所公开的架构的新颖方面的示例性方法技术。虽然出于解释简单性的目的，例如，在本文中示出的以流程图或流程示图形式的一个或多个方法技术被示出和描述为一系列动作，要理解和领会的是，该方法技术受动作的次序的限制，因为根据其，一些动作可以以不同次序发生和/或与在本文中描述和示出的其他动作同时发生。例如，本领域技术人员将理解和领会的是，方法技术可以替换地被表示为诸如在状态图中的一系列互相联系的状态或事件。此外，并不是方法技术中说明的全部动作都对于新颖实现方式而言是需要的。

图6图示了根据实施例的逻辑流程600。如图示的，计算节点包括监控逻辑612和动态供应器614。计算节点602可以经由构造604和SDI管理器606连接到一个或多个解聚资源608和610，该解聚资源被图示为同一类型的单独资源。然而，可以领会的是，各种类型的资源可以被用在某些实施例中。

监控逻辑612可以被配置成监控如在本文中描述的可用资源直到发现分片违反601为止。可以在603处向动态资源供应器614通知该违反，并且在605处，动态资源供应器614可以向SDI管理器606委托有关是扩展还是重新映射受该违反影响的给定资源的决策。在一些实施例中，这可以是默认选项，因为SDI管理器606可以具有有关系统的总体状态的更多信息。然而，如下文描述的，动态资源供应器614可以在一些实施例中做出这样的决策。伴随该请求，计算节点602可以指示需要致力于的资源，使得可以实行多个默认动作中的一个来致力于该违反。例如，用于延迟违反的默认行为可以是重新分配更靠近计算节点602的资源，同时针对带宽违反的默认行为可以是实施QoS以保证带宽。此处，在两种情况下，由于缺少资源或者以其他方式，默认选项可能不是可行的，。因此，可能需要采取另一个（重新分配或者实施QoS），或者如果不可能满足要求则一个都不采取。如果没有可以采取的动作，则可以通知软件堆栈。

在一些实施例中，SDI管理器606可以负责当已经检测到违反时，确定要采取的动作，因为可以向SDI管理器606通知总体系统状态。在607处，SDI管理器606可以接受制定决策的责任。例如，用于决策制定的算法可以基于多个准则中的一个或多个：数据中心遥测数据、启发性、或复合节点要求。在实施例中，SDI管理器606可以决定改变未充分利用的其他复合节点，如果这有助于满足请求方的要求的话。如图示的，计算节点602可以发送性能数据以及请求，这是因为SDI管理器606可能不具有最为更新的数据。

在图6的示例中，SDI管理器606确定资源608应当在609处被释放，其在611处被资源608处理，并且在613处被资源608确认。在615处，可以由SDI管理器606将映射指令发送到资源610，其可以在617处被处理并且在619处被确认。在621和622处，一旦实行该操作，SDI管理器606可以经由动态供应器614利用确认向计算节点602进行响应，这可以标识采取的动作并且这可以导致从资源608到610的重新映射。

图7图示了根据实施例的逻辑流程700。在逻辑流程700（其包括与在图6内图示的元件相同编号的元件）中，计算节点702可以包括监控逻辑712和动态供应器714。计算节点702可以经由构造704连接到SDI管理器706以及资源708和710。使用本文中阐述的技术，监控逻辑712可以确定在701处已经发生了分片违反，并且在703处接收来自监控逻辑712的有关该违反的信息。在705处，例如，动态供应器714可以确定要实行资源的重新映射，以维持计算节点702所需要的DTF。在707处，重新映射指令可以被发送到SDI管理器706并且由SDI管理器706处理。

如上文描述的，动态供应器714可以决定要重新映射由给定池提供给另一池的资源。当动态供应器714确定最佳选项是重新映射或者因为所需要的DTF已经改变时，可以使用该选项。如图示的，动态供应器714可以要求SDI管理器706重新映射该特定资源。SDI管理器706可以决定资源需要被重新映射到什么池，或者可以接收来自动态供应器714的确定。在图7的示例中，动态供应器714确定资源708应当在705处被释放，其在709处经由SDI管理器706被发送，在711处被资源708处理，并且在713处被资源708确认。在715处，可以由SDI管理器706将映射指令发送到资源710，其可以在717处被处理并且在719处被确认。在721和722处，一旦实行该操作，SDI管理器706可以经由动态供应器614利用确认向计算节点702进行响应，这可以标识采取的动作并且这可以导致从资源708到资源710的重新映射。

图8图示了根据实施例的逻辑流程800。在逻辑流800中，计算节点803可以包括监控逻辑810和动态供应器812。计算节点802可以经由构造804连接到SDI管理器806以及资源808。使用本文中阐述的技术，监控逻辑810可以确定在801处已经发生了分片违反，并且在803处接收来自监控逻辑812的有关该违反的信息。如关于图6和7描述的，不是重新映射资源，而是动态供应器812可以决定需要增加针对特定池的资源量的扩展。当动态供应器812确定最佳选项是要扩展资源量时，例如当默认选项是扩展和/或需要快速响应时，可以使用该选项。

在805处，扩展指令可以由SDI管理器806从动态供应器812接收，其在807处可以由SDI管理器806处理。资源808可以在809处接收来自SDI管理器806的扩展指令，并且可以在811处处理该指令。正在被处理的资源扩展的确认可以在813处被SDI管理器806接收，在815处被动态供应器812接收以及在810处被监控逻辑810接收。

图9图示了根据实施例的逻辑流程900。在902处，包括一个或多个处理器电路的计算节点被配置成经由构造访问一个或多个远程资源，该计算节点可以被配置成接收针对一个或多个远程资源的动态容许分片。在一些实施例中，动态容许分片可以包括一定范围的动态距离，其可以按照一定范围的带宽和/或一定范围的延迟来呈现。此外，在一些实施例中，动态容许分片可以包括标准偏差。分片优化器组件可以被呈现在一些计算节点中，并且负责逻辑流程900的一个或多个部分。

在904处，计算节点可以被配置成监控一个或多个远程资源的性能。例如，计算节点可以被配置成监控一个或多个所监控的资源是否将要超过由动态容许分片定义的阈值带宽或延迟范围。在示例中，动态容许分片可以包括时间组件，并且可以监控资源以确定阈值是否被超过长达预先确定的时间段。此外，标准偏差可以被用来监控一个或多个远程资源的性能。

在906处，计算节点可以被配置成确定一个或多个远程资源的被监控的性能在由动态容许分片定义的阈值之外。如果远程资源中的一个或多个在阈值之外长达预先确定的时间段，或者以其他方式，计算节点可以被配置成确定如此并且采取适当措施，如在本文中描述的。

在908处，计算节点可以被配置成生成指示一个或多个远程资源的性能在由动态容许分片定义的阈值之外的违反消息。该违反消息可以标识特定资源和违反的类型（例如，超过带宽或延迟）。在一些实施例中，违反消息可以请求将资源重新映射到不同资源，和/或可以请求扩展现有的资源。可以领会的是，重新映射和扩展可以被单独地使用，或者彼此结合地使用以满足系统的需求。

在一些情况下，由于缺少资源或以其他方式，用于重新映射和/或扩展资源的请求可能被拒绝。在这些情况下，计算节点可以被配置成：接收关于下述的指示：一个或多个远程资源的性能不能被改变成在由动态容许分片定义的阈值内；向软件堆栈生成消息，该消息指示一个或多个远程资源的性能不能被改变成在由动态容许分片定义的阈值内。

图10图示了存储介质1000的实施例。存储介质1000可以包括一件制品。在一些示例中，存储介质1000可以包括任何非临时性计算机可读介质或机器可读介质，诸如光学、磁性或半导体存储装置。存储介质1000可以存储各种类型的计算机可执行指令，例如1002。例如，存储介质2700可以存储各种类型的计算机可执行指令，以使用本文中描述的一个或多个处理器和组件来实现在本文中描述的逻辑流程，诸如逻辑流程600、600、800和/或900。

计算机可读或机器可读存储介质的示例可以包括能够存储电子数据的任何有形介质，包括易失性存储器或非易失性存储器、可移除或不可移除存储器、可擦除或不可擦除存储器、可写或可重写存储器等等。计算机可执行指令的示例可以包括任何适合类型的代码，诸如源代码、编译代码、解释代码、可执行代码、静态代码、动态代码、面向对象的代码、视觉代码等等。实施例不限于此情境中。

图11图示了数据中心1100的概念性总览，该数据中心1100一般可以代表数据中心或其他类型的计算网络，可以根据各种实施例来在其中或者针对其实现本文中描述的一种或多种技术。如在图11中所示，数据中心1100一般可以包含多个机架，该机架中的每一个可以容纳包括相应的一组物理资源的计算装备。在图11中描绘的特定的非限制性示例中，数据中心1100包含四个机架1102A至1102D，其容纳包括相应的各组物理资源（PCR）1105A至1105D的计算装备。根据该示例，数据中心100的总的一组物理资源106包括分布在机架1102A至1102D当中的各组物理资源组1105A至1105D。物理资源1106可以包括多种类型的资源，诸如例如处理器、协处理器、加速器、现场可编程门阵列（FPGA）、存储器和存储装置。实施例不限于这些示例。

说明性数据中心1100在许多方面不同于典型的数据中心。例如，在说明性实施例中，在其上安置了诸如CPU、存储器和其他组件之类的组件的电路板（“载板（sled）”）是针对提高的热性能而设计的。特别地，在说明性实施例中，该载板比典型板更浅。换言之，该载板从前到后更短，冷却风扇位于后方。这减少了空气跨板上组件而必须行进的路径的长度。此外，载板上的组件比在典型电路板中间隔得更远，并且这些组件被布置成减少或消除遮蔽（即，一个组件在另一组件的空气流动路径中）。在说明性实施例中，诸如处理器之类的处理组件位于载板的顶侧，而诸如DIMM之类的近存储器（near memory）位于载板的底侧。由于该设计所提供的增强的空气流动，组件可以以比在典型系统中更高的频率和功率水平来操作，从而提高性能。此外，载板被配置成与每个机架1102A、1102B、1102C、1102D中的电源和数据通信线缆盲式（blindly）配合，从而增强了它们被快速移除、升级、重新安装和/或更换的能力。类似地，位于载板上的各个组件（诸如处理器、加速器、存储器和数据存储驱动器）被配置成由于它们彼此之间的增大的间隔而易于升级。在说明性实施例中，组件附加地包括硬件证明特征以证实其真实性。

此外，在说明性实施例中，数据中心1100利用支持包括以太网和Omni-Path的多个其他网络架构的单个网络架构（“构造”）。在说明性实施例中，载板经由光纤耦合到交换机，所述光纤提供比典型的双绞线布线（例如，类别5、类别5e、类别6等）更高的带宽和更低的延迟。由于高带宽、低延迟互连和网络架构，数据中心1100可以在使用中池化诸如存储器、加速器（例如，图形加速器、FPGA、ASIC等）以及数据存储驱动器之类的在物理上未聚集的资源，并以视需要为基础将它们提供给计算资源（例如，处理器），使计算资源能够访问池化资源，就如同它们是本地的一样。说明性数据中心1100附加地接收各种资源的使用信息、基于过去的资源使用来预测不同类型的工作负载的资源使用，以及基于该信息动态地重新分配资源。

数据中心1100的机架1102A、1102B、1102C、1102D可以包括促进各种类型的维护任务的自动化的物理设计特征。例如，数据中心1100可以使用被设计成机器人可访问的并且接受和容纳机器人可操纵的资源载板的机架来实现。此外，在说明性实施例中，机架1102A、1102B、1102C、1102D包括集成电源，其接收比通常对于电源来说的电流更高的电流。增加的电流使电源能够向每个载板上的组件提供附加的电力，使组件能够以高于典型频率的频率来操作。

图12图示了数据中心1100的机架1202的示例性逻辑配置。如在图12中示出的，机架1202一般可以容纳多个机架，这些载板中的每一个可以包括相应的一组物理资源。在图12中描绘的特定的非限制性示例中，机架1202容纳包括相应的各组物理资源1205-1至1205-4的载板1204-1至1204-4，该相应的各组物理资源中每一组构成被包括在机架1202中的总的一组物理资源1206的一部分。关于图11，如果机架1202代表例如机架1102A，那么物理资源1206可以对应于被包括在机架1102A中的物理资源1105A。在该示例的情境中，物理资源1105A因此可以由包括以下资源的相应的各组物理资源构成：机架1202的载板1204-1至1204-4中所包括的物理存储资源1205-1、物理加速器资源1205-2、物理存储器资源1204-3和物理计算资源1205-5。实施例不限于该示例。每个载板可以包含各种类型的物理资源（例如，计算、存储器、加速器、存储）中的每一个的池。通过使机器人可访问且机器人可操纵的载板包括未聚集的资源，每种类型的资源可以彼此独立地并且以其本身的优化刷新率而被升级。

图13图示了数据中心1300的示例，该数据中心1100一般可以代表可以根据各种实施例来在其中或者针对其实现本文中描述的一种或多种技术的一个数据中心。在图13中描绘的特定的非限制性示例中，数据中心1300包括机架1302-1至1302-32。在各种实施例中，数据中心1300的机架可以以限定和/或适应各种访问通路的方式进行布置。例如，如在图13中示出的，数据中心1300的机架可以以限定和/或适应各种访问通路1311A、1311B、1311C和1311D的方式进行布置。在一些实施例中，这种访问通路的存在一般可以使得诸如机器人维护装备之类的自动化维护装备能够物理地访问容纳在数据中心1300的各种机架中的计算装备并实行自动化维护任务（例如，更换有故障的载板、升级载板）。在各种实施例中，访问通路1311A、131IB、1311C和1311D的尺寸、机架1302-1至1302-32的尺寸和/或数据中心1300的物理布局的一个或多个其他方面可以被选择成促进这种自动化操作。实施例不限于此情境中。

图14图示了数据中心1400的示例，该数据中心1400一般可以代表可以根据各种实施例来在其中或者针对其实现本文中描述的一种或多种技术的一个数据中心。如在图14中示出的，数据中心1400可以以光学构造1412为特征。光学构造1412一般可以包括光学信令介质（例如光学布线）和光学交换基础设施的组合，数据中心1400中的任何特定载板可以经由该组合来向数据中心1400中的其他载板中的每一个发送信号（以及从数据中心1400中的其他载板中的每一个接收信号）。光学构造1412提供给任何给定载板的信令连接性可以包括到同一机架中的其他载板以及其他机架中的载板二者的连接性。在图14中描绘的特定的非限制性示例中，数据中心1400包括四个机架1402A至1402D。机架1402A至1402D容纳相应的成对载板1404A-1和1404A-2、1404B-1和1404B-2、1404C-1和1404C-2，以及1404D-1和1404D-2。因此，在该示例中，数据中心1400包括总共八个载板。经由光学构造1412，每个这样的载板可以具有与数据中心1400中的其他七个载板中的每一个的信令连接性。例如，经由光学构造1412，机架1402A中的载板1404A-1可以具有与机架1402A中的载板1404A-2以及分布在数据中心1400的其他机架1402B、1402C和1402D当中的其他六个载板1404B-1、1404B-2、1404C-1、1404C-2、1404D-1和1404D-2的信令连接性。实施例不限于该示例。

图15图示了连接性方案1500的概览，该连接性方案1500一般可以代表在一些实施例中可以在数据中心（诸如图11、13和14的示例数据中心1100、1300和1400中的任何数据中心）的各种载板之间建立的链路层连接性。可以使用以双模光学交换基础设施1514为特征的光学构造来实现连接性方案1500。双模光学交换基础设施1514一般可以包括交换基础设施，其能够根据多个链路层协议经由相同的统一的一组光学信令介质来接收通信，并且适当地交换此类通信。在各种实施例中，可以使用一个或多个双模光学交换机1515来实现双模光学交换基础设施1514。在各种实施例中，双模光学交换机1515一般可以包括高基（high-radix）交换机。在一些实施例中，双模光学交换机1515可以包括多层交换机，诸如四层交换机。在各种实施例中，双模光学交换机1515可以以集成硅光子学为特征，与常规交换设备相比，集成硅光子学使它们能够以显著减少的延迟交换通信。在一些实施例中，双模交换机可以是单个物理网络连线，其能够载送以太网或Onmi-Path通信，该以太网或Onmi-Path通信能够由双模光学交换机1515自动检测或者由Pod管理控制器来配置。这允许同一网络被用于云通信量（以太网）或高性能计算（HPC），通常为Onmi-Path或Infiniband。此外，并且在一些实例中，Onmi-Path协议可以载送Onmi-Path通信和以太网通信。在一些实施例中，双模光学交换机1515可以构成叶脊架构中的叶交换机1530，该叶脊架构附加地包括一个或多个双模光学脊交换机1520。注意的是，在一些实施例中，架构可能不是叶脊架构，但是可以是两层交换机架构以直接连接到载板。

在各种实施例中，双模光学交换机可以能够经由光学构造的光学信令介质接收携带互联网协议（IP分组）的以太网协议通信和根据第二高性能计算（HPC）链路层协议（例如，英特尔的Omni-Path架构，Infiniband）的通信两者。如在图15中反映的，关于具有与光学构造的光学信令连接性的任何特定的成对载板1504A和1504B，连接性方案1500因此可以经由以太网链路和HPC链路提供对链路层连接性的支持。因此，可以由单个高带宽、低延迟交换构造来支持以太网和HPC通信二者。实施例不限于该示例。

图16图示了根据一些实施例的机架架构1600的一般性概览，该机架架构1600可以代表图11至14中描绘的机架中的任何特定一个机架的架构。如在图16中反映的，机架架构1600一般可以以载板可以插入其中的多个载板空间为特征，每个载板空间可以经由机架访问区域1601而是机器人可访问的。在图16中描绘的特定的非限制性示例中，机架架构1600以五个载板空间1603-1至1603-5为特征。载板空间1603-1至1603-5以相应的多用途连接器模块（MPCM）1616-1至1616-5为特征。在一些实例中，当载板被插入到载板空间1603-1至1603-5中的任何给定一个空间中时，对应的MPCM可以与被插入的载板的配对的MPCM相耦合。该耦合可以将具有连接性的被插入的载板提供给该载板容纳于其中的机架的信令基础设施和电力基础设施两者。

被包括在要由机架架构1600容纳的类型的载板当中的可以是以扩展能力为特征的一个或多个类型的载板。图17图示了可以代表此类类型的载板的载板1704的示例。如图17中所示，载板1704可以包括一组物理资源1705以及MPCM 1716，该MPCM 1716被设计成当载板1704插入到载板空间（诸如图16的载板空间1603-1至1603-5中的任何）中时与配对的MPCM耦合。载板1704还可以以扩展连接器1717为特征。扩展连接器1717一般可以包括能够接受一种或多种类型的扩展模块（诸如，扩展模块1718）的插座、插槽或其他类型的连接元件。通过与扩展载板1718上的配对的连接器耦合，扩展连接器1717可以为物理资源1705提供对驻留在扩展载板1718上的补充计算资源1705B的访问。实施例不限于此情境中。

图18图示了机架架构1800的示例，该机架架构1800可以代表可以被实现以便为以扩展能力为特征的载板（诸如图17的载板1704）提供支持的机架架构。在图18中描绘的特定的非限制性示例中，机架架构1800包括七个载板空间1803-1至1803-7，其以相应的MPCM1816-1至1816-7为特征。载板空间1803-1至1803-7包括相应的主要区域1803-1A至1803-7A和相应的扩展区域1803-1B至1803-7B。关于每个此类载板空间，当对应的MPCM与插入的载板的配对的MPCM耦合时，主要区域一般可以构成载板空间的区域，其可以物理地适应插入的载板。扩展区域一般可以构成载板空间的区域，其可以物理地适应扩展模块，诸如图17的扩展载板1718（在插入的载板配置有此类模块的情况下）。

图19图示了根据一些实施例的机架1902的示例，其可以代表根据图18的机架架构1800实现的机架。在图19中描绘的特定的非限制性示例中，机架1902以七个载板空间1903-1至1903-7为特征，其包括相应的主要区域1903-1A至1903-7A和相应的扩展区域1903-1B至1903-7B。在各种实施例中，可以使用空气冷却系统来实现机架1902中的温度控制。例如，如在图19中反映的，机架1902可以以多个风扇1919为特征，该多个风扇1919一般被布置成在各种载板空间1903-1至1903-7内提供空气冷却。在一些实施例中，载板空间的高度大于常规的“1U”服务器高度。在此类实施例中，如与常规机架配置中使用的风扇相比，风扇1919一般可以包括相对慢的大直径冷却风扇。相对于以较高速度运行的具有较小直径的冷却风扇，以较低的速度运行具有较大直径的冷却风扇可以增加风扇寿命，同时仍然提供相同的冷却量。所述载板在物理上比常规的机架尺寸更浅。此外，在每个载板上布置组件以减少热屏蔽（即，不在空气流动的方向上串联地布置）。因而，更宽、更浅的载板允许设备性能的提高，因为由于改进的冷却（即，没有热遮蔽、设备之间的更多空间、针对更大散热器的更多空间等），设备可以以更高的热封套（例如，250W）操作。

MPCM 1916-1至1916-7可以被配置成为插入的载板提供对由相应的电力模块1920-1至1920-7供应的电力的接入，每个电力模块可以从外部电源1921提取电力。在各种实施例中，外部电源1921可以向机架1902递送交流（AC）电力，并且电力模块1920-1至1920-7可以被配置成将此类AC电力转换为要供应到插入的载板的直流（DC）电力。在一些实施例中，例如，电力模块1920-1至1920-7可以被配置成将277伏电力转换成12伏DC电力，以经由相应的MPCM 1916-1至1916-7提供给插入的载板。实施例不限于该示例。

MPCM 1916-1至1916-7还可以被布置成为插入的载板提供到双模光学交换基础设施1914的光学信令连接性，该双模光学交换基础设施1914可以与图15的双模光学交换基础设施1514相同或与其类似。在各种实施例中，被包含在MPCM 1916-1至1916-7中的光学连接器可以被设计成与插入的载板的MPCM中包含的配对的光学连接器耦合，以经由相应长度的光学布线1922-1至1922-7为此类载板提供与双模光学交换基础设施1914的光学信令连接性。在一些实施例中，每个此类长度的光学布线可以从其对应的MPCM延伸到在机架1902的载板空间外部的光学互连绝缘线束（loom）1923。在各种实施例中，光学互连绝缘线束1923可以被布置成穿过机架1902的支撑柱或者其他类型的负载承载元件。实施例不限于此情境中。由于插入的载板经由MPCM连接到光学交换基础设施，因此可以节省通常花费在手动地配置机架布线以适应新插入的载板的资源。

图20图示了根据一些实施例的载板2004的示例，其可以代表被设计用于与图9的机架1902结合使用的载板。载板2004可以以MPCM 2016为特征，该MPCM 2016包括光学连接器2016A和电力连接器2016B，并且被设计成与载板空间的配对的MPCM耦合（与将MPCM 2016插入到该载板空间中相结合）。将MPCM 2016与此类配对的MPCM耦合可以使电力连接器2016与配对的MPCM中包括的电力连接器耦合。这一般可以使载板2004的物理资源2005能够经由电力连接器2016和电力传输介质2024从外部源供应电力，该电力传输介质2024将电力连接器2016导电耦合到物理资源2005。

载板2004还可以包括双模光学网络接口电路2026。双模光学网络接口电路2026一般可以包括能够根据由图19的双模光学交换基础设施1914支持的多个链路层协议中的每一个通过光学信令介质进行通信的电路系统。在一些实施例中，双模光学网络接口电路2026可以能够进行以太网协议通信和根据第二高性能协议的通信二者。在各种实施例中，双模光学网络接口电路2026可以包括一个或多个光学收发器模块2027，每个光学收发器模块2027可以能够通过一个或多个光学通道中的每一个来发射和接收光学信号。实施例不限于此情境中。

将MPCM 2016与给定机架中的载板空间的配对的MPCM耦合可以使光学连接器2016A与配对的MPCM中包括的光学连接器耦合。这一般可以经由一组光学通道2025中的每一个在双模光学网络接口电路系统2026和载板的光学布线之间建立光学连接性。双模光学网络接口电路2026可以经由电学信令介质2028与载板2004的物理资源2005通信。除了用于提供改进的冷却并使能以相对较高的热封套（例如，250W）进行操作的载板上的组件的布置和载板的尺寸之外（如上面参考图19所描述的），在一些实施例中，载板可以包括一个或多个附加特征以促进空气冷却，诸如热管和/或散热器（布置成耗散由物理资源2005生成的热）。值得注意的是，尽管图20中描绘的示例载板2004没有以扩展连接器为特征，但是根据一些实施例，以载板2004的设计元件为特征的任何给定载板也可以以扩展连接器为特征。实施例不限于此情境中。

图21图示了数据中心2100的示例，数据中心2100一般可以代表可以根据各种实施例来在其中或者针对其实现本文中描述的一种或多种技术的数据中心。如在图21中反映的，可以实现物理基础设施管理框架2150A以促进对数据中心2100的物理基础设施2100A的管理。在各种实施例中，物理基础设施管理框架2150A的一个功能可以是要管理数据中心2100内的自动化维护功能，诸如使用机器人维护装备来服务物理基础设施2100A内的计算装备。在一些实施例中，物理基础设施2100A可以以先进的遥测系统为特征，所述遥测系统实行遥测报告，所述遥测报告足够鲁棒以支持物理基础设施2100A的远程自动化管理。在各种实施例中，由此类先进的遥测系统提供的遥测信息可以支持诸如故障预测/预防能力和容量规划能力之类的特征。在一些实施例中，物理基础设施管理框架2150A还可以被配置成使用硬件证明技术来管理物理基础设施组件的认证。例如，机器人可以在安装之前通过分析从与要安装的每个组件关联的射频标识（RFID）标签收集的信息来验证组件的真实性。实施例不限于此情境中。

如图21中所示，数据中心2100的物理基础设施2100A可以包括光学构造2112，其可以包括双模光学交换基础设施2114。光学构造2112和双模光学交换基础设施2114可以分别与图14的光学构造1412和图15的双模光学交换基础设施1514相同或与其类似，并且可以在数据中心2100的载板之间提供高带宽、低延迟、多协议连接性。如上文讨论的，参考图11，在各种实施例中，此类连接性的可用性可以使对诸如加速器、存储器和存储装置之类的资源进行解聚和动态池化是可行的。在一些实施例中，例如，一个或多个池化加速器载板2130可以被包括在数据中心2100的物理基础设施2100A当中，该物理基础设施2100A中的每一个包括加速器资源池——诸如例如协处理器和/或FPGA——其经由光学构造2112和双模光学交换基础设施2114而对其他载板全局可访问。

在另一示例中，在各种实施例中，一个或多个池化存储载板2132可以被包括在数据中心2100的物理基础设施2100A当中，该物理基础设施2100A中的每一个可以包括经由光学构造2112和双模光学交换基础设施2114而对其他载板可用全局可访问的存储资源池。在一些实施例中，此类池化存储载板2132可以包括固态存储设备（诸如固态驱动器（SSD））的池。在各种实施例中，一个或多个高性能处理载板2134可以被包括在数据中心2100的物理基础设施2100A当中。在一些实施例中，高性能处理载板2134可以包括高性能处理器池以及冷却特征（其增强空气冷却以产生达到250W或更高的较高热封套）。在各种实施例中，任何给定的高性能处理载板2134可以以扩展连接器2117为特征，所述扩展连接器2117可以接受远存储器扩展载板，使得对该高性能处理载板2134本地可用的远存储器与包括在该载板上的近存储器以及处理器解聚。在一些实施例中，此类高性能处理载板2134可以被配置有远存储器（使用包括低延迟SSD存储装置的扩展载板）。光学基础设施允许一个载板上的计算资源利用并未在位于数据中心中的同一机架或任何其他机架上的载板上聚集的远程加速器/FPGA、存储器和/或SSD资源。在上文参考图15描述的脊-叶网络框架中，远程资源可以位于距一个交换机跳跃或距两个交换机跳跃的距离。实施例不限于此情境中。

在各种实施例中，可以将一个或多个抽象的层应用于物理基础设施2100A的物理资源，以便定义虚拟基础设施，诸如软件定义的基础设施2100B。在一些实施例中，可以分配软件定义的基础设施2100B的虚拟计算资源2136以支持云服务2140的提供。在各种实施例中，可以对特定的各组虚拟计算资源1136进行分组以用于以SDI服务2138的形式供应给云服务2140。云服务2140的示例可以包括但不限于软件即服务（SaaS）服务2142、平台即服务（PaaS）服务2144以及基础设施即服务（IaaS）服务2146。

在一些实施例中，可以使用虚拟基础设施管理框架2150B来进行软件定义的基础设施2100B的管理。在各种实施例中，虚拟基础设施管理框架2150B可以被设计成结合管理针对云服务2140的虚拟计算资源2136和/或SDI服务2138的分配来实现工作负载指纹识别技术和/或机器学习技术。在一些实施例中，虚拟基础设施管理框架2150B可以结合实行此类资源分配来使用/咨询遥测数据。在各种实施例中，可以实现应用/服务管理框架2150C，以便为云服务2140提供QoS管理能力。实施例不限于此情境中。

更一般地，在本文中描述的设备的各种元件可以包括各种硬件元件、软件元件或其二者的组合。硬件元件的示例可以包括设备、逻辑设备、组件、处理器、微处理器、电路、处理器元件、电路元件（例如，晶体管、电阻器、电容器、电感器等等）、集成电路、专用集成电路（ASIC）、可编程逻辑设备（PLD）、数字信号处理器（DSP）、现场可编程门阵列（FPGA）、存储器单元、逻辑门、寄存器、半导体设备、芯片、微芯片、芯片集等等。软件元件的示例可以包括软件组件、程序、应用、计算机程序、应用程序、系统程序、软件开发程序、机器程序、操作系统软件、中间软件、固件、软件模块、例程、子例程、功能、方法、过程、软件接口、应用程序接口（API）、指令集、计算代码、计算机代码、代码段、计算机代码段、词语、值、符号或其任何组合。然而，确定是否使用硬件元件和/或软件元件来实现实施例可以根据任何数量的因素而变化，该因素诸如期望的计算速率、功率水平、耐热性、处理周期预算、输入数据速率、输出数据速率、存储器资源、数据总线速度和其他设计或性能约束，如对于给定实现方式所期望的那样。

可以使用表达“一个实施例”或“实施例”连同它们的衍生词来描述一些实施例。这些术语意指结合实施例描述的特定特征、结构或特性被包括在至少一个实施例中。短语“在一个实施例中”在本说明书的各种地方中的出现不一定全部指代同一实施例。此外，可以使用表达“耦合的”和“连接的”连同它们的衍生词来描述一些实施例。这些术语不一定意图作为彼此的同义词。例如，可以使用术语“连接的”和/或“耦合的”来描述一些实施例以指示两个或更多个元件彼此直接物理或电学接触。然而，术语“耦合的”还可以意指两个或更多个元件不彼此直接接触，但是还仍进行协作或者彼此交互。

在前述具体实施方式中，可以看到的是，出于使本公开流畅的目的，各种特征被一起组合在单个实施例中。本公开的方法不要被理解为反映下述意图：要求保护的实施例要求比在每个权利要求中明确记载的更多的特征。而是，如所附权利要求反映的，发明的主题在于比单个所公开的实施例的全部特征更少。因此，所附权利要求由此被并入到具体实施方式中，其中每个权利要求独立作为单独的实施例。在所附权利要求中，术语“包括”和“其中”分别被用作相应术语“包含”和“在其中”的平常语言等同方式。此外，术语“第一”、“第二”、“第三”等等仅仅被用作标注，并且不意图对它们的对象强加数字要求。

已经在上文描述的内容包括所公开的架构的示例。当然，不可能描述组件和/或方法技术的每个可想到的组合，但是本领域普通技术人员可以认识到，许多另外的组合和排列是可能的。因此，新颖的架构意图涵盖落入本公开的精神和范围内的全部这样的更改、修改和变化。

已经在上文描述的内容包括所公开的架构的示例。当然，不可能描述组件和/或方法技术的每个可想到的组合，但是本领域普通技术人员可以认识到，许多另外的组合和排列是可能的。因此，新颖的架构意图涵盖落入所附权利要求的精神和范围内的全部这样的更改、修改和变化。现在本公开转向提供各种示例实现方式。

示例1：一种软件定义的基础设施系统，其包括：计算节点，包括一个或多个处理器电路，被配置成经由构造访问一个或多个远程资源，该计算节点被配置成：接收用于一个或多个远程资源的动态容许分片；监控一个或多个远程资源的性能；确定一个或多个远程资源的被监控的性能在由动态容许分片定义的阈值之外；以及生成指示一个或多个远程资源的性能在由动态容许分片定义的阈值之外的消息。

示例2：如示例1的软件定义的基础设施系统，其中该动态容许分片包括一定范围的动态距离。

示例3：如示例2的软件定义的基础设施系统，其中该一定范围的动态距离表示一定范围的延迟。

示例4：如示例2的软件定义的基础设施系统，其中该一定范围的动态距离表示一定范围的带宽。

示例5：如示例2的软件定义的基础设施系统，其中该动态容许分片包括标准偏差。

示例6：如示例1的软件定义的基础设施系统，其中该计算节点包括被配置成监控一个或多个远程资源的性能的分片优化器。

示例7：如示例6的软件定义的基础设施系统，其中该分片优化器被配置成当一个或多个远程资源的性能在由动态容许分片定义的阈值之外长达多于预先确定的时间段时生成消息。

示例8：如示例1的软件定义的基础设施系统，其中该消息被生成为包括用于重新映射一个或多个远程资源的请求。

示例9：如示例1的软件定义的基础设施系统，其中该消息被生成为包括用于扩展一个或多个远程资源的请求。

示例10：如示例1的软件定义的基础设施系统，其中该计算节点被配置成：接收关于下述的指示：一个或多个远程资源的性能不能被改变成在由动态容许分片定义的阈值内；以及向软件堆栈生成消息，该消息指示一个或多个远程资源的性能不能被改变成在由动态容许分片定义的阈值内。

示例11：一种计算机实现方法，其包括：在软件定义的基础设施系统的计算节点处接收用于一个或多个远程资源的动态容许分片；由计算节点监控一个或多个远程资源的性能；由计算节点确定一个或多个远程资源的被监控的性能在由动态容许分片定义的阈值之外；以及由计算节点生成消息，该消息指示了一个或多个远程资源的性能在由动态容许分片定义的阈值之外。

示例12：如示例11的计算机实现方法，其中该动态容许分片包括一定范围的动态距离。

示例13：如示例12的计算机实现方法，其中该一定范围的动态距离表示一定范围的延迟。

示例14：如示例12的计算机实现方法，其中该一定范围的动态距离表示一定范围的带宽。

示例15：如示例12的计算机实现方法，其中该动态容许分片包括标准偏差。

示例16：如示例11的计算机实现方法，其中该计算节点包括被配置成监控一个或多个远程资源的性能的分片优化器。

示例17：如示例16的计算机实现方法，其中该分片优化器被配置成当一个或多个远程资源的性能在由动态容许分片定义的阈值之外长达多于预先确定的时间段时生成消息。

示例18：如示例11的计算机实现方法，其中该消息被生成为包括用于重新映射一个或多个远程资源的请求。

示例19：如示例11的计算机实现方法，其中该消息被生成为包括用于扩展一个或多个远程资源的请求。

示例20：如示例11的计算机实现方法，其中该计算节点被配置成：接收关于下述的指示：一个或多个远程资源的性能不能被改变成在由动态容许分片定义的阈值内；以及向软件堆栈生成消息，该消息指示一个或多个远程资源的性能不能被改变成在由动态容许分片定义的阈值内。

示例21：一种包括非临时性计算机可读存储介质的制品，该非临时性计算机可读存储介质存储用于由软件定义的基础设施系统的计算节点的处理电路系统执行的指令，该指令用于使计算节点进行以下操作：由计算节点接收用于一个或多个远程资源的动态容许分片；由计算节点监控一个或多个远程资源的性能；由计算节点确定一个或多个远程资源的被监控的性能在由动态容许分片定义的阈值之外；以及由计算节点生成消息，该消息指示一个或多个远程资源的性能在由动态容许分片定义的阈值之外。

示例22：如示例21的制品，其中该动态容许分片包括一定范围的动态距离。

示例23：如示例22的制品，其中该一定范围的动态距离表示一定范围的延迟。

示例24：如示例22的制品，其中该一定范围的动态距离表示一定范围的带宽。

示例25：如示例22的制品，其中该动态容许分片包括标准偏差。

示例26：如示例21的制品，其中该计算节点包括被配置成监控一个或多个远程资源的性能的分片优化器。

示例27：如示例26的制品，其中该分片优化器被配置成当一个或多个远程资源的性能在由动态容许分片定义的阈值之外长达预先确定的时间段时生成消息。

示例28：如示例21的制品，其中该消息被生成为包括用于重新映射一个或多个远程资源的请求。

示例29：如示例21的制品，其中该消息被生成为包括用于扩展一个或多个远程资源的请求。

示例30：如示例21的制品，进一步包括用于由软件定义的基础设施系统的计算节点的处理电路系统执行的指令，该指令用于使计算节点进行以下操作：接收关于下述的指示：一个或多个远程资源的性能不能被改变成在由动态容许分片定义的阈值内；以及向软件堆栈生成消息，该消息指示一个或多个远程资源的性能不能被改变成在由动态容许分片定义的阈值内。

示例31：一种软件定义的基础设施系统的计算节点，其包括：用于接收用于一个或多个远程资源的动态容许分片的装置；用于监控一个或多个远程资源的性能的装置；用于确定一个或多个远程资源的被监控的性能在由动态容许分片定义的阈值之外的装置；以及用于生成消息的装置，该消息指示一个或多个远程资源的性能在由动态容许分片定义的阈值之外。

示例32：如示例31的计算节点，其中该动态容许分片包括一定范围的动态距离。

示例33：如示例32的计算节点，其中该一定范围的动态距离表示一定范围的延迟。

示例34：如示例32的计算节点，其中该一定范围的动态距离表示一定范围的带宽。

示例35：如示例32的计算节点，其中该动态容许分片包括标准偏差。

示例36：如示例31的计算节点，其中该计算节点包括被配置成监控一个或多个远程资源的性能的分片优化器。

示例37：如示例36的计算节点，其中该分片优化器被配置成当一个或多个远程资源的性能在由动态容许分片定义的阈值之外长达预先确定的时间段时生成消息。

示例38：如示例31的计算节点，其中该消息被生成为包括用于重新映射一个或多个远程资源的请求。

示例39：如示例31的计算节点，其中该消息被生成为包括用于扩展一个或多个远程资源的请求。

示例40：如示例31的计算节点，进一步包括：用于接收关于下述的指示的装置：一个或多个远程资源的性能不能被改变成在由动态容许分片定义的阈值内；以及用于向软件堆栈生成消息的装置，该消息指示一个或多个远程资源的性能不能被改变成在由动态容许分片定义的阈值内。

示例41：一种装置，其包括：至少一个存储器；至少一个处理器；以及逻辑，该逻辑的至少一部分被包括在硬件中并且由至少一个处理器执行，该逻辑用以：接收用于一个或多个远程资源的动态容许分片；监控一个或多个远程资源的性能；确定一个或多个远程资源的被监控的性能在由动态容许分片定义的阈值之外；以及生成指示一个或多个远程资源的性能在由动态容许分片定义的阈值之外的消息。

示例42：如示例41的装置，其中该动态容许分片包括一定范围的动态距离。

示例43：如示例42的装置，其中该一定范围的动态距离表示一定范围的延迟。

示例44：如示例42的装置，其中该一定范围的动态距离表示一定范围的带宽。

示例45：如示例42的装置，其中该动态容许分片包括标准偏差。

示例46：如示例41的装置，其中该计算节点包括被配置成监控一个或多个远程资源的性能的分片优化器。

示例47：如示例46的装置，其中该分片优化器被配置成当一个或多个远程资源的性能在由动态容许分片定义的阈值之外长达预先确定的时间段时来生成消息。

示例48：如示例41的装置，其中该消息被生成为包括用于重新映射一个或多个远程资源的请求。

示例49：如示例41的装置，其中该消息被生成为包括用于扩展一个或多个远程资源的请求。

示例50：如示例41的装置，其中该逻辑用以：接收关于下述的指示：一个或多个远程资源的性能不能被改变成在由动态容许分片定义的阈值内；以及向软件堆栈生成消息，该消息指示一个或多个远程资源的性能不能被改变成在由动态容许分片定义的阈值内。

Claims

1.一种软件定义的基础设施系统，其包括：

计算节点，包括一个或多个处理器电路，被配置成经由构造访问一个或多个远程资源，所述计算节点被配置成：

接收用于所述一个或多个远程资源的动态容许分片；

监控所述一个或多个远程资源的性能；

确定所述一个或多个远程资源的被监控的性能在由所述动态容许分片定义的阈值之外；以及

生成指示所述一个或多个远程资源的性能在由所述动态容许分片定义的阈值之外的消息。

2.根据权利要求1所述的软件定义的基础设施系统，其中所述动态容许分片包括一定范围的动态距离。

3.根据权利要求2所述的软件定义的基础设施系统，其中所述一定范围的动态距离表示一定范围的延迟。

4.根据权利要求2所述的软件定义的基础设施系统，其中所述一定范围的动态距离表示一定范围的带宽。

5.根据权利要求2所述的软件定义的基础设施系统，其中所述动态容许分片包括标准偏差。

6.根据权利要求1所述的软件定义的基础设施系统，其中所述计算节点包括被配置成监控所述一个或多个远程资源的性能的分片优化器。

7.根据权利要求6所述的软件定义的基础设施系统，其中所述分片优化器被配置成当所述一个或多个远程资源的性能在由所述动态容许分片定义的阈值之外长达预先确定的时间段时生成消息。

8.根据权利要求1所述的软件定义的基础设施系统，其中所述消息被生成为包括用于重新映射所述一个或多个远程资源的请求。

9.根据权利要求1所述的软件定义的基础设施系统，其中所述消息被生成为包括用于扩展所述一个或多个远程资源的请求。

10.根据权利要求1所述的软件定义的基础设施系统，其中所述计算节点被配置成：

接收关于下述的指示：所述一个或多个远程资源的性能不能被改变成在由所述动态容许分片定义的阈值内；以及

向软件堆栈生成消息，所述消息指示所述一个或多个远程资源的性能不能被改变成在由所述动态容许分片定义的阈值内。

11.一种计算机实现方法，其包括：

在软件定义的基础设施系统的计算节点处接收用于一个或多个远程资源的动态容许分片；

由所述计算节点监控所述一个或多个远程资源的性能；

由所述计算节点确定所述一个或多个远程资源的被监控的性能在由所述动态容许分片定义的阈值之外；以及

由所述计算节点生成消息，所述消息指示所述一个或多个远程资源的性能在由所述动态容许分片定义的阈值之外。

12.根据权利要求11所述的计算机实现方法，其中所述动态容许分片包括一定范围的动态距离。

13.根据权利要求12所述的计算机实现方法，其中所述一定范围的动态距离表示一定范围的延迟。

14.根据权利要求12所述的计算机实现方法，其中所述一定范围的动态距离表示一定范围的带宽。

15.根据权利要求12所述的计算机实现方法，其中所述动态容许分片包括标准偏差。

16.根据权利要求11所述的计算机实现方法，其中所述计算节点包括被配置成监控所述一个或多个远程资源的性能的分片优化器。

17.根据权利要求16所述的计算机实现方法，其中所述分片优化器被配置成当所述一个或多个远程资源的性能在由所述动态容许分片定义的阈值之外长达预先确定的时间段时生成消息。

18.根据权利要求11所述的计算机实现方法，其中所述消息被生成为包括用于重新映射所述一个或多个远程资源的请求。

19.根据权利要求11所述的计算机实现方法，其中所述消息被生成为包括用于扩展所述一个或多个远程资源的请求。

20.根据权利要求11所述的计算机实现方法，其中所述计算节点被配置成：

21.一种包括非临时性计算机可读存储介质的制品，所述非临时性计算机可读存储介质存储用于由软件定义的基础设施系统的计算节点的处理电路系统执行的指令，所述指令使所述计算节点：

由所述计算节点接收用于一个或多个远程资源的动态容许分片；

由所述计算节点监控所述一个或多个远程资源的性能；

22.根据权利要求11所述的制品，其中所述动态容许分片包括一定范围的动态距离。

23.根据权利要求12所述的制品，其中所述一定范围的动态距离表示一定范围的延迟。

24.根据权利要求12所述的制品，其中所述一定范围的动态距离表示一定范围的带宽。

25.根据权利要求12所述的制品，其中所述动态容许分片包括标准偏差。