CN109426646A - 用于基于遥测数据来组成受管理节点的技术 - Google Patents

用于基于遥测数据来组成受管理节点的技术 Download PDF

Info

Publication number
CN109426646A
CN109426646A CN201811005041.4A CN201811005041A CN109426646A CN 109426646 A CN109426646 A CN 109426646A CN 201811005041 A CN201811005041 A CN 201811005041A CN 109426646 A CN109426646 A CN 109426646A
Authority
CN
China
Prior art keywords
resource
rack
managed node
slide plate
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811005041.4A
Other languages
English (en)
Other versions
CN109426646B (zh
Inventor
S.森
M.J.库马尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN109426646A publication Critical patent/CN109426646A/zh
Application granted granted Critical
Publication of CN109426646B publication Critical patent/CN109426646B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/18Packaging or power distribution
    • G06F1/183Internal mounting support structures, e.g. for printed circuit boards, internal connecting means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J15/00Gripping heads and other end effectors
    • B25J15/0014Gripping heads and other end effectors having fork, comb or plate shaped means for engaging the lower surface on a object to be transported
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3442Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for planning or managing the needed capacity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/06Addressing a physical block of locations, e.g. base addressing, module addressing, memory dedication
    • G06F12/0615Address space extension
    • G06F12/0623Address space extension for memory modules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1605Handling requests for interconnection or transfer for access to memory bus based on arbitration
    • G06F13/1652Handling requests for interconnection or transfer for access to memory bus based on arbitration in a multiprocessor architecture
    • G06F13/1657Access to multiple memories
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1668Details of memory controller
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/20Handling requests for interconnection or transfer for access to input/output bus
    • G06F13/28Handling requests for interconnection or transfer for access to input/output bus using burst mode transfer, e.g. direct memory access DMA, cycle steal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/20Handling requests for interconnection or transfer for access to input/output bus
    • G06F13/28Handling requests for interconnection or transfer for access to input/output bus using burst mode transfer, e.g. direct memory access DMA, cycle steal
    • G06F13/30Handling requests for interconnection or transfer for access to input/output bus using burst mode transfer, e.g. direct memory access DMA, cycle steal with priority control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4204Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus
    • G06F13/4221Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus being an input/output bus, e.g. ISA bus, EISA bus, PCI bus, SCSI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/161Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7807System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7867Architectures of general purpose stored program computers comprising a single central processing unit with reconfigurable architecture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • H04L41/0816Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5019Ensuring fulfilment of SLA
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5019Ensuring fulfilment of SLA
    • H04L41/5025Ensuring fulfilment of SLA by proactively reacting to service quality change, e.g. by reconfiguration after service quality degradation or upgrade
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/065Generation of reports related to network devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/25Flow control; Congestion control with rate being modified by the source upon detecting a change of network conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/76Admission control; Resource allocation using dynamic resource allocation, e.g. in-call renegotiation requested by the user or requested by the network in response to changing network conditions
    • H04L47/762Admission control; Resource allocation using dynamic resource allocation, e.g. in-call renegotiation requested by the user or requested by the network in response to changing network conditions triggered by the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/83Admission control; Resource allocation based on usage prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/40Constructional details, e.g. power supply, mechanical construction or backplane
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/02Constructional details
    • H04Q1/10Exchange station construction
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/14Mounting supporting structure in casing or on frame or rack
    • H05K7/1485Servers; Data center rooms, e.g. 19-inch computer racks
    • H05K7/1488Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures
    • H05K7/1489Cabinets therefor, e.g. chassis or racks or mechanical interfaces between blades and support structures characterized by the mounting of blades therein, e.g. brackets, rails, trays
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/14Mounting supporting structure in casing or on frame or rack
    • H05K7/1485Servers; Data center rooms, e.g. 19-inch computer racks
    • H05K7/1498Resource management, Optimisation arrangements, e.g. configuration, identification, tracking, physical location
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/18Construction of rack or frame
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20009Modifications to facilitate cooling, ventilating, or heating using a gaseous coolant in electronic enclosures
    • H05K7/20209Thermal management, e.g. fan control
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20718Forced ventilation of a gaseous coolant
    • H05K7/20736Forced ventilation of a gaseous coolant within cabinets for removing heat from server blades
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4022Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/105Arrangements for software license management or administration, e.g. for managing licenses at corporate level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2200/00Indexing scheme relating to G06F1/04 - G06F1/32
    • G06F2200/20Indexing scheme relating to G06F1/20
    • G06F2200/201Cooling arrangements using cooling fluid
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/86Event-based monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/885Monitoring specific for caches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • G06F9/4856Task life-cycle, e.g. stopping, restarting, resuming execution resumption being on a different machine, e.g. task migration, virtual machine migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/044Network management architectures or arrangements comprising hierarchical management structures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Thermal Sciences (AREA)
  • Power Engineering (AREA)
  • Computer Security & Cryptography (AREA)
  • Mechanical Engineering (AREA)
  • Robotics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)
  • Multi Processors (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Data Mining & Analysis (AREA)
  • Manufacturing & Machinery (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Multimedia (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Small-Scale Networks (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)

Abstract

用于基于遥测数据来组成受管理节点的技术包括通信电路和计算设备。计算设备要接收针对多个资源中的每一个资源的资源级遥测数据和来自多个机架中的每一个机架的机架级遥测数据以及受管理节点组成请求,所述受管理节点组成请求标识要由受管理节点实现的至少一个度量。响应于受管理节点组成请求的接收,计算设备进一步要确定所述多个资源中的每一个资源的目前利用和所述多个机架中的每一个机架的目前性能水平,并且基于资源级和机架级遥测数据从所述多个资源确定满足受管理节点组成请求的资源集。

Description

用于基于遥测数据来组成受管理节点的技术
对相关申请的交叉引用
本申请要求2017年8月30日提交的印度临时专利申请号201741030632和2017年11月10日提交的美国临时专利申请号62/584,401的权益。
背景技术
在在(例如,数据中心中的)多个计算设备之间分发工作负荷(workload)的系统中,集中式服务器可以组成用来处理工作负荷的计算设备的节点。每一个节点表示由每一个计算设备提供的资源(例如,计算、存储、加速等)的逻辑聚合。基于工作负荷的资源要求,集中式服务器确定满足这样的要求的计算设备的资源组成(composition)。通常,在组成节点之前,集中式服务器在系统中的计算设备上执行资产发现过程以确定由每一个计算设备提供的资源。在资产发现过程期间,集中式服务器接收关于计算设备上各个资源的信息。然后,集中式系统可以评估该信息以确定哪些资源满足资源要求,以便以服务级别协议(例如,数据中心的客户与数据中心运营商之间的协议)中指定的速度执行给定的工作负荷。
附图说明
在随附各图中,本文中描述的概念被图示作为示例而非作为限制。为了说明的简单和清楚,在各图中图示的元件不一定按比例绘制。在认为适当的地方,已经在各图之间重复参考标签以指示对应或类似的元件。
图1是用于利用分解的资源来执行工作负荷的数据中心的至少一个实施例的简化图;
图2是图1的数据中心的pod的至少一个实施例的简化图;
图3是可以被包括在图2的pod中的机架(rack)的至少一个实施例的透视图;
图4是图3的机架的侧面正视图;
图5是其中安装有滑板(sled)的图3的机架的透视图;
图6是图5的滑板的正面(top side)的至少一个实施例的简化框图;
图7是图6的滑板的反面(bottom side)的至少一个实施例的简化框图;
图8是在图1的数据中心中可使用的计算滑板的至少一个实施例的简化框图;
图9是图8的计算滑板的至少一个实施例的顶部透视图;
图10是在图1的数据中心中可使用的加速器滑板的至少一个实施例的简化框图;
图11是图10的加速器滑板的至少一个实施例的顶部透视图;
图12是在图1的数据中心中可使用的存储滑板的至少一个实施例的简化框图;
图13是图12的存储滑板的至少一个实施例的顶部透视图;
图14是在图1的数据中心中可使用的存储器滑板的至少一个实施例的简化框图;以及
图15是可以在图1的数据中心内建立以利用由分解的资源组成的受管理节点来执行工作负荷的系统的简化框图;
图16是用于基于从计算滑板接收的受管理节点组成请求来分配数据中心中可用的资源以组成受管理节点的系统的至少一个实施例的简化框图;
图17是图16的编排器(orchestrator)服务器的简化框图;
图18是可以由图16和17的编排器服务器建立的环境的至少一个实施例的简化框图;以及
图19-21是用于基于来自资源的资源级遥测数据和来自数据中心中的机架的机架级聚合遥测数据来组成受管理节点的方法的至少一个实施例的简化流程图,其可以由图16-18的编排器服务器执行。
具体实施方式
虽然本公开的概念容许有各种修改和替代形式,但是已经在附图中作为示例示出并且将在本文中详细地描述其特定实施例。然而,应当理解,不意图将本公开的概念限于所公开的特定形式,而是相反,本发明要涵盖与本公开和所附权利要求一致的所有修改、等同方案和替代方案。
在说明书中对“一个实施例”、“实施例”、“说明性实施例”、等的引用指示所描述的实施例可以包括特定特征、结构或特性,但是每一个实施例可能包括或者可能不一定包括该特定特征、结构或特性。此外,这样的短语不一定是指同一实施例。进一步地,当结合实施例描述特定特征、结构或特性时,主张的是,不管是否明确地描述,结合其它实施例实现这样的特征、结构或特性在本领域技术人员的知识内。另外,应当领会,被包括在以“A、B和C中的至少一个”的形式的列表中的项目可以意味着(A);(B);(C);(A和B);(A和C);(B和C);或者(A、B和C)。类似地,以“A、B或C中的至少一个”的形式列出的项目可以意味着(A);(B);(C);(A和B);(A和C);(B和C);或者(A、B和C)。
在一些情况下,所公开的实施例可以以硬件、固件、软件或其任何组合来实现。所公开的实施例还可以被实现为由暂时性或非暂时性机器可读(例如,计算机可读)存储介质承载或者存储在其上的指令,所述指令可以由一个或多个处理器读取和执行。机器可读存储介质可以体现为用于存储或传输以由机器可读的形式的信息的任何存储设备、机构或其它物理结构(例如,易失性或非易失性存储器、介质盘或其它介质设备)。
在附图中,可以以特定布置和/或排序示出一些结构或方法特征。然而,应当领会,可以不要求这样的特定布置和/或排序。相反,在一些实施例中,这样的特征可以以与在说明性图中示出方式和/或次序不同的方式和/或次序进行布置。另外,特定图中的结构或方法特征的包括不打算暗示着在所有的实施例中都要求这样的特征,并且在一些实施例中可以不包括这样的特征或者这样的特征可以与其它特征组合。
现在参考图1,其中分解的资源可以合作地执行一个或多个工作负荷(例如,代表顾客合作地执行应用)的数据中心100包括多个pod 110、120、130、140,所述多个pod中的每一个包括一行或多行机架。如在本文中更详细地描述的,每一个机架容纳多个滑板,所述多个滑板中每一个可以体现为诸如服务器之类的计算设备,其主要装备有特定类型的资源(例如,存储器设备、数据存储设备、加速器设备、通用处理器)。在说明性实施例中,每一个pod 110、120、130、140中的滑板连接到多个pod交换机(例如,将向和从pod内的滑板路由数据通信的交换机)。pod交换机继而与脊柱交换机150连接,所述脊柱交换机150在数据中心100中的pod(例如,pod 110、120、130、140)之间切换通信。在一些实施例中,滑板可以与使用英特尔全方位路径(Omni-Path)技术的结构连接。如在本文中更加详细地描述的,数据中心100中的滑板内的资源可以被分配给群组(本文中称为“受管理节点”),其包含要在工作负荷的执行中共同地利用的来自一个或多个其它滑板的资源。工作负荷可以好像属于受管理节点的资源位于同一滑板上一样来执行。受管理节点中的资源甚至可以属于归属于不同机架并且甚至归属于不同pod 110、120、130、140的滑板。可以将单个滑板的一些资源分配给一个受管理节点,而将同一滑板的其它资源分配给不同的受管理节点(例如,将一个处理器分配给一个受管理节点,并且将同一滑板的另一处理器分配给不同的受管理节点)。通过将资源分解到占主导地位地包括单个类型的资源的滑板(例如,主要包括计算资源的计算滑板、主要包含存储器资源的存储器滑板),以及选择性地分配和解除分配分解的资源以形成被分配来执行工作负荷的受管理节点,数据中心100提供了比起包括包含计算、存储器、存储以及也许附加的资源的超融合服务器的典型数据中心更高效的资源使用。照此,数据中心100可以提供比具有相同数目的资源的典型数据中心较好的性能(例如,吞吐量、每秒的操作数、等待时间等)。
现在参考图2,在说明性实施例中,pod 110包括机架240的行200、210、220、230的集合。每一个机架240可以容纳多个滑板(例如,十六个滑板)并且向所容纳的滑板提供电力和数据连接,如在本文中更加详细地描述的。在说明性实施例中,每一行200、210、220、230中的机架连接到多个pod交换机250、260。pod交换机250包括pod 110的机架的滑板连接到的一组端口252以及将pod 110连接到脊柱交换机150以向数据中心100中的其它pod提供连接性的另一组端口254。类似地,pod交换机260包括pod 110的机架的滑板连接到的一组端口262的集合以及将pod 110连接到脊柱交换机150的一组端口264。照此,这对交换机250、260的使用向pod 110提供了冗余量。例如,如果交换机250、260中的任一个失效,则pod 110中的滑板仍然可以通过另一交换机250、260来维持与数据中心100的剩余部分(例如,其它pod的滑板)的数据通信。此外,在说明性实施例中,交换机150、250、260可以体现为双模式光学交换机,其能够经由光纤的光学信令介质来路由承载因特网协议(IP)分组的以太网协议通信和根据第二、高性能链路层协议(例如,英特尔的全方位路径架构的、无限带宽(Infiniband))的通信二者。
应当领会,其它pod 120、130、140(以及数据中心100的任何附加的pod)中的每一个可以类似地构造为在图2中示出并且关于图2描述的pod 110并且具有与pod 110类似的组件(例如,每一个pod可以具有多行容纳多个滑板的机架,如上文描述的)。另外,虽然示出了两个pod交换机250、260,但是应当理解,在其它实施例中,每一个pod 110、120、130、140可以连接到不同数目的pod交换机(例如,提供甚至更大的失效备援能力)。
现在参考图3-5,数据中心100的每一个说明性机架240包括垂直布置的两个加长支撑柱302、304。例如,加长支撑柱302、304在被部署时从数据中心100的底部(floor)向上延伸。机架240还包括被配置成支撑数据中心100的滑板的加长支撑臂312的一个或多个水平对310(在图3中经由虚线椭圆标识),如下文描述的。加长支撑臂312的对中的一个加长支撑臂312从加长支撑柱302向外延伸,并且另一加长支撑臂312从加长支撑柱304向外延伸。
在说明性实施例中,数据中心100的每一个滑板体现为无底盘(chassis-less)滑板。也就是说,每一个滑板具有在其上安装物理资源(例如,处理器、存储器、加速器、储存器等)的无底盘电路板基板,如下文更加详细地讨论的。照此,机架240被配置成容纳无底盘滑板。例如,加长支撑臂312的每一对310限定机架240的滑板插槽320,所述滑板插槽320被配置成容纳对应的无底盘滑板。为了这么做,每一个说明性的加长支撑臂312包括被配置成容纳滑板的无底盘电路板基板的电路板导引物(guide)330。每一个电路板导引物330被固定到或者以其它方式安装到对应的加长支撑臂312的正面332。例如,在说明性实施例中,每一个电路板导引物330被安装在对应的加长支撑臂312相对于对应的加长支撑柱302、304的远端处。为了图的清楚,可能没有在每一个图中引用每一个电路板导引物330。
每一个电路板导引物330包括限定电路板插槽380的内壁,所述电路板插槽380被配置成在滑板400被容纳在机架240的对应滑板插槽320中时容纳滑板400的无底盘电路板基板。为了这么做,如图4中所示,用户(或机器人)将说明性无底盘滑板400的无底盘电路板基板对准到滑板插槽320。用户或者机器人然后可以将无底盘电路板基板向前滑动到滑板插槽320中,使得无底盘电路板基板的每一个侧边414被容纳在限定对应的滑板插槽320的加长支撑臂312的对310的电路板导引物330的对应电路板插槽380中,如图4中所示。通过具有包括分解的资源的机器人可访问且机器人可操纵的滑板,每一个类型的资源可以与彼此独立地并且以它们自己优化的刷新速率进行升级。此外,滑板被配置成与每一个机架240中的电力和数据通信线缆盲配,从而增强其被快速地移除、升级、重新安装和/或替换的能力。照此,在一些实施例中,数据中心100可以在没有人类参与的情况下在数据中心底部上操作(例如,执行工作负荷、经历维护和/或升级等)。在其它实施例中,人类可以促进数据中心100中的一个或多个维护或升级操作。
应当领会,每一个电路板导引物330是双面的。也就是说,每一个电路板导引物330包括限定电路板导引物330的每一侧上的电路板插槽380的内壁。以该方式,每一个电路板导引物330可以在任一侧上支撑无底盘电路板基板。照此,可以向机架240添加单个附加的加长支撑柱以使机架240变成可以保持如图3中所示的滑板插槽320的两倍之多的双机架解决方案。说明性机架240包括限定对应的七个滑板插槽320的加长支撑臂312的七对310,所述七个滑板插槽320中的每一个被配置成如上文所讨论那样容纳并且支撑对应滑板400。当然,在其它实施例中,机架240可以包括加长支撑臂312的附加对或者更少对310(即,附加的或者更少的滑板插槽320)。应当领会,因为滑板400是无底盘的,所以滑板400可以具有与典型服务器不同的总体高度。照此,在一些实施例中,每一个滑板插槽320的高度可以短于典型服务器的高度(例如,短于单个机架单元“1U”)。也就是说,加长支撑臂312的每一对310之间的垂直距离可以小于标准机架单元“1U”。另外,由于滑板插槽320的高度中的相对减小,机架240的总体高度在一些实施例中可以短于传统机架外壳的高度。例如,在一些实施例中,加长支撑柱302、304中的每一个可以具有六英尺或更小的长度。再次,在其它实施例中,机架240可以具有不同的尺寸。进一步地,应当领会,机架240不包括任何壁、外壳等。相反,机架240是向本地环境敞开的无外壳机架。当然,在一些情况下,在其中机架240形成数据中心100中的行末机架的那些情况下,可以将端板附连到加长支撑柱302、304中的一个。
在一些实施例中,各种互连可以被布线(route)成向上或者向下通过加长支撑柱302、304。为了促进这样的布线,每一个加长支撑柱302、304包括限定互连可以位于其中的内腔的内壁。被布线成通过加长支撑柱304、304的互连可以体现为任何类型的互连,包括但不限于向每一个滑板插槽320提供通信连接的数据或者通信互连、向每一个滑板插槽320提供电力的电力互连和/或其它类型的互连。
在说明性实施例中,机架240包括在其上安装(未示出的)对应的光学数据连接器的支撑平台。每一个光学数据连接器与对应滑板插槽320相关联,并且被配置成在滑板400被容纳在对应滑板插槽320中时与对应滑板400的光学数据连接器配合(mate)。在一些实施例中,数据中心100中的组件(例如,滑板、机架和交换机)之间的光学连接利用盲配光学连接来做出。例如,每一个线缆上的门可以防止灰尘污染线缆内的光纤。在连接到盲配光学连接器机构的过程中,当线缆的末端进入连接器机构时,门被推开。随后,线缆内部的光纤进入连接器机构内的凝胶,并且一个线缆的光纤与连接器机构内部的凝胶内的另一线缆的光纤接触。
说明性机架240还包括耦合到机架240的交叉支撑臂的风扇阵列370。风扇阵列370包括在加长支撑柱302、304之间以水平线对准的一行或多行冷却风扇372。在说明性实施例中,风扇阵列370包括用于机架240的每一个滑板插槽320的一行冷却风扇372。如上文所讨论的,在说明性实施例中,每一个滑板400不包括任何板载冷却系统,并且照此,风扇阵列370提供用于容纳在机架240中的每一个滑板400的冷却。在说明性实施例中,每一个机架240还包括与每一个滑板插槽320相关联的电力供应。每一个电力供应被固定到限定对应滑板插槽320的加长支撑臂312的对310中的一个加长支撑臂312。例如,机架240可以包括耦合到或者固定到从加长支撑柱302延伸的每一个加长支撑臂312的电力供应。每一个电力供应包括电力连接器,所述电力连接器被配置成在滑板400被容纳在对应滑板插槽320中时与滑板400的电力连接器配合。在说明性实施例中,滑板400不包括任何板载的电力供应,并且照此,在机架240中提供的电力供应在安装到机架240时向对应滑板400供应电力。
现在参考图6,在说明性实施例中,滑板400被配置成安装在数据中心100的对应机架240中,如上文所讨论的。在一些实施例中,每一个滑板400可以被优化或者以其它方式配置用于执行特定任务,诸如计算任务、加速任务、数据存储任务等。例如,滑板400可以体现为如在下文关于图8-9讨论的计算滑板800、如在下文关于图10-11讨论的加速器滑板1000、如在下文关于图12-13讨论的存储滑板1200,或者体现为被优化或以其它方式配置成执行其它专门的任务的滑板,诸如在下文关于图14讨论的存储器滑板1400。
如上文所讨论的,说明性滑板400包括支撑被安装在其上的各种物理资源(例如,电气组件)的无底盘电路板基板602。应当领会,电路板基板602是“无底盘的”,因为滑板400不包括壳体或外壳。相反,无底盘电路板基板602向本地环境敞开。无底盘电路板基板602可以由能够支撑被安装在其上的各种电气组件的任何材料组成。例如,在说明性实施例中,无底盘电路板基板602由FR-4玻璃增强环氧树脂层压材料组成。当然,在其它实施例中,可以使用其它材料来形成无底盘电路板基板602。
如在下文更加详细地讨论的,无底盘电路板基板602包括改进被安装在无底盘电路板基板602上的各种电气组件的热冷却(heat cooling)特性的多个特征。如所讨论的,无底盘电路板基板602不包括壳体或外壳,这可以通过减少可能抑制空气流动的那些结构而改进滑板400的电气组件之上的气流。例如,因为无底盘电路板基板602未被定位在单独的壳体或外壳中,所以不存在到无底盘电路板基板602的底板(例如,底盘的后板),这可能抑制跨电气组件的空气流动。另外,无底盘电路板基板602具有被配置成减小跨安装到无底盘电路板基板602的电气组件的气流路径的长度的几何形状。例如,说明性无底盘电路板基板602具有比无底盘电路板基板602的深度606大的宽度604。在一个特定实施例中,例如,与具有大约17英寸的宽度和大约39英寸的深度的典型服务器相比,无底盘电路板基板602具有大约21英寸的宽度和大约9英寸的深度。照此,从无底盘电路板基板602的前边610朝向后边612延伸的气流路径608具有相对于典型服务器较短的距离,这可以改进滑板400的热冷却特性。此外,虽然没有在图6中图示,但是安装到无底盘电路板基板602的各种物理资源被安装在对应位置中,使得两个实质上产生热量的电气组件不彼此遮蔽,如在下文更加详细地讨论的。也就是说,在操作期间产生相当可观的热量(即,大于充分足以不利地影响另一电气组件的冷却的标称热量)的两个电气组件不被沿着气流路径608的方向(即,沿着从无底盘电路板基板602的前边610朝向后边612延伸的方向)与彼此一致成直线地安装到无底盘电路板基板602。
如上文所讨论的,说明性滑板400包括被安装到无底盘电路板基板602的正面650的一个或多个物理资源620。虽然在图6中示出了两个物理资源620,但是应当领会,在其它实施例中滑板400可以包括一个、两个或更多个物理资源620。取决于例如滑板400的类型或预期功能性,物理资源620可以体现为能够执行各种任务(诸如计算功能)和/或控制滑板400的功能的任何类型的处理器、控制器或其它计算电路。例如,如在下文更加详细地讨论的,物理资源620可以在其中滑板400体现为计算滑板的实施例中体现为高性能处理器,在其中滑板400体现为加速器滑板的实施例中体现为加速器协处理器或电路,在其中滑板400体现为存储滑板的实施例中体现为存储控制器,或者在其中滑板400体现为存储器滑板的实施例中体现为一组存储器设备。
滑板400还包括被安装到无底盘电路板基板602的正面650的一个或多个附加物理资源630。在说明性实施例中,附加物理资源包括如在下文更加详细地讨论的网络接口控制器(NIC)。当然,取决于滑板400的类型和功能性,在其它实施例中物理资源630可以包括附加的或者其它的电气组件、电路和/或设备。
物理资源620经由输入/输出(I/O)子系统622通信地耦合到物理资源630。I/O子系统622可以体现为用来利用物理资源620、物理资源630和/或滑板400的其它组件促进输入/输出操作的电路和/或组件。例如,I/O子系统622可以体现为或者以其它方式包括存储器控制器中枢、输入/输出控制中枢、集成传感器中枢、固件设备、通信链路(例如,点对点链路、总线链路、导线、线缆、光导、印刷电路板迹线等)和/或用来促进输入/输出操作的其它组件和子系统。在说明性实施例中,I/O子系统622体现为或者以其它方式包括双数据速率4(DDR4)数据总线或DDR5数据总线。
在一些实施例中,滑板400还可以包括资源到资源互连624。资源到资源互连624可以体现为能够促进资源到资源通信的任何类型的通信互连。在说明性实施例中,资源到资源互连624体现为高速点对点互连(例如,比I/O子系统622更快)。例如,资源到资源互连624可以体现为快速路径互连(QPI)、超级路径互连(UPI)或者专用于资源到资源通信的其它高速点对点互连。
滑板400还包括电力连接器640,所述电力连接器640被配置成在滑板400被安装在对应机架240中时与机架240的对应电力连接器配合。滑板400经由电力连接器640从机架240的电力供应接收电力以向滑板400的各种电气组件供应电力。也就是说,滑板400不包括用来向滑板400的电气组件提供电力的任何本地电力供应(即,板载电力供应)。本地或板载电力供应的排除促进无底盘电路板基板602的总体占用空间中的减少,这可以增加如上文所讨论的被安装在无底盘电路板基板602上的各种电气组件的热冷却特性。在一些实施例中,通过直接在处理器820下方的通孔(例如,通过无底盘电路板基板602的反面750)向处理器820提供电力,从而提供增加的热预算、附加的电流和/或电压以及比起典型板更好的电压控制。
在一些实施例中,滑板400还可以包括安装特征642,其被配置成与机器人的安装臂或其它结构配合以促进通过机器人在机架240中对滑板600的放置。安装特征642可以体现为允许机器人抓住滑板400而不毁坏无底盘电路板基板602或安装到其的电气组件的任何类型的物理结构。例如,在一些实施例中,安装特征642可以体现为附连到无底盘电路板基板602的非传导焊盘。在其它实施例中,安装特征可以体现为附连到无底盘电路板基板602的支架、支柱或其它类似结构。安装特征642的特定数目、形状、大小和/或组成可以取决于被配置成管理滑板400的机器人的设计。
现在参考图7,除被安装在无底盘电路板基板602的正面650上的物理资源630之外,滑板400还包括被安装到无底盘电路板基板602的反面750的一个或多个存储器设备720。也就是说,无底盘电路板基板602体现为双面电路板。物理资源620经由I/O子系统622通信地耦合到存储器设备720。例如,物理资源620和存储器设备720可以经由贯穿无底盘电路板基板602的一个或多个通孔而通信地耦合。在一些实施例中每一个物理资源620可以通信地耦合到一个或多个存储器设备720的不同集合。替代地,在其它实施例中,每一个物理资源620可以通信地耦合到每一个存储器设备720。
存储器设备720可以体现为能够在滑板400的操作期间存储用于物理资源620的数据的任何类型的存储器设备,诸如任何类型的易失性存储器(例如,动态随机存取存储器(DRAM)等)或者非易失性存储器。易失性存储器可以是要求电力来维持由介质存储的数据的状态的存储介质。易失性存储器的非限制性示例可以包括各种类型的随机存取存储器(RAM),诸如动态随机存取存储器(DRAM)或静态随机存取存储器(SRAM)。可以在存储器模块中使用的一个特定类型的DRAM是同步动态随机存取存储器(SDRAM)。在特定实施例中,存储器组件的DRAM可以遵从由JEDEC颁布的标准,诸如用于DDR SDRAM的JESD79F、用于DDR2SDRAM的JESD79-2F、用于DDR3 SDRAM的JESD79-3F、用于DDR4 SDRAM的JESD79-4A、用于低功率DDR(LPDDR)的JESD209、用于LPDDR2的JESD209-2、用于LPDDR3的JESD209-3以及用于LPDDR4的JESD209-4(这些标准在www.jedec.org处可获得)。这样的标准(以及类似的标准)可以被称为基于DDR的标准,并且实现这样的标准的存储设备的通信接口可以被称为基于DDR的接口。
在一个实施例中,存储器设备是块可寻址存储器设备,诸如基于NAND或NOR技术的那些。存储器设备还可以包括下一代非易失性设备,诸如英特尔3D XPointTM存储器或其它类型的可寻址的在适当的位置写入(write-in-place)非易失性存储器设备。在一个实施例中,存储器设备可以是或者可以包括使用硫属化物玻璃的存储器设备,多阈值水平NAND闪速存储器,NOR闪速存储器,单或多级相变存储器(PCM),电阻存储器,纳米线存储器,铁电晶体管随机存取存储器(FeTRAM),反铁电存储器,合并忆阻器技术的磁阻随机存取存储器(MRAM)存储器,包括金属氧化物基底、氧空位基底和传导桥随机存取存储器(CB-RAM)的电阻存储器,或者自旋转移扭矩(STT)-MRAM,基于自旋电子磁结存储器的设备,基于磁隧道结(MTJ)的设备,基于DW(畴壁)和SOT(自旋轨道转移)的设备,基于半导体闸流管的存储器设备,或上文中的任何存储器设备的组合,或者其它存储器。存储器设备可以是指管芯本身和/或经封装的存储器产品。在一些实施例中,存储器设备可以包括无晶体管的可堆叠交叉点架构,其中存储器单元位于字线和位线的交叉处且可被单独地寻址并且其中位存储基于体电阻中的改变。
现在参考图8,在一些实施例中,滑板400可以体现为计算滑板800。计算滑板800被优化或者以其它方式配置成执行计算任务。当然,如上文所讨论的,计算滑板800可以依靠其它滑板,诸如加速滑板和/或存储滑板,来执行这样的计算任务。计算滑板800包括与滑板400的物理资源类似的各种物理资源(例如,电气组件),其已经被在图8中使用相同的参考号码来标识。上文关于图6和7提供的对这样的组件的描述适用于计算滑板800的对应组件,并且为了计算滑板800的描述的清楚而不在本文中进行重复。
在说明性计算滑板800中,物理资源620体现为处理器820。虽然在图8中仅示出了两个处理器820,但是应当领会,在其它实施例中计算滑板800可以包括附加的处理器820。说明性地,处理器820体现为高性能处理器820,并且可以被配置成在相对高的额定功率下操作。虽然在比典型处理器(其在大约155-230W下操作)大的额定功率下操作的处理器820生成附加的热量,但是上文讨论的无底盘电路板基板602的增强的热冷却特性促进更高功率的操作。例如,在说明性实施例中,处理器820被配置成在至少250W的额定功率下操作。在一些实施例中,处理器820可以被配置成在至少350W的额定功率下操作。
在一些实施例中,计算滑板800还可以包括处理器到处理器互连842。类似于上文讨论的滑板400的资源到资源互连624,处理器到处理器互连842可以体现为能够促进处理器到处理器互连842通信的任何类型的通信互连。在说明性实施例中,处理器到处理器互连842体现为高速点对点互连(例如,比I/O子系统622快)。例如,处理器到处理器互连842可以体现为快速路径互连(QPI)、超级路径互连(UPI)或者专用于处理器到处理器通信的其它高速点对点互连。
计算滑板800还包括通信电路830。说明性通信电路830包括网络接口控制器(NIC)832,其还可以被称为主机结构接口(HFI)。NIC 832可以体现为或者以其它方式包括任何类型的集成电路、分立电路、控制器芯片、芯片组、内插板、子卡、网络接口卡、可以由计算滑板800使用以与另一计算设备(例如,与其它滑板400)连接的其它设备。在一些实施例中,NIC832可以体现为包括一个或多个处理器的片上系统(SoC)的部分,或者被包括在也包含一个或多个处理器的多芯片封装上。在一些实施例中,NIC 832可以包括(未示出的)本地处理器和/或(未示出的)本地存储器,其二者对NIC 832而言都是本地的。在这样的实施例中,NIC832的本地处理器可以能够执行处理器820的功能中的一个或多个。附加地或者替代地,在这样的实施例中,NIC 832的本地存储器可以在板级别、插座(socket)级别、芯片级别和/或其它级别处集成到计算滑板的一个或多个组件中。
通信电路830通信地耦合到光学数据连接器834。光学数据连接器834被配置成在计算滑板800被安装在机架240中时与机架240的对应光学数据连接器配合。说明性地,光学数据连接器834包括从光学数据连接器834的配合表面引向光学收发器836的多个光纤。光学收发器836被配置成将来自机架侧光学数据连接器的传入光学信号转换成电气信号并且将电气信号转换成到机架侧光学数据连接器的传出光学信号。虽然在说明性实施例中示出为形成光学数据连接器834的部分,但是在其它实施例中光学收发器836可以形成通信电路830的部分。
在一些实施例中,计算滑板800还可以包括扩展连接器840。在这样的实施例中,扩展连接器840被配置成与扩展无底盘电路板基板的对应连接器配合以向计算滑板800提供附加物理资源。附加物理资源可以例如由处理器820在计算滑板800的操作期间使用。扩展无底盘电路板基板可以基本上类似于上文讨论的无底盘电路板基板602并且可以包括被安装到其的各种电气组件。安装到扩展无底盘电路板基板的特定电气组件可以取决于扩展无底盘电路板基板的预期功能性。例如,扩展无底盘电路板基板可以提供附加的计算资源、存储器资源和/或存储资源。照此,扩展无底盘电路板基板的附加物理资源可以包括但不限于处理器、存储器设备、存储设备和/或加速器电路,其包括例如现场可编程门阵列(FPGA)、专用集成电路(ASIC)、安全协处理器、图形处理单元(GPU)、机器学习电路或者其它专门的处理器、控制器、设备和/或电路。
现在参考图9,示出了计算滑板800的说明性实施例。如所示,处理器820、通信电路830和光学数据连接器834被安装到无底盘电路板基板602的正面650。可以使用任何适合的附连或安装技术将计算滑板800的物理资源安装到无底盘电路板基板602。例如,各种物理资源可以被安装在对应的插座(例如,处理器插座)、支持物或支架中。在一些情况下,电气组件中的一些可以经由焊接或类似技术直接地安装到无底盘电路板基板602。
如上文所讨论的,单独的处理器820和通信电路830被安装到无底盘电路板基板602的正面650,使得两个产生热量的电气组件不遮蔽彼此。在说明性实施例中,处理器820和通信电路830被安装在无底盘电路板基板602的正面650上的对应位置中,使得那些物理资源中的两个不沿着气流路径608的方向与其它物理资源成直线地一致。应当领会,虽然光学数据连接器834与通信电路830一致,但是光学数据连接器834在操作期间不产生热量或者产生标称热量。
计算滑板800的存储器设备720被安装到如上文关于滑板400讨论的无底盘电路板基板602的反面750。虽然被安装到反面750,但是存储器设备720经由I/O子系统622通信地耦合到位于正面650上的处理器820。因为无底盘电路板基板602体现为双面电路板,所以存储器设备720和处理器820可以经由贯穿无底盘电路板基板602的一个或多个通孔、连接器或其它机构而通信地耦合。当然,在一些实施例中每一个处理器820可以通信地耦合到一个或多个存储器设备720的不同集合。替代地,在其它实施例中,每一个处理器820可以通信地耦合到每一个存储器设备720。在一些实施例中,存储器设备720可以被安装到无底盘电路板基板602的反面上的一个或多个存储器夹层,并且可以通过球栅阵列与对应处理器820互连。
处理器820中的每一个包括被固定到其的散热器850。由于存储器设备720向无底盘电路板基板602的反面750的安装(以及对应机架240中的滑板400的垂直间距),无底盘电路板基板602的正面650包括附加的“自由”区域或空间,其促进对具有相对于在典型服务器中使用的传统散热器更大的大小的散热器850的使用。另外,由于无底盘电路板基板602的改进的热冷却特性,处理器散热器850都不包括附连到其的冷却风扇。也就是说,散热器850中的每一个体现为无风扇散热器。
现在参考图10,在一些实施例中,滑板400可以体现为加速器滑板1000。加速器滑板1000被优化或者以其它方式配置成执行专门的计算任务,诸如机器学习、加密、散列或者其它计算密集型任务。在一些实施例中,例如,计算滑板800可以在操作期间将任务卸载到加速器滑板1000。加速器滑板1000包括与滑板400和/或计算滑板800的组件类似的各种组件,其已经被在图10中使用相同的参考号码来标识。上文关于图6、7和8提供的对这样的组件的描述适用于加速器滑板1000的对应组件,并且为了加速器滑板1000的描述的清楚而不在本文中进行重复。
在说明性加速器滑板1000中,物理资源620体现为加速器电路1020。虽然在图10中仅示出了两个加速器电路1020,但是应当领会,在其它实施例中加速器滑板1000可以包括附加的加速器电路1020。例如,如图11中所示,在一些实施例中加速器滑板1000可以包括四个加速器电路1020。加速器电路1020可以体现为任何类型的处理器、协处理器、计算电路或者能够执行计算或处理操作的其它设备。例如,加速器电路1020可以体现为例如现场可编程门阵列(FPGA)、专用集成电路(ASIC)、安全协处理器、图形处理单元(GPU)、机器学习电路或者其它专门的处理器、控制器、设备和/或电路。
在一些实施例中,加速器滑板1000还可以包括加速器到加速器互连1042。类似于上文讨论的滑板600的资源到资源互连624,加速器到加速器互连1042可以体现为能够促进加速器到加速器通信的任何类型的通信互连。在说明性实施例中,加速器到加速器互连1042体现为高速点对点互连(例如,比I/O子系统622快)。例如,加速器到加速器互连1042可以体现为快速路径互连(QPI)、超级路径互连(UPI)或者专用于处理器到处理器通信的其它高速点对点互连。在一些实施例中,加速器电路1020可以与主要加速器电路1020和辅助加速器电路1020进行菊花链接,所述主要加速器电路1020通过I/O子系统622连接到NIC 832和存储器720,所述辅助加速器电路1020通过主要加速器电路1020连接到NIC 832和存储器720。
现在参考图11,示出了加速器滑板1000的说明性实施例。如上文所讨论的,加速器电路1020、通信电路830和光学数据连接器834被安装到无底盘电路板基板602的正面650。再次,单独的加速器电路1020和通信电路830被安装到无底盘电路板基板602的正面650,使得两个产生热量的电气组件不遮蔽彼此,如上文所讨论的。加速器滑板1000的存储器设备720被安装到无底盘电路板基板602的反面750,如上文关于滑板600所讨论的。虽然被安装到反面750,但是存储器设备720经由I/O子系统622(例如,通过通孔)通信地耦合到位于正面650上的加速器电路1020。进一步地,加速器电路1020中的每一个可以包括比在服务器中使用的传统散热器更大的散热器1070。如上文参考散热器870所讨论的,散热器1070可以大于传统散热器,由于由位于无底盘电路板基板602的反面750上而不是正面650上的存储器设备720提供的“自由”区域。
现在参考图12,在一些实施例中,滑板400可以体现为存储滑板1200。存储滑板1200被优化或者以其它方式配置成在对存储滑板1200而言本地的数据储存器1250中存储数据。例如,在操作期间,计算滑板800或者加速器滑板1000可以存储和检索来自存储滑板1200的数据储存器1250的数据。存储滑板1200包括与滑板400和/或计算滑板800的组件类似的各种组件,其已经被在图12中使用相同的参考号码来标识。上文关于图6、7和8提供的对这样的组件的描述适用于存储滑板1200的对应组件,并且为了存储滑板1200的描述的清楚而不在本文中进行重复。
在说明性存储滑板1200中,物理资源620体现为存储控制器1220。虽然在图12中仅示出两个存储控制器1220,但是应当领会,在其它实施例中存储滑板1200可以包括附加的存储控制器1220。存储控制器1220可以体现为能够基于经由通信电路830接收的请求而控制向数据储存器1250中存储和检索数据的任何类型的处理器、控制器或控制电路。在说明性实施例中,存储控制器1220体现为相对低功率的处理器或控制器。例如,在一些实施例中,存储控制器1220可以被配置成在大约75瓦特的额定功率下操作。
在一些实施例中,存储滑板1200还可以包括控制器到控制器互连1242。类似于上文讨论的滑板400的资源到资源互连624,控制器到控制器互连1242可以体现为能够促进控制器到控制器通信的任何类型的通信互连。在说明性实施例中,控制器到控制器互连1242体现为高速点对点互连(例如,比I/O子系统622更快)。例如,控制器到控制器互连1242可以体现为快速路径互连(QPI)、超级路径互连(UPI)或者专用于处理器到处理器通信的其它高速点对点互连。
现在参考图13,示出了存储滑板1200的说明性实施例。在说明性实施例中,数据储存器1250体现为或者以其它方式包括被配置成容纳一个或多个固态驱动器(SSD)1254的存储笼1252。为了这么做,存储笼1252包括数个安装插槽1256,所述数个安装插槽1256中的每一个被配置成容纳对应的固态驱动器1254。安装插槽1256中的每一个包括进行合作来限定对应安装插槽1256的访问开口1260的数个驱动器导引物1258。存储笼1252被固定到无底盘电路板基板602使得访问开口背对着无底盘电路板基板602(即,朝向其前面)。照此,当存储滑板1200被安装在对应机架204中时,固态驱动器1254是可访问的。例如,在存储滑板1200保持安装在对应机架240中时,可以(例如,经由机器人)从机架240换出固态驱动器1254。
存储笼1252说明性地包括十六个安装插槽1256并且能够安装和存储十六个固态驱动器1254。当然,在其它实施例中存储笼1252可以被配置成存储附加的或者更少的固态驱动器1254。另外,在说明性实施例中,固态驱动器被垂直地安装在存储笼1252中,但是在其它实施例中可以以不同的定向安装在存储笼1252中。每一个固态驱动器1254可以体现为能够存储长期数据的任何类型的数据存储设备。为了这么做,固态驱动器1254可以包括上文讨论的易失性和非易失性存储器设备。
如图13中所示,存储控制器1220、通信电路830和光学数据连接器834被说明性地安装到无底盘电路板基板602的正面650。再次,如上文所讨论的,可以使用任何适合的附连或安装技术将存储滑板1200的电气组件安装到无底盘电路板基板602,其包括例如插座(例如,处理器插座)、支持物、支架、经焊接的连接和/或其它安装或被固定技术。
如上文所讨论的,单独的存储控制器1220和通信电路830被安装到无底盘电路板基板602的正面650,使得两个产生热量的电气组件不遮蔽彼此。例如,存储控制器1220和通信电路830被安装在无底盘电路板基板602的正面650上的对应位置中,使得那些电气组件中的两个不沿着气流路径608的方向与其它成直线地一致。
存储滑板1200的存储器设备720被安装到无底盘电路板基板602的反面750,如上文关于滑板400所讨论的。虽然被安装到反面750,但是存储器设备720经由I/O子系统622通信地耦合到位于正面650上的存储控制器1220。再次,因为无底盘电路板基板602体现为双面电路板,所以存储器设备720和存储控制器1220可以经由贯穿无底盘电路板基板602的一个或多个通孔、连接器或其它机构而通信地耦合。存储控制器1220中的每一个包括被固定到其的散热器1270。如上文所讨论的,由于存储滑板1200的无底盘电路板基板602的改进的热冷却特性,散热器1270都不包括附连到其的冷却风扇。也就是说,散热器1270中的每一个体现为无风扇散热器。
现在参考图14,在一些实施例中,滑板400可以体现为存储器滑板1400。存储器滑板1400被优化或者以其它方式配置成给其它滑板400(例如,计算滑板800、加速器滑板1000等)提供对对于存储器滑板1200而言本地的(例如,在存储器设备720的两个或更多集合1430、1432中的)存储器池的访问。例如,在操作期间,计算滑板800或加速器滑板1000可以使用逻辑地址空间远程地向存储器滑板1200的存储器集合1430、1432中的一个或多个写入和/或从其读取,所述逻辑地址空间映射至存储器集合1430、1432中的物理地址。存储器滑板1400包括与滑板400和/或计算滑板800的组件类似的各种组件,其已经被在图14中使用相同的参考号码来标识。上文关于图6、7和8提供的对这样的组件的描述适用于存储器滑板1400的对应组件,并且为了存储器滑板1400的描述的清楚而不在本文中进行重复。
在说明性存储器滑板1400中,物理资源620体现为存储器控制器1420。虽然在图14中仅示出了两个存储器控制器1420,但是应当领会,在其它实施例中存储器滑板1400可以包括附加的存储器控制器1420。存储器控制器1420可以体现为能够基于经由通信电路830接收的请求而控制向存储器集合1430、1432中写入和读取数据的任何类型的处理器、控制器或控制电路。在说明性实施例中,每一个存储控制器1220连接到对应的存储器集合1430、1432以向对应的存储器集合1430、1432内的存储器设备720写入以及从其读取,并且实施与已经向存储器滑板1400发送执行存储器访问操作(例如,读取或写入)的请求的滑板400相关联的任何准许(例如,读取、写入等)。
在一些实施例中,存储器滑板1400还可以包括控制器到控制器互连1442。类似于上文讨论的滑板400的资源到资源互连624,控制器到控制器互连1442可以体现为能够促进控制器到控制器通信的任何类型的通信互连。在说明性实施例中,控制器到控制器互连1442体现为高速点对点互连(例如,比I/O子系统622更快)。例如,控制器到控制器互连1442可以体现为快速路径互连(QPI)、超级路径互连(UPI)或者专用于处理器到处理器通信的其它高速点对点互连。照此,在一些实施例中,存储器控制器1420可以通过控制器到控制器互连1442访问在与另一存储器控制器1420相关联的存储器集合1432内的存储器。在一些实施例中,可扩展的存储器控制器由存储器滑板(例如,存储器滑板1400)上的在本文中称为“小芯片(chiplet)”的多个较小的存储器控制器组成。小芯片可以(例如,使用EMIB(嵌入式多管芯互连桥))互连。组合的小芯片存储器控制器可以扩展直到相对大数目的存储器控制器和I/O端口(例如,多达16个存储器信道)。在一些实施例中,存储器控制器1420可以实现存储器交错(例如,将一个存储器地址映射至存储器集合1430,将下一个存储器地址映射至存储器集合1432,并且将第三个地址映射至存储器集合1430等)。交错可以在存储器控制器1420内进行管理,或者从(例如,计算滑板800的)CPU插座跨网络链路到存储器集合1430、1432进行管理,并且与从同一存储器设备访问邻近的存储器地址相比,可以改进与执行存储器访问操作相关联的等待时间。
进一步地,在一些实施例中,存储器滑板1400可以通过波导、使用波导连接器1480连接到(例如,在同一机架240或者相邻的机架240中的)一个或多个其它滑板400。在说明性实施例中,波导是提供16个Rx(即,接收)通道和16个Rt(即,传输)通道的64毫米波导。在说明性实施例中,每一个通道是16Ghz或者32Ghz。在其它实施例中,频率可以不同。使用波导可以向另一滑板(例如,在与存储器滑板1400相同的机架240或者相邻的机架240中的滑板400)提供对存储器池(即,存储器集合1430、1432)的高吞吐量访问,而没有在光学数据连接器834上增加负荷。
现在参考图15,用于执行一个或多个工作负荷(例如,应用)的系统可以依照数据中心100来实现。在说明性实施例中,系统1510包括编排器服务器1520,所述编排器服务器1520可以体现为包括执行管理软件(例如,云操作环境,诸如OpenStack)的计算设备(例如,计算滑板800)的受管理节点,其通信地耦合到包括大量计算滑板1530(例如,每一个类似于计算滑板800)、存储器滑板1540(例如,每一个类似于存储器滑板1400)、加速器滑板1550(例如,每一个类似于存储器滑板1000)和存储滑板1560(例如,每一个类似于存储滑板1200)的多个滑板400。滑板1530、1540、1550、1560中的一个或多个可以被(诸如通过编排器服务器1520)分组到受管理节点1570中,以共同地执行工作负荷(例如,在虚拟机中或者在容器中执行的应用1532)。受管理节点1570可以体现为来自相同或不同滑板400的诸如处理器820、存储器资源720、加速器电路1020或者数据储存器1250之类的物理资源620的组装件。进一步地,受管理节点可以由编排器服务器1520在工作负荷要被分配给受管理节点时或者在任何其它时间来建立、限定或“起转(spin up)”,并且不管目前是否将任何工作负荷分配给受管理节点,都可以存在。在说明性实施例中,根据与用于工作负荷(例如,应用1532)的服务级别协议相关联的服务质量(QoS)目标(例如,与吞吐量、等待时间、每秒的指令数等相关联的性能目标),编排器服务器1520可以选择性地分配和/或解除分配来自滑板400的物理资源620和/或添加或移除来自受管理节点1570的一个或多个滑板400。在这么做时,编排器服务器1520可以接收指示受管理节点1570的每一个滑板400中的性能状况(例如,吞吐量、等待时间、每秒的指令数等)的遥测数据,并且将遥测数据与服务质量目标相比较以确定服务质量目标是否被满足。如果是这样的话,则编排器服务器1520可以附加地确定是否可以在仍然满足QoS目标时从受管理节点1570解除分配一个或多个物理资源,从而释放那些物理资源以用于在另一受管理节点中使用(例如,以执行不同的工作负荷)。替代地,如果目前没有满足QoS目标,则编排器服务器1520可以决定动态地分配附加的物理资源以在工作负荷(例如,应用1532)正在执行时帮助执行工作负荷。
另外,在一些实施例中,诸如通过标识工作负荷(例如,应用1532)的执行阶段(例如,其中执行不同操作的时间段,每一个操作具有不同的资源利用特性)以及抢先标识数据中心100中的可用资源并且(例如,在相关联的阶段开始的预定义的时间段内)将它们分配给受管理节点1570,编排器服务器1520可以标识工作负荷(例如,应用1532)的资源利用方面的趋势。在一些实施例中,编排器服务器1520可以基于各种等待时间和分发方案对性能进行建模,以在数据中心100中的计算滑板和其它资源(例如,加速器滑板、存储器滑板、存储滑板)之间放置工作负荷。例如,编排器服务器1520可以利用计及滑板400上的资源的性能(例如,FPGA性能、存储器访问等待时间等)以及通过网络到资源(FPGA)的路径的性能(例如,拥塞、等待时间、带宽)的模型。照此,编排器服务器1520可以基于与数据中心100中可用的每一个潜在资源相关联的总等待时间(例如,除了与在执行工作负荷的计算滑板与资源位于其上的滑板400之间的通过网络的路径相关联的等待时间之外,与资源本身的性能相关联的等待时间)来确定哪个(哪些)资源应当关于哪些工作负荷进行使用。
在一些实施例中,编排器服务器1520可以使用从滑板400报告的遥测数据(例如,温度、风扇速度等)来生成数据中心100中的热量生成图,并且根据热量生成图以及所预测的与不同工作负荷相关联的热量生成向受管理节点分配资源,以维持数据中心100中的目标温度和热量分布。附加地或者替代地,在一些实施例中,编排器服务器1520可以将所接收的遥测数据组织到分层模型中,所述分层模型指示受管理节点之间的关系(例如,空间关系,诸如数据中心100内的受管理节点的资源的物理位置,和/或功能关系,诸如通过受管理节点为其提供服务的顾客对受管理节点的分组、受管理节点通常执行的功能的类型、通常在彼此之间共享或交换工作负荷的受管理节点等)。基于受管理节点中的物理位置和资源方面的差异,给定的工作负荷可以跨不同的受管理节点的资源展现不同的资源利用(例如,引起不同的内部温度、使用处理器或存储器容量的不同百分比)。编排器服务器1520可以基于存储在分层模型中的遥测数据来确定所述差异,并且如果从一个受管理节点向另一受管理节点重新分配工作负荷,则将所述差异因素包括到对工作负荷的未来资源利用的预测中,以在数据中心100中准确地均衡资源利用。
为了减少编排器服务器1520上的计算负荷和网络上的数据转移负荷,在一些实施例中,编排器服务器1520可以将自测试信息发送给滑板400以使得每一个滑板400能够在本地(例如,在滑板400上)确定由滑板400生成的遥测数据是否满足一个或多个条件(例如,满足预定义的阈值的可用容量、满足预定义的阈值的温度等)。每一个滑板400然后可以将简化结果(例如,是或否)向后报告给编排器服务器1520,编排器服务器1520可以在确定资源到受管理节点的分配时利用所述简化结果。
现在参考图16,可以依照上文参考图1描述的数据中心100来实现用于基于受管理节点组成请求来分配数据中心中可用的资源以组成受管理节点的系统1600。在说明性实施例中,系统1600包括通信地耦合到多个滑板的编排器服务器1620,所述多个滑板包括多个计算滑板1630、多个加速器滑板1640、多个数据存储滑板1650和多个存储器滑板1660。每一个计算滑板1630包括一个或多个计算资源1632,并且在操作中执行应用1634(例如,工作负荷)。每一个加速器滑板1640包括一个或多个加速器资源1642。另外,每一个数据存储滑板1650包括一个或多个数据存储资源1652,并且每一个存储器滑板1660包括一个或多个存储器资源1662。滑板1630、1640、1650、1660中的一个或多个可以(诸如由编排器服务器1620)分组到受管理节点中,以共同执行工作负荷(例如,应用1634)。受管理节点可以体现为来自相同或不同滑板(例如,具有物理资源620的滑板400,计算滑板800、1530,加速器滑板1000、1550,存储滑板1200、1560或存储器滑板1400、1540)或机架(例如,机架240中的一个或多个)的资源1632、1642、1652、1662(例如,物理资源620、630)的组装件,所述资源1632、1642、1652、1662诸如是计算资源1632、加速器资源1642、存储资源1652、存储器资源1262或其它资源。
进一步地,受管理节点可以由编排器服务器1620在工作负荷要被分配给受管理节点时或者在任何其它时间建立、限定或“起转”,并且不管目前是否将任何工作负荷分配给受管理节点,都可以存在。系统1600可以位于数据中心中,并且向通过网络与系统1600通信的(未示出的)客户端设备提供存储和计算服务(例如,云服务)。编排器服务器1620可以支持云操作环境,诸如OpenStack,并且由编排器服务器1620建立的受管理节点可以代表(未示出的)客户端设备的用户诸如在虚拟机或者容器中执行一个或多个应用或过程(即,工作负荷)。
在使用中,如下面进一步讨论的,编排器服务器1620可以从计算滑板1630接收要组成受管理节点的受管理节点组成请求以执行工作负荷(例如,应用1634)。应当领会,在一些实施例中,可以从通过(未示出的)网络与系统1600通信的(未示出的)客户端设备的用户(例如,数据中心的客户)接收受管理节点组成请求。受管理节点组成请求可以包括服务级别协议(SLA)(例如,数据中心的客户与数据中心运营商之间的协议),其可以为针对其请求执行工作负荷的客户指示目标利用水平、吞吐量和/或等待时间(例如,服务质量(QoS)度量(metrics))。为了这么做,编排器服务器1620可以收集数据中心中的每一个滑板上的各个资源的资源级遥测数据和每一个机架的机架级聚合遥测数据。例如,每一个资源的资源级遥测数据可以指示数据中心中的每一个滑板上的对应资源的性能状况(例如,目前利用水平)。另外,每一个机架的机架级遥测数据可以指示对应机架的性能水平,诸如对应机架的功率使用、对应机架中的组件的出错率、以及到和来自对应机架中的资源1632、1642、1652、1662的入站和出站网络通信(例如,网络业务、网络分组、网络流等)的量。
响应于受管理节点组成请求的接收,编排器服务器1620可以根据资源级遥测数据和机架级遥测数据在滑板上选择资源集以组成满足受管理节点组成请求的受管理节点。例如,如果用于分配给作出请求的计算滑板1630的应用1634的SLA指示与工作负荷相关联的相对高的目标QoS,则编排器服务器1620可以选择不仅具有足够容量(例如,足够低的目前利用)来代表工作负荷以目标QoS执行功能、而且位于具有与目标QoS相应的可靠性和容量水平(例如,架顶式交换机上的低网络负荷、相对低的出错率等)的(多个)机架中的资源集。应当领会,编排器服务器1620可以分配计算滑板1630的一个或多个计算资源1632、加速器滑板1640的一个或多个加速器资源1642、存储滑板1650的一个或多个存储资源1652以及存储器滑板1660的一个或多个存储器资源1662以组成满足在受管理节点请求中指示的目标QoS的受管理节点。例如,如图16中所示,编排器服务器1620可以分配计算滑板1630A的一个或多个计算资源1632A、加速器滑板1640A的一个或多个加速器资源1642A、存储滑板1650A的一个或多个存储资源1652A以及存储器滑板1660A的一个或多个存储器资源1662A来组成满足来自计算滑板1630A的受管理节点请求的受管理节点1670。
在说明性实施例中,计算滑板1630可以体现为具有能够执行工作负荷(例如,应用1634)并执行本文中描述的其它功能的中央处理单元(CPU)的任何类型的计算设备,所述其它功能包括请求编排器服务器1620组成受管理节点以执行工作负荷。例如,计算滑板1630可以体现为具有物理资源620的滑板400,计算滑板800、1530,计算机,分布式计算系统,多处理器系统,网络器具(例如,物理的或虚拟的),台式计算机,工作站,膝上型计算机,笔记本计算机,基于处理器的系统,或者网络器具。
加速器滑板1640可以体现为具有物理资源620的滑板400或者加速器滑板1000、1550,并且包括一个或多个加速器资源1642。每一个加速器资源1642可以体现为设备,诸如集成电路、嵌入式系统、现场可编程阵列(FPGA)、片上系统(SoC)、专用集成电路(ASIC)、可再配置的硬件或硬件电路、或者能够与计算滑板1630和编排器服务器1620通信并(例如,以与工作负荷相关联的SLA中指定的速度)执行要加速以满足受管理节点组成请求的工作负荷的一个或多个部分的其它专门的硬件。如图16中所示,每一个加速器资源1642进一步包括一个或多个加速器设备1644。在一些实施例中,加速器设备可以体现为协处理器、嵌入式电路、ASIC、FPGA和/或其它专门的电路。应当理解,每一个加速器滑板1640可以在对应的滑板1640上包括不同数目的加速器资源1642,并且每一个加速器资源1642可以在对应的加速器资源1642上包括不同数目的加速器设备1644。
现在参考图17,编排器服务器1620可以体现为能够执行本文中描述的功能的任何类型的计算设备,所述功能包括接收来自每一个资源的资源级遥测数据、来自每一个机架的机架级聚合遥测数据以及来自计算滑板1630的受管理节点组成请求,确定用来组成满足受管理节点组成请求的要执行工作负荷的受管理节点的资源集,以及响应于资源集的确定而将资源集分配给作出请求的计算滑板1630以组成受管理节点。如图17中所示,说明性编排器服务器1620包括计算引擎1710、输入/输出(I/O)子系统1720、通信电路1730、一个或多个数据存储设备1740、以及受管理节点组成逻辑单元1750。应当领会,在其它实施例中,编排器服务器1620可以包括其它或附加组件,诸如在计算机中通常找到的那些(例如,外围设备)。另外,在一些实施例中,说明性组件中的一个或多个可以被合并于另一组件中,或者以其它方式形成另一组件的部分。
计算引擎1710可以体现为能够执行下文描述的各种计算功能的任何类型的设备或者设备的集合。在一些实施例中,计算引擎1710可以体现为单个设备,诸如集成电路、嵌入式系统、现场可编程门阵列(FPGA)、片上系统(SoC)或者其它集成系统或设备。在说明性实施例中,计算引擎1710包括或者体现为处理器1712和存储器1714。处理器1712可以体现为能够执行本文中描述的功能的任何类型的处理器。例如,处理器1712可以体现为(多个)单核或多核处理器、微控制器或者其它处理器或处理/控制电路。在一些实施例中,处理器1712可以体现为、包括或者耦合到FPGA、专用集成电路(ASIC)、可再配置的硬件或硬件电路、或者其它专门的硬件,用来促进本文中描述的功能的执行。
存储器1714可以体现为能够执行本文中描述的功能的任何类型的易失性存储器(例如,动态随机存取存储器(DRAM)等)或者非易失性存储器或数据储存器。易失性存储器可以是要求电力来维持由介质存储的数据的状态的存储介质。易失性存储器的非限制性示例可以包括各种类型的随机存取存储器(RAM),诸如动态随机存取存储器(DRAM)或静态随机存取存储器(SRAM)。可以在存储器模块中使用的一个特定类型的DRAM是同步动态随机存取存储器(SDRAM)。在特定实施例中,存储器组件的DRAM可以遵从由JEDEC颁布的标准,诸如用于DDR SDRAM的JESD79F、用于DDR2 SDRAM的JESD79-2F、用于DDR3 SDRAM的JESD79-3F、用于DDR4 SDRAM的JESD79-4A、用于低功率DDR(LPDDR)的JESD209、用于LPDDR2的JESD209-2、用于LPDDR3的JESD209-3以及用于LPDDR4的JESD209-4(这些标准在www.jedec.org处可获得)。这样的标准(以及类似的标准)可以被称为基于DDR的标准,并且实现这样的标准的存储设备的通信接口可以被称为基于DDR的接口。
在一个实施例中,存储器设备是块可寻址存储器设备,诸如基于NAND或NOR技术的那些。存储器设备还可以包括未来一代非易失性设备,诸如三维交叉点存储器设备(例如,英特尔3D XpointTM存储器)或其它字节可寻址的在适当的位置写入的非易失性存储器设备。在一个实施例中,存储器设备可以是或者可以包括使用硫属化物玻璃的存储器设备,多阈值水平NAND闪速存储器,NOR闪速存储器,单或多级相变存储器(PCM),电阻存储器,纳米线存储器,铁电晶体管随机存取存储器(FeTRAM),反铁电存储器,合并忆阻器技术的磁阻随机存取存储器(MRAM)存储器,包括金属氧化物基底、氧空位基底和传导桥随机存取存储器(CB-RAM)的电阻存储器,或者自旋转移扭矩(STT)-MRAM,基于自旋电子磁结存储器的设备,基于磁隧道结(MTJ)的设备,基于DW(畴壁)和SOT(自旋轨道转移)的设备,基于半导体闸流管的存储器设备,或上文中的任何存储器设备的组合,或者其它存储器。存储器设备可以是指管芯本身和/或经封装的存储器产品。
在一些实施例中,3D交叉点架构(例如,英特尔3D XpointTM存储器)可以包括无晶体管的可堆叠交叉点架构,其中存储器单元位于字线和位线的交叉处且可被单独地寻址并且其中位存储基于体电阻中的改变。在一些实施例中,存储器1714的全部或部分可以集成到处理器1712中。在操作中,存储器1714可以存储在操作期间使用的各种软件和数据,诸如资源利用数据、资源可用性数据、应用编程接口(API)数据、应用、程序和库。
计算引擎1710经由I/O子系统1720通信地耦合到编排器服务器1620的其它组件,所述I/O子系统1720可以体现为用来利用计算引擎1710(例如,利用处理器1712和/或存储器1714)和编排器服务器1620的其它组件促进输入/输出操作的电路和/或组件。例如,I/O子系统1720可以体现为或者以其它方式包括存储器控制器中枢、输入/输出控制中枢、集成传感器中枢、固件设备、通信链路(例如,点对点链路、总线链路、导线、线缆、光导、印刷电路板迹线等)和/或用来促进输入/输出操作的其它组件和子系统。在一些实施例中,I/O子系统1720可以形成片上系统(SoC)的部分并且连同处理器1712、存储器1714和编排器服务器1620的其它组件中的一个或多个被合并到计算引擎1710中。
通信电路1730可以体现为能够使得能实现编排器服务器1620与另一计算设备(例如,滑板1630、1640、1650、1660)之间的通信的任何通信电路、设备或其集合。通信电路1730可以被配置成使用任何一个或多个通信技术(例如,有线或无线通信)和相关联的协议(例如,以太网、蓝牙®、Wi-Fi®、WiMAX等)来实现这样的通信。通信电路1730可以包括网络接口控制器(NIC)1732(例如,作为内插设备),其还可以被称为主机结构接口(HFI)。NIC 1732可以体现为一个或多个内插板、子卡、网络接口卡、控制器芯片、芯片组、或者可以由编排器服务器1620使用以与另一计算设备(例如,滑板1630、1640、1650、1660)连接的其它设备。在一些实施例中,NIC 1732可以体现为包括一个或多个处理器的片上系统(SoC)的部分,或者被包括在也包含一个或多个处理器的多芯片封装上。在一些实施例中,NIC 1732可以包括(未示出的)本地处理器和/或(未示出的)本地存储器,其二者对NIC 1732而言都是本地的。在这样的实施例中,NIC 1732的本地处理器可以能够执行本文中描述的计算引擎1710的功能中的一个或多个。附加地或者替代地,在这样的实施例中,NIC 1732的本地存储器可以在板级别、插座级别、芯片级别和/或其它级别处集成到编排器服务器1620的一个或多个组件中。
所述一个或多个说明性数据存储设备1740可以体现为被配置用于数据的短期或长期存储的任何类型的设备,诸如例如存储器设备和电路、存储器卡、硬盘驱动器、固态驱动器或其它数据存储设备。每一个数据存储设备1740可以包括存储用于数据存储设备1740的数据和固件代码的系统分区。每一个数据存储设备1740还可以包括存储用于操作系统的数据文件和可执行文件的一个或多个操作系统分区。编排器服务器1620还可以包括受管理节点组成逻辑单元1750,其可以体现为能够确定数据中心中的哪些资源应当被选择用于包括在受管理节点中以在满足与工作负荷相关联的一组服务质量度量的情况下执行工作负荷的任何设备或电路(例如,处理器、协处理器、FPGA、ASIC等)。
应当领会,编排器服务器1620和滑板1630、1640、1650、1660可以经由网络进行通信,所述网络可以体现为任何类型的有线或无线通信网络,包括全球网络(例如,因特网)、局域网(LAN)或广域网(WAN)、蜂窝网络(例如,全球移动通信系统(GSM)、3G、长期演进(LTE)、全球微波接入互操作性(WiMAX)等)、数字订户线(DSL)网络、线缆网络(例如,同轴网络、光纤网络等)或其任何组合。
现在参考图18,编排器服务器1620可以在操作期间建立环境1800。在说明性实施例中,环境1800包括资源数据1802和受管理节点参数数据1804。资源数据1802可以体现为指示每一个资源的目前利用水平和类型(例如,计算、加速器、数据存储、存储器)和每一个机架的目前性能水平的任何数据。照此,资源数据1802可以包括指示与工作负荷相关联的每一个滑板1630、1640、1650、1660中的性能状况的遥测数据,诸如每一个滑板的每一个资源上的目前负荷(例如,工作负荷目前利用的资源的百分比)。另外,资源数据1802可以进一步包括指示对应机架的性能水平的机架级遥测数据,诸如对应机架的功率使用、对应机架中的组件的出错率、以及从每一个机架的架顶式交换机接收的每一个机架的拥塞数据。拥塞数据指示到和来自对应机架中的资源1632、1642、1652、1662的入站和出站网络通信(例如,网络业务、网络分组、网络流等)的量。受管理节点参数数据1804可以体现为指示被请求组成以执行工作负荷的受管理节点的参数的任何数据。例如,受管理节点参数数据可以包括服务级别协议(SLA),其可以指示与所请求的工作负荷相关联的目标服务质量(QoS)度量(例如,目标利用水平、目标吞吐量和/或等待时间、目标可靠性和容量(例如,功率使用、架顶式交换机上的网络负荷、出错率等))。
另外,说明性环境1800包括网络通信器1820、所请求的节点参数确定器1830、资源分析器1840和资源分配管理器1850。资源分析器1840进一步包括遥测数据分析器1842。环境1800的组件中的每一个的实施例可以体现为硬件、固件、软件或其组合。照此,在一些实施例中,环境1800的组件中的一个或多个可以体现为电路或电气设备的集合(例如,网络通信器电路1820、所请求的节点参数确定器电路1830、资源分析器电路1840、遥测数据分析器电路1842、资源分配管理器电路1850等)。应当领会,在这样的实施例中,网络通信器电路1820、所请求的节点参数确定器电路1830、资源分析器电路1840、遥测数据分析器电路1842或资源分配管理器电路1850中的一个或多个可以形成计算引擎1710、I/O子系统1720、通信电路1730、受管理节点组成逻辑单元1750和/或编排器服务器1620的其它组件中的一个或多个的部分。
在说明性环境1800中,网络通信器1820被配置成分别促进到和来自编排器服务器1620的进站和出站网络通信(例如,网络业务、网络分组、网络流等),所述网络通信器1820如上文所讨论的那样可以体现为硬件、固件、软件、虚拟化硬件、所模拟的架构和/或其组合。为了这么做,网络通信器1820被配置成接收和处理来自一个系统或计算设备(例如,滑板1630、1640、1650、1660中的一个或多个)的数据分组,并且准备且发送数据分组给另一计算设备或系统(例如,数据中心中的滑板和/或资源)。相应地,在一些实施例中,网络通信器1820的功能性的至少一部分可以由通信电路1730来执行并且在说明性实施例中由NIC1732来执行。例如,在说明性实施例中,网络通信器1820从每一个资源接收资源级遥测数据并且从数据中心中的每一个机架接收机架级聚合遥测数据。
所请求的节点参数确定器1830被配置成分析从作出请求的计算滑板1630接收的受管理节点组成请求以确定被请求组成以执行工作负荷的受管理节点的一个或多个参数,所述所请求的节点参数确定器1830可以体现为硬件、固件、软件、虚拟化硬件、所模拟的架构和/或其组合。如上文所讨论的,受管理节点组成请求可以包括服务级别协议(SLA),其按照与为其执行工作负荷的客户的服务级别协议(SLA)可以指示与工作负荷相关联的目标服务质量(QoS)度量(例如,目标利用水平、目标吞吐量和/或等待时间、目标可靠性和容量(例如,功率使用、架顶式交换机上的网络负荷、出错率等))。如下文所讨论的,可以将所请求的组成的节点的所请求参数与数据中心中可用的资源和滑板的资源数据1802进行比较,以确定满足组成的节点的所请求参数的资源集。
资源分析器1840被配置成分析从数据中心中可用的资源1632、1642、1652、1662和滑板1630、1640、1650、1660接收的资源数据1802来确定满足受管理节点组成请求中指示的QoS度量的资源集,所述资源分析器1840可以体现为硬件、固件、软件、虚拟化硬件、所模拟的架构和/或其组合。如上文所讨论的,资源数据1802包括从各个资源接收的资源级遥测数据和从机架接收的机架级聚合遥测数据,其由遥测数据分析器1842分析。遥测数据分析器1842可以分析从每一个资源接收的资源级遥测数据,以确定数据中心中的每一个滑板上的各个资源的性能状况(例如,每一个数据存储设备、每一个加速器设备等的目前利用)。另外,遥测数据分析器1842可以进一步分析从每一个滑板接收的聚合遥测数据,以确定对应机架的功率使用、对应机架中的组件的出错率、以及对应机架上的网络负荷(例如,架顶式交换机上的网络负荷))。
资源分析器1840可以被进一步配置成确定从单个资源到请求编排器服务器1620组成受管理节点的作出请求的计算滑板1630的距离。例如,距离可以是物理距离和/或网络距离(即,网络跳数)。应当领会,网络距离或网络跳数是指在作出请求的计算滑板1630和具有满足目标QoS的一个或多个资源的滑板之间的数据必须经过的中间设备的数目。换言之,资源分析器1840可以确定最短路径(例如,物理距离和/或网络距离)并且优先考虑(prioritize)来自满足目标QoS的可用资源的具有到作出请求的计算滑板1630的最短路径的资源,所述可用资源可以由资源分配管理器1850用来分配资源以组成受管理节点。
资源分配管理器1850被配置成选择性地分配满足如由所请求的节点参数确定器1830确定的所请求的节点参数的资源集来组成受管理节点,所述资源分配管理器1850可以体现为硬件、固件、软件、虚拟化硬件、所模拟的架构和/或其组合。响应于将资源分配给受管理节点的请求,资源分配管理器1850根据资源级遥测数据以及机架级聚合遥测数据来选择滑板上的资源。照此,对于(例如,与用于分配给计算滑板1630以包括在受管理节点中的应用的SLA相关联的)相对高的目标服务质量(QoS),资源分配管理器1850可以选择不仅具有充足容量(例如,足够低的目前利用)来代表工作负荷以目标服务质量执行功能、而且还位于具有与目标服务质量相应的可靠性和容量水平(例如,架顶式交换机上的低网络负荷、相对低的出错率等)的(多个)机架中的资源。进一步地,资源分配管理器1850可以跨机架来分发对资源的分配以均衡机架的功率利用。例如,资源分配管理器1850可以分发对资源的分配以维持数据中心中的热量产生的均匀分布。在一些实施例中,资源分配管理器1850可以优先考虑从满足目标QoS的可用资源池中选择具有到作出请求的计算滑板1630的最短路径(例如,物理距离和/或网络距离)的资源。在这么做时,资源分配管理器1850可以最小化从作出请求的计算滑板1630到要分配的资源集的总距离。例如,可以通过计算每一个资源距作出请求的计算滑板1630的平均距离并将平均距离乘以与要添加的资源集相对应的滑板的数目来确定总距离。应当领会,在一些实施例中,资源分配管理器1850可以集中在根据要执行的工作负荷的类型来最小化特定类型的滑板的距离上。例如,如果所请求的工作负荷包括加速器密集功能,则资源分配管理器1850可以最小化加速器滑板距作出请求的计算滑板1630的距离。
现在参考图19-21,编排器服务器1620在操作中可以执行方法1900,用于分配数据中心中可用的资源以组成由计算滑板1630请求的受管理节点。方法1900以框1902开始,其中编排器服务器1620接收可用资源1632、1642、1652、1662的遥测数据。为了这么做,在框1904中,编排器服务器1620从数据中心100中的所述多个资源1632、1642、1652、1662中的每一个接收资源级遥测数据。另外,在框1906中,编排器服务器1620从数据中心中的每一个机架接收机架级聚合遥测数据。在一些实施例中,如框1908中所图示的,编排器服务器1620可以从用于每一个机架的架顶式交换机接收拥塞数据。如上文所讨论的,架顶式交换机是机架的网络交换机,其通信地耦合到对应机架中的多个滑板1630、1640、1650、1660并且可以分别促进到和来自对应机架中的资源的入站和出站网络通信(例如,网络业务、网络分组、网络流等)。
在框1910中,编排器服务器1620从作出请求的计算滑板1630接收与工作负荷相关联的受管理节点组成请求。如框1912中所指示的,编排器服务器1620在接收受管理节点组成请求时可以接收服务级别协议(SLA),所述服务级别协议(SLA)指示与请求由组成的受管理节点执行的工作负荷相关联的目标服务质量(QoS)。如上文所讨论的,目标QoS可以包括目标利用水平、目标性能水平、目标等待时间、目标吞吐量、每秒输入/输出操作的目标数目,和/或每秒执行的指令的目标数目。
在框1914中,编排器服务器1620确定是否已从计算滑板1630接收到受管理节点请求。如果尚未接收到受管理节点请求,则方法1900循环回到框1902以继续接收可用资源1632、1642、1652、1662的遥测数据。然而,如果编排器服务器1620确定已从计算滑板1630接收到受管理节点请求,则方法1900前进到图20中示出的框1916。
在图20中示出的框1916中,编排器服务器1620确定目前数据中心中可用的每一个资源的目前资源利用水平。为了这么做,编排器服务器1620基于(例如,来自框1904的)来自对应资源的遥测数据确定每一个资源的资源利用水平,如框1918中所指示的。例如,资源的资源利用可以指示可用于代表工作负荷执行功能的对应资源的容量。
如上文所讨论的,在说明性实施例中,编排器服务器1620被配置成选择不仅具有足够的容量来代表工作负荷以目标服务质量(QoS)执行功能、而且位于具有与目标QoS相应的可靠性和容量水平的一个或多个机架中的资源。为了这么做,编排器服务器1620确定目前数据中心中的每一个机架的性能水平,如框1920中所指示的。例如,在一些实施例中,编排器服务器1620可以基于(例如,从框1906)从对应机架接收的机架级聚合遥测数据来确定每一个机架的性能水平,如框1922中所指示的。可选地或附加地,编排器服务器1620可以聚合(例如,从框1904)从同一机架上的资源接收的资源级遥测数据来确定每一个机架的性能水平,如框1924中所指示的。
在其它实施例中,编排器服务器1620可以基于由编排器服务器1620聚合的机架级聚合遥测数据和/或资源级遥测数据来确定每一个机架的可靠性和容量的水平。例如,每一个机架的可靠性和容量的水平可以指示对应机架的功率使用、对应机架中的资源的出错率、和/或包括到和来自对应机架的通信的网络负荷。在确定每一个可用资源的目前资源利用和每一个机架的性能水平二者之后,方法1900进行到图21中示出的框1928。
在图21中示出的框1928中,编排器服务器1620确定用于受管理节点组成的资源集。在说明性实施例中,编排器服务器1620确定具有足够容量以以目标服务质量(QoS)执行工作负荷的资源集,如框1930中图示的。为了这么做,在框1932中,编排器服务器1620确定具有比目标利用水平小的利用水平的资源集,如在(例如,来自框1910的)与工作负荷相关联的服务水平协议(SLA)中所指示的。应当领会,如果资源的利用水平小于目标利用水平,则编排器服务器1620确定资源具有足够的容量来代表工作负荷以目标QoS执行功能。另外,在框1934的说明性实施例中,编排器服务器1620针对具有足够容量来执行工作负荷的资源集中的每一个资源,确定对应的机架是否满足如在(例如,来自框1910的)与工作负荷相关联的服务水平协议(SLA)中所指示的目标性能水平。
在一些实施例中,编排器服务器1620可以确定数据中心的拓扑,并且在将资源分配给受管理节点时,编排器服务器1620可以进一步确定从作出请求的计算滑板1630到具有(例如,来自框1930-1934的)满足目标QoS的可以分配给受管理节点的资源的滑板的路径。例如,编排器服务器1620可以优先考虑基于从作出请求的计算滑板1630到具有满足目标QoS的一个或多个资源的每一个滑板的距离来选择资源,如框1936中所图示的。应当领会,距离可以是物理距离和/或网络距离(例如,网络跳数)。如上文所讨论的,网络距离是指在作出请求的计算滑板1630和具有满足目标QoS的一个或多个资源的滑板之间的数据必须经过的中间设备的数目。在一些实施例中,编排器服务器1620可以确定具有小于预定义阈值的对应滑板和作出请求的计算滑板1630之间的物理距离和/或网络距离的资源。
在一些实施例中,编排器服务器1620可以优先考虑基于作出请求的计算滑板1630与对应于每一个资源的每一个滑板之间的物理距离来选择资源集,如框1938中所指示的。附加地或替代地,编排器服务器1620可以优先考虑基于作出请求的计算滑板1630与对应于每一个资源的每一个滑板之间的网络距离来选择资源集,如框1940中所指示的。换言之,编排器服务器1620可以确定最短路径(例如,物理距离和/或网络距离)并且优先考虑从(例如,来自框1930-1934的)满足目标QoS的可用资源中选择具有到作出请求的计算滑板1630的最短路径的资源。在这么做时,资源分配管理器1850可以最小化从作出请求的计算滑板1630到要分配的资源集的总距离。例如,可以通过计算每一个资源距作出请求的计算滑板1630的平均距离乘以与要添加的资源集相对应的滑板的数目来确定总距离。应当领会,在一些实施例中,资源分配管理器1850可以集中在根据要执行的工作负荷的类型来最小化特定类型的滑板的距离上。例如,如果所请求的工作负荷包括加速器密集功能,则资源分配管理器1850可以最小化加速器滑板距作出请求的计算滑板1630的距离。
随后,在框1942中,编排器服务器1620分配所确定的资源集以组成满足来自作出请求的计算滑板1630的受管理节点组成请求的受管理节点。为了这么做,编排器服务器1620可以将每一个确定的资源的唯一地址传输到作出请求的计算滑板1630以组成所请求的受管理节点。
示例
下文提供了本文中公开的技术的说明性实例。技术的实施例可以包括下文描述的示例中的任何一个或多个以及任何组合。
示例1包括一种计算设备,所述计算设备包括通信电路;以及计算引擎,其要(i)接收针对多个资源中的每一个资源的资源级遥测数据和来自多个机架中的每一个机架的机架级遥测数据,每一个机架具有所述多个资源中的一个或多个,(ii)接收受管理节点组成请求,其中受管理节点组成请求标识要由受管理节点实现的至少一个度量,(iii)响应于受管理节点组成请求的接收,确定所述多个资源中的每一个资源的目前利用,(iv)响应于受管理节点组成请求的接收,确定所述多个机架中的每一个机架的目前性能水平,以及(v)基于资源级和机架级遥测数据从所述多个资源确定满足受管理节点组成请求的资源集。
示例2包括示例1的主题,并且其中所述多个资源是不同类型的,并且每一个类型的资源被托管在不同的滑板上。
示例3包括示例1和2中的任何示例的主题,并且其中要接收机架级遥测数据包括要从每一个机架的架顶式交换机接收拥塞数据。
示例4包括示例1-3中的任何示例的主题,并且其中要接收与工作负荷相关联的受管理节点组成请求包括要接收指示与工作负荷相关联的一个或多个服务质量度量的服务级别协议。
示例5包括示例1-4中的任何示例的主题,并且其中受管理节点组成请求包括目标性能水平。
示例6包括示例1-5中的任何示例的主题,并且其中要确定每一个资源的目前利用包括要基于从对应资源接收的资源级遥测数据来确定每一个资源的目前利用。
示例7包括示例1-6中的任何示例的主题,并且其中要确定每一个机架的目前利用包括要基于从对应机架接收的机架级遥测数据来确定每一个机架的性能水平。
示例8包括示例1-7中的任何示例的主题,并且其中要确定每一个机架的目前利用包括要聚合从公共机架上的资源接收的资源级遥测数据以确定该公共机架的性能水平。
示例9包括示例1-8中的任何示例的主题,并且其中要确定每一个机架的目前利用包括要基于从对应机架接收的机架级遥测数据来确定每一个机架的可靠性和容量。
示例10包括示例1-9中的任何示例的主题,并且其中要确定每一个机架的目前利用包括要基于由编排器服务器聚合的资源级遥测数据来确定每一个机架的可靠性和容量。
示例11包括示例1-10中的任何示例的主题,并且其中要从所述多个资源确定满足受管理节点组成请求的资源集包括要确定具有足够容量以在受管理节点组成请求中指示的目标服务质量度量下执行工作负荷的资源集。
示例12包括示例1-11中的任何示例的主题,并且其中要确定具有足够容量以在目标服务质量度量下执行工作负荷的资源集包括要确定具有比在受管理节点组成请求中指示的目标利用水平小的利用水平的资源集。
示例13包括示例1-12中的任何示例的主题,并且其中要从所述多个资源确定满足受管理节点组成请求的资源集包括要确定与资源集中的每一个资源相对应的机架是否满足受管理节点组成请求中指示的目标性能水平。
示例14包括示例1-13中的任何示例的主题,并且其中要从所述多个资源确定满足受管理节点组成请求的资源集包括要基于从作出请求的设备到对应资源的距离给来自所述多个资源的满足受管理节点组成请求的资源集划分优先级。
示例15包括示例1-14中的任何示例的主题,并且其中距离包括从作出请求的设备到对应资源的物理距离。
示例16包括示例1-15中的任何示例的主题,并且其中距离包括从作出请求的设备到对应资源的网络距离。
示例17包括示例1-16中的任何示例的主题,并且其中计算引擎进一步要分配资源集以组成满足受管理节点组成请求的受管理节点。
示例18包括示例1-17中的任何示例的主题,并且其中要分配资源集以组成满足受管理节点组成请求的受管理节点包括要将资源集中的每一个资源的唯一地址传输到作出请求的设备。
示例19包括一种方法,所述方法包括通过编排器服务器从多个资源中的每一个资源接收资源级遥测数据,并且从多个机架中的每一个机架接收机架级机架级遥测数据,每一个机架具有所述多个资源中的一个或多个;通过编排器服务器从作出请求的设备接收与工作负荷相关联的受管理节点组成请求,其中受管理节点组成请求标识要由受管理节点实现的至少一个度量;响应于受管理节点组成请求的接收并且通过编排器服务器来确定所述多个资源中的每一个资源的目前利用;响应于受管理节点组成请求的接收并且通过编排器服务器来确定所述多个机架中的每一个机架的目前性能水平;以及通过编排器服务器、基于资源级和机架级遥测数据从所述多个资源确定满足受管理节点组成请求的资源集。
示例20包括示例19的主题,并且其中所述多个资源是不同类型的,并且每一个类型的资源被托管在不同的滑板上。
示例21包括示例19和20中的任何示例的主题,并且其中接收机架级遥测数据包括通过编排器服务器从每一个机架的架顶式交换机接收拥塞数据。
示例22包括示例19-21中的任何示例的主题,并且其中接收与工作负荷相关联的受管理节点组成请求包括通过编排器服务器接收指示与工作负荷相关联的一个或多个服务质量度量的服务级别协议。
示例23包括示例19-22中的任何示例的主题,并且其中受管理节点组成请求包括目标性能水平。
示例24包括示例19-23中的任何示例的主题,并且其中确定每一个资源的目前利用包括通过编排器服务器、基于从对应资源接收的资源级遥测数据来确定每一个资源的目前利用。
示例25包括示例19-24中的任何示例的主题,并且其中确定每一个机架的目前利用包括通过编排器服务器、基于从从对应机架接收的机架级遥测数据来确定每一个机架的性能水平。
示例26包括示例19-25中的任何示例的主题,并且其中确定每一个机架的目前利用包括通过编排器服务器聚合从公共机架上的资源接收的资源级遥测数据以确定该公共机架的性能水平。
示例27包括示例19-26中的任何示例的主题,并且其中确定每一个机架的目前利用包括通过编排器服务器、基于从对应的机架接收的机架级遥测数据来确定每一个机架的可靠性和容量。
示例28包括示例19-27中的任何示例的主题,并且其中确定每一个机架的目前利用包括通过编排器服务器、基于由编排器服务器聚合的资源级遥测数据来确定每一个机架的可靠性和容量。
示例29包括示例19-28中的任何示例的主题,并且其中从所述多个资源确定满足受管理节点组成请求的资源集包括通过编排器服务器确定具有足够容量以在受管理节点组成请求中指示的目标服务质量度量下执行工作负荷的资源集。
示例30包括示例19-29中的任何示例的主题,并且其中确定具有足够容量以在目标服务质量度量下执行工作负荷的资源集包括通过编排器服务器确定具有比在受管理节点组成请求中指示的目标利用水平小的利用水平的资源集。
示例31包括示例19-30中的任何示例的主题,并且其中从所述多个资源确定满足受管理节点组成请求的资源集包括通过编排器服务器确定与资源集中的每一个资源相对应的机架是否满足受管理节点组成请求中指示的目标性能水平。
示例32包括示例19-31中的任何示例的主题,并且其中从所述多个资源确定满足受管理节点组成请求的资源集包括通过编排器服务器、基于从作出请求的设备到对应资源的距离给来自所述多个资源的满足受管理节点组成请求的资源集划分优先级。
示例33包括示例19-32中的任何示例的主题,并且其中距离包括从作出请求的设备到对应资源的物理距离。
示例34包括示例19-33中的任何示例的主题,并且其中距离包括从作出请求的设备到对应资源的网络距离。
示例35包括示例19-34中的任何示例的主题,并且进一步包括通过编排器服务器分配资源集以组成满足受管理节点组成请求的受管理节点。
示例36包括示例19-35中的任何示例的主题,并且其中分配资源集以组成满足受管理节点组成请求的受管理节点包括通过编排器服务器将资源集中的每一个资源的唯一地址传输到作出请求的设备。
示例37包括一个或多个机器可读存储介质,其包括存储在其上的多个指令,所述多个指令响应于被执行而使计算引擎执行示例19-36中的任何示例的方法。
示例38包括一种计算设备,所述计算设备包括用于执行示例19-36中的任何示例的方法的部件。
示例39包括一种计算设备,所述计算设备包括网络通信器电路,其要从多个资源中的每一个资源接收资源级遥测数据并且从多个机架中的每一个机架接收机架级遥测数据,每一个机架具有所述多个资源中的一个或多个,并从作出请求的设备接收与工作负荷相关联的受管理节点组成请求,其中受管理节点组成请求标识要由受管理节点实现的至少一个度量;资源分析器电路,其要响应于受管理节点组成请求的接收,确定所述多个资源中的每一个资源的目前利用和所述多个机架中的每一个机架的目前性能水平;以及资源分配管理器电路,其要基于资源级和机架级遥测数据从所述多个资源确定满足受管理节点组成请求的资源集并且分配该资源集以组成满足受管理节点组成请求的受管理节点。
示例40包括示例39的主题,并且其中所述多个资源是不同类型的,并且每一个类型的资源被托管在不同的滑板上。
示例41包括示例39和40中的任何示例的主题,并且其中要接收机架级遥测数据包括要从每一个机架的架顶式交换机接收拥塞数据。
示例42包括示例39-41中的任何示例的主题,并且其中要接收与工作负荷相关联的受管理节点组成请求包括要接收指示与工作负荷相关联的一个或多个服务质量度量的服务级别协议。
示例43包括示例39-42中的任何示例的主题,并且其中受管理节点组成请求包括目标性能水平。
示例44包括示例39-43中的任何示例的主题,并且其中要确定每一个资源的目前利用包括要基于从对应资源接收的资源级遥测数据来确定每一个资源的目前利用。
示例45包括示例39-44中的任何示例的主题,并且其中要确定每一个机架的目前利用包括要基于从对应机架接收的机架级遥测数据来确定每一个机架的性能水平。
示例46包括示例39-45中的任何示例的主题,并且其中要确定每一个机架的目前利用包括要聚合从公共机架上的资源接收的资源级遥测数据以确定该公共机架的性能水平。
示例47包括示例39-46中的任何示例的主题,并且其中要确定每一个机架的目前利用包括要基于从对应机架接收的机架级遥测数据来确定每一个机架的可靠性和容量。
示例48包括示例39-47中的任何示例的主题,并且其中要确定每一个机架的目前利用包括要基于由编排器服务器聚合的资源级遥测数据来确定每一个机架的可靠性和容量。
示例49包括示例39-48中的任何示例的主题,并且其中要从所述多个资源确定满足受管理节点组成请求的资源集包括要确定具有足够容量以在受管理节点组成请求中指示的目标服务质量度量下执行工作负荷的资源集。
示例50包括示例39-49中的任何示例的主题,并且其中要确定具有足够容量以在目标服务质量度量下执行工作负荷的资源集包括要确定具有比在受管理节点组成请求中指示的目标利用水平小的利用水平的资源集。
示例51包括示例39-50中的任何示例的主题,并且其中要从所述多个资源确定满足受管理节点组成请求的资源集包括要确定与资源集中的每一个资源相对应的机架是否满足受管理节点组成请求中指示的目标性能水平。
示例52包括示例39-51中的任何示例的主题,并且其中要从所述多个资源确定满足受管理节点组成请求的资源集包括要基于从作出请求的设备到对应资源的距离给来自所述多个资源的满足受管理节点组成请求的资源集划分优先级。
示例53包括示例39-52中的任何示例的主题,并且其中距离包括从作出请求的设备到对应资源的物理距离。
示例54包括示例39-53中的任何示例的主题,并且其中距离包括从作出请求的设备到对应资源的网络距离。
示例55包括示例39-54中的任何示例的主题,并且其中要分配资源集以组成满足受管理节点组成请求的受管理节点包括要将资源集中的每一个资源的唯一地址传输到作出请求的设备。
示例56包括一种计算设备,所述计算设备包括用于从多个资源中的每一个资源接收资源级遥测数据并且从多个机架中的每一个机架接收机架级遥测数据的电路,每一个机架具有所述多个资源中的一个或多个;用于从作出请求的设备接收与工作负荷相关联的受管理节点组成请求的电路,其中受管理节点组成请求标识要由受管理节点实现的至少一个度量;用于响应于受管理节点组成请求的接收而确定所述多个资源中的每一个资源的目前利用的部件;用于响应于受管理节点组成请求的接收而确定所述多个机架中的每一个机架的目前性能水平的部件;以及用于基于资源级和机架级遥测数据从所述多个资源确定满足受管理节点组成请求的资源集的部件。
示例57包括示例56的主题,并且其中所述多个资源是不同类型的,并且每一个类型的资源被托管在不同的滑板上。
示例58包括示例56和57中的任何示例的主题,并且其中接收机架级遥测数据的电路包括从每一个机架的架顶式交换机接收拥塞数据的电路。
示例59包括示例56-58中的任何示例的主题,并且其中用于接收与工作负荷相关联的受管理节点组成请求的电路包括用于接收指示与工作负荷相关联的一个或多个服务质量度量的服务级别协议的电路。
示例60包括示例56-59中的任何示例的主题,并且其中受管理节点组成请求包括目标性能水平。
示例61包括示例56-60中的任何示例的主题,并且其中用于确定每一个资源的目前利用的部件包括用于基于从对应资源接收的资源级遥测数据来确定每一个资源的目前利用的部件。
示例62包括示例56-61中的任何示例的主题,并且其中用于确定每一个机架的目前利用的部件包括用于基于从对应机架接收的机架级遥测数据来确定每一个机架的性能水平的部件。
示例63包括示例56-62中的任何示例的主题,并且其中用于确定每一个机架的目前利用的部件包括用于聚合从公共机架上的资源接收的资源级遥测数据以确定公共机架的性能水平的部件。
示例64包括示例56-63中的任何示例的主题,并且其中用于确定每一个机架的目前利用的部件包括用于基于从对应机架接收的机架级遥测数据来确定每一个机架的可靠性和容量的部件。
示例65包括示例56-64中的任何示例的主题,并且其中用于确定每一个机架的目前利用的部件包括用于基于由编排器服务器聚合的资源级遥测数据来确定每一个机架的可靠性和容量的部件。
示例66包括示例56-65中的任何示例的主题,并且其中用于从所述多个资源确定满足受管理节点组成请求的资源集的部件包括用于确定具有足够容量以在受管理节点组成请求中指示的目标服务质量度量下执行工作负荷的资源集的部件。
示例67包括示例56-66中的任何示例的主题,并且其中用于确定具有足够容量以在目标服务质量度量下执行工作负荷的资源集的部件包括用于确定具有比在受管理节点组成请求中指示的目标利用水平小的利用水平的资源集的部件。
示例68包括示例56-67中的任何示例的主题,并且其中用于从所述多个资源确定满足受管理节点组成请求的资源集的部件包括用于确定与资源集中的每一个资源相对应的机架是否满足受管理节点组成请求中指示的目标性能水平的部件。
示例69包括示例56-68中的任何示例的主题,并且其中用于从所述多个资源确定满足受管理节点组成请求的资源集的部件包括用于基于从作出请求的设备到对应资源的距离给来自所述多个资源的满足受管理节点组成请求的资源集划分优先级的部件。
示例70包括示例56-69中的任何示例的主题,并且其中距离包括从作出请求的设备到对应资源的物理距离。
示例71包括示例56-70中的任何示例的主题,并且其中距离包括从作出请求的设备到对应资源的网络距离。
示例72包括示例56-71中的任何示例的主题,并且进一步包括用于分配资源集以组成满足受管理节点组成请求的受管理节点的部件。
示例73包括示例56-72中的任何示例的主题,并且其中用于分配资源集以组成满足受管理节点组成请求的受管理节点的部件包括用于要将资源集中的每一个资源的唯一地址传输到作出请求的设备的部件。

Claims (27)

1.一种计算设备,包括:
通信电路;以及
计算引擎,其要(i)接收针对多个资源中的每一个资源的资源级遥测数据和来自多个机架中的每一个机架的机架级遥测数据,每一个机架具有所述多个资源中的一个或多个,(ii)接收受管理节点组成请求,其中受管理节点组成请求标识要由受管理节点实现的至少一个度量,(iii)响应于受管理节点组成请求的接收,确定所述多个资源中的每一个资源的目前利用,(iv)响应于受管理节点组成请求的接收,确定所述多个机架中的每一个机架的目前性能水平,以及(v)基于资源级和机架级遥测数据从所述多个资源确定满足受管理节点组成请求的资源集。
2.根据权利要求1所述的计算设备,其中所述多个资源是不同类型的,并且每一个类型的资源被托管在不同的滑板上。
3.根据权利要求1所述的计算设备,其中要接收机架级遥测数据包括要从每一个机架的架顶式交换机接收拥塞数据。
4.根据权利要求1所述的计算设备,其中要接收与工作负荷相关联的受管理节点组成请求包括要接收指示与工作负荷相关联的一个或多个服务质量度量的服务级别协议。
5.根据权利要求1所述的计算设备,其中要确定每一个资源的目前利用包括要基于从对应资源接收的资源级遥测数据来确定每一个资源的目前利用。
6.根据权利要求1所述的计算设备,其中要确定每一个机架的目前利用包括要基于从对应机架接收的机架级遥测数据来确定每一个机架的性能水平,并且要确定每一个机架的目前利用包括要基于从对应机架接收的机架级遥测数据来确定每一个机架的可靠性和容量。
7.根据权利要求1所述的计算设备,其中要确定每一个机架的目前利用包括要聚合从公共机架上的资源接收的资源级遥测数据以确定公共机架的性能水平,并且要确定每一个机架的目前利用包括要基于由编排器服务器聚合的资源级遥测数据来确定每一个机架的可靠性和容量。
8.根据权利要求1所述的计算设备,其中要从所述多个资源确定满足受管理节点组成请求的资源集包括要确定具有足够容量以在受管理节点组成请求中指示的目标服务质量度量下执行工作负荷的资源集。
9.根据权利要求8所述的计算设备,其中要确定具有足够容量以在目标服务质量度量下执行工作负荷的资源集包括要确定具有比在受管理节点组成请求中指示的目标利用水平小的利用水平的资源集。
10.根据权利要求1所述的计算设备,其中要从所述多个资源确定满足受管理节点组成请求的资源集包括要确定与资源集中的每一个资源相对应的机架是否满足受管理节点组成请求中指示的目标性能水平。
11.根据权利要求1所述的计算设备,其中要从所述多个资源确定满足受管理节点组成请求的资源集包括要基于从作出请求的设备到对应资源的距离给来自所述多个资源的满足受管理节点组成请求的资源集划分优先级。
12.根据权利要求1所述的计算设备,其中计算引擎进一步要分配资源集以组成满足受管理节点组成请求的受管理节点。
13.一种计算设备,包括:
用于从多个资源中的每一个资源接收资源级遥测数据并且从多个机架中的每一个机架接收机架级遥测数据的电路,每一个机架具有所述多个资源中的一个或多个;
用于从作出请求的设备接收与工作负荷相关联的受管理节点组成请求的电路,其中受管理节点组成请求标识要由受管理节点实现的至少一个度量;
用于响应于受管理节点组成请求的接收而确定所述多个资源中的每一个资源的目前利用的部件;
用于响应于受管理节点组成请求的接收而确定所述多个机架中的每一个机架的目前性能水平的部件;以及
用于基于资源级和机架级遥测数据从所述多个资源确定满足受管理节点组成请求的资源集的部件。
14.根据权利要求13所述的计算设备,其中所述多个资源是不同类型的,并且每一个类型的资源被托管在不同的滑板上。
15.根据权利要求13所述的计算设备,其中接收机架级遥测数据的电路包括从每一个机架的架顶式交换机接收拥塞数据的电路。
16.根据权利要求13所述的计算设备,其中用于接收与工作负荷相关联的受管理节点组成请求的电路包括用于接收指示与工作负荷相关联的一个或多个服务质量度量的服务级别协议的电路。
17.根据权利要求13所述的计算设备,其中用于确定每一个资源的目前利用的部件包括用于基于从对应资源接收的资源级遥测数据来确定每一个资源的目前利用的部件。
18.根据权利要求13所述的计算设备,其中用于确定每一个机架的目前利用的部件包括用于基于从对应机架接收的机架级遥测数据来确定每一个机架的性能水平的部件,并且用于确定每一个机架的目前利用的部件包括用于基于从对应机架接收的机架级遥测数据来确定每一个机架的可靠性和容量的部件。
19.根据权利要求13所述的计算设备,其中用于确定每一个机架的目前利用的部件包括用于聚合从公共机架上的资源接收的资源级遥测数据以确定公共机架的性能水平的部件,并且用于确定每一个机架的目前利用的部件包括用于基于由编排器服务器聚合的资源级遥测数据来确定每一个机架的可靠性和容量的部件。
20.根据权利要求13所述的计算设备,其中用于从所述多个资源确定满足受管理节点组成请求的资源集的部件包括用于确定在受管理节点组成请求中指示的目标服务质量度量下执行工作负荷的资源集的部件。
21.根据权利要求20所述的计算设备,其中用于确定具有足够容量以在目标服务质量度量下执行工作负荷的资源集的部件包括用于确定具有比在受管理节点组成请求中指示的目标利用水平小的利用水平的资源集的部件。
22.根据权利要求13所述的计算设备,其中用于从所述多个资源确定满足受管理节点组成请求的资源集的部件包括用于确定与资源集中的每一个资源相对应的机架是否满足受管理节点组成请求中指示的目标性能水平的部件。
23.根据权利要求13所述的计算设备,其中用于从所述多个资源确定满足受管理节点组成请求的资源集的部件包括用于基于从作出请求的设备到对应资源的距离给来自所述多个资源的满足受管理节点组成请求的资源集划分优先级的部件。
24.根据权利要求13所述的计算设备,进一步包括用于分配资源集以组成满足受管理节点组成请求的受管理节点的部件。
25.一种方法,包括:
通过编排器服务器接收针对多个资源中的每一个资源的资源级遥测数据和来自多个机架中的每一个机架的机架级遥测数据,每一个机架具有所述多个资源中的一个或多个;
通过编排器服务器接收来自作出请求的设备的与工作负荷相关联的受管理节点组成请求,其中受管理节点组成请求标识要由受管理节点实现的至少一个度量;
响应于受管理节点组成请求的接收并且通过编排器服务器来确定所述多个资源中的每一个资源的目前利用;
响应于受管理节点组成请求的接收并且通过编排器服务器来确定所述多个机架中的每一个机架的目前性能水平;以及
通过编排器服务器、基于资源级和机架级遥测数据从所述多个资源确定满足受管理节点组成请求的资源集。
26.根据权利要求25所述的方法,其中确定每一个资源的目前利用包括通过编排器服务器、基于从对应资源接收的资源级遥测数据来确定每一个资源的目前利用。
27.根据权利要求25所述的方法,其中确定每一个机架的目前利用包括通过编排器服务器、基于从对应机架接收的机架级遥测数据来确定每一个机架的性能水平。
CN201811005041.4A 2017-08-30 2018-08-30 用于基于遥测数据来组成受管理节点的计算设备和方法 Active CN109426646B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
IN201741030632 2017-08-30
IN201741030632 2017-08-30
US201762584401P 2017-11-10 2017-11-10
US62/584401 2017-11-10
US15/859,368 US11422867B2 (en) 2017-08-30 2017-12-30 Technologies for composing a managed node based on telemetry data
US15/859368 2017-12-30

Publications (2)

Publication Number Publication Date
CN109426646A true CN109426646A (zh) 2019-03-05
CN109426646B CN109426646B (zh) 2024-07-30

Family

ID=65434219

Family Applications (8)

Application Number Title Priority Date Filing Date
CN201810845565.8A Pending CN109426316A (zh) 2017-08-30 2018-07-27 用于提供针对超融合基础结构的高效池化的技术
CN201810843475.5A Active CN109428841B (zh) 2017-08-30 2018-07-27 针对自动化网络拥塞管理的技术
CN201811005041.4A Active CN109426646B (zh) 2017-08-30 2018-08-30 用于基于遥测数据来组成受管理节点的计算设备和方法
CN201811001590.4A Pending CN109428889A (zh) 2017-08-30 2018-08-30 用于自适应连接与连接优化之间的动态切换中的机器学习方案的技术
CN201811004869.8A Pending CN109426633A (zh) 2017-08-30 2018-08-30 用于管理网络接口控制器的灵活主机接口的技术
CN201811004916.9A Pending CN109426630A (zh) 2017-08-30 2018-08-30 用于提供对池化式加速器装置的有效访问的技术
CN201811004878.7A Pending CN109426568A (zh) 2017-08-30 2018-08-30 用于在加速架构中的自动迁移的技术
CN201811002563.9A Pending CN109428843A (zh) 2017-08-30 2018-08-30 从解聚架构中的加速器装置提供有效率的结果转移的技术

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN201810845565.8A Pending CN109426316A (zh) 2017-08-30 2018-07-27 用于提供针对超融合基础结构的高效池化的技术
CN201810843475.5A Active CN109428841B (zh) 2017-08-30 2018-07-27 针对自动化网络拥塞管理的技术

Family Applications After (5)

Application Number Title Priority Date Filing Date
CN201811001590.4A Pending CN109428889A (zh) 2017-08-30 2018-08-30 用于自适应连接与连接优化之间的动态切换中的机器学习方案的技术
CN201811004869.8A Pending CN109426633A (zh) 2017-08-30 2018-08-30 用于管理网络接口控制器的灵活主机接口的技术
CN201811004916.9A Pending CN109426630A (zh) 2017-08-30 2018-08-30 用于提供对池化式加速器装置的有效访问的技术
CN201811004878.7A Pending CN109426568A (zh) 2017-08-30 2018-08-30 用于在加速架构中的自动迁移的技术
CN201811002563.9A Pending CN109428843A (zh) 2017-08-30 2018-08-30 从解聚架构中的加速器装置提供有效率的结果转移的技术

Country Status (5)

Country Link
US (24) US20190068466A1 (zh)
EP (1) EP3676708A4 (zh)
CN (8) CN109426316A (zh)
DE (1) DE112018004798T5 (zh)
WO (5) WO2019045929A1 (zh)

Families Citing this family (146)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9948724B2 (en) * 2015-09-10 2018-04-17 International Business Machines Corporation Handling multi-pipe connections
US10034407B2 (en) 2016-07-22 2018-07-24 Intel Corporation Storage sled for a data center
US20180150256A1 (en) 2016-11-29 2018-05-31 Intel Corporation Technologies for data deduplication in disaggregated architectures
CN109891908A (zh) * 2016-11-29 2019-06-14 英特尔公司 用于毫米波机架互连的技术
US10686895B2 (en) * 2017-01-30 2020-06-16 Centurylink Intellectual Property Llc Method and system for implementing dual network telemetry application programming interface (API) framework
US10346315B2 (en) 2017-05-26 2019-07-09 Oracle International Corporation Latchless, non-blocking dynamically resizable segmented hash index
US10574580B2 (en) * 2017-07-04 2020-02-25 Vmware, Inc. Network resource management for hyper-converged infrastructures
US11119835B2 (en) 2017-08-30 2021-09-14 Intel Corporation Technologies for providing efficient reprovisioning in an accelerator device
US11106427B2 (en) * 2017-09-29 2021-08-31 Intel Corporation Memory filtering for disaggregate memory architectures
US11650598B2 (en) * 2017-12-30 2023-05-16 Telescent Inc. Automated physical network management system utilizing high resolution RFID, optical scans and mobile robotic actuator
US10511690B1 (en) 2018-02-20 2019-12-17 Intuit, Inc. Method and apparatus for predicting experience degradation events in microservice-based applications
US20210056426A1 (en) * 2018-03-26 2021-02-25 Hewlett-Packard Development Company, L.P. Generation of kernels based on physical states
US10761726B2 (en) * 2018-04-16 2020-09-01 VWware, Inc. Resource fairness control in distributed storage systems using congestion data
US11315013B2 (en) * 2018-04-23 2022-04-26 EMC IP Holding Company LLC Implementing parameter server in networking infrastructure for high-performance computing
US10599553B2 (en) * 2018-04-27 2020-03-24 International Business Machines Corporation Managing cloud-based hardware accelerators
US11330042B2 (en) * 2018-05-17 2022-05-10 International Business Machines Corporation Optimizing dynamic resource allocations for storage-dependent workloads in disaggregated data centers
US10977085B2 (en) 2018-05-17 2021-04-13 International Business Machines Corporation Optimizing dynamical resource allocations in disaggregated data centers
US10841367B2 (en) 2018-05-17 2020-11-17 International Business Machines Corporation Optimizing dynamical resource allocations for cache-dependent workloads in disaggregated data centers
US10936374B2 (en) 2018-05-17 2021-03-02 International Business Machines Corporation Optimizing dynamic resource allocations for memory-dependent workloads in disaggregated data centers
US10893096B2 (en) 2018-05-17 2021-01-12 International Business Machines Corporation Optimizing dynamical resource allocations using a data heat map in disaggregated data centers
US11221886B2 (en) 2018-05-17 2022-01-11 International Business Machines Corporation Optimizing dynamical resource allocations for cache-friendly workloads in disaggregated data centers
US10601903B2 (en) 2018-05-17 2020-03-24 International Business Machines Corporation Optimizing dynamical resource allocations based on locality of resources in disaggregated data centers
US10684887B2 (en) * 2018-05-25 2020-06-16 Vmware, Inc. Live migration of a virtualized compute accelerator workload
US10795713B2 (en) 2018-05-25 2020-10-06 Vmware, Inc. Live migration of a virtualized compute accelerator workload
US11042406B2 (en) 2018-06-05 2021-06-22 Intel Corporation Technologies for providing predictive thermal management
US11431648B2 (en) 2018-06-11 2022-08-30 Intel Corporation Technologies for providing adaptive utilization of different interconnects for workloads
US20190384376A1 (en) * 2018-06-18 2019-12-19 American Megatrends, Inc. Intelligent allocation of scalable rack resources
US11388835B1 (en) * 2018-06-27 2022-07-12 Amazon Technologies, Inc. Placement of custom servers
US11436113B2 (en) * 2018-06-28 2022-09-06 Twitter, Inc. Method and system for maintaining storage device failure tolerance in a composable infrastructure
US12034593B1 (en) 2018-07-10 2024-07-09 Cable Television Laboratories, Inc. Systems and methods for advanced core network controls
US11968548B1 (en) * 2018-07-10 2024-04-23 Cable Television Laboratories, Inc. Systems and methods for reducing communication network performance degradation using in-band telemetry data
US10977193B2 (en) 2018-08-17 2021-04-13 Oracle International Corporation Remote direct memory operations (RDMOs) for transactional processing systems
US11347678B2 (en) * 2018-08-06 2022-05-31 Oracle International Corporation One-sided reliable remote direct memory operations
WO2020047426A1 (en) 2018-08-30 2020-03-05 Rigetti & Co, Inc. Low-latency, high-performance hybrid computing
US11188348B2 (en) * 2018-08-31 2021-11-30 International Business Machines Corporation Hybrid computing device selection analysis
US11163713B2 (en) 2018-09-25 2021-11-02 International Business Machines Corporation Efficient component communication through protocol switching in disaggregated datacenters
US11182322B2 (en) 2018-09-25 2021-11-23 International Business Machines Corporation Efficient component communication through resource rewiring in disaggregated datacenters
US11650849B2 (en) * 2018-09-25 2023-05-16 International Business Machines Corporation Efficient component communication through accelerator switching in disaggregated datacenters
US11012423B2 (en) 2018-09-25 2021-05-18 International Business Machines Corporation Maximizing resource utilization through efficient component communication in disaggregated datacenters
US11138044B2 (en) * 2018-09-26 2021-10-05 Micron Technology, Inc. Memory pooling between selected memory resources
US10901893B2 (en) * 2018-09-28 2021-01-26 International Business Machines Corporation Memory bandwidth management for performance-sensitive IaaS
US10962389B2 (en) * 2018-10-03 2021-03-30 International Business Machines Corporation Machine status detection
WO2020072819A1 (en) * 2018-10-03 2020-04-09 Rigetti & Co, Inc. Parcelled quantum resources
US10768990B2 (en) * 2018-11-01 2020-09-08 International Business Machines Corporation Protecting an application by autonomously limiting processing to a determined hardware capacity
US11055186B2 (en) * 2018-11-27 2021-07-06 Red Hat, Inc. Managing related devices for virtual machines using robust passthrough device enumeration
US11275622B2 (en) * 2018-11-29 2022-03-15 International Business Machines Corporation Utilizing accelerators to accelerate data analytic workloads in disaggregated systems
US10901918B2 (en) * 2018-11-29 2021-01-26 International Business Machines Corporation Constructing flexibly-secure systems in a disaggregated environment
US10831975B2 (en) 2018-11-29 2020-11-10 International Business Machines Corporation Debug boundaries in a hardware accelerator
US11048318B2 (en) * 2018-12-06 2021-06-29 Intel Corporation Reducing microprocessor power with minimal performance impact by dynamically adapting runtime operating configurations using machine learning
US10771344B2 (en) * 2018-12-21 2020-09-08 Servicenow, Inc. Discovery of hyper-converged infrastructure devices
US10970107B2 (en) * 2018-12-21 2021-04-06 Servicenow, Inc. Discovery of hyper-converged infrastructure
US11269593B2 (en) * 2019-01-23 2022-03-08 Sap Se Global number range generation
US11271804B2 (en) * 2019-01-25 2022-03-08 Dell Products L.P. Hyper-converged infrastructure component expansion/replacement system
US11429440B2 (en) * 2019-02-04 2022-08-30 Hewlett Packard Enterprise Development Lp Intelligent orchestration of disaggregated applications based on class of service
US10817221B2 (en) * 2019-02-12 2020-10-27 International Business Machines Corporation Storage device with mandatory atomic-only access
US10949101B2 (en) * 2019-02-25 2021-03-16 Micron Technology, Inc. Storage device operation orchestration
US11294992B2 (en) * 2019-03-12 2022-04-05 Xilinx, Inc. Locking execution of cores to licensed programmable devices in a data center
US11443018B2 (en) * 2019-03-12 2022-09-13 Xilinx, Inc. Locking execution of cores to licensed programmable devices in a data center
JP7176455B2 (ja) * 2019-03-28 2022-11-22 オムロン株式会社 監視システム、設定装置および監視方法
US11531869B1 (en) * 2019-03-28 2022-12-20 Xilinx, Inc. Neural-network pooling
US11243817B2 (en) * 2019-03-29 2022-02-08 Intel Corporation Technologies for data migration between edge accelerators hosted on different edge locations
US11055256B2 (en) * 2019-04-02 2021-07-06 Intel Corporation Edge component computing system having integrated FaaS call handling capability
US11089137B2 (en) * 2019-04-02 2021-08-10 International Business Machines Corporation Dynamic data transmission
WO2020206370A1 (en) * 2019-04-05 2020-10-08 Cisco Technology, Inc. Discovering trustworthy devices using attestation and mutual attestation
US11263122B2 (en) * 2019-04-09 2022-03-01 Vmware, Inc. Implementing fine grain data coherency of a shared memory region
US11416294B1 (en) * 2019-04-17 2022-08-16 Juniper Networks, Inc. Task processing for management of data center resources
US11003479B2 (en) * 2019-04-29 2021-05-11 Intel Corporation Device, system and method to communicate a kernel binary via a network
CN110053650B (zh) * 2019-05-06 2022-06-07 湖南中车时代通信信号有限公司 一种列车自动运行系统、列车自动运行系统架构及列车自动运行系统的模块管理方法
CN110203600A (zh) * 2019-06-06 2019-09-06 北京卫星环境工程研究所 适用于航天器总装物料的自动存储及拣选系统
US11481117B2 (en) * 2019-06-17 2022-10-25 Hewlett Packard Enterprise Development Lp Storage volume clustering based on workload fingerprints
US10877817B1 (en) * 2019-06-28 2020-12-29 Intel Corporation Technologies for providing inter-kernel application programming interfaces for an accelerated architecture
US10949362B2 (en) * 2019-06-28 2021-03-16 Intel Corporation Technologies for facilitating remote memory requests in accelerator devices
US20200409748A1 (en) * 2019-06-28 2020-12-31 Intel Corporation Technologies for managing accelerator resources
EP4007963A1 (en) * 2019-08-02 2022-06-08 JPMorgan Chase Bank, N.A. Systems and methods for provisioning a new secondary identityiq instance to an existing identityiq instance
US11082411B2 (en) * 2019-08-06 2021-08-03 Advanced New Technologies Co., Ltd. RDMA-based data transmission method, network interface card, server and medium
US10925166B1 (en) * 2019-08-07 2021-02-16 Quanta Computer Inc. Protection fixture
EP4019206A4 (en) * 2019-08-22 2022-08-17 NEC Corporation ROBOT CONTROL SYSTEM, ROBOT CONTROL METHOD AND RECORDING MEDIA
US10999403B2 (en) 2019-09-27 2021-05-04 Red Hat, Inc. Composable infrastructure provisioning and balancing
CA3151195A1 (en) * 2019-10-10 2021-04-15 Channel One Holdings Inc. Methods and systems for time-bounding execution of computing workflows
CN110650609B (zh) * 2019-10-10 2020-12-01 珠海与非科技有限公司 一种分布式储存的云服务器
US11200046B2 (en) * 2019-10-22 2021-12-14 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Managing composable compute system infrastructure with support for decoupled firmware updates
US11803380B2 (en) * 2019-10-29 2023-10-31 Nvidia Corporation High performance synchronization mechanisms for coordinating operations on a computer system
DE102020127704A1 (de) 2019-10-29 2021-04-29 Nvidia Corporation Techniken zum effizienten transferieren von daten an einem prozessor
CN112749121A (zh) * 2019-10-31 2021-05-04 中兴通讯股份有限公司 基于pcie总线的多芯片互联系统
US11342004B2 (en) * 2019-11-07 2022-05-24 Quantum Corporation System and method for rapid replacement of robotic media mover in automated media library
US10747281B1 (en) * 2019-11-19 2020-08-18 International Business Machines Corporation Mobile thermal balancing of data centers
US11782810B2 (en) * 2019-11-22 2023-10-10 Dell Products, L.P. Systems and methods for automated field replacement component configuration
US11263105B2 (en) * 2019-11-26 2022-03-01 Lucid Software, Inc. Visualization tool for components within a cloud infrastructure
US11861219B2 (en) 2019-12-12 2024-01-02 Intel Corporation Buffer to reduce write amplification of misaligned write operations
US11789878B2 (en) 2019-12-19 2023-10-17 Intel Corporation Adaptive fabric allocation for local and remote emerging memories based prediction schemes
US11321259B2 (en) * 2020-02-14 2022-05-03 Sony Interactive Entertainment Inc. Network architecture providing high speed storage access through a PCI express fabric between a compute node and a storage server
US11636503B2 (en) * 2020-02-26 2023-04-25 At&T Intellectual Property I, L.P. System and method for offering network slice as a service
US11122123B1 (en) 2020-03-09 2021-09-14 International Business Machines Corporation Method for a network of storage devices
US11121941B1 (en) 2020-03-12 2021-09-14 Cisco Technology, Inc. Monitoring communications to identify performance degradation
US20210304025A1 (en) * 2020-03-24 2021-09-30 Facebook, Inc. Dynamic quality of service management for deep learning training communication
US11115497B2 (en) * 2020-03-25 2021-09-07 Intel Corporation Technologies for providing advanced resource management in a disaggregated environment
US11630696B2 (en) 2020-03-30 2023-04-18 International Business Machines Corporation Messaging for a hardware acceleration system
US11509079B2 (en) * 2020-04-06 2022-11-22 Hewlett Packard Enterprise Development Lp Blind mate connections with different sets of datums
US12001826B2 (en) 2020-04-24 2024-06-04 Intel Corporation Device firmware update techniques
US20230112996A1 (en) * 2020-04-30 2023-04-13 Intel Corporation Compilation for function as a service implementations distributed across server arrays
US11177618B1 (en) * 2020-05-14 2021-11-16 Dell Products L.P. Server blind-mate power and signal connector dock
US11295135B2 (en) * 2020-05-29 2022-04-05 Corning Research & Development Corporation Asset tracking of communication equipment via mixed reality based labeling
US11374808B2 (en) * 2020-05-29 2022-06-28 Corning Research & Development Corporation Automated logging of patching operations via mixed reality based labeling
US11947971B2 (en) * 2020-06-11 2024-04-02 Hewlett Packard Enterprise Development Lp Remote resource configuration mechanism
US11687629B2 (en) * 2020-06-12 2023-06-27 Baidu Usa Llc Method for data protection in a data processing cluster with authentication
US11360789B2 (en) 2020-07-06 2022-06-14 International Business Machines Corporation Configuration of hardware devices
CN111824668B (zh) * 2020-07-08 2022-07-19 北京极智嘉科技股份有限公司 机器人以及基于机器人的容器存入、取出方法
US11681557B2 (en) * 2020-07-31 2023-06-20 International Business Machines Corporation Systems and methods for managing resources in a hyperconverged infrastructure cluster
WO2022031835A1 (en) 2020-08-05 2022-02-10 Avesha, Inc. Networked system for real-time computer-aided augmentation of live input video stream
US20220092481A1 (en) * 2020-09-18 2022-03-24 Dell Products L.P. Integration optimization using machine learning algorithms
US11570243B2 (en) 2020-09-22 2023-01-31 Commvault Systems, Inc. Decommissioning, re-commissioning, and commissioning new metadata nodes in a working distributed data storage system
US11314687B2 (en) * 2020-09-24 2022-04-26 Commvault Systems, Inc. Container data mover for migrating data between distributed data storage systems integrated with application orchestrators
US20210011787A1 (en) * 2020-09-25 2021-01-14 Francesc Guim Bernat Technologies for scaling inter-kernel technologies for accelerator device kernels
US11405451B2 (en) * 2020-09-30 2022-08-02 Jpmorgan Chase Bank, N.A. Data pipeline architecture
US11379402B2 (en) * 2020-10-20 2022-07-05 Micron Technology, Inc. Secondary device detection using a synchronous interface
US20220129601A1 (en) * 2020-10-26 2022-04-28 Oracle International Corporation Techniques for generating a configuration for electrically isolating fault domains in a data center
US11803493B2 (en) * 2020-11-30 2023-10-31 Dell Products L.P. Systems and methods for management controller co-processor host to variable subsystem proxy
US20210092069A1 (en) * 2020-12-10 2021-03-25 Intel Corporation Accelerating multi-node performance of machine learning workloads
US11662934B2 (en) * 2020-12-15 2023-05-30 International Business Machines Corporation Migration of a logical partition between mutually non-coherent host data processing systems
US11948014B2 (en) * 2020-12-15 2024-04-02 Google Llc Multi-tenant control plane management on computing platform
US11645104B2 (en) * 2020-12-22 2023-05-09 Reliance Jio Infocomm Usa, Inc. Intelligent data plane acceleration by offloading to distributed smart network interfaces
US11994997B2 (en) * 2020-12-23 2024-05-28 Intel Corporation Memory controller to manage quality of service enforcement and migration between local and pooled memory
US11445028B2 (en) 2020-12-30 2022-09-13 Dell Products L.P. System and method for providing secure console access with multiple smart NICs using NC-SL and SPDM
US11803216B2 (en) 2021-02-03 2023-10-31 Hewlett Packard Enterprise Development Lp Contiguous plane infrastructure for computing systems
US11785735B2 (en) * 2021-02-19 2023-10-10 CyberSecure IPS, LLC Intelligent cable patching of racks to facilitate cable installation
US12112212B2 (en) 2021-02-26 2024-10-08 Google Llc Controlling system load based on memory bandwidth
US11503743B2 (en) * 2021-03-12 2022-11-15 Baidu Usa Llc High availability fluid connector for liquid cooling
US11470015B1 (en) * 2021-03-22 2022-10-11 Amazon Technologies, Inc. Allocating workloads to heterogenous worker fleets
US20220321403A1 (en) * 2021-04-02 2022-10-06 Nokia Solutions And Networks Oy Programmable network segmentation for multi-tenant fpgas in cloud infrastructures
US20220342688A1 (en) * 2021-04-26 2022-10-27 Dell Products L.P. Systems and methods for migration of virtual computing resources using smart network interface controller acceleration
WO2022235651A1 (en) 2021-05-03 2022-11-10 Avesha, Inc. Distributed computing system with multi tenancy based on application slices
US11714775B2 (en) 2021-05-10 2023-08-01 Zenlayer Innovation LLC Peripheral component interconnect (PCI) hosting device
US12045643B1 (en) * 2021-06-03 2024-07-23 Amazon Technologies, Inc. Power aware load placement for sub-lineups
US20210328933A1 (en) * 2021-06-25 2021-10-21 Akhilesh Thyagaturu Network flow-based hardware allocation
US20220413987A1 (en) * 2021-06-28 2022-12-29 Dell Products L.P. System and method for accelerator-centric workload placement
US20230004786A1 (en) * 2021-06-30 2023-01-05 Micron Technology, Inc. Artificial neural networks on a deep learning accelerator
IT202100017564A1 (it) * 2021-07-02 2023-01-02 Fastweb S P A Apparato robotico per eseguire operazioni di manutenzione su un componente elettronico
EP4142442B1 (en) * 2021-08-30 2024-04-17 Ovh Cooling assembly for a data center rack and method for assembling a rack system
US20230093868A1 (en) * 2021-09-22 2023-03-30 Ridgeline, Inc. Mechanism for real-time identity resolution in a distributed system
US20230115664A1 (en) * 2021-10-08 2023-04-13 Seagate Technology Llc Resource management for disaggregated architectures
US20230121562A1 (en) * 2021-10-15 2023-04-20 Dell Products, L.P. Telemetry of artificial intelligence (ai) and/or machine learning (ml) workloads
US12066964B1 (en) * 2021-12-10 2024-08-20 Amazon Technologies, Inc. Highly available modular hardware acceleration device
US20230222012A1 (en) * 2022-01-12 2023-07-13 Dell Products L.P. Method for scaling up microservices based on api call tracing history
US11863385B2 (en) * 2022-01-21 2024-01-02 International Business Machines Corporation Optimizing container executions with network-attached hardware components of a composable disaggregated infrastructure
US11921582B2 (en) 2022-04-29 2024-03-05 Microsoft Technology Licensing, Llc Out of band method to change boot firmware configuration
CN115052055B (zh) * 2022-08-17 2022-11-11 北京左江科技股份有限公司 一种基于FPGA的网络报文的checksum卸载方法

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080022282A1 (en) * 2005-05-19 2008-01-24 Ludmila Cherkasova System and method for evaluating performance of a workload manager
US20110016214A1 (en) * 2009-07-15 2011-01-20 Cluster Resources, Inc. System and method of brokering cloud computing resources
CN102694863A (zh) * 2012-05-30 2012-09-26 电子科技大学 基于负载调整和系统容错的分布式存储系统的实现方法
US8489939B2 (en) * 2010-10-25 2013-07-16 At&T Intellectual Property I, L.P. Dynamically allocating multitier applications based upon application requirements and performance and reliability of resources
US20130208715A1 (en) * 2010-10-28 2013-08-15 Lg Electronics Inc. Method and apparatus for transceiving a data frame in a wireless lan system
CN103281351A (zh) * 2013-04-19 2013-09-04 武汉方寸科技有限公司 一种高效能遥感数据处理与分析的云服务平台
CN103748560A (zh) * 2011-07-01 2014-04-23 惠普发展公司,有限责任合伙企业 用于管理计算资源的方法和系统
CN104168332A (zh) * 2014-09-01 2014-11-26 广东电网公司信息中心 高性能计算中负载均衡与节点状态监控方法
US9262144B1 (en) * 2014-08-20 2016-02-16 International Business Machines Corporation Deploying virtual machine instances of a pattern to regions of a hierarchical tier using placement policies and constraints
US9444695B2 (en) * 2014-01-30 2016-09-13 Xerox Corporation Methods and systems for scheduling a task
US20160285783A1 (en) * 2015-03-26 2016-09-29 Vmware, Inc. Methods and apparatus to control computing resource utilization of monitoring agents
US9634958B2 (en) * 2013-04-02 2017-04-25 Amazon Technologies, Inc. Burst capacity for user-defined pools
US9705798B1 (en) * 2014-01-07 2017-07-11 Google Inc. Systems and methods for routing data through data centers using an indirect generalized hypercube network
US20170257970A1 (en) * 2016-03-04 2017-09-07 Radisys Corporation Rack having uniform bays and an optical interconnect system for shelf-level, modular deployment of sleds enclosing information technology equipment

Family Cites Families (178)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2704350B1 (fr) * 1993-04-22 1995-06-02 Bull Sa Structure physique d'un sous système de mémoire de masse.
JP3320344B2 (ja) * 1997-09-19 2002-09-03 富士通株式会社 ライブラリ装置用カートリッジ移送ロボットおよびライブラリ装置
US6158000A (en) * 1998-09-18 2000-12-05 Compaq Computer Corporation Shared memory initialization method for system having multiple processor capability
US6230265B1 (en) * 1998-09-30 2001-05-08 International Business Machines Corporation Method and system for configuring resources in a data processing system utilizing system power control information
US7287096B2 (en) * 2001-05-19 2007-10-23 Texas Instruments Incorporated Method for robust, flexible reconfiguration of transceive parameters for communication systems
US7536715B2 (en) * 2001-05-25 2009-05-19 Secure Computing Corporation Distributed firewall system and method
US6901580B2 (en) * 2001-06-22 2005-05-31 Intel Corporation Configuration parameter sequencing and sequencer
US7415723B2 (en) * 2002-06-11 2008-08-19 Pandya Ashish A Distributed network security system and a hardware processor therefor
US7408876B1 (en) * 2002-07-02 2008-08-05 Extreme Networks Method and apparatus for providing quality of service across a switched backplane between egress queue managers
US20040073834A1 (en) * 2002-10-10 2004-04-15 Kermaani Kaamel M. System and method for expanding the management redundancy of computer systems
US7386889B2 (en) * 2002-11-18 2008-06-10 Trusted Network Technologies, Inc. System and method for intrusion prevention in a communications network
US7031154B2 (en) * 2003-04-30 2006-04-18 Hewlett-Packard Development Company, L.P. Louvered rack
US7238104B1 (en) * 2003-05-02 2007-07-03 Foundry Networks, Inc. System and method for venting air from a computer casing
US7146511B2 (en) * 2003-10-07 2006-12-05 Hewlett-Packard Development Company, L.P. Rack equipment application performance modification system and method
US20050132084A1 (en) * 2003-12-10 2005-06-16 Heung-For Cheng Method and apparatus for providing server local SMBIOS table through out-of-band communication
US7552217B2 (en) 2004-04-07 2009-06-23 Intel Corporation System and method for Automatic firmware image recovery for server management operational code
US7809836B2 (en) 2004-04-07 2010-10-05 Intel Corporation System and method for automating bios firmware image recovery using a non-host processor and platform policy to select a donor system
US7421535B2 (en) * 2004-05-10 2008-09-02 International Business Machines Corporation Method for demoting tracks from cache
JP4335760B2 (ja) * 2004-07-08 2009-09-30 富士通株式会社 ラックマウント型収納ユニットおよびラックマウント型ディスクアレイ装置
US7685319B2 (en) * 2004-09-28 2010-03-23 Cray Canada Corporation Low latency communication via memory windows
EP1854013A4 (en) * 2005-01-05 2010-09-08 Xtremedata Inc SYSTEMS AND METHODS FOR JOINING COPROCESSORS IN COMPUTER SYSTEMS
US7634584B2 (en) * 2005-04-27 2009-12-15 Solarflare Communications, Inc. Packet validation in virtual network interface architecture
US8799980B2 (en) * 2005-11-16 2014-08-05 Juniper Networks, Inc. Enforcement of network device configuration policies within a computing environment
TW200720941A (en) * 2005-11-18 2007-06-01 Inventec Corp Host computer memory configuration data remote access method and system
US7493419B2 (en) * 2005-12-13 2009-02-17 International Business Machines Corporation Input/output workload fingerprinting for input/output schedulers
US8713551B2 (en) * 2006-01-03 2014-04-29 International Business Machines Corporation Apparatus, system, and method for non-interruptively updating firmware on a redundant hardware controller
US20070271560A1 (en) * 2006-05-18 2007-11-22 Microsoft Corporation Deploying virtual machine to host based on workload characterizations
US7472211B2 (en) * 2006-07-28 2008-12-30 International Business Machines Corporation Blade server switch module using out-of-band signaling to detect the physical location of an active drive enclosure device
US8098658B1 (en) * 2006-08-01 2012-01-17 Hewett-Packard Development Company, L.P. Power-based networking resource allocation
US8010565B2 (en) * 2006-10-16 2011-08-30 Dell Products L.P. Enterprise rack management method, apparatus and media
US8068351B2 (en) * 2006-11-10 2011-11-29 Oracle America, Inc. Cable management system
US20090089564A1 (en) * 2006-12-06 2009-04-02 Brickell Ernie F Protecting a Branch Instruction from Side Channel Vulnerabilities
US8112524B2 (en) * 2007-01-15 2012-02-07 International Business Machines Corporation Recommending moving resources in a partitioned computer
US7738900B1 (en) 2007-02-15 2010-06-15 Nextel Communications Inc. Systems and methods of group distribution for latency sensitive applications
US8140719B2 (en) * 2007-06-21 2012-03-20 Sea Micro, Inc. Dis-aggregated and distributed data-center architecture using a direct interconnect fabric
CN101431432A (zh) * 2007-11-06 2009-05-13 联想(北京)有限公司 刀片服务器
US8078865B2 (en) * 2007-11-20 2011-12-13 Dell Products L.P. Systems and methods for configuring out-of-band bios settings
US8214467B2 (en) * 2007-12-14 2012-07-03 International Business Machines Corporation Migrating port-specific operating parameters during blade server failover
KR101311669B1 (ko) * 2007-12-17 2013-09-27 노키아 코포레이션 보조 설정 및 관리
US8645965B2 (en) * 2007-12-31 2014-02-04 Intel Corporation Supporting metered clients with manycore through time-limited partitioning
US8225159B1 (en) * 2008-04-25 2012-07-17 Netapp, Inc. Method and system for implementing power savings features on storage devices within a storage subsystem
US8166263B2 (en) * 2008-07-03 2012-04-24 Commvault Systems, Inc. Continuous data protection over intermittent connections, such as continuous data backup for laptops or wireless devices
US20100125695A1 (en) * 2008-11-15 2010-05-20 Nanostar Corporation Non-volatile memory storage system
US20100091458A1 (en) * 2008-10-15 2010-04-15 Mosier Jr David W Electronics chassis with angled card cage
US8954977B2 (en) * 2008-12-09 2015-02-10 Intel Corporation Software-based thread remapping for power savings
US8798045B1 (en) * 2008-12-29 2014-08-05 Juniper Networks, Inc. Control plane architecture for switch fabrics
US20100229175A1 (en) * 2009-03-05 2010-09-09 International Business Machines Corporation Moving Resources In a Computing Environment Having Multiple Logically-Partitioned Computer Systems
WO2010108165A1 (en) * 2009-03-20 2010-09-23 The Trustees Of Princeton University Systems and methods for network acceleration and efficient indexing for caching file systems
US8321870B2 (en) * 2009-08-14 2012-11-27 General Electric Company Method and system for distributed computation having sub-task processing and sub-solution redistribution
US20110055838A1 (en) * 2009-08-28 2011-03-03 Moyes William A Optimized thread scheduling via hardware performance monitoring
KR101367241B1 (ko) * 2009-10-16 2014-02-25 후지쯔 가부시끼가이샤 전자 장치
CN101706802B (zh) * 2009-11-24 2013-06-05 成都市华为赛门铁克科技有限公司 一种数据写入、修改及恢复的方法、装置及服务器
US9129052B2 (en) * 2009-12-03 2015-09-08 International Business Machines Corporation Metering resource usage in a cloud computing environment
CN102135923A (zh) * 2010-01-21 2011-07-27 鸿富锦精密工业(深圳)有限公司 将操作系统集成到bios芯片的方法及启动该操作系统的方法
US8638553B1 (en) * 2010-03-31 2014-01-28 Amazon Technologies, Inc. Rack system cooling with inclined computing devices
US8601297B1 (en) * 2010-06-18 2013-12-03 Google Inc. Systems and methods for energy proportional multiprocessor networks
US8171142B2 (en) * 2010-06-30 2012-05-01 Vmware, Inc. Data center inventory management using smart racks
IT1401647B1 (it) * 2010-07-09 2013-08-02 Campatents B V Metodo per monitorare cambi di configurazione di un dispostivo di controllo di una macchina automatica
US8259450B2 (en) * 2010-07-21 2012-09-04 Birchbridge Incorporated Mobile universal hardware platform
US9428336B2 (en) * 2010-07-28 2016-08-30 Par Systems, Inc. Robotic storage and retrieval systems
WO2012021380A2 (en) * 2010-08-13 2012-02-16 Rambus Inc. Fast-wake memory
US8914805B2 (en) * 2010-08-31 2014-12-16 International Business Machines Corporation Rescheduling workload in a hybrid computing environment
US8838286B2 (en) * 2010-11-04 2014-09-16 Dell Products L.P. Rack-level modular server and storage framework
US8762668B2 (en) * 2010-11-18 2014-06-24 Hitachi, Ltd. Multipath switching over multiple storage systems
US9563479B2 (en) * 2010-11-30 2017-02-07 Red Hat, Inc. Brokering optimized resource supply costs in host cloud-based network using predictive workloads
CN102693181A (zh) * 2011-03-25 2012-09-26 鸿富锦精密工业(深圳)有限公司 分位刷写系统及方法
US9405550B2 (en) * 2011-03-31 2016-08-02 International Business Machines Corporation Methods for the transmission of accelerator commands and corresponding command structure to remote hardware accelerator engines over an interconnect link
US20120303322A1 (en) * 2011-05-23 2012-11-29 Rego Charles W Incorporating memory and io cycle information into compute usage determinations
US9317336B2 (en) * 2011-07-27 2016-04-19 Alcatel Lucent Method and apparatus for assignment of virtual resources within a cloud environment
US8713257B2 (en) * 2011-08-26 2014-04-29 Lsi Corporation Method and system for shared high speed cache in SAS switches
US8755176B2 (en) * 2011-10-12 2014-06-17 Xyratex Technology Limited Data storage system, an energy module and a method of providing back-up power to a data storage system
US9237107B2 (en) * 2011-11-15 2016-01-12 New Jersey Institute Of Technology Fair quantized congestion notification (FQCN) to mitigate transport control protocol (TCP) throughput collapse in data center networks
US20140304713A1 (en) * 2011-11-23 2014-10-09 Telefonaktiebolaget L M Ericsson (pulb) Method and apparatus for distributed processing tasks
DE102011119693A1 (de) * 2011-11-29 2013-05-29 Universität Heidelberg System, Computer-implementiertes Verfahren und Computerprogrammprodukt zur direkten Kommunikation zwischen Hardwarebeschleunigern in einem Computercluster
US20130185729A1 (en) * 2012-01-13 2013-07-18 Rutgers, The State University Of New Jersey Accelerating resource allocation in virtualized environments using workload classes and/or workload signatures
US8732291B2 (en) 2012-01-13 2014-05-20 Accenture Global Services Limited Performance interference model for managing consolidated workloads in QOS-aware clouds
US9336061B2 (en) * 2012-01-14 2016-05-10 International Business Machines Corporation Integrated metering of service usage for hybrid clouds
US9367360B2 (en) * 2012-01-30 2016-06-14 Microsoft Technology Licensing, Llc Deploying a hardware inventory as a cloud-computing stamp
TWI462017B (zh) * 2012-02-24 2014-11-21 Wistron Corp 伺服器部署系統及資料更新的方法
GB2517097B (en) * 2012-05-29 2020-05-27 Intel Corp Peer-to-peer interrupt signaling between devices coupled via interconnects
JP5983045B2 (ja) * 2012-05-30 2016-08-31 富士通株式会社 ライブラリ装置
US8832268B1 (en) * 2012-08-16 2014-09-09 Amazon Technologies, Inc. Notification and resolution of infrastructure issues
US9792004B2 (en) * 2012-10-08 2017-10-17 Fisher-Rosemount Systems, Inc. Derived and linked definitions with override
US9202040B2 (en) 2012-10-10 2015-12-01 Globalfoundries Inc. Chip authentication using multi-domain intrinsic identifiers
US9047417B2 (en) * 2012-10-29 2015-06-02 Intel Corporation NUMA aware network interface
US20140185225A1 (en) * 2012-12-28 2014-07-03 Joel Wineland Advanced Datacenter Designs
US9130824B2 (en) 2013-01-08 2015-09-08 American Megatrends, Inc. Chassis management implementation by management instance on baseboard management controller managing multiple computer nodes
US9609782B2 (en) * 2013-01-15 2017-03-28 Intel Corporation Rack assembly structure
US9201837B2 (en) * 2013-03-13 2015-12-01 Futurewei Technologies, Inc. Disaggregated server architecture for data centers
US9582010B2 (en) * 2013-03-14 2017-02-28 Rackspace Us, Inc. System and method of rack management
US9104562B2 (en) * 2013-04-05 2015-08-11 International Business Machines Corporation Enabling communication over cross-coupled links between independently managed compute and storage networks
US20140317267A1 (en) * 2013-04-22 2014-10-23 Advanced Micro Devices, Inc. High-Density Server Management Controller
US20140337496A1 (en) * 2013-05-13 2014-11-13 Advanced Micro Devices, Inc. Embedded Management Controller for High-Density Servers
CN103294521B (zh) * 2013-05-30 2016-08-10 天津大学 一种降低数据中心通信负载及能耗的方法
US9436600B2 (en) * 2013-06-11 2016-09-06 Svic No. 28 New Technology Business Investment L.L.P. Non-volatile memory storage for multi-channel memory system
US20150033222A1 (en) 2013-07-25 2015-01-29 Cavium, Inc. Network Interface Card with Virtual Switch and Traffic Flow Policy Enforcement
US10069686B2 (en) * 2013-09-05 2018-09-04 Pismo Labs Technology Limited Methods and systems for managing a device through a manual information input module
US9306861B2 (en) * 2013-09-26 2016-04-05 Red Hat Israel, Ltd. Automatic promiscuous forwarding for a bridge
US9413713B2 (en) * 2013-12-05 2016-08-09 Cisco Technology, Inc. Detection of a misconfigured duplicate IP address in a distributed data center network fabric
US9792243B2 (en) * 2013-12-26 2017-10-17 Intel Corporation Computer architecture to provide flexibility and/or scalability
EP3111329A4 (en) * 2014-02-27 2017-11-15 Intel Corporation Techniques to allocate configurable computing resources
JP6438035B2 (ja) * 2014-02-27 2018-12-12 インテル・コーポレーション ラックスケールアーキテクチャコンピューティングシステムのためのワークロード最適化、スケジューリング及び配置
US9363926B1 (en) * 2014-03-17 2016-06-07 Amazon Technologies, Inc. Modular mass storage system with staggered backplanes
US9561469B2 (en) * 2014-03-24 2017-02-07 Johnson Matthey Public Limited Company Catalyst for treating exhaust gas
US10218645B2 (en) * 2014-04-08 2019-02-26 Mellanox Technologies, Ltd. Low-latency processing in a network node
US9503391B2 (en) * 2014-04-11 2016-11-22 Telefonaktiebolaget Lm Ericsson (Publ) Method and system for network function placement
US9544233B2 (en) * 2014-04-28 2017-01-10 New Jersey Institute Of Technology Congestion management for datacenter network
US9081828B1 (en) * 2014-04-30 2015-07-14 Igneous Systems, Inc. Network addressable storage controller with storage drive profile comparison
TWI510933B (zh) * 2014-05-13 2015-12-01 Acer Inc 遠端存取資料的方法以及本地端裝置
EP4083777B1 (en) * 2014-05-22 2024-09-04 Huawei Technologies Co., Ltd. Resource control node and method
US9477279B1 (en) * 2014-06-02 2016-10-25 Datadirect Networks, Inc. Data storage system with active power management and method for monitoring and dynamical control of power sharing between devices in data storage system
US9602351B2 (en) * 2014-06-06 2017-03-21 Microsoft Technology Licensing, Llc Proactive handling of network faults
US10180889B2 (en) * 2014-06-23 2019-01-15 Liqid Inc. Network failover handling in modular switched fabric based data storage systems
US10382279B2 (en) * 2014-06-30 2019-08-13 Emc Corporation Dynamically composed compute nodes comprising disaggregated components
US10122605B2 (en) * 2014-07-09 2018-11-06 Cisco Technology, Inc Annotation of network activity through different phases of execution
US9892079B2 (en) * 2014-07-25 2018-02-13 Rajiv Ganth Unified converged network, storage and compute system
US9684531B2 (en) * 2014-08-21 2017-06-20 International Business Machines Corporation Combining blade servers based on workload characteristics
US9858104B2 (en) * 2014-09-24 2018-01-02 Pluribus Networks, Inc. Connecting fabrics via switch-to-switch tunneling transparent to network servers
US10630767B1 (en) * 2014-09-30 2020-04-21 Amazon Technologies, Inc. Hardware grouping based computing resource allocation
US10061599B1 (en) * 2014-10-16 2018-08-28 American Megatrends, Inc. Bus enumeration acceleration
US9886306B2 (en) * 2014-11-21 2018-02-06 International Business Machines Corporation Cross-platform scheduling with long-term fairness and platform-specific optimization
US9098451B1 (en) * 2014-11-21 2015-08-04 Igneous Systems, Inc. Shingled repair set for writing data
CA2969863A1 (en) * 2014-12-09 2016-06-16 Cirba Ip Inc. System and method for routing computing workloads based on proximity
US20160173600A1 (en) 2014-12-15 2016-06-16 Cisco Technology, Inc. Programmable processing engine for a virtual interface controller
US10057186B2 (en) * 2015-01-09 2018-08-21 International Business Machines Corporation Service broker for computational offloading and improved resource utilization
EP3046028B1 (en) * 2015-01-15 2020-02-19 Alcatel Lucent Load-balancing and scaling of cloud resources by migrating a data session
US10114692B2 (en) * 2015-01-27 2018-10-30 Quantum Corporation High/low energy zone data storage
US10234930B2 (en) * 2015-02-13 2019-03-19 Intel Corporation Performing power management in a multicore processor
JP2016167143A (ja) * 2015-03-09 2016-09-15 富士通株式会社 情報処理システムおよび情報処理システムの制御方法
US9276900B1 (en) * 2015-03-19 2016-03-01 Igneous Systems, Inc. Network bootstrapping for a distributed storage system
US10606651B2 (en) * 2015-04-17 2020-03-31 Microsoft Technology Licensing, Llc Free form expression accelerator with thread length-based thread assignment to clustered soft processor cores that share a functional circuit
US10019388B2 (en) * 2015-04-28 2018-07-10 Liqid Inc. Enhanced initialization for data storage assemblies
US9910664B2 (en) * 2015-05-04 2018-03-06 American Megatrends, Inc. System and method of online firmware update for baseboard management controller (BMC) devices
US20160335209A1 (en) * 2015-05-11 2016-11-17 Quanta Computer Inc. High-speed data transmission using pcie protocol
US9696781B2 (en) * 2015-05-28 2017-07-04 Cisco Technology, Inc. Automated power control for reducing power usage in communications networks
US9792248B2 (en) * 2015-06-02 2017-10-17 Microsoft Technology Licensing, Llc Fast read/write between networked computers via RDMA-based RPC requests
US11203486B2 (en) * 2015-06-02 2021-12-21 Alert Innovation Inc. Order fulfillment system
US9606836B2 (en) * 2015-06-09 2017-03-28 Microsoft Technology Licensing, Llc Independently networkable hardware accelerators for increased workflow optimization
CN204887839U (zh) * 2015-07-23 2015-12-16 中兴通讯股份有限公司 一种单板模块级水冷系统
US10055218B2 (en) * 2015-08-11 2018-08-21 Quanta Computer Inc. System and method for adding and storing groups of firmware default settings
US10348574B2 (en) * 2015-08-17 2019-07-09 Vmware, Inc. Hardware management systems for disaggregated rack architectures in virtual server rack deployments
US10736239B2 (en) * 2015-09-22 2020-08-04 Z-Impact, Inc. High performance computing rack and storage system with forced cooling
US10387209B2 (en) * 2015-09-28 2019-08-20 International Business Machines Corporation Dynamic transparent provisioning of resources for application specific resources
US10162793B1 (en) * 2015-09-29 2018-12-25 Amazon Technologies, Inc. Storage adapter device for communicating with network storage
US9888607B2 (en) * 2015-09-30 2018-02-06 Seagate Technology Llc Self-biasing storage device sled
US10216643B2 (en) * 2015-11-23 2019-02-26 International Business Machines Corporation Optimizing page table manipulations
US9811347B2 (en) * 2015-12-14 2017-11-07 Dell Products, L.P. Managing dependencies for human interface infrastructure (HII) devices
US20170180220A1 (en) * 2015-12-18 2017-06-22 Intel Corporation Techniques to Generate Workload Performance Fingerprints for Cloud Infrastructure Elements
US10028401B2 (en) * 2015-12-18 2018-07-17 Microsoft Technology Licensing, Llc Sidewall-accessible dense storage rack
US10452467B2 (en) * 2016-01-28 2019-10-22 Intel Corporation Automatic model-based computing environment performance monitoring
US10374926B2 (en) * 2016-01-28 2019-08-06 Oracle International Corporation System and method for monitoring logical network traffic flows using a ternary content addressable memory in a high performance computing environment
US10140158B2 (en) * 2016-02-23 2018-11-27 Telefonaktiebolaget Lm Ericsson (Publ) Methods and modules relating to allocation of host machines
US9811281B2 (en) * 2016-04-07 2017-11-07 International Business Machines Corporation Multi-tenant memory service for memory pool architectures
US10701141B2 (en) * 2016-06-30 2020-06-30 International Business Machines Corporation Managing software licenses in a disaggregated environment
US11706895B2 (en) * 2016-07-19 2023-07-18 Pure Storage, Inc. Independent scaling of compute resources and storage resources in a storage system
US10234833B2 (en) * 2016-07-22 2019-03-19 Intel Corporation Technologies for predicting power usage of a data center
US10034407B2 (en) 2016-07-22 2018-07-24 Intel Corporation Storage sled for a data center
US20180034908A1 (en) * 2016-07-27 2018-02-01 Alibaba Group Holding Limited Disaggregated storage and computation system
US10365852B2 (en) * 2016-07-29 2019-07-30 Vmware, Inc. Resumable replica resynchronization
US10193997B2 (en) 2016-08-05 2019-01-29 Dell Products L.P. Encoded URI references in restful requests to facilitate proxy aggregation
US10127107B2 (en) * 2016-08-14 2018-11-13 Nxp Usa, Inc. Method for performing data transaction that selectively enables memory bank cuts and memory device therefor
US10108560B1 (en) * 2016-09-14 2018-10-23 Evol1-Ip, Llc Ethernet-leveraged hyper-converged infrastructure
US10303458B2 (en) * 2016-09-29 2019-05-28 Hewlett Packard Enterprise Development Lp Multi-platform installer
US10776342B2 (en) * 2016-11-18 2020-09-15 Tuxena, Inc. Systems and methods for recovering lost clusters from a mounted volume
US10726131B2 (en) * 2016-11-21 2020-07-28 Facebook, Inc. Systems and methods for mitigation of permanent denial of service attacks
US20180150256A1 (en) * 2016-11-29 2018-05-31 Intel Corporation Technologies for data deduplication in disaggregated architectures
CN109891908A (zh) * 2016-11-29 2019-06-14 英特尔公司 用于毫米波机架互连的技术
US10503671B2 (en) * 2016-12-29 2019-12-10 Oath Inc. Controlling access to a shared resource
US10282549B2 (en) * 2017-03-07 2019-05-07 Hewlett Packard Enterprise Development Lp Modifying service operating system of baseboard management controller
EP3592493A4 (en) * 2017-03-08 2020-12-02 BWXT Nuclear Energy, Inc. DEVICE AND METHOD FOR REPAIRING GUIDE PLATE BOLTS
US20180288152A1 (en) * 2017-04-01 2018-10-04 Anjaneya R. Chagam Reddy Storage dynamic accessibility mechanism method and apparatus
US10331581B2 (en) * 2017-04-10 2019-06-25 Hewlett Packard Enterprise Development Lp Virtual channel and resource assignment
US10355939B2 (en) * 2017-04-13 2019-07-16 International Business Machines Corporation Scalable data center network topology on distributed switch
US10467052B2 (en) * 2017-05-01 2019-11-05 Red Hat, Inc. Cluster topology aware container scheduling for efficient data transfer
US10303615B2 (en) * 2017-06-16 2019-05-28 Hewlett Packard Enterprise Development Lp Matching pointers across levels of a memory hierarchy
US20190166032A1 (en) * 2017-11-30 2019-05-30 American Megatrends, Inc. Utilization based dynamic provisioning of rack computing resources
US10447273B1 (en) * 2018-09-11 2019-10-15 Advanced Micro Devices, Inc. Dynamic virtualized field-programmable gate array resource control for performance and reliability
US11201818B2 (en) * 2019-04-04 2021-12-14 Cisco Technology, Inc. System and method of providing policy selection in a network

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080022282A1 (en) * 2005-05-19 2008-01-24 Ludmila Cherkasova System and method for evaluating performance of a workload manager
US20110016214A1 (en) * 2009-07-15 2011-01-20 Cluster Resources, Inc. System and method of brokering cloud computing resources
US8489939B2 (en) * 2010-10-25 2013-07-16 At&T Intellectual Property I, L.P. Dynamically allocating multitier applications based upon application requirements and performance and reliability of resources
US20130208715A1 (en) * 2010-10-28 2013-08-15 Lg Electronics Inc. Method and apparatus for transceiving a data frame in a wireless lan system
CN103748560A (zh) * 2011-07-01 2014-04-23 惠普发展公司,有限责任合伙企业 用于管理计算资源的方法和系统
CN102694863A (zh) * 2012-05-30 2012-09-26 电子科技大学 基于负载调整和系统容错的分布式存储系统的实现方法
US9634958B2 (en) * 2013-04-02 2017-04-25 Amazon Technologies, Inc. Burst capacity for user-defined pools
CN103281351A (zh) * 2013-04-19 2013-09-04 武汉方寸科技有限公司 一种高效能遥感数据处理与分析的云服务平台
US9705798B1 (en) * 2014-01-07 2017-07-11 Google Inc. Systems and methods for routing data through data centers using an indirect generalized hypercube network
US9444695B2 (en) * 2014-01-30 2016-09-13 Xerox Corporation Methods and systems for scheduling a task
US9262144B1 (en) * 2014-08-20 2016-02-16 International Business Machines Corporation Deploying virtual machine instances of a pattern to regions of a hierarchical tier using placement policies and constraints
CN104168332A (zh) * 2014-09-01 2014-11-26 广东电网公司信息中心 高性能计算中负载均衡与节点状态监控方法
US20160285783A1 (en) * 2015-03-26 2016-09-29 Vmware, Inc. Methods and apparatus to control computing resource utilization of monitoring agents
US20170257970A1 (en) * 2016-03-04 2017-09-07 Radisys Corporation Rack having uniform bays and an optical interconnect system for shelf-level, modular deployment of sleds enclosing information technology equipment

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KIWIOR D 等: "Active resource allocation in active networks", 《IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS》, pages 452 - 459 *
耿艳鹏 等: "基于Web的高性能计算资源共享管理系统", 《信息技术与信息化》, pages 56 - 59 *

Also Published As

Publication number Publication date
EP3676708A4 (en) 2021-06-02
US11467885B2 (en) 2022-10-11
CN109426568A (zh) 2019-03-05
US20190065172A1 (en) 2019-02-28
US20190068509A1 (en) 2019-02-28
CN109426630A (zh) 2019-03-05
US20190065401A1 (en) 2019-02-28
US20200192710A1 (en) 2020-06-18
US20190065415A1 (en) 2019-02-28
WO2019045930A1 (en) 2019-03-07
US20190065261A1 (en) 2019-02-28
US20190068521A1 (en) 2019-02-28
US20190065260A1 (en) 2019-02-28
CN109428841A (zh) 2019-03-05
US20200257566A1 (en) 2020-08-13
US11748172B2 (en) 2023-09-05
US20190065281A1 (en) 2019-02-28
CN109428841B (zh) 2024-09-06
CN109426646B (zh) 2024-07-30
CN109428843A (zh) 2019-03-05
EP3676708A1 (en) 2020-07-08
US20190068693A1 (en) 2019-02-28
US20190068466A1 (en) 2019-02-28
CN109426633A (zh) 2019-03-05
DE112018004798T5 (de) 2020-06-18
US20190067848A1 (en) 2019-02-28
US20190068464A1 (en) 2019-02-28
WO2019045929A1 (en) 2019-03-07
US11030017B2 (en) 2021-06-08
US11422867B2 (en) 2022-08-23
US20190068444A1 (en) 2019-02-28
US20190065112A1 (en) 2019-02-28
CN109426316A (zh) 2019-03-05
US10888016B2 (en) 2021-01-05
US20190069433A1 (en) 2019-02-28
WO2019045928A1 (en) 2019-03-07
US20190068696A1 (en) 2019-02-28
US11614979B2 (en) 2023-03-28
WO2019046620A1 (en) 2019-03-07
US20190062053A1 (en) 2019-02-28
US11416309B2 (en) 2022-08-16
US11055149B2 (en) 2021-07-06
CN109428889A (zh) 2019-03-05
US20190068698A1 (en) 2019-02-28
US20190065212A1 (en) 2019-02-28
US20190065083A1 (en) 2019-02-28
WO2019046639A1 (en) 2019-03-07
US20190068523A1 (en) 2019-02-28
US20190065231A1 (en) 2019-02-28
US11392425B2 (en) 2022-07-19

Similar Documents

Publication Publication Date Title
CN109426646A (zh) 用于基于遥测数据来组成受管理节点的技术
US11861424B2 (en) Technologies for providing efficient reprovisioning in an accelerator device
US20190034383A1 (en) Technologies for providing remote access to a shared memory pool
US11228539B2 (en) Technologies for managing disaggregated accelerator networks based on remote direct memory access
US11115497B2 (en) Technologies for providing advanced resource management in a disaggregated environment
US20190140838A1 (en) Technologies for providing certified telemetry data indicative of resources utilizations
EP3731063B1 (en) Technologies for providing adaptive power management in an accelerator sled
EP3731091A1 (en) Technologies for providing an accelerator device discovery service
US20190253518A1 (en) Technologies for providing resource health based node composition and management
US10579547B2 (en) Technologies for providing I/O channel abstraction for accelerator device kernels
EP3757784B1 (en) Technologies for managing accelerator resources
US10678737B2 (en) Technologies for providing dynamic communication path modification for accelerator device kernels
US11531635B2 (en) Technologies for establishing communication channel between accelerator device kernels
EP3757785B1 (en) Technologies for facilitating remote memory requests in accelerator devices
CN109426629A (zh) 用于通过预测位流来预配置加速器的技术
US20230418686A1 (en) Technologies for providing efficient pooling for a hyper converged infrastructure
US20200341824A1 (en) Technologies for providing inter-kernel communication abstraction to support scale-up and scale-out
CN109426452A (zh) 用于在加速器设备中提供高效内核供应的技术

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant