EP3241089A1 - Procédé de gestion automatique de la consommation électrique d'une grappe de serveurs - Google Patents

Procédé de gestion automatique de la consommation électrique d'une grappe de serveurs

Info

Publication number
EP3241089A1
EP3241089A1 EP15822954.2A EP15822954A EP3241089A1 EP 3241089 A1 EP3241089 A1 EP 3241089A1 EP 15822954 A EP15822954 A EP 15822954A EP 3241089 A1 EP3241089 A1 EP 3241089A1
Authority
EP
European Patent Office
Prior art keywords
consumption
nodes
node
management method
automatic management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
EP15822954.2A
Other languages
German (de)
English (en)
Inventor
Liana BOZGA
Philippe Lachamp
Jean-Olivier GERPHAGNON
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bull SA
Original Assignee
Bull SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bull SA filed Critical Bull SA
Publication of EP3241089A1 publication Critical patent/EP3241089A1/fr
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/18Packaging or power distribution
    • G06F1/189Power distribution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3287Power saving characterised by the action undertaken by switching off individual functional units in the computer system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5094Allocation of resources, e.g. of the central processing unit [CPU] where the allocation takes into account power or heat criteria
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Definitions

  • the invention relates to a method for managing the power consumption of a server cluster.
  • Server clusters in the context of the present application will be understood to mean any set of servers managed centrally.
  • the high-performance computers also referred to as HPC calculator.
  • HPC high performance computer
  • the power available must be taken into account in order not to collapse the supply structure and therefore the calculator; the heat dissipation capacities must be taken into account in order not to risk damaging the computer by heating;
  • the associated cost may exceed one million euros per year (current metric based on a calculation power of approximately 1 MW / P Flops).
  • circuit breakers are very fast and cut the power of a group of nodes. However, this is a reactive approach, the energy consumption has already begun, In addition to the return of online disjunct nodes, it is necessary to perform a resetting often manual.
  • the invention aims to remedy all or part of the disadvantages of the state of the art identified above, and in particular to provide means to allow to follow a consumption setpoint without exceeding it.
  • one aspect of the invention relates to a method for automatically managing the power consumption of a server cluster comprising a plurality of nodes, characterized in that the method comprises the following steps:
  • the method / device according to the invention may have one or more additional characteristics among the following, considered individually or according to the technically possible combinations:
  • the number of nodes selected is a function of the difference between the predicted consumption and the instantaneous consumption limit; the method is implemented before a resource allocation, the resources to be allocated being used as a parameter of the prediction function of the future consumption;
  • the process is implemented according to a schedule; the nodes are assigned to treatments, the treatments being classified according to at least two categories, the at least one node being selected according to the category of treatment that it performs;
  • the nodes are pre-classified in at least two groups
  • the at least one node is selected from a predetermined group; - to select the at least one node is selected the entirety of a predetermined group;
  • the at least one node is selected from the nodes having a predetermined status.
  • the invention also relates to a digital storage device comprising a file corresponding to instruction codes implementing the method according to a possible combination of the preceding features.
  • the invention also relates to a device implementing the method according to a possible combination of the preceding features.
  • Figure 1 an illustration of means for implementing the invention
  • FIG. 1 an illustration of steps of the method according to the invention.
  • the supervision server comprises:
  • a storage means 1 for example a hard disk whether local or remote, whether simple or in a grid (for example RAI D); a communication interface 130, for example a communication card according to the Ethernet protocol.
  • Other protocols are conceivable as "Fiber Channel” or InfiniBand.
  • the microprocessor 1 1 0 of the supervision server, the storage means 1 20 of the supervision server and the communication interface 1 30 of the supervision server are interconnected by a bus 1 50.
  • an action When an action is taken to a device it is actually performed by a microprocessor of the device controlled by instruction codes stored in a memory of the device. If an action is taken to an application, it is actually performed by a microprocessor of the device in a memory of which the instruction codes corresponding to the application are recorded. When a device, or an application sends a message, this message is sent via a communication interface of said device or of said application.
  • FIG. 1 shows that the storage means 1 of the supervisory server 1 00 comprise:
  • cluster database area 120.2 or node management database, which includes information about the nodes in the server cluster supervised by the supervisory server 1 00;
  • FIG. 1 shows a cluster 200 of servers.
  • the cluster 200 of servers having a number Z of nodes.
  • the server cluster 200 is supervised by the supervisory server 100.
  • Figure 1 shows a power supply block 300 corresponding to an electrical cabinet 300 from which the power is distributed in the cluster 200 of servers.
  • Figure 1 shows a network 400 for interconnecting the server 1 00 supervision, the server cluster 200 and 300 power cabinet.
  • FIG. 1 shows a calendar server 500, the calendar server 500 being interconnected with the supervision server 1 00 via at least the network 400.
  • the calendar server 500 delivers, when it is polled, a limit of powerful , that is, a value representing maximum consumption. This value can be associated with one or more dates so as to specify during which time interval the issued limit is valid.
  • the calendar server may be replaced by a zone in the storage means of the supervisory server 1 00.
  • a zone is, for example, structured as a table for associating time intervals and power limits.
  • Figure 2 shows a step 1 1 00 evaluation of the need for an adaptation of the consumption of the server cluster 200. This step can occur in at least two circumstances:
  • the supervision server allocates resources for the execution of a new job
  • second case a planning of the evaluation to follow as well as possible evolutions of a power limit setpoint.
  • FIG. 2 shows that the step 1 100 comprises a sub-step 1 1 1 0 measuring an instant consumption of the cluster 200 of servers.
  • the supervisory server 1 00 interrogates the power cabinet 300 to know the power that it is delivering.
  • FIG. 2 shows that step 1 1 00 comprises a substep 1 1 20 for acquiring an instantaneous consumption limit.
  • the supervisory server 100 interrogates the calendar server 500 to know the current limit, that is to say at the date of the question, of the power that can consume the cluster of 200 servers.
  • the mode of acquisition of the limit includes the possibility of specifying a date. We then obtain a limit corresponding to the specified date.
  • Step 1 1 1 0 At the end of the step 1 1 1 1 0 measuring an instantaneous consumption and step 1 1 20 acquisition of an instantaneous consumption limit the supervision server 100 goes to a substep 1 1 30 prediction of future consumption.
  • Step 1 1 30 depends on the case that caused the execution of step 1 100 of assessing the need for a consumption adaptation.
  • the server 1 00 supervision is allocating resources for the execution of a new job.
  • the supervisory server 1 00 knows the characteristics of this new work, and in particular the number of nodes required for said execution.
  • the server is therefore able to calculate how much the cluster will be consumed once the new job is running. This is the sum of the instantaneous consumption and the estimated consumption for the new job.
  • the supervisory server 1 00 thus obtains a predicted consumption corresponding to the first case.
  • the first case may be a little more complex taking into account, for example, the work that will end.
  • the predicted consumption is the measured instantaneous consumption.
  • the acquisition of limit can be done at a date slightly in the future.
  • this slightly in the future may be, for example, the half-planning period.
  • the server 1 00 supervision has therefore produced a consumption prediction.
  • the supervisory server 100 passes to a substep 1 140 of confrontation of the prediction to the acquired limit. If the prediction is below the acquired limit, then we go to step X of end of the power management. If the prediction is greater than the acquired limit, then we proceed to a step 1200 of limiting the consumption of the cluster.
  • Step 1 200 comprises a sub-step 121 0 for calculating the number of nodes to be stopped in order not to exceed the acquired limit. This number of nodes is a function of the difference between the prediction and the acquired limit.
  • step 1220 for selecting a number of nodes corresponding to the number calculated in the previous step. There are several strategies for this selection.
  • a first strategy consists in choosing a group of nodes from the groups of nodes described in the zone 1 20.3 for describing groups of nodes.
  • the group chooses must fulfill at least two criteria:
  • a second strategy is to choose nodes among those described by the node management database as being in status "idle" (rest or waiting), that is to say, waiting to be allocated.
  • status "idle” rest or waiting
  • the nodes, and their components are never dormant to ensure the fastest start possible. This results in a significant resting consumption.
  • a third strategy is to choose nodes among those executing jobs that have been identified as non-priority. This third strategy is implemented efficiently by using several job management queues, in particular by using a management queue dedicated to non-priority jobs. The selection of the corresponding nodes is then facilitated.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Power Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Power Sources (AREA)

Abstract

Procédé de gestion automatique de la consommation électrique d'une grappe de serveurs comportant une pluralité de nœuds caractérisé en ce que le procédé comporte les étapes suivantes : - mesure d'une consommation instantanée de la grappe de serveurs; - acquisition d'une limite instantanée de consommation; - prédiction d'une consommation future selon une fonction d'au moins la mesure de consommation instantanée; - si la prédiction est supérieure à la limite instantanée acquise alors : - sélection d'au moins un nœud - arrêt électrique du au moins un nœud sélectionné.

Description

Procédé de gestion automatique de la consommation électrique d'une grappe de serveurs
DOMAINE TECHNIQUE DE L'INVENTION
[ 0001 ] L'invention se rapporte à procédé de gestion de la consommation électrique d'une grappe de serveurs.
[0002 ] On entendra par grappe de serveurs dans le cadre de la présente demande tout ensemble de serveurs gérés de manière centralisée. Sont en particulier visés les calculateurs hautes performances aussi appelés calculateur HPC.
ETAT DE LA TECHNIQUE ANTERIEURE
[0003 ] Dans un environnement d'un calculateur haute performance (HPC) la consommation énergétique est un critère prépondérant pour au moins trois raisons :
il faut prendre en compte la puissance disponible pour ne pas faire s'écrouler la structure d'alimentation et donc le calculateur ; il faut prendre en compte les capacités de dissipation thermique pour ne pas risquer d'endommager le calculateur par échauffement ;
- enfin le coût associé peut dépasser le million d'euros annuel (métrique actuelle basée sur une puissance de calcul d'environ 1 MW/P Flops).
[ 0004 ] Dans ce contexte il est important de s'assurer que la consommation énergétique maximale tolérée (i.e. par le calculateur en place limitant le nombre de MWs utilisables, ou encore pour limiter et contrôler la facture énergétique) soit respectée.
[0005 ] Pour ce faire, des mécanismes existent afin de positionner des serveurs de calcul en arrêt (power-off), en mode de suspension (suspend) ou encore réduire son utilisation d'énergie (mode idle ou réduction de la fréquence CPU ...). Cependant, ces arrêts ou ces changements d'états doivent être gérés afin d'assurer le fonctionnement optimal du calculateur (performance maximale dans l'enveloppe énergétique donnée).
[0006] Ce souci de ne pas dépasser la puissance maximale « autorisée » (soit par une contrainte physique soit par une contrainte économique) doit pouvoir être géré de manière très réactive (réaction de l'ordre de la milliseconde) et ne peut donc pas être facilement traitée au niveau logiciel (i.e. plusieurs milliers d'équipements à traiter en parallèle). Il est donc nécessaire de traiter (du moins en partie) les pics de consommation via un mécanisme de type « disjoncteur ».
[0007 ] Les disjoncteurs sont très rapides et coupent l'alimentation d'un groupe de nœuds. Il s'agit cependant d'une démarche réactive, la sur consommation d'énergie a déjà commencé, De plus pour la remise en ligne des nœuds disjonctés, il faut effectuer un réarmement bien souvent manuel.
[0008 ] Les solutions de l'état de la technique ne permettent donc pas une gestion fine de la consommation d'un calculateur et en particulier pas le suivie d'une valeur de consigne de consommation.
EXPOSE DE L'INVENTION
[0009] L'invention vise à remédier à tout ou partie des inconvénients de l'état de la technique identifiés ci-dessus, et notamment à proposer des moyens pour permettre de suivre une valeur de consigne de consommation sans la dépasser.
[ 0010 ] Dans ce dessein, un aspect de l'invention se rapporte à un procédé de gestion automatique de la consommation électrique d'une grappe de serveurs comportant une pluralité de nœuds caractérisé en ce que le procédé comporte les étapes suivantes :
mesure d'une consommation instantanée de la grappe de serveurs ; acquisition d'une limite instantanée de consommation ;
prédiction d'une consommation future selon une fonction d'au moins la mesure de consommation instantanée;
- si la prédiction est supérieure à la limite instantanée acquise alors :
sélection d'au moins un nœud
arrêt électrique du au moins un nœud sélectionné.
[ 0011 ] Outre les caractéristiques principales qui viennent d'être mentionnées dans le paragraphe précédent, le procédé/dispositif selon l'invention peut présenter une ou plusieurs caractéristiques complémentaires parmi les suivantes, considérées individuellement ou selon les combinaisons techniquement possibles:
le nombre de nœuds sélectionnés est fonction de de l'écart entre la consommation prédite et la limite instantanée de consommation ; le procédé est mis en œuvre avant une allocation de ressources, les ressources devant être allouées étant utilisées comme un paramètre de la fonction de prédiction de la consommation future ;
le procédé est mis en œuvre en fonction d'une planification ; - les nœuds sont affectés à des traitements, les traitements étant classés selon au moins deux catégories, le au moins un nœud étant sélectionné selon la catégorie de traitement qu'il exécute ;
les nœuds sont pré-classés en au moins deux groupes ;
le au moins un nœud est sélectionné dans un groupe prédéterminé ; - pour sélectionner le au moins un nœud on sélectionne l'intégralité d'un groupe prédéterminé ;
le au moins un nœud est sélectionnée parmi les nœuds ayant un statut prédéterminé.
[0012] L'invention se rapporte également à un dispositif de stockage numérique comportant un fichier correspondant à des codes instructions mettant en œuvre le procédé selon une combinaison possible des caractéristiques précédentes.
[0013] L'invention se rapporte également à un dispositif mettant en œuvre le procédé selon une combinaison possible des caractéristiques précédentes.
BREVE DESCRIPTION DES FIGURES
[0014] D'autres caractéristiques et avantages de l'invention ressortiront à la lecture de la description qui suit, en référence aux figures annexées, qui illustrent :
la figure 1 : une illustration de moyen permettant la mise en œuvre de l'invention ;
la figure 2 : une illustration d'étapes du procédé selon l'invention.
[0015] Pour plus de clarté, les éléments identiques ou similaires sont repérés par des signes de référence identiques sur l'ensemble des figures.
[0016] L'invention sera mieux comprise la lecture de la description qui suit et à l'examen des figures qui l'accompagnent. Celles-ci sont présentées à titre indicatif et nullement limitatif de l'invention.
DESCRIPTION DETAILLEE D'UN MODE DE REALISATION [0017] La figure 1 montre un dispositif serveur 1 00 de supervision. Le serveur de supervision comporte :
un microprocesseur 1 1 0 ;
des moyens de stockage 1 20, par exemple un disque dur qu'il soit local ou distant, qu'il soit simple ou en grille (par exemple RAI D) ; une interface 130 de communication, par exemple une carte de communication selon le protocole Ethernet. D'autres protocoles sont envisageables comme « Fibre Channel » ou InfiniBand.
[0018] Le microprocesseur 1 1 0 du serveur de supervision, les moyens 1 20 de stockage du serveur de supervision et l'interface 1 30 de communication du serveur de supervision sont interconnectés par un bus 1 50.
[0019] Lorsque l'on prête une action à un dispositif celle-ci est en fait effectuée par un microprocesseur du dispositif commandé par des codes instructions enregistrés dans une mémoire du dispositif. Si l'on prête une action à une application, celle-ci est en fait effectuée par un microprocesseur du dispositif dans une mémoire duquel les codes instructions correspondant à l'application sont enregistrés. Lorsqu'un dispositif, ou une application émet un message, ce message est émis via une interface de communication dudit dispositif ou de la dite application.
[0020] La figure 1 montre que les moyens 1 20 de stockage du serveur 1 00 de supervision comportent :
une zone 1 20.1 comportant des codes instructions correspondant à la mise en œuvre de l'invention ;
une zone 120.2 base de données de grappe, ou base de données de gestion de nœuds, qui comporte les informations sur les nœuds que comporte la grappe de serveurs supervisée par le serveur 1 00 de supervision ;
une zone 1 20.3 comportant une description de groupes de nœuds. Une telle description comporte au moins un ensemble d'identifiant de nœud. Un identifiant de nœud est, par exemple, une adresse sur un réseau auquel est connecté le nœud, ou un identifiant dans une base de données de gestion de nœuds. [0021 ] La figure 1 montre une grappe 200 de serveurs. La grappe 200 de serveurs comportant un nombre Z de nœuds. Dans cette description la grappe 200 de serveur est supervisée par le serveur 1 00 de supervision.
[ 0022 ] La figure 1 montre un bloc 300 d'alimentation correspondant à une armoire 300 électrique à partir de laquelle la puissance est distribuée dans la grappe 200 de serveurs.
[0023 ] La figure 1 montre un réseau 400 permettant d'interconnecter le serveur 1 00 de supervision, la grappe 200 de serveurs et l'armoire 300 d'alimentation.
[ 0024 ] Dans la pratique c'est également l'armoire 300 électrique qui alimente le serveur 1 00 de supervision et le réseau 400.
[0025 ] La figure 1 montre un serveur 500 de calendrier, le serveur 500 de calendrier étant interconnecté avec le serveur 1 00 de supervision via au moins le réseau 400. Le serveur 500 de calendrier délivre, lorsqu'il est interrogé une limite de puissante, c'est-à-dire une valeur représentant une consommation maximale. Cette valeur peut être associée à une ou plusieurs dates de manière à spécifier durant quel intervalle de temps la limite délivrée est valable.
[0026] Dans une variante, le serveur de calendrier peut être remplacé par une zone dans les moyens de stockage du serveur 1 00 de supervision. Une telle zone est, par exemple, structurée comme une table pour associer des intervalles de temps et des limites de puissance.
[0027 ] La figure 2 montre une étape 1 1 00 d'évaluation de la nécessité d'une adaptation de la consommation de la grappe 200 de serveur. Cette étape peut survenir dans au moins deux circonstances :
- premier cas : le serveur de supervision alloue des ressources en vue de l'exécution d'un nouveau travail,
deuxième cas : une planification de l'évaluation pour suivre au mieux des évolutions d'une consigne de limite de puissance.
[0028 ] La figure 2 montre que l'étape 1 100 comporte une sous-étape 1 1 1 0 de mesure d'une consommation instantanée de la grappe 200 de serveurs. Dans la sous-étape 1 1 1 0 de mesure d'une consommation instantanée, le serveur 1 00 de supervision interroge l'armoire 300 d'alimentation pour connaître la puissance qu'elle est en train de délivrer. [0029] La figure 2 montre que l'étape 1 1 00 comporte une sous-étape 1 1 20 d'acquisition d'une limite de consommation instantanée. Dans la sous-étape 1 120 d'acquisition d'une limite de consommation instantanée le serveur 1 00 de supervision interroge le serveur 500 de calendrier pour connaître la limite courante, c'est-à-dire à la date de la question, de la puissance que peut consommer la grappe 200 de serveurs. Dans une variante le mode d'acquisition de la limite inclut la possibilité de spécifier une date. On obtient alors une limite correspondant à la date spécifiée.
[0030 ] A la fin de l'étape 1 1 1 0 de mesure d'une consommation instantanée et de l'étape 1 1 20 d'acquisition d'une limite de consommation instantanée le serveur 100 de supervision passe à une sous-étape 1 1 30 de prédiction d'une consommation future. L'étape 1 1 30 dépend du cas qui a provoqué l'exécution de l'étape 1 100 d'évaluation de la nécessité d'une adaptation de consommation.
[ 0031 ] Dans le premier cas le serveur 1 00 de supervision est en train d'allouer des ressources en vue de l'exécution d'un nouveau travail. Le serveur 1 00 de supervision connaît les caractéristiques de ce nouveau travail, et en particulier le nombre de nœuds requis pour ladite exécution. Le serveur est donc capable de calculer quelle sera la consommation de la grappe une fois le nouveau travail en cours d'exécution. Il s'agit de la somme de la consommation instantanée et de la consommation estimée pour l'exécution du nouveau travail. Le serveur 1 00 de supervision obtient ainsi une consommation prédite correspondant au premier cas.
[ 0032 ] Le premier cas peut être un peu plus complexe en prenant en compte, par exemple, les travaux qui vont se terminer.
[ 0033 ] Dans le deuxième cas il n'y a pas de nouveau travail à planifier. Dans ce cas la consommation prédite est la consommation instantanée mesurée.
[0034 ] Dans les premier est deuxième cas l'acquisition de limite peut se faire à une date légèrement dans le futur. Dans le deuxième cas, ce légèrement dans le futur peut être, par exemple, la demi-période de planification.
[ 0035 ] A la fin de la sous-étape 1 1 30 de prédiction, le serveur 1 00 de supervision a donc produit une prédiction de consommation.
[0036] De la sous-étape 1 130 de prédiction le serveur 1 00 de supervision passe à une sous-étape 1 140 de confrontation de la prédiction à la limite acquise. Si la prédiction est inférieure à la limite acquise, alors on passe à une étape X de fin de la gestion de l'alimentation. Si la prédiction est supérieure à la limite acquise, alors on passe à une étape 1200 de limitation de la consommation de la grappe.
[0037 ] L'étape 1 200 comporte une sous-étape 121 0 de calcul du nombre de nœuds à arrêter pour ne pas dépasser la limite acquise. Ce nombre de nœuds est fonction de la différence entre la prédiction et la limite acquise.
[0038 ] Une fois le nombre de nœuds à éteindre connu on passe à une étape 1 220 de sélection d'un nombre de nœuds correspondant au nombre calculé à l'étape précédente. Il existe plusieurs stratégies pour cette sélection.
[ 0039] Une première stratégie consiste à choisir un groupe de nœuds parmi les groupes de nœuds décrit dans la zone 1 20.3 de description de groupes de nœuds. Le groupe choisit doit remplir au moins deux critères :
comporter un nombre de nœuds au moins égal au nombre de nœuds calculé dans la sous-étape 1 21 0 de calcul du nombre de nœuds, - correspondre à des nœuds alimentés.
[0040 ] Dans cette première stratégie, une fois le groupe sélectionné on peut, dans une variante, ne choisir que le nombre de nœuds requis et pas le groupe en entier.
[ 0041 ] Une deuxième stratégie consiste à choisir des nœuds parmi ceux décrit par la base de données de gestion de nœuds comme étant en statut « idle » (repos ou attente), c'est-à-dire en attente d'être alloué. On note ici que dans une grappe de serveur à vocation haute performance, les nœuds, et leurs composants, ne sont jamais en sommeil pour garantir le démarrage le plus rapide possible. Il en résulte une consommation au repos significative.
[0042 ] Une troisième stratégie consiste à choisir des nœuds parmi ceux exécutant des travaux ayant été identifiés comme non prioritaires. Cette troisième stratégie est mise en œuvre efficacement en utilisant plusieurs files de gestion de travaux, en particulier en utilisant une file gestion dédiée aux travaux non prioritaires. La sélection des nœuds correspondant est alors facilitée.
[ 0043 ] Il est possible d'utiliser plusieurs de ces stratégies en même temps, en fonction du nombre de nœuds à sélectionner ou d'une programmation prédéterminée. [0044 ] Une fois les nœuds sélectionné, on passe à une étape 1300 de d'extinction des nœuds sélectionnés. Cette mise à hors tension est réalisée, par émission d'un message, par exemple I PMI, vers les nœuds sélectionnés.
[ 0045 ] Il est ainsi possible, avec l'invention, de prévenir les dépassements d'une consigne de limite de consommation. L'invention permet également de suivre au plus près une telle consigne.

Claims

REVENDICATIONS
1 . Procédé de gestion automatique de la consommation électrique d'une grappe (200) de serveurs comportant une pluralité de nœuds caractérisé en ce que le procédé comporte les étapes suivantes :
mesure (1 1 10) d'une consommation instantanée de la grappe de serveurs ;
acquisition (1 120) d'une limite instantanée de consommation ; prédiction (1 130) d'une consommation future selon une fonction d'au moins la mesure de consommation instantanée;
si (1 140) la prédiction est supérieure à la limite instantanée acquise alors :
sélection (1210-1220) d'au moins un nœud
arrêt (1300) électrique du au moins un nœud sélectionné.
2. Procédé de gestion automatique selon la revendication 1 , caractérisé en ce que le nombre de nœuds sélectionnés est fonction (1210) de de l'écart entre la consommation prédite et la limite instantanée de consommation.
3. Procédé de gestion automatique selon l'une des revendications précédentes, caractérisé en ce qu'il est mis en œuvre avant une allocation de ressources, les ressources devant être allouées étant utilisées comme un paramètre de la fonction de prédiction de la consommation future.
4. Procédé de gestion automatique selon l'une des revendications précédentes, caractérisé en ce qu'il est mis en œuvre en fonction d'une planification.
5. Procédé de gestion automatique selon l'une des revendications précédentes, caractérisé en ce que les nœuds sont affectés à des traitements, les traitements étant classés selon au moins deux catégories, le au moins un nœud étant sélectionné selon la catégorie de traitement qu'il exécute.
6. Procédé de gestion automatique selon l'une des revendications précédentes, caractérisé en ce que les nœuds sont pré-classés en au moins deux groupes.
7. Procédé de gestion automatique selon la revendication 4, caractérisé en ce que le au moins un nœud est sélectionné dans un groupe prédéterminé.
8. Procédé de gestion automatique selon la revendication 4, caractérisé en ce que le pour sélectionner le au moins un nœud on sélectionne l'intégralité d'un groupe prédéterminé.
9. Procédé de gestion automatique selon l'une des revendications précédentes, caractérisé en ce que le au moins un nœud est sélectionnée parmi les nœuds ayant un statut prédéterminé.
10. Dispositif de stockage numérique comportant un fichier correspondant à des codes instructions mettant en œuvre le procédé selon l'une des revendications précédentes.
1 1 . Dispositif mettant en œuvre le procédé selon l'une des revendications 1 à 9.
EP15822954.2A 2014-12-30 2015-12-28 Procédé de gestion automatique de la consommation électrique d'une grappe de serveurs Ceased EP3241089A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1463444A FR3031200B1 (fr) 2014-12-30 2014-12-30 Procede de gestion automatique de la consommation electrique d'une grappe de serveurs
PCT/EP2015/081279 WO2016107840A1 (fr) 2014-12-30 2015-12-28 Procédé de gestion automatique de la consommation électrique d'une grappe de serveurs

Publications (1)

Publication Number Publication Date
EP3241089A1 true EP3241089A1 (fr) 2017-11-08

Family

ID=52684523

Family Applications (1)

Application Number Title Priority Date Filing Date
EP15822954.2A Ceased EP3241089A1 (fr) 2014-12-30 2015-12-28 Procédé de gestion automatique de la consommation électrique d'une grappe de serveurs

Country Status (4)

Country Link
US (1) US20190155359A1 (fr)
EP (1) EP3241089A1 (fr)
FR (1) FR3031200B1 (fr)
WO (1) WO2016107840A1 (fr)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3076005B1 (fr) * 2017-12-22 2019-12-27 Bull Sas Commande de la consommation energetique d'une grappe de serveurs
EP4195044A1 (fr) * 2021-12-09 2023-06-14 Bull SAS Méthode d'optimisation de la consommation énergétique d'une infrastructure informatique par suspension de travaux

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7210048B2 (en) * 2003-02-14 2007-04-24 Intel Corporation Enterprise power and thermal management
CN102016748A (zh) * 2008-04-21 2011-04-13 自适应计算企业股份有限公司 用于管理计算环境中的能量消耗的系统和方法
US8862922B2 (en) * 2010-01-14 2014-10-14 International Business Machines Corporation Data center power adjustment

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
None *
See also references of WO2016107840A1 *

Also Published As

Publication number Publication date
WO2016107840A1 (fr) 2016-07-07
FR3031200B1 (fr) 2017-12-29
US20190155359A1 (en) 2019-05-23
FR3031200A1 (fr) 2016-07-01

Similar Documents

Publication Publication Date Title
CN108632365B (zh) 服务资源调整方法、相关装置和设备
CA2852367C (fr) Procede, programme d'ordinateur et dispositif d'allocation de ressources informatiques d'un cluster pour l'execution d'un travail soumis audit cluster
Calheiros et al. Virtual machine provisioning based on analytical performance and QoS in cloud computing environments
US9104498B2 (en) Maximizing server utilization within a datacenter
EP2894872B1 (fr) Procédé d'ordonnancement de tâches dans un réseau à courants porteurs en ligne
US20180254998A1 (en) Resource allocation in a cloud environment
Prachitmutita et al. Auto-scaling microservices on IaaS under SLA with cost-effective framework
FR2906907A1 (fr) Procedes et dispostif de gestion de l'energie dans un systeme de traitement d'informations
US20170034031A1 (en) Automatic determination of optimal time window for migration, backup or other processes
WO2016107840A1 (fr) Procédé de gestion automatique de la consommation électrique d'une grappe de serveurs
US10171572B2 (en) Server pool management
US8745125B2 (en) Routing traffic after power failure
Wang et al. Trust: Real-time request updating with elastic resource provisioning in clouds
WO2016198762A1 (fr) Procédé et système de détermination d'une configuration de serveurs cible pour un déploiement d'une application logicielle
EP3502809B1 (fr) Procédé de pilotage de ballons d'eau chaude sanitaire
FR3045972B1 (fr) Brassage dynamique de l'alimentation electrique
US9052904B1 (en) System and method for determining whether to reschedule malware scans based on power-availability information for a power grid and power-usage information for the scans
EP3051416A1 (fr) Procédé de commande de déploiement d'un programme a exécuter dans un parc de machines
FR3067832A1 (fr) Fourniture de services inter-groupements
Canon et al. Évaluation de la consommation d’énergie nécessaire à l’exécution d’un workload dans un datacenter vert
Feinberg et al. Optimizing cloud utilization via switching decisions
Bhattacharjee et al. Enhancing reliability of cloud system through proactive identification of under performing components
Bayati Data centers energy optimization
CN118175032A (zh) 一种云服务创建方法、装置、电子设备及存储介质
EP4148569A1 (fr) Procédé d'ordonnancement d'un ensemble de taches de calcul dans un supercalculateur

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20170727

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

DAV Request for validation of the european patent (deleted)
DAX Request for extension of the european patent (deleted)
17Q First examination report despatched

Effective date: 20190228

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: EXAMINATION IS IN PROGRESS

REG Reference to a national code

Ref country code: DE

Ref legal event code: R003

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION HAS BEEN REFUSED

18R Application refused

Effective date: 20201130