WO2018130762A1

WO2018130762A1 - Procédé d'analyse des règles d'évolutions entre les niveaux d'utilisation des ressources d'un système informatique

Info

Publication number: WO2018130762A1
Application number: PCT/FR2018/000005
Authority: WO
Inventors: Bruno DEMEILLIEZ; Florent Rochette; Gilles MENIGOT
Original assignee: Bull Sas
Priority date: 2017-01-12
Filing date: 2018-01-11
Publication date: 2018-07-19
Also published as: FR3061785B1; US20190384688A1; EP3568766A1; FR3061785A1

Abstract

La présente invention concerne un procédé d'évaluation de la performance d'une chaîne applicative au sein d'une infrastructure informatique, comprenant un nombre N de ressources notées R_i (1 ≤ i ≤ N), comprenant les étapes de : collecte, sur un même intervalle de temps et avec une même période d'échantillonnage period_ech d'un nombre prédéfini M de séries de mesures X_k (1 ≤ k ≤ M) relatives aux niveaux d'utilisation des ressources R_i; pour toutes les combinaisons possibles de deux séries de mesures (X_k1,X_k2),avec k1≠ k2 : création de plusieurs couples de sous-ensembles (X'k1,X'k2) en sélectionnant un nombre prédéfini n_⋎ de valeurs à partir des séries X_k1 et X_k2; application d'un algorithme de recherche de relation(s) de corrélation affine sur chaque couple de sous-ensembles; calcul des pourcentages P(i) de différence entre les valeurs de X'_k2(t) et de aX'_k1(t) + b pour chaque indice t (compris entre 1 et n_⋎); calcul des valeurs de saturation de la série X'_k2.

Description

Procédé d'analyse des règles d'évolutions entre les niveaux d'utilisation des ressources d'un système informatique

La présente invention concerne le domaine de la surveillance d' une infrastructure informatique, cette expression désignant l'ensemble des éléments matériels et logiciels composant le système informatique d'une entreprise ou d'une organisation. L'invention concerne plus particulièrement le domaine de l'analyse des ressources (notamment processeur, système d'exploitation, mémoire) d'une infrastructure informatique sur laquelle est hébergée une chaîne de liaison applicative, c'est-à-dire, pour un processus, une chaîne fonctionnelle reliant plusieurs applications qui fonctionnent ensemble pour réaliser le processus.

De nombreuses infrastructures informatiques sont mal dimensionnées - et le plus souvent sous-dimensionnées. Un mauvais dimensionnement se traduit par des performances insuffisantes, voire des arrêts de la production. Bien dimensionner une infrastructure informatique est un enjeu majeur pour les entreprises dont la production dépend des performances de leurs systèmes informatiques. Le terme « dimensionnement » désigne les capacités (calculatoires, mémorielles) des serveurs, couplées à la disponibilité des ressources (matérielles et logicielles).

Une montée en charge d'un système informatique peut s'accompagner d'une saturation progressive des ressources du système au sein d'une même chaîne fonctionnelle (ou chaîne de liaison applicative). La saturation d'une ressource bloque la montée en charge du système et empêche par conséquent d'observer la saturation éventuelle des autres ressources de la chaîne.

L'utilisation d'une ressource peut induire l'utilisation d'une autre ressource. A titre d'exemple, dans le cas d'une application ordonnant qu'un calcul soit effectué sur une machine A et que son résultat soit enregistré sur une machine B, le n iveau d'utilisation des processeurs de la machine A dépend de l'avancement des enregistrements sur la machine B.

Chaque ressource est caractérisée par un niveau d'utilisation maximal pour un fonctionnement optimal (par exemple quatre-vingt pourcent pour un processeur). La présente invention vise à proposer une méthode pour définir une corrélation du niveau d'utilisation d'u ne ressource A par rapport au niveau d'utilisation d'une ressource B afin de déterminer, lorsque la ressource B est saturée sans que la ressource A le soit, le dimensionnement de la ressource B nécessaire pour atteindre le niveau maximal de la ressource A.

L'objectif est de dimensionner de manière cohérente et optimale les ressources d'un système informatique et éviter les saturations des ressources et leurs conséquences.

La recherche de corrélations dans les évolutions des niveaux d'utilisation des ressources d'une chaîne applicative vise à prédire :

- l'évolution des consommations et les saturations des ressources lors de l'augmentation de la charge,

- le dimensionnement des ressources d'une chaîne applicative comprenant plusieurs serveurs.

I l existe des solutions pour surveiller des serveurs à l'unité, mais elles ne permettent pas de déterminer les niveaux d'utilisation future des ressources, ni d'établir une corrélation entre les différents niveaux d'utilisation des ressources de différents serveurs au sein d'une même chaîne applicative.

Un objectif de la présente invention est de permettre une analyse automatique des consommations des ressources d'un système informatique et d'en déduire des corrélations entre les niveaux d'utilisation des ressources.

A cet effet, il est proposé un procédé d'évaluation de la performance d'une chaîne applicative au sein d'une infrastructure informatique, comprenant un nombre N de ressources notées R_t (avec i un entier compris entre 1 et N), comprenant les étapes de:

- collecte, sur un même intervalle de temps et avec une même période d'échantillonnage period_ech d'un nombre prédéfini M de séries de mesures X_k (avec k un entier compris entre 1 et M) relatives aux niveaux d 'utilisation de ressources distinctes,

- pour toutes les combinaisons possibles de deux séries de mesures

parmi les séries collectées : création de plusieurs couples de sous-ensembles en sélectionnant un nombre prédéfini n„de

valeurs à partir des séries de mesures X_kl et X_k2 respectivement,

application d'un algorithme de recherche de relation(s) de corrélation affine sur chaque couple de sous- ensembles ^la corrélation affine étant

modélisé par l'équation où a et b sont

des nombres réels,

calcul, pour chaque couple

des pourcentages P(t de différence entre les valeurs de

et de

suivant la formule P(t) = à chaque indice t (compris entre 1

et n„),

calcul , pour chaque couple et à condition

que toutes les valeurs de P(t) soient inférieures ou égales à une valeur prédéfinie T, des valeurs de saturation ou

s^ont respectivement les valeurs

minimale et maximale de la série de mesures X'_k2- Selon diverses caractéristiques prises seules ou en combinaison :

- la valeur de n„ est comprise entre 3 et 60.

- chaque série de mesure est réalisée sur un intervalle de temps supérieur ou égal à 2 heures.

- chaque série de mesures est réalisée avec une période d'échantillonnage period_ech d'une minute.

- la valeur T est de 95% .

- le nombre de couples de sous-ensembles est compris entre 1 et 100.

L'étape de sélection des sous-ensembles X'_kl et X'_k2 comporte les opérations de :

- prise en compte des paramètres suivants : les valeurs minimale p_min et maximale p_max d'une période de recherche notée p, p étant une variable de la méthode, le pas d'incrémentation de la période p, une période d'échantillonnage periode_ech,

- création des n_v valeurs du sous ensemble X'_kl en sélectionnant valeurs dans la série X_kl,

- création des n_w valeurs du sous ensemble X'_k2 en sélectionnant riy valeurs dans la série X_k2.

L'algorithme de recherche d'une relation affine entre deux séries de mesures comprend les opérations de :

- calcul de a comme étant le rapport entre

soit est la moyenne des différences

entre les valeurs successives de la liste soit

est la moyenne des

différences entre les valeurs successives de la liste soit

- calcul de b suivant la formule

X'_kl t) sont les valeurs dans les séries à l'ind ice t.

Selon diverses caractéristiques prises seules ou en combinaison :

- le paramètre p_min est fixé à une valeur comprise entre 1 et 10.

- le paramètre p_max est fixé à une valeur comprise entre 1 et 1 00.

- Le paramètre p_pas est fixé à une valeur comprise entre 1 et 10. L'invention sera mieux comprise et d'autres détails, caractéristiques et avantages de l'invention apparaîtront à la lecture de la description suivante faite à titre d'exemple non limitatif en référence aux dessins, dans lesquels :

- La FIG.1 est une représentation schématique de cinq ressources et des combinaisons possibles entre les séries de mesures effectuées sur ces ressources.

- La FIG.2 est un diagramme fonctionnel illustrant différentes étapes du procédé de recherche des règles d'évolutions entre les différentes ressources d'un système informatique.

- Le LISTI NG.1 est un pseudo code décrivant un exemple de réalisation du procédé dans le cas de la recherche d'une règle d'évolution entre deux séries de mesures. Une architecture (ou un système, ou encore une infrastructure) informatique comprend classiquement diverses ressources, matérielles et/ou logicielles, qui , pour accomplir des processus, sont reliées entre elles pour former une ou plusieurs chaîne(s) fonctionnelle(s) (ou chaîne(s) de liaison applicative, ou encore chaîne(s) applicative(s)).

Pour optimiser le fonctionnement d'une telle chaîne applicative, il est décrété nécessaire d'évaluer sa performance et notamment l'utilisation des ressources qui la constituent. On note N (N un entier) le nombre de ressources, notées R_i (i un entier tel que l≤i≤N), de la chaîne applicative.

Pour évaluer la performance de la chaîne applicative, le principe est de rechercher des règles d'évolution entre plusieurs séries de mesures effectuées sur les ressources, typiquement le niveau d'utilisation, la charge, la mémoire disponible, la mémoire ou l'espace disque occupé(e). Par « règle d'évolution » , on entend une relation de corrélation de type affine entre deux séries de mesures se rapportant à des niveaux d'utilisation de ressources R_t. La FIG.1 fournit un exemple de cinq ressources notées

Une étape du procédé consiste à effectuer et collecter une pluralité de séries de mesures notée X_k, chaque mesure fournissant un niveau (ou taux) d'utilisation d'une ressource R_t. Ces séries sont notées X₁ à X₅ dans l'exemple de la FIG.1 . Le niveau d'utilisation d'une ressource est une grandeur physique dont la nature peut varier selon le type de ressource examiné. I l peut s'agir d'une puissance consommée dans le cas d'un processeur (par ex. un processeur central), un pourcentage du taux de transfert maximum dans le cas d'un disque dur, ou encore un pourcentage de la capacité totale (ou taux d'occupation) dans le cas d'une mémoire vive.

La FIG.2 illustre les principales étapes du procédé.

Une étape préliminaire consiste à collecter un nombre M (M un entier non nécessairement égal à N) prédéfini de séries de mesures réalisées toutes sw un même intervalle de temps et avec

une même période d'échantillonnage notée period_ech.

Les mesures sont avantageusement réalisées de manière automatique par un programme exécuté sur un ou plusieurs serveur(s) intégré à l'infrastructure informatique. Les mesures sont de préférence réalisées (et collectées) sur un intervalle de temps d'au moins 2 heures, avec une période d'échantillonnage d'une minute. A titre d'exemple, les mesures sont réalisées sur une période de quatre heures (typiquement comprise entre 08h00 et 12h00, avec une période d'échantillonnage d'une minute (i.e. deux mesures successives sont espacées d'une minute).

Les mesures permettent par ex. de déterminer le niveau d'activité d'un processeur central (Central Processing Unit ou CPU) et des disques de deux serveurs. Dans cet exemple, la méthode proposée par la présente invention permet de déterminer des corrélations de type affine entre les activités des processeurs et des disques des deux serveurs, suivant toutes les combinaisons possibles :

- corrélation entre le niveau d'activité du CPU du premier serveur et celui de son propre disque,

- corrélation entre le niveau d 'activité d u CPU du premier serveur et celui du disque du second serveur,

- corrélation entre le niveau d'activité du CPU du second serveur et celui de son propre disque,

- corrélation entre le niveau d'activité du CPU du second serveur et celui du disque du premier serveur,

- corrélation entre le niveau d'activité du CPU du premier serveur et celui du CPU du second serveur,

- corrélation entre le niveau d'activité du disq ue du premier serveur et celui du disque du second serveur.

Une série de mesures peut-être le résultat d'une mesure ou l'agrégation des résultats de plusieurs mesures réalisées simultanément. Par exemple, une série de mesures peut contenir la somme des débits de tous les disques présents sur une machine.

La méthode de recherche de corrélation proposée par la présente invention vise, pour un ensemble de séries de mesures collectées, à établir des relations de corrélation entre différents couples de séries de mesures notées (où kl et k2 sont des entiers compris entre 1 et M et où kl≠k2) issues des mesures collectées. Chaque couple de séries de mesures correspond à une combinaison particulière de deux séries de mesures. Dans l'exemple de la FIG.1 , si une série de mesures X_k est collectée pour chaque ressource R_t, i.e. chaque série de mesure X_k correspond au niveau d'utilisation d'une ressource R_t, alors il y aura dix paires possibles de séries de mesures notées de 1 à 1 0. Rappelons qu'un objectif de la présente invention est la détermination de relations de corrélations pour toutes les combinaisons possibles de deux séries de mesures.

Une première étape consiste à sélectionner deux séries de mesures X_kl et X_k2 à partir de l'ensemble des séries de mesures collectées.

Une deuxième étape consiste à rechercher une relation de corrélation affine sur au minimum n_v valeurs (n„ un entier ajustable) entres les deux séries de mesures X_kl et X_k2. Cette relation de corrélation affine est illustrée par l'équation (1 ) :

où a et b sont des nombres réels.

Des pourcentages P t de différence entre les valeurs

sont calculés, X_k2(t) se référant à la valeur de la mesure

d'indice t dans la série se référant à la valeur de la mesure

d'indice t dans la série X_kl. Ce calcul est illustré par l'équation (2), ces pourcentages étant définis comme suit :

Où t est un indice entier tel que l≤t≤n_v.

Si chaque valeur de P(t) obtenue est inférieure ou égale à une valeur T prédéfinie, par ex. fixée par un opérateur (typiquement l'administrateur réseau), alors la relation de corrélation affine ( 1 ) est validée et sauvegardée. T est appelé pourcentage de tolérance et est avantageusement fixé à 95%. Selon un mode préféré de réalisation, est avantageusement compris entre 3 et 60.

Dans ce cas, le procédé comprend une étape suivante de calcul des valeurs de saturations de la série de mesures X_kl

avec les formules (3) et (4) suivantes :

où sont respectivement les valeurs minimale et

maximale de la série de mesures X_k2. Si au moins une des valeurs appartient à l'intervalle

sont les valeurs minimale et maximale de la série X_kl, alors la

règle d'évolution trouvée est telle que la ressource associée à la série de mesures X_k2 va saturer avant la ressource associée à la série de mesures X_kl. Plus précisément, la ressource X_k2 commencera à saturer lorsque la ressource X_kl se rapprochera de la valeur de

Si aucune relation de corrélation n'a été trouvée, une étape supplémentaire consiste à traiter la combinaison de séries de mesures suivante, cette étape étant répétée jusqu'à ce que toutes les combinaisons possibles aient été analysées. U ne variante consiste à réaliser ce même processus pour une multitude de couples de sous- ensembles obtenus à partir d'un couple de série de mesures

Dans ce cas la série est obtenue par sélection d'un

nombre n_v prédéfini de valeurs dans la série X_kl. De la même manière, X'_k2 est obtenue à partir de X_k2.

La FIG.1 illustre u n exemple où la relation de corrélation est calculée directement sur les séries de mesures ce qui

correspond au cas particulier où n-, est égale au nombre de valeurs contenues dans chaque série Une variante du procédé

consiste à calculer des relations de corrélation sur des sous-ensembles

obtenus à partir d'un couple de séries de mesures

comme indiqué plus haut. Cette possibilité est offerte à l'utilisateur en lui proposant un paramétrage initial illustré dans le LISTI NG.1 . Cet exemple est fourni pour un exemple de couple de séries de mesures noté Les mêmes étapes sont appliquées sur toutes les

combinaisons possibles de séries de mesures issues des

données collectées.

Les paramètres réglables par l'utilisateur sont :

- ^{u n} intervalle de recherche de valeurs,

- la valeur minimale d'une variable p correspondant à une

période de sélection des sous-ensembles

- la valeur maximale de la période p,

- '^e P^as d'incrémentation de la période p,

-

le nombre de valeurs dans chaque sous-ensemble et

9

- T le pourcentage de tolérance pour la validation d'une relation de corrélation entre les séries

Dans le cas particulier où les valeurs de valent 1 ,

les intervalles de recherche recouvrent toutes les valeurs de X_kl et de est égale à la taille de la suite X_kl et à la taille de X_k2. La

valeur de p sera alors de 1 et les sous-ensembles seront les

mêmes que les séries initiales

La recherche est alors réalisée directement sur les séries de mesures

Pour construire un sous-ensemble X'_kl à partir de X_kl, l'opération consiste à sélectionner une valeur sur n_s dans X_kl et à l'intégrer dans le sous-ensemble X'_ki. Par exemple, si n_s vaut 2, une valeur sur 2 sera sélectionnée dans X_kl pour construire X'_kl.

Si par exemple alors les

valeurs de la variable n_s seront successivement 2, 4, 6 et 8. I l en résultera quatre couples de sous-ensembles pour lesquels

une relation de corrélation sera recherchée. Une relation de corrélation est trouvée pour les séries X_kl et X_k2 si des relations de corrélation sont trouvées pour tous les couples de sous-ensembles générés.

Si au cours du processus, une relation de corrélation n'est pas trouvée pour au moins un couple de sous-ensembles, alors il n'est pas généré de corrélation entre les séries de mesures. Dans ce cas, une nouvelle combinaison de séries de mesures est sélectionnée dans les

données collectées et le processus est relancé.

L'intérêt de travailler sur des couples de sous-ensembles

des couples de séries de mesures initiales et non directement

sur les séries de mesures initiales est de fournir un indicateur de la pertinence de la corrélation trouvée. En effet, pour un couple de séries de mesures et à condition que des corrélations soient trouvées

pour tous les sous-ensembles générés, plus le nombre de

sous-ensembles est important et plus la relation de corrélation entre les séries de mesures est forte. Selon un mode préféré de

réalisation, le nombre de couples de sous-ensembles utilisé est compris entre 1 et 100.

La variation de la période d 'échantillonnage p, entre

permet de prendre en compte uniquement les valeurs extrêmes (hautes ou basses, par exemple dans le cas d'une série de mesures représentant une courbe sinusoïdale).

A l'issue de cette étape, on obtient un couple de deux sous- ensembles contenant chacun n_v valeurs.

Une équation de corrélation de type affine est recherchée entre ces deux sous-ensembles. Elle peut être notée comme dans l'équation (1 ) :

Le calcul de la valeur de a est réalisé en calculant le rapport entre la moyenne des différences entre les valeurs successives de la

liste et la moyenne X'_kimoy <ies d ifférences entre les valeurs successives de la liste X'_kl. Le calcul de a est illustré par l'équation (5) :

Les calculs des valeurs moyennes sont illustrés

par les équations (6) et (7) :

Le calcul de la valeur de b est réalisé avec l'équation (8) :

où sont les valeurs respectives dans les séries X'_k2 et

à l'indice t.

La prochaine étape est le test de la fiabilité de la relation de corrélation ainsi générée. Pour cela, un exemple de réalisation consiste à générer une liste Z à partir des n_v valeurs de la liste dans laquelle

chaque valeur Z(t) est reliée à la valeur par la relation de

corrélation affine (1 ) : Chaque pourcentage de

différence P(t) entre les valeurs Z(t) et X'_k20) est calculé, comme l'illustre l'équation (9) :

L'étape consistant à générer une liste Z(t) est une étape intermédiaire qui n'est pas indispensable au calcul d u pourcentage P(t), lequel peut être calculé directement comme le montre l'équation (2). Cette étape génère une suite de pourcentages que l'on peut noter P et qui contient riy valeurs notées P(t). 11

Si au moins une valeur de P(t) est strictement supérieure au pourcentage de tolérance T, alors il n'y a pas de corrélation entre les séries de mesures et l'algorithme de recherche traite la

combinaison de séries de mesures suivante. En effet, si parmi une multitude de couples de sous-ensembles l'un d'entre eux ne

fournit pas d'équation de corrélation, alors on considère qu'il n'y a pas de corrélation entre les séries de mesures (à partir desquelles

les sous-ensembles ont été générés).

Si toutes les valeurs de P t) sont inférieures ou égales au pourcentage de tolérance T, alors l'équation de corrélation

est validée pour le couple de sous-ensembles Dans ce

cas, l'étape suivante est le calcul des valeurs de saturation

de la même manière que dans les équations (3) et (4) en

remplaçant X

et comme illustré dans le LISTING.1 .

Si une relation de corrélation est trouvée pour chaque couple de sous-ensembles alors il existe une corrélation entre les

séries de mesures initiales Les valeurs finales de a, b et les

valeurs de saturations sont obtenu par le calcul de la

moyenne des valeurs obtenues pour les sous-ensembles présentant une corrélation.

Ainsi, ce procédé permet de générer des relations de corrélations entre plusieurs séries de mesures, lesquelles pourront être utilisées pour définir un meilleur dimensionnement des infrastructures de production.

Claims

REVENDICATIONS

1 . Procédé d'évaluation de la performance d'une chaîne applicative au sein d'une infrastructure informatique, comprenant un nombre N de ressources R_t (avec i un entier compris entre 1 et N), comprenant les étapes de:

- collecte, sur un même intervalle de temps et avec une même période d'échantillonnage period_ech d'un nombre prédéfini M de séries de mesures X_k, où k est un entier compris entre 1 et M, relatives aux niveaux d'utilisation de ressources distinctes,

- pour toutes les combinaisons possibles de deux séries de mesures parmi les séries collectées :

o création de plusieurs couples de sous-ensembles eⁿ sélectionnant un nombre prédéfini n-, de

valeurs à partir des séries de mesures

respectivement,

o application d'un algorithme de recherche de relation(s) de corrélation affine sur chaque couple de sous- ensembles

cette corrélation affine étant modélisée par l'équation où a et b sont

des nombre réels,

o calcul, pour chaque couple

des pourcentages P(t) de différence entre les valeurs de

suivant la formule P(t) = à chaque indice t (compris entre 1

et n_v),

o calcul, pour chaque couple

et à condition que toutes les valeurs de P(t soient inférieures ou égales à une valeur prédéfinie T, des valeurs de saturation où

sont respectivement les valeurs

minimale et maximale de la série de mesures X'_k2-

2. Procédé selon la revendication 1 , caractérisé en ce que la valeur de n„ est comprise entre 3 et 60.

3. Procédé selon la revendication 1 ou 2, caractérisée en ce que chaque série de mesure est réalisée sur un intervalle de temps supérieur ou égal à 2 heures.

4. Procédé selon l'une quelconque des revendications précédentes, caractérisée en ce que chaque série de mesures est réalisée avec une période d'échantillonnage period_ech d'une minute.

5. Procédé selon l'une quelconque des revendications précédentes, caractérisée en ce que la valeur T est de 95% .

6. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que le nombre de couples de sous- ensembles est compris entre 1 et 1 00.

7. Procédé selon l'une quelconque des revendications précédentes, caractérisée en ce que la sélection des sous-ensembles comporte les opérations de :

- prise en compte des paramètres suivants : les valeurs minimale p_min et maximale p_max d'une période de recherche notée p, p étant une variable de la méthode, le pas d'incrémentation p_pas de la période p, une période d'échantillonnage periode_ech,

- création des n_v valeurs du sous ensemble X"_kl en sélectionnant n_v valeurs dans la série X_kl,

- création des n_v valeurs du sous ensemble X'_k2 en sélectionnant n_v valeurs dans la série X_k2.

8. Procédé, selon la revendication 7, caractérisée en ce que le paramètre p_min est fixé à une valeur comprise entre 1 et 10.

9. Procédé, selon la revendication 7 ou la revendication 8, caractérisée en ce que le paramètre p_max est fixé à une valeur comprise entre 1 et 1 00.

10. Procédé, selon l'une quelconque des revendications 7 à 9, caractérisée en ce que le paramètre p_pas est fixé à une valeur comprise entre 1 et 1 0.

1 1 . Procédé selon l'une quelconque des revendications précédentes, caractérisée en ce que l'algorithme de recherche d'une relation affine entre deux séries de mesures comprend les

opérations de : - calcul de a comme étant le rapport entre

soit est la moyenne des différences

entre les valeurs successives de la liste

soit

est la moyenne des

différences entre les valeurs successives de la liste soit

- calcul de b suivant la formule _et

sont les valeurs dans les séries à l'indice t.