WO2018130762A1 - Procédé d'analyse des règles d'évolutions entre les niveaux d'utilisation des ressources d'un système informatique - Google Patents

Procédé d'analyse des règles d'évolutions entre les niveaux d'utilisation des ressources d'un système informatique Download PDF

Info

Publication number
WO2018130762A1
WO2018130762A1 PCT/FR2018/000005 FR2018000005W WO2018130762A1 WO 2018130762 A1 WO2018130762 A1 WO 2018130762A1 FR 2018000005 W FR2018000005 W FR 2018000005W WO 2018130762 A1 WO2018130762 A1 WO 2018130762A1
Authority
WO
WIPO (PCT)
Prior art keywords
series
values
measurements
value
period
Prior art date
Application number
PCT/FR2018/000005
Other languages
English (en)
Inventor
Bruno DEMEILLIEZ
Florent Rochette
Gilles MENIGOT
Original Assignee
Bull Sas
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bull Sas filed Critical Bull Sas
Priority to US16/477,493 priority Critical patent/US20190384688A1/en
Priority to EP18702743.8A priority patent/EP3568766A1/fr
Publication of WO2018130762A1 publication Critical patent/WO2018130762A1/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3442Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for planning or managing the needed capacity

Definitions

  • the present invention relates to the field of monitoring a computer infrastructure, this expression designating all the hardware and software components of the computer system of a company or an organization.
  • the invention relates more particularly to the field of resource analysis (in particular processor, operating system, memory) of a computer infrastructure on which is hosted an application link chain, that is to say, for a process, a functional chain connecting several applications that work together to complete the process.
  • Sizing refers to the capabilities (computational, memorial) servers, coupled with the availability of resources (hardware and software).
  • a scaling up of a computer system can be accompanied by a progressive saturation of system resources within the same functional chain (or application link chain).
  • the saturation of a resource blocks the scalability of the system and therefore prevents the possibility of saturation of other resources in the chain.
  • the use of one resource may induce the use of another resource.
  • the level of use of the processors of the machine A depends on the progress of the recordings on machine B.
  • Each resource is characterized by a maximum utilization level for optimal operation (for example, eighty percent for a processor).
  • the present invention aims at providing a method for defining a correlation of the level of use of a resource A with respect to the utilization level of a resource B in order to determine when the resource B is saturated without the resource A it is, the dimensioning of the resource B necessary to reach the maximum level of the resource A.
  • the objective is to dimension coherently and optimally the resources of a computer system and to avoid the saturations of the resources and their consequences.
  • An objective of the present invention is to allow an automatic analysis of the resource consumption of a computer system and to deduce correlations between the levels of use of the resources.
  • a method for evaluating the performance of an application chain within a computing infrastructure comprising a number N of resources denoted R t (with i an integer between 1 and N), comprising the steps of:
  • n is between 3 and 60.
  • each measurement series is carried out over a time interval greater than or equal to 2 hours.
  • each series of measurements is carried out with a sampling period ech period of one minute.
  • the value T is 95%.
  • the number of pairs of subsets is between 1 and 100.
  • the step of selecting the subsets X ' k1 and X' k2 comprises the operations of:
  • the algorithm for finding an affine relation between two series of measurements includes the operations of:
  • X ' kl t are the values in the series with the ind ective.
  • the parameter p min is set to a value between 1 and 10.
  • the parameter p max is set to a value between 1 and 1 00.
  • FIG.1 is a schematic representation of five resources and possible combinations between the series of measurements made on these resources.
  • FIG. 2 is a functional diagram illustrating various steps of the method of searching for the rules of evolution between the different resources of a computer system.
  • the LISTI NG.1 is a pseudo code describing an embodiment of the method in the case of the search for a rule of evolution between two series of measurements.
  • a computer architecture (or system, or even infrastructure) conventionally comprises various resources, hardware and / or software, which, to accomplish processes, are interconnected to form one or more functional chains (or application link string (s), or application string (s)).
  • N N an integer
  • R i i an integer such that l ⁇ i ⁇ N
  • the principle is to look for evolution rules between several series of measurements made on the resources, typically the level of use, the load, the available memory, the memory or the disk space busy (e).
  • evolution rule is meant an affine correlation relationship between two sets of measures relating to resource utilization levels R t .
  • FIG.1 provides an example of five rated resources
  • One step of the method consists in performing and collecting a plurality of series of measurements denoted X k , each measure providing a level (or rate) of use of a resource R t .
  • These series are denoted X 1 to X 5 in the example of FIG.
  • the level of use of a resource is a physical quantity, the nature of which may vary according to the type of resource being examined. It can be a power consumed in the case of a processor (eg a central processor), a percentage of the maximum transfer rate in the case of a hard disk, or a percentage of the capacity total (or occupancy rate) in the case of a RAM.
  • FIG. 2 illustrates the main steps of the method.
  • a preliminary step consists in collecting a number M (M an integer not necessarily equal to N) predefined series of measurements made all sw the same time interval and with
  • the measurements are advantageously performed automatically by a program running on one or more server (s) integrated into the IT infrastructure.
  • the measurements are preferably made (and collected) over a time interval of at least 2 hours, with a sampling period of one minute.
  • the measurements are carried out over a period of four hours (typically between 08:00 and 12:00, with a sampling period of one minute (ie two successive measurements are spaced apart by one minute).
  • Measures allow eg. determine the level of activity of a Central Processing Unit (CPU) and disks of two servers.
  • CPU Central Processing Unit
  • the method proposed by the present invention makes it possible to determine affine type correlations between the activities of the processors and the disks of the two servers, according to all the possible combinations:
  • a series of measurements may be the result of a measurement or the aggregation of the results of several measurements made simultaneously.
  • a series of measurements may contain the sum of the bit rates of all the disks present on a machine.
  • the correlation search method proposed by the present invention aims, for a set of series of measurements collected, to establish correlation relations between different pairs of series of measurements noted (where k1 and k2 are integers between 1 and M and where kl ⁇ k2) from the collected measurements.
  • Each pair of series of measurements corresponds to a particular combination of two series of measurements.
  • a series of measurements X k is collected for each resource R t , ie each measurement series X k corresponds to the level of use of a resource R t , then there will be ten possible pairs of series of measurements noted from 1 to 1 0.
  • an objective of the present invention is the determination of correlation relations for all possible combinations of two series of measurements.
  • a first step consists of selecting two series of measurements X kl and X k2 from the set of measured series of measurements.
  • a second step is to look for an affine correlation relation on at least n v values (n "an adjustable integer) between the two series of measurements X kl and X k2 .
  • This affine correlation relation is illustrated by equation (1):
  • t is an integer index such that l ⁇ t ⁇ n v .
  • T is called percentage tolerance and is advantageously set at 95%. According to a preferred embodiment, is advantageously between 3 and 60.
  • the method comprises a next step of calculating the saturation values of the series of measurements X kl
  • the evolution rule found is such that the resource associated with the series of measurements X k2 will saturate before the resource associated with the series of measurements X kl . More precisely, the resource X k2 will begin to saturate when the resource X kl will approach the value of
  • a variant consists in carrying out this same process for a multitude of pairs of subassemblies obtained from a series of measurements
  • n v predefined values in the series X kl .
  • X ' k2 is obtained from X k2 .
  • FIG. 1 illustrates an example where the correlation relation is calculated directly on the series of measurements
  • n- is equal to the number of values contained in each series
  • the user-adjustable parameters are:
  • the search intervals cover all the values of X kl and of is equal to the size of the sequence X kl and the size of X k2 .
  • the operation consists in selecting a value on n s in X kl and integrating it into the subset X' ki . For example, if n s is 2, a value of 2 will be selected in X kl to build X ' kl .
  • a correlation relation is found for the X kl and X k2 series if correlation relations are found for all the generated subset pairs.
  • the number of pairs of subassemblies used is between 1 and 100.
  • the calculation of the value of a is done by calculating the ratio between the average of the differences between the successive values of the
  • an exemplary embodiment consists of generating a list Z from the n v values of the list in which
  • each value Z (t) is connected to the value by the relation of
  • the step of generating a list Z (t) is an intermediate step that is not essential for calculating the percentage P (t), which can be calculated directly as shown in equation (2). This step generates a sequence of percentages that can be noted P and which contains riy values noted P (t). 11
  • this method makes it possible to generate correlation relationships between several series of measurements, which can be used to define a better dimensioning of the production infrastructures.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Analysis (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

La présente invention concerne un procédé d'évaluation de la performance d'une chaîne applicative au sein d'une infrastructure informatique, comprenant un nombre N de ressources notées Ri (1 ≤ i ≤ N), comprenant les étapes de : collecte, sur un même intervalle de temps et avec une même période d'échantillonnage periodech d'un nombre prédéfini M de séries de mesures Xk (1 ≤ k ≤ M) relatives aux niveaux d'utilisation des ressources Ri ; pour toutes les combinaisons possibles de deux séries de mesures (Xk1,Xk2),avec k1≠ k2 : création de plusieurs couples de sous-ensembles (X'k1,X'k2) en sélectionnant un nombre prédéfini n de valeurs à partir des séries Xk1 et Xk2; application d'un algorithme de recherche de relation(s) de corrélation affine sur chaque couple de sous-ensembles; calcul des pourcentages P(i) de différence entre les valeurs de X'k2(t) et de aX'k1(t) + b pour chaque indice t (compris entre 1 et n); calcul des valeurs de saturation de la série X'k2.

Description

Procédé d'analyse des règles d'évolutions entre les niveaux d'utilisation des ressources d'un système informatique
La présente invention concerne le domaine de la surveillance d' une infrastructure informatique, cette expression désignant l'ensemble des éléments matériels et logiciels composant le système informatique d'une entreprise ou d'une organisation. L'invention concerne plus particulièrement le domaine de l'analyse des ressources (notamment processeur, système d'exploitation, mémoire) d'une infrastructure informatique sur laquelle est hébergée une chaîne de liaison applicative, c'est-à-dire, pour un processus, une chaîne fonctionnelle reliant plusieurs applications qui fonctionnent ensemble pour réaliser le processus.
De nombreuses infrastructures informatiques sont mal dimensionnées - et le plus souvent sous-dimensionnées. Un mauvais dimensionnement se traduit par des performances insuffisantes, voire des arrêts de la production. Bien dimensionner une infrastructure informatique est un enjeu majeur pour les entreprises dont la production dépend des performances de leurs systèmes informatiques. Le terme « dimensionnement » désigne les capacités (calculatoires, mémorielles) des serveurs, couplées à la disponibilité des ressources (matérielles et logicielles).
Une montée en charge d'un système informatique peut s'accompagner d'une saturation progressive des ressources du système au sein d'une même chaîne fonctionnelle (ou chaîne de liaison applicative). La saturation d'une ressource bloque la montée en charge du système et empêche par conséquent d'observer la saturation éventuelle des autres ressources de la chaîne.
L'utilisation d'une ressource peut induire l'utilisation d'une autre ressource. A titre d'exemple, dans le cas d'une application ordonnant qu'un calcul soit effectué sur une machine A et que son résultat soit enregistré sur une machine B, le n iveau d'utilisation des processeurs de la machine A dépend de l'avancement des enregistrements sur la machine B.
Chaque ressource est caractérisée par un niveau d'utilisation maximal pour un fonctionnement optimal (par exemple quatre-vingt pourcent pour un processeur). La présente invention vise à proposer une méthode pour définir une corrélation du niveau d'utilisation d'u ne ressource A par rapport au niveau d'utilisation d'une ressource B afin de déterminer, lorsque la ressource B est saturée sans que la ressource A le soit, le dimensionnement de la ressource B nécessaire pour atteindre le niveau maximal de la ressource A.
L'objectif est de dimensionner de manière cohérente et optimale les ressources d'un système informatique et éviter les saturations des ressources et leurs conséquences.
La recherche de corrélations dans les évolutions des niveaux d'utilisation des ressources d'une chaîne applicative vise à prédire :
- l'évolution des consommations et les saturations des ressources lors de l'augmentation de la charge,
- le dimensionnement des ressources d'une chaîne applicative comprenant plusieurs serveurs.
I l existe des solutions pour surveiller des serveurs à l'unité, mais elles ne permettent pas de déterminer les niveaux d'utilisation future des ressources, ni d'établir une corrélation entre les différents niveaux d'utilisation des ressources de différents serveurs au sein d'une même chaîne applicative.
Un objectif de la présente invention est de permettre une analyse automatique des consommations des ressources d'un système informatique et d'en déduire des corrélations entre les niveaux d'utilisation des ressources.
A cet effet, il est proposé un procédé d'évaluation de la performance d'une chaîne applicative au sein d'une infrastructure informatique, comprenant un nombre N de ressources notées Rt (avec i un entier compris entre 1 et N), comprenant les étapes de:
- collecte, sur un même intervalle de temps et avec une même période d'échantillonnage periodech d'un nombre prédéfini M de séries de mesures Xk (avec k un entier compris entre 1 et M) relatives aux niveaux d 'utilisation de ressources distinctes,
- pour toutes les combinaisons possibles de deux séries de mesures
Figure imgf000004_0001
parmi les séries collectées : création de plusieurs couples de sous-ensembles en sélectionnant un nombre prédéfini n„de
Figure imgf000005_0008
valeurs à partir des séries de mesures Xkl et Xk2 respectivement,
application d'un algorithme de recherche de relation(s) de corrélation affine sur chaque couple de sous- ensembles la corrélation affine étant
Figure imgf000005_0007
modélisé par l'équation où a et b sont
Figure imgf000005_0009
des nombres réels,
calcul, pour chaque couple
Figure imgf000005_0005
des pourcentages P(t de différence entre les valeurs de
Figure imgf000005_0010
et de
Figure imgf000005_0006
suivant la formule P(t) = à chaque indice t (compris entre 1
Figure imgf000005_0001
et n„),
calcul , pour chaque couple et à condition
Figure imgf000005_0004
que toutes les valeurs de P(t) soient inférieures ou égales à une valeur prédéfinie T, des valeurs de saturation ou
Figure imgf000005_0002
sont respectivement les valeurs
Figure imgf000005_0003
minimale et maximale de la série de mesures X'k2- Selon diverses caractéristiques prises seules ou en combinaison :
- la valeur de n„ est comprise entre 3 et 60.
- chaque série de mesure est réalisée sur un intervalle de temps supérieur ou égal à 2 heures.
- chaque série de mesures est réalisée avec une période d'échantillonnage periodech d'une minute.
- la valeur T est de 95% .
- le nombre de couples de sous-ensembles est compris entre 1 et 100.
L'étape de sélection des sous-ensembles X'kl et X'k2 comporte les opérations de :
- prise en compte des paramètres suivants : les valeurs minimale pmin et maximale pmax d'une période de recherche notée p, p étant une variable de la méthode, le pas d'incrémentation de la période p, une période d'échantillonnage periodeech,
- création des nv valeurs du sous ensemble X'kl en sélectionnant valeurs dans la série Xkl,
- création des nw valeurs du sous ensemble X'k2 en sélectionnant riy valeurs dans la série Xk2.
L'algorithme de recherche d'une relation affine entre deux séries de mesures comprend les opérations de :
Figure imgf000006_0010
- calcul de a comme étant le rapport entre
Figure imgf000006_0005
soit est la moyenne des différences
Figure imgf000006_0001
entre les valeurs successives de la liste soit
Figure imgf000006_0006
Figure imgf000006_0007
est la moyenne des
Figure imgf000006_0002
différences entre les valeurs successives de la liste soit
Figure imgf000006_0008
Figure imgf000006_0003
- calcul de b suivant la formule
Figure imgf000006_0004
X'kl t) sont les valeurs dans les séries à l'ind ice t.
Figure imgf000006_0009
Selon diverses caractéristiques prises seules ou en combinaison :
- le paramètre pmin est fixé à une valeur comprise entre 1 et 10.
- le paramètre pmax est fixé à une valeur comprise entre 1 et 1 00.
- Le paramètre ppas est fixé à une valeur comprise entre 1 et 10. L'invention sera mieux comprise et d'autres détails, caractéristiques et avantages de l'invention apparaîtront à la lecture de la description suivante faite à titre d'exemple non limitatif en référence aux dessins, dans lesquels :
- La FIG.1 est une représentation schématique de cinq ressources et des combinaisons possibles entre les séries de mesures effectuées sur ces ressources.
- La FIG.2 est un diagramme fonctionnel illustrant différentes étapes du procédé de recherche des règles d'évolutions entre les différentes ressources d'un système informatique.
- Le LISTI NG.1 est un pseudo code décrivant un exemple de réalisation du procédé dans le cas de la recherche d'une règle d'évolution entre deux séries de mesures. Une architecture (ou un système, ou encore une infrastructure) informatique comprend classiquement diverses ressources, matérielles et/ou logicielles, qui , pour accomplir des processus, sont reliées entre elles pour former une ou plusieurs chaîne(s) fonctionnelle(s) (ou chaîne(s) de liaison applicative, ou encore chaîne(s) applicative(s)).
Pour optimiser le fonctionnement d'une telle chaîne applicative, il est décrété nécessaire d'évaluer sa performance et notamment l'utilisation des ressources qui la constituent. On note N (N un entier) le nombre de ressources, notées Ri (i un entier tel que l≤i≤N), de la chaîne applicative.
Pour évaluer la performance de la chaîne applicative, le principe est de rechercher des règles d'évolution entre plusieurs séries de mesures effectuées sur les ressources, typiquement le niveau d'utilisation, la charge, la mémoire disponible, la mémoire ou l'espace disque occupé(e). Par « règle d'évolution » , on entend une relation de corrélation de type affine entre deux séries de mesures se rapportant à des niveaux d'utilisation de ressources Rt. La FIG.1 fournit un exemple de cinq ressources notées
Figure imgf000007_0001
Figure imgf000007_0003
Une étape du procédé consiste à effectuer et collecter une pluralité de séries de mesures notée Xk, chaque mesure fournissant un niveau (ou taux) d'utilisation d'une ressource Rt. Ces séries sont notées X1 à X5 dans l'exemple de la FIG.1 . Le niveau d'utilisation d'une ressource est une grandeur physique dont la nature peut varier selon le type de ressource examiné. I l peut s'agir d'une puissance consommée dans le cas d'un processeur (par ex. un processeur central), un pourcentage du taux de transfert maximum dans le cas d'un disque dur, ou encore un pourcentage de la capacité totale (ou taux d'occupation) dans le cas d'une mémoire vive.
La FIG.2 illustre les principales étapes du procédé.
Une étape préliminaire consiste à collecter un nombre M (M un entier non nécessairement égal à N) prédéfini de séries de mesures réalisées toutes sw un même intervalle de temps et avec
Figure imgf000007_0002
une même période d'échantillonnage notée periodech.
Les mesures sont avantageusement réalisées de manière automatique par un programme exécuté sur un ou plusieurs serveur(s) intégré à l'infrastructure informatique. Les mesures sont de préférence réalisées (et collectées) sur un intervalle de temps d'au moins 2 heures, avec une période d'échantillonnage d'une minute. A titre d'exemple, les mesures sont réalisées sur une période de quatre heures (typiquement comprise entre 08h00 et 12h00, avec une période d'échantillonnage d'une minute (i.e. deux mesures successives sont espacées d'une minute).
Les mesures permettent par ex. de déterminer le niveau d'activité d'un processeur central (Central Processing Unit ou CPU) et des disques de deux serveurs. Dans cet exemple, la méthode proposée par la présente invention permet de déterminer des corrélations de type affine entre les activités des processeurs et des disques des deux serveurs, suivant toutes les combinaisons possibles :
- corrélation entre le niveau d'activité du CPU du premier serveur et celui de son propre disque,
- corrélation entre le niveau d 'activité d u CPU du premier serveur et celui du disque du second serveur,
- corrélation entre le niveau d'activité du CPU du second serveur et celui de son propre disque,
- corrélation entre le niveau d'activité du CPU du second serveur et celui du disque du premier serveur,
- corrélation entre le niveau d'activité du CPU du premier serveur et celui du CPU du second serveur,
- corrélation entre le niveau d'activité du disq ue du premier serveur et celui du disque du second serveur.
Une série de mesures peut-être le résultat d'une mesure ou l'agrégation des résultats de plusieurs mesures réalisées simultanément. Par exemple, une série de mesures peut contenir la somme des débits de tous les disques présents sur une machine.
La méthode de recherche de corrélation proposée par la présente invention vise, pour un ensemble de séries de mesures collectées, à établir des relations de corrélation entre différents couples de séries de mesures notées (où kl et k2 sont des entiers compris entre 1 et M et où kl≠k2) issues des mesures collectées. Chaque couple de séries de mesures correspond à une combinaison particulière de deux séries de mesures. Dans l'exemple de la FIG.1 , si une série de mesures Xk est collectée pour chaque ressource Rt, i.e. chaque série de mesure Xk correspond au niveau d'utilisation d'une ressource Rt, alors il y aura dix paires possibles de séries de mesures notées de 1 à 1 0. Rappelons qu'un objectif de la présente invention est la détermination de relations de corrélations pour toutes les combinaisons possibles de deux séries de mesures.
Une première étape consiste à sélectionner deux séries de mesures Xkl et Xk2 à partir de l'ensemble des séries de mesures collectées.
Une deuxième étape consiste à rechercher une relation de corrélation affine sur au minimum nv valeurs (n„ un entier ajustable) entres les deux séries de mesures Xkl et Xk2. Cette relation de corrélation affine est illustrée par l'équation (1 ) :
Figure imgf000009_0001
où a et b sont des nombres réels.
Des pourcentages P t de différence entre les valeurs
Figure imgf000009_0010
sont calculés, Xk2(t) se référant à la valeur de la mesure
Figure imgf000009_0009
d'indice t dans la série se référant à la valeur de la mesure
Figure imgf000009_0008
d'indice t dans la série Xkl. Ce calcul est illustré par l'équation (2), ces pourcentages étant définis comme suit :
Figure imgf000009_0002
Où t est un indice entier tel que l≤t≤nv.
Si chaque valeur de P(t) obtenue est inférieure ou égale à une valeur T prédéfinie, par ex. fixée par un opérateur (typiquement l'administrateur réseau), alors la relation de corrélation affine ( 1 ) est validée et sauvegardée. T est appelé pourcentage de tolérance et est avantageusement fixé à 95%. Selon un mode préféré de réalisation, est avantageusement compris entre 3 et 60.
Dans ce cas, le procédé comprend une étape suivante de calcul des valeurs de saturations de la série de mesures Xkl
Figure imgf000009_0007
avec les formules (3) et (4) suivantes :
Figure imgf000009_0003
où sont respectivement les valeurs minimale et
Figure imgf000009_0004
maximale de la série de mesures Xk2. Si au moins une des valeurs appartient à l'intervalle
Figure imgf000009_0005
Figure imgf000009_0006
sont les valeurs minimale et maximale de la série Xkl, alors la
Figure imgf000010_0005
règle d'évolution trouvée est telle que la ressource associée à la série de mesures Xk2 va saturer avant la ressource associée à la série de mesures Xkl. Plus précisément, la ressource Xk2 commencera à saturer lorsque la ressource Xkl se rapprochera de la valeur de
Figure imgf000010_0004
Si aucune relation de corrélation n'a été trouvée, une étape supplémentaire consiste à traiter la combinaison de séries de mesures suivante, cette étape étant répétée jusqu'à ce que toutes les combinaisons possibles aient été analysées. U ne variante consiste à réaliser ce même processus pour une multitude de couples de sous- ensembles obtenus à partir d'un couple de série de mesures
Figure imgf000010_0002
Dans ce cas la série est obtenue par sélection d'un
Figure imgf000010_0001
Figure imgf000010_0003
nombre nv prédéfini de valeurs dans la série Xkl. De la même manière, X'k2 est obtenue à partir de Xk2.
La FIG.1 illustre u n exemple où la relation de corrélation est calculée directement sur les séries de mesures ce qui
Figure imgf000010_0009
correspond au cas particulier où n-, est égale au nombre de valeurs contenues dans chaque série Une variante du procédé
Figure imgf000010_0010
consiste à calculer des relations de corrélation sur des sous-ensembles
Figure imgf000010_0006
obtenus à partir d'un couple de séries de mesures
Figure imgf000010_0008
comme indiqué plus haut. Cette possibilité est offerte à l'utilisateur en lui proposant un paramétrage initial illustré dans le LISTI NG.1 . Cet exemple est fourni pour un exemple de couple de séries de mesures noté Les mêmes étapes sont appliquées sur toutes les
Figure imgf000010_0007
combinaisons possibles de séries de mesures issues des
Figure imgf000010_0011
données collectées.
Les paramètres réglables par l'utilisateur sont :
- u n intervalle de recherche de valeurs,
Figure imgf000010_0013
- u n intervalle de recherche de valeurs,
Figure imgf000010_0014
- la valeur minimale d'une variable p correspondant à une
Figure imgf000010_0015
période de sélection des sous-ensembles
Figure imgf000010_0012
- la valeur maximale de la période p,
Figure imgf000010_0016
- 'e Pas d'incrémentation de la période p,
Figure imgf000010_0017
-
Figure imgf000010_0018
le nombre de valeurs dans chaque sous-ensemble et
Figure imgf000010_0020
Figure imgf000010_0019
9
- T le pourcentage de tolérance pour la validation d'une relation de corrélation entre les séries
Figure imgf000011_0001
Dans le cas particulier où les valeurs de valent 1 ,
Figure imgf000011_0013
les intervalles de recherche recouvrent toutes les valeurs de Xkl et de est égale à la taille de la suite Xkl et à la taille de Xk2. La
Figure imgf000011_0002
valeur de p sera alors de 1 et les sous-ensembles seront les
Figure imgf000011_0016
mêmes que les séries initiales
Figure imgf000011_0003
La recherche est alors réalisée directement sur les séries de mesures
Figure imgf000011_0004
Pour construire un sous-ensemble X'kl à partir de Xkl, l'opération consiste à sélectionner une valeur sur ns dans Xkl et à l'intégrer dans le sous-ensemble X'ki. Par exemple, si ns vaut 2, une valeur sur 2 sera sélectionnée dans Xkl pour construire X'kl.
Si par exemple alors les
Figure imgf000011_0014
valeurs de la variable ns seront successivement 2, 4, 6 et 8. I l en résultera quatre couples de sous-ensembles pour lesquels
Figure imgf000011_0011
une relation de corrélation sera recherchée. Une relation de corrélation est trouvée pour les séries Xkl et Xk2 si des relations de corrélation sont trouvées pour tous les couples de sous-ensembles générés.
Figure imgf000011_0012
Si au cours du processus, une relation de corrélation n'est pas trouvée pour au moins un couple de sous-ensembles, alors il n'est pas généré de corrélation entre les séries de mesures. Dans ce cas, une nouvelle combinaison de séries de mesures est sélectionnée dans les
Figure imgf000011_0005
données collectées et le processus est relancé.
L'intérêt de travailler sur des couples de sous-ensembles
Figure imgf000011_0006
des couples de séries de mesures initiales et non directement
Figure imgf000011_0007
sur les séries de mesures initiales est de fournir un indicateur de la pertinence de la corrélation trouvée. En effet, pour un couple de séries de mesures et à condition que des corrélations soient trouvées
Figure imgf000011_0008
pour tous les sous-ensembles générés, plus le nombre de
Figure imgf000011_0009
sous-ensembles est important et plus la relation de corrélation entre les séries de mesures est forte. Selon un mode préféré de
Figure imgf000011_0015
réalisation, le nombre de couples de sous-ensembles utilisé est compris entre 1 et 100.
La variation de la période d 'échantillonnage p, entre
Figure imgf000011_0010
permet de prendre en compte uniquement les valeurs extrêmes (hautes ou basses, par exemple dans le cas d'une série de mesures représentant une courbe sinusoïdale).
A l'issue de cette étape, on obtient un couple de deux sous- ensembles contenant chacun nv valeurs.
Figure imgf000012_0006
Une équation de corrélation de type affine est recherchée entre ces deux sous-ensembles. Elle peut être notée comme dans l'équation (1 ) :
Figure imgf000012_0005
Le calcul de la valeur de a est réalisé en calculant le rapport entre la moyenne des différences entre les valeurs successives de la
Figure imgf000012_0007
liste et la moyenne X'kimoy <ies d ifférences entre les valeurs successives de la liste X'kl. Le calcul de a est illustré par l'équation (5) :
Figure imgf000012_0001
Les calculs des valeurs moyennes sont illustrés
Figure imgf000012_0012
par les équations (6) et (7) :
Figure imgf000012_0002
Le calcul de la valeur de b est réalisé avec l'équation (8) :
Figure imgf000012_0003
où sont les valeurs respectives dans les séries X'k2 et
Figure imgf000012_0011
à l'indice t.
La prochaine étape est le test de la fiabilité de la relation de corrélation ainsi générée. Pour cela, un exemple de réalisation consiste à générer une liste Z à partir des nv valeurs de la liste dans laquelle
Figure imgf000012_0010
chaque valeur Z(t) est reliée à la valeur par la relation de
Figure imgf000012_0009
corrélation affine (1 ) : Chaque pourcentage de
Figure imgf000012_0008
différence P(t) entre les valeurs Z(t) et X'k20) est calculé, comme l'illustre l'équation (9) :
Figure imgf000012_0004
L'étape consistant à générer une liste Z(t) est une étape intermédiaire qui n'est pas indispensable au calcul d u pourcentage P(t), lequel peut être calculé directement comme le montre l'équation (2). Cette étape génère une suite de pourcentages que l'on peut noter P et qui contient riy valeurs notées P(t). 11
Si au moins une valeur de P(t) est strictement supérieure au pourcentage de tolérance T, alors il n'y a pas de corrélation entre les séries de mesures et l'algorithme de recherche traite la
Figure imgf000013_0008
combinaison de séries de mesures suivante. En effet, si parmi une multitude de couples de sous-ensembles l'un d'entre eux ne
Figure imgf000013_0006
fournit pas d'équation de corrélation, alors on considère qu'il n'y a pas de corrélation entre les séries de mesures (à partir desquelles
Figure imgf000013_0007
les sous-ensembles ont été générés).
Si toutes les valeurs de P t) sont inférieures ou égales au pourcentage de tolérance T, alors l'équation de corrélation
Figure imgf000013_0003
est validée pour le couple de sous-ensembles Dans ce
Figure imgf000013_0002
cas, l'étape suivante est le calcul des valeurs de saturation
Figure imgf000013_0005
de la même manière que dans les équations (3) et (4) en
Figure imgf000013_0004
remplaçant X
Figure imgf000013_0001
et comme illustré dans le LISTING.1 .
Si une relation de corrélation est trouvée pour chaque couple de sous-ensembles alors il existe une corrélation entre les
Figure imgf000013_0009
séries de mesures initiales Les valeurs finales de a, b et les
Figure imgf000013_0010
valeurs de saturations sont obtenu par le calcul de la
Figure imgf000013_0011
moyenne des valeurs obtenues pour les sous-ensembles présentant une corrélation.
Ainsi, ce procédé permet de générer des relations de corrélations entre plusieurs séries de mesures, lesquelles pourront être utilisées pour définir un meilleur dimensionnement des infrastructures de production.

Claims

REVENDICATIONS
1 . Procédé d'évaluation de la performance d'une chaîne applicative au sein d'une infrastructure informatique, comprenant un nombre N de ressources Rt (avec i un entier compris entre 1 et N), comprenant les étapes de:
- collecte, sur un même intervalle de temps et avec une même période d'échantillonnage periodech d'un nombre prédéfini M de séries de mesures Xk, où k est un entier compris entre 1 et M, relatives aux niveaux d'utilisation de ressources distinctes,
- pour toutes les combinaisons possibles de deux séries de mesures parmi les séries collectées :
Figure imgf000014_0001
o création de plusieurs couples de sous-ensembles e n sélectionnant un nombre prédéfini n-, de
Figure imgf000014_0010
valeurs à partir des séries de mesures
Figure imgf000014_0011
respectivement,
o application d'un algorithme de recherche de relation(s) de corrélation affine sur chaque couple de sous- ensembles
Figure imgf000014_0009
cette corrélation affine étant modélisée par l'équation où a et b sont
Figure imgf000014_0008
des nombre réels,
o calcul, pour chaque couple
Figure imgf000014_0007
des pourcentages P(t) de différence entre les valeurs de
Figure imgf000014_0002
suivant la formule P(t) = à chaque indice t (compris entre 1
Figure imgf000014_0003
et nv),
o calcul, pour chaque couple
Figure imgf000014_0006
et à condition que toutes les valeurs de P(t soient inférieures ou égales à une valeur prédéfinie T, des valeurs de saturation où
Figure imgf000014_0004
sont respectivement les valeurs
Figure imgf000014_0005
minimale et maximale de la série de mesures X'k2-
2. Procédé selon la revendication 1 , caractérisé en ce que la valeur de n„ est comprise entre 3 et 60.
3. Procédé selon la revendication 1 ou 2, caractérisée en ce que chaque série de mesure est réalisée sur un intervalle de temps supérieur ou égal à 2 heures.
4. Procédé selon l'une quelconque des revendications précédentes, caractérisée en ce que chaque série de mesures est réalisée avec une période d'échantillonnage periodech d'une minute.
5. Procédé selon l'une quelconque des revendications précédentes, caractérisée en ce que la valeur T est de 95% .
6. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que le nombre de couples de sous- ensembles est compris entre 1 et 1 00.
7. Procédé selon l'une quelconque des revendications précédentes, caractérisée en ce que la sélection des sous-ensembles comporte les opérations de :
Figure imgf000015_0001
- prise en compte des paramètres suivants : les valeurs minimale pmin et maximale pmax d'une période de recherche notée p, p étant une variable de la méthode, le pas d'incrémentation ppas de la période p, une période d'échantillonnage periodeech,
- création des nv valeurs du sous ensemble X"kl en sélectionnant nv valeurs dans la série Xkl,
- création des nv valeurs du sous ensemble X'k2 en sélectionnant nv valeurs dans la série Xk2.
8. Procédé, selon la revendication 7, caractérisée en ce que le paramètre pmin est fixé à une valeur comprise entre 1 et 10.
9. Procédé, selon la revendication 7 ou la revendication 8, caractérisée en ce que le paramètre pmax est fixé à une valeur comprise entre 1 et 1 00.
10. Procédé, selon l'une quelconque des revendications 7 à 9, caractérisée en ce que le paramètre ppas est fixé à une valeur comprise entre 1 et 1 0.
1 1 . Procédé selon l'une quelconque des revendications précédentes, caractérisée en ce que l'algorithme de recherche d'une relation affine entre deux séries de mesures comprend les
Figure imgf000015_0002
opérations de : - calcul de a comme étant le rapport entre
Figure imgf000016_0002
soit est la moyenne des différences
Figure imgf000016_0001
entre les valeurs successives de la liste
Figure imgf000016_0007
soit
Figure imgf000016_0009
est la moyenne des
Figure imgf000016_0003
différences entre les valeurs successives de la liste soit
Figure imgf000016_0008
Figure imgf000016_0004
- calcul de b suivant la formule et
Figure imgf000016_0005
sont les valeurs dans les séries à l'indice t.
Figure imgf000016_0010
Figure imgf000016_0006
PCT/FR2018/000005 2017-01-12 2018-01-11 Procédé d'analyse des règles d'évolutions entre les niveaux d'utilisation des ressources d'un système informatique WO2018130762A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US16/477,493 US20190384688A1 (en) 2017-01-12 2018-01-11 Method for Analysing the Rules of Changes Between the Levels of Use of Resources of a Computer System
EP18702743.8A EP3568766A1 (fr) 2017-01-12 2018-01-11 Procédé d'analyse des règles d'évolutions entre les niveaux d'utilisation des ressources d'un système informatique

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1750281 2017-01-12
FR1750281A FR3061785B1 (fr) 2017-01-12 2017-01-12 Procede d'analyse des regles d'evolutions entre les niveaux d'utilisation des ressources d'un systeme informatique

Publications (1)

Publication Number Publication Date
WO2018130762A1 true WO2018130762A1 (fr) 2018-07-19

Family

ID=58992964

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2018/000005 WO2018130762A1 (fr) 2017-01-12 2018-01-11 Procédé d'analyse des règles d'évolutions entre les niveaux d'utilisation des ressources d'un système informatique

Country Status (4)

Country Link
US (1) US20190384688A1 (fr)
EP (1) EP3568766A1 (fr)
FR (1) FR3061785B1 (fr)
WO (1) WO2018130762A1 (fr)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090240476A1 (en) * 2008-03-24 2009-09-24 Madhukar Kshirsagar Method and device for forecasting computational needs of an application
US20110072130A1 (en) * 2009-09-18 2011-03-24 Nec Laboratories America, Inc. Extracting Overlay Invariants Network for Capacity Planning and Resource Optimization
US20140365637A1 (en) * 2013-06-11 2014-12-11 Vmware, Inc. Methods and systems for reducing metrics used to monitor resources
WO2015141218A1 (fr) * 2014-03-18 2015-09-24 日本電気株式会社 Dispositif de traitement d'informations, procédé d'analyse et support d'enregistrement de programme

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5987477A (en) * 1997-07-11 1999-11-16 International Business Machines Corporation Parallel file system and method for parallel write sharing
CN103455486B (zh) * 2012-05-28 2016-09-28 国际商业机器公司 安置数据库的方法和系统
US10798018B2 (en) * 2014-08-29 2020-10-06 Nec Corporation Method for operating a virtual network infrastructure
US20160224379A1 (en) * 2015-01-29 2016-08-04 The Intellisis Corporation Mapping Processes to Processors in a Network on a Chip Computing System

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090240476A1 (en) * 2008-03-24 2009-09-24 Madhukar Kshirsagar Method and device for forecasting computational needs of an application
US20110072130A1 (en) * 2009-09-18 2011-03-24 Nec Laboratories America, Inc. Extracting Overlay Invariants Network for Capacity Planning and Resource Optimization
US20140365637A1 (en) * 2013-06-11 2014-12-11 Vmware, Inc. Methods and systems for reducing metrics used to monitor resources
WO2015141218A1 (fr) * 2014-03-18 2015-09-24 日本電気株式会社 Dispositif de traitement d'informations, procédé d'analyse et support d'enregistrement de programme
US20170091630A1 (en) * 2014-03-18 2017-03-30 Nec Corporation Information processing device, analysis method, and program recording medium

Also Published As

Publication number Publication date
FR3061785B1 (fr) 2021-01-29
US20190384688A1 (en) 2019-12-19
EP3568766A1 (fr) 2019-11-20
FR3061785A1 (fr) 2018-07-13

Similar Documents

Publication Publication Date Title
Rabosky et al. Explosive evolutionary radiations: decreasing speciation or increasing extinction through time?
US8593946B2 (en) Congestion control using application slowdown
EP3058487A1 (fr) Traitement de requêtes de recherche au moyen d&#39;une structure de données
EP2805234B1 (fr) Procédé d&#39;optimisation de traitement parallèle de données sur une plateforme matérielle.
EP3489831A1 (fr) Procédé et dispositif de surveillance d&#39;un processus générateur de données d&#39;une métrique pour la prédiction d&#39;anomalies
EP3120243A1 (fr) Procede et dispositif d&#39;aide a l&#39;optimisation et la parallelisation de code
FR2880440A1 (fr) Flux de donnees statistiques.
US8903999B2 (en) Method and system for calculating and charting website performance
FR3095546A1 (fr) Dispositif et procédé d’analyse de l’état d’un système en contexte bruité
Podolskiy et al. The weakest link: Revealing and modeling the architectural patterns of microservice applications
WO2004053726A2 (fr) Appareil et procedes de classification de sites web
EP3568766A1 (fr) Procédé d&#39;analyse des règles d&#39;évolutions entre les niveaux d&#39;utilisation des ressources d&#39;un système informatique
CN112433908A (zh) 确定检测服务器的间隔时间的方法、系统、设备及介质
FR2920870A1 (fr) Dispositif de validation de mesures d&#39;une grandeur cinematique.
EP3380942B1 (fr) Procédé et système d&#39;aide à la maintenance et à l&#39;optimisation d&#39;un supercalculateur
EP3568764A1 (fr) Procédé d&#39;évaluation de la de la performance d&#39;une chaîne applicative au sein d&#39;une infrastucture informatique
WO2016200413A1 (fr) Système de recommandation et analyse de session d&#39;application
KR20040054711A (ko) 컴퓨팅 시스템에 엔진 측정 메트릭을 할당하는 시스템 및방법
EP2953029B1 (fr) Methodes et systemes de test de performances a debit configurable
FR3025678A1 (fr) Methodes et systemes de surveillance de serveurs informatiques
EP4187388A1 (fr) Procede et dispositif de detection de comportement aberrant dans un ensemble d&#39;executions d&#39;applications logicielles
EP2680158A2 (fr) Procédé de détermination d&#39;une valeur manquante parmi des données collectées pour une pluralite d&#39;individus à une pluralité d&#39;instants
WO2014053606A2 (fr) Procédé de traitement de données définissant un élément dans un espace e de dimensions d, programme d&#39;ordinateur associé
EP3265915A1 (fr) Dispositif de simulation
Baptist et al. Integration of the Open Data Cube on Common Cloud Frameworks

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18702743

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2018702743

Country of ref document: EP

Effective date: 20190812