FR3067480B1 - Procede et systeme de prediction de l'impact d'un dysfonctionnement ressource sur le niveau de service d'une chaine applicative - Google Patents

Procede et systeme de prediction de l'impact d'un dysfonctionnement ressource sur le niveau de service d'une chaine applicative Download PDF

Info

Publication number
FR3067480B1
FR3067480B1 FR1755146A FR1755146A FR3067480B1 FR 3067480 B1 FR3067480 B1 FR 3067480B1 FR 1755146 A FR1755146 A FR 1755146A FR 1755146 A FR1755146 A FR 1755146A FR 3067480 B1 FR3067480 B1 FR 3067480B1
Authority
FR
France
Prior art keywords
malfunction
resource
impact
resources
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
FR1755146A
Other languages
English (en)
Other versions
FR3067480A1 (fr
Inventor
Bruno DEMEILLIEZ
Gilles Menigot
Valerie Favier
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bull SA
Original Assignee
Bull SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bull SA filed Critical Bull SA
Priority to FR1755146A priority Critical patent/FR3067480B1/fr
Publication of FR3067480A1 publication Critical patent/FR3067480A1/fr
Application granted granted Critical
Publication of FR3067480B1 publication Critical patent/FR3067480B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

L'invention porte sur un procédé de prédiction de l'impact d'un dysfonctionnement affectant une ressource, sur un niveau de service d'au moins une chaine applicative, ledit procédé étant caractérisé en ce que lesdites ressources sont associées à un niveau prédéterminé d'utilisation courante et à un seuil prédéterminé d'utilisation maximum, en ce qu'il comporte l'utilisation d'au moins une sonde configurée pour collecter des données, et en ce qu'il comporte les étapes suivantes : - Collecter les données de ladite sonde, lesdites données collectées comportant des données relatives à l'état de fonctionnement des ressources ; Détecter un dysfonctionnement sur au moins une ressource, à partir des données de sonde collectées ; En présence d'un dysfonctionnement, quantifier l'impact présumé dudit dysfonctionnement sur le niveau de service d'au moins une chaine applicative, comportant les sous étapes suivantes : ○ Calculer un nouveau seuil d'utilisation maximum en fonction du seuil prédéterminé d'utilisation maximum et des données relatives à l'état de fonctionnement des ressources, ○ Comparer le nouveau seuil d'utilisation maximum de la ressource au niveau prédéterminé d'utilisation courante de ladite ressource, pour déterminer si le nouveau seuil d'utilisation maximum est dépassé par le niveau prédéterminé d'utilisation courante, et ○ Si le nouveau seuil d'utilisation maximum est dépassé alors, calculer une valeur de sévérité présumée d'impact du dysfonctionnement sur le niveau de service d'au moins une chaine applicative ; et - Générer un signal d'alerte applicative comportant la valeur de sévérité présumée d'impact du dysfonctionnement sur le niveau de service d'au moins une chaine applicative.

Description

PROCEDE ET SYSTEME DE PREDICTION DE L’IMPACT D’UN DYSFONCTIONNEMENTRESSOURCE SUR LE NIVEAU DE SERVICE D’UNE CHAINE APPLICATIVE
[0001] L’invention concerne le domaine de la surveillance des performances de chaînesapplicatives. L’invention concerne plus particulièrement un procédé de prédiction automatiquede l’impact d’un dysfonctionnement d’une ressource, sur un niveau de service d’au moins unechaîne applicative. L’invention concerne également un système informatique capable desupporter la mise en oeuvre d’un tel procédé.
[Art antérieur] [0002] Au fil des années, l’utilisation des systèmes informatiques s’accroît avec desscénarios d'utilisation de plus en plus complexes, des chaînes applicatives de plus en plusnombreuses et faisant appel à de nombreuses ressources informatiques pouvant faire l’objetde dysfonctionnement. Or, les directions métiers demandent désormais au directeur dessystèmes d'information (DSI) de s’engager sur des niveaux de service (ou SLA pour« Service-level agreement ») pour l’ensemble des chaînes applicatives relatives à leursapplications métiers.
[0003] Dans ce contexte, il existe de nombreuses méthodes pour évaluer le respect desSLA. Par exemple, le brevet US8209273 décrit un procédé d’évaluation et de classement deniveau de service comportant une étape de prédiction de l’importance de la violation d’un SLApouvant être basé notamment sur la fréquence d’occurrence et l’ancienneté du problème. Demême, il existe des outils de surveillance permettant de monitorer le ressenti utilisateur, maisces outils ne permettent pas d’établir un lien entre un incident matériel, ou dysfonctionnement,sur la chaîne de liaison et une dégradation des performances de la chaîne applicative, puis dedéterminer l’impact du dysfonctionnement sur les SLAs devant être respectées.
[0004] De même, s’il existe des outils de surveillance permettant de monitorer les différentséquipements du système d'information (e.g. FR2985335), il n’y a pas de vision applicativepermettant de savoir quel est l’impact d’un dysfonctionnement au niveau d’une ressource d’unéquipement informatique, sur le niveau de service des chaînes applicatives concernées.
[0005] Ainsi, il n’existe pas de procédé permettant de rapidement évaluer l’impact d’undysfonctionnement matériel sur le niveau de SLA d’une chaîne applicative. En effet,considérant la multiplicité des chaînes applicatives d’un côté et des ressources d’un autrecôté, les outils actuels de surveillance des infrastructures ne permettant pas d’avoir une visionapplicative de cette infrastructure. Il est donc impossible avec les outils actuels de mesurer oude prédire les impacts d’un incident matériel ou d’une contention au niveau d’une ressourcesur le niveau de SLA des applications métiers et donc de pouvoir faire un rapport prédisantl’impact d’un dysfonctionnement (e.g. incident matériel ou contention) sur le niveau de SLAdes différentes applications métiers du système d’information.
[0006] Ainsi, il existe un besoin pour de nouveaux procédés et systèmes visant àautomatiser l'analyse et la prédiction de l’impact des dysfonctionnements subis par dessystèmes informatiques.
[Problème technique] [0007] L’invention a donc pour but de remédier aux inconvénients de l’art antérieur. Enparticulier, l’invention a pour but de proposer un procédé de prédiction de l’impact d’undysfonctionnement d’une ressource sur le niveau de service d’une chaîne applicative, leditprocédé permettant de rapidement informer la direction des systèmes d'information, ladirection métier ou les utilisateurs d’un dysfonctionnement détecté sur une ressourcespouvant impacter une ou plusieurs chaînes applicatives. En outre, le procédé est capable defournir une prédiction de la sévérité de cet impact. Enfin, ce procédé est en mesure deprogresser au fur et à mesure de la survenue de dysfonctionnements de façon à améliorer lajustesse de sa prédiction. L’invention a en outre pour but de proposer un systèmeinformatique susceptible de mettre en oeuvre le procédé de prédiction de l’impact d’undysfonctionnement ressource sur le niveau de service d’une chaîne applicative.
[Brève description de l’invention] [0008] A cet effet, l’invention porte sur un procédé de prédiction automatique de l’impactd’un dysfonctionnement affectant une ressource, sur un niveau de service d’au moins unechaîne applicative utilisant des ressources, ledit procédé étant caractérisé en ce que lesditesressources sont associées à un niveau prédéterminé d’utilisation courante et à un seuil prédéterminé d’utilisation maximum, en ce qu’il comporte l’utilisation d’au moins une sondeconfigurée pour collecter des données, et en ce qu’il comporte les étapes suivantes : - Collecter les données de ladite sonde, lesdites données collectées comportant desdonnées relatives à l’état de fonctionnement des ressources ; Détecter un dysfonctionnement sur au moins une ressource, à partir des données desonde collectées ;
En présence d’un dysfonctionnement, quantifier l’impact présumé duditdysfonctionnement sur le niveau de service d’au moins une chaîne applicative,comportant les sous étapes suivantes :
Calculer un nouveau seuil d’utilisation maximum en fonction du seuil prédéterminéd’utilisation maximum et des données relatives à l’état de fonctionnement desressources, Comparer le nouveau seuil d’utilisation maximum de la ressource au niveauprédéterminé d’utilisation courante de ladite ressource, de façon à déterminer si lenouveau seuil d’utilisation maximum est dépassé par le niveau prédéterminéd’utilisation courante, Si le nouveau seuil d’utilisation maximum est dépassé alors, • Calculer une valeur de sévérité présumée d’impact du dysfonctionnementsur le niveau de service d’au moins une chaîne applicative, • Générer un signal d’alerte applicative comportant la valeur de sévéritéprésumée d’impact du dysfonctionnement sur le niveau de service d’aumoins une chaîne applicative.
[0009] Ce procédé permet de prévoir l’impact d’un dysfonctionnement, au niveau d’uneressource d’un équipement, sur le niveau de SLA des chaînes applicatives et d’établir unrapport concernant le niveau de SLA des différentes applications métiers du SI dans le cadrede ce dysfonctionnement. Ainsi, lorsqu’un dysfonctionnement (e.g. incident ou congestion) auniveau des ressources se produit, il est possible de déterminer précisément quelles seront leschaînes applicatives qui seront impactées par ce phénomène et de calculer la sévéritéprésumée de cet incident sur les SLAs de l’application.
[0010] Selon d’autres caractéristiques optionnelles du procédé : - il comprend, une étape préalable de génération d’un premier référentiel d’utilisationdes ressources, comportant, distinctivement pour chacune des ressources, une valeur correspondant à un niveau d’utilisation d’une ressource par une chaîne applicative. Untel référentiel peut être avantageusement utilisé pour déterminer si une chaîneapplicative sera ou non impactée par un dysfonctionnement. En effet, cela permetd’identifier rapidement les chaînes applicatives n’utilisant pas les ressources ayantsubi un dysfonctionnement. - l’étape de calcul de la valeur de sévérité présumée d’impact du dysfonctionnement surle niveau de service d’au moins une chaîne applicative est réalisée à partir de donnéesmémorisées dans le premier référentiel d’utilisation des ressources. - il comporte, en présence d’un dysfonctionnement, une étape d’enregistrement d’unevaleur observée d’impact d’un dysfonctionnement sur un niveau de service d’au moinsune chaîne applicative. Cela permet d’évaluer et de mémoriser l’impact réel d’undysfonctionnement détecté. Une telle valeur peut ensuite être comparée à la valeurd’impact prédit par le procédé. Avantageusement, la valeur observée d’impact d’undysfonctionnement sur un niveau de service d’au moins une chaîne applicative estenregistré dans un second référentiel d’impact de dysfonctionnement. En effet, un telréférentiel sera en mesure de rassembler un grand nombre de données sur lesimpacts réels des dysfonctionnements détectés. Ainsi, le second référentiel d’impactde dysfonctionnement comporte des données relatives au niveau de service observé,d’au moins une chaîne applicative par exemple en fonction de valeurs relatives auxressources subissant un dysfonctionnement, lesdites valeurs relatives aux ressourcessubissant un dysfonctionnement étant sélectionnées parmi des données relatives àl’état de fonctionnement des ressources ou de nouveaux seuils d’utilisation maximumde ressources suite à un dysfonctionnement. - Le procédé comporte, après la détection d’un dysfonctionnement sur au moins uneressource : o une étape de comparaison du dysfonctionnement à un dysfonctionnementantérieur de façon à identifier un dysfonctionnement antérieur identique ousensiblement identique, et o si un dysfonctionnement antérieur identique ou sensiblement identique estidentifié, une étape de génération d’un signal d’alerte applicative comportantune valeur observée d’impact du dysfonctionnement sur le niveau de serviced’au moins une chaîne applicative. - il comprend une étape de mesure du niveau d’utilisation globale des ressources.
[0011] Selon un autre aspect, l’invention porte sur un système informatique de supervisionautomatique de l’impact d’un dysfonctionnement d’au moins une ressource sur un niveau deservice d’au moins une chaîne applicative, ledit système informatique comportant au moinsune sonde configurée pour collecter des données, ledit système informatique étantcaractérisé en ce qu’il comporte : - Un module de configuration apte à associer lesdites ressources à un niveauprédéterminé d’utilisation courante et à un seuil prédéterminé d’utilisationmaximum, - un module d’acquisition apte à collecter, à partir desdites sondes, des donnéesrelatives à l’état de fonctionnement des ressources, - un module de détection apte à détecter un dysfonctionnement sur au moinsune ressource, à partir de données de sonde collectées ; et apte, en présenced’un dysfonctionnement, à transmettre l’information à un module de traitement, - un module de traitement de données capable de quantifier l’impact présumédudit dysfonctionnement sur le niveau de service d’au moins une chaîneapplicative et apte à o Calculer un nouveau seuil d’utilisation maximum en fonction du seuilprédéterminé d’utilisation maximum et des données relatives à l’état defonctionnement des ressources, o Comparer le nouveau seuil d’utilisation maximum de la ressource auniveau prédéterminé d’utilisation courante de ladite ressource, de façonà déterminer si le nouveau seuil d’utilisation maximum est dépassé parle niveau prédéterminé d’utilisation courante, et o Si le nouveau seuil d’utilisation maximum est dépassé alors, calculerune valeur de sévérité présumée d’impact du dysfonctionnement sur leniveau de service d’au moins une chaîne applicative et à le transmettreà un module de communication, - un module de communication de données apte à générer un signal d’alerteapplicative comportant la valeur de sévérité présumée d’impact dudysfonctionnement sur le niveau de service d’au moins une chaîne applicative.
[0012] Avantageusement, ce système informatique comporte en outre : -un premier référentiel d’utilisation des ressources, comportant, distinctivement pourchacune des ressources, une valeur correspondant à un niveau d’utilisation d’uneressource par une chaîne applicative, et -un second référentiel d’impact de dysfonctionnement comportant une valeur observéed’impact d’un dysfonctionnement sur un niveau de service d’au moins une chaîneapplicative en fonction de valeurs relatives aux ressources subissant un dysfonctionnement, lesdites valeurs relatives aux ressources subissant un dysfonctionnement étant sélectionnées parmi des données relatives à l’état defonctionnement des ressources ou de nouveaux seuils d’utilisation maximum deressources suite à un dysfonctionnement.
[0013] D’autres avantages et caractéristiques de l’invention apparaîtront à la lecture de ladescription suivante donnée à titre d’exemple illustratif et non limitatif, en référence auxFigures annexées qui représentent : • Figure 1, une vue schématique d’un procédé de prédiction automatique de l’impactd’un dysfonctionnement selon l’invention. Les étapes encadrées par des pointillés sontfacultatives. • Figure 2, une vue schématique d’une étape de quantification de l’impact présumé duditdysfonctionnement sur un niveau de service d’au moins une chaîne applicative duprocédé selon l’invention. Les étapes encadrées par des pointillés sont facultatives. • Figure 3, une vue schématique des éléments du système informatique de prédictionautomatique de l’impact de dysfonctionnement selon l’invention. Les élémentsencadrés par des pointillés sont facultatifs.
[Description de l’inventionl [0014] Dans la suite de la description, on entend par «Ressource» ou «Ressourcematérielle », des paramètres ou des fonctions de dispositifs informatiques permettant lefonctionnement d’une chaîne applicative. Un même dispositif informatique fait appelgénéralement à plusieurs ressources. De même, une même ressource est généralementpartagée entre plusieurs chaînes applicatives. Par exemple, le terme « ressource » peutinclure : des disques réseaux caractérisé par exemple par leurs entrées/sorties, un réseau caractérisé par sa bande passante, des ports de communication caractérisés par leur statut(ouvert / fermé), un processeur caractérisé par exemple par son utilisation (en pourcent) ou letaux d’occupation de ses caches, une mémoire vive caractérisée par la quantité allouée, oude façon plus globale le temps de latence d’un processus ou les pertes de paquets.
[0015] L’expression « chaîne applicative » au sens de l’invention correspond à un ensembled’applications, reliées entre elles par un flot d’information et visant à proposer, au travers deplusieurs processus, une ou plusieurs fonctionnalités pouvant faire l’objet d’un accord deniveau de service (SLA).
[0016] L’expression « niveau de service » au sens de l’invention correspond à une qualitéde service à laquelle peut s’engager un tiers et ainsi garantir de bonnes performances pourles chaînes applicatives critiques d’une organisation. Ainsi, le niveau de service ou les valeursde sévérité (présumée, observée, ou calculée) d’impact du dysfonctionnement peuventcorrespondre à des critères objectifs tels que des débits et des temps de réponse par chaîneapplicative ou bien subjectif, et prendre par exemple la forme d’une échelle de valeur,numérique ou non, correspondant à une appréciation de la qualité du niveau de service. Leniveau de service peut correspondre à une ou plusieurs valeurs.
[0017] Le terme «dysfonctionnement» au sens de l’invention correspond à la survenued’un incident matériel ou d’une congestion sur la structure informatique hébergeant unechaîne applicative.
[0018] Par « sonde » ou « sonde informatique », on entend au sens de l’invention un logicielassocié à un équipement qui permet d’effectuer, de gérer et faire remonter vers unéquipement informatique des mesures destinées à informer entre autres de l’état defonctionnement des ressources.
[0019] Selon un premier aspect, l’invention porte sur un procédé de prédiction automatiquede l’impact d’un dysfonctionnement affectant une ressource, sur un niveau de service d’aumoins une chaîne applicative utilisant des ressources. Une même ressource peut être utiliséepar plusieurs chaînes applicatives ainsi un seul dysfonctionnement peut avoir des impacts surplusieurs chaînes applicatives. De même, le procédé selon l’invention peut également êtreutilisé lorsque plusieurs ressources présentent simultanément un dysfonctionnement.
[0020] Le procédé selon l’invention se base sur l’association desdites ressources à un seuilprédéterminé d’utilisation maximum d’une part et à un niveau prédéterminé d’utilisationcourante d’autre part.
[0021] Ainsi, à chaque ressource est associé à un seuil prédéterminé d’utilisationmaximum correspondant au paramètre maximal de ladite ressource permettant un bonfonctionnement de ladite ressource. Par exemple, cela correspond aux limites maximalesacceptables de consommations de ressources pour un système informatique hébergeant uneou plusieurs chaînes applicatives. Ces limites peuvent être réelles ou hypothétiques etcorrespondent généralement un niveau d’utilisation au-delà duquel des dysfonctionnementspeuvent survenir et ayant pour conséquence un arrêt de la ressource ou bien à tout le moinsdes baisses de qualités de service. Par exemple, le tableau 1 ci-dessous présente les seuilsprédéterminés d’utilisation maximum pour trois ressources.
Tableau 1
[0022] A chaque ressource est également associé un niveau prédéterminé d’utilisationcourante correspondant à l’utilisation globale de ladite ressource par les chaînes applicativesdu système informatique. En effet, les chaînes applicatives sont associées à un certainnombre d'actions, où chaque action implique une consommation de ressources spécifiques(I/O disques ou réseau, consommation CPU, etc). Ainsi, une même chaîne applicative va faireappel à plusieurs ressources avec des niveaux d’utilisation différents.
[0023] En outre, le procédé selon l’invention peut également comprendre l’attribution d’unniveau de criticité à chaque couple Ressource (Ri) - Chaîne applicative (Ai). Le niveau decriticité peut correspondre à une valeur numérique traduisant l’importance relative de laressource dans le cadre du fonctionnement normale de la chaîne applicative.
[0024] Dans ce contexte, le procédé selon l’invention peut comprendre une étape préalable101 de mesure de valeurs correspondant à un niveau d’utilisation courant de chacune desressources. Cette mesure est réalisée distinctivement pour chacune des chaînes applicatives.Avantageusement, ces valeurs sont enregistrées dans un premier référentiel 200d’utilisation des ressources par les chaînes applicatives.
[0025] Ce référentiel 200 d’utilisation des ressources par les chaînes applicativesprésente la particularité de rassembler des informations sur le niveau d’utilisation desressources, classées et distinguées en fonction de la chaîne applicative utilisant laditeressource. Ce référentiel est basé sur le fait que la ou les chaînes applicatives (Ai,..., Ai,..., An)repose, pour leur fonctionnement, sur un ensemble de ressources (Ri,..., Ri,..., Rn) utilisé entout ou partie. Il permet de détailler le niveau d’utilisation courant (ou classique) de chacunedes ressources (Ursai) par chacune des chaînes applicatives. Le référentiel 200 par exemplesous la forme d’un tableau dont chaque ligne correspond à une chaîne applicative (A) etchaque colonne une ressource (Ri) et pour chaque ressource sont reportées dans leditréférentiel une valeur correspondant à un niveau d’utilisation d’une ressource (Ursai) par unechaîne applicative. Le référentiel 200 peut par exemple prendre la forme d’une matricereprésentée par le tableau 2.
Tableau 2
[0026] Le référentiel 200 d’utilisation des ressources, par les chaînes applicatives, estgénéré par l’intermédiaire d’une séquence de mesure des consommations de ressources parchaque chaîne applicative de façon indépendante. La somme des utilisations de ressourcepar chacune des chaînes applicatives d’un système informatique correspondant à l’utilisationglobale des ressources du système informatique lors du fonctionnement des chaînesapplicatives considérées.
[0027] Le référentiel 200 peut correspondre à un agencement matériel et logiciel permettantd'une part la mesure, par des sondes, de l'empreinte de chaque chaîne applicative sur chaqueressource, en soustrayant des consommations de ressources mesurées celles de l'empreinteà vide sur une même période et d'autre part le calcul de l'empreinte totale sur l'ensemble desressources induites par l’ensemble des chaînes applicatives, puis la mémorisation de cetteempreinte totale dans ledit référentiel.
[0028] Le niveau d’utilisation d’une ressource (Ursai) par les chaînes applicative peut varieren fonction du temps. Cette variation, souvent cyclique, peut être retrouvée par exemple ausein d’une même journée au gré des heures de travail mais également au gré de lasaisonnalité de l’activité métier. En effet, lorsqu'une application est utilisée en production surune infrastructure, les demandes de ressource de l'application ne sont pas régulières, soitpour le déclenchement de taches périodiques (traitements batch) soit pour l'usage del'application de façon saisonnière (période de clôture, lancement des campagnes...). Ainsi, defaçon avantageuse, le référentiel 200 intègre une donnée temporelle de façon à intégrer lesvariations observées au cours du temps dans l’utilisation des ressources. Le même processuss’effectue pour les périodes sans problème de performance pour mémoriser des triplets (A,Ri, Ursai).
[0029] Faisant suite au tableau 1 listant trois ressources avec leur seuil prédéterminéd’utilisation maximum respectif, un exemple de structure d’un référentiel 200 est exposé entableau 3.
Tableau 3
[0030] Ainsi, le premier référentiel comporte un agencement matériel et logiciel permettantde lister et mémoriser dans une mémoire : - des identifiants uniques pour chacune des ressources (F?,) - des identifiants uniques pour chacune des chaînes applicatives (A) - des niveaux d’utilisation (Ursai) des ressources par les chaînes applicatives.
[0031] Comme cela est présenté dans le tableau 3, ce référentiel peut également mémoriserpour chaque ressource les seuils d’utilisation maximum et stocker une information relative auniveau d’utilisation courante.
[0032] Le procédé selon l’invention comporte l’utilisation d’au moins une sondeconfigurée pour collecter des données. Ainsi, le procédé selon l’invention peut faire appel àune sonde ou à une pluralité de sondes. La ou les sondes permettent de collecter desdonnées sur l’état de fonctionnement des ressources et ces données sont utilisées dans leprocédé selon l’invention pour détecter un dysfonctionnement. Comme cela est présenté enfigure 1, le procédé selon l’invention peut comporter une étape préalable facultative deconfiguration 102 de la ou des sondes correspondant à la mise en place d’une ou plusieurssondes.
[0033] Les sondes particulières permettant d’obtenir des données sur l’état defonctionnement des ressources peuvent être nommées sondes d’état de fonctionnement. Cessondes d’état de fonctionnement peuvent être associées à chaque ressource pour remonterles informations de mesure ou métriques, représentant l’état de fonctionnement desressources. Pour chaque ressource, les sondes d’état de fonctionnement définissent unidentifiant de la ressource et au moins une valeur correspondant à un état de fonctionnement.L’état de fonctionnement de chaque ressource peut être suivi en continue ou à des intervallesconfigurables de façon à obtenir des informations d’état de fonctionnement pour chaqueressource en fonction du temps. Ces informations peuvent être stockées dans une mémoire.
[0034] L’étape de configuration des sondes peut comprendre la définition de seuils dedysfonctionnement correspondant par exemple à des valeurs minimales et/ou maximales depourcentage d’utilisation de ressources (ex : taux d’occupation des processeurs CPUs, de lamémoire RAM), des temps de réponse, des temps de traitement ou à des valeurs de variationautorisée en fonction du temps. Les seuils de dysfonctionnement peuvent être inscrits dansun fichier de configuration (par exemple pour chaque dispositif de l’infrastructure et/ou pourchaque ressource). Ces seuils de dysfonctionnement peuvent être utilisés pour déterminer sil’infrastructure ne dévie pas d’un comportement attendu ou ne satisfait pas des performancesvoulues.
[0035] Outre les éventuelles premières étapes de création 101 d’un premier référentiel oude configuration 102 des sondes, le procédé selon l’invention comporte une étape decollecte 110 des données d’une sonde, lesdites données collectées comportant desdonnées relatives à l’état de fonctionnement des ressources utilisées par la chaîneapplicative. Comme évoqué précédemment, les informations collectées peuvent par exemplecorrespondre des valeurs minimales et/ou maximales de pourcentage d’utilisation deressources, des temps de réponse, des temps de traitement mais également le statut des ports, le nombre de files de message JDBC ou JMS, le taux d’occupation du système defichiers, le taux de fonctionnement du ramasse miettes ou récupérateur de mémoires (pour «garbage collecter » en anglais) pour les applications J2EE (pour « Java Enterprise Edition »en anglais).
[0036] Comme cela est présenté en figure 3, ces sondes 31, 32, 33 d’état defonctionnement peuvent être associées à chaque ressource 11, 12, 13 pour remonter lesinformations de mesure ou métriques, représentant l’état de fonctionnement des ressources.Pour chaque ressource, la ou les sondes d’état de fonctionnement définissent un identifiantde la ressource et un état de fonctionnement. L’état de fonctionnement de chaque ressourcepeut être suivi en continue ou à des intervalles configurable de façon à obtenir desinformations pour chaque ressource d’état de fonctionnement en fonction du temps. Dans lecadre d’une étape 120 d’enregistrement des données relatives à l’état de fonctionnement desressources, ces informations peuvent être stockées dans une mémoire.
[0037] Dans un mode de réalisation particulier, le procédé peut prendre en compte laprésence d’une redondance au sein des ressources. Par exemple dans le cas d’un ensemblede serveurs, si l’un subit un dysfonctionnement global, il peut y avoir une répartition de lacharge sur les serveurs restants. Ainsi, dans le cas d’une architecture redondée, il y a depréférence présence d’un répartiteur fournissant, dans le cadre du procédé selon l’invention,une indication sur l’état de fonctionnement de la ferme de serveurs.
[0038] Le procédé selon l’invention comporte une étape de détection 130 d’undysfonctionnement sur au moins une ressource, à partir des données de sonde collectées.
[0039] La détection de dysfonctionnement peut par exemple être réalisée via une étape decomparaison entre des valeurs mesurées par une sonde et des seuils de dysfonctionnementcorrespondant par exemple aux données fournies lors d’une étape de configuration 102 dessondes. Cette détection peut par exemple être réalisée via une étape de comparaison entredes valeurs mesurées par une sonde et des seuils de dysfonctionnement spécifiés en accordavec les données fournies lors de l’étape de configuration 102. En effet, des seuils dedysfonctionnement peuvent être fixés dans un fichier de configuration (par exemple pourchaque ressource). Ces seuils de dysfonctionnement permettent de déterminer si la ressourcene satisfait pas des performances voulues.
[0040] Alternativement, un enregistrement systématique des valeurs des paramètres deressources et une comparaison d’une nouvelle valeur aux valeurs préalablement enregistréespeut permettre de détecter un dysfonctionnement si la nouvelle valeur est significativement différente des valeurs enregistrées antérieurement. Cette méthode alternative permet dedéterminer si la ressource ne dévie pas d’un comportement attendu ou classique. Undysfonctionnement peut également être détecté par comparaison avec le seuil d’utilisationmaximum.
[0041 ] Afin de garder une trace des éventuels écarts par rapport aux seuils fixés, des alertespeuvent être émises vers un utilisateur ou être stockées dans un fichier de suivi. En outre, undysfonctionnement détecté peut être associé avec une indication temporelle.
[0042] Lorsqu’aucun dysfonctionnement n’est détecté, et par exemple que les résultats demesure satisfont aux seuils de dysfonctionnement définis, alors il y a poursuite de la collectede données telle que prévue à l’étape 110 de collecte.
[0043] Lorsque les résultats de mesure ne satisfont pas aux seuils dedysfonctionnement définis, un dysfonctionnement est alors détecté. A cette étape, il esten outre possible d’émettre un message d’alerte vers un utilisateur (un courriel, un messagegraphique, un son ou autre). Par exemple encore, il est possible d’inscrire cet événementdans le fichier de suivi dans une étape de mise à jour de celui-ci.
[0044] Le procédé selon l’invention peut également comprendre une étape facultative demesure 140 du niveau d’utilisation globale des ressources. Cela permet de déterminerl’utilisation globale des ressources par l’ensemble des chaînes applicatives sans distinction.La mesure des niveaux d’utilisation globale des ressources (Ursgi) au cours du temps peutêtre complétée par une étape de comparaison avec des niveaux antérieurs d’utilisationglobale de ressources. Ce processus a pour objectif de savoir si les observations sont stablesdans le temps. Les niveaux d’utilisation globale des ressources (Ursgi) mesurés au cours dutemps peuvent également être comparés avec la somme des niveaux d’utilisation courant dechacune des ressources tels que mesurés lors de l’étape 101. Cela de façon à contrôler qu’iln’y ait pas au fil du temps une augmentation ou une modification du schéma d’utilisation desressources nécessitant une nouvelle étape ponctuelle 101 de mesure de valeurscorrespondant à un niveau d’utilisation courant de chacune des ressources correspondant àune cartographie de l’utilisation des ressources par les chaînes applicatives constituant lesystème informatique.
[0045] Le procédé peut comprendre, à l’issue de l’étape 140, une étape d’enregistrement 141 dudit niveau de d’utilisation globale des ressources.
[0046] De façon préférée, le procédé peut comprendre en outre une étape de comparaison 142 dans le temps de l’utilisation globale des ressources. Si l’utilisation globale des ressources dévie ponctuellement ou de façon chronique, le procédé peut comprendre uneétape de génération 143 d’une alerte si la consommation globale des ressources présenteune variation significative. Le niveau de variation significative permettant de déclencher unetelle alerte peut être librement configuré par les utilisateurs (par exemple une variationsupérieure à 10%, ou supérieure à 20 %).
[0047] En présence d’un dysfonctionnement, le procédé selon l’invention comporte uneétape 160 de quantification l’impact présumé dudit dysfonctionnement sur un niveau deservice d’au moins une chaîne applicative. Cette étape 160 comporte plusieurs sous étapespouvant être ou non facultatives et étant détaillées à la figure 2.
[0048] La sous étape 161 correspond au calcul d’un nouveau seuil d’utilisation maximum enfonction du seuil prédéterminé d’utilisation maximum de la ressource d’une part et desdonnées relatives à l’état de fonctionnement des ressources d’autre part. Cela permet dequantifier l’impact du dysfonctionnement sur le niveau fonctionnalité de la ressource à untemps donné.
[0049] Par exemple, dans le cas d’un dysfonctionnement affectant principalement le CPUn°1 d’un système informatique, alors, comme cela est présenté dans le tableau 4, il peut yavoir une réduction du seuil d’utilisation maximum aboutissant à la génération d’un nouveauseuil d’utilisation maximum inférieur au seuil prédéterminé d’utilisation maximum. Commeprésenté en tableau 4, il est également possible de calculer un nouveau seuil d’utilisationmaximum pour les ressources n’ayant pas subi de dysfonctionnement. Le tableau 4 montredans ce cas un nouveau seuil d’utilisation maximum identique au seuil prédéterminéd’utilisation maximum. Néanmoins, il est possible également que le dysfonctionnement d’uneressource entraîne une diminution du nouveau seuil d’utilisation maximum d’une autreressource non impactée directement par le dysfonctionnement mais étant dépendante de laressource impactée.
Tableau 4
[0050] Dans une sous-étape 162, le nouveau seuil d’utilisation maximum de la ressource estcomparé au niveau prédéterminé d’utilisation courante de ladite ressource, de façon àdéterminer si le nouveau seuil d’utilisation maximum est dépassé par le niveau prédéterminéd’utilisation courante. Dans le cas présenté dans le tableau 5, il est possible de voir que leseuil d’utilisation maximum du CPU n°1 est dépassé par le niveau prédéterminé d’utilisationcourante du CPU n°1. Ainsi, il y aura probablement un impact du dysfonctionnement sur leniveau de service des chaînes applicatives faisant appel au CPU n°1 alors qu’il n’y aura pasd’impact présumé sur le niveau de service de la chaîne applicative 4 ne faisant pas appel auCPU n°1.
Tableau 5
[0051] Si le nouveau seuil d’utilisation maximum n’est pas dépassé alors le procédé peutpoursuivre la collecte de données selon l’étape 110. A ce stade, le procédé peut égalementcomprendre la génération 164 d’un signal d’alerte de dysfonctionnement sans impact sur leniveau de service de la chaîne applicative. Un tel signal d’alerte applicative peut par exempleêtre envoyé aux administrateurs du système informatique et/ou aux directions desapplications métiers.
[0052] Si le nouveau seuil d’utilisation maximum est dépassé, comme cela est présentédans le tableau 5, cela implique qu’il y aura un impact du dysfonctionnement sur le niveau deservice d’une ou plusieurs chaînes applicatives. Dans ce cadre, le procédé selon l’invention
comporte une sous étape 163 de calcul d’une valeur de sévérité présumée de l’impactdu dysfonctionnement sur un niveau de service de la chaîne applicative. Ce calcul peutêtre réalisé pour toutes les chaînes applicatives pouvant être impactées par ledysfonctionnement détecté.
[0053] Il existe plusieurs méthodes pour le calcul d’un niveau présumé de sévérité dudysfonctionnement sur un niveau de service de la chaîne applicative. Par exemple, cetteméthode peut être basée sur une valeur de niveau de criticité de la ressource pour la chaîneapplicative. Ce niveau de criticité correspondant à l’importance relative de la ressource dansle cadre du fonctionnement normale de la chaîne applicative.
[0054] Avantageusement, cette sous étape 163 de calcul peut comprendre la prise encompte de l’importance de ladite ressource dans le fonctionnement de l’application. Ainsi, ilpeut être pris en compte le niveau d’utilisation de la ressource (Ursaî) par la chaîneapplicative. Il est en effet possible pour un système informatique donné de quantifierl’utilisation des ressources par chacune des chaînes applicatives hébergées par le systèmeinformatique. De façon préférée, l’étape de calcul 163 de la valeur de sévérité présuméed’impact du dysfonctionnement sur le niveau de service d’au moins une chaîne applicative estréalisée à partir de données mémorisées dans le premier référentiel 200 d’utilisation desressources. Cette valeur de sévérité présumée d’impact du dysfonctionnement sur le niveaude service d’au moins une chaîne applicative permet d’obtenir une prédiction du niveau deservice que fournir une chaîne applicative suite au dysfonctionnement.
Tableau 6
[0055] Dans le tableau 6, ci-dessus il est possible de voir que la chaîne applicative 1 faitbeaucoup plus appel au CPU n°1 (ressource subissant un dysfonctionnement) que la chaîneapplicative 3 par exemple.
[0056] Ainsi, lors de l’étape de calcul 163 d’une valeur de sévérité présumée de l’impact dudysfonctionnement sur le niveau de service, il est probable que l’impact présumé soit plusimportant sur la chaîne applicative 1 que sur la chaîne applicative 3 dont l’utilisation du CPUn°1 est faible.
[0057] Ensuite, le procédé comporte la génération 170 d’un signal d’alerte applicativecomportant la valeur de sévérité calculée du dysfonctionnement sur un niveau de service d’aumoins une chaîne applicative. Ce signal d’alerte applicative peut être envoyé par exemple auDSI, aux utilisateurs des chaînes applicatives métiers concernées par le dysfonctionnement,et/ou aux référents métier.
[0058] Ces informations peuvent être stockées dans une mémoire et permettrel’établissement d’un rapport. Les informations stockées sont par exemple : - des données temporelles telles que la date et l’heure, - l’état de fonctionnement par exemple de la ressource subissant le dysfonctionnement,et - le nouveau seuil d’utilisation maximum, et éventuellement - la valeur de sévérité présumée d’impact du dysfonctionnement par exemple pourchaque chaîne applicative impactée.
[0059] De façon à réduire l’impact sur la mémoire, seules les informations relatives auxressources subissant un dysfonctionnement et les chaînes applicative potentiellementimpactées sont enregistrées.
[0060] Avantageusement, en présence d’un dysfonctionnement, le procédé selon l’inventioncomporte une étape 190 d’enregistrement d’une valeur observée d’impact d’undysfonctionnement sur un niveau de service (Sobi) d’au moins une chaîne applicative (Ri). Parexemple, les données de sondes collectées enregistrées peuvent être utilisées pour mesurerl’impact réel sur le niveau de service des chaînes applicatives lorsqu’un dysfonctionnements’est produit de façon à affiner les valeurs d’impacts. En outre, dans un mode de réalisationde la présente invention, le procédé selon l’invention peut comprendre la réception desmesures de niveau de service par des terminaux d'utilisateurs par l'intermédiaire d'un réseaude données. Chacun des mesures de niveau de service pouvant indiquer une mesure d’un niveau de service d'une des chaînes applicatives hébergées par l'un des terminauxutilisateurs. Le procédé peut comprendre en outre la détermination si l'un des niveaux deservice rapportés par l'un des terminaux d'utilisateur viole une règle d’un accord de niveau deservice prédéterminé.
[0061] Cette étape 190 d’enregistrement comporte de façon préférée une sous étaped’établissement d’un second référentiel 300 d’impact de dysfonctionnement. Ce secondréférentiel 300 d’impact de dysfonctionnement peut être utilisé pour mémoriser la valeurobservée d’impact d’un dysfonctionnement sur un niveau de service (Sobi) d’au moins unechaîne applicative.
[0062] Le second référentiel 300 d’impact de dysfonctionnement peut avantageusementcomporter une valeur observée d’impact d’un dysfonctionnement sur un niveau de service(Sobi), d’au moins une chaîne applicative (A) en fonction de valeurs de fonctionnalités desressources subissant un dysfonctionnement (Rdysi), lesdites valeurs de fonctionnalités desressources subissant un dysfonctionnement (Rdysi) pouvant être sélectionnées parmi desdonnées relatives à l’état de fonctionnement des ressources ou de nouveaux seuilsd’utilisation maximum de ressources suite à un dysfonctionnement. Ainsi, le second référentielcomporte des triplets d’information (Sobi, Ai, Rdysi) ce qui présente l’avantage de réduire lenombre et la quantité d’informations envoyées par les sondes, pour réduire l’encombrementdu réseau tout en maintenant une précision suffisante pour l’intégration ultérieure de cesdonnées dans le procédé selon l’invention.
[0063] De façon préférée, le second référentiel comporte un agencement matériel et logicielpermettant de lister et mémoriser dans une mémoire : - des identifiants uniques pour chacune des chaînes applicatives, - des identifiants uniques pour chacune des ressources, - des valeurs de fonctionnalités des ressources, et - des valeurs observées d’impact d’un dysfonctionnement sur un niveau de service(Sobi).
[0064] Le second référentiel peut être utilisé de manière particulièrement avantageuse pouraméliorer la prédiction du procédé selon l’invention.
[0065] Ainsi, de façon avantageuse, le procédé selon l’invention comporte, après ladétection 130 d’un dysfonctionnement sur au moins une ressource : - une étape de comparaison 150 du dysfonctionnement à un dysfonctionnementantérieur de façon à identifier un dysfonctionnement antérieur identique ousensiblement identique, et - si un dysfonctionnement antérieur identique ou sensiblement identique est identifié,une étape de génération 180 d’un signal d’alerte applicative comportant une valeurobservée d’impact du dysfonctionnement sur le niveau de service d’au moins unechaîne applicative.
[0066] Ainsi, l’étape de comparaison 150 peut être mise en oeuvre pour identifier undysfonctionnement antérieur ayant eu un impact sensiblement identique au présentdysfonctionnement sur la ressource. Par sensiblement identique on entend au sens del’invention une valeur variant de moins de 30 % par rapport à la valeur comparée, depréférence de moins de 20 %, de façon encore plus préférée de moins de 10 %.
[0067] Lorsque le dysfonctionnement antérieur est sensiblement identique, le procédé selonl’invention peut comprendre une étape de calcul d’une valeur calculée d’impact dudysfonctionnement à partir de la valeur observée d’impact du dysfonctionnement antérieursensiblement identique. Cette étape de calcul peut permettre, à partir de la valeur observéede dysfonctionnement antérieur sensiblement identique et par exemple à partir des donnéesrelatives à l’état de fonctionnement, de calculer une nouvelle valeur d’impact dudysfonctionnement plus précise que le seraient la valeur présumée d’impact et la valeurobservée d’impact.
[0068] Selon une autre particularité de l'invention, le procédé peut également inclure uneétape d”utilisation d’une interface homme-machine (IHM) pouvant intervenir par exempledans : - la définition et la mémorisation des seuils de dysfonctionnement, - la définition et la mémorisation des niveaux de criticité, - la définition et la mémorisation des paramètres de mémorisation et de transmissiondes informations générées par le système, et - la définition et la mémorisation des valeurs observées d’impact du dysfonctionnementsur le niveau de service (par exemple des niveaux de services observés) suite à undysfonctionnement et utilisé dans la construction du second référentiel 300.
[0069] Selon un autre aspect, l’invention porte sur un système informatique 1 de supervisionautomatique de l’impact d’un dysfonctionnement d’au moins une ressource 11, 12, 13 sur unniveau de service d’au moins une chaîne applicative 21,22, 23. Comme cela est présenté enfigure 3, le système informatique 1 comporte au moins une sonde 31, 32, 33 configurée pourcollecter des données. En outre, le système informatique 1 comporte plusieurs modulespermettant son fonctionnement.
[0070] Le système informatique 1 selon l’invention comporte un module de configuration 40apte à associer lesdites ressources à un niveau prédéterminé d’utilisation courante et à unseuil prédéterminé d’utilisation maximum.
[0071] Le système informatique 1 selon l’invention comporte un module d’acquisition 50apte à collecter, à partir desdites sondes, des données relatives à l’état de fonctionnementdes ressources.
[0072] Le système informatique 1 selon l’invention comporte un module de détection 60 apteà détecter un dysfonctionnement sur au moins une ressource, à partir de données de sondecollectées ; et apte, en présence d’un dysfonctionnement, à transmettre l’information à unmodule de traitement 70.
[0073] Le module de traitement 70 de données est capable de quantifier l’impact présumédudit dysfonctionnement sur le niveau de service d’au moins une chaîne applicative et il estnotamment apte à :
Calculer un nouveau seuil d’utilisation maximum en fonction du seuil prédéterminéd’utilisation maximum et des données relatives à l’état de fonctionnement desressources, - Comparer le nouveau seuil d’utilisation maximum de la ressource au niveauprédéterminé d’utilisation courante de ladite ressource, de façon à déterminer si lenouveau seuil d’utilisation maximum est dépassé par le niveau prédéterminé d’utilisationcourante, et - Si le nouveau seuil d’utilisation maximum est dépassé alors, calculer une valeur desévérité présumée d’impact du dysfonctionnement sur le niveau de service d’au moinsune chaîne applicative et à le transmettre à un module de communication, [0074] Le système informatique 1 selon l’invention comporte module de communication (80)de données apte à générer un signal d’alerte applicative comportant la valeur de sévéritéprésumée d’impact du dysfonctionnement sur le niveau de service d’au moins une chaîneapplicative.
[0075] Avantageusement, le système informatique 1 de supervision automatique de l’impactd’un dysfonctionnement selon l’invention comporte : - un premier référentiel 200 d’utilisation des ressources, comportant, distinctivement pourchacune des ressources (Ri), une valeur correspondant à un niveau d’utilisation d’uneressource (Ursai) par une chaîne applicative (Ai) et - un second référentiel 300 d’impact de dysfonctionnement comportant des valeursobservées d’impact du dysfonctionnement sur le niveau de service (Sobi), d’au moinsune chaîne applicative (Ai) en fonction de valeurs de fonctionnalités des ressourcessubissant un dysfonctionnement (Rdysi), lesdites valeurs de fonctionnalités desressources subissant un dysfonctionnement (Rdysi) étant sélectionnées parmi desdonnées relatives à l’état de fonctionnement des ressources ou de nouveaux seuilsd’utilisation maximum de ressources suite à un dysfonctionnement.

Claims (4)

  1. Revendications
    1. Procédé de prédiction automatique de l’impact d’un dysfonctionnement affectant uneressource, sur un niveau de service d’au moins une chaîne applicative utilisant desressources, ledit procédé étant caractérisé en ce que lesdites ressources sont associées à un niveau prédéterminé d’utilisationcourante et à un seuil prédéterminé d’utilisation maximum, en ce qu’il comporte l’utilisation d’au moins une sonde configurée pour collecter desdonnées, et en ce qu’il comporte les étapes suivantes : o Collecter (110) les données de ladite sonde, lesdites données collectéescomportant des données relatives à l’état de fonctionnement des ressources ; o Détecter (130) un dysfonctionnement sur au moins une ressource, à partir desdonnées de sonde collectées ; o En présence d’un dysfonctionnement, quantifier (160) l’impact présumé duditdysfonctionnement sur le niveau de service d’au moins une chaîne applicative,comportant les sous étapes suivantes : Calculer (161) un nouveau seuil d’utilisation maximum en fonction duseuil prédéterminé d’utilisation maximum et des données relatives àl’état de fonctionnement des ressources, Comparer (162) le nouveau seuil d’utilisation maximum de la ressourceau niveau prédéterminé d’utilisation courante de ladite ressource, defaçon à déterminer si le nouveau seuil d’utilisation maximum estdépassé par le niveau prédéterminé d’utilisation courante, et Si le nouveau seuil d’utilisation maximum est dépassé alors, calculer(163) une valeur de sévérité présumée d’impact du dysfonctionnementsur le niveau de service d’au moins une chaîne applicative ; et o Générer (170) un signal d’alerte applicative comportant la valeur de sévéritéprésumée d’impact du dysfonctionnement sur le niveau de service d’au moinsune chaîne applicative.
  2. 2. Procédé selon la revendication 1, caractérisé en ce qu’il comprend, une étapepréalable de génération (101) d’un premier référentiel (200) d’utilisation desressources, comportant, distinctivement pour chacune des ressources (Ri), une valeurcorrespondant à un niveau d’utilisation d’une ressource (Ursai) par une chaîneapplicative (A). 3. Procédé selon la revendication 2, caractérisé en ce que l’étape de calcul (163) de lavaleur de sévérité présumée d’impact du dysfonctionnement sur le niveau de serviced’au moins une chaîne applicative est réalisé à partir de données mémorisées dans lepremier référentiel (200) d’utilisation des ressources. 4. Procédé selon l’une quelconque des revendications 1 à 3, caractérisé en ce qu’ilcomporte, en présence d’un dysfonctionnement, une étape (190) d’enregistrementd’une valeur observée d’impact d’un dysfonctionnement sur un niveau de service(Sobi) d’au moins une chaîne applicative (Ri). 5. Procédé selon la revendication 4, caractérisé en ce que la valeur observée d’impactd’un dysfonctionnement sur un niveau de service (Sobi) d’au moins une chaîneapplicative est enregistré dans un second référentiel (300) d’impact dedysfonctionnement. 6. Procédé selon la revendication 5, caractérisé en ce que le second référentiel (300)d’impact de dysfonctionnement comporte des valeurs observées d’impact d’undysfonctionnement sur un niveau de service (Sobi), d’au moins une chaîne applicative(Ai) en fonction de valeurs de fonctionnalités des ressources subissant undysfonctionnement (Rdysi), lesdites valeurs de fonctionnalités des ressourcessubissant un dysfonctionnement (Rdysi) étant sélectionnées parmi des donnéesrelatives à l’état de fonctionnement des ressources ou de nouveaux seuils d’utilisationmaximum de ressources suite à un dysfonctionnement. 7. Procédé selon l’une quelconque des revendications 4 à 6, caractérisé en ce qu’ilcomporte, après la détection (130) d’un dysfonctionnement sur au moins uneressource : o une étape de comparaison (150) du dysfonctionnement à undysfonctionnement antérieur de façon à identifier un dysfonctionnementantérieur identique ou sensiblement identique, et o si un dysfonctionnement antérieur identique ou sensiblement identique estidentifié, une étape de génération (180) d’un signal d’alerte applicativecomportant une valeur observée d’impact du dysfonctionnement sur le niveaude service d’au moins une chaîne applicative.
  3. 8. Procédé selon l’une quelconque des revendications 1 à 7, caractérisé en ce qu’ilcomprend une étape de mesure (140) du niveau d’utilisation globale des ressources. 9. Système informatique (1) de supervision automatique de l’impact d’undysfonctionnement d’au moins une ressource (11, 12, 13) sur un niveau de serviced’au moins une chaîne applicative (21, 22, 23), ledit système informatique comportantau moins une sonde (31, 32, 33) configurée pour collecter des données, ledit systèmeinformatique étant caractérisé en ce qu’il comporte : - un module de configuration (40) apte à associer lesdites ressources à unniveau prédéterminé d’utilisation courante et à un seuil prédéterminéd’utilisation maximum, - un module d’acquisition (50) apte à collecter, à partir desdites sondes, desdonnées relatives à l’état de fonctionnement des ressources, - un module de détection (60) apte à détecter un dysfonctionnement sur aumoins une ressource, à partir de données de sonde collectées, et apte, enprésence d’un dysfonctionnement, à transmettre l’information à un module detraitement (70), - un module de traitement (70) de données capable de quantifier l’impactprésumé dudit dysfonctionnement sur le niveau de service d’au moins unechaîne applicative et apte à : o Calculer un nouveau seuil d’utilisation maximum en fonction du seuilprédéterminé d’utilisation maximum et des données relatives à l’état defonctionnement des ressources, o Comparer le nouveau seuil d’utilisation maximum de la ressource auniveau prédéterminé d’utilisation courante de ladite ressource, de façonà déterminer si le nouveau seuil d’utilisation maximum est dépassé parle niveau prédéterminé d’utilisation courante, et o Si le nouveau seuil d’utilisation maximum est dépassé alors, calculerune valeur de sévérité présumée d’impact du dysfonctionnement sur leniveau de service d’au moins une chaîne applicative et à le transmettreà un module de communication, - un module de communication (80) de données apte à générer un signal d’alerteapplicative comportant la valeur de sévérité présumée d’impact dudysfonctionnement sur le niveau de service d’au moins une chaîne applicative.
  4. 10. Système informatique (1) de supervision automatique de l’impact d’undysfonctionnement selon la revendication 9 caractérisé en ce qu’il comporte - un premier référentiel (200) d’utilisation des ressources, comportant,distinctivement pour chacune des ressources (Ri), une valeur correspondant àun niveau d’utilisation d’une ressource (Ursai) par une chaîne applicative (Ai) et - un second référentiel (300) d’impact de dysfonctionnement comportant desvaleurs observées d’impact du dysfonctionnement sur le niveau de service(Sobi), d’au moins une chaîne applicative (Ai) en fonction de valeurs defonctionnalités des ressources subissant un dysfonctionnement (RdySi),lesdites valeurs de fonctionnalités des ressources subissant undysfonctionnement (Rdysi) étant sélectionnées parmi des données relatives àl’état de fonctionnement des ressources ou de nouveaux seuils d’utilisationmaximum de ressources suite à un dysfonctionnement.
FR1755146A 2017-06-08 2017-06-08 Procede et systeme de prediction de l'impact d'un dysfonctionnement ressource sur le niveau de service d'une chaine applicative Active FR3067480B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1755146A FR3067480B1 (fr) 2017-06-08 2017-06-08 Procede et systeme de prediction de l'impact d'un dysfonctionnement ressource sur le niveau de service d'une chaine applicative

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1755146A FR3067480B1 (fr) 2017-06-08 2017-06-08 Procede et systeme de prediction de l'impact d'un dysfonctionnement ressource sur le niveau de service d'une chaine applicative
FR1755146 2017-06-08

Publications (2)

Publication Number Publication Date
FR3067480A1 FR3067480A1 (fr) 2018-12-14
FR3067480B1 true FR3067480B1 (fr) 2019-07-26

Family

ID=60019992

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1755146A Active FR3067480B1 (fr) 2017-06-08 2017-06-08 Procede et systeme de prediction de l'impact d'un dysfonctionnement ressource sur le niveau de service d'une chaine applicative

Country Status (1)

Country Link
FR (1) FR3067480B1 (fr)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8209273B2 (en) * 2007-09-19 2012-06-26 International Business Machines Corporation Automatically evaluating and ranking service level agreement violations
FR3002663B1 (fr) * 2013-02-22 2017-03-10 Bull Sas Surveillance distribuee de mesure de performance d'une architecture informatique
FR3043223A1 (fr) * 2015-11-02 2017-05-05 Bull Sas Mecanisme d'analyse de correlation lors de la degradation des performances d'une chaine applicative.

Also Published As

Publication number Publication date
FR3067480A1 (fr) 2018-12-14

Similar Documents

Publication Publication Date Title
CN111212038B (zh) 基于大数据人工智能的开放数据api网关系统
EP3767467A1 (fr) Procédé et dispositif de détermination d'une valeur d'indice de performance de prédiction d anomalies dans une infrastructure informatique à partir de valeurs d'indicateurs de performance
US8533536B2 (en) Monitoring data categorization and module-based health correlations
FR3098967A1 (fr) Procédé et dispositif de détermination d’une durée estimée avant un incident technique dans une infrastructure informatique à partir de valeurs d’indicateurs de performance
EP3163445B1 (fr) Mécanisme d'analyse de corrélation lors de la dégradation des performances d'une chaîne applicative
US20080270225A1 (en) Apparatus and Methods for Determining Availability and Performance of Entities Providing Services in a Distributed System Using Filtered Service Consumer Feedback
FR2909792A1 (fr) Systeme de maintenance centralisee d'equipements electroniques embarques
CN112788022B (zh) 流量异常检测方法、装置、存储介质及处理器
FR3061570A1 (fr) Mecanisme de surveillance et d'alertes des applications du systeme informatique
US11863395B2 (en) Techniques for correlating service events in computer network diagnostics
US10613525B1 (en) Automated health assessment and outage prediction system
EP3767468A1 (fr) Procédé et dispositif de détermination d'une valeur de risque d'incident technique dans une infrastructure informatique à partir de valeurs d'indicateurs de performance
US20200374179A1 (en) Techniques for correlating service events in computer network diagnostics
CN111209153A (zh) 异常检测处理方法、装置及电子设备
FR3067480B1 (fr) Procede et systeme de prediction de l'impact d'un dysfonctionnement ressource sur le niveau de service d'une chaine applicative
CN110413482B (zh) 检测方法和装置
EP3620928A1 (fr) Dispositif et procede d analyse du comportement d'une brique applicative soumise a une rarefaction des ressources
EP3380942B1 (fr) Procédé et système d'aide à la maintenance et à l'optimisation d'un supercalculateur
EP3617888B1 (fr) Dispositif et procede pour l'optimisation de l'utilisation dans le temps des ressources d'une infrastructure informatique
EP2993827A1 (fr) Sondes pour la surveillance de serveurs informatiques
EP3506094A1 (fr) Procédé et système pour l'optimisation de l'ordonnancement de traitements par lot
EP3767474B1 (fr) Procédé d'analyse de consommation de ressource d'une infrastructure informatique, alerte et dimensionnement
US7925748B2 (en) System and method for managing system resources in a network environment
Beckmann et al. Endpoint-performance-monitoring for a better end-user experience
EP3893470B1 (fr) Procédé d' optimisation de mise à jour d' objets connectés et module applicatif

Legal Events

Date Code Title Description
PLSC Publication of the preliminary search report

Effective date: 20181214

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5

PLFP Fee payment

Year of fee payment: 6

PLFP Fee payment

Year of fee payment: 7