FR3086306A1 - Procede de renouvellement d’infrastructure de distribution d’eau - Google Patents

Procede de renouvellement d’infrastructure de distribution d’eau Download PDF

Info

Publication number
FR3086306A1
FR3086306A1 FR1858520A FR1858520A FR3086306A1 FR 3086306 A1 FR3086306 A1 FR 3086306A1 FR 1858520 A FR1858520 A FR 1858520A FR 1858520 A FR1858520 A FR 1858520A FR 3086306 A1 FR3086306 A1 FR 3086306A1
Authority
FR
France
Prior art keywords
components
failure
data
physical
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR1858520A
Other languages
English (en)
Inventor
Ouael Silini
Jean-Francois Closet
Christian Laplaud
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ALTEREO INFORMATIQUE, FR
Original Assignee
G2c Informatique
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by G2c Informatique filed Critical G2c Informatique
Priority to FR1858520A priority Critical patent/FR3086306A1/fr
Publication of FR3086306A1 publication Critical patent/FR3086306A1/fr
Pending legal-status Critical Current

Links

Classifications

    • EFIXED CONSTRUCTIONS
    • E03WATER SUPPLY; SEWERAGE
    • E03BINSTALLATIONS OR METHODS FOR OBTAINING, COLLECTING, OR DISTRIBUTING WATER
    • E03B7/00Water main or service pipe systems
    • E03B7/003Arrangement for testing of watertightness of water supply conduits
    • EFIXED CONSTRUCTIONS
    • E03WATER SUPPLY; SEWERAGE
    • E03BINSTALLATIONS OR METHODS FOR OBTAINING, COLLECTING, OR DISTRIBUTING WATER
    • E03B1/00Methods or layout of installations for water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Hydrology & Water Resources (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

La présente invention concerne un procédé de planification du renouvellement des composants d'une infrastructure de réseau physique de fluide. L'infrastructure, de préférence une infrastructure de distribution d'eau potable, comprenant un ensemble de composants (canalisations 50, branchements 60 ou accessoires de robinetterie 40) comportant au moins un composant. Le procédé comprend des étapes de modélisation d'un risque de défaillance (130) à partir d'une exploration de données sur un ensemble de données physiques (102) correspondant à des paramètres physiques (101) dudit ensemble de composants pour constituer des regroupement (122) de composants similaires ou enrichir l'ensemble de données physiques à partir d'une base de données mutualisées d'ensemble de données physiques de plusieurs infrastructures de réseau de fluide, de hiérachisation dudit composant (140) de l'ensemble de composants en prenant en compte le risque de défaillance et la priorité au renouvellement et d'identification des composants (150) en fonction de leur classification.

Description

Domaine de l'invention
Le domaine de la présente invention concerne celui des procédés de planification du renouvellement des composants d'une infrastructure de réseau physique de fluide. Il concerne particulièrement, mais pas exclusivement, la planification du renouvellement des composants d'une infrastructure de réseau de distribution d'eau potable.
Art antérieur
La desserte des populations en eau potable a été amorcée en France à la fin du XIXème siècle, et c'est de 1960 à 1980 que le déploiement des infrastructures a connu un pic d'activités. Aujourd'hui, le linéaire de canalisations est estimé à près de 900 000 kilomètres dont la valeur est estimée à 100 milliards d'euros.
Chaque année, près de 6 milliards de mètre cube d'eau sont prélevés par les collectivités pour être distribués aux usagers des services d'eau et satisfaire leurs besoins. Ces besoins s'élèvent à 4,5 milliards de mètres cube. Si une partie de l'écart entre les volumes prélevés et les volumes utilisés est nécessaire au fonctionnement des installations, c'est tout de même près d'un milliard de mètre cube qui sont perdus lors de la distribution.
Ces pertes sont liées aux fuites qui proviennent principalement des défauts d'étanchéité et casses des canalisations, des branchements et de leurs accessoires de robinetterie : un patrimoine souvent oublié qui est à l'origine de la grande majorité du nombre de fuites.
Selon certaines sources, le taux de renouvellement annuel des canalisations serait seulement de 0,6 %., ce qui correspondrait à une espérance de vie moyenne d'un peu plus de 165 ans.
Cette insuffisance de moyens consacrés au renouvellement d'un patrimoine dont la durée de vie n'est pas infinie suscite des craintes.
L'identification des infrastructures distribution d'eau potable à renouveler est donc une problématique grandissante.
Ainsi, il convient d'allouer des moyens qu'ils soient matériels, humains, financiers, ou informationnels aux actions les plus rentables en termes de réduction du risque encouru par l'infrastructure à ne pas assurer son niveau de service.
Cette approche suppose une maîtrise des composantes du risque, et en ce qui concerne les infrastructures de réseaux physiques de fluide, la prédiction de l'aléa de défaillance, comme la probabilité de casse par exemple, et des conséquences potentielles en cas d'occurrence, ainsi qu'une formalisation pertinente de leur croisement, par exemple, avec une grille de criticité.
Les actions qui découlent d'une telle approche accroissent la performance des infrastructures, vue ainsi comme la capacité de cette dernière à éviter le risque.
De nombreux outils existent pour mettre en œuvre une telle démarche. Toutefois, la plupart de ces outils intégrant un modèle risque intègre également un modèle de défaillance. Ces modèles de défaillance sont en général basés sur une approche paramétrique ou semi-paramétrique des défaillances.
Ces modèles paramétriques ou semi-paramétriques nécessitent d'imposer des contraintes sur les distributions sous-jacentes de défaillances. Ces modèles nécessitent un calage qui consiste à trouver le meilleur ensemble de valeurs des paramètres du modèle en définissant un « score », qui mesure à quel point un certain ensemble de valeurs des paramètres correspond le mieux aux données observées qu'un autre, communément appelé le maximum de vraisemblance.
Ce calage nécessite des données d'observation de défaillance qui sont collectées manuellement par les exploitants des infrastructures de distribution d'eau potable et sont saisis dans des systèmes d'information Géographique, soit SIG, et/ou des outils de Gestion de Maintenance Assistée par Ordinateur, soit GMAO, pour les défaillances.
Parmi les défauts et limites identifiés dans les outils existants, il peut être cité l'absence de procédé de sélection de covariables dans l'étape de modélisation des défaillances. Les modèles paramétriques et semi-paramétriques utilisés dans les outils existants sont très sensibles à l'augmentation de la dimension des covariables. En effet l'augmentation de cette dimension à tendance à rendre les données plus éparses et les méthodes statistiques classiques nécessitant le principe de significativité statistique sont fortement impactées par le manque de densité des données dans l'espace de ces covariables. C'est pourquoi, la sélection de covariables pour la réduction de dimension s'avère nécessaire.
L'absence de procédé d'analyse des défaillances de tous les composants du réseau peut être également mentionné. Les outils existants sont focalisés sur les canalisations, alors que d'autres composants comme les branchements ont des taux de défaillances supérieurs ou égaux à ceux des canalisations.
L'impossibilité de mise en œuvre d'outils existants lorsque les bases de données d'observation de défaillances sont de trop faible profondeur d'observation fait également partie de ces limites. Les procédés existants ne permettent pas de caler des modèles de défaillance sur des infrastructures de distribution d'eau potable pour lesquelles les données de défaillances n'ont pas été enregistrées sur une fenêtre temporelle d'observation qui ne permettent de calage des modèles paramétriques ou semi-paramétriques ceux-ci étant impactées par le manque de données qui violent le principe de significativité statistique.
Comme autres défauts et limites identifiés dans les outils existants ont peu également cité :
• L'absence de procédé de préparation de données préalable à l'étape de modélisation des défaillances ; et/ou, • L'absence de procédé de traitement des anomalies dans l'étape de modélisation des défaillances.
La préparation des données préalable à la mise en œuvre des outils existants peu représenter jusqu'à 80 % du temps total. Cette préparation des données permet à partir des données brutes de les découvrir, structurer, nettoyer, enrichir, valider et publier dans un format adapté à leur analyse avec les outils existants. C'est donc un travail fastidieux que doit réaliser l'opérateur des outils existants avant tout analyse.
Une anomalie est une observation qui s'écarte sensiblement des autres observations de l'échantillon de données utilisée pour le calage du modèle de défaillance. Ces anomalies peuvent :
• Résulter d'un mauvais codage des données, par exemple, erreur d'affectation de la défaillance au composant ;
• Être dues à la gestion de l'exploitant, par exemple, les défaillances ne sont reportées que lorsque qu'il y a des opérations de recherches actives des fuites, la datation des défaillances est donc faussée s'il n'y a pas de recherches actives de fuite en continu ;
• Résulter d'un évènement particulier, par exemple, froid extrême qui engendre des casses sur les réseaux sensibles au gel des sols ; et/ou, • Exprimer des variations aléatoires des défaillances.
Le non traitement de ces anomalies impacte le processus de calage et la pertinence du modèle obtenu :
• Non convergence des procédures de calage des modèles de défaillances ; et/ou, • Biais non maîtrisés introduits dans le modèle quand la convergence est possible qui conduit à un modèle erroné.
C'est pourquoi il existe un besoin pour de nouveaux procédés intelligents pour la classification des composants d'une infrastructure de réseau physique de fluide candidats au renouvellement s'affranchissant de ces défauts et limites.
Exposé de l'invention
La présente invention a pour but de résoudre tout ou partie des inconvénients mentionnés ci-dessus sous la forme d'un procédé de planification du renouvellement des composants d'une infrastructure de réseau physique de fluide ; cette infrastructure, de préférence une infrastructure de distribution d'eau, comprenant un ensemble de composants comportant au moins un composant parmi une canalisation de distribution, un branchement et accessoire de robinetterie comme une vanne; le procédé comprenant des étapes suivantes :
- modélisation d'un risque de défaillance à partir d'une exploration de données sur un ensemble de données physiques correspondant à des paramètres physiques dudit ensemble de composants ;
- hiérarchisation des composants de l'ensemble de composants en prenant en compte le risque de défaillance et la priorité au renouvellement;
- identification des composants candidats au renouvellement en ensemble cohérent sur la base de la hiérarchisation.
Selon une disposition, le procédé de planification du renouvellement des composants d'une infrastructure de réseau physique de fluide permet également de détecter des anomalies de données résultant d'un mauvais codage des données qui serait dû à une erreur d'affectation des défaillances à des composants ou de duplication d'enregistrement de défaillances, comme une même défaillance a été enregistrée plusieurs fois.
Un autre avantage de cette disposition est de détecter des anomalies qui reflètent les modalités de gestion de l'exploitant plus que le phénomène de défaillance. Ce type d'anomalies est particulièrement prégnant quand l'exploitant ne fait pas de recherche active de fuites en permanence mais réalise des opérations ponctuelles, la datation des défaillances est donc faussée car la date de défaillance enregistrée n'est représentative que de la date de l'opération ponctuelle de recherche de fuites qui peut être réalisée de nombreux jours après l'apparition des fuites
Selon un mode de réalisation, l'étape de modélisation d'un risque de défaillance est réalisé par la méthode Random Survival Forest.
Selon un mode de réalisation, le procédé de planification du renouvellement des composants d'une infrastructure de réseau physique de fluide comprend une étape préliminaire de préparation de données pour traiter les paramètres physiques et/ou de données physiques dudit ensemble de composants en vue de leur intégration dans une base de données.
Selon un mode de réalisation, le procédé de planification comprend une étape de correction des paramètres physiques et/ou de données physiques.
Selon un mode de réalisation, le procédé de planification du renouvellement des composants d'une infrastructure de réseau physique de fluide dans lequel l'étape préliminaire de préparation de données comprend des étapes de structuration, de nettoyage, et d'enrichissement.
Selon un mode de réalisation, l'étape de modélisation d'un risque de défaillance comprend une étape de réduction de paramètres physiques et/ou de données physiques de sorte à améliorer l'évaluation d'un risque de défaillance et/ou le modèle de défaillance.
Selon un mode de réalisation, l'étape de modélisation d'un risque de défaillance comprend une étape de d'entrainement et validation du modèle.
Selon un mode de réalisation, l'étape de modélisation d'un risque de défaillance comprend une étape d'archivage du modèle de défaillance.
Selon un mode de réalisation, l'étape d'élaboration de la modélisation d'un risque de défaillance comprend une estimation d'une apparition d'un risque de défaillance pour chaque composant.
Selon un mode de réalisation, l'étape de hiérarchisation des compsants comprend une étape de constitution de paramètres physiques et/ou de données physiques homogènes.
Selon un mode de réalisation, l'étape de hiérarchisation dudit tronçon comprend une étape d'analyse multicritère avec pondération des paramètres physiques et/ou de données physiques.
Selon un mode de réalisation, le procédé de planification comprend une étape de regroupement des ensemble de données de sorte à former des ensembles de données physiques de composants similaires préalablement à la modélisation du risque de défaillance et/ou à détecter des anomalies.
Selon un mode de réalisation, le procédé de planification comprend une étape de regroupement comprend une étape de vérification de la similarité entre les ensembles de composants.
Selon un mode de réalisation, l'étape de regroupement comprend une étape d'enrichissement de l'ensemble de données physiques d'une infrastructure de réseau de fluide avec un autre ensemble de données mutualisant les données physiques de plusieurs infrastructures de réseau de fluide.
D'autres caractéristiques et avantages de l'invention apparaîtront mieux à la lecture de la description qui suit d'un mode de réalisation de l'invention donné à titre d'exemple non limitatif.
Liste des figures
L'invention sera mieux comprise à l'aide de la description détaillée qui est exposée ci-dessous en regard du dessin, dans lesquels :
la figure 1 représente un exemple d'infrastructure de distribution d'eau potable ;
la figure 2 montre un exemple de constitution de données ;
la figure 3 illustre un exemple du procédé de planification du renouvellement des composants d'une infrastructure de réseau physique de fluide selon un mode de réalisation ;
la figure 4 expose un exemple d'aire sous la courbe pour qui est l'un des indicateurs permettant la validation d'un modèle de défaillance selon un mode de réalisation ;
la figure 5 représente un exemple de comparaison des analyses multicritères que le procédé de planification du renouvellement des composants d'une infrastructure de réseau physique de fluide met en oeuvre;
la figure 6 présente un exemple d'efficacité attendue des variantes.
Dans la description détaillée qui va suivre des figures définies ci-dessus, les mêmes éléments ou les éléments remplissant des fonctions identiques pourront conserver les mêmes références de manière à simplifier la compréhension de l'invention.
La figure 1 représente une infrastructure de distribution d'eau potable 1 pouvant, par exemple, inclure une pompe immergée 10 dans une nappe d'eau souterraine. Cette pompe immergée refoule de l'eau pour remplir un réservoir sur tour 30 via une conduite d'adduction 20. L'infrastructure de distribution d'eau potable 1, représentée sur la figure 1, est configurée pour délivrer de l'eau à des usagers domestiques 70 ou des usagers industriel 80 au travers d'un réseau de canalisations de distribution 50 et de branchements 60. Additionnellement, l'infrastructure de distribution d'eau potable peut être équipé d'accessoires de robinetterie pouvant être des vannes 40 et des poteaux d'incendie 90.
La présente invention a trait à un procédé de planification du renouvellement des composants d'une infrastructure de réseau physique de fluide pour obtenir un ensemble d'actions de renouvellement à entreprendre en fonction de l'ensemble des données relatives à l'infrastructure de réseau physique, de son environnement, de ses défaillances ou de défaillances sur des infrastructures de même type, des données propres à l'exploitation, à la maintenance et aux travaux de renouvellement de l'infrastructure.
Le procédé de planification du renouvellement de la présente invention comporte plusieurs étapes comme illustrées sur la figure 3 :
- préparation de données 110 ;
- correction et stockage de données 120 ;
- regroupement des données 122 ;
- modélisation du risque de défaillance 130 des composants du réseau ;
- hiérarchisation dudit tronçon 140 de l'ensemble de tronçons 90 par risques de défaillance ; et,
- identification du tronçon 150 avec risque de défaillance le plus élevé.
Lors de l'étape de préparation 110 de l'ensemble de données physiques 102 correspondant à des paramètres physiques 101 dudit ensemble de tronçons 90. Ces paramètres physiques 101 sont relatifs aux composants, aux infrastructures de réseau, à leur environnement et à leurs défaillances et sont traitées en vue de leur intégration dans une base de donnée. Un exemple de ces paramètres physiques est représenté dans le tableau 1.
Comme le montre la figure 3, l'étape de préparation des ensembles de données 110 peut inclure 2 étapes :
- la collection de l'ensemble de données 111 : et,
- le nettoyage de l'ensemble de données 112.
Les paramètres physiques 101 sont collectés, lors de l'étape de collection de l'ensemble de données 111, en tant qu'entrée du procédé et incluent l'ensemble de données physiques 102 des composants de l'infrastructure de réseau physique, par exemple pour les canalisations de distribution 50 de l'infrastructure de réseau de distribution d'eau potable 1, comme cela est représenté dans le tableau 1.
Cet ensemble de données physiques 102 sont des données pouvant provenir d'un Système d'information Géographique SIG décrivant la structure et les caractéristiques de l'infrastructure de réseau physique de fluide et d'un système de Gestion de Maintenance Assistée par Ordinateur GMAO décrivant les défaillances des composants de l'infrastructure de réseau physique de fluide. Toutes les autres caractéristiques de la géographie et de l'ingénierie de l'infrastructure de réseau physique de fluide peuvent également être utilisées aussi bien que tout autre donnée sur lesquelles l'homme du métier peut s'appuyer.
L'ensemble de données physiques 102 collectées font ensuite l'objet d'une structuration, d'un nettoyage, d'un enrichissement et d'une validation avant leur publication dans un format adapté à la poursuite du procédé : c'est l'étape de nettoyage 112.
L'étape de nettoyage 112 de l'ensemble de données physiques 102 permet d'historiser les opérations de structuration, de nettoyage et d'enrichissement pour revenir à un état antérieur ou créer des scénarii de préparation d'ensemble de données 110 à appliquer à posteriori à d'autres ensemble de données physiques 102 du même type. Cette étape de nettoyage 112 peut toutefois être optionnelle selon les modes de réalisation.
Afin de créer et de mettre à jour la base de données propre à une infrastructure de réseau physique de fluide ou pour constituer, mettre à jour et enrichir une base de données mutualisant les données de plusieurs infrastructures de réseau physique de fluide, ces données sont corrigées avant leur stockage 120. Cette étape de stockage de l'ensemble de données 120 est assurée via une base de données gérant les données propres à une seule infrastructure de réseau physique et les données mutualisées de plusieurs infrastructures de réseau physique.
Une étape de regroupement 122 des ensemble de données 112, vise à constituer des ensembles de données physiques 102 de composants similaires préalablement à la modélisation du risque de défaillance 130 et/ou à détecter des anomalies. Une analyse du regroupement des ensembles de données physiques 102 assure le regroupement des composants en groupe aussi appelé clusters. Chaque groupe possède au final une forte similarité intra-groupe et une faible similarité intergroupe.
Selon un autre mode de réalisation, lors de l'étape de regroupement 122, les ensembles de données physiques 102 de composants sont injectés dans les jeux de l'ensemble de données issues de l'analyse de groupement d'une base mutualisée de données physiques de plusieurs infrastructures de réseau de fluide.
Si à l'issue de ce groupement, aucune similarité n'est détectée, aucun ensemble de données de la base de données mutualisées ne vient enrichir les données de (infrastructure physique de réseau, et, le cas échéant, un jeu de données enrichies est créé.
Cette constitution d'ensemble de données homogènes favorise la modélisation du risque de défaillance 130 d'un composant de (ensemble de composants comprenant des canalisations 50, des branchements 60 ou des accessoires de robinetterie 40. En effet, la modélisation du risque de défaillance 130 des composants du réseau permet de construire des modèles prédictifs du risque de défaillances des composants à partir d'ensemble de données physiques 102 d'une ou plusieurs infrastructures de réseau physique de fluide.
En ce qui concerne la modélisation du risque de défaillance des composants 130, les paramètres physiques 101 corrigés sont regroupés pour constituer des ensembles de données physiques 102 homogènes.
La modélisation du risque de défaillance 130 comprend 4 étapes comme illustré sur la figure 3:
réduction du nombre de covariables 131 ;
- création des échantillons de données d'entrainement et de validation du modèle 132 ;
- entrainement et validation du modèle 133 ; et,
- archivage du modèle 134.
La réduction de covariables 131 est essentielle à la modélisation des défaillances. Dans la pratique, de nombreuses covariables sont souvent disponibles en tant que facteurs de risque potentiels de défaillance.
Au stade initial de la modélisation, il est commun de voir l'introduction d'un grand nombre de prédicteurs dans l'espoir d'améliorer la précision du modèle. Cependant, pour améliorer la prévisibilité et l'interprétation du modèle, un modèle parcimonieux est souhaitable. Ainsi, la réduction du nombre de covariables 131 joue un rôle non-négligeable dans la construction de modèles de défaillance.
Les méthodes de réduction sont de type Univariée ou Multivariée. Comme exemple de méthode de sélection multivariée, il peut être cité l'analyse de données en clusters, l'arbre de décision et l'analyse en composantes principales.
Dans un mode de réalisation de l'invention, la réduction du nombre de covariables sur un jeu de données sélectionnés est réalisée en mettant en œuvre dans un premier temps la méthode de sélection univariée qui élimine les covariables les moins significatives en entraînant le modèle covariable par covariable et en éliminant les covariables pour lesquelles l'indicateur Aire sous la Courbe en anglais « Area Under the Curve » (proposé dans Time-dependent ROC curves for censored survival data and a dinostic marker, PJ HEAGERTYet al, juin 2002) est inférieur à un seuil fixé à 0,7, puis à partir du jeu de covariables retenues, la sélection des covariables pertinentes est réalisée en mettant en œuvre la méthode suivante : entrainement du modèle avec l'ensemble des covariables retenues, puis élimination de la liste des covariables retenues la covariable la moins significative pour un seuil d'erreur de première espèce fixé à 0,35.
Lors d'une étape de création des échantillons 132 de données d'entrainement et de validation du modèle, que ce soit pour des modèles paramétriques, semi-paramétriques ou non paramétriques, il est nécessaire de constituer 2 sous-ensembles des données le premier pour caler les modèles paramétriques ou semi-paramétriques ou entraîner les modèles non-paramétriques, le second pour valider la performance du modèle obtenu.
Quant à l'étape d'entrainement et validation du modèle 133, l'objectif est d'obtenir à l'issue de cette étape un modèle permettant de prédire le risque de défaillance des composants de l'infrastructure de réseau physique. Pour obtenir ce modèle final, il est nécessaire de réaliser un calage pour les modèles paramétriques ou semi-paramétriques et un entrainement pour les modèles non paramétriques sur l'échantillon de données. Le calage des modèles paramétriques ou semiparamétriques peut être réalisé par la méthode du maximum de vraisemblance.
L'entrainement des modèles non-paramétriques est réalisé par méthode supervisée. Dans un mode de réalisation de l'invention, le modèle non paramétrique mis en œuvre est le modèle Random Survival Forest décrit dans « Random Survival Forest - Hemant Ishwaran, Udaya B. Kogalur, Eugene H. Blackstone and Michael S. Lauer - 2008 ». Pour la validation des modèles, c'est la méthode proposée par Y Le Gat Evaluation de la performance d'un modèle de prévision des casses en réseau d'eau potable - Mémoire de DEA-2002 qui est mise en œuvre. Elle consiste à effectuer la validation en mesurant l'efficacité du modèle à identifier les composants les plus à risque, à partir de la proportion des défaillances qu'il permettrait d'éviter en retenant comme indicateur de sélection le taux de défaillance prédit par le modèle.
Les modèles construits sont archivés, lors d'une étape d'archivage 134, en conservant l'associant du jeu de données sur lequel ils ont été construits. Ils seront utilisés ultérieurement en prédiction pour la classification des composants candidats au renouvellement 140. Cette classification de composants candidats au renouvellement 140 comprend 3 étapes comme illustré sur la figure 3 :
- Choix du modèle de défaillance 410 ;
- Calcul du risque de défaillance 420 ; et,
- L'analyse multicritère 430.
Le modèle de défaillance à appliquer à l'infrastructure de réseau physique étudié est choisi, lors choix du modèle de défaillance 410, parmi les modèles archivés à l'étape d'archivage du modèle 134. Ainsi il est possible d'appliquer un modèle archivé construit à partir d'ensembles de données physiques 102 propres à une infrastructure de réseau physique de fluide ou à partir d'ensemble de données physiques 102 issu de données mutualisées de plusieurs infrastructures de réseau physique de fluide permettant ainsi de s'affranchir d'une éventuelle insuffisance des données de défaillance.
Le calcul du risque de défaillance 420 de chacun des composants de l'infrastructure de réseau physique de fluide faisant l'objet d'une hiérarchisation des composants candidats au renouvellement est effectué en calculant un indicateur de défaillance à partir du modèle choisi à l'étape précédente, soit lors du choix du modèle de défaillance 410. Dans un mode de réalisation de l'invention, cet indicateur du risque de défaillance est le nombre de casses prédit pour un horizon temporel donné.
Pour ce qui est de l'étape d'Analyse multicritère 430, celle-ci se décompose en 4 étapes ;
- Construction du cadre d'analyse multicritère 431 ;
- Calcul des critères pour chaque composant 432 ;
- Calcul du score pour chaque composant 433 ; et,
- Comparaison de différents cadre d'analyse multicritère 434.
L'analyse multicritère 430 est réalisée dans le but de classifier les composants candidats au renouvellement en prenant en compte plusieurs critères. Ces critères et les poids qui leur sont associés traduisent les préférences exprimées par le gestionnaire de l'infrastructure de réseau physique de fluide en ce qui concerne par exemple le risque de défaillance, la criticité du composant dans le réseau, le besoin en renforcement, le coût des réparations évitées, la réduction de pertes d'eau, le besoin de coordination avec d'autres travaux de voiries par exemple. Dans un mode de réalisation de l'invention, il est possible de constituer le cadre de l'analyse multicritère en construisant les critères à prendre en compte dans l'analyse, en définissant les poids de chacun des critères et en saisissant des données annexes permettant de calculer les critères si nécessaire, comme par exemple le coût unitaires de réparation des fuites pour calculer un indicateur de coût de réparations évitées par le renouvellement du composant défaillant.
En ce qui concerne l'étape de calcul des critères pour chaque composant 432, à l'occasion du calcul des critères, selon le cadre précédemment définit, une normalisation est réalisée suivant une fonction de transformation qui permet de contourner le problème d'incompatibilité d'unités de mesures des différents critères.
S'ensuit une étape de calcul du score final 433 par une méthode d'agrégation de type somme pondérée à la suite de laquelle les résultats sont sauvegardés.
Lors d'une étape de comparaison de différents cadre d'analyse multicritère 434, les résultats de plusieurs analyses multicritères sont comparés sur la base d'une sélection des n premiers composants triés sur la valeur de leur score calculé précédemment et représentant un certain pourcentage du nombre total de composants à renouveler. Dans un mode de réalisation de l'invention, cette comparaison s'appuie sur le choix du certain pourcentage du nombre total de composants à renouveler, sur la construction d'indicateurs à partir des critères retenus pour l'analyse multicritère, la performance de l'analyse multicritère est évaluée en calculant pour chaque indicateur retenu un bénéfice escompté qui se calcule comme étant la somme de la valeur de l'indicateur pour chacun des n premiers composants retenus représentant un certain pourcentage du nombre total de composants divisé par la somme de la valeur de l'indicateur pour tous les composants de l'infrastructure de réseau.
L'identification des composants 150 à renouveler est nécessaire pour construire des ensembles cohérents de composants à renouveler en termes d'organisation de chantier et d'enveloppe budgétaire.
Cette étape d'identification des composants 150 à renouveler se décompose 4 étapes :
- Création d'une base de données des coûts de renouvellement 151
- Création de sous-ensembles de composants candidats au renouvellement 152 :
- Création de chantiers de renouvellement 153 :
- Edition de fiches chantiers 154 :
Selon un mode de réalisation, il est possible de créer une base de prix unitaire de renouvellement 151 par type de composant.
Une création de 3 groupes des composants classifiés candidats au renouvellement 152 est réalisée sur la base de 3 enveloppes budgétaires. Le premier sous-ensemble est constitué en regroupant les n premiers composants candidats au renouvellement classifiés selon leur score multicritère dont le coût de renouvellement total est à peu près égal à la première enveloppe budgétaire. Il est fait de même pour les 2 autres sous-ensembles.
Lors de l'étape de création de chantiers de renouvellement 153 via une interface utilisateur dédiée, l'utilisateur sélectionne parmi ces 3 groupes les composants à renouveler pour constituer des chantiers cohérents au travers d'une vue tabulaire de ces composants ou d'une vue cartographique dans laquelle le groupe d'appartenance est identifié par un codage en couleur des composants.
Une fiche de synthèse comprenant un extrait cartographique du chantier et un tableau des caractéristiques et coûts du chantier est éditée lors d'une étape d'édition de fiches chantiers 154.
Dans l'exemple qui suit, le procédé de planification du renouvellement des composants d'une infrastructure de réseau physique de fluide sera illustré à l'aide d'un cas d'étude portant principalement sur des tronçons.
Par ailleurs, cet exemple peut être transposé à d'autres composants, comme un branchement, avec les paramètres suivants :
- Matériau : acier / fonte / PEHD / plomb / autre ;
- Diamètre ;
- Longueur;
- Date de pose ;
- Épaisseur de matériau ;
- Type de couverture : sous chaussée / sous trottoir / sous terrain naturel / autre ;
- Type de désinfectant : Chlore gazeux / Dioxyde de chlore / Ozone / autre ;
- Typologie de l'abonné : maison individuelle / immeuble / commerce / bureau / artisan / industriel / Hôpital / autre ;
- Pression de service ; et/ou,
- Présence de vanne de fermeture de branchement ;
ou une vanne, avec les paramètres suivants :
- Type : papillon / opercule / boisseau conique / boisseau sphérique / guillotine / soupape / autre ;
- Matériau;
- Diamètre nominal ;
- Date de pose ;
- Pression de service ;
- Type de raccordement : bride / soudé à emmanchement / soudé bout à bout / autre ;
- Actionnement de la vanne : manuel / motorisé ;
- État : ouvert / fermé ; et/ou,
- Lieu : chambre / en terre.
À titre d'exemple, un extrait de 18 composants de type canalisation 50 est illustré parmi un ensemble de 7 971 canalisations 50. Cet ensemble représente un linéaire total de 486 km pour lequel ont été enregistrées 225 défaillances sur une période de 32 années, allant du 1 Janvier 1969 au 31 décembre 2001. Le tableau cidessous illustre un exemple d'ensemble de données physiques 102 correspondant à des paramètres physiques 101 dont les abréviations représentent « ID » pour identifiant, « LONG. » pour longueur, « AN » pour année de pose, « 0 » pour diamètre, « MAT. » pour matériau, « PE. » pour polyéthylène, « Fgrise » pour fonte grise, « Fductile » pour fonte ductile, « AMC » pour amiante-ciment, «PVC» pour Polychlorure de vinyle, « EMP. » pour emplacement, « Schemin » pour sous chemin, « Schaussée » pour sous chaussée, «PRES.» pour pression et «ILP» pour indice linéaire de perte.
ID LONG. AN 0 MAT. EMP. PRES. ILP
28963 179,91 1996 63 PE Schemin 45,46 0,64
29968 | 17,51 1969 150 Fgrise Schaussée 67,52 4,08
ID LONG. AN 0 MAT. EMP. PRES. ILP
30050 2,75 1993 150 Fductile Schaussée 63,41 0
30861 | 63,86 1969 150 Fductile Schaussée 44,42 4,08
28981 i 45,14 1976 125 AMC Schaussée 61,46 2,46
29152 542,53 2001 63 PVC Schemin 79,27 2,46
30862 ) 3,64 1989 63 PE Schaussée 47,62 4,08
30863 60,66 1989 63 PE Schaussée 47,62 4,08
30864 \ 62,55 1969 150 Fductile Schaussée 48,97 4,08
30865 1,78 1989 63 PE Schaussée 50,39 4,08
30866 41,64 1989 63 PE Schaussée 48,94 4,08
60867 73,09 1989 63 PE Schaussée 55,37 4,08
30868 ) 87,60 1989 63 PE Schaussée 51,38 4,08
30051 852,97 2001 63 PE Schaussée 59,44 0
30869 . 63,01 1989 90 PE Schaussée 53,95 4,08
30870 1,16 1989 50 PE Schaussée 53,38 4,08
30871 i 2,12 1989 63 PE Schaussée 51,38 4,08
29153 2,78 2001 63 PVC Schemin 70,20 2,46
Tableau 1: Collection de données
Le tableau qui suit représente des enregistrements de défaillances des canalisations avec identification de type de fuite « id de fuite » en fonction des identifiants :
ID DATE DE FUITE ID DE FUITE
32957 26/05/2004 2488
31211 29/11/2007 2594
13126 30/05/2013 2646
31904 01/07/2000 2506
33654 21/08/2013 2677
30536 07/08/2013 2678
34870 13/08/2013 2679
31156 22/08/2013 2680
29679 28/09/2013 2681
31649 14/10/2013 2682
30926 22/11/2013 2683
33860 23/11/2013 2684
Tableau 2: Enregistrement des défaillances
Cet ensemble de données physiques 102 correspondant à des paramètres physiques 101 dudit ensemble de canalisations 50 est préparé de sorte à les intégrer dans une base de données lors de l'étape de préparation 110.
Cette étape de préparation des ensembles de données 110 collecte l'ensemble de données.
Afin de créer et de mettre à jour la base de données propre à une infrastructure de réseau physique de fluide ou pour constituer, mettre à jour et enrichir une base de données mutualisant les données de plusieurs infrastructures de réseau physique de fluide, ces données sont corrigées avant leur stockage 120.
L'ensemble de données est ensuite regroupé lors d'une étape de regroupement 122 pour constituer des ensembles de données physiques 102 de composants similaires préalablement à la modélisation du risque de défaillance 130 et/ou à détecter des anomalies.
Cette constitution d'ensemble de données homogènes favorise l'évaluation d'un risque de défaillance 130 d'une canalisation de l'ensemble de canalisations 50.
Le traitement de ces anomalies est nécessaire pour que l'étape de construction du modèle de défaillance 130 conduise à un modèle qui exprime les variations aléatoires des défaillances et ne soit pas biaisés par des erreurs de codages ou des pratiques d'enregistrement des défaillances de l'exploitant par exemple.
Les groupes et/ou les anomalies sont détectées par l'intermédiaire d'une étude statistique sur le nombre d'objets contenus dans un groupe par rapport au nombre total :
- un pourcentage d'éléments dans un groupe est inférieur à 0.5% du nombre total, les éléments de ce groupe sont considérés comme des anomalies ;
- des groupes se distinguent avec des pourcentages supérieurs à 40 % du nombre total. Chacun des groupes constitue un jeu de données indépendant ; et,
- un groupe, au-dessus de 75% du nombre total, génère la création d'un seul jeu de données.
L'analyse de groupement est effectuée sur l'échantillon en gardant uniquement les covariables suivantes :
- longueur;
- date de pose ;
- âge ;
- matériau;
- nombre de défaillances.
L'identifiant est gardé dans le but de retrouver la correspondance groupe/données brutes.
Cette analyse est réalisée par un algorithme de groupement de type BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies, Zhang, T.; Ramakrishnan, R.; Livny, M. -1996 ). Les groupes de composants ainsi obtenues soit pour une infrastructure de réseau physique de fluide ou pour l'ensemble de données issues d'une base de données mutualisant les données de plusieurs infrastructures de réseau physique de fluide constituent des données sur lesquels la modélisation du risque de défaillance est réalisée par la suite.
L'algorithme BRICH utilisé pour le regroupement classé et la détection d'anomalie est de type non supervisé. Le nombre de regroupements aussi appellés clusters en sortie est égale au nombre de covariables. En sortie, une valeur entier, c'est-à-dire appartenant au groupe des entier naturels H, par tronçon est récupérée. Cette valeur entier représente le groupe auquel appartient le tronçon et correspond à la colonne « BRICH » dans le tableau suivant :
ID LONG. AN. DE POSE AGE NB DE DEFAIL. MAT. BRICH
28963 179,91 38 20 0 6 3
29968 | 17,51 11 31 1 2 0
30050 2,75 35 23 0 3 0
30861 63,86 11 47 0 3 0
28981 45,14 18 40 0 0 0
29152 542,53 43 15 0 7 2
AN. DE NB DE
ID LONG. AGE MAT. BRICH
POSE DEFAIL
30862 : 3,64 31 27 0 6 0
30863 60,66 31 27 0 6 0
30864 i 62,55 11 47 0 3 0
30865 1,78 31 27 0 6 0
30866 < 41,64 31 27 0 6 0
60867 73,09 31 27 0 6 0
30868 : 87,60 31 27 0 6 0
30051 852,97 43 15 0 6 4
30869 63,01 31 27 0 6 0
30870 1,16 31 27 0 6 0
30871 i 2,12 31 27 0 6 0
Tableau 3: Analyse de données utilisant BRICH
Une analyse statistique sur le nombre de canalisations par groupe et le pourcentage correspondant est effectué.
GROUPE NB. DE TRONÇON POU RC. DU NB TOTAL
0 ! 7168 88.93
1 11 0.14
2 i 184 2.24
3 652 8.09
Tableau 4: Analyse statistique sur le nombre de tronçon
L'analyse permet de définir deux actions :
- Le groupe 1 représente 0.14 % de l'échantillon total, soit une valeur inférieure à 0.5 %. Ces canalisations 50 seront considérés comme des anomalies et seront éliminés du jeu de l'ensemble de données;
- Le groupe 0 représente 89 % de l'échantillon total et dépassent nettement les autres sous-groupes. Une fois les anomalies éliminées, l'ensemble des données restantes constitue le jeu de données.
L'étape de Modélisation du risque de défaillance 130 est réalisée sur les jeux de données issues de l'étape de regroupement des données 122.
S'agissant des défaillances que subissent les composants de l'infrastructure de réseau physique de fluide, il est à noter que les principales caractéristiques de ces données est que l'évènement défaillance que l'on cherche à modéliser peut ne pas apparaître pour certains composants parce que sa durée de non défaillance ou durée de vie est supérieure à la fenêtre d'observation de la série de données, on parle ainsi de données censurées à droite, ou parce que les composants entrent dans la fenêtre d'observation à des âges différents et d'autres ont pu être mis hors service avant le début de la fenêtre d'observation, on parle alors de données tronquées à gauche.
Pour l'analyse de ce type de données les méthodes statistiques classiques sont inopérantes et c'est une approche dite d'analyse de survie sur les évènements récurrents que sont les défaillances des composants qui est réalisée, comme cela est réalisé sur la figure 2.
Plusieurs modèles paramétriques ou semi-paramétriques peuvent être mis en œuvre tel que COXPH ou Linear Extended Yule Process LEYP pour ce type d'analyse. Une alternative qui évite d'imposer des contraintes paramétriques sur les distributions sous-jacentes de défaillances est d'avoir recours à des modèles nonparamétriques de type « apprentissage automatique » qui fournissent un moyen de traiter automatiquement les interactions de haut niveau et les termes d'ordre supérieur dans les covariables et permettent une prédiction précise.
Dans un mode de réalisation de l'invention, le modèle de défaillance est de type forêt aléatoire adaptée à l'analyse de survie Random Forest Survival dont la nature non paramétrique n'exige aucune hypothèse de distribution entre covariables et covariables expliquées. Ce modèle est décrit dans « Random Survival Forest Hemant Ishwaran, Udaya B. Kogalur, Eugene H. Blackstone and Michael S. Lauer 2008 ». Il permet de bénéficier de la robustesse des méthodes de forêts aléatoires, de leur précision et de leur capacité à découvrir des interrelations très complexes entre les covariables y compris pour des jeux de données de grande taille.
L'évaluation d'un risque de défaillance 230 comprend 4 étapes comme mentionné précédemment, dont une étape de réduction de covariables 131, de type
Univariée ou Multivariée, qui joue un rôle non-négligeable dans la construction de modèles de défaillance.
Dans cet exemple, la réduction du nombre de covariables sur un jeu de données sélectionnés est réalisée automatiquement en mettant en œuvre dans un premier temps la méthode de sélection univariée qui élimine les covariables les moins significatives en entraînant le modèle covariable par covariable et en éliminant les covariables pour lesquelles l'indicateur «Aire sous la Courbe AUC» (proposé dans Time-dependent ROC curves for censored survival data and a dinostic marker, PJ HEAGERTYet al, juin 2002) est inférieur à un seuil fixé à 0,7, puis à partir du jeu de covariables retenues la sélection des covariables pertinentes est réalisée en mettant en œuvre la méthode suivante : entrainement du modèle avec l'ensemble des covariables retenues, puis élimination de la liste des covariables retenues la covariables la moins significatives pour un seuil d'erreur de première espèce fixé à 0,35.
Lors de l'étape de création des échantillons 132 de données d'entrainement et de validation du modèle, que ce soit pour des modèles paramétriques, semi-paramétriques ou non paramétriques, il est nécessaire de constituer 2 sous-ensembles des données le premier pour caler les modèles paramétriques ou semi-paramétriques ou entraîner les modèles non-paramétriques, le second pour valider la qualité du modèle obtenu.
Quant à l'étape d'entrainement et validation du modèle 133, l'objectif est d'obtenir à l'issue de cette étape un modèle permettant de prédire le risque de défaillance des composants de l'infrastructure de réseau physique. Pour obtenir ce modèle final, il est nécessaire de réaliser un calage pour les modèles paramétriques ou semi-paramétriques et un entrainement pour les modèles non paramétriques sur l'échantillon de données. Le calage des modèles paramétriques ou semiparamétriques peut être réalisé par la méthode du maximum de vraisemblance.
Dans le mode de réalisation où le modèle de défaillance ets de type Random Survival Forest, I
Pour la validation des modèles, c'est la méthode proposée par Y Le Gat Evaluation de la performance d'un modèle de prévision des casses en réseau d'eau potable - Mémoire de DEA-2002 qui est mise en œuvre. Elle consiste à effectuer la validation en mesurant l'efficacité du modèle à identifier les composants les plus à risque, à partir de la proportion des défaillances qu'il permettrait d'éviter en retenant comme indicateur de sélection le taux de défaillances prédit par le modèle.
Les modèles construits sont archivés, lors d'une étape d'archivage 134, et seront utilisés ultérieurement en prédiction pour la hiérarchisation des composants candidats au renouvellement 140.
Le modèle, de notre exemple, est construit sur la période totale des enregistrements, soit à partir du 1 Janvier 1998 au 25 Janvier 2016. La période de calage commence le 1 Janvier 1998 et fini le 17 Janvier 2012. La validation est effectuée sur à partir du 17 Janvier 2012 au 25 Janvier 2016. La méthode de sélection univariée a permis de garder uniquement les covariables :
- Longueur;
- Année de pose ;
- ILP;
- Pression.
Les autres covariables, ayant des valeurs AUC inférieur à 0.7, ne sont pas retenues. Le résultat est illustré dans le tableau ci-dessous :
COVARIABLES LONG. AN 0 EMP. ILP PRES.
AUC 0.994 0.793 .0647 .0494 0.783 0.979
Tableau 5: Covariables avec AUC
La convergence des modèles paramétriques, semi-paramétriques et nonparamétriques se base sur le test des p-valeurs. C'est la probabilité pour un modèle donné sous l'hypothèse nulle d'obtenir la même valeur ou une valeur encore plus extrême que celle observée. Cette valeur doit être inférieure à 0.3.
Les p-valeurs constituent un premier indicateur de la convergence du modèle et de l'importance des covariables sélectionnées dans les étapes précédentes.
La mesure de la performance prédictive du modèle se base sur la procédure de validation croisée décrite dans Y.Le Gat , Modélisation du risque de rupture en réseau de distribution d'eau potable - 2012. Cette méthode permet de tracer la courbe de performance prédictive du modèle représenté dans la figure 4.
La courbe des défaillances (casses) prédites évitées par le modèle est en trait semi continu et la courbe des défaillances observées évitées est en trait plein. La mesure de la performance prédictive du modèle est calculée à partir de l'Aire sous la Courbe (AUC) de la courbe des défaillances observées évitées. Cette valeur est comprise entre 0 et 1. Plus elle est proche de 1, meilleur est le modèle. Dans le cas illustré, cette valeur est de 0.963 dans notre cas.
Dans l'étape de hiérachisation 140, il s'agit tout d'abord de choisir un modèle de défaillance parmi les modèles associés aux données de l'infrastructure étudiée archivés à l'étape d'archivage du modèle 134. S'ensuit le calcul du risque de défaillance 420 de chacun des composants de l'infrastructure de réseau physique de fluide faisant l'objet d'une hiérarchisation des composants candidats au.
Dans notre exemple, l'indicateur AUC permet de choisir le meilleur modèle pour la prévision du nombre de défaillance. La valeur 0.963 est suffisante pour choisir ce modèle et appliqué la prévision sur la période du 17 Janvier 2012 au 17 Janvier 2020.
Un exemple du résultat de la prévision est illustré dans le tableau cidessous avec les abréviations représentant « ID » pour identifiant, « AN » pour année de pose, « LONG. » pour longueur » « 0 » pour diamètre, « MAT. » pour matériau, « PE. » pour polyéthylène, « Fgrise » pour fonte grise, « Fductile » pour fonte ductile, «AMC» pour amiante-ciment, «PVC» pour Polychlorure de vinyle, «EMP.» pour emplacement, « Schemin » pour sous chemin, « Schaussée » pour sous chaussée, « PRES. » pour pression et « ILP » pour indice linéaire de perte, « NB DE DEF. Nombre de déaillance, « TAUX DE DEF. » pour Taux de défaillance :
ID AN LONG. 0 MAT. EMP. PRES. ILP NB. DE DEF. TAUX DE DEF.
28963 1996 179,91 63 PE Schemin 45,46 0,64 0.00 0.00
29968 | 1969 17,51 150 Fgrise Schaussée 67,52 4,08 0.36 2.55
30050 1993 2,75 150 Fductile Schaussée 63,41 0 0.00 0.12
30861 1969 63,86 150 Fductile Schaussée 44,42 4,08 0.15 0.28
28981 1976 45,14 125 AMC Schaussée 61,46 2,46 0.04 0.10
29152 2001 542,53 63 PVC Schemin 79,27 2,46 0.03 0.01
ID AN LONG. 0 MAT. EMP. PRES. ILP NB. DE DEF. TAUX DE DEF.
30862 1989 3,64 63 PE Schaussée 47,62 4,08 0.00 0.08
30863 1989 60,66 63 PE Schaussée 47,62 4,08 0.00 0.01
30864 1969 62,55 150 Fductile Schaussée 48,97 4,08 0.15 0.30
30865 1989 1,78 63 PE Schaussée 50,39 4,08 0.00 0.19
30866 : 1989 41,64 63 PE Schaussée 48,94 4,08 0.03 0.10
Tableau 6: Résultat de la prévision
L'analyse multicritère est réalisée dans le but de classification des composants candidats au renouvellement en prenant en compte plusieurs critères comme par exemple :
- Le coût de réparation;
- La criticité hydraulique;
- La perturbation du trafic routier;
- Les pertes évitées;
- D'autres paramètres comme le taux de défaillance ou le nombre de défaillance.
La définition des critères est réalisée dans l'étape Construction du cadre de l'analyse multicritère 430.
En ce qui concerne l'étape de calcul des critères pour chaque composant 432, à l'occasion du calcul des critères, une normalisation est réalisée suivant une fonction de transformation pour les rendre comparables et ainsi contourner le problème d'incompatibilité d'unités de mesures des différents critères.
S'ensuit une étape de calcul du score final 433 par un méthode d'agrégation de type somme pondérée à la suite de laquelle les résultats sont sauvegardés.
Lors d'une étape de comparaison de différents cadre d'analyse multicritère 434, les résultats de plusieurs analyses multicritères sont comparés sur la base d'une sélection des n premiers composants triés sur la valeur de leur score calculé précédemment et représentant un certain pourcentage du nombre total de composants à renouveler.
Les critères créés, dans notre exemple, sont :
- Le poids relatif du coût annuel de réparation du tronçon par rapport à l'amortissement de son renouvellement CREP ;
- Le coût de réparation CRP ; et,
- Perturbation du trafic routier PT.
L'analyse multicritère est une pondération de ces critères. Un exemple de deux analyses multicritères et les poids attribués aux critères est illustré dans le tableau suivant :
ANALYSE
MULTICRITERE
PREMIERE
ANALYSE
DEUXIEME
ANALYSE
CRP CREP PT SOMME PONDERATION DES CRITERES
0.55 0.225 0.225 1
0.56 0.11 0.33 1
Tableau 7: Analyse multicritère
Les indicateurs de comparaison sont :
- coût de réparation;
- criticité hydraulique;
- perturbation du trafic routier;
- pertes évitées;
- autres paramètres comme taux de défaillance.
Le résultat de la comparaison est réalisé sur 1% du linéaire total. Il est représenté dans la figure 6.
Les tronçons sont ensuite classifiés. Cette classification, où également appelé hiérarchisation, des composants candidats au renouvellement 130 permet d'identifier les composants d'une infrastructure de réseau physique de fluide en prenant en compte le risque de défaillance et les préférences de l'exploitant en terme de priorité au renouvellement et donc d'identification.
Le score calculé par cette analyse est utilisé par la suite. Il permet de créer 4 classes de tronçons avec des valeurs de 1 jusqu'à 4, où 1 est la classe des 5 tronçons 90 critiques et prioritaires au renouvellement et 4 est la classe des tronçons 90 les moins prioritaires. Un exemple des résultats est illustré dans le tableau ci-dessous :
ID LONG. AN POSE 0 MAT. EMP. PRES. ILP PRIORITE
28963 179.91 1996 63 PE Schemin 45.46 0.646 4.0
29968 1 17.51 1969 150 FGrise Schaussée 67.52 4.087 4.0
30050 ’ 2.75 1993 150 Fductile Schaussée 63.41 0 4.0
30861 63.86 1969 150 Fductile Schaussée 44.42 4.087 4.0
28981 1 45.14 1976 125 AMC Schaussée 61.46 2.468 4.0
29152 542.53 2001 63 PVC Schemin 79.27 2.468 4.0
30862 3.64 1989 63 PE Schaussée 47.62 4.087 4.0
30863 60.66 1989 63 PE Schaussée 47.62 4.087 4.0
30864 s 62.55 1969 150 Fductile Schaussée 48.94 4.087 1.0
30865 i 1.78 1989 63 PE Schaussée 50.39 4.087 4.0
30866 41.67 1989 63 PE Schaussée 48.94 4.087 4.0
30867 73.09 1989 63 PE Schaussée 55.37 4.087 4.0
30868 1 87.60 1989 63 PE Schaussée 51.38 4.087 3.0
30051 852.97 2001 63 PE Schaussée 59.44 0 4.0
30869 1 63.01 1989 90 PE Schaussée 53.95 4.087 4.0
30870 1 1.16 1989 50 PE Schaussée 53.38 4.087 4.0
30871 2.12 1989 63 PE Schaussée 51.38 4.087 4.0
29153 2.78 2001 63 PVC Schemin 70.20 2.468 4.0
Tableau 8: Résultat de classification
Les résultats de la hiérarchisation découlant d'un cadre d'analyse multicritère sont visualisés au travers d'une interface utilisateur dédiée sous forme tabulaire ou sous forme cartographique si les données descriptives des composants possèdent une référence spatiale. Le résultat de l'analyse est sauvegardé en base de données avec son jeu de critères et de poids associés.
Ensuite, l'identification des composants à renouveler 150 est nécessaire pour construire des ensembles cohérents de composants à renouveler en termes d'organisation de chantier et d'enveloppe budgétaire.
Une base de prix unitaire de renouvellement 151 par type de composant est créée et une création de 3 groupes des composants classifiés candidats au renouvellement 152 est réalisée sur la base de 3 enveloppes budgétaires par exemple.
Lors de l'étape de création de chantiers de renouvellement 153, les composants à renouveler sont sélectionnés parmi ces 3 groupes les pour constituer des chantiers cohérents. Cette sélection s'effectue au travers d'une vue tabulaire de ces composants ou d'une vue cartographique dans laquelle le groupe d'appartenance est identifié par un codage en couleur des composants. Une fiche de synthèse, par la suite, comprenant un extrait cartographique du chantier et un tableau des caractéristiques et coûts du chantier sera éditée.
Selon un autre mode de réalisation, les ensembles de données d'une infrastructure de réseau physique de fluide sont injectés dans les jeux de l'ensemble de données issues de l'analyse de groupement d'une base mutualisée, puis une vérification de la similarité entre les composants s'effectue en recherchant par analyse de groupement la nouvelle classe résultante qui comportera le plus de données. Si à l'issue de ce groupement, les ensembles de données de l'infrastructure de réseau physique ne sont pas mélangées à celles du jeu de l'ensemble de données de la base de données mutualisées, ce procédé est réitéré avec un autre jeu de l'ensemble de données issues de la base de données mutualisées. Si aucune similarité n'est détectée, aucun ensemble de données de la base de données mutualisées ne vient enrichir les données de l'infrastructure physique de réseau, et, le cas échéant, un jeu de données enrichies est créé.
Ainsi, grâce à cette disposition, le procédé de planification du renouvellement des composants d'une infrastructure de réseau physique de fluide est applicable à une infrastructure de réseau physique de fluide pour laquelle les données de défaillances n'auraient pas été observées sur une période suffisamment longue pour fournir suffisamment d'information pour caler un modèle de défaillance en bénéficiant des données de défaillance d'une base de données mutualisées de plusieurs infrastructures de réseau de fluide.
Par ailleurs, l'un des avantages du procédé de planification du renouvellement des composants est la présence d'une étape de planification des chantiers de renouvellement des composants.
Cette étape de planification des chantiers de renouvellement des composants comprend une étape de création d'une base de données des coûts de renouvellement, via une interface utilisateur dédiée, permettant la création d'une base de prix unitaire de renouvellement par type de composant.
À cette étape de création d'une base de données des coûts s'ajoute une étape de création de sous-ensembles de composants candidats au renouvellement.
Par exemple, une première sélection en 3 groupes des composants hiérarchisés candidats au renouvellement est réalisée sur la base de 3 enveloppes 5 budgétaires. Le premier sous-ensemble est constitué en regroupant les n premiers composants candidats au renouvellement hiérarchisés selon leur score multicritère dont le coût de renouvellement total est à peu près égal à la première enveloppe budgétaire. Il en va de même pour les 2 autres sous-ensembles.
S'en suit une étape de création de chantiers de renouvellement, 10 également via une interface utilisateur dédiée, grâce à laquelle l'utilisateur sélectionne un des trois groupes, les composants à renouveler afin de constituer des chantier cohérent au travers d'une vue tabulaire de ces composants ou d'une vue cartographique dans laquelle le groupe d'appartenance est identifié par un codage en couleur des composants, par exemple.
Enfin, une étape d'édition de fiches chantiers édite une fiche de synthèse comprenant un extrait cartographique du chantier et un tableau des caractéristiques et coûts du chantier.

Claims (14)

  1. REVENDICATIONS
    1. Procédé de planification (100) du renouvellement des composants (90) d'une infrastructure de réseau physique de fluide; cette infrastructure, de préférence une infrastructure de distribution d'eau, comprenant un ensemble de composants (90) comportant au moins un composant parmi une canalisation (50) de distribution, un branchement (60) et accessoire de robinetterie (40) comme une vanne; le procédé de planification (100) comprenant des étapes suivantes :
    - modélisation d'un risque de défaillance (130) à partir d'une exploration de données sur un ensemble de données physiques (102) correspondant à des paramètres physiques (101) dudit ensemble de composants (90) ;
    - hiérarchisation des composants (140) de l'ensemble de composants (90) en prenant en compte le risque de défaillance et la priorité au renouvellement;
    - identification des composants (150) candidats au renouvellement en ensemble cohérent sur la base de la hiérarchisation.
  2. 2. Procédé de planification (100) selon la revendication 1, dans lequel l'étape modélisation d'un risque de défaillance (130) est réalisé par la méthode Random Survival Forest.
  3. 3. Procédé de planification (100) selon la revendication 1 ou 2, lequel comprend une étape préliminaire de préparation de données (110) pour traiter les paramètres physiques (101) et/ou de données physiques (102) dudit ensemble de composants (90) en vue de leur intégration dans une base de données.
  4. 4. Procédé selon la revendication 1 ou 2, lequel comprend une étape de correction des paramètres physiques (101) et/ou de données physiques (102).
  5. 5. Procédé de planification (100) selon la revendication précédente, dans lequel l'étape préliminaire de préparation de données (110) comprend des étapes de structuration, de nettoyage, et d'enrichissement.
  6. 6. Procédé de planification (100) selon l'une quelconque des revendications précédentes, dans lequel l'étape de modélisation d'un risque de défaillance (130) comprend une étape de réduction (131) de paramètres physiques (101) et/ou de données physiques (102) de sorte à améliorer l'évaluation d'un risque de défaillance (130) et/ou le modèle de défaillance.
  7. 7. Procédé de planification (100) selon l'une quelconque des revendications précédentes, dans lequel l'étape de modélisation d'un risque de défaillance (130) comprend une étape d'entrainement et validation du modèle (133).
  8. 8. Procédé de planification (100) selon l'une quelconque des revendications précédentes, dans lequel l'étape de modélisation d'un risque de défaillance (130) comprend une étape d'archivage (134) du modèle de défaillance.
  9. 9. Procédé de planification (100) selon l'une quelconque des revendications précédentes, dans lequel l'étape de hiérarchisation des composants (140) comprend une étape de constitution de paramètres physiques (101) et/ou de données physiques (102) homogènes.
  10. 10. Procédé de planification (100) selon l'une quelconque des revendications précédentes, dans lequel l'étape de hiérarchisation dudit tronçon comprend une étape d'analyse multicritère (430) avec pondération des paramètres physiques (101) et/ou de données physiques (102).
  11. 11. Procédé de planification (100) selon l'une quelconque des revendications précédentes, dans lequel l'étape d'élaboration de modélisation d'un risque de défaillance (130) comprend une estimation d'une apparition d'un risque de défaillance (130) pour chaque composant pour une durée donnée.
  12. 12. Procédé de planification (100) selon l'une quelconque des revendications précédentes, lequel comprend une étape de regroupement (122) des ensemble de données (112) de sorte à former des ensembles de données physiques (102) de composants similaires préalablement à la modélisation du risque de défaillance 130 et/ou à détecter des anomalies.
  13. 13. Procédé de planification (100) selon l'une quelconque des revendications précédentes, lequel comprend une étape de regroupement (122) comprend une étape de vérification de la similarité entre les ensembles de composants (90).
  14. 14. Procédé de planification (100) selon la revendication précédente, dans lequel l'étape de regroupement comprend une étape d'enrichissement de 5 l'ensemble de données physiques d'une infrastructure de réseau de fluide avec un autre ensemble de données mutualisant les données physiques de plusieurs infrastructures de réseau de fluide.
FR1858520A 2018-09-20 2018-09-20 Procede de renouvellement d’infrastructure de distribution d’eau Pending FR3086306A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1858520A FR3086306A1 (fr) 2018-09-20 2018-09-20 Procede de renouvellement d’infrastructure de distribution d’eau

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1858520 2018-09-20
FR1858520A FR3086306A1 (fr) 2018-09-20 2018-09-20 Procede de renouvellement d’infrastructure de distribution d’eau

Publications (1)

Publication Number Publication Date
FR3086306A1 true FR3086306A1 (fr) 2020-03-27

Family

ID=66166015

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1858520A Pending FR3086306A1 (fr) 2018-09-20 2018-09-20 Procede de renouvellement d’infrastructure de distribution d’eau

Country Status (1)

Country Link
FR (1) FR3086306A1 (fr)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6084500A (ja) * 1983-10-14 1985-05-13 Hitachi Ltd 推論処理方法
JPH03145582A (ja) * 1989-10-31 1991-06-20 Meidensha Corp 取水ポンプ及び配水池水位の制御装置
JP2009217718A (ja) * 2008-03-12 2009-09-24 Toshiba Corp 保守計画支援システム
CN104657911A (zh) * 2015-01-20 2015-05-27 中国石油天然气股份有限公司 一种天然气管道压缩机组维护方法及设备
US20170247863A1 (en) * 2014-10-29 2017-08-31 Nec Corporation Tap water management system, tap water management device, tap water management method, and tap water management program recording medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6084500A (ja) * 1983-10-14 1985-05-13 Hitachi Ltd 推論処理方法
JPH03145582A (ja) * 1989-10-31 1991-06-20 Meidensha Corp 取水ポンプ及び配水池水位の制御装置
JP2009217718A (ja) * 2008-03-12 2009-09-24 Toshiba Corp 保守計画支援システム
US20170247863A1 (en) * 2014-10-29 2017-08-31 Nec Corporation Tap water management system, tap water management device, tap water management method, and tap water management program recording medium
CN104657911A (zh) * 2015-01-20 2015-05-27 中国石油天然气股份有限公司 一种天然气管道压缩机组维护方法及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SADEGHZADEH KEIVAN ET AL: "Analytical clustering procedures in massive failure data", 2017 ANNUAL RELIABILITY AND MAINTAINABILITY SYMPOSIUM (RAMS), IEEE, 23 January 2017 (2017-01-23), pages 1 - 7, XP033081523, DOI: 10.1109/RAM.2017.7889727 *
ZHAOYANG TAN ET AL: "An evaluation of maintenance strategy using risk based inspection", SAFETY SCIENCE, ELSEVIER, AMSTERDAM, NL, vol. 49, no. 6, 31 January 2011 (2011-01-31), pages 852 - 860, XP028204632, ISSN: 0925-7535, [retrieved on 20110203], DOI: 10.1016/J.SSCI.2011.01.015 *

Similar Documents

Publication Publication Date Title
Fan et al. Machine learning based water pipe failure prediction: The effects of engineering, geology, climate and socio-economic factors
US8341106B1 (en) System and method for identifying related events in a resource network monitoring system
AU2019243836A1 (en) Predicting pipe failure
CN105678481A (zh) 一种基于随机森林模型的管线健康状态评估方法
FR2970542A1 (fr) Systeme et procede pour identifier des emplacements geographiques potentiels d&#39;anomalies dans un reseau de distribution d&#39;eau
EP3172548B1 (fr) Procédé pour détecter des anomalies dans un réseau de distribution, en particulier d&#39;eau potable
FR3047827A1 (fr) Procede et systeme de gestion de risques pour un systeme de transport terrestre
EP1281132A1 (fr) Procede de simulation stochastique centralisee
Zhu et al. A novel decision-making model for selecting a construction project delivery system
Taiwo et al. Toward Sustainable Water Infrastructure: The State‐Of‐The‐Art for Modeling the Failure Probability of Water Pipes
Chen et al. Quality control and bias adjustment of crowdsourced wind speed observations
WO2018193085A1 (fr) Système et procédé pour gérer la détection de fraudes dans un système de transactions financières
FR3035232A1 (fr) Systeme de surveillance de l&#39;etat de sante d&#39;un moteur et procede de configuration associe
Herraiz et al. Impact of installation counts on perceived quality: A case study on debian
Chik et al. Estimation of the short-term probability of failure in water mains
Vuillet et al. Decision-making method for assessing performance of large levee alignment
EP3172632B1 (fr) Procédé de détection d&#39;anomalies dans un réseau de distribution, en particulier distribution d&#39;eau
CN112231352B (zh) 一种多路阀失效数据管理及失效模式自动诊断系统
Guzmán-Fierro et al. Bayesian network-based methodology for selecting a cost-effective sewer asset management model
FR3086306A1 (fr) Procede de renouvellement d’infrastructure de distribution d’eau
CN117787693A (zh) 油气管道环焊缝失效风险因素排查方法及相关设备
FR3114648A1 (fr) Procédé de caractérisation de fuite
WO2007096525A1 (fr) Procede et systeme d&#39;identification et d&#39;evaluation de risque de defaillance d&#39;un systeme de confinement geologique
CN111144429A (zh) 对象分类方法及其系统、计算机系统及计算机可读介质
CN113869423A (zh) 一种营销响应模型构建方法、设备及介质

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20200327

CD Change of name or company name

Owner name: ALTEREO INFORMATIQUE, FR

Effective date: 20200629

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5

PLFP Fee payment

Year of fee payment: 6