ES2784233T3 - Procedimiento combinado para detectar anomalías en un sistema de distribución de agua - Google Patents
Procedimiento combinado para detectar anomalías en un sistema de distribución de agua Download PDFInfo
- Publication number
- ES2784233T3 ES2784233T3 ES15306546T ES15306546T ES2784233T3 ES 2784233 T3 ES2784233 T3 ES 2784233T3 ES 15306546 T ES15306546 T ES 15306546T ES 15306546 T ES15306546 T ES 15306546T ES 2784233 T3 ES2784233 T3 ES 2784233T3
- Authority
- ES
- Spain
- Prior art keywords
- values
- network
- variables
- control variables
- observations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 187
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 143
- 238000009826 distribution Methods 0.000 title claims abstract description 83
- 230000008859 change Effects 0.000 claims abstract description 25
- 230000002159 abnormal effect Effects 0.000 claims description 65
- 230000006870 function Effects 0.000 claims description 28
- 238000004422 calculation algorithm Methods 0.000 claims description 22
- 238000010801 machine learning Methods 0.000 claims description 21
- 238000007619 statistical method Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012876 topography Methods 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 description 48
- 238000012360 testing method Methods 0.000 description 23
- 239000013598 vector Substances 0.000 description 22
- 238000004364 calculation method Methods 0.000 description 10
- 230000006399 behavior Effects 0.000 description 9
- 230000007423 decrease Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 229910052801 chlorine Inorganic materials 0.000 description 7
- 239000000460 chlorine Substances 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 230000005856 abnormality Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 4
- 206010000117 Abnormal behaviour Diseases 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 238000012731 temporal analysis Methods 0.000 description 3
- 238000000700 time series analysis Methods 0.000 description 3
- 238000012897 Levenberg–Marquardt algorithm Methods 0.000 description 2
- 208000009989 Posterior Leukoencephalopathy Syndrome Diseases 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 239000003651 drinking water Substances 0.000 description 2
- 235000020188 drinking water Nutrition 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000000528 statistical test Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- KZBUYRJDOAKODT-UHFFFAOYSA-N Chlorine Chemical compound ClCl KZBUYRJDOAKODT-UHFFFAOYSA-N 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000005293 physical law Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012109 statistical procedure Methods 0.000 description 1
- 239000011232 storage material Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0259—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/041—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a variable is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/048—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B17/00—Systems involving the use of models or simulators of said systems
- G05B17/02—Systems involving the use of models or simulators of said systems electric
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0224—Process history based detection method, e.g. whereby history implies the availability of large amounts of data
- G05B23/024—Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/18—Water
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Automation & Control Theory (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Business, Economics & Management (AREA)
- Flow Control (AREA)
- Economics (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Fire-Extinguishing By Fire Departments, And Fire-Extinguishing Equipment And Control Thereof (AREA)
Abstract
Un procedimiento (400) para detectar anomalías en un sistema de distribución de agua compuesto por una red de nodos, comprendiendo dicho procedimiento: - parametrizar (220) un modelo hidráulico (211) del sistema de distribución de agua con un conjunto de valores (210) de variables de control que caracterizan la red y su salida en los nodos; - utilizar sensores en la red para adquirir (230) observaciones de un subconjunto de variables de estado en primeras referencias temporales; - identificar (410) al menos una entidad objetivo en la que cambiar los valores de las variables de control en función de al menos dichas observaciones; - cambiar (250) el conjunto de valores de las variables de control utilizando un ajuste paso a paso de las variables de control y un criterio de interrupción en función de valores residuales de las variables de estado; - realizar una clasificación (270) de al menos una entidad de la red en un estado de acuerdo con el conjunto de variables de control.
Description
DESCRIPCIÓN
Procedimiento combinado para detectar anomalías en un sistema de distribución de agua
Campo de la invención
La presente invención se refiere a la detección de anomalías en un sistema de distribución de agua. Más específicamente, se refiere a la detección de anomalías con el uso combinado de estadísticas y un modelo hidráulico del sistema de distribución de agua.
Antecedentes
Técnica anterior
Un sistema para distribuir agua potable está hecho principalmente de tuberías entre un cabezal hidráulico y los consumidores, junto con dispositivos de control tales como válvulas y bombas. Dicho sistema puede estar sujeto a numerosas anomalías. Las anomalías pertenecen a una pluralidad de tipos. Las anomalías hidráulicas comprenden fugas, variación anormal de la presión, caída rápida del nivel del agua de un tanque de almacenamiento, balance de materia de almacenamiento incoherente. Las anomalías de operación definen un elemento en el sistema que está en un estado incorrecto, por ejemplo, una válvula en un estado de apertura diferente respecto de la almacenada en el sistema de información. Estas anomalías, especialmente las fugas, pueden reducir enormemente el rendimiento del sistema de distribución de agua. Por ejemplo, las fugas en las tuberías son la causa de la pérdida de una parte significativa del agua entre el cabezal hidráulico y los consumidores, y pueden causar daños estructurales. La detección y corrección de anomalías en un sistema de distribución de agua es, por lo tanto, una preocupación permanente de los operadores de dichos sistemas para mitigar el coste económico de la pérdida y daños del agua. Además, la detección de fugas en un sistema de distribución de agua es un objetivo fundamental para limitar el consumo global de agua y los residuos, lo cual es de particular interés en las regiones sujetas a escasez de agua y con el objetivo de promover el desarrollo sostenible.
La detección de fugas en un sistema de distribución de agua se realiza históricamente mediante inspección humana. La inspección humana generalmente consiste en enviar operadores humanos para inspeccionar las tuberías del sistema e identificar fugas y otras anomalías. Esta detección se puede facilitar, por ejemplo, con sensores de audio, que detectan ruido debido a una fuga. Sin embargo, el tamaño típicamente grande de los sistemas de distribución de agua hace que la detección humana de fugas y anomalías sea muy difícil. Por ejemplo, el sistema de distribución de agua de una gran ciudad comprende miles de kilómetros de tuberías. Por lo tanto, es imposible inspeccionar todas las tuberías con frecuencia a un coste razonable.
El uso de uno o más sensores contribuye a una solución al problema de detectar anomalías en un sistema de distribución de agua. Los sensores pueden usarse principalmente para detectar automáticamente cambios anormales en el comportamiento del sistema, por lo tanto, se pueden enviar operadores humanos a los nodos/arcos del sistema en los que se detectó un comportamiento anormal. Sin embargo, los procedimientos de detección de anomalías basados en sensores también tienen desventajas. Pueden generar una gran cantidad de falsos positivos (alarmas para eventos que no son anomalías reales) y dar lugar a numerosas intervenciones humanas inútiles y costosas. También pueden detectar anomalías correctamente pero con localización imprecisa, debido a la gran escala de un sistema típico de distribución de agua. De otra manera, implementar una alta densidad de sensores en el sistema podría ayudar a localizar anomalías con mayor precisión, pero es demasiado costoso.
El documento US 2014/0052421 desvela un procedimiento para modelar un sistema de distribución de agua. Este procedimiento consiste en simular la red hidráulica utilizando estimaciones de la demanda de agua. El procedimiento comprende una etapa de calibración, que consiste en modificar las demandas de agua y simular nuevamente el sistema hidráulico, con el fin de minimizar las diferencias entre las predicciones y observaciones de los parámetros hidráulicos, como las presiones y los caudales. El procedimiento que desvela el documento US 2014/0052421 permite calibrar el modelado de una red de distribución de agua, pero no permite detectar anomalías en la red de distribución de agua.
La solicitud de patente europea n.° EP 15306029.8, presentada por el mismo solicitante que el solicitante de la presente solicitud, desvela procedimientos para detectar anomalías en un sistema de distribución de agua. Un procedimiento desvelado en esta solicitud anterior utiliza un conjunto de valores predichos de parámetros de entidades del sistema de distribución de agua, modelado como una red, por ejemplo, la velocidad del agua y la presión del agua en diferentes momentos, de acuerdo con un modelo hidráulico del sistema de distribución de agua y los valores de los parámetros de control de la red, por ejemplo la longitud, rugosidad de las tuberías, una predicción del consumo de los usuarios de la red, etc. Dicho procedimiento consiste en realizar iteraciones sucesivas del cálculo de los valores predichos, comparar estos valores con observaciones de los sensores y, de acuerdo con las diferencias entre predicciones y observaciones, ajustar los valores de los parámetros, usando luego el procedimiento para detectar una anomalía de acuerdo con los valores de los parámetros. Este procedimiento permite una determinación precisa de los valores de los parámetros de control de la red que mejor coinciden con las observaciones de los sensores. Algunos valores de los parámetros de control son representativos de anomalías en la red. Por ejemplo, la predicción de un consumo excesivo de agua puede ser representativa de una fuga en el sistema de distribución de agua. Los algoritmos
de aprendizaje automático, capacitados en casos ejemplares de anomalías en una red de agua, son capaces de identificar una anomalía de acuerdo con los valores de los parámetros de control que se obtienen después de varios casos de cálculo de los valores predichos, a través del procedimiento iterativo.
Este procedimiento tiene muchas ventajas. Proporciona un procedimiento automático, rápido y fiable para detectar anomalías en un sistema de distribución de agua, lo que permite corregir anomalías en el sistema mucho más rápidamente que con el uso de inspecciones humanas tradicionales. Sobre iteraciones sucesivas, las modificaciones para controlar los parámetros se identifican cada vez con mayor precisión. Este procedimiento es eficiente para identificar y localizar anomalías en un sistema de distribución de agua después de sucesivas iteraciones. Además, el uso del modelo hidráulico del sistema de distribución de agua permite al operador de una red localizar una anomalía incluso en una entidad de la red que no está equipada con sensores.
Sin embargo, la gran cantidad de parámetros que tienen un impacto en el modelo hidráulico y la gran cantidad de iteraciones necesarias para obtener una solución satisfactoria pueden hacer que el procedimiento sea complejo en grandes sistemas de distribución de agua. Esto mitiga la capacidad del operador de un sistema de distribución de agua para identificar y corregir anomalías en el sistema de distribución de agua rápidamente.
Por lo tanto, existe la necesidad de un procedimiento para disminuir el tiempo de detección notificado al operador y mejorar la relevancia de los resultados en términos de identificación y localización. Por ejemplo, el tiempo de detección se reduce con la optimización del número de iteraciones de cálculo de los parámetros de control de una red de sistema de distribución de agua que son necesarios para lograr una detección fiable de anomalías en el sistema de distribución de agua.
Sumario de la invención
A tal efecto, la invención desvela un procedimiento para detectar anomalías en un sistema de distribución de agua compuesto por una red de nodos, comprendiendo dicho procedimiento: parametrizar un modelo hidráulico del sistema de distribución de agua con un conjunto de valores de variables de control que caracterizan la red y su salida en los nodos; utilizar sensores en la red para adquirir observaciones de un subconjunto de variables de estado en primeras referencias temporales; identificar al menos una entidad objetivo en la que cambiar los valores de las variables de control en función de al menos dichas observaciones; cambiar el conjunto de valores de las variables de control utilizando un ajuste paso a paso de las variables de control y un criterio de interrupción en función de valores residuales de las variables de estado; realizar una clasificación de al menos una entidad de la red en un estado de acuerdo con el conjunto de variables de control.
Ventajosamente, el procedimiento comprende además identificar al menos una variable de control para cambiar en función de al menos dichas observaciones.
Esto permite una reducción adicional de la carga de cálculo del procedimiento, reduciendo el número de variables de control que se han de modificar.
Ventajosamente, identificar al menos una entidad objetivo en la que cambiar los valores de las variables de control en función de al menos dichas observaciones comprende: usar el modelo hidráulico para calcular los valores predichos de un conjunto de variables de estado que caracterizan al menos una velocidad y presión del agua en los nodos, asociándose dichos valores predichos a segundas referencias temporales; calcular los valores residuales del subconjunto de las variables de estado como una diferencia entre los valores predichos y las observaciones en las segundas referencias temporales; realizar un análisis estadístico de valores residuales en una entidad de la red en una selección de las referencias temporales; clasificar las entidades de la red en función de las reglas aplicadas a la salida del análisis estadístico.
Esto permite una detección previa eficiente de al menos una entidad objetivo, utilizando valores históricos.
Ventajosamente, dicha al menos una entidad objetivo se identifica clasificándose en un estado anormal en función de la comparación de valores residuales y un umbral predefinido.
Esto permite una selección eficiente de al menos una entidad objetivo, centrándose en las entidades que tienen mayores posibilidades de estar en un estado anormal.
Ventajosamente, identificar al menos una entidad objetivo en la que cambiar los valores de las variables de control en función de al menos dichas observaciones comprende: realizar una serie de pruebas en las observaciones utilizando una combinación de reglas; clasificar las entidades de la red en función de la combinación de reglas sobre observaciones.
Esto permite una clasificación simple pero robusta de entidades sin la necesidad de utilizar un modelo hidráulico.
Ventajosamente, dicha al menos una entidad objetivo se identifica clasificándose en un estado anormal en función de la combinación de reglas sobre observaciones.
Esto permite una identificación simple pero robusta de al menos una entidad objetivo.
Ventajosamente, identificar al menos una entidad objetivo en la que cambiar los valores de las variables de control en función de al menos dichas observaciones comprende: realizar una serie de pruebas sobre desviaciones estadísticas de observaciones utilizando una combinación de reglas; clasificar las entidades de la red en función de la combinación de reglas sobre observaciones.
Esto permite una clasificación simple pero robusta de entidades sin la necesidad de utilizar un modelo hidráulico.
Ventajosamente, dicha al menos una entidad objetivo se identifica al clasificarse en un estado anormal en función de la combinación de reglas sobre desviaciones estadísticas de observaciones.
Esto permite una identificación simple pero robusta de al menos una entidad objetivo.
Ventajosamente, identificar al menos una entidad objetivo en la que cambiar los valores de las variables de control en función de al menos dichas observaciones comprende identificar un arco de la red en el que el valor de una observación de la velocidad del agua excede un umbral en una entidad objetivo.
Esto permite una identificación muy simple y directa de al menos una entidad objetivo.
Ventajosamente, el conjunto de valores de las variables de control se realiza para al menos un tipo de evento, y las variables de control que se han de modificar se basan en dicho al menos un tipo de evento.
Esto permite mejorar la robustez de la detección y disminuir la carga de cálculo del procedimiento. De hecho, se modifica un número reducido de variables de control, que tienen una mayor probabilidad de vincularse a un evento producido en la red.
Ventajosamente, se prueba una pluralidad de tipos de eventos y se realiza una instancia de cambio del conjunto de valores de variables de control para cada tipo de evento.
Esto permite probar al mismo tiempo una pluralidad de diferentes tipos de eventos.
Ventajosamente, al menos cambiar el conjunto de valores de las variables de control se realiza para al menos un tipo de evento elegido mediante la clasificación de las entidades de la red en función de las reglas aplicadas a la salida del análisis estadístico.
Esto permite reducir la carga de cálculo de cambiar el conjunto de valores de las variables de control, determinando más específicamente las variables de control que se han de cambiar, de acuerdo con el análisis estadístico.
Ventajosamente, el procedimiento comprende: detectar una anomalía en función del resultado de identificar al menos una entidad objetivo en la que cambiar los valores de las variables de control en función de al menos dichas observaciones; si no se detecta ninguna anomalía, enriquecer una base de datos de estados normales de las entidades; si se detecta una anomalía: cambiar el conjunto de valores de las variables de control utilizando un ajuste paso a paso de las variables de control y un criterio de interrupción en función de los valores residuales de las variables de estado; realizar la segunda clasificación de al menos una entidad de la red en un estado de acuerdo con el conjunto de variables de control.
Esto permite reducir la carga de cálculo del procedimiento, iniciando el ajuste iterativo de las variables de control solo si se detecta una anomalía en función de las observaciones, y mejorar las ejecuciones posteriores del procedimiento al enriquecer una base de datos de estados normales.
Ventajosamente, el cambio del conjunto de valores de las variables de control mediante un ajuste paso a paso de las variables de control y un criterio de interrupción en función de valores residuales de las variables de estado comprende: A) cambiar el conjunto de valores de las variables de control; B) usar el modelo hidráulico para calcular los valores predichos de un conjunto de variables de estado que caracterizan al menos la velocidad y la presión del agua en los nodos en las referencias temporales; C) calcular los valores residuales del conjunto de variables de estado como una diferencia entre los valores predichos y las observaciones en las referencias temporales; D) si dichas diferencias satisfacen un criterio de interrupción, pasar a la etapa F); E) si no, cambiar el conjunto de valores de las variables de control (350) y volver a la etapa B); F) si dichas diferencias no satisfacen un criterio de refinamiento (360), seleccionar un subconjunto de la red (370) en que calcular los valores predichos, volviendo a la etapa B.
Esto permite un ajuste progresivo de los valores de las variables de control hasta que sus valores sean lo suficientemente fiables como para detectar eventos en la red.
Ventajosamente, el criterio de refinamiento comprende el cálculo de los valores de uno de un mínimo cuadrado y una función objetivo bayesiana, y la selección y modificación de las variables de control se determinan mediante un algoritmo de Levenberg-Marquardt.
El uso de una función objetivo bayesiana permite calibrar la fiabilidad relativa de las mediciones y los valores modificados de las variables de control y estado. El uso del algoritmo de Levenberg-Marquadt permite tener buenas cualidades de convergencia y estabilidad.
Ventajosamente, la realización de una clasificación de al menos una entidad de la red en un estado de acuerdo con el conjunto de variables de control se realiza mediante un algoritmo de aprendizaje automático previamente capacitado.
Esto permite tener reglas de clasificación optimizadas para un sistema de distribución de agua dado, cuya fiabilidad aumenta con el tiempo.
Ventajosamente, las variables de control comprenden variables escalares que caracterizan la topología y la topografía de la red, y variables basadas en el tiempo que caracterizan las entradas y salidas de la red que tienen al menos un valor en cada referencia temporal.
Esto permite aumentar el número de posibles eventos detectados por el procedimiento.
Ventajosamente, cambiar el conjunto de valores de las variables de control comprende modificar al menos uno de: los valores de un subconjunto de las variables de control basadas en el tiempo; los valores de un subconjunto de las variables de control escalar calculados durante una fase de modelado de la red.
Esto permite aprovechar al máximo la disponibilidad de variables de control escalares y basadas en el tiempo.
Ventajosamente, modificar los valores de un subconjunto de las variables de control basadas en el tiempo comprende modificar los valores de las variables de control basadas en el tiempo representativas del consumo de agua.
Esto permite detectar eventos que se detectan por un aumento anormal del consumo de agua, por ejemplo fugas.
Ventajosamente, las variables de estado caracterizan aún más la presión.
Esto permite tener un modelo más completo y eficiente de la evolución temporal de los parámetros físicos del sistema de distribución de agua.
La invención también desvela un sistema para detectar anomalías en un sistema de distribución de agua compuesto por una red de nodos, comprendiendo dicho sistema: sensores de al menos velocidad y presión del agua en un subconjunto de nodos de la red; un dispositivo informático que comprende un procesador; enlaces de comunicación entre sensores y el dispositivo informático; un medio de almacenamiento; en el que el dispositivo informático está configurado para: recuperar un conjunto inicial de valores de variables de control que caracterizan la red y su salida en los nodos de los medios de almacenamiento y lo utilizan para parametrizar un modelo hidráulico del sistema de distribución de agua; utilizar enlaces de comunicación entre sensores en la red para adquirir observaciones de un subconjunto de las variables de estado, teniendo dichas observaciones referencias temporales; ejecutar uno de los procedimientos desvelados anteriormente.
La invención también desvela un producto de programa informático, almacenado en un medio no transitorio legible por ordenador, para detectar anomalías en un sistema de distribución de agua compuesto por una red de nodos, comprendiendo dicho producto de programa informático instrucciones de código para ejecutar uno de los procedimientos desvelados anteriormente.
La invención aumenta la robustez y reduce el coste de cálculo de un procedimiento de detección de anomalías en un sistema de distribución de agua basado en un ajuste paso a paso de los parámetros de control.
La invención permite una detección precisa de anomalías en cualquier entidad de un sistema de distribución de agua, incluso si dicha entidad no está equipada con sensores.
Los procedimientos de la invención son capaces de detectar varios tipos de anomalías en un sistema de distribución de agua.
La precisión de la detección de anomalías de un procedimiento de la invención aumenta con el número de usos del procedimiento.
Breve descripción de los dibujos
La invención se entenderá mejor y sus diversas características y ventajas surgirán de la siguiente descripción de una serie de realizaciones ejemplares y sus figuras adjuntas, en las que:
- la figura 1 muestra un ejemplo de un sistema de distribución de agua organizado en red en la técnica anterior; - la figura 2 muestra un ejemplo de procedimiento para detectar anomalías en un sistema de distribución de agua en una serie de realizaciones de la invención, usando un ajuste iterativo paso a paso de propiedades y variables de control de un modelo hidráulico combinado con un aprendizaje automático para identificar la anomalía en la técnica anterior;
- la figura 3 muestra un ejemplo de un procedimiento para identificar parámetros para un evento objetivo en la técnica anterior;
- la figura 4 muestra un ejemplo de procedimiento para detectar anomalías en un sistema de distribución de agua
en una serie de realizaciones de la invención;
- la figura 5 muestra un ejemplo de procedimiento para detectar anomalías en un sistema de distribución de agua en una serie de realizaciones de la invención, en la que la ejecución del ajuste iterativo paso a paso de las propiedades y las variables de control de un modelo hidráulico combinado con un aprendizaje automático para identificar la anomalía depende de la salida de una clasificación de anomalías utilizando un cálculo de los valores residuales de las variables de estado;
- la figura 6 muestra un ejemplo de procedimiento para detectar anomalías en un sistema de distribución de agua en una serie de realizaciones de la invención, en la que la ejecución del ajuste iterativo paso a paso de las propiedades y las variables de control de un modelo hidráulico combinado con un aprendizaje automático para identificar la anomalía depende de la salida de una clasificación de anomalías utilizando una combinación de reglas aplicadas a las variables de estado;
- la figura 7 muestra un ejemplo de procedimiento para detectar anomalías en un sistema de distribución de agua en una serie de realizaciones de la invención, utilizando el aprendizaje estadístico para detectar y caracterizar previamente una anomalía.
- la figura 8 muestra un ejemplo de una presentación de la localización de anomalías a un operador.
Descripción detallada de la invención
En esta memoria descriptiva, la invención se describirá mediante ejemplos relacionados con la detección de fugas y la detección de concentraciones anormales de cloro. Sin embargo, la invención no se limita a estos ejemplos y puede aplicarse a la detección de cualquier anomalía en un sistema de distribución de agua.
La figura 1 muestra un ejemplo de un sistema de distribución de agua organizado en una red de acuerdo con la técnica anterior.
La red 100 mostrada en la figura 1 está organizada como una red y comprende una pluralidad de nodos 110, 111, 112, 113, 114, 115, 116 y 117, así como una pluralidad de arcos 120, 121, 122, 123, 124, 125, 126, 127 y 128. Los nodos suelen representar las conexiones con fuentes de agua o depósitos de agua, por ejemplo el depósito 130 en el nodo 116, las conexiones con el usuario del sistema de distribución de agua, por ejemplo, el consumo 131 en el nodo 113 y las conexiones entre los arcos. Los arcos típicamente representan tuberías entre los nodos. La red puede equiparse con equipos como válvulas y bombas. Por ejemplo, una bomba 132 está presente en el arco 120. Más generalmente, un nodo puede ser una unión entre dos o tres tuberías, un punto en el que se encuentran las entradas o salidas de la red, por ejemplo, un punto en el que un usuario consume agua, o un punto en el que se inyecta agua en la red. Un nodo también puede representar una subred, por ejemplo, un vecindario agrupado en un solo nodo.
Los parámetros físicos relacionados con el agua comprenden notablemente a modo de ejemplo la velocidad, presión, caudal, nivel de almacenamiento (depósito y tanque), temperatura, etc. Se pueden agregar parámetros adicionales de acuerdo con las necesidades de detección y/o la evolución de los sensores. La evolución de estos parámetros a lo largo del tiempo depende de las características del sistema de distribución de agua, las entradas y salidas en los nodos y el estado de cualquier equipo en el sistema.
Los atributos del sistema de distribución de agua comprenden principalmente:
- la topología de la red (es decir, el gráfico con arcos y nodos);
- la topografía de la red (es decir, la elevación de los nodos);
- las propiedades de las tuberías, como la longitud, diámetro, material, rugosidad, singularidades, coeficientes de pérdida menores, etc.);
- las propiedades de cada equipo de la red (por ejemplo, características de la bomba, diámetro de la válvula, coeficiente de fricción, consigna de funcionamiento, etc.).
El modelo hidráulico de una red de agua potable comprende este conjunto de información.
Las entradas y salidas en los nodos están definidas por los consumos o inyecciones de agua en cada nodo del gráfico. Típicamente, representan los consumos individuales de los usuarios del sistema de distribución de agua y la inyección de agua desde la entrada de agua al sistema.
El estado del equipo, como válvulas o bombas, comprende los estados operativos y los puntos de consigna de estos dispositivos.
En esta descripción, las características del sistema de distribución de agua, las entradas y salidas en los nodos y estados de los dispositivos se denominarán "variables de control" del sistema de distribución de agua, mientras que los parámetros físicos en los nodos y arcos se denominarán "variables de estado" del sistema de distribución de agua. Las variables de control comprenden, por ejemplo, el consumo de agua en los nodos, expresado, por ejemplo, en m3/d, rugosidad y fricción de las tuberías, así como el estado de las bombas o accionadores, etc. Las variables de estado comprenden velocidad y presión en los diferentes arcos y nodos. De acuerdo con la aplicación objetivo, las variables de estado también pueden comprender niveles de agua en tanques y depósitos de agua, concentración de cloro residual (RCC), etc. Los valores de las variables de estado varían con el tiempo. Los valores de algunas variables de control, por ejemplo, aquellos relacionados con la topología o la topografía de la red, permanecen constantes,
mientras que los valores de algunas variables de control, por ejemplo, aquellos relacionados con las entradas y salidas de la red y con los estados de los dispositivos, varían con el tiempo. Mientras tanto, una entidad se refiere a toda la red, o un subconjunto de una red compuesta de nodos, arcos y equipos, un solo nodo, un solo arco o un equipo de la red que se caracteriza por características que tienen un impacto en el comportamiento del sistema de distribución de agua.
Una descripción del valor inicial de las variables de estado y una predicción (serie temporal) de los valores de las variables de control, principalmente los consumos en los nodos de la red, permiten una predicción de los valores de las variables de estado a lo largo del tiempo. Esta predicción generalmente se realiza calculando valores sucesivos de las variables de estado con una etapa de tiempo fija o variable. Esta predicción se llama resolución del problema directo.
Algunas entidades de la red están equipadas con sensores que miden parámetros físicos, típicamente velocidad o presión. Estos sensores permiten obtener series temporales de variables de estado.
Se conocen procedimientos para calcular los valores de las variables de control que definen la bondad de ajuste del sistema además de las observaciones de las variables de estado. Estos procedimientos generalmente se denominan resolución inversa de problemas y aparecen desvelados principalmente en Piller, O. (1995): Modeling the behavior of a network -Hydraulic analysis and sampling procedures for parameter estimation. Applied Mathematics thesis from the University of Bordeaux (PRES), 288 páginas, Talence, Francia, presentado el 3 de febrero de 1995 y Piller, O., Gilbert, D. y Van Zyl, J. E. (2010): Dual Calibration for Coupled Flow and Transport Models of Water Distribution Systems. Water Distribution Systems Analysis WDSA 2010, ASCE, Tucson, 722-731, diciembre de 2010, US 8635051. Resolver un problema inverso generalmente consiste en iteraciones sucesivas de un bucle que comprende modificar valores de variables de control, predecir valores de variables de estado de acuerdo con las variables de control, para minimizar una función matemática que sea representativa de las diferencias entre predicción y observaciones de variables de estado. Estas técnicas permiten determinar, por ejemplo, las características de una entidad de la red (por ejemplo, una pérdida de carga en una válvula, una rugosidad de una tubería, etc.) o el consumo de agua que mejor se ajusta a las observaciones de las variables de estado.
En esta solicitud, una entidad es un término general para designar un nodo, un arco, equipo, un subconjunto de la red o de toda la red. De este modo, clasificar una entidad en un estado anormal puede consistir en identificar una anomalía de un nodo, un arco, un equipo, un subconjunto de la red, etc.
La figura 2 muestra un ejemplo de un procedimiento para detectar anomalías en un sistema de distribución de agua en la técnica anterior, utilizando un ajuste iterativo paso a paso de propiedades y variables de control de un modelo hidráulico y aprendizaje automático para identificar la anomalía.
El procedimiento 200 comprende una primera etapa 220 para definir parámetros de un modelo hidráulico 211 usando un conjunto de variables de control 210. La naturaleza del modelo hidráulico y las variables de control se han presentado en relación con la figura 1. El modelo hidráulico puede configurarse principalmente con variables de control que caracterizan la estructura de la red y variables de control que caracterizan una predicción de las entradas y salidas de la red en los nodos durante un conjunto de referencias temporales, principalmente una predicción del consumo de agua en la red.
En una realización preferente, los valores de las variables de control relacionadas con la estructura de la red (por ejemplo, el diámetro y la rugosidad de las tuberías, características de los equipos, etc.) han sido calibrados después de la creación del modelo hidráulico. De hecho, los valores teóricos definidos durante el modelado de la red no siempre coinciden con los valores reales. Para obtener valores más precisos de las variables de control relacionadas con la estructura de la red, una etapa de calibración puede consistir en ajustar los valores de estas variables de control para proporcionar la mejor predicción del comportamiento de la red. Típicamente, este ajuste puede consistir en:
- realizar observaciones de las entradas, salidas y un subconjunto de las variables de estado de la red durante una duración determinada;
- configurar el modelo hidráulico de la red con valores de las variables de control relacionadas con las entradas, salidas y estructura de la red;
- calcular los valores predichos de las variables de estado de la red de acuerdo con el modelo hidráulico;
- calcular una diferencia entre los valores observados y predichos de las variables de estado de la red, y modificar los valores de las variables de control de la red utilizando un algoritmo de optimización para minimizar la distancia entre los valores observados y predichos de las variables de estado de la red.
Por otro lado, las variables de control relacionadas con la entrada y salida de la red se pueden obtener, por ejemplo, utilizando observaciones de las entradas y salidas pasadas. Por ejemplo, los valores de las variables de control que caracterizan el consumo de agua en diferentes nodos se pueden calcular utilizando datos medidos históricos del consumo de agua.
El procedimiento 200 comprende además una etapa 230 de usar sensores para adquirir observaciones de un subconjunto de variables de estado, teniendo dichas observaciones primeras referencias temporales. Una variable de estado es un valor temporizado de un parámetro físico en una entidad de la red. La variable de estado a menudo se
relaciona con valores físicos en un nodo de la red (por ejemplo, presión o concentración de cloro en un nodo de la red). También pueden relacionarse con un valor físico en un arco de la red, por ejemplo, la velocidad del agua en una tubería. Partes de los procedimientos de la técnica anterior y la invención se basan en una comparación de observaciones y predicciones de variables de estado. Las observaciones de las variables de estado solo son posibles si está presente un sensor adecuado. Por ejemplo, una observación de presión en un nodo de la red solo se puede realizar si un sensor de presión está presente en este nodo. Por otro lado, es posible calcular valores predichos de variables de estado en nodos u otras entidades que no están equipadas con sensores, utilizando un modelo hidráulico. Las primeras referencias temporales están asociadas a cada sensor, que es capaz de producir mediciones en diferentes tiempos/ritmos. De acuerdo con diversas realizaciones de la invención, las primeras referencias temporales de cada sensor pueden estar sincronizadas, o cada sensor puede tener sus propias referencias temporales. En ambos casos, la ejecución de las próximas etapas del procedimiento de la invención será la misma.
Tal y como se indica en relación con la figura 1, un sistema de distribución de agua generalmente está equipado con sensores. Estos sensores miden parámetros físicos como la velocidad, caudal, presión, etc. en los nodos o los arcos de la red, siendo dichos parámetros físicos en un nodo o un arco variables de estado de la red. Por razones prácticas de coste, mantenimiento y facilidad de operación, todos los nodos y arcos no están equipados con sensores, y aquellos equipados con sensores generalmente no están equipados con un sensor para cada parámetro físico. El número y la distribución de los sensores se pueden elegir de acuerdo con la definición de sectores del sistema de distribución de agua. La adquisición de observaciones se puede realizar de forma remota. Por ejemplo, los sensores que se implementan a lo largo de la red pueden enviar los valores de las variables de estado a una plataforma remota a través de diversos medios de telecomunicaciones, generalmente enlaces inalámbricos.
Los valores de las variables de estado varían con el tiempo, cada valor tiene una referencia temporal que representa el tiempo en que se midió el valor. En una realización de la invención, los valores de las variables de estado se adquieren utilizando un período de tiempo predefinido y se envían regularmente, posiblemente pero no necesariamente, usando otro período. Por ejemplo, los valores de las variables de estado para las que está presente un sensor pueden adquirirse y enviarse cada dos minutos, 5 minutos, 15 minutos o cada hora cada 24 horas. En una realización preferente de la invención, los sensores se sincronizan para adquirir mediciones simultáneamente. Esto permite que la plataforma remota adquiera observaciones de los valores del subconjunto de variables de estado para las cuales hay un sensor disponible en cada referencia temporal. Los valores se pueden enviar inmediatamente después de ser medidos. También se pueden almacenar localmente a nivel de dispositivo de transmisión, y luego enviarse a intervalos regulares, por ejemplo, enviando todos los valores que han sido capturados durante 15 minutos, 1 hora o cualquier otro intervalo.
El procedimiento 200 comprende además una etapa 240 de establecer al menos un objetivo. La etapa tiene como objetivo definir eventos específicos que pueden ser, por ejemplo, una variación anormal de la presión, la detección de una válvula en un falso estado de apertura. Estos eventos específicos serán los que se buscarán en las siguientes etapas del procedimiento, para varias entidades (toda la red, subconjunto de la red, etc.). Tal y como se explicó con referencia a la figura 3, se define un conjunto de parámetros para cada tipo de evento objetivo en la etapa 310.
El procedimiento 200 comprende además una etapa 250 de identificación de parámetros. En una serie de realizaciones de la invención, los parámetros se establecen para eventos específicos. En los casos en que se aborda una pluralidad de eventos, se ejecuta una etapa 250 de identificación para cada evento objetivo, ya sea uno tras otro, o en paralelo. A continuación, se proporciona un ejemplo de procedimiento para identificar parámetros en una instancia, con referencia a la figura 3. Existen varios procedimientos para determinar los eventos objetivo. En una serie de realizaciones de la invención, los eventos se recogen en una lista predefinida. En otras realizaciones, se selecciona un evento para una aplicación específica. Por ejemplo, solo se puede seleccionar un evento de "fuga". En otras realizaciones más de la invención, un operador selecciona los eventos que le interesan en una lista de todos los eventos posibles. En otras realizaciones más de la invención, se seleccionan los eventos que son detectables de acuerdo con los sensores presentes en la red. En otras realizaciones de la invención, no se busca ningún evento en particular. De este modo, se puede seleccionar un conjunto predefinido de parámetros.
El procedimiento comprende una etapa 260 para extraer y preprocesar un vector de características para preparar la etapa de clasificación. El procedimiento busca normalizar los datos y reducir la dimensión del problema. Los datos de entrada incluyen todos los resultados del modelo (véase la figura 3) y los datos de salida son un vector con un número reducido de dimensiones. En una realización, la reducción de la dimensión del problema se puede resolver utilizando un análisis de componentes principales, un análisis discriminante lineal o un algoritmo de los K vecinos más próximos.
El procedimiento comprende una etapa 270 para calificar el estado actual de una entidad. De acuerdo con la definición de una entidad propuesta anteriormente, la clasificación de una entidad puede aplicarse a toda la red, un solo arco, un solo nodo o un subconjunto de los nodos y arcos de la red. En una serie de realizaciones de la invención, el subconjunto de nodos y arcos de la red que forman la entidad se eligen para formar un conjunto coherente. Por ejemplo, una entidad puede ser un subconjunto de un área que entrega agua a un vecindario, con una sola entrada y un solo arco de salida para toda la entidad.
Se pueden usar varias técnicas de aprendizaje automático dependiendo de la disponibilidad y la cantidad de datos históricos etiquetados, compuestos de vectores de características. En una serie de realizaciones, estas técnicas
incluyen detección de anomalías, agrupación y clasificación. En una serie de realizaciones, las reglas del aprendizaje automático se basan en algoritmos de aprendizaje automático 271 previamente capacitados en vectores de características históricas etiquetadas. Por ejemplo, en el caso de clases históricas etiquetadas suficientemente disponibles, los algoritmos de clasificación pueden analizar las clases históricas disponibles y los vectores de características correspondientes para construir un clasificador que determine automáticamente las reglas de clasificación de las entidades. Un nuevo vector de características se puede clasificar automáticamente en la clase actual relevante, por lo tanto, caracterizando el estado actual y brindando información valiosa a un operador. Por ejemplo, la clasificación puede basarse en máquinas de vectores de soporte, bosques aleatorios; regresión logística, etc. En una serie de realizaciones, se puede utilizar la clasificación con dos clases (estado normal/anormal). En una serie de realizaciones, las clasificaciones también pueden consistir en tipos de anomalías (presión, alto/bajo consumo y calidad del agua), etc. La clasificación también puede incluir un índice de fiabilidad, lo que indica la certeza de la clasificación de la anomalía. En una serie de realizaciones, la capacitación del algoritmo de aprendizaje automático se puede activar en cualquier momento según la base de tiempo (frecuencia definida), en criterios de rendimiento o en evolución en el conjunto de datos utilizado.
En el caso de clases históricas etiquetadas y vectores de características correspondientes que son insuficientes, se puede usar agrupación o detección de anomalías. La agrupación puede incluir técnicas como K-medias o agrupación jerárquica. La agrupación utiliza estados pasados, representados por vectores de características anteriores pero sin etiquetas conocidas. En una realización de la invención, el estado se declara como anormal si no está presente en agrupaciones más grandes (se prueba un criterio del tamaño de las agrupaciones).
El procedimiento comprende una etapa 280 para determinar si la clase calculada para una entidad corresponde a un estado anormal ("evento") de acuerdo con la salida de los algoritmos de aprendizaje automático o si uno de los estados se detecta como anomalía. Si se detecta un evento, el procedimiento pasa a la etapa 290. Si los estados están calificados como normales, el procedimiento pasa a la etapa 291.
El procedimiento comprende una etapa 290 para mostrar información estructurada al operador. Luego se puede presentar una lista de entidades priorizadas en estado anormal a un operador para lanzar operaciones de mantenimiento adecuadas a las entidades con la mayor probabilidad de anomalía. Estas entidades con estado anormal se presentan con información adicional recopilada a lo largo de las etapas anteriores (en función de la información contenida en los resultados del modelo y el vector de características). En una realización, la información contiene indicaciones sobre la cuantificación del nivel de anormalidad (por ejemplo, el valor del flujo de una fuga, el valor de la pérdida de carga), tiempo y duración de la anormalidad, ubicación conocida y propagación de la anormalidad, etc. Teniendo en cuenta la configuración del contexto, esta información se utiliza para priorizar los estados anormales y proporcionar un grado de anormalidad al usuario.
El procedimiento comprende una etapa 291 para enriquecer una base de datos histórica de vectores de características etiquetadas como "normales". Estos vectores de características se utilizan como entradas para el procedimiento de aprendizaje de algoritmos. Esto permite ventajosamente tener una base de datos más rica con el tiempo y, de este modo, una predicción más fiable de estados normales o anormales.
El procedimiento comprende una etapa 292 para enriquecer la base de datos histórica de vectores de características no etiquetadas como "normales" por el procedimiento. El procedimiento comprende entonces una etapa de validación de eventos por parte de los operadores. En una realización, los operadores pueden introducir el procedimiento, para cada entidad, si confirman el evento y su clase. Los vectores se pueden etiquetar de acuerdo con la clase a la que pertenecen (fuga, anomalía de presión, anomalía en la calidad del agua, etc.). La base de datos histórica de vectores de características se enriquece con el nuevo vector clasificado de características cualquiera que sea el estado "anormal" o "normal". Estos vectores de características se utilizan como entradas en el procedimiento de capacitación de algoritmos. Si no está etiquetado por el operador, los vectores todavía se almacenan pero sin etiqueta específica. Luego se pueden usar en modos no supervisados o semisupervisados (agrupación y detección de anomalías).
La figura 3 muestra un ejemplo de un procedimiento para identificar parámetros para un evento objetivo en la técnica anterior.
El procedimiento 250 comprende una etapa 310 de establecer el problema de acuerdo con uno de los eventos específicos y entidades específicas elegidas en la etapa 240. La etapa tiene como objetivo definir los conjuntos de parámetros correspondientes al tipo de evento objetivo para la entidad. Se define un conjunto de parámetros por cada objetivo de evento y entidad. En una serie de realizaciones de la invención, un tipo de evento está asociado con una lista de parámetros, y el conjunto de parámetros se recupera de acuerdo con el evento que abarca. Por ejemplo, un evento puede ser un estado de apertura falsa de una válvula que se sabe que se caracteriza por valores inconsistentes de variables de control representativas de rugosidad y fricción, mientras que otro tipo de eventos pueden ser fugas que se sabe que se caracterizan por valores anormales de la demanda de agua.
El procedimiento 250 comprende además una etapa 320 de usar el modelo hidráulico para calcular valores predichos de un conjunto de variables de estado que caracterizan entidades, al menos velocidad en los arcos y presión en los nodos en segundas referencias temporales. Esta etapa consiste en calcular un valor predicho de las variables de estado de la entidad (red, sus subconjuntos, etc.), en las segundas referencias temporales. El usuario puede elegir las
segundas referencias de tiempo independientemente de las primeras referencias de tiempo. Por ejemplo, las segundas referencias temporales están separadas por un intervalo predefinido y constante (es decir, los valores predichos se calculan cada 1 minuto, 5 minutos, o cualquier otra duración) y no están necesariamente sincronizados con las primeras referencias temporales. Los procedimientos para usar un modelo hidráulico para calcular los valores predichos de las variables de estado de una red hidráulica son bien conocidos por los expertos en la materia de la ingeniería de sistemas de agua. Por lo general consisten en, a partir del estado del tanque en una referencia de tiempo y los valores de las variables de control, usar la ley física de la hidráulica para calcular los valores de todas las variables de estado en la misma referencia de tiempo, y luego calcular los valores del estado del tanque en la siguiente referencia temporal. Entonces es posible calcular los valores predichos de las variables de estado en todas las referencias temporales a partir de los valores iniciales de las variables de estado y los valores de las variables de control. Los procedimientos para calcular los valores predichos de las variables de estado en una referencia temporal aparecen desvelados principalmente en O. Piller, "Modeling the behavior of a network-Hydraulic analysis and sampling procedures for parameter estimation". PhD thesis in Applied Mathematics from the Mathematics and Computer Science Doctoral School at the University of Bordeaux (PRES), 1995, 288 páginas, Talence, Francia.
El procedimiento comprende además una etapa 330 de cálculo de valores residuales del subconjunto de las variables de estado como una diferencia entre predicciones y observaciones en las segundas referencias temporales. En caso de que las segundas referencias temporales y las primeras referencias temporales no sean idénticas, los valores de las observaciones pueden calcularse en las segundas referencias temporales, por ejemplo, construyendo una función continua de cada observación en la primera referencia temporal y seleccionando valores en las segundas referencias temporales deseadas. Dicha función continua se puede construir de varias maneras. Por ejemplo, puede construirse utilizando una función de interpolación o una función de regularización. Aquí se adaptan varias funciones, por ejemplo, una función de convolución del núcleo gaussiano. Esta etapa consiste en calcular las diferencias entre los valores predichos y observados de las variables de estado, para variables de estado para las cuales hay observaciones disponibles. Las observaciones de las variables de estado pueden ser observaciones en bruto u observaciones preprocesadas. Los valores observados de las variables de estado pueden, por ejemplo, preprocesarse mediante suavizado, falta de imputación de datos, etc. para limpiar la señal en los casos en que el sistema está correctamente modelado y calibrado, y las entradas y salidas de la red están correctamente definidas, entonces, si no hay una anomalía real, las observaciones y predicciones de las variables de estado son muy cercanas y los valores residuales están muy cerca de los valores residuales en la calibración del modelo. Por el contrario, los valores residuales pueden ser importantes, es decir, se produce una anomalía, como por ejemplo cuando un consumo espacial de agua es incorrecto. La función objetivo se usa para calcular la importancia de los valores residuales. La importancia del valor residual puede calcularse, por ejemplo, como una norma ponderada o un promedio ponderado del valor absoluto de cada valor residual. Los pesos asociados con las diferentes observaciones/residuos se pueden definir de acuerdo con la naturaleza de la observación (flujo, presión, etc.), la marca y la precisión del sensor, la hora del día, la varianza empírica de la medición. Más generalmente, el peso puede ser definido automáticamente, o definido por un usuario, según una indicación de fiabilidad de la medición.
El procedimiento 250 comprende además una etapa 340 de verificar si los valores residuales satisfacen un criterio de interrupción. Esta etapa consiste en verificar si los valores residuales de las variables de estado son lo suficientemente pequeños como para considerar que los valores de las variables de control describen con precisión el comportamiento de la entidad. El criterio de interrupción puede ser, por ejemplo, una combinación de un umbral en el número de iteraciones, un umbral sobre la variación de los valores residuales, un umbral en el gradiente de la función objetivo con respecto al conjunto de parámetros.
Cuando el criterio de interrupción 340 no se cumple, el procedimiento 250 comprende una etapa de bucle 350 para cambiar los valores de los parámetros del problema (por ejemplo, el perfil de consumo) usando un procedimiento de descenso. En una realización, el procedimiento puede ser un algoritmo de gradiente, un algoritmo de gradiente conjugado, un algoritmo de Newton, un algoritmo de Levenberg-Marquardt u otro algoritmo del mismo tipo. Esta etapa 350 alimenta una nueva iteración de la etapa 320, utilizando el modelo hidráulico para calcular valores predichos con valores modificados de parámetros del problema.
Cuando se cumple el criterio de interrupción 340, el procedimiento 250 comprende una etapa 360 que es una prueba basada en un criterio de refinamiento. Mientras el valor de la función objetivo disminuye, otra etapa de refinamiento 370 se realiza en el bucle en la etapa 320.
El procedimiento 250 comprende además una etapa 370 para seleccionar un subconjunto de al menos un elemento (nodo o arco). La etapa examina el gradiente calculado como el producto escalar de un vector de sensibilidad de elemento (nodo o arco) por un vector de contribución de elemento. El procedimiento descarta los elementos de acuerdo con un criterio de selección, en función de la evaluación de sensibilidad. En una realización, los que tienen una sensibilidad positiva se descartan. Esta etapa 370 alimenta una nueva iteración de la etapa 320, utilizando el modelo hidráulico para calcular los valores predichos en los elementos seleccionados.
El procedimiento 250 comprende además una etapa 380 para proporcionar las salidas de los parámetros del modelo. Las salidas del modelo incluyen los parámetros ajustados, los valores sucesivos de los conjuntos de elementos y la función objetivo relacionada, y las características que se procesan en la etapa 260 tal y como se muestra en la figura 2. Las salidas del modelo incluyen, por lo tanto, información sobre diversas entidades, desde un nodo o arco específico
hasta un subconjunto de la red y toda la red.
La figura 4 muestra un ejemplo de procedimiento para detectar anomalías en un sistema de distribución de agua en una serie de realizaciones de la invención.
El procedimiento 400 de la invención comprende etapas similares al procedimiento 200 de la técnica anterior, principalmente:
- la etapa 220 de parametrizar un modelo hidráulico del sistema de distribución de agua con un conjunto de valores de variables de control que caracterizan la red y su salida en los nodos;
- la etapa 230 de usar sensores en la red para adquirir observaciones de un subconjunto de variables de estado en las primeras referencias temporales;
- la etapa 250 de cambiar el conjunto de valores de las variables de control usando un ajuste paso a paso de las variables de control y un criterio de interrupción en función de valores residuales de las variables de estado; - la etapa 270 de realizar una clasificación de al menos una entidad de la red en un estado de acuerdo con el conjunto de variables de control.
En una serie de realizaciones de la invención, el procedimiento también puede comprender una o más de las otras etapas del procedimiento 200:
- la etapa 280 de detección de eventos;
- la etapa 290 de mostrar eventos y sus características;
- la etapa 291 de enriquecer la base de datos de clases normales históricas;
- la etapa 292 de enriquecer la base de datos de clases históricas anormales;
El procedimiento 400 comprende además una etapa 410 de identificar al menos una entidad objetivo en la que cambiar los valores de las variables de control en función de al menos dichas observaciones.
El objetivo de la etapa 410 es reducir el número de entidades en las que los valores de las variables de control se cambian en la etapa 250, asegurando que, si ocurre una anomalía en el sistema de distribución de agua, se encuentra en las entidades seleccionadas en la etapa 410. De hecho, la carga computacional y la complejidad de la etapa 250 pueden aumentar enormemente en redes grandes con un alto número de entidades.
De este modo, al reducir el número de entidades para las cuales se modifican las variables de control, el procedimiento de la invención reduce la carga computacional de la detección de anomalías y produce sus resultados más rápido y al menos de manera igual de fiable que los procedimientos de la técnica anterior.
En una serie de realizaciones de la invención, la etapa 410 identifica además otros elementos, por ejemplo las variables de control que se han de cambiar, reduciendo de este modo adicionalmente el coste de cálculo de la etapa 250.
En una serie de realizaciones de la invención, la etapa 250 se realiza para una pluralidad de tipos de eventos, y la etapa 410 identifica posibles tipos de eventos para probar.
De acuerdo con diversas realizaciones de la invención, la identificación de las entidades en la que cambiar los valores de control, de los valores de control que se han de cambiar y de los eventos que se han de probar se puede realizar de muchas maneras diferentes. Por ejemplo, puede basarse en un análisis estadístico de los valores residuales de las variables de estado y una primera clasificación de entidades. También puede basarse en una comparación directa de valores de variables de estado, por ejemplo la velocidad del agua, con un umbral.
Más generalmente, en un procedimiento de acuerdo con la invención, se detecta una anomalía, si al menos una entidad se clasifica en un estado representativo de una anomalía en la etapa 270, o si se detecta un evento en la etapa 280. En una serie de realizaciones de la invención, algunos eventos son representativos de una anomalía, mientras que otros no lo son. De este modo, la etapa 290 de mostrar eventos y sus características comprende mostrar una anomalía a un operador, si al menos una entidad ha sido clasificada en un estado anormal. En otras realizaciones de la invención, también es posible visualizar o registrar, además de eventos, las clasificaciones en un estado normal. De este modo, un experto puede verificar esta visualización o registro de estados normales para garantizar que la clasificación se realice correctamente y que ninguna clasificación errónea lleve a perder una anomalía.
Se presentarán ejemplos de realizaciones de la invención, a modo de ejemplos no limitativos, en el resto de la descripción.
La figura 5 muestra un ejemplo de procedimiento para detectar anomalías en un sistema de distribución de agua en una serie de realizaciones de la invención, en el que la ejecución del ajuste iterativo paso a paso de las propiedades y las variables de control de un modelo hidráulico combinado con un aprendizaje automático para identificar la anomalía depende de la salida de una clasificación de anomalías utilizando un cálculo de los valores residuales de las variables de estado.
El procedimiento 500 comprende las etapas 220, 230, 250, 260 y 270 del procedimiento 400. En una serie de realizaciones de la invención, también puede comprender al menos una de las etapas 280, 290, 291, 292 del
procedimiento 400.
En este ejemplo de realizaciones, la etapa 410 de identificar al menos una entidad objetivo en la que cambiar los valores de las variables de control se realiza utilizando un análisis estadístico de los valores residuales de las variables de estado. El uso de esta combinación permite configurar la parte iterativa directamente en una clase de anomalía previamente identificada con una entidad previamente identificada, y centrarse en anomalías importantes para que el procedimiento de detección sea más preciso y los operadores puedan usarlo más fácilmente. Las principales anomalías son las que producen discrepancias estadísticas entre los resultados del modelo y los datos medidos, que se detectan a través del análisis de residuos. El procedimiento iterativo confirma la presencia de una anomalía y brinda información más detallada. Luego se puede iniciar con menos frecuencia y con un menor número de instancias paralelas, ahorrando tiempo de cálculo.
La etapa 410 de identificación de al menos un objetivo comprende de este modo la etapa 320 de cálculo de los valores predichos, y la etapa 330 de cálculo de residuos, que se conocen a partir de la técnica anterior. Los valores residuales se pueden calcular para todas o una parte de las variables de estado para las que está disponible una observación.
La etapa 410 comprende además una etapa 510 de realizar una pluralidad de análisis estadísticos de valores residuales para al menos una entidad para una selección de referencias temporales. Esta etapa consiste en analizar la distribución de valores residuales para una entidad en cada referencia temporal en una ventana de tiempo. De acuerdo con diversas realizaciones de la invención, la ventana de tiempo puede cubrir la totalidad o un subconjunto de referencias temporales.
A través de la pluralidad de análisis estadísticos, se puede detectar una anomalía si los valores residuales no son consistentes con las observaciones históricas de los valores residuales. El uso de la distribución histórica de valores residuales permite detectar los comportamientos habituales e inusuales, incluyendo variabilidad y varias propiedades de los valores residuales, para su comparación con los valores residuales actuales dentro de una ventana de tiempo dada. Por ejemplo, la etapa 510 puede comprender calcular inferencias estadísticas (momento de orden n, promedio, desviación estándar, desviación media o mediana absoluta, etc.) utilizando una base de datos de valores residuales históricos para su comparación con las inferencias estadísticas correspondientes de los valores residuales actuales. Esto le da más robustez al procedimiento ya que toma en cuenta los valores pasados y los comportamientos observados.
En una serie de realizaciones de la invención, los valores residuales se transforman usando una transformada de Fourier antes del análisis estadístico. En una realización de la invención, realizar un análisis estadístico para una entidad comprende detectar si un valor residual excede un umbral predefinido para un número predefinido de etapas sucesivas. El umbral y el número de etapas de tiempo sucesivas se pueden predefinir en función de detecciones anteriores, para maximizar la relación de detección de anomalías cuando existe una anomalía (verdaderos positivos) y minimizar la relación de detección de una anomalía cuando no existe (falsas alarmas). El análisis puede usar pruebas estadísticas sobre las propiedades de los valores residuales y el cálculo de los valores P resultantes para calificar el resultado de las pruebas. Los umbrales de los valores P se pueden establecer para obtener un nivel de riesgo de obtener falsas alarmas. Establecer un valor dado implica esperar un porcentaje dado de falsas alarmas, es decir, rechazo incorrecto de suposiciones. En una realización, el análisis estadístico se realiza típicamente en valores residuales de presión o velocidad. Por ejemplo, un análisis del caudal para detectar una fuga puede realizarse en ventanas de unas pocas horas.
La etapa 410 comprende además una etapa 520 de clasificar al menos una entidad de la red en función de las reglas que se aplicarán a la salida de la etapa de análisis estadístico. Siguiendo la aplicación de las reglas, se da una clase a las entidades (por ejemplo, "fuga", "caída de presión", "problema de calidad del agua"). En una realización de la invención, la regla se basa en una comparación de los valores P dados por las pruebas estadísticas realizadas en la etapa 510, con un nivel de riesgo predefinido, dependiendo del nivel objetivo de sensibilidad del procedimiento. En una realización de la invención, la regla se basa en un algoritmo de clasificación previamente capacitado, permitiendo, en función de la simulación pasada, analizar el vector actual de valores residuales y dar la clase actual de la entidad. En una realización de la invención, hay dos clases disponibles, una representativa de estado normal y la otra representativa de uno anormal. En otras realizaciones de la invención, las clases dan una naturaleza más precisa de la anomalía, como "caída anormal de presión", "problema con la calidad del agua", etc.
El procedimiento 500 comprende además una etapa 530 para determinar la siguiente etapa de acuerdo con las clases actuales. Si una de las clases corresponde a un estado anormal (uno de los posibles estados anormales) o si el estado se detecta como periférico, el procedimiento pasa a 250. Si todas las clases se califican como normales, el procedimiento pasa a 540.
Si una de las clases corresponde a una clase anormal, la etapa 250 puede adaptarse a las entidades que se han clasificado como anormales. En una serie de realizaciones de la invención, solo las variables de control de las entidades clasificadas como anormales pueden modificarse inicialmente en la etapa 250. En otras realizaciones de la invención, controlar las variables de las entidades que se clasifican como anormales, así como las variables de control de entidades adyacentes pueden modificarse inicialmente en la etapa 250. También es posible asociar una clase en la salida de la etapa 520 para controlar variables para modificar o eventos para probar en la etapa 250. Por lo tanto,
la etapa 250 se lanza para un número reducido de posibles anomalías, correspondiente a las anomalías esperadas, en subconjuntos específicos de nodos y arcos. Este procedimiento iterativo mejor sintonizado y enfocado geográficamente da como resultado una caracterización de anomalía más rápida y precisa (ubicación, intensidad). El mejor ajuste se debe, en particular, a las condiciones de contorno más fuertes establecidas para los problemas, mientras que en la etapa 220, el modelo hidráulico es menos limitado.
En la salida de la etapa 270, el procedimiento 500 comprende una etapa 560 de enriquecer una base de datos de residuos históricos con estados normales/anormales. Esta etapa consiste en asociar los residuos con una etiqueta "normal" si no se ha identificado ninguna anomalía en la etapa 270, una etiqueta "anormal" o una etiqueta representativa de un evento, si se ha detectado un evento en la salida de la etapa 270. Esto permite enriquecer la base de datos que asocia valores residuales con un estado normal, un estado anormal o un evento, y permite obtener una clasificación adicional de los valores residuales en las ejecuciones posteriores del procedimiento, mejorando de este modo su eficiencia en el tiempo.
La etapa 540 consiste en enriquecer una base de datos de residuos con estados normales. De manera similar a la etapa 560, esto permite mejorar la clasificación de las entidades en la etapa 520 a lo largo del tiempo.
El procedimiento comprende además una etapa 550 que enriquece la base de datos histórica de clase normal, en caso de que no se cumpla el criterio 530. Esta etapa consiste en ejecutar diferentes ajustes iterativos paso a paso de propiedades y variables de control de un modelo hidráulico, y extraer vectores de características correspondientes a los diferentes tipos de anomalías. Estos vectores se consideran directamente como representantes de clase normales, posiblemente con diferentes contextos, y almacenados en la base de datos de clase normal para su uso posterior para capacitar el algoritmo de aprendizaje automático.
EJEMPLO DE REALIZACIÓN: DETECCIÓN DE UNA DISMINUCIÓN ANORMAL DE LA CONCENTRACIÓN DE CLORO RESIDUAL
A modo de ejemplo no limitativo del procedimiento 500, a continuación se describe un escenario de detección de una disminución anormal de la concentración de cloro residual.
Un sistema de distribución de agua está equipado con sensores que miden parámetros representativos de la calidad del agua, además de sensores hidráulicos. En particular, comprende sensores de la concentración de cloro residual (denominada RCC a continuación).
Un modelo hidráulico de la red ha sido calibrado durante una fase de capacitación, así como un modelo de la evolución de la RCC. En este ejemplo, los valores predichos, observados y residuales son valores de la RCC. Durante una fase de capacitación, se aplica un módulo de aprendizaje a los valores residuales de la RCC, para determinar los parámetros de los valores residuales representativos de una RCC normal.
Una vez que se calculan los valores residuales de RCC, el análisis estadístico compara los valores que son característicos de la distribución de los valores residuales con los valores históricos utilizados durante la fase de capacitación. Si los valores residuales que tienen al menos una propiedad de distribución tienen un valor anormal, un valor absoluto por encima de un umbral, para un gran número de tiempos sucesivos de referencia, un subconjunto de la red se clasifica previamente en una clase de "disminución anormal de RCC" con un índice de fiabilidad.
El ajuste iterativo paso a paso de las propiedades y las variables de control de un modelo hidráulico se inicia con el subconjunto específico de la red y la configuración correspondiente a la anomalía de la calidad del agua, en particular la evolución de la RCC. Las propiedades y las variables de control incluyen aquí parámetros específicos del modelo de cloro, como las constantes cinéticas para agua a granel en las diversas fuentes y las constantes cinéticas para cada material de tubería.
Si no se encontró previamente ningún caso de distribución anormal de RCC en la red, el procesamiento de los resultados a la salida de la resolución del modelo inverso se puede realizar utilizando una detección de anomalías o una agrupación aplicada a las constantes cinéticas. Al usar la detección de anomalías, el estado se compara con los estados históricos. Se declara como anomalía si la distancia está por encima de un umbral. Al menos un valor se clasifica en una clase de "disminución anormal de RCC" con un índice de fiabilidad.
La información sobre la anomalía y su localización se puede presentar a un operador a través de una interfaz gráfica. Esta realización es ventajosa, ya que proporciona robustez adicional a la detección de anomalías. De hecho, se detectará una anomalía si se genera primero mediante el análisis de residuos y luego se confirma y localiza gracias al modelo inverso, que se ha sintonizado más específicamente.
La figura 6 muestra un ejemplo de procedimiento para detectar anomalías en un sistema de distribución de agua en una serie de realizaciones de la invención, en la que la ejecución de un ajuste iterativo paso a paso de propiedades y variables de control de un modelo hidráulico combinado con un aprendizaje automático para identificar la anomalía depende de la salida de una clasificación de anomalías usando una combinación de reglas aplicadas a las variables de estado.
El procedimiento 600 comprende las etapas 220, 230, 250, 260 y 270 del procedimiento 400. En una serie de realizaciones de la invención, también puede comprender al menos una de las etapas 280, 290, 291, 292 del procedimiento 400.
En una serie de realizaciones de la invención, la etapa 410 del procedimiento 600 comprende una etapa 610 de realizar una serie de pruebas sobre observaciones de acuerdo con una combinación de reglas, sin usar un modelo hidráulico, y la etapa 620 de clasificar un nodo, en función de la salida de la etapa 610.
En la etapa 610, las observaciones de las variables de estado se prueban para determinar si hay anomalías y en qué punto, antes de parametrizar el procedimiento iterativo. Se realizan varias pruebas y sus resultados se combinan utilizando reglas para clasificar entidades en los diferentes estados predefinidos que se han predefinido. En una realización, el procedimiento compara todos los valores medidos de las variables con umbrales predefinidos que se han definido en función de la experiencia de los operadores. Si el valor de una variable excede el umbral, las anomalías correspondientes se seleccionan en un área que está predefinida en función de las ubicaciones de los diferentes sensores. En otra realización, se detecta una anomalía si el número de etapas de tiempo de observación excede un umbral dado. En una realización, el número de etapas de tiempo que exceden el umbral para elevar la anomalía se da a través del cálculo de probabilidad binomial y un nivel de riesgo dado. En otra realización, las nuevas variables se construyen en función de observaciones, para describir aspectos particulares que podrían estar sujetos a anomalías. En una realización, la pendiente de la regresión lineal en el tiempo se puede calcular y comparar con los umbrales para detectar una evolución anormal. En otra realización, se puede calcular un determinado percentil en observaciones (por ejemplo, 5 % o 50 %) y compararlo con umbrales predefinidos. En otra realización, los umbrales se pueden calcular en función de la combinación lineal de valores medios y desviaciones estándar observadas pasadas en las observaciones para tener en cuenta la variabilidad habitual de las señales. En una realización, los umbrales diferentes pueden basarse típicamente en 2 y 3 desviaciones estándar alrededor de los valores medios.
En una realización, cada resultado de la prueba se puede puntuar y las puntuaciones se pueden combinar con una combinación multilineal. Las puntuaciones pueden ser solo 0 y 1, pero también pueden ser más precisos, para reflejar diferentes niveles de sospecha, por ejemplo, vinculados con diferentes niveles de riesgo (con valores P) o diferentes umbrales. La combinación de puntuaciones por lo tanto proporciona un índice indicativo de la posibilidad de que una entidad esté en un estado anormal, aumentando así la robustez. En una realización, la combinación puede hacer uso de pesos, que se pueden ajustar en las fases de capacitación, para dar más importancia a una prueba en particular. En una realización, una de las pruebas puede ser más fiable, pero otras pueden reunirse para ser más fiables en conjunto. Esta combinación también se aplica a los resultados de las pruebas entre varias entidades. En una realización, la combinación se usa para evaluar si el comportamiento anormal es similar en muchas entidades, por lo tanto, son los resultados de un controlador común y no una anomalía real. Esta combinación tiene como objetivo aumentar la solidez de la inicialización del procedimiento iterativo. Usando este procedimiento, se puede probar una amplia variedad de reglas, en una serie de diferentes variables. Tal y como se explica a continuación, se pueden identificar las variables y reglas relevantes, adaptadas y mejoradas para una red dada en las etapas 540, 550 y 560. En una realización, las pruebas que se han de aplicar, las reglas y la combinación de puntuaciones se aplican de manera diferente en grupos de áreas. Estos grupos de áreas pueden ser definidos por el usuario o por un procedimiento de agrupación en función de datos históricos.
La etapa 410 del procedimiento 600 comprende además una etapa 620 de clasificación de una entidad que es muy similar a la etapa 520 del procedimiento 500, salvo por que se aplica a la salida de la combinación de las reglas 610, en lugar de la producción de estadísticas sobre valores residuales 510. De manera similar a la etapa 520, la etapa 620 se puede capacitar usando un algoritmo de aprendizaje automático, o adaptarse específicamente para clasificar las entidades de acuerdo con el resultado de la etapa 610. De forma similar, el procedimiento 600 comprende una etapa 630 para detectar o no una anomalía, que es muy similar a la etapa 530 del procedimiento 500, salvo por que se aplica a la salida de la etapa 620.
Por lo tanto, la etapa 250 se inicia con un número reducido de configuraciones, correspondiente a las anomalías esperadas, en subconjuntos específicos de nodos y arcos. Este procedimiento iterativo mejor sintonizado y enfocado geográficamente da como resultado una caracterización de anomalía más rápida y precisa (ubicación, intensidad). El mejor ajuste se debe, en particular, a las condiciones de contorno más fuertes establecidas para los problemas, mientras que en la etapa 220, el modelo hidráulico es menos limitado.
En una serie de realizaciones de la invención, el procedimiento 600 comprende además la etapa 640 de enriquecer la base de datos histórica de reglas con estados normales, y la etapa 660 de enriquecer la base de datos histórica de reglas con estados normales y anormales. Estas etapas son muy similares a las etapas 540 y 560 respectivamente, en cambio, se enriquece una base de datos de asociación de reglas y estados normales/anormales, en lugar de una base de datos de reglas de asociación de valores residuales con estados normales/anormales. Este enriquecimiento permite, durante varias ejecuciones del procedimiento, capacitar las reglas de detección previa de anomalías a una red de distribución de agua dada. De este modo, incluso sin un conocimiento a priori de las reglas sobre las variables de estado que son representativas o no de un estado anormal, el procedimiento puede adaptarse automáticamente a la red y adoptar las reglas más relevantes. En una serie de realizaciones de la invención, el sistema se inicializa con reglas arbitrarias: por ejemplo, el 1 % de los nodos que tienen el flujo de agua más importante se clasificarán como anormales. La ejecución de la etapa 250 permite determinar aquellos que realmente están en un estado anormal, y la
etapa 660 puede enriquecer la base de datos con el conocimiento del nodo que estaba en un estado normal real o anormal. Durante varias ejecuciones del procedimiento, las reglas y la clasificación en las etapas 610 y 620 adquieren un conocimiento suficiente de eventos pasados para cambiar de reglas arbitrarias a reglas de detección previa de eventos. En una serie de realizaciones de la invención, el procedimiento 600 también comprende la etapa 550 del procedimiento 500.
EJEMPLO DE REALIZACIÓN: DETECCIÓN DE UN INCREMENTO ANORMAL DE LA DEMANDA DE AGUA UTILIZANDO UNA DETECCIÓN PREVIA EN FUNCIÓN DE UNA COMBINACIÓN DE REGLAS
A modo de ejemplo no limitativo del procedimiento 600, a continuación se describe ahora un escenario de detección de un aumento anormal de la demanda de agua.
Este ejemplo demuestra la capacidad de un procedimiento 600 de acuerdo con la invención para detectar un aumento anormal de la demanda de agua, posiblemente vinculado a una fuga, con una detección previa en función de una combinación de reglas.
Este ejemplo describe la detección de un aumento anormal de la demanda de agua, que puede estar vinculado a una fuga. Las series temporales observadas de caudales se combinan para formar demandas de agua para áreas determinadas. Se calculan diferentes percentiles en estas nuevas series temporales y se comparan con umbrales en función de combinaciones lineales de desviaciones estándar observadas pasadas. En función de las ejecuciones anteriores del procedimiento, se ha aprendido un número límite de etapas de tiempo sucesivas para los cuales los percentiles deben estar por encima del umbral para detectar previamente una anomalía. Al utilizar el aprendizaje automático, este número límite de etapas de tiempo sucesivas se calcula como un número óptimo para evitar posibles anomalías y no tener demasiadas detecciones previas. Supongamos que para 3 áreas dadas, los percentiles están por encima de los umbrales en más etapas de tiempo que el número límite de etapas de tiempo que se aprendió para cada área dada. Para todas las demás áreas, los percentiles están por debajo de los umbrales en el número requerido de etapas de tiempo. Para ellos, la puntuación dada es 0. Para cada una de las 3 áreas que activan los umbrales, se da una puntuación de 1 y luego se aplica la regla de combinación: Para cada área, si su propia puntuación es 1, el porcentaje de otras áreas con una puntuación igual a 0 se compara con un umbral predefinido. En el caso actual, este porcentaje está por encima del umbral para las 3 áreas, ya que muchas otras áreas tienen una puntuación de 0. Por lo tanto, las 3 áreas se detectan previamente como anormales. La detección previa de anomalías en 3 áreas en lugar de una evita una falsa alarma en función de posibles cambios de demanda de agua que se producen al mismo tiempo en muchas áreas. Estos posibles cambios pueden deberse a la estacionalidad o un evento común específico que no debe ser señalado a la atención de los operadores. Esto aumenta la robustez del procedimiento al disminuir el índice de falsas alarmas.
El ajuste iterativo paso a paso de las propiedades y las variables de control de un modelo hidráulico se inicia con el subconjunto específico de estas 3 áreas de la red y la configuración correspondiente al aumento de la demanda de agua. Las propiedades y las variables de control están configuradas para detectar fugas en las 3 áreas dadas, como subconjuntos de nodos en los que se asigna una demanda anormal (su número disminuye a través del procedimiento de iteración) y sus perfiles de tiempo de consumo de agua.
La información sobre las anomalías y sus localizaciones se puede presentar a un operador a través de una interfaz gráfica. Esta realización es ventajosa, ya que proporciona robustez adicional a la detección de anomalías. De hecho, se detectará una anomalía si primero se plantea una combinación de reglas sobre observaciones y se confirma mediante el modelo inverso, más específicamente sintonizado.
La figura 7 muestra un ejemplo de un procedimiento para detectar anomalías en un sistema de distribución de agua en una serie de realizaciones de la invención, utilizando el aprendizaje estadístico para detectar y caracterizar previamente una anomalía y el uso de un ajuste iterativo paso a paso de propiedades y variables de control de un modelo hidráulico, agregado al aprendizaje automático para identificar la anomalía. La forma de usar esta combinación permite configurar la parte iterativa directamente en una clase de anomalía previamente identificada, con una entidad previamente identificada y centrándose en las principales anomalías para hacer que el procedimiento de detección sea más preciso y fácil de usar por los operadores. El procedimiento iterativo confirma la presencia de una anomalía y brinda información más detallada.
El procedimiento 700 comprende las etapas 220, 230, 250, 260 y 270 del procedimiento 400. En una serie de realizaciones de la invención, también puede comprender al menos una de las etapas 280, 290, 291, 292 del procedimiento 400.
En una serie de realizaciones de la invención, la etapa 410 del procedimiento 600 comprende una etapa 710 de realizar una serie de pruebas sobre observaciones de acuerdo con una combinación de reglas, sin usar un modelo hidráulico, y una etapa 720 de clasificar un nodo, en función de la salida de la etapa 710.
En la etapa 710, las observaciones de las variables de estado se prueban para determinar si hay anomalías y en qué punto, antes de parametrizar el procedimiento iterativo. El procedimiento simula los valores esperados de las observaciones, en función de sus valores pasados y controladores adicionales. En una serie de realizaciones de la invención, se capacitan varios modelos sobre datos pasados, y se selecciona el modelo que produce la mejor
predicción de datos pasados. En una realización, el procedimiento contiene modelos basados en análisis de series temporales como la técnica de promedio móvil autorregresivo (ARMA) o la técnica de promedio móvil integrado autorregresivo estacional (SARIMA). Los modelos ARMA y SARIMA aparecen desvelados principalmente en Box, George; Jenkins, Gwilym (1970). Time Series Analysis: Forecasting and Control. San Francisco: Holden-Day. En una realización, el procedimiento contiene modelos basados en algoritmos de aprendizaje automático, como bosques aleatorios o redes neuronales artificiales. En una realización, el procedimiento incluye modelos que usan valores pasados o actuales de otras variables para una observación dada de la variable. Los controladores adicionales son variables o parámetros que influyen en las observaciones. En una realización, se incluyen los volúmenes de temperatura y precipitación. En otra realización, se incluye el calendario y los períodos de tiempo con eventos específicos. Los valores simulados para las observaciones se comparan con las observaciones reales a través del cálculo de valores residuales. Los valores residuales se prueban con diferentes pruebas y sus resultados se combinan mediante reglas para clasificar entidades en los diferentes estados predefinidos. En una realización, el procedimiento prueba todos los valores residuales en comparación con umbrales predefinidos en función de la experiencia de los operadores. Si los valores residuales exceden los umbrales, las anomalías correspondientes se seleccionan en un área que se define en función de la ubicación de los diferentes sensores. En otra realización, las anomalías se marcan si demasiadas etapas de tiempo de valores residuales exceden un umbral dado, para una ventana de tiempo dada. Esta ventana de tiempo depende de la naturaleza de las variables y las anomalías que se han de detectar. En una realización, el período de tiempo puede ser de 6 horas. En una realización, el número de etapas de tiempo que exceden el umbral para elevar la anomalía se da a través del cálculo de probabilidad binomial y un nivel de riesgo dado. En otra realización, las nuevas variables se construyen en función de valores residuales, para describir aspectos particulares que podrían estar sujetos a anomalías. En una realización, la suma acumulada de valores residuales a lo largo del tiempo puede calcularse y compararse con los umbrales para detectar una evolución anormal. En otra realización, la distribución de los valores residuales se prueba con un procedimiento estadístico, para su comparación con la distribución pasada de residuos.
Si una prueba revela un cambio significativo en la distribución, se puede marcar una anomalía. En otra realización, los umbrales se pueden calcular en función de las desviaciones estándar observadas pasadas en las observaciones para tener en cuenta la variabilidad habitual de las señales. En una realización, los números de desviaciones estándar que se utilizarán pueden ser típicamente 2 y 3. En una realización, cada resultado de la prueba se puede puntuar y las puntuaciones se pueden combinar con una combinación multilineal. Las puntuaciones pueden ser solo 0 y 1, pero también pueden ser más precisos, para reflejar diferentes niveles de sospecha, por ejemplo, vinculados con diferentes niveles de riesgo (con valores P) o diferentes umbrales. La combinación de puntuaciones por lo tanto da el nivel general de sospecha en cada entidad, aumentando la robustez. En una realización, la combinación puede hacer uso de pesos, que se pueden ajustar en las fases de capacitación, para dar más importancia a una prueba en particular. En unas realizaciones, una de las pruebas puede ser más fiable, pero otras pueden reunirse para ser más fiables en conjunto. Esta combinación también se aplica a los resultados de las pruebas entre varias entidades. En una realización, la combinación se usa para evaluar si el comportamiento anormal es similar en muchas entidades, por lo tanto, son los resultados de un controlador común y no una anomalía real. Esta combinación tiene como objetivo aumentar la solidez de la inicialización del procedimiento iterativo. Los algoritmos de aprendizaje automático permiten aprender qué variables de estado, en qué entidad, son representativas de una anomalía en una red determinada. Más generalmente, la fiabilidad de los resultados de las pruebas se puede mejorar utilizando procedimientos de aprendizaje que asocian umbrales en las observaciones a la presencia o ausencia de una anomalía; el principio de adaptación del umbral es similar a la adaptación de las reglas, salvo por que se aplica directamente en umbrales de observaciones, en lugar de aplicarse a las reglas.
La etapa 410 del procedimiento 700 comprende además una etapa 720 de clasificación de una entidad que es muy similar a la etapa 520 del procedimiento 500, salvo por que se aplica a la salida de las pruebas de la etapa 710, en lugar de la producción de estadísticas sobre valores residuales 510. De manera similar a la etapa 520, la etapa 720 se puede capacitar con un algoritmo de aprendizaje automático, o adaptarse específicamente para clasificar las entidades de acuerdo con el resultado de la etapa 710. De forma similar, el procedimiento 600 comprende una etapa 730 para detectar o no una anomalía, que es muy similar a la etapa 530 del procedimiento 500, salvo por que se aplica a la salida de la etapa 720.
Por lo tanto, la etapa 250 se inicia con un número reducido de anomalías detectadas previamente, correspondiente a las anomalías esperadas, en subconjuntos específicos de nodos y arcos. Este procedimiento iterativo mejor sintonizado y enfocado geográficamente da como resultado una caracterización de anomalía más rápida y precisa (ubicación, intensidad). El mejor ajuste se debe, en particular, a las condiciones de contorno más fuertes establecidas para los problemas, mientras que en la etapa 220, el modelo hidráulico es menos limitado.
En una serie de realizaciones de la invención, el procedimiento 700 comprende además la etapa 740 de enriquecer la base de datos histórica de observaciones con estados normales, y la etapa 760 de enriquecer la base de datos histórica de observaciones con estados normales y anormales. Estas etapas son muy similares a las etapas 540 y 560 respectivamente, salvo por el hecho de que se enriquece una base de datos de asociación de observaciones y estados normales/anormales, en lugar de una base de datos de observaciones de asociación de valores residuales con estados normales/anormales. En una serie de realizaciones de la invención, el procedimiento 600 también comprende la etapa 550 del procedimiento 500. De este modo, después de varias ejecuciones del procedimiento, los algoritmos de aprendizaje automático permiten identificar las variables de estado, entidades y umbrales que son representativos de
una anomalía.
EJEMPLO DE REALIZACIÓN: DETECCIÓN DE UN INCREMENTO ANORMAL DE LA DEMANDA DE AGUA UTILIZANDO UNA DETECCIÓN PREVIA EN FUNCIÓN DE UMBRALES DE OBSERVACIONES
Mediante un ejemplo no limitativo del procedimiento 700, a continuación se describe un escenario de detección de un aumento anormal de la demanda de agua.
De manera similar al ejemplo anterior, este ejemplo demuestra la capacidad de un procedimiento de acuerdo con la invención para detectar un aumento anormal de la demanda de agua, posiblemente vinculado a una fuga. Sin embargo, este ejemplo, basado en el procedimiento 700, utiliza una comparación directa de observaciones con umbrales en lugar de una combinación de reglas.
Este ejemplo describe la detección de un aumento anormal de la demanda de agua, que puede estar vinculado a una fuga. Los caudales observados se combinan para formar demandas de agua para áreas determinadas. Estas demandas de agua se simulan con el uso de demandas de agua pasadas y análisis de series de tiempo. Las variables simuladas se utilizan para calcular valores residuales con observaciones. Se calculan las sumas acumuladas de valores residuales. Se comparan con los umbrales. Estos umbrales se basan en las variaciones observadas de las sumas acumuladas de valores residuales en el pasado. Significa que usan la medición de las variabilidades, aquí en función de medias calculadas y desviaciones estándar. En este ejemplo, para 2 áreas en toda la red, la suma acumulada de valores residuales excede los umbrales dados. Esto significa que el comportamiento esperado en términos de demanda de agua no se observa en estas 2 áreas, como los valores residuales son lo suficientemente grandes, en un número suficiente de etapas de tiempo, para decir que hay una desviación estadística. Se genera una detección previa del aumento anormal de la demanda de agua.
El ajuste iterativo paso a paso de las propiedades y las variables de control de un modelo hidráulico se inicia con el subconjunto específico de la red y la configuración correspondiente al aumento de la demanda de agua. Las propiedades y las variables de control están configuradas para detectar fugas en las 2 áreas dadas, como subconjuntos de nodos en los que se asigna una demanda anormal (su número disminuye a través del procedimiento de iteración) y sus perfiles de tiempo de consumo de agua.
La información sobre las anomalías y sus localizaciones se puede presentar a un operador a través de una interfaz gráfica. Esta realización es ventajosa, ya que proporciona robustez adicional a la detección de anomalías. De hecho, se detectará una anomalía si primero se plantea una combinación de reglas sobre observaciones y se confirma mediante el modelo inverso, más específicamente sintonizado.
La Figura 8 muestra un ejemplo de una presentación de la localización de anomalías a un operador.
Un mapa 800 de la red de un sistema de distribución de agua se muestra a un operador a través de un dispositivo de visualización. El mapa contiene líneas que representan tuberías del sistema, el ancho de las líneas es representativo del diámetro de las tuberías. El sistema contiene tuberías grandes, como las tuberías 810 y 811, así como tuberías más pequeñas, tales como las tuberías 820 y 821. Tres fugas 830, 831, 832 se han localizado en la red y se representan mediante círculos grandes. Se puede insertar información sobre la importancia relativa de las fugas. Por ejemplo, el diámetro de los círculos puede aumentar con la importancia de la fuga. También es posible representar solo la fuga que se considera la más grave o mostrar información adicional sobre la fuga, por ejemplo, una lista de fugas pasadas que tenían las características más cercanas.
Los ejemplos descritos anteriormente se dan como ilustraciones de realizaciones de la invención. No limitan de ninguna manera el ámbito de la invención que se define mediante las siguientes reivindicaciones.
Claims (16)
1. Un procedimiento (400) para detectar anomalías en un sistema de distribución de agua compuesto por una red de nodos, comprendiendo dicho procedimiento:
- parametrizar (220) un modelo hidráulico (211) del sistema de distribución de agua con un conjunto de valores (210) de variables de control que caracterizan la red y su salida en los nodos;
- utilizar sensores en la red para adquirir (230) observaciones de un subconjunto de variables de estado en primeras referencias temporales;
- identificar (410) al menos una entidad objetivo en la que cambiar los valores de las variables de control en función de al menos dichas observaciones;
- cambiar (250) el conjunto de valores de las variables de control utilizando un ajuste paso a paso de las variables de control y un criterio de interrupción en función de valores residuales de las variables de estado;
- realizar una clasificación (270) de al menos una entidad de la red en un estado de acuerdo con el conjunto de variables de control.
2. El procedimiento según la reivindicación 1, que comprende además identificar al menos una variable de control que se ha de modificar en función de al menos dichas observaciones.
3. El procedimiento según una de las reivindicaciones 1 y 2, en el que identificar al menos una entidad objetivo en la que cambiar los valores de las variables de control en función de al menos dichas observaciones comprende:
- utilizar el modelo hidráulico para calcular (320) valores predichos de un conjunto de variables de estado que caracterizan al menos una velocidad y presión del agua en los nodos, asociándose dichos valores predichos a segundas referencias temporales;
- calcular (330) valores residuales del subconjunto de las variables de estado como una diferencia entre los valores predichos y las observaciones en las segundas referencias temporales;
- realizar (510) un análisis estadístico de valores residuales en una entidad de la red en una selección de las referencias temporales;
- clasificar (520) las entidades de la red en función de reglas aplicadas a la salida del análisis estadístico.
4. El procedimiento según la reivindicación 3, en el que dicha al menos una entidad objetivo se identifica clasificándose en un estado anormal en función de la comparación de valores residuales y un umbral predefinido.
5. El procedimiento según una de las reivindicaciones 1 y 2, en el que identificar al menos una entidad objetivo en la que cambiar los valores de las variables de control en función de al menos dichas observaciones comprende identificar un arco de la red en el que el valor de una observación de la velocidad del agua excede un umbral en una entidad objetivo.
6. El procedimiento según una de las reivindicaciones 1 a 5, en el que el cambio (250) del conjunto de valores de las variables de control se realiza para al menos un tipo de evento, y las variables de control que se han de modificar se basan en dicho al menos un tipo de evento.
7. El procedimiento según la reivindicación 6, en el que se prueba una pluralidad de tipos de evento, y se realiza una instancia de cambio (250) del conjunto de valores de variables de control para cada tipo de evento.
8. El procedimiento según una de las reivindicaciones 6 y 7, cuando dependen de la reivindicación 3, en el que al menos cambiar el conjunto de valores de las variables de control se realiza para dicho al menos un tipo de evento elegido usando la clasificación (520) de las entidades de la red en función de las reglas aplicadas a la salida del análisis estadístico.
9. El procedimiento según una de las reivindicaciones 1 a 8, que comprende:
- detectar (530) una anomalía en función de la salida de la identificación (410) de al menos una entidad objetivo en la que cambiar los valores de las variables de control en función de al menos dichas observaciones;
- si no se detecta ninguna anomalía, enriquecer una base de datos de estados normales de las entidades (540); - si se detecta una anomalía:
oCambiar (250) el conjunto de valores de las variables de control utilizando un ajuste paso a paso de las variables de control y un criterio de interrupción en función de valores residuales de las variables de estado; oRealizar la segunda clasificación (270) de al menos una entidad de la red en un estado de acuerdo con el conjunto de variables de control.
10. El procedimiento según una de las reivindicaciones 1 a 9, en el que cambiar el conjunto de valores de las variables de control utilizando un ajuste paso a paso de las variables de control y un criterio de interrupción en función de valores residuales de las variables de estado comprende:
- A) cambiar el conjunto de valores de las variables de control (310);
- B) utilizar el modelo hidráulico para calcular (320) valores predichos de un conjunto de variables de estado que
caracterizan al menos la velocidad y la presión del agua en los nodos en las referencias temporales;
- C) calcular los valores residuales (330) del conjunto de variables de estado como una diferencia entre los valores predichos y las observaciones en las referencias temporales;
- D) si dichas diferencias cumplen un criterio de interrupción (340), pasar a la etapa F);
- E) si no, cambiar el conjunto de valores de las variables de control (350) y volver a la etapa B);
- F) si dichas diferencias no cumplen un criterio de refinamiento (360), seleccionar un subconjunto de la red (370) en que calcular los valores predichos, volviendo a la etapa B).
11. El procedimiento según la reivindicación 10, en el que el criterio de refinamiento comprende el cálculo de valores de una de al menos una función de cuadrado y una función objetivo bayesiana, y la selección y modificación de variables de control se determina mediante un algoritmo de Levenberg-Marquardt.
12. El procedimiento según una de las reivindicaciones 1 a 10, en el que la realización de una clasificación de al menos una entidad de la red en un estado de acuerdo con el conjunto de variables de control se realiza mediante un algoritmo de aprendizaje automático previamente capacitado.
13. El procedimiento según una de las reivindicaciones 1 a 12, en el que las variables de control comprenden variables escalares que caracterizan la topología y la topografía de la red, y variables basadas en el tiempo que caracterizan las entradas y salidas de la red que tienen al menos un valor en cada referencia temporal.
14. El procedimiento según una de las reivindicaciones 1 a 13, en el que las variables de estado caracterizan aún más la presión.
15. Un sistema para detectar anomalías en un sistema de distribución de agua compuesto por una red de nodos, comprendiendo dicho sistema:
- sensores de al menos velocidad y presión del agua en un subconjunto de nodos de la red;
- un dispositivo informático que comprende un procesador;
- enlaces de comunicación entre sensores y el dispositivo informático;
- un medio de almacenamiento;
en el que el dispositivo informático está configurado para:
- recuperar un conjunto inicial de valores de variables de control que caracterizan la red y su salida en los nodos respecto del medio de almacenamiento y utilizarlo para parametrizar un modelo hidráulico del sistema de distribución de agua;
- utilizar enlaces de comunicación entre sensores en la red para adquirir observaciones de un subconjunto de las variables de estado, teniendo dichas observaciones referencias temporales;
- ejecutar un procedimiento de acuerdo con una cualquiera de las reivindicaciones 1 a 14.
16. Un producto de programa informático, almacenado en un medio no transitorio legible por ordenador, para detectar anomalías en un sistema de distribución de agua compuesto por una red de nodos, comprendiendo dicho producto de programa informático instrucciones de código para ejecutar un procedimiento de acuerdo con una cualquiera de las reivindicaciones 1 a 14.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15306029.8A EP3112959B1 (en) | 2015-06-29 | 2015-06-29 | Method for detecting anomalies in a water distribution system |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2784233T3 true ES2784233T3 (es) | 2020-09-23 |
Family
ID=53673873
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15306029T Active ES2906411T3 (es) | 2015-06-29 | 2015-06-29 | Procedimiento de detección de anomalías en un sistema de distribución de agua |
ES15306546T Active ES2784233T3 (es) | 2015-06-29 | 2015-09-30 | Procedimiento combinado para detectar anomalías en un sistema de distribución de agua |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15306029T Active ES2906411T3 (es) | 2015-06-29 | 2015-06-29 | Procedimiento de detección de anomalías en un sistema de distribución de agua |
Country Status (10)
Country | Link |
---|---|
US (2) | US20190004484A1 (es) |
EP (2) | EP3112959B1 (es) |
CN (2) | CN107949812B (es) |
AU (2) | AU2016287383B2 (es) |
BR (1) | BR112017028077A2 (es) |
CL (2) | CL2017003382A1 (es) |
ES (2) | ES2906411T3 (es) |
MX (2) | MX2017016783A (es) |
SG (1) | SG10201910834TA (es) |
WO (2) | WO2017001522A1 (es) |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2906411T3 (es) | 2015-06-29 | 2022-04-18 | Suez Groupe | Procedimiento de detección de anomalías en un sistema de distribución de agua |
WO2017217957A1 (en) * | 2016-06-13 | 2017-12-21 | Schlumberger Technology Corporation | Runtime parameter selection in simulations |
FR3052567B1 (fr) * | 2016-06-14 | 2020-01-24 | Suez Groupe | Procede , produit programme d'ordinateur et systeme de pilotage dynamique d'un reseau fluidique |
US11514277B2 (en) * | 2017-01-10 | 2022-11-29 | Nec Corporation | Sensing system, sensor node device, sensor measurement value processing method, and program |
US10963797B2 (en) * | 2017-02-09 | 2021-03-30 | Caterpillar Inc. | System for analyzing machine data |
US11373105B2 (en) * | 2017-04-13 | 2022-06-28 | Oracle International Corporation | Autonomous artificially intelligent system to predict pipe leaks |
FR3071920B1 (fr) * | 2017-09-29 | 2020-11-06 | Suez Groupe | Detection et caracterisation ameliorees d'anomalies dans un continuum d'eau |
WO2019063648A1 (fr) * | 2017-09-29 | 2019-04-04 | Suez Groupe | Detection et caracterisation ameliorees d'anomalies dans un continuum d'eau |
US10776191B2 (en) | 2017-11-30 | 2020-09-15 | International Business Machines Corporation | Anomaly detection in a sensor network |
US10642262B2 (en) * | 2018-02-27 | 2020-05-05 | Woodward, Inc. | Anomaly detection and anomaly-based control |
US11328102B2 (en) * | 2018-03-29 | 2022-05-10 | Aecom | Digital design tools for building construction |
US11176383B2 (en) * | 2018-06-15 | 2021-11-16 | American International Group, Inc. | Hazard detection through computer vision |
US11859846B2 (en) | 2018-06-15 | 2024-01-02 | Johnson Controls Tyco IP Holdings LLP | Cost savings from fault prediction and diagnosis |
US11474485B2 (en) | 2018-06-15 | 2022-10-18 | Johnson Controls Tyco IP Holdings LLP | Adaptive training and deployment of single chiller and clustered chiller fault detection models for connected chillers |
CN109190783B (zh) * | 2018-07-03 | 2021-11-09 | 北京交通大学 | 城市水网渗漏空间聚集性检测及关键影响因素识别方法 |
FR3083553B1 (fr) * | 2018-07-09 | 2023-05-19 | Suez Groupe | Placement ameliore de capteurs de parametres physico-chimiques dans un fluide |
CN108898190A (zh) * | 2018-07-24 | 2018-11-27 | 深圳市源广浩电子有限公司 | 一种基于环保大数据的环境监测预警方法及系统 |
CN109325692B (zh) * | 2018-09-27 | 2021-01-22 | 清华大学合肥公共安全研究院 | 水管网的数据实时分析方法及装置 |
CN109376925B (zh) * | 2018-10-23 | 2021-07-23 | 青岛理工大学 | 供水管网节点流量动态自适应优化方法 |
ES2938909T3 (es) * | 2018-12-20 | 2023-04-17 | Suez Int | Un procedimiento mejorado para evaluar el estado de la tubería |
CN109783979B (zh) * | 2019-02-15 | 2021-03-26 | 吉林大学 | 一种城市供水管网半监督条件下泄漏监测传感器布局优化方法 |
EP3699569A1 (de) * | 2019-02-25 | 2020-08-26 | Siemens Aktiengesellschaft | Detektion einer leckage in einem versorgungsnetz |
CN111626460B (zh) * | 2019-02-27 | 2024-03-26 | 深圳电蚂蚁数据技术有限公司 | 一种区域用水网络拓扑关系确认方法、装置和系统 |
CN109991855B (zh) * | 2019-04-23 | 2021-11-30 | 杭州电子科技大学 | 一种基于分布式优化策略的供水管网容量平稳控制方法 |
CN113614665B (zh) * | 2019-04-25 | 2024-10-01 | Abb瑞士股份有限公司 | 使用人工智能在过程工业中进行生产核算的方法和系统 |
US11150658B2 (en) * | 2019-05-06 | 2021-10-19 | Florida Atlantic University Board Of Trustees | Hybrid aerial/underwater robotics system for scalable and adaptable maintenance of aquaculture fish farms |
CN110175200A (zh) * | 2019-05-31 | 2019-08-27 | 国网上海市电力公司 | 一种基于人工智能算法的异常用能分析方法及系统 |
US11375677B2 (en) * | 2019-06-19 | 2022-07-05 | Max Safai | Fluid conservation system and methods of use |
CN110448849A (zh) * | 2019-07-08 | 2019-11-15 | 阮东 | 一种基于机器学习的消火栓压力监测系统及方法 |
US11204299B2 (en) | 2019-09-26 | 2021-12-21 | Wipro Limited | Method and system for predicting water leakage events in district-metered-area of water distribution network |
CN110796173B (zh) * | 2019-09-27 | 2023-05-16 | 昆明电力交易中心有限责任公司 | 一种基于改进kmeans的负荷曲线形态聚类算法 |
WO2021081250A1 (en) * | 2019-10-22 | 2021-04-29 | Eog Resources, Inc. | Anomaly detection in pipelines and flowlines |
US20210142168A1 (en) * | 2019-11-07 | 2021-05-13 | Nokia Technologies Oy | Methods and apparatuses for training neural networks |
DE102020202865B3 (de) * | 2020-03-06 | 2021-08-26 | Robert Bosch Gesellschaft mit beschränkter Haftung | Verfahren und Recheneinheit zur Überwachung des Zustandes einer Maschine |
CN113379176B (zh) * | 2020-03-09 | 2023-12-19 | 中国移动通信集团设计院有限公司 | 电信网络异常数据检测方法、装置、设备和可读存储介质 |
FR3109214B1 (fr) * | 2020-04-09 | 2022-09-02 | Sagemcom Energy & Telecom Sas | Procédé de détection et de localisation d’une fuite de fluide |
WO2021232016A1 (en) * | 2020-05-15 | 2021-11-18 | Phyn Llc | Liquid flow processing for plumbing systems |
CN111753877B (zh) * | 2020-05-19 | 2024-03-05 | 海克斯康制造智能技术(青岛)有限公司 | 一种基于深度神经网络迁移学习的产品质量检测方法 |
FR3110724B1 (fr) | 2020-05-25 | 2024-03-01 | Suez Groupe | Détection améliorée de changement de composition physico-chimique d’un liquide |
US11676368B2 (en) * | 2020-06-30 | 2023-06-13 | Optum Services (Ireland) Limited | Identifying anomalous activity from thermal images |
CN111736471B (zh) * | 2020-07-14 | 2021-06-15 | 江南大学 | 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法 |
US11657122B2 (en) * | 2020-07-16 | 2023-05-23 | Applied Materials, Inc. | Anomaly detection from aggregate statistics using neural networks |
FR3114648B1 (fr) * | 2020-09-25 | 2023-06-23 | Veolia Environnement | Procédé de caractérisation de fuite |
CN112434470B (zh) * | 2020-12-03 | 2022-05-31 | 中国电建集团华东勘测设计研究院有限公司 | 河道分流口门水位数据外延方法、装置、存储介质及设备 |
CN112727415A (zh) * | 2021-02-03 | 2021-04-30 | 哈尔滨理工大学 | 一种分层注水系统自动配注方法 |
CN112780953B (zh) * | 2021-02-08 | 2022-07-12 | 浙江工业大学 | 一种基于模式检测的独立计量区域管网漏损检测方法 |
CN113065228B (zh) * | 2021-03-10 | 2024-02-20 | 中国大唐集团科学技术研究院有限公司西北电力试验研究院 | 一种基于朴素贝叶斯的汽轮机阀门关闭时间评估方法 |
CN113469235B (zh) * | 2021-06-24 | 2024-04-26 | 珠海卓邦科技有限公司 | 用水波动异常识别方法及装置、计算机装置及存储介质 |
CN113408548A (zh) * | 2021-07-14 | 2021-09-17 | 贵州电网有限责任公司电力科学研究院 | 变压器异常数据检测方法、装置、计算机设备和存储介质 |
GB202112111D0 (en) * | 2021-08-24 | 2021-10-06 | Imperial College Innovations Ltd | Method for automatically maintaining and improving in a hydraulic model for a water distribution network, and controlling the operation of a water |
US20230075475A1 (en) * | 2021-09-07 | 2023-03-09 | PeerNova, Inc. | Outlier Determination Among Models of Future Event Prediction |
CN113518011B (zh) * | 2021-09-10 | 2022-03-01 | 阿里云计算有限公司 | 异常检测方法和装置、电子设备及计算机可读存储介质 |
US11960254B1 (en) * | 2022-03-11 | 2024-04-16 | Bentley Systems, Incorporated | Anomaly detection and evaluation for smart water system management |
FR3139918A1 (fr) * | 2022-09-20 | 2024-03-22 | Smart And Blue | Procédé de classification par apprentissage supervisé d’évènements de consommation fluidique par un bâtiment à surveiller parmi plusieurs classes d’éléments consommateurs |
CN116108604B (zh) * | 2023-04-13 | 2023-06-20 | 四川奥凸环保科技有限公司 | 一种供水管网异常检测方法、系统、设备及存储介质 |
CN116542635B (zh) * | 2023-07-05 | 2023-10-20 | 浙江和达科技股份有限公司 | 一种水务数据的智能监测方法、装置及电子设备 |
CN117170249B (zh) * | 2023-10-30 | 2024-01-16 | 铵泰克(北京)科技有限公司 | 用于网络化控制系统的自适应优化控制方法和系统 |
CN118258976B (zh) * | 2024-05-31 | 2024-08-06 | 国家海洋环境监测中心 | 一种基于北斗短报文的海域水质监测方法及其系统 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7457735B2 (en) * | 2001-11-14 | 2008-11-25 | Bentley Systems, Incorporated | Method and system for automatic water distribution model calibration |
CN1312629C (zh) | 2005-11-11 | 2007-04-25 | 杭州电子科技大学 | 城市排水系统不确定水力学模型建模方法 |
US8635051B1 (en) | 2008-08-28 | 2014-01-21 | Bentley Systems, Incorporated | System and method for pressure-dependent demand optimization for leakage detection |
GB0908184D0 (en) * | 2009-05-13 | 2009-06-24 | Univ Exeter | Bayesian-based online burst detection in water distribution systems |
SG188534A1 (en) * | 2010-09-14 | 2013-04-30 | Amitsur Preis | System and method for water distribution modelling |
JP5793299B2 (ja) * | 2010-12-28 | 2015-10-14 | 株式会社東芝 | プロセス監視診断装置 |
GB2487435A (en) * | 2011-01-24 | 2012-07-25 | Webstech Aps | Enhanced wireless sensor location estimation using multiple location estimates and at least one measured medium characteristic |
CN102201065B (zh) * | 2011-05-16 | 2012-11-21 | 天津大学 | 基于轨迹分析的监控视频异常事件检测方法 |
CN102340811B (zh) * | 2011-11-02 | 2014-11-26 | 中国农业大学 | 无线传感器网络故障诊断方法 |
NO347239B1 (no) * | 2011-11-16 | 2023-07-24 | Abb Schweiz Ag | System og fremgangsmåte for å optimalisere operasjon av et vann nettverk |
US20130262068A1 (en) * | 2012-03-28 | 2013-10-03 | International Business Machines Corporation | Sensor placement for leakage location in liquid distribution networks |
CN102681442B (zh) * | 2012-05-28 | 2014-08-20 | 上海海事大学 | 一种全电船区域配电智能容错控制系统及控制方法 |
US9582775B2 (en) * | 2012-12-10 | 2017-02-28 | International Business Machines Corporation | Techniques for iterative reduction of uncertainty in water distribution networks |
CN103472820B (zh) | 2013-09-18 | 2015-07-15 | 哈尔滨工业大学 | 一种基于偏最小二乘算法的推进系统故障诊断方法 |
JP6214979B2 (ja) * | 2013-09-19 | 2017-10-18 | 株式会社日立製作所 | 配水管網の情報システム |
CN104462652B (zh) * | 2014-11-07 | 2017-09-08 | 中国人民解放军海军工程大学 | 一种无轴驱动式集成电机泵喷推进器水力模型的设计方法 |
ES2906411T3 (es) | 2015-06-29 | 2022-04-18 | Suez Groupe | Procedimiento de detección de anomalías en un sistema de distribución de agua |
-
2015
- 2015-06-29 ES ES15306029T patent/ES2906411T3/es active Active
- 2015-06-29 EP EP15306029.8A patent/EP3112959B1/en active Active
- 2015-09-30 EP EP15306546.1A patent/EP3112960B1/en active Active
- 2015-09-30 ES ES15306546T patent/ES2784233T3/es active Active
-
2016
- 2016-06-29 AU AU2016287383A patent/AU2016287383B2/en active Active
- 2016-06-29 WO PCT/EP2016/065212 patent/WO2017001522A1/en active Application Filing
- 2016-06-29 MX MX2017016783A patent/MX2017016783A/es unknown
- 2016-06-29 WO PCT/EP2016/065213 patent/WO2017001523A1/en active Application Filing
- 2016-06-29 SG SG10201910834TA patent/SG10201910834TA/en unknown
- 2016-06-29 US US15/737,710 patent/US20190004484A1/en active Pending
- 2016-06-29 CN CN201680049486.5A patent/CN107949812B/zh active Active
- 2016-06-29 US US15/737,704 patent/US11281203B2/en active Active
- 2016-06-29 AU AU2016286280A patent/AU2016286280B2/en active Active
- 2016-06-29 MX MX2017016784A patent/MX2017016784A/es unknown
- 2016-06-29 CN CN201680045293.2A patent/CN108027594B/zh active Active
- 2016-06-29 BR BR112017028077A patent/BR112017028077A2/pt not_active Application Discontinuation
-
2017
- 2017-12-26 CL CL2017003382A patent/CL2017003382A1/es unknown
- 2017-12-26 CL CL2017003377A patent/CL2017003377A1/es unknown
Also Published As
Publication number | Publication date |
---|---|
BR112017028077A2 (pt) | 2018-08-28 |
EP3112960B1 (en) | 2020-01-08 |
CN107949812A (zh) | 2018-04-20 |
CL2017003377A1 (es) | 2018-06-15 |
CN108027594A (zh) | 2018-05-11 |
CN108027594B (zh) | 2021-06-22 |
MX2017016783A (es) | 2018-11-09 |
WO2017001523A1 (en) | 2017-01-05 |
US20180181111A1 (en) | 2018-06-28 |
AU2016287383A1 (en) | 2018-01-18 |
CL2017003382A1 (es) | 2018-06-15 |
AU2016287383B2 (en) | 2020-01-16 |
ES2906411T3 (es) | 2022-04-18 |
US11281203B2 (en) | 2022-03-22 |
WO2017001522A1 (en) | 2017-01-05 |
MX2017016784A (es) | 2019-05-27 |
EP3112960A1 (en) | 2017-01-04 |
SG10201910834TA (en) | 2020-01-30 |
US20190004484A1 (en) | 2019-01-03 |
CN107949812B (zh) | 2021-09-14 |
EP3112959B1 (en) | 2021-12-22 |
AU2016286280B2 (en) | 2020-02-27 |
EP3112959A1 (en) | 2017-01-04 |
AU2016286280A1 (en) | 2018-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2784233T3 (es) | Procedimiento combinado para detectar anomalías en un sistema de distribución de agua | |
US10373056B1 (en) | Unsupervised model building for clustering and anomaly detection | |
KR102009574B1 (ko) | 하천에서의 홍수범람 대응 관리 방법 및 하천에서의 홍수범람 대응 관리 시스템 | |
CN112242060B (zh) | 交通流量预测方法及装置、计算机设备及可读存储介质 | |
KR102435919B1 (ko) | 다차원 데이터를 이용한 옥내 누수 탐지 및 유형 구분 장치, 방법 및 프로그램 | |
AU2015315838A1 (en) | Apparatus and method for ensembles of kernel regression models | |
US20220222545A1 (en) | Generation method, non-transitory computer-readable storage medium, and information processing device | |
Ghannam et al. | Comparison of deep learning approaches for forecasting urban short-term water demand a Greater Sydney Region case study | |
Scalabrin et al. | A Bayesian forecasting and anomaly detection framework for vehicular monitoring networks | |
US20160275407A1 (en) | Diagnostic device, estimation method, non-transitory computer readable medium, and diagnostic system | |
Zhang et al. | An unsupervised leak detection method with aggregating prediction and reconstruction along projection pathway for natural gas gathering pipelines | |
US20220222580A1 (en) | Deterioration detection method, non-transitory computer-readable storage medium, and information processing device | |
CN113516179B (zh) | 一种地下基础设施渗漏水性态辨识方法及系统 | |
US20220196512A1 (en) | Detection of a leakage in a supply grid | |
Anagnostopoulos et al. | Enhancing virtual sensors to deal with missing values and low sampling rates | |
Maslov et al. | Blpa: Bayesian learn-predict-adjust method for online detection of recurrent changepoints | |
CN110197668A (zh) | 一种音频预测模型的构建方法及计算机可读存储介质 | |
BR112017028076B1 (pt) | Métodos e sistema para detectar anomalias em um sistema de distribuição de água e meio não transitório legível por computador | |
US20220222579A1 (en) | Deterioration detection method, non-transitory computer-readable storage medium, and information processing device | |
Mahdi et al. | Internet-of-Things-Based Rain Detection Device Using Machine Learning Classification for Rain Prediction at Telkom University | |
de Vitry et al. | Calibrating urban flood models with qualitative probabilistic flooding information extracted from CCTV footage | |
Chen et al. | Uncertainty-aware Sensor Data Anomaly Detection for Autonomous Vehicles | |
Agbo et al. | Missing Data Recovery for Downstream Learning in Low-Cost Environmental Sensor Networks | |
CN117973826A (zh) | 智慧水利中基于流程的安全检测方法、系统、设备及介质 | |
CN117970182A (zh) | 一种基于dtw算法的漏电预警方法及系统 |