BR112017028076B1 - Métodos e sistema para detectar anomalias em um sistema de distribuição de água e meio não transitório legível por computador - Google Patents

Métodos e sistema para detectar anomalias em um sistema de distribuição de água e meio não transitório legível por computador Download PDF

Info

Publication number
BR112017028076B1
BR112017028076B1 BR112017028076-0A BR112017028076A BR112017028076B1 BR 112017028076 B1 BR112017028076 B1 BR 112017028076B1 BR 112017028076 A BR112017028076 A BR 112017028076A BR 112017028076 B1 BR112017028076 B1 BR 112017028076B1
Authority
BR
Brazil
Prior art keywords
values
network
variables
nodes
control variables
Prior art date
Application number
BR112017028076-0A
Other languages
English (en)
Inventor
Guillaume CUSSONNEAU
Pierre-Antoine JARRIGE
Abel DEMBELE
Francis CAMPAN
Original Assignee
Suez Groupe
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suez Groupe filed Critical Suez Groupe
Publication of BR112017028076B1 publication Critical patent/BR112017028076B1/pt

Links

Abstract

MÉTODO PARA DETECTAR ANOMALIAS EM UM SISTEMA DE DISTRIBUIÇÃO DE ÁGUA . A invenção é relativa a um método e a um sistema para detectar anomalias em um sistema de distribuição de água. O sistema de distribuição de água compreende uma rede de nós e é equipado com sensores de no mínimo velocidade da água e em um subconjunto dos nós. O sistema de distribuição de água é modelado por um modelo hidráulico. O método de acordo com a invenção compreende a parametrização do modelo hidráulico com valores iniciais de um conjunto de variáveis de controle, usando os sensores para obter valores das variáveis da técnica da rede nos nós, usando o modelo hidráulico para calcular os valores previstos das variáveis da técnica, calculando de maneira recursiva os valores das variáveis de controle que, aplicados ao modelo hidráulico, permitem a obtenção dos valores previstos das variáveis da técnica que sejam mais próximos dos valores observados e a classificação dos nós da rede com base nos valores das variáveis de controle.

Description

CAMPO DA INVENÇÃO
[0001] A presente invenção é relativa à detecção de anomalias em um sistema de distribuição de água. Mais especificamente, ela é relacionada à detecção de anomalias com o uso combinado de estatística e um modelo hidráulico do sistema de distribuição de água.
ANTECEDENTES DA INVENÇÃO
[0002] Um sistema para distribuir água potável é feito principalmente de canos entre uma coluna d'água e os consumidores, juntamente com dispositivos de controle, como válvulas e bombas. Este sistema pode estar sujeito a várias anomalias. As anomalias pertencem a vários tipos. As anomalias hidráulicas compreendem vazamentos, variação anormal da pressão, queda rápida do nível de água de um reservatório, equilíbrio de massa incoerente de armazenamento. As anomalias operacionais definem um elemento no sistema que é um estado incorreto, por exemplo, uma válvula em um estado de abertura diferente do armazenado no sistema de informação. Estas anomalias, especialmente vazamentos, podem reduzir significativamente o desempenho do sistema de distribuição de água. Por exemplo, vazamentos nos canos são a causa da perda de uma parte significativa da água entre a coluna d'água e os consumidores e pode provocar danos estruturais. A detecção e a correção de anomalias em um sistema de distribuição de água é, portanto, uma preocupação permanente dos operadores destes sistemas para atenuar o custo econômico da perda e danos da água. Além disso, a detecção de vazamentos em um sistema de distribuição de água e um objetivo chave para limitar o consumo e desperdício global de água, o que é de interesse particular em regiões sujeitas a stress hídrico e tendo em vista a promoção do desenvolvimento sustentável.
[0003] A detecção de vazamentos em um sistema de detecção de água é historicamente realizada através de inspeção humana. A inspeção humana geralmente consiste do envio de operadores humanos para identificar os canos do sistema e identificar vazamentos e outras anomalias. Esta detecção pode, por exemplo, ser auxiliada pela utilização de sensores de áudio, que detectam o ruído devido a um vazamento. Entretanto, o tamanho tipicamente grande dos sistemas de distribuição de água torna muito difícil a detecção humana de vazamentos e anomalias. Por exemplo, o sistema de distribuição de água de uma grande cidade compreende milhares de quilômetros de canos. É, portanto, impossível inspecionar todos os canos frequentemente a um custo razoável.
[0004] O uso de sensores contribui para uma solução para o problema de detectar anomalias em um sistema de distribuição de água. Os sensores podem ser usados principalmente para detectar automaticamente mudanças anormais no comportamento do sistema, portanto, os operadores humanos podem ser enviados para os nós/arcos do sistema nos quais o comportamento anormal foi detectado. Entretanto, métodos de detecção de anomalias baseados em sensores também têm desvantagens. Eles podem gerar um alto número de falsos positivos (alarmes para eventos que não são anomalias reais) e levar a várias intervenções humanas inúteis e dispendiosas. Eles podem também detectar anomalias adequadamente, mas com localização imprecisa, devido à larga escala de um sistema de distribuição de água típico. De outra forma, implantar uma alta densidade de sensores no sistema pode ajudar na localização mais precisa de anomalias, mas isto é muito caro.
[0005] A patente US 8635051 revela um método para identificar vazamentos em um sistema de distribuição de água. Este método compreende o uso de um modelo dos vazamentos e a aplicação iterativa deste modelo para obter os valores previstos de consumo de água, comparando os valores de saída com observações, atualizando os valores para obter um modelo melhor, até que a diferença entre as previsões e observações esteja abaixo de um limite, ou que um limite no número de interações seja atingido. O uso de um modelo hidráulico por este método permite identificar um vazamento em um nó no qual nenhum sensor esteja disponível. Entretanto, falta uma comparação histórica para comparar observações com dados históricos. Portanto, a robustez da previsão é reduzida, pois um limite para detectar um vazamento ou valor anormal precisa ser definido anteriormente.
[0006] Há, portanto, a necessidade de um método para aperfeiçoar a robustez da detecção automática e localização de anomalias em um sistema de distribuição de água. O método proposto é baseado no uso de um modelo hidráulico e em um processamento estatístico da série temporal de medições em nós selecionados do sistema.
RESUMO DA INVENÇÃO
[0007] Para este efeito, a invenção apresenta um método para detectar anomalias de acordo com a reivindicação 1, um sistema para detectar anomalias de acordo com a reivindicação 14 e um programa de computador de acordo com a reivindicação 15. As reivindicações dependentes definem as configurações preferidas da presente invenção.
[0008] A invenção revela também um método para detectar anomalias em um sistema de distribuição de água composto por uma rede de nós, tal método compreendendo: A) A parametrização de um modelo hidráulico do sistema de distribuição de água pela inicialização de um conjunto de valores de variáveis de controle caracterizando a rede e o seu rendimento nos nós; B) o uso de sensores na rede para adquirir as observações de um subconjunto de variáveis de estado, tais observações tendo referências temporais; C) modificação do conjunto de valores de variáveis de controle; D) uso do modelo hidráulico para calcular os valores previstos de um conjunto de variáveis de estado caracterizando no mínimo velocidade e pressão da água nos nós, nas referências temporais; E) cálculo (330) dos valores residuais do conjunto de variáveis de estado como uma diferença entre os valores previstos e as observações das referências temporais; F) se tais diferenças satisfizerem um critério de quebra, vá para a etapa H; G) se não, modifique o conjunto de valores das variáveis de controle e volte para a etapa D); H) se tais diferenças satisfizerem um critério de refinamento, vá para a etapa J); I) se não, selecione um subconjunto da rede onde os valores previstos são calculados, voltando à etapa D); J) classificação de uma entidade da rede em um estado de acordo com o conjunto de variáveis de controle.
[0009] Vantajosamente, as etapas C) a J) são realizadas para no mínimo um tipo de evento e a modificação do estado de variáveis de controle é realizada de acordo com tal no mínimo um tipo de evento.
[0010] Isto permite modificar as variáveis de controle que sabe-se que são afetadas por um evento, aumentando, portanto, a confiabilidade e a robustez da detecção do evento.
[0011] Vantajosamente, vários tipos de eventos são testados e uma das etapas C) a J) é realizada para cada tipo de evento.
[0012] Isto permite detectar em uma única execução do método vários tipos de eventos ou anomalias na rede.
[0013] Vantajosamente, o critério de refinamento compreende o cálculo de valores de no mínimo um quadrado mínimo e uma função objetiva bayesiana e a seleção e modificação de variáveis de controle é determinada por um algoritmo de Levenberg-Marquardt.
[0014] Usar uma função objetiva bayesiana permite calibrar a confiança relativa das medições e os valores modificados das variáveis de controle e estado. Usar o algoritmo de Levenberg-Marquadt permite ter boa convergência e qualidades de estabilidade.
[0015] Vantajosamente, a classificação de uma entidade da rede é realizada por um algoritmo de aprendizagem por máquina anteriormente treinado.
[0016] Isto permite ter regras de classificação otimizadas para um determinado sistema de distribuição de água, cuja confiabilidade cresce com o tempo.
[0017] Vantajosamente, as variáveis de controle compreendem variáveis escalares caracterizando a topologia e a topografia da rede e variáveis baseadas no tempo caracterizando as entradas e saídas da rede, tendo no mínimo um valor em cada referência temporal.
[0018] Isto permite aumentar o número de eventos possíveis detectados pelo método.
[0019] Vantajosamente, a modificação do conjunto de valores das variáveis de controle compreende a modificação de no mínimo um dentre: os valores de um subconjunto de controle baseado no tempo; os valores de um subconjunto das variáveis de controle escalares calculados durante uma fase de modelagem da rede.
[0020] Isto permite aproveitar integralmente as disponibilidades de controle escalares e baseadas no tempo.
[0021] Vantajosamente, a modificação dos valores de um subconjunto das variáveis de controle baseadas no tempo compreende a modificação dos valores das variáveis de controle baseadas no tempo representativas do consumo de água.
[0022] Isto permite detectar eventos que são detectados por um aumento anormal do consumo de água, por exemplo, vazamentos.
[0023] Vantajosamente, as variáveis de estado caracterizam também a pressão.
[0024] Isto permite ter uma modelagem mais completa e eficiente da evolução temporal dos parâmetros físicos do sistema de distribuição de água.
[0025] A invenção apresenta também um método de detectar anomalias em um sistema de detecção de água composto de uma rede de nós, tal método compreendendo: a parametrização de um modelo hidráulico do sistema de distribuição de água com um conjunto de valores de variáveis de controle caracterizando a rede e seu rendimento nos nós; uso de sensores na rede para adquirir observações de um subconjunto das variáveis de estado em referências temporais; uso do modelo hidráulico para calcular o valor previsto de um conjunto de variáveis de estado caracterizando no mínimo uma velocidade da água nos nós, tais valores tendo referências temporais; cálculo dos valores residuais do subconjunto de variáveis de estado como uma diferença entre os valores previstos e as observações nas referências temporais; realização de uma análise estatística de valores residuais em uma entidade da rede em uma seleção das referências temporais; classificação de no mínimo um dentre um nó e um arco da rede baseados em um índice de qualidade na saída da análise estatística.
[0026] Vantajosamente, a análise estatística compreende o cálculo de um de uma média, um desvio padrão, uma média absoluta ou desvio mediano, um modelo auto-regressivo, boxpot, Support Vector Machine, uma Principal Component Analysis (PCA), vizinhança mais próxima de K e resultados de testes estatísticos (calculando os valores P).
[0027] Isto permite um melhor entendimento do comportamento histórico do sistema de distribuição de água e uma adaptação da detecção para a nova situação com o feedback de usuários.
[0028] Vantajosamente, um nó é classificado em uma classe representativa de um estado anormal se os valores residuais na entidade da rede ultrapassarem um limite baseado na análise estatística de dados históricos e nível de risco operacional em um número predefinido de referências temporais sucessivas.
[0029] Vantajosamente, um método compreendendo a etapa dos dois métodos descritos acima compreende também a classificação da rede em um estado na saída de: J) classificação de uma entidade da rede em um estado de acordo com o conjunto de variáveis de controle; e classificação de no mínimo um dentre um nó e um arco da rede com base em um índice de qualidade na saída da análise estatística.
[0030] A invenção apresenta também um sistema para detectar anomalias em um sistema de distribuição de água composto de uma rede de nós, tal sistema compreendendo: sensores no mínimo de velocidade e pressão da água em um subconjunto de nós da rede; um dispositivo de cálculo compreendendo um processador; links de comunicação entre sensores e o dispositivo de cálculo; meios de armazenamento; no qual o dispositivo de cálculo é configurado para: recuperar um conjunto inicial de valores de variáveis de controle caracterizando a rede e seu rendimento nos nós a partir dos meios de armazenamento e utilizando-o para parametrizar o modelo hidráulico do sistema de distribuição de água; uso de links de comunicação entre sensores na rede para adquirir observações de um subconjunto das variáveis de estado, tais observações tendo referências temporais; execução de um dos métodos revelados acima.
[0031] A invenção apresenta também um programa de computador, armazenado em um meio legível por computador não transitório, detectando anomalias em um sistema de distribuição de água composto por uma rede de nós, tal programa de computador compreendendo instruções de código para executar um dos métodos revelados acima.
[0032] A invenção melhora a confiabilidade da detecção e identificação de estados anormais em uma rede de distribuição de água.
[0033] A invenção é aplicável a uma ampla gama de anomalias, compreendendo detecção de vazamentos, degradação da qualidade da água, problema com sensor e comportamento incorreto de dispositivo do sistema de distribuição de água potável.
[0034] As anomalias detectadas pelo método e confirmadas por operadores podem ser usadas para alimentar algoritmos de aprendizagem para detectar mais anomalias com maior precisão.
[0035] O método tem uma melhor robustez graças ao uso de medições históricas. O método leva em conta a variabilidade observada e a incerteza das medições.
[0036] O método facilita a localização e identificação de anomalias e é capaz de apresentar anomalias a um operador, separadas por criticidade.
[0037] O método reduz o custo da operação de um sistema de distribuição de água ao limitar o número de intervenções humanas no sistema.
[0038] O método reduz o custo de operar um sistema de distribuição de água ao limitar o número de sensores necessários para localizar anomalias com precisão.
[0039] Todas as configurações descritas na presente especificação podem ser combinadas em qualquer combinação, exceto combinações mutuamente excludentes.
BREVE DESCRIÇÃO DOS DESENHOS
[0040] A invenção será melhor entendida e suas várias características e vantagens surgirão da seguinte descrição de várias configurações de exemplo e suas figuras anexas, nas quais: - A Figura 1 mostra um exemplo de um sistema de distribuição de água organizado em rede de acordo com o conhecimento anterior; - A Figura 2 apresenta um exemplo de método para detectar anomalias em um sistema de distribuição de água em várias configurações da invenção, usando um ajuste iterativo em etapas das propriedades e variáveis de controle de modelo hidráulico para uma aprendizagem por máquina para identificar a anomalia; - A Figura 3 mostra o exemplo de um método para identificar parâmetros para um evento alvo em várias configurações da invenção; - A Figura 4 apresenta um exemplo de método para detectar anomalias em um sistema de distribuição de água em várias configurações da invenção, usando uma análise estatística dos valores residuais da comparação do resultado do modelo hidráulico e observação; - A Figura 5 apresenta um exemplo de método para detectar anomalias em um sistema de distribuição de água em várias configurações da invenção, usando uma combinação de análise estatística em valores residuais do modelo hidráulico para caracterizar a situação de calibração e um ajuste iterativo em etapas das propriedades e variáveis de controle de um modelo hidráulico, aprendizagem por máquina para identificar a anomalia; - A Figura 6 mostra um exemplo de uma apresentação da localização de anomalias a um operador.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[0041] Nesta especificação, a invenção será descrita por meio de exemplos relacionados à detecção de uma válvula em um estado de abertura falsa, um problema com sensor e um evento de vazamento. Entretanto, a invenção não é restrita a estes exemplos e pode ser aplicada à detecção de qualquer anomalia em um sistema de distribuição de água.
[0042] A figura 1 mostra um exemplo de um sistema de distribuição de água organizado em uma rede de acordo com o conhecimento anterior.
[0043] A rede 100 mostrada na figura 1 é organizada como uma rede e compreende uma pluralidade de nós 110, 111, 112, 113, 114, 115, 116 e 117, e uma pluralidade de arcos 120, 121, 122, 123, 124, 125, 126, 127 e 128. Os nós normalmente representam as conexões com fontes de água ou reservatórios de água, por exemplo o reservatório 130 no nó 116, as conexões com o usuário do sistema de distribuição de água, por exemplo consumo 131 no nó 113, e as conexões entre os arcos. Os arcos normalmente representam canos entre os nós. A rede pode ser equipada com equipamentos como válvulas e bombas. Uma bomba 132 está presente, por exemplo, no arco 120. De maneira mais geral, um nó pode ser uma junção entre dois ou três canos, um ponto no qual as entradas ou saídas da rede são encontradas, por exemplo um ponto onde um usuário consome água ou um ponto no qual a água é injetada na rede. Um nó pode também representar uma sub-rede, por exemplo um bairro agrupado sob um único nó.
[0044] Os parâmetros físicos relacionados à água compreendem principalmente, por exemplo, velocidade, pressão, vazão, nível no armazenamento (reservatório e tanque), temperatura, etc. Outros parâmetros podem ser adicionados de acordo com as necessidades de detecção e/ou evolução dos sensores. A evolução destes parâmetros com o tempo depende das características do sistema de distribuição de água, das entradas e saídas nos nós e do estado de qualquer equipamento no sistema.
[0045] Os atributos do sistema de distribuição de água compreendem principalmente: - a topologia da rede (ou seja, o gráfico com arcos e nós); - a topografia da rede (ou seja, a elevação dos nós, - as propriedades dos canos, como comprimento, diâmetro, material rugosidade, singularidades, pequenos coeficientes de perda ...); - as propriedades de cada equipamento da rede (por exemplo, características da bomba, diâmetro da válvula, coeficiente de atrito, ponto de ajuste operacional, ...) .O modelo hidráulico de uma rede de água potável compreende este conjunto de informações.
[0046] As entradas e saídas nos nós são definidas pelos consumos ou injeções de água em cada nó do gráfico. Elas normalmente representam os consumos individuais dos usuários do sistema de distribuição de água e a injeção de água da admissão de água para o sistema.
[0047] O status do equipamento, como válvulas ou bombas, compreende os estados operacionais e pontos de ajuste do dispositivo.
[0048] No restante desta descrição, as características do sistema de distribuição de água, entradas e saídas nos nós e estados dos dispositivos serão denominados "variáveis de controle" do sistema de distribuição de água, enquanto que os parâmetros físicos nos nós e arcos serão denominados "variáveis de estado" do sistema de distribuição de água. Os valores das variáveis de estado variam com o tempo. Os valores de algumas variáveis de controle, por exemplo as relacionadas à topologia ou topografia da rede, permanecem constantes, enquanto que os valores de algumas variáveis de controle, por exemplo as relacionadas às entradas e saídas da rede e aos estados dos dispositivos, variam com o tempo. Enquanto isso, uma entidade refere-se à rede como um todo ou a um subconjunto de uma rede composta de nós, arcos e equipamentos, um único nó, um único arco ou um equipamento da rede que é caracterizado por características que têm impacto sobre o comportamento do sistema de distribuição de água.
[0049] Uma descrição do valor inicial das variáveis de estado e uma previsão (série temporal) dos valores das variáveis de controle, principalmente os consumos nos nós da rede, permitem prever os valores das variáveis de estado com o tempo. Esta previsão é geralmente realizada pelo cálculo de valores sucessivos das variáveis de estado com passo de tempo variável. Esta previsão é denominada resolução do problema direto.
[0050] Algumas entidades da rede são equipadas com sensores medindo parâmetros físicos, normalmente velocidade ou pressão. Estes sensores permitem obter séries temporais de variáveis de estado.
[0051] São conhecidos métodos para calcular os valores de variáveis de controle que definem a adequação do sistema além das observações das variáveis de estado. Estes métodos são geralmente denominados resolução de problema inverso e são revelados principalmente por Piller, O. (1995): Modeling the behavior of a network - Hydraulic analysis and sampling procedures for parameter estimation. Applied Mathematics thesis from the University of Bordeaux [Tese de matemática aplicável da Universidade de Bordeaux] (PRES), 288 páginas, Talence, França, defendida em 03 de fevereiro de 1995 e Piller, O., Gilbert, D. and Van Zyl, J. E. (2010): Dual Calibration for Coupled Flow and Transport Models of Water Distribution Systems. Water Distribution Systems Analysis WDSA 2010, ASCE, Tucson, 722731, dezembro/2010, US 8635051. Resolver um problema inverso geralmente consiste em iterações sucessivas de um ciclo compreendendo a modificação de valores de variáveis de controle, previsão de valores de variáveis de estado de acordo com variáveis de controle, para minimizar uma função matemática que é representativa das diferenças entre previsão e observações das variáveis de estado. Estas técnicas permitem determinar, por exemplo, as características de uma entidade da rede (por exemplo, uma perda de carga em um nó, a rugosidade de um cano^) ou o consumo de água que melhor se ajusta às observações de variáveis de estado.
[0052] A figura 2 apresenta um exemplo de método para detectar anomalias em um sistema de distribuição de água em várias configurações da invenção, usando um ajuste iterativo em etapas das propriedades e variáveis de controle de um modelo hidráulico e aprendizagem de máquina para identificar a anomalia.
[0053] O método 200 compreende uma primeira etapa 220 para definir os parâmetros de um modelo hidráulico 211 usando um conjunto de variáveis de controle 210. A natureza do modelo hidráulico e variáveis de controle foi apresentada em relação à figura 1. O modelo hidráulico pode ser configurado principalmente por variáveis de controle caracterizando a estrutura da rede e as variáveis de controle caracterizando uma previsão das entradas e saídas da rede em nós por um conjunto de referências temporais, principalmente com a previsão do consumo de água na rede.
[0054] Em uma configuração preferida, os valores das variáveis de controle relacionadas à estrutura da rede (por exemplo, o diâmetro e rugosidade dos canos, características dos equipamentos, etc.) foram calibrados após a criação do modelo hidráulico. De fato, os valores teóricos definidos durante a modelagem da rede nem sempre são equivalentes a valores reais. Para obter valores mais precisos de variáveis de controle relacionadas à estrutura da rede, uma etapa de calibração pode consistir no ajuste dos valores destas variáveis de controle para apresentar a melhor previsão do comportamento da rede. Normalmente, este ajuste pode consistir de: - realizar observações das entradas, saídas e de um subconjunto das variáveis de estado da rede por uma determinada duração; - configurar o modelo hidráulico da rede com valores das variáveis de controle relacionadas às entradas, saídas e estrutura da rede; - calcular os valores previstos das variáveis de estado da rede de acordo com o modelo hidráulico; - calcular a diferença entre os valores observados e previstos das variáveis de estado da rede e modificar os valores das variáveis de controle da rede usando um algoritmo de otimização para minimizar a distância entre os valores observados e previstos das variáveis de estado da rede.
[0055] Por outro lado, as variáveis de controle relacionadas à entrada e saída da rede podem ser obtidas, por exemplo, utilizando-se observações das entradas e saídas anteriores. Por exemplo, os valores das variáveis de controle caracterizando o consumo de água em nós diferentes podem ser calculados utilizando-se dados medidos históricos de consumo de água.
[0056] O método 200 compreende também uma etapa 230 de uso de sensores para adquirir observações de um subconjunto de variáveis de estado, tais observações tendo referências temporais. Como especificado em relação à figura 1, um sistema de distribuição de água é normalmente equipado com sensores. Estes sensores medem parâmetros físicos como velocidade, vazão, pressão, etc., nos nós ou arcos da rede, tais parâmetros físicos em um nó ou arco sendo variáveis de estado da rede. Por razões práticas de custo, manutenção e facilidade de operação, todos os nós e arcos não são equipados com sensores e aqueles equipados com sensores normalmente não são equipados com um sensor para cada parâmetro físico. O número e distribuição de sensores podem ser escolhidos de acordo com a definição de setores do sistema de distribuição de água. A aquisição de observações pode ser realizada remotamente. Por exemplo, os sensores que são implantados ao longo da rede podem enviar os valores de variáveis de estado a uma plataforma remota através de vários meios de telecomunicação, normalmente links sem fio.
[0057] Os valores de variáveis de estado variam com o tempo, cada valor tem uma referência temporal que representa o momento no qual o valor foi medido. Em uma configuração da invenção, os valores das variáveis de estado são adquiridos utilizando-se um período de tempo predeterminado e enviados regularmente usando outro período. Por exemplo, os valores das variáveis de estado para as quais um sensor está presente podem ser adquiridos e enviados a cada 2 minutos, 5 minutos, 15 minutos ou 1 hora a cada 24 horas. Em uma configuração preferida da invenção, os sensores são sincronizados para adquirir a medição simultaneamente. Isto permite que a plataforma remota adquira observações dos valores do subconjunto de variáveis de estado para as quais o sensor está disponível em cada referência temporal. Os valores podem ser enviados imediatamente após serem medidos. Eles podem também ser armazenados localmente no nível do dispositivo de transmissão e então enviados a intervalos regulares, por exemplo pelo envio de todos os valores que foram captados durante 15 minutos, 1 hora ou qualquer outro intervalo.
[0058] O método 200 compreende também uma etapa 240 de estabelecimento de no mínimo uma meta. A etapa visa definir eventos alvo que podem ser, por exemplo, uma variação anormal de pressão, a detecção de uma válvula em um estado de abertura falsa. Estes eventos alvo serão então aqueles buscados nas etapas seguintes do método, para várias entidades (rede como um todo, subconjunto da rede...) . Como explicado em referência à figura 3, um conjunto de parâmetros é definido por cada tipo de evento alvo na etapa 310.
[0059] O método 200 compreende também uma etapa 250 de identificação de parâmetros. Em várias configurações da invenção, os parâmetros são estabelecidos para eventos alvo. Nos casos nos quais vários eventos sejam visados, uma etapa 250 de identificação é executada para cada evento alvo, seja um após o outro ou em paralelo. Um exemplo de método para identificar parâmetros em uma instância é apresentado abaixo, em referência à figura 3. Existem vários métodos para determinar eventos alvo. Em várias configurações da invenção, os eventos são coletados em uma lista predefinida. Em outras configurações, um evento é selecionado para uma aplicação específica. Por exemplo, apenas um evento de "vazamento" pode ser selecionado. Em outras configurações da invenção, um operador seleciona o evento no qual está interessado em uma lista de todos os eventos possíveis. Em outras configurações da invenção, eventos que são detectáveis de acordo com os sensores presentes na rede são selecionados. Em outras configurações da invenção, nenhum evento em particular é buscado. Portanto, um conjunto predefinido de parâmetros pode ser selecionado.
[0060] O método compreende uma etapa 260 para extrair e pré- processar vetor de características para preparar a etapa de classificação. O processo visa normalizar os dados e reduzir a dimensão do problema. Os dados de entrada incluem todas as saídas de modelo (conforme a figura 3) e os dados de saída constituem um vetor com um número reduzido de dimensões. Em uma configuração, a redução da dimensão do problema pode ser resolvida utilizando-se uma Principal Component Analysis, Linear Discriminant Analysis ou algoritmo de vizinho mais próximo de K.
[0061] O método compreende uma etapa 270 para qualificar o estado atual de uma entidade. De acordo com a definição de uma entidade proposta anteriormente, a classificação de uma entidade pode se aplicar à rede como um todo, a um único arco, um único nó ou um subconjunto dos nós e arcos da rede. Em várias configurações da invenção, o subconjunto de nós e arcos da rede que forma a entidade é escolhido de modo a formar um conjunto coerente. Por exemplo, uma entidade pode ser um subconjunto de uma área que entrega água a um bairro, com uma única entrada e um único arco de saída para toda a entidade.
[0062] Várias técnicas de aprendizagem de máquina podem ser usadas dependendo da disponibilidade e quantidade de dados rotulados históricos, compostas de vetores de recursos. Em várias configurações, estas técnicas incluem detecção de outlier, agrupamento e classificação. Em várias configurações, as regras de aprendizagem de máquina são baseadas em algoritmos de aprendizagem de máquina 271 previamente treinados em vetores de recursos rotulados históricos. Por exemplo, em caso de classes rotuladas históricas suficientemente disponíveis, os algoritmos de classificação podem analisar as classes históricas disponíveis e os vetores de recursos correspondentes para construir um classificador para determinar automaticamente as regras de classificação de entidades. Um novo vetor de características pode ser então automaticamente classificado na classe atual relevante, caracterizando, portanto, o estado atual e apresentando uma informação valiosa ao operador. Por exemplo, a classificação pode ser baseada em Support Vector Machine, Random Forest; Logistic Regression... em várias configurações, a classificação com duas classes (estado normal/anormal) pode ser usada. Em várias configurações, as classificações podem também consistir em tipos de anomalias (pressão, consumo alto/baixo e qualidade da água, etc.). A classificação pode também incluir um índice de confiança, que indica a certeza da classificação da anomalia. Em várias configurações, o treinamento do algoritmo de aprendizagem de máquina pode ser disparado a qualquer momento dependendo da base temporal (frequência definida) em critérios de desempenho ou na evolução do conjunto de dados usados.
[0063] Caso não haja classes históricas rotuladas e os correspondentes vetores de características suficientemente disponíveis, agrupamento ou detecção outlier podem ser usados. O agrupamento pode incluir técnicas como meios K ou agrupamento hierárquico. O agrupamento usa estados passados, representados por vetores passados de características, mas sem rótulos conhecidos. Em uma configuração da invenção, o estado é então declarado como anormal se não estiver presente em agrupamentos maiores (um critério do tamanho de agrupamentos é testado).
[0064] O método compreende uma etapa 280 para determinar se a classe calculada para uma entidade corresponde a um estado anormal ("evento") de acordo com a saída dos algoritmos de aprendizagem de máquina ou se um dos estados é detectado como outlier. Se um evento for detectado, o método vai para 290. Se os estados forem qualificados como normais, o método vai para 291.
[0065] O método compreende uma etapa 290 para exibir informações estruturadas ao operador. Uma lista de entidades priorizadas em estado normal pode então ser apresentada ao operador para lançar operações de manutenção adequadas às entidades com a mais alta probabilidade de anomalia. Estas entidades com estado anormal recebem informações adicionais coletadas ao longo das etapas anteriores (com base nas informações contidas nas saídas de modelo e no vetor de características). Em uma configuração, a informação contém indicações sobre a quantificação do nível de anormalidade (por exemplo, o valor de fluxo de um vazamento, o valor de perda de coluna), tempo e duração da anormalidade, localização conhecida e amplitude da anormalidade, etc. Levando em consideração os ajustes do contexto, esta informação é usada para priorizar os estados anormais e proporcionar um grau de anormalidade ao usuário.
[0066] O método compreende uma etapa 291 para enriquecer a base de dados histórica de vetores de características rotuladas como "normais". Estes vetores de características são usados como entradas para o processo de aprendizagem dos algoritmos. Isto permite, vantajosamente, ter um banco de dados mais rico com o passar do tempo e, portanto, uma previsão mais confiável de estados normais ou anormais.
[0067] O método compreende uma etapa 292 para enriquecer a base de dados histórica de vetores de características não rotulados como "normais" pelo método. O método compreende, então, uma etapa de validação de eventos pelos operadores. Em uma configuração, os operadores podem então lançar o método, para cada entidade, se confirmarem o evento e sua classe. Os vetores podem então ser rotulados de acordo com a classe à qual eles pertencem (vazamento, anomalia de pressão, anomalia de qualidade da água...) . A base de dados histórica de vetores de características é enriquecida com o novo vetor de características classificado de acordo com o estado, "anormal" ou "normal". Estes vetores de características são usados como insumos no processo de aprendizagem de algoritmos. No caso não rotulado pelo operador, os vetores ainda são armazenados, mas sem rótulo específico. Eles podem então ser usados em modos não supervisionados ou semi supervisionados (detecção de agrupamento e outliers).
[0068] A figura 3 apresenta um exemplo de um método para identificar parâmetros para um evento alvo em várias configurações da invenção.
[0069] O método 300 compreende uma etapa 310 de configuração do problema de acordo com um dos eventos alvo e entidades específicas escolhidas na etapa 240. A etapa visa definir os conjuntos de parâmetros correspondentes ao tipo de evento alvo para a entidade. Um conjunto de parâmetros é definido por cada alvo de evento e entidade. Em várias configurações da invenção, um tipo de evento é associado a uma lista de parâmetros e o conjunto de parâmetros é recuperado de acordo com o evento que é visado. Por exemplo, um estado de abertura falsa de uma válvula é conhecido por ser caracterizado por valores inconsistentes de variáveis de controle representativas de rugosidade e atrito, enquanto que os vazamentos são conhecidos por serem caracterizados por valores anormais de demanda de água.
[0070] O método 300 compreende também uma etapa 320 de uso do modelo hidráulico para calcular os valores previstos de um conjunto de variáveis de estado caracterizando entidades, no mínimo velocidade nos arcos e pressão nos nós nas referências temporais. Esta etapa consiste no cálculo de um valor previsto de variáveis de estado da entidade (rede, seus subconjuntos...) nas referências temporais das observações. Os métodos para usar um modelo hidráulico para calcular os valores previstos das variáveis de estado de uma rede hidráulica são bem conhecidos pelas pessoas familiarizadas na área de engenharia de sistema de água. Eles consistem tipicamente em, a partir do estado do tanque em uma referência temporal e valores de variáveis de controle, usar a lei física da hidráulica para calcular os valores de todas as variáveis de estado na mesma referência temporal e então calcular os valores do estado do tanque na próxima referência temporal. É então possível calcular os valores previstos das variáveis de estado em todas as referências temporais a partir dos valores iniciais das variáveis de estado e valores das variáveis de controle. Os métodos para calcular os valores previstos das variáveis de estado em uma referência temporal são revelados principalmente por O. Piller, “Modeling the behavior of a network - Hydraulic analysis and sampling procedures for parameter estimation”. Tese de Ph.D. em Matemática Aplicada da Escola de Doutorado em Matemática e Ciências da Computação da Universidade de Bordeaux (PRES), 1995, 288 páginas, Talence, França.
[0071] O método compreende também uma etapa 330 de calcular os valores residuais do subconjunto das variáveis de estado como uma diferença entre as previsões e observações nas referências temporais. Esta etapa consiste em calcular as diferenças entre os valores observados previstos e pré- processados (suavização, lançamento de dados, etc., para limpar o sinal) das variáveis de estado, para as variáveis de estado para as quais as observações estão disponíveis. Nos casos em que o sistema esteja corretamente modelado e calibrado e as entradas e saídas da rede estejam corretamente definidas, as observações e previsões das variáveis de estado são muito próximas: isto significa valores residuais insignificantes. Ao contrário, os valores residuais podem ser importantes, o que significa a ocorrência de uma anomalia como, por exemplo, quando um consumo espacial de água está errado. A função objetiva é usada para calcular a importância dos valores residuais como uma norma ponderada.
[0072] O método 300 compreende também uma etapa 340 de verificar se os valores residuais satisfazem um critério de quebra. Esta etapa consiste em verificar se os valores residuais das variáveis de estado são pequenos o suficiente para considerar que os valores das variáveis de controle descrevem com exatidão o comportamento da entidade. O critério de quebra pode ser, por exemplo, uma combinação do limite do número de iterações, limite à variação dos valores residuais, limite ao gradiente da função objetiva em relação ao ajuste dos parâmetros.
[0073] Quando o critério de quebra 340 não é satisfeito, o método 300 compreende uma etapa de ciclo 350 para mudar os valores dos parâmetros de problema (por exemplo, o perfil de consumo) usando um método descendente. Em uma configuração, o método pode ser algoritmo de gradiente, algoritmo de gradiente conjugado, algoritmo de Newton, algoritmo de Levenberg Marquardt... esta etapa 350 alimenta uma nova iteração da etapa 320, usando o modelo hidráulico para calcular os valores previstos com os valores modificados dos parâmetros de problema.
[0074] Quando o critério de quebra 340 é satisfeito, o método 300 compreende uma etapa 360 que é um teste baseado em um critério de refinamento. Enquanto o valor da função objetiva diminui, a etapa de refinamento adicional 370 é realizada no ciclo para a etapa 320.
[0075] O método 300 compreende também uma etapa 370 para selecionar um subconjunto de no mínimo um elemento (nó ou arco). A etapa examina o gradiente calculado como produto escalar do vetor de sensibilidade do elemento (nó ou arco) por vetor de contribuição de elemento. O método descarta os elementos de acordo com um critério de seleção, baseado na avaliação de sensibilidade. Em uma configuração, os que têm uma sensibilidade positiva são descartados. Esta etapa 370 alimenta uma nova iteração da etapa 320, usando o modelo hidráulico para calcular os valores previstos nos elementos selecionados.
[0076] O método 300 compreende também uma etapa 380 para apresentar as saídas dos parâmetros de modelo. As saídas de modelo incluem os parâmetros ajustados, os valores sucessivos das configurações de elemento e a função objetiva relacionada e as características que são processadas na etapa 260, como mostrado na figura 2. As saídas de modelo incluem, portanto, informações sobre várias entidades, de nó ou arco específico a subconjunto da rede e da rede como um todo.
EXEMPLO DE CONFIGURAÇÃO: DETECÇÃO DE UM ESTADO DE ABERTURA FALSA DE UMA VÁLVULA
[0077] Por meio de um exemplo não limitativo do método 200, um cenário de detecção de um estado de abertura falsa de uma válvula será descrito abaixo.
[0078] Um modelo hidráulico foi definido e calibrado durante uma fase de calibração, usando diferentes estados de abertura de válvulas. Os estados de abertura de válvulas podem variar com o tempo e as variáveis de controle representando sua posição precisam ser consequentemente atualizadas. Entretanto, este não é sempre o caso, especialmente se as válvulas não forem equipadas com sensores e se forem operadas manualmente.
[0079] Várias classes diferentes de anomalias foram definidas, que compreendem anomalias como vazamentos e erros de atualizações do estado dos dispositivos, tal como um estado de abertura falsa das válvulas. Os algoritmos de aprendizagem de máquina foram treinados para obter classificadores em vetores de características rotuladas históricas correspondentes a cada tipo de anomalia.
[0080] Várias instâncias de um método de identificação de anomalias são executadas, cada uma operando em diferentes parâmetros de modelo. Por exemplo, um estado de abertura falsa de uma válvula é sabidamente caracterizado por valores inconsistentes de variáveis de controle representativas de rugosidade e atrito, enquanto que sabe-se que os vazamentos são caracterizados por valores anormais de demandas. Ambos resultam em uma combinação de valores inconsistentes de pressão e fluxo.
[0081] Cada execução do método 250 modifica, portanto, o seu próprio conjunto de parâmetros de problema e a presença de uma anomalia correspondente em uma entidade (arco ou nó ou subconjunto da rede) pode resultar em uma modificação importante dos parâmetros correspondentes. As saídas de simulações são usadas no algoritmo de extração de características e no algoritmo de pré-processamento para obter vetores de características para cada entidade. Os vetores de características são então usados no classificador para selecionar a classe atual para cada entidade. Por exemplo, se a execução do método 300 modificar significativamente os valores de rugosidade e atrito em um subconjunto de arcos e este subconjunto contiver arcos equipados com uma válvula, o subconjunto de arcos pode ser classificado em uma classe representativa de uma posição incorreta da válvula.
[0082] Esta informação é apresentada a um operador, que pode lançar uma inspeção humana para validar a incorreção do estado de abertura da válvula e corrigir seu estado de abertura, se necessário. Quando a correção da classificação tiver sido estabelecida, é possível usar estes dados para treinar adicionalmente o método de classificação para as válvulas que estão em um estado de abertura falsa. De fato, a eficiência da classificação (número de alarmes falsos, número de detecção verdadeira...) baseada na aprendizagem é conhecida como aumentando o número de casos de classificação.
[0083] A figura 4 mostra um exemplo de método para detectar anomalias em um sistema de distribuição de água em várias configurações da invenção, usando uma análise estatística em valores residuais do modelo hidráulico.
[0084] O método 400 compreende: - uma etapa 220 de configuração de modelo hidráulico 211 do modelo de distribuição de água com um conjunto de valores de variáveis de controle 210 caracterizando a rede e sua saída nos nós; - uma etapa 230 de uso de sensores na rede para adquirir observações de um subconjunto das variáveis de estado nas referências temporais; - uma etapa 320 de uso do modelo hidráulico para calcular os valores previstos de um conjunto de variáveis de estado, caracterizando no mínimo uma velocidade nos nós, tais valores tendo referências temporais; - uma etapa 330 de calcular os valores residuais do subconjunto das variáveis de estado como uma diferença entre os valores previstos e as observações nas referências temporais; Estas etapas são semelhantes às dos métodos 200 e 300. Em uma configuração preferida da invenção, os valores residuais são calculados para todas as entidades nas quais as observações das variáveis de estado estão disponíveis.
[0085] O método 400 compreende também uma etapa 410 de realizar várias análises estatísticas de valores residuais para no mínimo uma entidade para uma seleção de referências temporais. Esta etapa consiste em analisar a distribuição de valores residuais para uma entidade em cada referência temporal em uma janela de tempo. De acordo com as várias configurações da invenção, a janela de tempo pode cobrir a totalidade ou um subconjunto das referências temporais.
[0086] Através das várias análises estatísticas, uma anomalia pode ser estabelecida se os valores residuais não estiverem consistentes com as observações históricas dos valores residuais. O uso da distribuição histórica de valores residuais possibilita captar os comportamentos comuns e incomuns, incluindo a variabilidade e as diversas propriedades dos valores residuais, para comparação com os valores residuais atuais em uma determinada janela de tempo. Por exemplo, a etapa 410 pode compreender o cálculo de inferências estatísticas (momento de ordem n, média, desvio padrão, desvio absoluto médio ou mediano, etc.) usando o banco de dados de valores residuais históricos para comparação com as inferências estatísticas correspondentes dos valores residuais atuais. Isto dá maior robustez ao método, pois leva em conta os valores passados.
[0087] Em várias configurações da invenção os valores residuais são transformados utilizando-se uma transformação de Fourier antes da análise estatística. Em uma configuração da invenção, a realização da análise estatística para uma entidade compreende a detecção se o valor residual ultrapassar um limite pré-estabelecido por um número pré- estabelecido de vezes sucessivas. O limite e o número de vezes sucessivas podem ser pré-definidos de acordo com as detecções anteriores, para maximizar a proporção de detecção de anomalias quando uma anomalia estiver presente e minimizar a proporção de detecção de uma anomalia quando ela não existir (alarmes falsos). A análise pode ser composta por testes estatísticos em propriedades de valores residuais e no cálculo dos valores P resultantes para qualificar os resultados dos testes. Os limites nos valores P podem ser estabelecidos para obter um nível de risco de obtenção de alarmes falsos. Estabelecer um determinado valor implica então em esperar uma determinada porcentagem de alarmes falsos, ou seja, rejeição errada de assunções. Em uma configuração, a análise estatística é realizada normalmente em valores residuais de pressão ou velocidade. Por exemplo, uma análise de vazão para detecção de um vazamento pode ser realizada em janelas de algumas horas.
[0088] O método compreende também uma etapa 420 de classificar a no mínimo uma entidade da rede baseada nas regras a serem aplicadas à saída da etapa de análise estatística. Após a aplicação das regras, uma classe é atribuída às entidades (por exemplo, "vazamento", "queda de pressão", "problema com a qualidade da água"). Em uma configuração da invenção, a regra é baseada em uma comparação de valores P dados por testes estatísticos realizados na etapa 410, com um nível de risco predefinido, dependendo da meta do nível de sensibilidade do método. Em uma configuração da invenção, a regra é baseada em um algoritmo de classificação previamente treinado possibilitando, com base na simulação passada, analisar o vetor atual de valores residuais e apresentar a classe atual da entidade. Em uma configuração da invenção, duas classes estão disponíveis, uma representativa de estados normais e a outra representativa de estados anormais. Em outras configurações da invenção, as classes apresentam uma natureza mais precisa de anomalia, tal como "queda anormal de pressão", "problema com a qualidade da água", etc.
[0089] O método compreende uma etapa 430 determinando a etapa seguinte de acordo com as classes atuais. Se uma das classes corresponder a um estado anormal (um dos estados anormais possíveis) ou se o estado for detectado como periférico, o método vai para 450. Se todas as classes forem classificadas como normais, o método vai para 440.
[0090] O método compreende uma etapa 440 para enriquecer o banco de dados histórico de valores residuais com os valores residuais de entidades rotuladas como "normais" na janela de tempo atual. Estes valores residuais são usados no processo de análise estatística para apresentar informações sobre a distribuição usual de valores residuais.
[0091] O método 400 compreende uma etapa 450 para exibir os eventos com suas características. As anomalias podem então ser apresentadas a um operador, por exemplo em uma lista selecionada ou em uma interface gráfica. Em várias configurações da invenção, o método compreende também uma etapa de quantificar a criticidade de uma anomalia. Esta etapa pode consistir, por exemplo, na classificação das anomalias da mais para a menos grave. Esta classificação pode ser realizada, por exemplo, de acordo com a importância dos valores residuais, com o tempo durante o qual os valores residuais significativos são encontrados ou com a natureza do parâmetro físico no qual se aplicam altos valores residuais. A quantificação de um vazamento pode ser calculada, por exemplo, de acordo com o volume estimado do vazamento. Em uma configuração da invenção, somente a anomalia considerada como mais grave é apresentada ao operador. O operador pode então enviar inspeção humana para verificar a natureza da anomalia e consertá-la, se necessário. Ele tem também a capacidade de verificar a correção da detecção da anomalia (rotulagem do usuário) para fornecer casos de treinamento adicionais e melhorar a detecção futura de anomalias.
[0092] O método compreende uma etapa 460 para enriquecer o banco de dados histórico de valores residuais com os valores residuais de entidades não rotuladas como "normais" na janela de tempo atual. Estes valores residuais são usados no processo de análise estatística para apresentar informações sobre a distribuição de valores residuais incomuns.
EXEMPLO DE CONFIGURAÇÃO: DETECÇÃO DE UMA FALHA DE SENSOR
[0093] Por meio de exemplo não limitativo do método 400, um cenário de detecção de falha de um sensor será descrito abaixo.
[0094] Um sistema de distribuição de água equipado com sensores de fluxo e pressão de água foi modelado. As relações hidráulicas entre canos, nós e dispositivos representativos do modelo hidráulico da rede são descritos nos arquivos do software de modelagem, por exemplo, arquivos de Epanet (.inp/.net), Piccolo (.dat), Infoworks (.iwc) ou Porteau (.xpto). O modelo foi calibrado em uma fase de calibração anterior durante a qual os parâmetros das variáveis de controle representativas da estrutura da rede (por exemplo, tamanhos de infraestrutura, rugosidade, perdas de carga) foram determinados. A calibração do modelo pode ser realizada utilizando-se sensores temporários além de sensores permanentes, para ter uma determinação mais precisa das variáveis de controle do que se apenas sensores permanentes fossem usados.
[0095] Durante uma fase de aprendizagem, o método é usado com previsões de consumo, que podem ser adaptadas, por exemplo, de acordo com a data do ano e dados históricos das medições. Os valores residuais são obtidos pela realização da diferença entre valores previstos e medidos. Os valores residuais são armazenados para todas as entidades equipadas com sensores. Um módulo de detecção pode então ser aplicado aos valores residuais, para estabelecer se os valores residuais são representativos de um comportamento padrão do sistema, aprendido em conjuntos de dados históricos de valores residuais. Por exemplo, os valores representativos do comportamento de cada nó podem ser aprendidos. O modelo pode compreender principalmente desvios padrão dos valores residuais ou parâmetros de auto-correlação da série de valores residuais, levando em conta vários contextos operacionais. O contexto operacional pode compreender cada elemento que tenha um impacto sobre o comportamento da rede, por exemplo, dia e hora, mês ou estação atual, etc. O modelo de aprendizagem pode também determinar, utilizando-se a análise de valores históricos, um valor limite de uma característica dos valores residuais, para adaptar a sensibilidade do sistema. No caso de testes estatísticos, por exemplo, o limite para valores P para rejeitar a assunção pode ser ajustado para dar ao operador um número aceitável de alarmes falsos esperados. O nível de risco de ter alarmes falsos é então dependente dos limites ajustados. No caso de comparação de valores com uma combinação linear de média e um número de desvios padrão (envelope de confiança), o número de desvios padrão pode ser ajustado de acordo com princípios de controle de processo estatístico. O número esperado de alarmes falso pode então ser ajustado. As características dos valores residuais são registradas.
[0096] Em uma fase operacional, o método é aplicado às medições dos sensores em uma janela de tempo, por exemplo, seis horas. Os valores previstos são calculados separadamente, utilizando-se um estado inicial do sistema e as previsões de consumo de água. Os valores residuais são, por exemplo, armazenados em uma matriz, com uma fileira por sensor e uma coluna por referência temporal. O processo de detecção pode levantar um comportamento anormal de sensor, por exemplo um desvio, alguns valores fora da faixa, etc. Esta anomalia pode ser observada em valores previstos por valores inconsistentes em determinados pontos de medição. A anomalia é detectada, por exemplo, se os valores residuais forem muito altos para um grande número de valores sucessivos ou se sua distribuição, representada por um modelo auto- regressivo, for diferente das distribuições históricas. Os limites para detectar uma anomalia foram determinados na fase de aprendizagem usando valores históricos. Esta configuração é vantajosa, pois o uso e comparação com valores históricos permite a detecção de anomalias ao mesmo tempo em que limita o número de alarmes falsos.
[0097] A intensidade da anomalia pode ser calculada, com base nos valores residuais, representativos da diferença entre observações e previsões. Esta intensidade permite a qualificação da anomalia relatada ao operador com uma indicação da sua seriedade. A medição da intensidade ajuda o operador a comparar a anomalia com as anteriores com a mesma rede e decidir as ações a serem realizadas para resolver a anomalia. No caso de problema no sensor, a manutenção pode ser composta por ação física diretamente no sensor, por exemplo.
[0098] A figura 5 mostra um exemplo de método para detectar anomalias em um sistema de distribuição de água em várias configurações da invenção, usando uma combinação de análise estatística em valores residuais a partir do modelo hidráulico para caracterizar a situação da calibração e um ajuste iterativo em etapas das propriedades das variáveis de controle de um modelo hidráulico, aprendizagem de máquina para identificar a anomalia.
[0099] O método 500 compreende: - uma etapa 220 de configuração de um modelo hidráulico 211 do sistema de distribuição de água com um conjunto de valores de variáveis de controle 210 caracterizando a rede e a sua saída nos nós; - uma etapa 230 de uso de sensores na rede para adquirir observações de um subconjunto das variáveis de estado nas referências temporais; - uma etapa 240 de ajuste de no mínimo uma meta, visando definir os conjuntos de parâmetros correspondentes a cada tipo de evento alvo; - uma etapa 250 de identificação de parâmetros para cada evento alvo em um processo paralelo; - uma etapa 260 para extrair e pré-processar vetor de características para preparar a etapa de classificação; - uma etapa 270 para qualificar os estados atuais de entidades com algoritmos de aprendizagem de máquina treinados 271 dependendo da disponibilidade de dados históricos rotulados; - um critério 280 de determinação da etapa seguinte de acordo com o estado atual para cada entidade; - se o critério 280 não for satisfeito, uma etapa 291 para enriquecer o banco de dados histórico com vetores de recursos rotulados como "normais"; - se o critério 280 for satisfeito, uma etapa 292 para enriquecer o banco de dados histórico com vetores de características não rotuladas como "normais" pelo método; - uma etapa 320 de uso do modelo hidráulico para calcular os valores previstos de um conjunto de variáveis de estado caracterizando no mínimo uma velocidade nos nós, tais valores tendo referências temporais; - uma etapa 330 de calcular os valores residuais do subconjunto das variáveis de estado como uma diferença entre os valores previstos e as observações nas referências temporais; - uma etapa 410 de realizar uma análise estatística de valores residuais em entidades (no mínimo um nó) e em uma seleção das referências temporais; - uma etapa 420 de classificar a no mínimo uma entidade da rede baseada nas regras a serem aplicadas à saída da etapa de análise estatística; - uma etapa 430 determinando a seguinte etapa de acordo com as classes atuais; - uma etapa 440 para enriquecer o banco de dados de valores residuais históricos com os valores residuais de entidades rotuladas como "normais" na janela de tempo atual.
[00100] As etapas 220, 230, 240, 250, 260, 270, 280 são semelhantes às do método 200. As etapas 320 e 330 são semelhantes às do método 300. As etapas 410, 420, 430, 440 são semelhantes às do método 400.
[00101] O método compreende uma etapa 510 de classificar a rede em um estado na saída das etapas 270 e 420. Diversos métodos diferentes para combinar a detecção do evento usando valores residuais e a detecção do evento usando o modelo hidráulico inverso em uma classificação global. Em alguns casos, esta detecção é mais precisa e robusta do que uma detecção de evento usando apenas uma das ramificações. Por exemplo, em muitos casos a classificação do evento na etapa 420 é mais rápida de treinar do que a classificação de evento na etapa 270. Portanto, no início da detecção do evento em uma rede, a classificação de evento na etapa 420 pode apresentar uma detecção confiável de eventos após um menor número de ciclos de treinamento do que a classificação de evento na etapa 270. Enquanto isto, a identificação de parâmetros na etapa 250 permite localizar eventos com maior precisão, mesmo em nós que não são equipados com sensores. De fato, modificar parâmetros em um nó ou arco, mesmo não equipados com sensores, permite localizar um evento neste nó ou arco. A combinação de ambos os meios de detectar eventos combina, portanto, vantajosamente as vantagens de ramificações e proporciona uma detecção de evento que é ao mesmo tempo precisa e rápida de treinar.
[00102] Várias maneiras diferentes são possíveis para detectar a combinação de detecção de eventos. Por exemplo, é possível usar algoritmos de aprendizagem de máquina nos eventos que são a saída das etapas tanto 270 quanto 420, para treinar algoritmos de aprendizagem de máquina para levantar um evento nos casos mais relevantes de um evento levantado pelas etapas 270 e 420. Em outras configurações da invenção, é usada uma combinação mais simples: quando um evento é detectado em um nó na etapa 270, a etapa 510 verifica se a saída da etapa 420 compreende um evento em um nó próximo que é equipado com um sensor. Em caso positivo, ele verifica se os dois eventos pertencem a tipos semelhantes. Se este for o caso, o evento detectado na etapa 270 é a saída do sistema.
[00103] Em outras configurações da invenção, os eventos não são combinados pelos eventos nas duas ramificações, mas um algoritmo de classificação de evento é globalmente treinado nos valores residuais da saída da etapa 330 e ano vetor de característica na saída da etapa 260.
[00104] O método 500 compreende uma etapa 520 que visa exibir a saída do processo 500 ao operador.
EXEMPLO DE CONFIGURAÇÃO: REDUÇÃO DE UM VAZAMENTO EM UM ESTÁGIO INICIAL DE USO DO SISTEMA
[00105] Por meio de exemplo não limitativo do método 500, será descrito abaixo um cenário de redução de alarmes incorretos quando detectando um vazamento em um estágio de uso inicial de um sistema.
[00106] Este exemplo descreve a detecção de um vazamento após alguns ciclos de detecção e treinamento usando um método 500 de acordo com a invenção. Sabe-se que a eficiência do algoritmo de aprendizagem de máquina aumenta com o número de utilizações. Esta é uma propriedade desejável, pois a confiabilidade do sistema de detecção de eventos aumenta e os algoritmos de aprendizagem de máquina, quando adequadamente treinados, podem atingir um nível de confiabilidade muito alto. Entretanto, nos estágios iniciais de uso de um sistema, o treinamento insuficiente dos algoritmos de aprendizagem de máquina pode levar a alarmes incorretos.
[00107] A aprendizagem de máquina baseada em matrizes de valores residuais é geralmente treinada mais rapidamente do que os algoritmos de aprendizagem de máquina baseados em parâmetros na saída de um modelo hidráulico inverso, no mínimo porque a classificação das matrizes de valores residuais pode ser lançada mais frequentemente do que a classificação das variáveis de controle.
[00108] Em um estágio inicial de uso do sistema, um evento de vazamento é detectado na etapa 270, apesar de não haver a presença de vazamento. Esta detecção falsa é devida a um treinamento insuficiente dos algoritmos de aprendizagem de máquina. Enquanto isso, o algoritmo de classificação baseado em valores residuais tinha a capacidade de ser treinado em um número menor de ciclos, não detectou nenhum evento. Neste exemplo, a etapa 510 descarta o evento, evitando, portanto, levantar um alarme falso.
[00109] A figura 6 mostra um exemplo de uma apresentação da localização das anomalias a um operador.
[00110] Um mapa 600 da rede do sistema de distribuição de água é mostrado a um operador através de um monitor. O mapa contém linhas que representam os canos do sistema, a largura das linhas sendo representativa do diâmetro dos canos. O sistema contém canos grandes, como os canos 610 e 611, e canos menores, como os canos 620 e 621. Três vazamentos 630, 631, 632 foram localizados na rede e são representados usando círculos grandes. Podem ser inseridas informações sobre a importância relativa dos vazamentos. Por exemplo, o diâmetro dos círculos pode aumentar com a importância do vazamento. Pode ser possível também representar somente o vazamento que é considerado como mais grave ou exibir informações adicionais sobre o vazamento, por exemplo uma lista de vazamentos antigos que tinham as características mais próximas.
[00111] Os exemplos descritos acima são apresentados como ilustrações das configurações da invenção. Eles não limitam de maneira nenhuma o escopo da invenção que é definida pelas reivindicações abaixo.

Claims (15)

1. Método (200) para detectar anomalias em um sistema de distribuição de água composto por uma rede de nós, CARACTERIZADO pelo fato de tal método compreender: A) A parametrização (220) de um modelo hidráulico (211) do sistema de distribuição de água pela inicialização de um conjunto de valores e variáveis de controle (210) denotando a rede e seu rendimento nos nós; B) O uso de sensores na rede para adquirir observações (230) de um subconjunto das variáveis de estado, tais observações tendo referências temporais; C) Troca do conjunto de valores das varáveis de controle (310); D) Uso do modelo hidráulico para calcular (320) os valores previstos de um conjunto de variáveis de estado denotando no mínimo a velocidade e pressão da agua nos nós nas referências temporais; E) Cálculo dos valores residuais (330) do conjunto de variáveis de estado como uma diferença entre os valores previstos e as observações nas referências temporais; F) Se tais diferenças satisfizerem um critério de quebra (340), vá para o item H); G) Em caso negativo, troque o conjunto de valores das variáveis de controle (350) e volte para a etapa D); H) Se tais diferenças satisfizerem um critério de refinamento (360), vá para a etapa J); I) Em caso negativo, selecione um subconjunto da rede onde os valores previstos são calculados, volte para a etapa D); J) Classificação (270) de uma entidade da rede em um estado de acordo com um conjunto de variáveis de controle.
2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que as etapas C a J são realizadas para no mínimo um tipo de evento e a mudança do estado das variáveis de controle é realizada de acordo com no mínimo um tipo de evento.
3. Método, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que vários tipos de eventos são testados e uma das etapas C a J é realizada para cada tipo de evento.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, CARAC TERI ZADO pelo fato de que o critério de refinamento compreende o cálculo de valores de no mínimo um quadrado mínimo e uma função objetiva bayesiana e a seleção e modificação de variáveis de controle é determinada por um algoritmo de Levenberg-Marquardt.
5. Método, de acordo com qualquer uma das reivindicações 1 a 4, CARAC TERI ZADO pelo fato de que a classificação de uma entidade da rede é realizada por um algoritmo de aprendizagem de máquina anteriormente treinado.
6. Método, de acordo com qualquer uma das reivindicações 1 a 5, CARAC TERI ZADO pelo fato de que as variáveis de controle compreendem variáveis escalares denotando a topologia e a topografia da rede e variáveis baseadas no tempo denotando as entradas e saídas da rede que tem no mínimo um valor em cada referência temporal.
7. Método, de acordo com a reivindicação 6, CARACTERIZADO pelo fato de que a troca do conjunto de valores das variáveis de controle compreende a modificação de no mínimo um dentre: - os valores de um subconjunto das variáveis de controle baseadas no tempo; - os valores de um subconjunto das variáveis de controle escalares calculadas durante uma fase de modelagem da rede.
8. Método, de acordo com a reivindicação 7, CARACTERIZADO pelo fato de que a modificação dos valores de um subconjunto das variáveis de controle baseadas no tempo compreende a modificação dos valores das variáveis de controle baseadas no tempo representativas do consumo de água.
9. Método, de acordo com qualquer uma das reivindicações de 1 a 8, CARACTERIZADO pelo fato de que as variáveis de estado denotam também a pressão.
10. Método para detectar anomalias em um sistema de distribuição de água composto por uma rede de nós, CARACTERIZADO pelo fato de tal método compreender: - a parametrização (220) de um modelo hidráulico (211) do sistema de distribuição de água com um conjunto de valores (210) de variáveis de controle denotando a rede e o seu rendimento nos nós; - o uso de sensores na rede para adquirir (230) as observações de um subconjunto de variáveis de estado nas referências de tempo; - uso do modelo hidráulico para calcular (320) os valores previstos de um conjunto de variáveis de estado denotando no mínimo uma velocidade da água nos nós, tais valores tendo referências temporais; - o cálculo (330) dos valores residuais dos subconjuntos das variáveis de estado com uma diferença entre os valores previstos e as observações das referências temporais; - realização (410) de uma análise estatística de valores residuais em uma entidade da rede em uma seleção das referências temporais; - classificação (420) da entidade da rede baseada em uma comparação de tal análise estatística de valores residuais com os valores representativos de um comportamento de tal entidade aprendido de um ou mais conjuntos de dados históricos de valores residuais.
11. Método, de acordo com a reivindicação 10, CARAC TERI ZADO pelo fato de que a análise estatística compreende o cálculo de uma média, um desvio padrão, um desvio médio ou mediano absoluto, um modelo autorregressivo, boxplot, Support Vector Machine, uma Principal Component Analysis (PCA) (Análise de Componente Principal), vizinho mais próximo de K e resultados de testes estatísticos (calculando os valores P).
12. Método, de acordo com qualquer uma das reivindicações 10 e 11, CARACTERIZADO pelo fato de que uma entidade da rede é classificada em uma classe representativa de um estado anormal se os valores residuais em no mínimo um nó ultrapassarem um limite baseado na análise estatística de dados históricos e no nível de risco operacional em um número pré-definido de referências temporais sucessivas.
13. Método, de acordo com qualquer de uma das reivindicações de 1 a 9 e de qualquer uma das reivindicações de 10 a 12, CARACTERIZADO pelo fato de compreender também a classificação (510) da rede em um estado no rendimento de: - J) Classificação (270) de uma entidade da rede em um estado de acordo com um conjunto de variáveis de controle; e - classificação (420) de no mínimo um de um nó e um arco da rede com base na comparação de tal análise estatística de valores residuais com valores representativos de um comportamento de tal entidade, aprendido de um ou mais conjuntos de dados históricos de valores residuais.
14. Sistema para detectar anomalias em um sistema de distribuição de água composto por uma rede de nós, CARACTERIZADO pelo fato de tal sistema compreender: - sensores de no mínimo velocidade e pressão da agua em um subconjunto de nós da rede; - um dispositivo de cálculo compreendendo um processador; - links de comunicação entre os sensores e o dispositivo de cálculo; - um meio de armazenamento; no qual o dispositivo de cálculo é configurado para: - recuperar um conjunto inicial de valores de variáveis de controle denotando a rede e seu rendimento nos nós a partir dos meios de armazenamento e utilizando-o para parametrizar um modelo hidráulico do sistema de distribuição de água; - usar links de comunicação entre os sensores na rede para adquirir observações de um conjunto das variáveis de estado, tais observações tendo referências temporais; - executar um método de acordo com qualquer uma das reivindicações 1 a 13.
15. Meio não transitório legível por computador, CARAC TERI ZADO pelo fato de compreender instruções para execução de um método, conforme definido em qualquer uma das reivindicações de 1 a 13.
BR112017028076-0A 2015-06-29 2016-06-29 Métodos e sistema para detectar anomalias em um sistema de distribuição de água e meio não transitório legível por computador BR112017028076B1 (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP15306029.8 2015-06-29

Publications (1)

Publication Number Publication Date
BR112017028076B1 true BR112017028076B1 (pt) 2023-06-13

Family

ID=

Similar Documents

Publication Publication Date Title
US11281203B2 (en) Method for detecting anomalies in a water distribution system
US20220300857A1 (en) System and method for validating unsupervised machine learning models
Baraldi et al. Ensemble neural network-based particle filtering for prognostics
US11288577B2 (en) Deep long short term memory network for estimation of remaining useful life of the components
EP3101599A2 (en) Advanced analytical infrastructure for machine learning
US20200143292A1 (en) Signature enhancement for deviation measurement-based classification of a detected anomaly in an industrial asset
CN112508105B (zh) 一种采油机故障检测与检索方法
US20160369777A1 (en) System and method for detecting anomaly conditions of sensor attached devices
CN110032490A (zh) 用于检测系统异常的方法及其装置
BR112017000076B1 (pt) Método para detectar anomalias em uma rede de distribuição, em particular, de água potável
US11265232B2 (en) IoT stream data quality measurement indicator and profiling method and system therefor
BR112017028076B1 (pt) Métodos e sistema para detectar anomalias em um sistema de distribuição de água e meio não transitório legível por computador
US20220222580A1 (en) Deterioration detection method, non-transitory computer-readable storage medium, and information processing device
CN116910526A (zh) 模型训练方法、装置、通信设备及可读存储介质
EP2956751B1 (en) Method and monitoring device for monitoring a structure
CN115659271A (zh) 传感器异常检测方法、模型训练方法、系统、设备及介质
US9473368B1 (en) Network graph representation of physically connected network
US20240135200A1 (en) Simulating training data for machine learning modeling and analysis
Quevedo et al. Temporal/spatial model-based fault diagnosis vs. Hidden Markov models change detection method: Application to the Barcelona water network
US20220222579A1 (en) Deterioration detection method, non-transitory computer-readable storage medium, and information processing device
US20240185136A1 (en) Method of assessing input-output datasets using neighborhood criteria in the input space and the output space
Liu et al. An algorithm of auto-update threshold for singularity analysis of pipeline pressure
KR20240067617A (ko) 학습 모델 운영 방법 및 장치
Peizhang et al. Research on water quality predictive model based on robust splines partial least squares
Wang et al. Model refinement and data filtering in high-tunnel greenhouse sensor network