BR102019008102A2

BR102019008102A2 - método e sistema para computar índices de riscos de incidentes ferroviários

Info

Publication number: BR102019008102A2
Application number: BR102019008102-3A
Authority: BR
Inventors: Sergio Ivan Viademonte Da Rosa; Nikolas Jorge Santiago Carneiro; Jair Da Silva Ferreira Junior
Original assignee: Vale S.A
Priority date: 2019-04-22
Filing date: 2019-04-22
Publication date: 2020-10-27

Abstract

método e sistema para computar índices de riscos de incidentes ferroviários a presente invenção provê um método para computar índices de riscos de incidentes ferroviários, o qual compreende as etapas de obter um conjunto de base de dados analíticas (a) compreendendo pelo menos uma base de dados (a1, a2,.., an); treinar pelo menos um modelo de aprendizado de máquina com pelo menos uma das base de dados para criar uma pluralidade de modelos preditivos (m1, m2, m3, ...., mn); calcular a performance de ao menos um dos modelos preditivos com base em um critério predeterminado; selecionar o modelo com a melhor performance de acordo com o critério predeterminado; mediante uma solicitação de um usuário com dados de uma composição ferroviária, gerar um mapa de risco com base no modelo preditivo selecionado (m+) e os dados da composição. a presente invenção é vantajosa uma vez que as base de dados analíticas (a) compreendem i instâncias de incidente ferroviário e n atributos relacionados ao incidente ferroviário, na forma im{(xn, yn)}, onde xn representa uma pluralidade de pares de atributo e valor referentes ao incidente ferroviário im, e yn representa uma classe do referido incidente ferroviário im. a presente invenção provê ainda um sistema computacional dotado de meios adequados para a realização das etapas descritas acima.

Description

MÉTODO E SISTEMA PARA COMPUTAR ÍNDICES DE RISCOS DE INCIDENTES FERROVIÁRIOS

CAMPO TÉCNICO

[0001] A presente invenção está relacionada ao campo de segurança de tráfego ferroviário. Especificamente, a presente invenção trata de um método e um sistema para computar índices de riscos de incidentes ferroviários.

DESCRIÇÃO DO ESTADO DA TÉCNICA

[0002] Análise de incidentes é uma atividade essencial em muitas operações industriais, principalmente naquelas que acontecem em condições e ambientes de alto risco operacional, como é o caso da indústria de mineração. Minérios extraídos das minas são transportados até a base de clientes através de redes de ferrovias e vias marítimas. Algumas empresas no ramo de mineração, além de suas atividades de mineração, também controlam suas operações de logística, que incluem transportes marítimos e ferroviários.

[0003] Ferrovias no Brasil cobrem longas distâncias, atravessam áreas remotas, pouco povoadas, como também áreas urbanas densamente povoadas. Portanto, nesse contexto, o transporte ferroviário consiste numa operação de risco, tanto para empregados e colaboradores da companhia, como para as populações que vivem em áreas próximas as ferrovias. Além da questão da segurança, existe também a questão da perda operacional e financeira, em consequência da interrupção da operação.

[0004] A maioria dos incidentes que acontecem ao longo da operação ferroviária podem ser caracterizados como eventos complexos, difíceis de se avaliar antecipadamente, devido à grande quantidade de variáveis envolvidas, e suas possíveis correlações. Empresas mineradoras ou de logística responsáveis pelo transporte de bens por ferrovias adotam várias iniciativas para mitigar o risco de incidentes em suas operações, como treinamento em procedimentos de segurança, uso de tecnologias de monitoramento como sensores e câmeras, e adoção de melhores práticas nos seus processos.

[0005] Adicionalmente a essas iniciativas, empresas coletam e armazenam dados operacionais sobre incidentes, para fins de analises e relatórios. A identificação e caracterização das variáveis que melhor descrevem eventos de incidentes é um fator crítico para elaboração de planos de segurança e mitigação de riscos de incidentes.

[0006] Uma estratégia para análise e mitigação de riscos de incidentes ferroviários consiste em identificar condições operacionais que contribuem para a ocorrência desses incidentes. E usar essas informações para avaliação e estimativa de riscos de incidentes.

[0007] O estado da técnica possui alguns estudos e iniciativas em análise, gestão e prevenção de acidentes ferroviários. Por exemplo, o trabalho descrito por W. Lira, R. Alves, J. M. Costa, G. Pessin, L. Galvão, Cleidson de Souza. “A Visual-Analytics System for Railway Safety Management. IEEE Computer Graphics and Applications”, vol. 34, no. 5, pp. 52-57 (2014), utiliza uma técnica de análise visual para análise de incidentes de atropelamento ferroviários. Essa técnica computa um índice de risco para incidentes de atropelamento ferroviários, e visualmente ilustra esse índice num mapa geográfico da ferrovia, juntamente com dados sócio-econômicos dos municípios e cidades por onde a ferrovia passa.

[0008] O trabalho de L. Wright, T. Schaafb. “Accident versus near miss causation: a critical review of the literature, an empirical test in the UK railway domain, and their implications for other sectors”. Journal of Hazardous Materials, Volume 11, Issues 1-3, pp. 105-110 (2004) relaciona-se às análises de incidentes ferroviários, onde três métodos de investigação são aplicados. Acidentes considerados graves são investigados por inquéritos formais (um painel de especialistas analisa um incidente em particular e realiza entrevistas com os envolvidos), incidentes menos graves são analisados por sistemas SPAD (Signal Passed at Danger) e CIRAS (Confidential Incident Reporting and Analysis System), normalmente usados para caso de “quase incidentes”.

[0009] Em H. Fukuda. “A Study on Incident Analysis Method for Railway Safety Managementˮ . Quarterly Report Railway Technical Research Inst., vol. 43, no. 2, pp. 83-86 (2002), enfatiza-se que industrias, como a ferroviária, de energia e de aviação sistematicamente coletam e analisam dados sobre incidentes, com a finalidade de prevenir esses incidentes. O objetivo maior é ser capaz de prever a ocorrência de incidentes, propor medidas de prevenção e mitigar o risco. Porém, apesar desses esforços, o documento conclui que não há um método universal para a análise de incidentes, e cada indústria desenvolve soluções próprias e customizadas. É proposto um modelo conceitual de sistema de informação, para extrair dados de incidentes e armazena-los em bases de dados para análise.

[00010] Outra iniciativa relevante é o trabalho desenvolvido por A. W. Evans, em “Fatal train accidents on Europe's railways: 1980-2009”. Accident Analysis and Prevention, 43, pp. 391-401 (2011), que trata de analises de acidentes ferroviários envolvendo fatalidades, especificamente colisões e descarrilamentos, nas principais linhas ferroviárias da Europa, no período de 1980 a 2009.

[00011] Diferentes tecnologias são usadas para avaliação de risco de incidentes ferroviários, como por exemplo o trabalho desenvolvido por R. Pastarus, S. Sabanov, T. Tohver. “Application of the risk assessment methods of railway transport in Estonian oil shale industry”. Oil Shale 2007, Vol. 24, No. 1, pp. 35-44, o qual aplica uma técnica de análise baseada em pares de informações de eventos / falhas, numa estrutura de árvore.

[00012] O trabalho apresentado por Min An, Wanchang Lin, and A. Strilinbg, 2013. “An Intelligent Railway Safety Risk Assessment Support System for Railway Operation and Maintenance Analysisˮ. The Open Transportation Journal 2013, Vol 7, pp. 27-42, apresenta um sistema para avaliação de risco de incidentes usando lógica fuzzy, num mecanismo de inferência fuzzy (Fuzzy Inference System FIS) baseado em regras.

[00013] M. Sasidharan, M. P. N. Burrow, G. S. Ghataora, M.E. Torbaghan, 2017. “A Review of Risk Management Applications for Railways”, apresenta uma revisão sobre aplicações computacionais para gestão de risco em ferrovias, e discute a integração de técnica de Simulação de Monte Carlo com raciocínio fuzzy, para gestão de risco em acidentes ferroviários, em particular descarrilamentos.

[00014] O trabalho proposto por H. Lee and l. Oh. “Establishing an ANN-Based Risk Model for Ground Subsidence Along Railways”. Applied Sciences, 2018, 8, 1936, descreve um modelo para análise de risco de subsidência do solo, ao longo de ferrovias. Tal documento possui foco na análise de risco de subsidência do solo, que é um problema de natureza geológica.

[00015] Com relação aos documentos de patente, o documento US2016/0350671 propõe um modelo de uma solução preditiva dinâmica que pode ser implantado com a finalidade de prever resultados operacionais de interesses em sistemas operacionais, dispositivos de hardware, máquinas e/ou processos associados com os mesmos, antes que ocorram os resultados operacionais de interesse. Apesar de fazer referência a predição dinâmica, o documento US2016/0350671 não faz referência a um problema especifico, não considerado dados reais de uma aplicação concreta nem um domínio de aplicação.

[00016] Assim, nota-se que o estado da técnica possui alguns documentos que se referem a análise de incidentes ferroviários e gestão de riscos. No entanto, não há revelação do estado da técnica sobre um sistema ou método para computar e estimar índices de riscos de incidentes ferroviários, de modo a auxiliar um operador na gestão de risco em tempo real.

[00017] Dessa forma, surge a necessidade de um método e sistema capaz de computar índices de riscos de incidentes ferroviários, de modo a auxiliar um operador na gestão de risco em tempo real.

DESCRIÇÃO RESUMIDA DA INVENÇÃO

[00018] A presente invenção se refere a um sistema e um método para cálculo de índices de riscos de incidentes ferroviários a partir de dados de condições operacionais relacionadas a esses incidentes. O objetivo da presente invenção é dar suporte a tomada de decisões relacionadas às atividades de gestão, avaliação e mitigação de riscos de incidentes ferroviários, e consequentemente contribuir para melhorar a segurança e eficiência nas operações ferroviárias.

[00019] O método consiste de quatro etapas distintas e iterativas. Por iterativo, significa que existe um comportamento cíclico na execução do método, de um estágio avançado pode-se iterar de volta a estágios anteriores, e prosseguir no processo. O método consiste na descoberta de correlações entre variáveis de incidentes ferroviários, ou seja, padrões de ocorrências de incidentes, e através desses padrões, computa um índice de risco associado a ocorrência dos incidentes.

[00020] Para alcançar os objetivos acima, a presente invenção revela um método para computar índices de riscos de incidentes ferroviários, o qual compreende as etapas de obter um conjunto de base de dados que compreende pelo menos uma base dados; obter pelo menos um modelo de aprendizado de máquina com pelo menos uma das base de dados para criar uma pluralidade de modelos preditivos; calcular a performance de ao menos um dos modelos preditivos com base em um critério predeterminado; selecionar o modelo com a melhor performance de acordo com o critério predeterminado; mediante uma solicitação de um usuário com dados de uma composição ferroviária, gerar um mapa de risco com base no modelo preditivo selecionado e os dados da composição ferroviária. A base de dados corresponde a I instâncias de incidente ferroviário e N atributos relacionados ao incidente ferroviário, na forma Im{(xn, yn)}, onde xn representa uma pluralidade de pares de atributo e valor referentes ao incidente ferroviário Im, e yn representa uma classe do referido incidente ferroviário Im.

[00021] A presente invenção provê ainda um sistema computacional dotado de meios adequados para a realização das etapas descritas acima.
BREVE DESCRIÇÃO DAS FIGURAS

- a figura 1 mostra um esquema ilustrativo da criação dos modelos preditivos a partir de um conjunto de bases de dados analíticos, bem como uma etapa de seleção do modelo preditivo com melhor performance;
- a figura 2 ilustra uma interface de consulta apresentando um mapa topográfico da estrada de ferro, criado a partir do método proposto pela presente invenção;
- a figura 3 revela um diagrama de blocos da arquitetura implementada por computador de acordo com a presente invenção;
- a figura 4 apresenta o diagrama de eventos de uma operação de consulta ao modelo preditivo.

DESCRIÇÃO DETALHADA DA INVENÇÃO

[00022] A descrição que se segue partirá de uma concretização preferencial da invenção, aplicada no campo de computação de índices de riscos de incidentes em ambiente ferroviário. Entretanto, como ficará evidente para qualquer técnico no assunto, a invenção não está limitada a essa concretização particular, podendo ser utilizada para prever risco de incidente, por exemplo, em linhas de metrô e estradas.

[00023] De acordo com a presente invenção, é descrito um método para computar índices de riscos de incidentes ferroviários, o qual compreende as etapas de:

- obter um conjunto de base de dados que compreende pelo menos uma base de dados;
- treinar modelos de aprendizado de máquina com pelo menos uma das base de dados para criar uma pluralidade de modelos preditivos;
- calcular a performance de ao menos um dos modelos preditivos com base em um critério predeterminado;
- selecionar o modelo com a melhor performance de acordo com o critério predeterminado;
- mediante uma solicitação de um usuário com dados de uma composição, gerar um mapa de risco com base no modelo preditivo selecionado e os dados da composição.

[00024] A base de dados corresponde a I instâncias de incidentes ferroviários e N atributos relacionados ao incidente ferroviário, na forma Im{(xn, yn)}, onde xn representa uma pluralidade de pares de atributo e valor referentes ao incidente ferroviário Im, e yn representa uma classe do referido incidente ferroviário Im.

[00025] Detalhes a respeito do método proposto serão descritos a seguir.

Ingestão de dados e construção de modelos analíticos

[00026] De acordo com a presente invenção, os dados para análise são obtidos de um Sistema de Gestão de Incidentes (Incident Management System IMS), dados os quais consistem de ocorrências de incidentes ferroviários. O IMS é um sistema coorporativo onde dados referentes a ocorrências de incidentes ferroviários são armazenados.

[00027] Preferencialmente, a transferência de dados do IMS para a base de dados do sistema de cálculo de índice de risco é feita de forma automática através de requisições emitidas por web services. Web services consistem de uma tecnologia utilizada na integração e comunicação entre sistemas computacionais, ou seja, permitem que diferentes sistemas interajam e troquem informações entre si. Nesse aspecto, ambos os sistemas contêm uma interface de comunicação entre eles, implementadas via web services e de acordo com o padrão de arquitetura REST (Representational State Transfer Protocol), transferindo dados através de conexão internet, usando o protocolo de comunicação HTTP. Nota-se que estes protocolos de comunicação entre aplicações de software são conhecidos do estado da técnica, e não são o objeto de proteção da presente invenção.

[00028] No método proposto, a transferência de dados ocorre de forma automática, ou seja, sem interferência humana, a intervalos de tempos previamente definidos, como por exemplo, uma vez ao dia, ou semana, etc.

[00029] Para que os dados de incidente provenientes do servidor IMS possam ser utilizados para treinar os modelos de aprendizado por máquina, estes devem preferencialmente ser pré-processados para estruturar os dados de interesse e, possivelmente, descartar informação que não possui relevância para o problema em questão. Por exemplo, diversas características a respeito de um incidente possuem significante valor administrativo, porém são pouco úteis para a implementação de um método de estimativa de risco. Informações como a data que o incidente foi relatado (e não a data que o incidente ocorreu), impacto financeiro e perdas operacionais, apesar de serem informações importantes, possuem baixo valor para fins preditivos. Adicionalmente, informações cuja distribuição de frequência é muito dispersa e aleatória devem ser preferencialmente removidas, uma vez que possuem pouca utilidade na identificação de padrões por sistemas de aprendizado por máquina.

[00030] O pré-processamento de dados é implementado e realizado de forma automática. As atividades de pré-processamento (seleção de atributos, seleção de instâncias e transformação de dados) são definidas e executadas durante a construção do modelo computacional, e implementadas num programa de computador para posterior execução automática. Dessa forma, a etapa de pré-processamento reside em obter dados de ocorrência de incidente (ferroviário) de um servidor IMS, realizar um pré-processamento dos dados de ocorrência de incidente de modo a criar pelo menos uma base de dados, em que o pré-processamento compreende criar pelo menos uma base de dados analítica A, com várias instâncias I contendo uma pluralidade N de pares atributos xi, yi a partir da informação de incidência de acidente.

[00031] O resultado dessa etapa são as bases de dados analíticas A.
Normalmente, várias bases analíticas são construídas, embora seja possível a construção de apenas uma base analítica, se esta for considerada suficiente. As bases de dados analíticas contêm casos de incidentes ferroviários, com um formato voltado para a tomada de decisão, ao invés de puramente operacional.

[00032] Como pode ser visto na Figura 1, as bases de dados analíticas podem ser entendidas como uma matriz, de tamanho IxN, onde I é o número de instâncias da base de dados, e N o número de atributos das bases de dados.

Construção de modelos preditivos para incidentes ferroviários

[00033] O conjunto de bases de dados analíticas AIxN obtidas na etapa anterior são usadas como dados de entrada para algoritmos de aprendizado de máquina, e o resultado obtido nesse processo são os modelos preditivos.

[00034] De acordo com a presente invenção, usa-se um método de aprendizado de máquina supervisionado, onde a partir de uma variável de interesse Y, seleciona-se um conjunto de variáveis X, X = (X1, X2, X3, ..., Xn), independentes entre si. A variável Y assume distintos valores, Y1, Y2, ..., Yk, chamados de classes, associados a um conjunto de variáveis X. O valor da variável Y, e.g., a classe de Y, pode ser computado em função dos valores de X. Y é a variável dependente e o conjunto de variáveis X, são as variáveis independentes, preditoras de Y.

[00035] Dessa forma, Y pode ser representado como:
Y = F(X1, X2, X3 , ... , Xn)

[00036] Consequentemente, a modelagem preditiva consiste em determinar uma função F(x), que dado um conjunto de elementos X1, X2, X3,..,Xn, determina a classe de Y, conforme descrito em C. Aggarwal. “Data Mining: The Textbook”. Springer, 734 pages (2015).

[00037] Sendo A um conjunto de dados, I uma instância de A com N atributos, na forma {(x1,y1), ...,(xn, yn)} onde Xi é um elemento de X, Xi ∈ X. Yi e uma variável de classe Y, Yi ∈ Y, associada a cada instância X. Um algoritmo de aprendizado de máquina procura determinar uma função:
g: X → Y,
onde X é o conjunto de dados de entrada, preditoras de Y, e Y o conjunto de dados de saída, a classe ser identificada.

[00038] O conjunto de bases de dados analíticas constituem o conjunto de dados A, e cada elemento I, denominados instâncias, I ∈ A, um caso de incidente ferroviário.

Definição das variáveis de interesse

[00039] Um dos objetivos da presente invenção se refere ao cálculo do índice de riscos para incidentes ferroviários. Portanto, deve-se determinar uma variável que representa a natureza do incidente, por exemplo, label_codnatureza, a qual representa o código da natureza do incidente, sendo a variável de interesse a ser identificada.

[00040] No campo técnico de operações ferroviárias, é possível enumerar cerca de 70 tipos diferentes de incidentes. No entanto, a concretização preferencial da presente invenção aqui descrita está preocupada com apenas quatro tipos de incidentes, a saber: Descarrilamento, Abalroamento, Atropelamento de pessoas e Vandalismo.

[00041] De acordo com esta representação preferencial, Y = labe_odnatureza. De acordo com uma concretização preferencial da presente invenção, Y assume 4 valores distintos, associados aos tipos de incidentes contemplados: descarrilamento, abalroamento, atropelamento de pessoas e vandalismo.

[00042] No entanto, fica claro para um técnico no assunto que outras variáveis de incidente poderiam ser consideradas e perfeitamente aplicadas na metodologia proposta pela presente invenção.

[00043] O método para computar índices de riscos de incidentes ferroviários é preferencialmente aplicado em um percurso ferroviário definido. O percurso ferroviário utilizado no caso concreto da presente invenção foi a Estrada de Ferro de Carajás (EFC). A partir do pré-processamento dos dados IMS, é possível obter uma lista de variáveis e respectivos valores, para o domínio de acidentes ferroviários em um percurso ferroviário. A EFC possui diversos atributos, no método aqui proposto definidos na forma @attribute, os quais se relaciona a uma variável.

[00044] A tabela 1 abaixo mostra a lista de atributos considerados para o percurso EFC da concretização preferencial, bem como seus possíveis valores.

[00045] As variáveis associadas às informações a respeito de um incidente ocorrido, juntamente com seus respectivos valores, compõem o conjunto de variáveis de X. Por exemplo, em um atributo N {(xi,yi)} onde Xi é um elemento de X, Xi ∈X. Yi e uma variável de classe Y, Yi ∈Y, seria:
N1 = (X1, Y1), onde por exemplo:
Y1 = DESCAR, identifica uma classe de incidente, descarrilamento.
X1 = (tipolocal = Circulacao, município = Maraba, pn = 0, falhafuncional = Nao, tração = convencional, situação = circulação, mes = Jun, diasemana = Quarta, turno = manha, tipo do trem = Minerio, comprimento = longo-3000m, locomotivas = <=2, quantidade vagões carregados = baixa-40vgs, quantidade de vagões vazios = alta+85vgs, carga = vazio-50vgs, contexto da causa do incidente = Equipamentos).

[00046] Cada elemento de X1, par atributo e valor, identifica as diversas características da composição envolvida no incidente ferroviário. Por exemplo, o atributo “tipo do trem” e seu respectivo valor “Minerio”.

[00047] Porém, é importante observar que os valores apresentados acima são referentes às variáveis da concretização particular do percurso de um trem na Estrada de Ferro de Carajás (percurso EFC). Tais características não devem ser entendidas como limitando o método da presente invenção. Diferentes conjuntos de dados podem ser usados, por exemplo, aplicando-se o método na Estrada de Ferro Vitoria Minas (EFVM), ou ainda outras estradas de ferro, apenas mudam-se os valores referentes a EFVM, e as variáveis especificas de cada ferrovia.

[00048] De acordo com uma concretização da invenção, o cálculo de índice de risco é computado em relação aos municípios, que se encontram no percurso da ferrovia. No entanto, o cálculo pode também ser feito com base em um valor determinado, em metros ou quilômetros, do percurso da ferrovia.

[00049] Opcionalmente, pode-se computar também um valor de sensibilidade referente a cada município pertencente ao percurso da EFC, associados a cada um dos incidentes contemplados. Esse valor de sensibilidade é usado como uma medida de relevância de cada município associado a cada incidente.

[00050] A medida de sensibilidade é computada a partir da frequência percentual de ocorrência de cada incidente nos municípios. Esse valor de sensibilidade é um fator multiplicador ao valor da predição de cada incidente, ao respectivo município.

[00051] Por exemplo, assume-se que o fator de sensibilidade de descarrilamento é 1,13 no município de Marabá. O índice de risco para descarrilamento de uma determinada composição trafegando pelo município de Marabá, será o resultado computado pelo modelo preditivo, multiplicado por 1,13. Esse valor é normalizado no intervalo [0,1], referente aos valores máximos e mínimos das predições de todos os incidentes, para o município de Marabá, da referida composição.

Definição dos algoritmos de aprendizado de máquina

[00052] O método proposto na presente invenção aplica uma estratégia de aprendizado de máquina indutivo supervisionado, na construção de modelos preditivos. Portanto, nessa etapa, diferentes algoritmos para aprendizado de máquina supervisionado são selecionados. Utilizou-se os algoritmos mais comumente usados para problemas classificatórios, pois os incidentes ferroviários são identificados como classes de incidentes. Os algoritmos selecionados foram:

[00053] O primeiro dos algoritmos considerados é gerador de arvores de decisão (Classification Tree). Árvores de decisão são métodos de aprendizado de máquinas supervisionado não-paramétricos, muito utilizados em tarefas de classificação e regressão. Os algoritmos utilizados para construir uma árvore de decisão a partir do conjunto de bases de dados são os algoritmos C4.5 e CART, conforme os documentos J. Ross Quinlan. “C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, San Mateo, CA (1993)” e L. Breiman. “Classification and Regression Trees. 1st Ed. (1984). O estado da técnica possui diversos documentos a respeito do algoritmo de construção de árvore de decisão a partir de um conjunto de dados supervisionado, logo o mesmo não será descrito em detalhes na presente invenção.

[00054] O segundo algoritmo testado é de regressão logística, que é uma técnica que tem como objetivo produzir, a partir de um conjunto de observações, um modelo que permita a predição de valores tomados por uma variável categórica, frequentemente binária, a partir de uma série de variáveis explicativas contínuas e/ou binárias. Nota-se que técnicas de regressão logística também são conhecidas do estado da técnica e não serão descritas no presente pedido.

[00055] O terceiro algoritmo testado na concretização preferencial da presente invenção é o de máquina de vetores de suporte (support vector machine - SVM). A máquina de vetores de suporte é um algoritmo de aprendizado supervisionado, cujo objetivo é classificar determinado conjunto de pontos de dados que são mapeados para um espaço de características multidimensional usando uma função kernel, abordagem utilizada para classificar problemas. Nela, o limite de decisão no espaço de entrada é representado por um hiperplano em dimensão superior no espaço. O algoritmo SVM também é conhecido do estado da técnica, tal como em Boser, B. E.; Guyon, I. M.; Vapnik, V. N. “A Training Algorithm for Optimal Margin Classifiers”. In: Annual workshop on computacional learning, 5, 1992, Pittsburgh. ACM Press. Pittsburgh: Haussler D, jul 1992. p.144-152; e também em Lorena, A. C e Carvalho, A. C. F. “Uma Introdução às Support Vector Machinesˮ, logo o mesmo não será descrito em detalhes na presente invenção.

[00056] O quarto algoritmo testado na concretização preferencial da presente invenção é o de Redes Naive Bayesianas. As Redes Bayesianas são redes que implementam o algoritmo de classificação Naive bayes, o qual é um classificador probabilístico que desconsidera completamente a correlação entre as variáveis. Tal algoritmo é muito útil em problemas de previsões em tempo real, classificação de texto e análise de sentimento. Uma descrição das redes bayesianas pode ser encontrada em C. Aggarwal. “Data Mining: The Textbookˮ. Springer, 734 pages (2015).

[00057] Para implementação desses algoritmos foi utilizado o framework WEKA 3.6.9, na linguagem de programação Java, versão 8. Descrição da plataforma WEKA pode ser encontrado em M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann and H. Witten. “The WEKA Data Mining Software: An Update”. SIGKDD Explorations, Volume 11, Issue 1 (2009).

[00058] No entanto, um técnico no assunto irá entender que é possível implementar os algoritmos de Naive Bayes, árvore de decisão, regressão logística e SVM por meio de diversas outras plataformas de software.

Medidas de performance dos modelos preditivos

[00059] De modo a avaliar a performance dos modelos preditivos utilizados, são propostas as medidas de acurácia, precisão e área da curva ROC (AUC). A acurácia (acurácia classificatória - AC) é a fração das instâncias corretamente classificadas, por exemplo, uma instância observada de um incidente de descarrilamento, corretamente identificada como descarrilamento. A Precisão mede a razão entre os verdadeiros positivos (ou seja, casos de incidentes corretamente identificados) e a soma dos verdadeiros positivos com os falsos positivos (incidentes erroneamente identificados). A área da curva ROC fornece uma medida de performance através da medida de área de um gráfico que plota as taxas de verdadeiro positivos e falsos positivos.

[00060] Discussões detalhadas sobre medidas de performance de modelos classificatórios, ou modelos preditivos, podem ser encontradas em C. Aggarwal. “Data Mining: The Textbookˮ. Springer, 734 pages (2015); em T. Hastie, R. Tibshirani, and J. Friedman. “The elements of statistical learning: data mining, inference and predictionˮ. 2nd. edn. Springer (2009); e em K. Wagstaff. “Machine Learning that Mattersˮ (2012).

[00061] De acordo com a concretização preferencial da presente invenção, aplicada em identificação de risco de incidente no percurso ferroviário de EFC, e utilizando uma base de dados com as variáveis presentes na Tabela 1, foi possível determinar algumas medidas de performance dos modelos preditivos. A Tabela 2 apresenta resultados de testes de performance realizados.

[00062] Para o exemplo de teste de performance da Tabela 2, foi utilizado uma base de dados com 3420 incidentes. Os atributos e respectivos valores possíveis são aqueles listados na Tabela 1 apresentada anteriormente. O Treinamento utilizado foi o de validação cruzada com 10 folds, com 100% da base de dados. Para a avaliação de performance com arquivos de testes, foi utilizada uma proporção de 75% para treinamento, e 25% para teste, estratificado por classe.

[00063] Neste exemplo, o algoritmo com a melhor performance foi regressão logística, com uma acurácia de 0.9375, seguido de redes Naive Bayesianas com 0.9276.

[00064] Preferencialmente, as bases de dados são atualizadas em períodos de tempo predeterminados. A medida que novas instâncias forem adicionadas à base de dados (novas ocorrências de incidentes), ou algumas das decisões em relação a modelagem de dados foram modificadas, os resultados de performance podem sofrer alterações, por isso o método proposto nessa invenção tem um caráter cíclico.

[00065] Por exemplo, o atributo quilômetro (quilômetro da ferrovia onde aconteceu um incidente) foi dividido em sete intervalos e, consequentemente, pode assumir a forma de sete valores distintos. Se uma nova divisão for proposta para o quilômetro ou se um percurso diferente for considerado, é provável que as medidas de performance sofram alterações.

[00066] De uma forma geral, as bases de dados tendem a ser dinâmicas, isso é, sofrem modificações ao longo do tempo, e por consequência, os modelos preditivos construídos a partir dessas bases de dados também as sofrem.

[00067] A concretização preferencial da presente invenção, aplicada na indicação de risco de incidentes ferroviários, obtém os dados de incidentes ferroviários a partir de um servidor de dados, tal como o IMS. Todas as variáveis pertinentes a um incidente ferroviário e obteníveis a partir do IMS são mostradas na Tabela 1.

Seleção de modelos preditivos

[00068] Conforme visto anteriormente, a partir de um algoritmo preditivo, tal como arvore de decisão, regressão logística, SVM ou Nayve Bayes, e um conjunto de dados, é possível criar um modelo preditivo. Para isto, é necessário treinar o algoritmo preditivo em questão com a referida base de dados.

[00069] Assim, diversos modelos preditivos podem ser gerados, de acordo com a modelagem de dados e de acordo com o algoritmo usado, como exemplificado na Tabela 2. Esses modelos preditivos são avaliados e selecionados de acordo com as medidas de performance discutidas anteriormente, a saber, acurácia, precisão e área da curva ROC (AUC).

[00070] Preferencialmente, a presente invenção prevê a atualização dos modelos preditivos de forma cíclica. Os modelos preditivos são dinamicamente gerados, e a cada alteração nas bases de dados, ou inserção de novas instancias de acidentes, novas bases analíticas podem ser construídas. Consequentemente, novos modelos preditivos podem ser gerados e validados. A figura 1 ilustra esse processo.

[00071] A Fig. 1 ilustra a etapa de seleção de modelos preditivos. A representa o conjunto de bases analíticas, com I instâncias e N atributos. Os modelos preditivos, modelol, modelo2, modelo n são criados a partir de diferentes algoritmos e / ou bases analíticas. O conjunto Y corresponde às predições, resultantes de cada modelo preditivo.

[00072] O modelo preditivo +, é o modelo com melhor avaliação de performance, conforme descrito na etapa de seleção de modelos preditivos. A seleção acontece através da computação das medidas de performance.

[00073] Em uma concretização opcional da presente invenção, as medidas de acurácia modelo e precisão em relação a predição de atropelamento de pessoas são as medidas usadas na seleção dos modelos preditivos. Seleciona-se os modelos de maior acurácia, e dentre esses, os modelos com maior precisão na identificação de incidentes de atropelamento de pessoas. A razão por usar a precisão de incidente atropelamento de pessoas como critério de seleção deve-se ao fato de ser esse o incidente mais crítico para identificação.

Interface de Consulta

[00074] Preferencialmente, o método proposto nessa invenção é implementado por um sistema computacional (software) para o cálculo de índices de riscos de incidentes ferroviários. A invenção tem como objetivo a construção de modelos preditivos como um sistema de suporte a decisões para gestão de riscos de incidentes ferroviários. Nesse contexto, dado um conjunto de dados de entrada, sobre as características de uma composição na via férrea, o modelo computa um índice de risco da ocorrência de incidentes, associado a esses dados. Por fim, tal índice de risco da ocorrência de incidentes deve preferencialmente ser acessível a um usuário, tal como um operador de segurança. A essa funcionalidade dá-se o nome de interface de consulta

[00075] Na concretização ilustrada na Figura 2, a interface de consulta apresenta um mapa topográfico da estrada de ferro, e um painel com um formulário. O formulário é onde os dados de uma composição são fornecidos, e o mapa indica a posição da composição na ferrovia. Na concretização preferencial da presente invenção, aplicada a um percurso ferroviário, o índice de risco é computado em relação aos municípios da ferrovia, para os incidentes considerados: atropelamento de pessoas, descarrilamento, abalroamento e vandalismo.

[00076] No lado esquerdo da tela ilustrado na Figura 2, é mostrado o painel de entrada de dados de uma composição. Pode-se observar na figura 2 a seguinte configuração: uma composição de minérios, com até duas locomotivas, trafegando no turno da tarde. A posição do mapa referente ao município de Açailândia foi selecionada e o modelo computa os índices de riscos, para cada um dos incidentes, em Açailândia. De acordo com o exemplo, os índices de risco são 0,53 para atropelamento de pessoas, 0,49 para vandalismo, 0,24 para descarrilamento, e 0,099 para abalroamento. Esses valores são mostrados num gráfico de barras, que também indica que os valores são normalizados no intervalo [0;1].

[00077] De acordo com a concretização opcional, os incidentes são identificados pelas respectivas cores, que estão dispostas na parte inferior esquerda do mapa da Figura 2, a saber: atropelamento de pessoas em vermelho, vandalismo em amarelo, descarrilamento em azul e abalroamento em verde. Movendo e posicionando-se o mouse ao longo da ferrovia sobre um município, no mapa, o sistema computa novos valores para o risco dos incidentes.

Arquitetura do sistema para computar índices de risco

[00078] Um técnico no assunto irá notar que as etapas do método para computar índices de riscos de incidentes são preferencialmente executadas por um computador. No entanto, considerando a equivalência lógica entre software e hardware, a presente invenção pode ser aplicada na forma de um sistema dotado de hardware dedicado para realizar as etapas do método para computar índices de riscos de incidentes ferroviários da presente invenção.

[00079] De acordo com uma concretização preferencial da presente invenção, a arquitetura do sistema proposto segue o padrão de arquiteturas de software orientadas a serviços (SOA), conforme o documento de T. Erl. “Service-Oriented Architecture: Concepts, Technology, and Design”. The Prentice Hall Service Technology Series (2005).

[00080] A Figura 3 ilustra um diagrama de blocos da arquitetura implementada por software de acordo com a presente invenção. A arquitetura engloba os componentes de ingestão de dados e construção de modelos analítico. Os dados originais de incidentes ferroviários são armazenados num sistema denominado Incident Management Systems (IMS). O nome desse sistema pode variar dependendo da organização, mas a função do IMS é o armazenamento de dados operacionais de incidentes, e no caso da EFC, incidentes ferroviários. Os dados de incidentes são extraídos por meio de Web Services, que são componentes de software que permitem a troca de dados entre diferentes sistemas computacionais, por meio de um protocolo de comunicação de rede de computadores, nesse caso, o protocolo http, usado na world wide web (internet).

[00081] Conforme pode ser observado na Figura 3, o sistema possui internamente uma base de dados de incidentes, que armazena os dados recebidos do IMS. Essa base de dados passa por uma etapa de pré-processamento e transformação de dados. Esse processo é automático, executado por um componente de software implementado na linguagem de programação R. A linguagem de programação que implementa o método e sistema para computar índices de riscos de incidentes não é objeto de proteção da presente invenção e não será discutida em detalhes. No entanto, informações a respeito da mesma podem ser encontradas em R Core Team (2018). “R: A language and environment for statistical computingˮ. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-proiect.org/.

[00082] O resultado desse processo são as bases de dado analíticas: A1, A2, An. Várias bases analíticas podem ser geradas nessa etapa, e são geradas em estruturas de data frames na linguagem R. Os data frames são exportados em formato ARFF, que é o formato nativo do framework Weka. Informações a respeito do framework Weka podem ser encontrados em M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann and H. Witten. “The WEKA Data Mining Software: An Update”. SIGKDD Explorations, Volume 11, Issue 1 (2009).

[00083] Existem dois principais componentes de software nessa arquitetura: o gerenciador de predições (PredictiveMgr) e o controlador de comunicações (CommunicationController).

[00084] O PredictiveMgr tem como função controlar a geração dos modelos preditivos, dos modelos analíticos (data frames), avaliação de performance dos modelos preditivos e a seleção do modelo preditivo com melhor performance, chamado de classificador. O PredictiveMgr recebe um conjunto de valores descrevendo um “cenário”, características de uma composição na ferrovia, e realiza uma consulta ao classificador gerando um índice de risco para cada classe (incidente ferroviário), de acordo com os dados do cenário.

[00085] O sistema proposto implementa uma arquitetura cliente- servidor. Toda a lógica está implementada no servidor, a interface de consulta, que é uma implementação web (web-based), é acessada através de máquinas clientes por navegadores de internet (web browsers). O CommunicationController é responsável pela interface de comunicação entre a interface do usuário (interface de consulta) e a lógica no servidor, realiza a validação da requisição (se os campos pedidos existem no modelo), computa as respostas com base nos municípios.

[00086] A figura 4, apresenta o diagrama de eventos de uma operação de consulta ao modelo preditivo.

[00087] Em uma concretização opcional, o sistema para computar índices de riscos de incidentes é implementado em linguagem de programação Java versão 8, usando o framework WEKA versão 3.8.1 para implementação dos algoritmos de aprendizado de máquina, linguagem de programação R versão 3.5 para implementação do pré-processamento de dados, html e javascript para interface de consulta.

[00088] Assim, a presente invenção apresenta uma solução técnica vantajosa para computar índices de riscos de incidentes ferroviários, a qual possui uma interface com um operador, de modo que tal operador possa avaliar os riscos de incidente e possivelmente tomar uma medida preventiva.

[00089] Na concretização ilustrativa descrita, com objetivo de computar índices de riscos de incidentes ferroviários, o método proposto é implementado por computador e é capaz de obter informações a respeito de incidentes ferroviários, realizar um pré-processamento dos dados de incidentes de modo a criar um conjunto de bases de dados. As bases de dados geradas são utilizadas para treinar modelos de aprendizado de máquina, de modo a obter diversos modelos de predição.

[00090] A etapa inicial é a ingestão de dados, ou seja, obtenção, análise e processamento de dados operacionais. Dados operacionais de incidentes ferroviários são coletados e armazenados em um sistema de banco de dados digital, identificados como IMS. Essa etapa inclui as atividades de seleção de atributos e pré-processamento de dados, e o resultado dessa etapa é uma série de modelos de dados, denominados bases analíticas A. A próxima etapa consiste na construção de modelos preditivos sobre os incidentes ferroviários, através de aplicação de algoritmos de aprendizado de máquina supervisionados. As bases analíticas criadas na etapa anterior são usadas como dados de entrada para esses algoritmos. O índice de risco de incidentes é resultado da computação desses modelos preditivos. Diversos modelos preditivos podem ser construídos nessa etapa, de acordo com os algoritmos e as bases analíticas usados. A etapa seguinte consiste na avaliação de performance preditiva dos modelos construídos na etapa anterior, de forma a selecionar o modelo com melhor performance. A quarta etapa do método proposto se relaciona a usabilidade, onde desenvolveu-se uma técnica de análise visual de informação, que permite aos usuários consultar os modelos preditivos.

[00091] A presente invenção é vantajosa uma vez que as bases de dados são criadas a partir de relatos de incidentes, onde as informações de interesse são extraídas com base em critérios determinados, de modo a criar os N atributos que formam uma base de dados.

[00092] É proposto a criação de diferentes modelos preditivos a partir de diferentes bases de dados e/ou diferentes técnicas de aprendizado de máquina, uma vez que o desempenho de cada técnica varia muito com o tipo de dados utilizado. Assim, a presente invenção torna possível que o modelo preditivo com a melhor performance seja selecionado, o qual será utilizado durante a consulta de um operador.

[00093] Outra vantagem da presente invenção é a sua ciclicidade. O conjunto de base dados é preferencialmente atualizado em períodos predeterminados. A partir de novas bases de dados, novos modelos preditivos são criados, o que possibilita o surgimento de um novo modelo M+. Desse modo, a presente invenção garante que o modelo que está sendo utilizado pela interface de consulta seja sempre o mais otimizado.

[00094] Na concretização ilustrada, o cálculo de índice de risco é computado em relação aos municípios, que se encontram no percurso da ferrovia. Portanto, computa uma medida de sensibilidade associado à cada município pertencente ao percurso da ferrovia em análise, referente a cada um dos incidentes contemplados. Esse valor de sensibilidade é usado como uma medida de relevância de cada município em relação a cada incidente, e utilizado na computação do índice de risco dos incidentes.

[00095] Inúmeras variações incidindo no escopo de proteção da presente invenção são permitidas. A invenção proposta não se restringe apenas a modelos de algoritmos, também apresenta uma arquitetura computacional para sua efetiva implementação num artefato de software. A invenção especifica o uso de Web Services, dentro de uma Arquitetura Orientada a Serviços (SOA). E estabelece o padrão de arquitetura REST (Representational State Transfer Protocol) para transferência de dados.

[00096] Adicionalmente, o método e sistema para computar índices de riscos de incidentes ferroviários pode ser utilizado para avaliar os riscos em diversos trajetos onde um veículo se desloca, desde que seja possível construir uma base de dados a respeito de atributos associados a um evento de particular interesse. Dessa forma, reforça-se o fato de que a presente invenção não está limitada às configurações/concretizações particulares acima descritas.

Claims

Método para computar índices de riscos de incidentes ferroviários, caracterizado por compreender as etapas de:
- - obter um conjunto de base de dados analíticas (A) compreendendo pelo menos uma base de dados analítica (A1, A2, An);
- - treinar pelo menos um modelo de aprendizado de máquina com pelo menos uma das base de dados para criar uma pluralidade de modelos preditivos (M1, M2, M3, ...., Mn);
- - calcular a performance de ao menos um dos modelos preditivos com base em um critério predeterminado;
- - selecionar o modelo com a melhor performance (M+) de acordo com o critério predeterminado;
- - mediante uma solicitação de um usuário com dados de uma composição ferroviária, gerar um mapa de risco com base no modelo preditivo selecionado (M+) e os dados da composição ferroviária;
em que a pelo menos uma base de dados analítica (A) compreende I instâncias de incidente ferroviário e N atributos relacionados ao incidente ferroviário, na forma Im{(xn, yn)}, onde xn representa uma pluralidade de pares de atributo e valor referentes ao incidente ferroviário Im, e yn representa uma classe do referido incidente ferroviário Im.
Método, de acordo com a reivindicação 1, caracterizado por o valor xi representar uma pluralidade de pares de atributo dentre:
tipo de local de circulação; município; passagem de nível (pn); falha funcional; tração; situação; mês; dia da semana; turno; tipo do trem; comprimento; número de locomotivas; quantidade vagões carregados; quantidade de vagões vazios; carga; contexto da causa do incidente.
Método, de acordo com a reivindicação 1 ou 2, caracterizado por o valor yi representar uma classe de incidente composta por: atropelamento de pessoas, descarrilamento, abalroamento e vandalismo.
Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado por a etapa de obter uma base de dados compreender as etapas de:
- - obter dados de ocorrência de incidente ferroviário de um servidor IMS;
- - realizar um pré-processamento dos dados de ocorrência de incidente de modo a criar pelo menos uma base de dados analítica (A1, A2, ..., An);
em que o pré-processamento compreende criar pelo menos uma instância (I) contendo uma pluralidade (N) de pares atributos (xi, yi) a partir da informação de incidência de acidente.
Método, de acordo com a reivindicação 4, caracterizado por o pré-processamento compreender a etapa de:
identificar, dentre os dados de ocorrência de incidente ferroviário do servidor IMS, pelo menos um atributo referente ao acidente e associar o valor do atributo à variável xi
identificar, dentre os dados de ocorrência de incidente ferroviário do servidor, a classe do acidente ferroviário e associar a classe do incidente ferroviários à variável y;
criar pelo menos uma instância I contendo uma pluralidade N de pares atributos xi, yi a partir da informação de incidência de acidente.
Método, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado por compreender a etapa de multiplicar o valor de performance de ao menos um dos modelos de aprendizado de máquina por um valor de sensibilidade com base em um local pertencente ao percurso do trem.
Método, de acordo com a reivindicação 6, caracterizado por o valor de sensibilidade ser computado a partir da frequência percentual de ocorrência de cada incidente nos locais pertencente ao percurso do trem.
Método, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado por a etapa de treinar pelo menos um modelo de aprendizado de máquina com a base de dados compreender:
gerar um modelo preditivo por meio de um algoritmo de aprendizado de máquina indutivo supervisionado.
Método, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que o pelo menos um modelo de aprendizado de máquina ser pelo menos um dentre: geradores de árvores de decisão, regressão logística, support vector machines (SVM) e Redes Naive Bayesianas.
Método, de acordo com qualquer uma das reivindicações 1 a 9, caracterizado pelo fato de que o critério predeterminado é pelo menos um dentre acurácia classificatória, precisão e área da curva ROC (AUC).
Método, de acordo com a reivindicação 10, caracterizado pelo fato de que o critério predeterminado possui dois critérios, onde o primeiro critério é a medida de acurácia do modelo, e o segundo critério é a precisão em relação a predição da classe de incidente atropelamento de pessoas, em que a etapa de selecionar o modelo com a melhor performance compreende ainda:
selecionar os modelos preditivos de maior acurácia, e
dentre esses, selecionar o modelo com maior precisão na identificação de incidentes de atropelamento de pessoas.
Método, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelo fato de que o método é repetido ciclicamente com base em um critério de ciclo dentre: inserção de novos incidentes na base de dados, alterações na própria ferrovia, alteração nos atributos usados para a geração dos modelos preditivos, e período de tempo.
Método, de acordo com qualquer uma das reivindicações 1 a 12, caracterizado pelo fato de que o mapa de risco é um mapa topográfico do percurso ferroviário, em que o índice de risco é computado em relação aos municípios da ferrovia, para os incidentes considerados: atropelamento de pessoas, abalroamento, descarrilamento e vandalismo.
Método, de acordo com qualquer uma das reivindicações 1 a 13, caracterizado pelo fato de que a etapa de gerar um mapa de risco compreende exibir uma interface de consulta a um usuário, em que o mapa de risco é gerado a partir dos dados fornecidos pelo usuário através da interface de consulta.
Método, de acordo com qualquer uma das reivindicações 1 a 13, caracterizado pelo fato de que a etapa de gerar um mapa de risco compreende gerar um mapa com índices de risco em relação a cada um dos municípios do percurso ferroviário para os incidentes considerados: atropelamento de pessoas, abalroamento, descarrilamento e vandalismo.
Sistema para computar índices de riscos de incidentes ferroviários, caracterizado por compreender:
- - meios para obter um conjunto de base de dados analíticas (A) compreendendo pelo menos uma base de dados analíticas (A1, A2, ..., An);
- - meios para gerar pelo menos um modelo de aprendizado de máquina com pelo menos uma das base de dados analíticas para criar uma pluralidade de modelos preditivos;
- - meios para calcular a performance de ao menos um dos modelos preditivos com base em um critério predeterminado;
- - meios para selecionar o modelo com a melhor performance de acordo com o critério predeterminado;
- - meios para, mediante uma solicitação de um usuário com dados de uma composição ferroviária, gerar um mapa de risco com base no modelo preditivo selecionado e os dados da composição ferroviária;
em que a pelo menos uma base de dados analítica (A) compreende I instâncias de incidente ferroviário e N atributos relacionados ao incidente ferroviário, na forma Im{(xn, yn)}, onde xn representa uma pluralidade de pares de atributo e valor referentes ao incidente ferroviário Im, e yn representa uma classe do referido incidente ferroviário Im.