BR102019008102A2 - método e sistema para computar índices de riscos de incidentes ferroviários - Google Patents
método e sistema para computar índices de riscos de incidentes ferroviários Download PDFInfo
- Publication number
- BR102019008102A2 BR102019008102A2 BR102019008102-3A BR102019008102A BR102019008102A2 BR 102019008102 A2 BR102019008102 A2 BR 102019008102A2 BR 102019008102 A BR102019008102 A BR 102019008102A BR 102019008102 A2 BR102019008102 A2 BR 102019008102A2
- Authority
- BR
- Brazil
- Prior art keywords
- railway
- incident
- data
- incidents
- risk
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000010801 machine learning Methods 0.000 claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims description 30
- 238000007781 pre-processing Methods 0.000 claims description 12
- 230000035945 sensitivity Effects 0.000 claims description 9
- 238000012706 support-vector machine Methods 0.000 claims description 8
- 238000003066 decision tree Methods 0.000 claims description 7
- 238000007477 logistic regression Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 5
- 230000003137 locomotive effect Effects 0.000 claims description 3
- 230000001939 inductive effect Effects 0.000 claims description 2
- 238000003780 insertion Methods 0.000 claims description 2
- 230000037431 insertion Effects 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 17
- 206010012411 Derailment Diseases 0.000 description 12
- 238000007726 management method Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 241000288113 Gallirallus australis Species 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000005065 mining Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 241000950314 Figura Species 0.000 description 4
- 238000007418 data mining Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000037406 food intake Effects 0.000 description 3
- 230000000116 mitigating effect Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000012502 risk assessment Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 101150029664 PELO gene Proteins 0.000 description 2
- 238000013501 data transformation Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 239000004058 oil shale Substances 0.000 description 2
- 238000011056 performance test Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000003449 preventive effect Effects 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 238000013106 supervised machine learning method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000003339 best practice Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000383 hazardous chemical Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L27/00—Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
- B61L27/50—Trackside diagnosis or maintenance, e.g. software upgrades
- B61L27/53—Trackside diagnosis or maintenance, e.g. software upgrades for trackside elements or systems, e.g. trackside supervision of trackside control system conditions
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L23/00—Control, warning or like safety means along the route or between vehicles or trains
- B61L23/04—Control, warning or like safety means along the route or between vehicles or trains for monitoring the mechanical state of the route
-
- B61L27/0088—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0796—Safety measures, i.e. ensuring safe condition in the event of error, e.g. for controlling element
Landscapes
- Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
método e sistema para computar índices de riscos de incidentes ferroviários a presente invenção provê um método para computar índices de riscos de incidentes ferroviários, o qual compreende as etapas de obter um conjunto de base de dados analíticas (a) compreendendo pelo menos uma base de dados (a1, a2,.., an); treinar pelo menos um modelo de aprendizado de máquina com pelo menos uma das base de dados para criar uma pluralidade de modelos preditivos (m1, m2, m3, ...., mn); calcular a performance de ao menos um dos modelos preditivos com base em um critério predeterminado; selecionar o modelo com a melhor performance de acordo com o critério predeterminado; mediante uma solicitação de um usuário com dados de uma composição ferroviária, gerar um mapa de risco com base no modelo preditivo selecionado (m+) e os dados da composição. a presente invenção é vantajosa uma vez que as base de dados analíticas (a) compreendem i instâncias de incidente ferroviário e n atributos relacionados ao incidente ferroviário, na forma im{(xn, yn)}, onde xn representa uma pluralidade de pares de atributo e valor referentes ao incidente ferroviário im, e yn representa uma classe do referido incidente ferroviário im. a presente invenção provê ainda um sistema computacional dotado de meios adequados para a realização das etapas descritas acima.
Description
[0001] A presente invenção está relacionada ao campo de segurança de tráfego ferroviário. Especificamente, a presente invenção trata de um método e um sistema para computar índices de riscos de incidentes ferroviários.
[0002] Análise de incidentes é uma atividade essencial em muitas operações industriais, principalmente naquelas que acontecem em condições e ambientes de alto risco operacional, como é o caso da indústria de mineração. Minérios extraídos das minas são transportados até a base de clientes através de redes de ferrovias e vias marítimas. Algumas empresas no ramo de mineração, além de suas atividades de mineração, também controlam suas operações de logística, que incluem transportes marítimos e ferroviários.
[0003] Ferrovias no Brasil cobrem longas distâncias, atravessam áreas remotas, pouco povoadas, como também áreas urbanas densamente povoadas. Portanto, nesse contexto, o transporte ferroviário consiste numa operação de risco, tanto para empregados e colaboradores da companhia, como para as populações que vivem em áreas próximas as ferrovias. Além da questão da segurança, existe também a questão da perda operacional e financeira, em consequência da interrupção da operação.
[0004] A maioria dos incidentes que acontecem ao longo da operação ferroviária podem ser caracterizados como eventos complexos, difíceis de se avaliar antecipadamente, devido à grande quantidade de variáveis envolvidas, e suas possíveis correlações. Empresas mineradoras ou de logística responsáveis pelo transporte de bens por ferrovias adotam várias iniciativas para mitigar o risco de incidentes em suas operações, como treinamento em procedimentos de segurança, uso de tecnologias de monitoramento como sensores e câmeras, e adoção de melhores práticas nos seus processos.
[0005] Adicionalmente a essas iniciativas, empresas coletam e armazenam dados operacionais sobre incidentes, para fins de analises e relatórios. A identificação e caracterização das variáveis que melhor descrevem eventos de incidentes é um fator crítico para elaboração de planos de segurança e mitigação de riscos de incidentes.
[0006] Uma estratégia para análise e mitigação de riscos de incidentes ferroviários consiste em identificar condições operacionais que contribuem para a ocorrência desses incidentes. E usar essas informações para avaliação e estimativa de riscos de incidentes.
[0007] O estado da técnica possui alguns estudos e iniciativas em análise, gestão e prevenção de acidentes ferroviários. Por exemplo, o trabalho descrito por W. Lira, R. Alves, J. M. Costa, G. Pessin, L. Galvão, Cleidson de Souza. “A Visual-Analytics System for Railway Safety Management. IEEE Computer Graphics and Applications”, vol. 34, no. 5, pp. 52-57 (2014), utiliza uma técnica de análise visual para análise de incidentes de atropelamento ferroviários. Essa técnica computa um índice de risco para incidentes de atropelamento ferroviários, e visualmente ilustra esse índice num mapa geográfico da ferrovia, juntamente com dados sócio-econômicos dos municípios e cidades por onde a ferrovia passa.
[0008] O trabalho de L. Wright, T. Schaafb. “Accident versus near miss causation: a critical review of the literature, an empirical test in the UK railway domain, and their implications for other sectors”. Journal of Hazardous Materials, Volume 11, Issues 1-3, pp. 105-110 (2004) relaciona-se às análises de incidentes ferroviários, onde três métodos de investigação são aplicados. Acidentes considerados graves são investigados por inquéritos formais (um painel de especialistas analisa um incidente em particular e realiza entrevistas com os envolvidos), incidentes menos graves são analisados por sistemas SPAD (Signal Passed at Danger) e CIRAS (Confidential Incident Reporting and Analysis System), normalmente usados para caso de “quase incidentes”.
[0009] Em H. Fukuda. “A Study on Incident Analysis Method for Railway Safety Managementˮ . Quarterly Report Railway Technical Research Inst., vol. 43, no. 2, pp. 83-86 (2002), enfatiza-se que industrias, como a ferroviária, de energia e de aviação sistematicamente coletam e analisam dados sobre incidentes, com a finalidade de prevenir esses incidentes. O objetivo maior é ser capaz de prever a ocorrência de incidentes, propor medidas de prevenção e mitigar o risco. Porém, apesar desses esforços, o documento conclui que não há um método universal para a análise de incidentes, e cada indústria desenvolve soluções próprias e customizadas. É proposto um modelo conceitual de sistema de informação, para extrair dados de incidentes e armazena-los em bases de dados para análise.
[00010] Outra iniciativa relevante é o trabalho desenvolvido por A. W. Evans, em “Fatal train accidents on Europe's railways: 1980-2009”. Accident Analysis and Prevention, 43, pp. 391-401 (2011), que trata de analises de acidentes ferroviários envolvendo fatalidades, especificamente colisões e descarrilamentos, nas principais linhas ferroviárias da Europa, no período de 1980 a 2009.
[00011] Diferentes tecnologias são usadas para avaliação de risco de incidentes ferroviários, como por exemplo o trabalho desenvolvido por R. Pastarus, S. Sabanov, T. Tohver. “Application of the risk assessment methods of railway transport in Estonian oil shale industry”. Oil Shale 2007, Vol. 24, No. 1, pp. 35-44, o qual aplica uma técnica de análise baseada em pares de informações de eventos / falhas, numa estrutura de árvore.
[00012] O trabalho apresentado por Min An, Wanchang Lin, and A. Strilinbg, 2013. “An Intelligent Railway Safety Risk Assessment Support System for Railway Operation and Maintenance Analysisˮ. The Open Transportation Journal 2013, Vol 7, pp. 27-42, apresenta um sistema para avaliação de risco de incidentes usando lógica fuzzy, num mecanismo de inferência fuzzy (Fuzzy Inference System FIS) baseado em regras.
[00013] M. Sasidharan, M. P. N. Burrow, G. S. Ghataora, M.E. Torbaghan, 2017. “A Review of Risk Management Applications for Railways”, apresenta uma revisão sobre aplicações computacionais para gestão de risco em ferrovias, e discute a integração de técnica de Simulação de Monte Carlo com raciocínio fuzzy, para gestão de risco em acidentes ferroviários, em particular descarrilamentos.
[00014] O trabalho proposto por H. Lee and l. Oh. “Establishing an ANN-Based Risk Model for Ground Subsidence Along Railways”. Applied Sciences, 2018, 8, 1936, descreve um modelo para análise de risco de subsidência do solo, ao longo de ferrovias. Tal documento possui foco na análise de risco de subsidência do solo, que é um problema de natureza geológica.
[00015] Com relação aos documentos de patente, o documento US2016/0350671 propõe um modelo de uma solução preditiva dinâmica que pode ser implantado com a finalidade de prever resultados operacionais de interesses em sistemas operacionais, dispositivos de hardware, máquinas e/ou processos associados com os mesmos, antes que ocorram os resultados operacionais de interesse. Apesar de fazer referência a predição dinâmica, o documento US2016/0350671 não faz referência a um problema especifico, não considerado dados reais de uma aplicação concreta nem um domínio de aplicação.
[00016] Assim, nota-se que o estado da técnica possui alguns documentos que se referem a análise de incidentes ferroviários e gestão de riscos. No entanto, não há revelação do estado da técnica sobre um sistema ou método para computar e estimar índices de riscos de incidentes ferroviários, de modo a auxiliar um operador na gestão de risco em tempo real.
[00017] Dessa forma, surge a necessidade de um método e sistema capaz de computar índices de riscos de incidentes ferroviários, de modo a auxiliar um operador na gestão de risco em tempo real.
[00018] A presente invenção se refere a um sistema e um método para cálculo de índices de riscos de incidentes ferroviários a partir de dados de condições operacionais relacionadas a esses incidentes. O objetivo da presente invenção é dar suporte a tomada de decisões relacionadas às atividades de gestão, avaliação e mitigação de riscos de incidentes ferroviários, e consequentemente contribuir para melhorar a segurança e eficiência nas operações ferroviárias.
[00019] O método consiste de quatro etapas distintas e iterativas. Por iterativo, significa que existe um comportamento cíclico na execução do método, de um estágio avançado pode-se iterar de volta a estágios anteriores, e prosseguir no processo. O método consiste na descoberta de correlações entre variáveis de incidentes ferroviários, ou seja, padrões de ocorrências de incidentes, e através desses padrões, computa um índice de risco associado a ocorrência dos incidentes.
[00020] Para alcançar os objetivos acima, a presente invenção revela um método para computar índices de riscos de incidentes ferroviários, o qual compreende as etapas de obter um conjunto de base de dados que compreende pelo menos uma base dados; obter pelo menos um modelo de aprendizado de máquina com pelo menos uma das base de dados para criar uma pluralidade de modelos preditivos; calcular a performance de ao menos um dos modelos preditivos com base em um critério predeterminado; selecionar o modelo com a melhor performance de acordo com o critério predeterminado; mediante uma solicitação de um usuário com dados de uma composição ferroviária, gerar um mapa de risco com base no modelo preditivo selecionado e os dados da composição ferroviária. A base de dados corresponde a I instâncias de incidente ferroviário e N atributos relacionados ao incidente ferroviário, na forma Im{(xn, yn)}, onde xn representa uma pluralidade de pares de atributo e valor referentes ao incidente ferroviário Im, e yn representa uma classe do referido incidente ferroviário Im.
[00021] A presente invenção provê ainda um sistema computacional dotado de meios adequados para a realização das etapas descritas acima.
BREVE DESCRIÇÃO DAS FIGURAS
BREVE DESCRIÇÃO DAS FIGURAS
- - a figura 1 mostra um esquema ilustrativo da criação dos modelos preditivos a partir de um conjunto de bases de dados analíticos, bem como uma etapa de seleção do modelo preditivo com melhor performance;
- - a figura 2 ilustra uma interface de consulta apresentando um mapa topográfico da estrada de ferro, criado a partir do método proposto pela presente invenção;
- - a figura 3 revela um diagrama de blocos da arquitetura implementada por computador de acordo com a presente invenção;
- - a figura 4 apresenta o diagrama de eventos de uma operação de consulta ao modelo preditivo.
[00022] A descrição que se segue partirá de uma concretização preferencial da invenção, aplicada no campo de computação de índices de riscos de incidentes em ambiente ferroviário. Entretanto, como ficará evidente para qualquer técnico no assunto, a invenção não está limitada a essa concretização particular, podendo ser utilizada para prever risco de incidente, por exemplo, em linhas de metrô e estradas.
[00023] De acordo com a presente invenção, é descrito um método para computar índices de riscos de incidentes ferroviários, o qual compreende as etapas de:
- - obter um conjunto de base de dados que compreende pelo menos uma base de dados;
- - treinar modelos de aprendizado de máquina com pelo menos uma das base de dados para criar uma pluralidade de modelos preditivos;
- - calcular a performance de ao menos um dos modelos preditivos com base em um critério predeterminado;
- - selecionar o modelo com a melhor performance de acordo com o critério predeterminado;
- - mediante uma solicitação de um usuário com dados de uma composição, gerar um mapa de risco com base no modelo preditivo selecionado e os dados da composição.
[00024] A base de dados corresponde a I instâncias de incidentes ferroviários e N atributos relacionados ao incidente ferroviário, na forma Im{(xn, yn)}, onde xn representa uma pluralidade de pares de atributo e valor referentes ao incidente ferroviário Im, e yn representa uma classe do referido incidente ferroviário Im.
[00025] Detalhes a respeito do método proposto serão descritos a seguir.
[00026] De acordo com a presente invenção, os dados para análise são obtidos de um Sistema de Gestão de Incidentes (Incident Management System IMS), dados os quais consistem de ocorrências de incidentes ferroviários. O IMS é um sistema coorporativo onde dados referentes a ocorrências de incidentes ferroviários são armazenados.
[00027] Preferencialmente, a transferência de dados do IMS para a base de dados do sistema de cálculo de índice de risco é feita de forma automática através de requisições emitidas por web services. Web services consistem de uma tecnologia utilizada na integração e comunicação entre sistemas computacionais, ou seja, permitem que diferentes sistemas interajam e troquem informações entre si. Nesse aspecto, ambos os sistemas contêm uma interface de comunicação entre eles, implementadas via web services e de acordo com o padrão de arquitetura REST (Representational State Transfer Protocol), transferindo dados através de conexão internet, usando o protocolo de comunicação HTTP. Nota-se que estes protocolos de comunicação entre aplicações de software são conhecidos do estado da técnica, e não são o objeto de proteção da presente invenção.
[00028] No método proposto, a transferência de dados ocorre de forma automática, ou seja, sem interferência humana, a intervalos de tempos previamente definidos, como por exemplo, uma vez ao dia, ou semana, etc.
[00029] Para que os dados de incidente provenientes do servidor IMS possam ser utilizados para treinar os modelos de aprendizado por máquina, estes devem preferencialmente ser pré-processados para estruturar os dados de interesse e, possivelmente, descartar informação que não possui relevância para o problema em questão. Por exemplo, diversas características a respeito de um incidente possuem significante valor administrativo, porém são pouco úteis para a implementação de um método de estimativa de risco. Informações como a data que o incidente foi relatado (e não a data que o incidente ocorreu), impacto financeiro e perdas operacionais, apesar de serem informações importantes, possuem baixo valor para fins preditivos. Adicionalmente, informações cuja distribuição de frequência é muito dispersa e aleatória devem ser preferencialmente removidas, uma vez que possuem pouca utilidade na identificação de padrões por sistemas de aprendizado por máquina.
[00030] O pré-processamento de dados é implementado e realizado de forma automática. As atividades de pré-processamento (seleção de atributos, seleção de instâncias e transformação de dados) são definidas e executadas durante a construção do modelo computacional, e implementadas num programa de computador para posterior execução automática. Dessa forma, a etapa de pré-processamento reside em obter dados de ocorrência de incidente (ferroviário) de um servidor IMS, realizar um pré-processamento dos dados de ocorrência de incidente de modo a criar pelo menos uma base de dados, em que o pré-processamento compreende criar pelo menos uma base de dados analítica A, com várias instâncias I contendo uma pluralidade N de pares atributos xi, yi a partir da informação de incidência de acidente.
[00031] O resultado dessa etapa são as bases de dados analíticas A.
Normalmente, várias bases analíticas são construídas, embora seja possível a construção de apenas uma base analítica, se esta for considerada suficiente. As bases de dados analíticas contêm casos de incidentes ferroviários, com um formato voltado para a tomada de decisão, ao invés de puramente operacional.
Normalmente, várias bases analíticas são construídas, embora seja possível a construção de apenas uma base analítica, se esta for considerada suficiente. As bases de dados analíticas contêm casos de incidentes ferroviários, com um formato voltado para a tomada de decisão, ao invés de puramente operacional.
[00032] Como pode ser visto na Figura 1, as bases de dados analíticas podem ser entendidas como uma matriz, de tamanho IxN, onde I é o número de instâncias da base de dados, e N o número de atributos das bases de dados.
[00033] O conjunto de bases de dados analíticas AIxN obtidas na etapa anterior são usadas como dados de entrada para algoritmos de aprendizado de máquina, e o resultado obtido nesse processo são os modelos preditivos.
[00034] De acordo com a presente invenção, usa-se um método de aprendizado de máquina supervisionado, onde a partir de uma variável de interesse Y, seleciona-se um conjunto de variáveis X, X = (X1, X2, X3, ..., Xn), independentes entre si. A variável Y assume distintos valores, Y1, Y2, ..., Yk, chamados de classes, associados a um conjunto de variáveis X. O valor da variável Y, e.g., a classe de Y, pode ser computado em função dos valores de X. Y é a variável dependente e o conjunto de variáveis X, são as variáveis independentes, preditoras de Y.
[00035] Dessa forma, Y pode ser representado como:
Y = F(X1, X2, X3 , ... , Xn)
Y = F(X1, X2, X3 , ... , Xn)
[00036] Consequentemente, a modelagem preditiva consiste em determinar uma função F(x), que dado um conjunto de elementos X1, X2, X3,..,Xn, determina a classe de Y, conforme descrito em C. Aggarwal. “Data Mining: The Textbook”. Springer, 734 pages (2015).
[00037] Sendo A um conjunto de dados, I uma instância de A com N atributos, na forma {(x1,y1), ...,(xn, yn)} onde Xi é um elemento de X, Xi ∈ X. Yi e uma variável de classe Y, Yi ∈ Y, associada a cada instância X. Um algoritmo de aprendizado de máquina procura determinar uma função:
g: X → Y,
onde X é o conjunto de dados de entrada, preditoras de Y, e Y o conjunto de dados de saída, a classe ser identificada.
g: X → Y,
onde X é o conjunto de dados de entrada, preditoras de Y, e Y o conjunto de dados de saída, a classe ser identificada.
[00038] O conjunto de bases de dados analíticas constituem o conjunto de dados A, e cada elemento I, denominados instâncias, I ∈ A, um caso de incidente ferroviário.
[00039] Um dos objetivos da presente invenção se refere ao cálculo do índice de riscos para incidentes ferroviários. Portanto, deve-se determinar uma variável que representa a natureza do incidente, por exemplo, label_codnatureza, a qual representa o código da natureza do incidente, sendo a variável de interesse a ser identificada.
[00040] No campo técnico de operações ferroviárias, é possível enumerar cerca de 70 tipos diferentes de incidentes. No entanto, a concretização preferencial da presente invenção aqui descrita está preocupada com apenas quatro tipos de incidentes, a saber: Descarrilamento, Abalroamento, Atropelamento de pessoas e Vandalismo.
[00041] De acordo com esta representação preferencial, Y = labe_odnatureza. De acordo com uma concretização preferencial da presente invenção, Y assume 4 valores distintos, associados aos tipos de incidentes contemplados: descarrilamento, abalroamento, atropelamento de pessoas e vandalismo.
[00042] No entanto, fica claro para um técnico no assunto que outras variáveis de incidente poderiam ser consideradas e perfeitamente aplicadas na metodologia proposta pela presente invenção.
[00043] O método para computar índices de riscos de incidentes ferroviários é preferencialmente aplicado em um percurso ferroviário definido. O percurso ferroviário utilizado no caso concreto da presente invenção foi a Estrada de Ferro de Carajás (EFC). A partir do pré-processamento dos dados IMS, é possível obter uma lista de variáveis e respectivos valores, para o domínio de acidentes ferroviários em um percurso ferroviário. A EFC possui diversos atributos, no método aqui proposto definidos na forma @attribute, os quais se relaciona a uma variável.
[00044] A tabela 1 abaixo mostra a lista de atributos considerados para o percurso EFC da concretização preferencial, bem como seus possíveis valores.
[00045] As variáveis associadas às informações a respeito de um incidente ocorrido, juntamente com seus respectivos valores, compõem o conjunto de variáveis de X. Por exemplo, em um atributo N {(xi,yi)} onde Xi é um elemento de X, Xi ∈X. Yi e uma variável de classe Y, Yi ∈Y, seria:
N1 = (X1, Y1), onde por exemplo:
Y1 = DESCAR, identifica uma classe de incidente, descarrilamento.
X1 = (tipolocal = Circulacao, município = Maraba, pn = 0, falhafuncional = Nao, tração = convencional, situação = circulação, mes = Jun, diasemana = Quarta, turno = manha, tipo do trem = Minerio, comprimento = longo-3000m, locomotivas = <=2, quantidade vagões carregados = baixa-40vgs, quantidade de vagões vazios = alta+85vgs, carga = vazio-50vgs, contexto da causa do incidente = Equipamentos).
N1 = (X1, Y1), onde por exemplo:
Y1 = DESCAR, identifica uma classe de incidente, descarrilamento.
X1 = (tipolocal = Circulacao, município = Maraba, pn = 0, falhafuncional = Nao, tração = convencional, situação = circulação, mes = Jun, diasemana = Quarta, turno = manha, tipo do trem = Minerio, comprimento = longo-3000m, locomotivas = <=2, quantidade vagões carregados = baixa-40vgs, quantidade de vagões vazios = alta+85vgs, carga = vazio-50vgs, contexto da causa do incidente = Equipamentos).
[00046] Cada elemento de X1, par atributo e valor, identifica as diversas características da composição envolvida no incidente ferroviário. Por exemplo, o atributo “tipo do trem” e seu respectivo valor “Minerio”.
[00047] Porém, é importante observar que os valores apresentados acima são referentes às variáveis da concretização particular do percurso de um trem na Estrada de Ferro de Carajás (percurso EFC). Tais características não devem ser entendidas como limitando o método da presente invenção. Diferentes conjuntos de dados podem ser usados, por exemplo, aplicando-se o método na Estrada de Ferro Vitoria Minas (EFVM), ou ainda outras estradas de ferro, apenas mudam-se os valores referentes a EFVM, e as variáveis especificas de cada ferrovia.
[00048] De acordo com uma concretização da invenção, o cálculo de índice de risco é computado em relação aos municípios, que se encontram no percurso da ferrovia. No entanto, o cálculo pode também ser feito com base em um valor determinado, em metros ou quilômetros, do percurso da ferrovia.
[00049] Opcionalmente, pode-se computar também um valor de sensibilidade referente a cada município pertencente ao percurso da EFC, associados a cada um dos incidentes contemplados. Esse valor de sensibilidade é usado como uma medida de relevância de cada município associado a cada incidente.
[00050] A medida de sensibilidade é computada a partir da frequência percentual de ocorrência de cada incidente nos municípios. Esse valor de sensibilidade é um fator multiplicador ao valor da predição de cada incidente, ao respectivo município.
[00051] Por exemplo, assume-se que o fator de sensibilidade de descarrilamento é 1,13 no município de Marabá. O índice de risco para descarrilamento de uma determinada composição trafegando pelo município de Marabá, será o resultado computado pelo modelo preditivo, multiplicado por 1,13. Esse valor é normalizado no intervalo [0,1], referente aos valores máximos e mínimos das predições de todos os incidentes, para o município de Marabá, da referida composição.
[00052] O método proposto na presente invenção aplica uma estratégia de aprendizado de máquina indutivo supervisionado, na construção de modelos preditivos. Portanto, nessa etapa, diferentes algoritmos para aprendizado de máquina supervisionado são selecionados. Utilizou-se os algoritmos mais comumente usados para problemas classificatórios, pois os incidentes ferroviários são identificados como classes de incidentes. Os algoritmos selecionados foram:
[00053] O primeiro dos algoritmos considerados é gerador de arvores de decisão (Classification Tree). Árvores de decisão são métodos de aprendizado de máquinas supervisionado não-paramétricos, muito utilizados em tarefas de classificação e regressão. Os algoritmos utilizados para construir uma árvore de decisão a partir do conjunto de bases de dados são os algoritmos C4.5 e CART, conforme os documentos J. Ross Quinlan. “C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, San Mateo, CA (1993)” e L. Breiman. “Classification and Regression Trees. 1st Ed. (1984). O estado da técnica possui diversos documentos a respeito do algoritmo de construção de árvore de decisão a partir de um conjunto de dados supervisionado, logo o mesmo não será descrito em detalhes na presente invenção.
[00054] O segundo algoritmo testado é de regressão logística, que é uma técnica que tem como objetivo produzir, a partir de um conjunto de observações, um modelo que permita a predição de valores tomados por uma variável categórica, frequentemente binária, a partir de uma série de variáveis explicativas contínuas e/ou binárias. Nota-se que técnicas de regressão logística também são conhecidas do estado da técnica e não serão descritas no presente pedido.
[00055] O terceiro algoritmo testado na concretização preferencial da presente invenção é o de máquina de vetores de suporte (support vector machine - SVM). A máquina de vetores de suporte é um algoritmo de aprendizado supervisionado, cujo objetivo é classificar determinado conjunto de pontos de dados que são mapeados para um espaço de características multidimensional usando uma função kernel, abordagem utilizada para classificar problemas. Nela, o limite de decisão no espaço de entrada é representado por um hiperplano em dimensão superior no espaço. O algoritmo SVM também é conhecido do estado da técnica, tal como em Boser, B. E.; Guyon, I. M.; Vapnik, V. N. “A Training Algorithm for Optimal Margin Classifiers”. In: Annual workshop on computacional learning, 5, 1992, Pittsburgh. ACM Press. Pittsburgh: Haussler D, jul 1992. p.144-152; e também em Lorena, A. C e Carvalho, A. C. F. “Uma Introdução às Support Vector Machinesˮ, logo o mesmo não será descrito em detalhes na presente invenção.
[00056] O quarto algoritmo testado na concretização preferencial da presente invenção é o de Redes Naive Bayesianas. As Redes Bayesianas são redes que implementam o algoritmo de classificação Naive bayes, o qual é um classificador probabilístico que desconsidera completamente a correlação entre as variáveis. Tal algoritmo é muito útil em problemas de previsões em tempo real, classificação de texto e análise de sentimento. Uma descrição das redes bayesianas pode ser encontrada em C. Aggarwal. “Data Mining: The Textbookˮ. Springer, 734 pages (2015).
[00057] Para implementação desses algoritmos foi utilizado o framework WEKA 3.6.9, na linguagem de programação Java, versão 8. Descrição da plataforma WEKA pode ser encontrado em M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann and H. Witten. “The WEKA Data Mining Software: An Update”. SIGKDD Explorations, Volume 11, Issue 1 (2009).
[00058] No entanto, um técnico no assunto irá entender que é possível implementar os algoritmos de Naive Bayes, árvore de decisão, regressão logística e SVM por meio de diversas outras plataformas de software.
[00059] De modo a avaliar a performance dos modelos preditivos utilizados, são propostas as medidas de acurácia, precisão e área da curva ROC (AUC). A acurácia (acurácia classificatória - AC) é a fração das instâncias corretamente classificadas, por exemplo, uma instância observada de um incidente de descarrilamento, corretamente identificada como descarrilamento. A Precisão mede a razão entre os verdadeiros positivos (ou seja, casos de incidentes corretamente identificados) e a soma dos verdadeiros positivos com os falsos positivos (incidentes erroneamente identificados). A área da curva ROC fornece uma medida de performance através da medida de área de um gráfico que plota as taxas de verdadeiro positivos e falsos positivos.
[00060] Discussões detalhadas sobre medidas de performance de modelos classificatórios, ou modelos preditivos, podem ser encontradas em C. Aggarwal. “Data Mining: The Textbookˮ. Springer, 734 pages (2015); em T. Hastie, R. Tibshirani, and J. Friedman. “The elements of statistical learning: data mining, inference and predictionˮ. 2nd. edn. Springer (2009); e em K. Wagstaff. “Machine Learning that Mattersˮ (2012).
[00061] De acordo com a concretização preferencial da presente invenção, aplicada em identificação de risco de incidente no percurso ferroviário de EFC, e utilizando uma base de dados com as variáveis presentes na Tabela 1, foi possível determinar algumas medidas de performance dos modelos preditivos. A Tabela 2 apresenta resultados de testes de performance realizados.
[00062] Para o exemplo de teste de performance da Tabela 2, foi utilizado uma base de dados com 3420 incidentes. Os atributos e respectivos valores possíveis são aqueles listados na Tabela 1 apresentada anteriormente. O Treinamento utilizado foi o de validação cruzada com 10 folds, com 100% da base de dados. Para a avaliação de performance com arquivos de testes, foi utilizada uma proporção de 75% para treinamento, e 25% para teste, estratificado por classe.
[00063] Neste exemplo, o algoritmo com a melhor performance foi regressão logística, com uma acurácia de 0.9375, seguido de redes Naive Bayesianas com 0.9276.
[00064] Preferencialmente, as bases de dados são atualizadas em períodos de tempo predeterminados. A medida que novas instâncias forem adicionadas à base de dados (novas ocorrências de incidentes), ou algumas das decisões em relação a modelagem de dados foram modificadas, os resultados de performance podem sofrer alterações, por isso o método proposto nessa invenção tem um caráter cíclico.
[00065] Por exemplo, o atributo quilômetro (quilômetro da ferrovia onde aconteceu um incidente) foi dividido em sete intervalos e, consequentemente, pode assumir a forma de sete valores distintos. Se uma nova divisão for proposta para o quilômetro ou se um percurso diferente for considerado, é provável que as medidas de performance sofram alterações.
[00066] De uma forma geral, as bases de dados tendem a ser dinâmicas, isso é, sofrem modificações ao longo do tempo, e por consequência, os modelos preditivos construídos a partir dessas bases de dados também as sofrem.
[00067] A concretização preferencial da presente invenção, aplicada na indicação de risco de incidentes ferroviários, obtém os dados de incidentes ferroviários a partir de um servidor de dados, tal como o IMS. Todas as variáveis pertinentes a um incidente ferroviário e obteníveis a partir do IMS são mostradas na Tabela 1.
[00068] Conforme visto anteriormente, a partir de um algoritmo preditivo, tal como arvore de decisão, regressão logística, SVM ou Nayve Bayes, e um conjunto de dados, é possível criar um modelo preditivo. Para isto, é necessário treinar o algoritmo preditivo em questão com a referida base de dados.
[00069] Assim, diversos modelos preditivos podem ser gerados, de acordo com a modelagem de dados e de acordo com o algoritmo usado, como exemplificado na Tabela 2. Esses modelos preditivos são avaliados e selecionados de acordo com as medidas de performance discutidas anteriormente, a saber, acurácia, precisão e área da curva ROC (AUC).
[00070] Preferencialmente, a presente invenção prevê a atualização dos modelos preditivos de forma cíclica. Os modelos preditivos são dinamicamente gerados, e a cada alteração nas bases de dados, ou inserção de novas instancias de acidentes, novas bases analíticas podem ser construídas. Consequentemente, novos modelos preditivos podem ser gerados e validados. A figura 1 ilustra esse processo.
[00071] A Fig. 1 ilustra a etapa de seleção de modelos preditivos. A representa o conjunto de bases analíticas, com I instâncias e N atributos. Os modelos preditivos, modelol, modelo2, modelo n são criados a partir de diferentes algoritmos e / ou bases analíticas. O conjunto Y corresponde às predições, resultantes de cada modelo preditivo.
[00072] O modelo preditivo +, é o modelo com melhor avaliação de performance, conforme descrito na etapa de seleção de modelos preditivos. A seleção acontece através da computação das medidas de performance.
[00073] Em uma concretização opcional da presente invenção, as medidas de acurácia modelo e precisão em relação a predição de atropelamento de pessoas são as medidas usadas na seleção dos modelos preditivos. Seleciona-se os modelos de maior acurácia, e dentre esses, os modelos com maior precisão na identificação de incidentes de atropelamento de pessoas. A razão por usar a precisão de incidente atropelamento de pessoas como critério de seleção deve-se ao fato de ser esse o incidente mais crítico para identificação.
[00074] Preferencialmente, o método proposto nessa invenção é implementado por um sistema computacional (software) para o cálculo de índices de riscos de incidentes ferroviários. A invenção tem como objetivo a construção de modelos preditivos como um sistema de suporte a decisões para gestão de riscos de incidentes ferroviários. Nesse contexto, dado um conjunto de dados de entrada, sobre as características de uma composição na via férrea, o modelo computa um índice de risco da ocorrência de incidentes, associado a esses dados. Por fim, tal índice de risco da ocorrência de incidentes deve preferencialmente ser acessível a um usuário, tal como um operador de segurança. A essa funcionalidade dá-se o nome de interface de consulta
[00075] Na concretização ilustrada na Figura 2, a interface de consulta apresenta um mapa topográfico da estrada de ferro, e um painel com um formulário. O formulário é onde os dados de uma composição são fornecidos, e o mapa indica a posição da composição na ferrovia. Na concretização preferencial da presente invenção, aplicada a um percurso ferroviário, o índice de risco é computado em relação aos municípios da ferrovia, para os incidentes considerados: atropelamento de pessoas, descarrilamento, abalroamento e vandalismo.
[00076] No lado esquerdo da tela ilustrado na Figura 2, é mostrado o painel de entrada de dados de uma composição. Pode-se observar na figura 2 a seguinte configuração: uma composição de minérios, com até duas locomotivas, trafegando no turno da tarde. A posição do mapa referente ao município de Açailândia foi selecionada e o modelo computa os índices de riscos, para cada um dos incidentes, em Açailândia. De acordo com o exemplo, os índices de risco são 0,53 para atropelamento de pessoas, 0,49 para vandalismo, 0,24 para descarrilamento, e 0,099 para abalroamento. Esses valores são mostrados num gráfico de barras, que também indica que os valores são normalizados no intervalo [0;1].
[00077] De acordo com a concretização opcional, os incidentes são identificados pelas respectivas cores, que estão dispostas na parte inferior esquerda do mapa da Figura 2, a saber: atropelamento de pessoas em vermelho, vandalismo em amarelo, descarrilamento em azul e abalroamento em verde. Movendo e posicionando-se o mouse ao longo da ferrovia sobre um município, no mapa, o sistema computa novos valores para o risco dos incidentes.
[00078] Um técnico no assunto irá notar que as etapas do método para computar índices de riscos de incidentes são preferencialmente executadas por um computador. No entanto, considerando a equivalência lógica entre software e hardware, a presente invenção pode ser aplicada na forma de um sistema dotado de hardware dedicado para realizar as etapas do método para computar índices de riscos de incidentes ferroviários da presente invenção.
[00079] De acordo com uma concretização preferencial da presente invenção, a arquitetura do sistema proposto segue o padrão de arquiteturas de software orientadas a serviços (SOA), conforme o documento de T. Erl. “Service-Oriented Architecture: Concepts, Technology, and Design”. The Prentice Hall Service Technology Series (2005).
[00080] A Figura 3 ilustra um diagrama de blocos da arquitetura implementada por software de acordo com a presente invenção. A arquitetura engloba os componentes de ingestão de dados e construção de modelos analítico. Os dados originais de incidentes ferroviários são armazenados num sistema denominado Incident Management Systems (IMS). O nome desse sistema pode variar dependendo da organização, mas a função do IMS é o armazenamento de dados operacionais de incidentes, e no caso da EFC, incidentes ferroviários. Os dados de incidentes são extraídos por meio de Web Services, que são componentes de software que permitem a troca de dados entre diferentes sistemas computacionais, por meio de um protocolo de comunicação de rede de computadores, nesse caso, o protocolo http, usado na world wide web (internet).
[00081] Conforme pode ser observado na Figura 3, o sistema possui internamente uma base de dados de incidentes, que armazena os dados recebidos do IMS. Essa base de dados passa por uma etapa de pré-processamento e transformação de dados. Esse processo é automático, executado por um componente de software implementado na linguagem de programação R. A linguagem de programação que implementa o método e sistema para computar índices de riscos de incidentes não é objeto de proteção da presente invenção e não será discutida em detalhes. No entanto, informações a respeito da mesma podem ser encontradas em R Core Team (2018). “R: A language and environment for statistical computingˮ. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-proiect.org/.
[00082] O resultado desse processo são as bases de dado analíticas: A1, A2, An. Várias bases analíticas podem ser geradas nessa etapa, e são geradas em estruturas de data frames na linguagem R. Os data frames são exportados em formato ARFF, que é o formato nativo do framework Weka. Informações a respeito do framework Weka podem ser encontrados em M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann and H. Witten. “The WEKA Data Mining Software: An Update”. SIGKDD Explorations, Volume 11, Issue 1 (2009).
[00083] Existem dois principais componentes de software nessa arquitetura: o gerenciador de predições (PredictiveMgr) e o controlador de comunicações (CommunicationController).
[00084] O PredictiveMgr tem como função controlar a geração dos modelos preditivos, dos modelos analíticos (data frames), avaliação de performance dos modelos preditivos e a seleção do modelo preditivo com melhor performance, chamado de classificador. O PredictiveMgr recebe um conjunto de valores descrevendo um “cenário”, características de uma composição na ferrovia, e realiza uma consulta ao classificador gerando um índice de risco para cada classe (incidente ferroviário), de acordo com os dados do cenário.
[00085] O sistema proposto implementa uma arquitetura cliente- servidor. Toda a lógica está implementada no servidor, a interface de consulta, que é uma implementação web (web-based), é acessada através de máquinas clientes por navegadores de internet (web browsers). O CommunicationController é responsável pela interface de comunicação entre a interface do usuário (interface de consulta) e a lógica no servidor, realiza a validação da requisição (se os campos pedidos existem no modelo), computa as respostas com base nos municípios.
[00086] A figura 4, apresenta o diagrama de eventos de uma operação de consulta ao modelo preditivo.
[00087] Em uma concretização opcional, o sistema para computar índices de riscos de incidentes é implementado em linguagem de programação Java versão 8, usando o framework WEKA versão 3.8.1 para implementação dos algoritmos de aprendizado de máquina, linguagem de programação R versão 3.5 para implementação do pré-processamento de dados, html e javascript para interface de consulta.
[00088] Assim, a presente invenção apresenta uma solução técnica vantajosa para computar índices de riscos de incidentes ferroviários, a qual possui uma interface com um operador, de modo que tal operador possa avaliar os riscos de incidente e possivelmente tomar uma medida preventiva.
[00089] Na concretização ilustrativa descrita, com objetivo de computar índices de riscos de incidentes ferroviários, o método proposto é implementado por computador e é capaz de obter informações a respeito de incidentes ferroviários, realizar um pré-processamento dos dados de incidentes de modo a criar um conjunto de bases de dados. As bases de dados geradas são utilizadas para treinar modelos de aprendizado de máquina, de modo a obter diversos modelos de predição.
[00090] A etapa inicial é a ingestão de dados, ou seja, obtenção, análise e processamento de dados operacionais. Dados operacionais de incidentes ferroviários são coletados e armazenados em um sistema de banco de dados digital, identificados como IMS. Essa etapa inclui as atividades de seleção de atributos e pré-processamento de dados, e o resultado dessa etapa é uma série de modelos de dados, denominados bases analíticas A. A próxima etapa consiste na construção de modelos preditivos sobre os incidentes ferroviários, através de aplicação de algoritmos de aprendizado de máquina supervisionados. As bases analíticas criadas na etapa anterior são usadas como dados de entrada para esses algoritmos. O índice de risco de incidentes é resultado da computação desses modelos preditivos. Diversos modelos preditivos podem ser construídos nessa etapa, de acordo com os algoritmos e as bases analíticas usados. A etapa seguinte consiste na avaliação de performance preditiva dos modelos construídos na etapa anterior, de forma a selecionar o modelo com melhor performance. A quarta etapa do método proposto se relaciona a usabilidade, onde desenvolveu-se uma técnica de análise visual de informação, que permite aos usuários consultar os modelos preditivos.
[00091] A presente invenção é vantajosa uma vez que as bases de dados são criadas a partir de relatos de incidentes, onde as informações de interesse são extraídas com base em critérios determinados, de modo a criar os N atributos que formam uma base de dados.
[00092] É proposto a criação de diferentes modelos preditivos a partir de diferentes bases de dados e/ou diferentes técnicas de aprendizado de máquina, uma vez que o desempenho de cada técnica varia muito com o tipo de dados utilizado. Assim, a presente invenção torna possível que o modelo preditivo com a melhor performance seja selecionado, o qual será utilizado durante a consulta de um operador.
[00093] Outra vantagem da presente invenção é a sua ciclicidade. O conjunto de base dados é preferencialmente atualizado em períodos predeterminados. A partir de novas bases de dados, novos modelos preditivos são criados, o que possibilita o surgimento de um novo modelo M+. Desse modo, a presente invenção garante que o modelo que está sendo utilizado pela interface de consulta seja sempre o mais otimizado.
[00094] Na concretização ilustrada, o cálculo de índice de risco é computado em relação aos municípios, que se encontram no percurso da ferrovia. Portanto, computa uma medida de sensibilidade associado à cada município pertencente ao percurso da ferrovia em análise, referente a cada um dos incidentes contemplados. Esse valor de sensibilidade é usado como uma medida de relevância de cada município em relação a cada incidente, e utilizado na computação do índice de risco dos incidentes.
[00095] Inúmeras variações incidindo no escopo de proteção da presente invenção são permitidas. A invenção proposta não se restringe apenas a modelos de algoritmos, também apresenta uma arquitetura computacional para sua efetiva implementação num artefato de software. A invenção especifica o uso de Web Services, dentro de uma Arquitetura Orientada a Serviços (SOA). E estabelece o padrão de arquitetura REST (Representational State Transfer Protocol) para transferência de dados.
[00096] Adicionalmente, o método e sistema para computar índices de riscos de incidentes ferroviários pode ser utilizado para avaliar os riscos em diversos trajetos onde um veículo se desloca, desde que seja possível construir uma base de dados a respeito de atributos associados a um evento de particular interesse. Dessa forma, reforça-se o fato de que a presente invenção não está limitada às configurações/concretizações particulares acima descritas.
Claims (16)
- Método para computar índices de riscos de incidentes ferroviários, caracterizado por compreender as etapas de:
- - obter um conjunto de base de dados analíticas (A) compreendendo pelo menos uma base de dados analítica (A1, A2, An);
- - treinar pelo menos um modelo de aprendizado de máquina com pelo menos uma das base de dados para criar uma pluralidade de modelos preditivos (M1, M2, M3, ...., Mn);
- - calcular a performance de ao menos um dos modelos preditivos com base em um critério predeterminado;
- - selecionar o modelo com a melhor performance (M+) de acordo com o critério predeterminado;
- - mediante uma solicitação de um usuário com dados de uma composição ferroviária, gerar um mapa de risco com base no modelo preditivo selecionado (M+) e os dados da composição ferroviária;
- Método, de acordo com a reivindicação 1, caracterizado por o valor xi representar uma pluralidade de pares de atributo dentre:
tipo de local de circulação; município; passagem de nível (pn); falha funcional; tração; situação; mês; dia da semana; turno; tipo do trem; comprimento; número de locomotivas; quantidade vagões carregados; quantidade de vagões vazios; carga; contexto da causa do incidente. - Método, de acordo com a reivindicação 1 ou 2, caracterizado por o valor yi representar uma classe de incidente composta por: atropelamento de pessoas, descarrilamento, abalroamento e vandalismo.
- Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado por a etapa de obter uma base de dados compreender as etapas de:
- - obter dados de ocorrência de incidente ferroviário de um servidor IMS;
- - realizar um pré-processamento dos dados de ocorrência de incidente de modo a criar pelo menos uma base de dados analítica (A1, A2, ..., An);
- Método, de acordo com a reivindicação 4, caracterizado por o pré-processamento compreender a etapa de:
identificar, dentre os dados de ocorrência de incidente ferroviário do servidor IMS, pelo menos um atributo referente ao acidente e associar o valor do atributo à variável xi
identificar, dentre os dados de ocorrência de incidente ferroviário do servidor, a classe do acidente ferroviário e associar a classe do incidente ferroviários à variável y;
criar pelo menos uma instância I contendo uma pluralidade N de pares atributos xi, yi a partir da informação de incidência de acidente. - Método, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado por compreender a etapa de multiplicar o valor de performance de ao menos um dos modelos de aprendizado de máquina por um valor de sensibilidade com base em um local pertencente ao percurso do trem.
- Método, de acordo com a reivindicação 6, caracterizado por o valor de sensibilidade ser computado a partir da frequência percentual de ocorrência de cada incidente nos locais pertencente ao percurso do trem.
- Método, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado por a etapa de treinar pelo menos um modelo de aprendizado de máquina com a base de dados compreender:
gerar um modelo preditivo por meio de um algoritmo de aprendizado de máquina indutivo supervisionado. - Método, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que o pelo menos um modelo de aprendizado de máquina ser pelo menos um dentre: geradores de árvores de decisão, regressão logística, support vector machines (SVM) e Redes Naive Bayesianas.
- Método, de acordo com qualquer uma das reivindicações 1 a 9, caracterizado pelo fato de que o critério predeterminado é pelo menos um dentre acurácia classificatória, precisão e área da curva ROC (AUC).
- Método, de acordo com a reivindicação 10, caracterizado pelo fato de que o critério predeterminado possui dois critérios, onde o primeiro critério é a medida de acurácia do modelo, e o segundo critério é a precisão em relação a predição da classe de incidente atropelamento de pessoas, em que a etapa de selecionar o modelo com a melhor performance compreende ainda:
selecionar os modelos preditivos de maior acurácia, e
dentre esses, selecionar o modelo com maior precisão na identificação de incidentes de atropelamento de pessoas. - Método, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelo fato de que o método é repetido ciclicamente com base em um critério de ciclo dentre: inserção de novos incidentes na base de dados, alterações na própria ferrovia, alteração nos atributos usados para a geração dos modelos preditivos, e período de tempo.
- Método, de acordo com qualquer uma das reivindicações 1 a 12, caracterizado pelo fato de que o mapa de risco é um mapa topográfico do percurso ferroviário, em que o índice de risco é computado em relação aos municípios da ferrovia, para os incidentes considerados: atropelamento de pessoas, abalroamento, descarrilamento e vandalismo.
- Método, de acordo com qualquer uma das reivindicações 1 a 13, caracterizado pelo fato de que a etapa de gerar um mapa de risco compreende exibir uma interface de consulta a um usuário, em que o mapa de risco é gerado a partir dos dados fornecidos pelo usuário através da interface de consulta.
- Método, de acordo com qualquer uma das reivindicações 1 a 13, caracterizado pelo fato de que a etapa de gerar um mapa de risco compreende gerar um mapa com índices de risco em relação a cada um dos municípios do percurso ferroviário para os incidentes considerados: atropelamento de pessoas, abalroamento, descarrilamento e vandalismo.
- Sistema para computar índices de riscos de incidentes ferroviários, caracterizado por compreender:
- - meios para obter um conjunto de base de dados analíticas (A) compreendendo pelo menos uma base de dados analíticas (A1, A2, ..., An);
- - meios para gerar pelo menos um modelo de aprendizado de máquina com pelo menos uma das base de dados analíticas para criar uma pluralidade de modelos preditivos;
- - meios para calcular a performance de ao menos um dos modelos preditivos com base em um critério predeterminado;
- - meios para selecionar o modelo com a melhor performance de acordo com o critério predeterminado;
- - meios para, mediante uma solicitação de um usuário com dados de uma composição ferroviária, gerar um mapa de risco com base no modelo preditivo selecionado e os dados da composição ferroviária;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
BR102019008102-3A BR102019008102A2 (pt) | 2019-04-22 | 2019-04-22 | método e sistema para computar índices de riscos de incidentes ferroviários |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
BR102019008102-3A BR102019008102A2 (pt) | 2019-04-22 | 2019-04-22 | método e sistema para computar índices de riscos de incidentes ferroviários |
Publications (1)
Publication Number | Publication Date |
---|---|
BR102019008102A2 true BR102019008102A2 (pt) | 2020-10-27 |
Family
ID=73045643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR102019008102-3A BR102019008102A2 (pt) | 2019-04-22 | 2019-04-22 | método e sistema para computar índices de riscos de incidentes ferroviários |
Country Status (1)
Country | Link |
---|---|
BR (1) | BR102019008102A2 (pt) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613639A (zh) * | 2020-11-30 | 2021-04-06 | 河南汇祥通信设备有限公司 | 一种基于lstm模型的综合管廊运维数据预测系统及方法 |
CN113202560A (zh) * | 2021-06-01 | 2021-08-03 | 桂林慧谷人工智能产业技术研究院 | 一种基于数据挖掘的煤矿风险预防和救援决策系统 |
CN114925994A (zh) * | 2022-05-07 | 2022-08-19 | 厦门大学 | 一种基于深度学习的城中村风险评估和风险因素定位方法 |
-
2019
- 2019-04-22 BR BR102019008102-3A patent/BR102019008102A2/pt unknown
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613639A (zh) * | 2020-11-30 | 2021-04-06 | 河南汇祥通信设备有限公司 | 一种基于lstm模型的综合管廊运维数据预测系统及方法 |
CN113202560A (zh) * | 2021-06-01 | 2021-08-03 | 桂林慧谷人工智能产业技术研究院 | 一种基于数据挖掘的煤矿风险预防和救援决策系统 |
CN114925994A (zh) * | 2022-05-07 | 2022-08-19 | 厦门大学 | 一种基于深度学习的城中村风险评估和风险因素定位方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tirkolaee et al. | A robust bi-objective mathematical model for disaster rescue units allocation and scheduling with learning effect | |
Inkoom et al. | Prediction of the crack condition of highway pavements using machine learning models | |
Dai et al. | Bus travel time modelling using GPS probe and smart card data: A probabilistic approach considering link travel time and station dwell time | |
Liu et al. | Incorporating household gathering and mode decisions in large‐scale no‐notice evacuation modeling | |
Yang et al. | Use of deep learning to predict daily usage of bike sharing systems | |
Chen et al. | Calibrating a Land Parcel Cellular Automaton (LP-CA) for urban growth simulation based on ensemble learning | |
Miller et al. | Coupling mode-destination accessibility with seismic risk assessment to identify at-risk communities | |
BR102019008102A2 (pt) | método e sistema para computar índices de riscos de incidentes ferroviários | |
Dawson et al. | The economic value of climate information in adaptation decisions: Learning in the sea-level rise and coastal infrastructure context | |
Yang et al. | A hybrid method for short-term freeway travel time prediction based on wavelet neural network and Markov chain | |
Twumasi-Boakye et al. | A computational approach for evaluating post-disaster transportation network resilience | |
King et al. | Evaluating transit network resilience through graph theory and demand-elastic measures: Case study of the Toronto transit system | |
Chen et al. | Forecast of flood disaster emergency material demand based on IACO-BP algorithm | |
Sun et al. | Overview of interdependency models of critical infrastructure for resilience assessment | |
Sasidharan et al. | A risk-informed decision support tool for the strategic asset management of railway track infrastructure | |
Hu et al. | Prioritizing disaster mapping tasks for online volunteers based on information value theory | |
Ak et al. | A time-based model and GIS framework for assessing hazardous materials transportation risk in urban areas | |
Li et al. | Passenger satisfaction evaluation of public transport using alternative queuing method under hesitant linguistic environment | |
Gerges et al. | A GIS-based approach for estimating community transportation exposure and capacity in the context of disaster resilience | |
Zabukovšek et al. | Business informatics principles | |
Rachunok et al. | Overemphasis on recovery inhibits community transformation and creates resilience traps | |
Wisetjindawat et al. | Modeling the effectiveness of infrastructure and travel demand management measures to improve traffic congestion during typhoons | |
Farazmehr et al. | Locating and deploying essential goods and equipment in disasters using AI-enabled approaches: A systematic literature review | |
Alawad et al. | Utilizing big data for enhancing passenger safety in railway stations | |
Zelinka et al. | Transport Telematics-Systemic View |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B03A | Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette] | ||
B07A | Application suspended after technical examination (opinion) [chapter 7.1 patent gazette] | ||
B07B | Technical examination (opinion): publication cancelled [chapter 7.2 patent gazette] |