BR102022020266A2 - Método de treinamento de um modelo baseado em inteligência artificial para predição de desfecho clínico de um indivíduo e método de predição de desfecho clínico de um indivíduo que utiliza tal modelo baseado em inteligência artificial - Google Patents

Método de treinamento de um modelo baseado em inteligência artificial para predição de desfecho clínico de um indivíduo e método de predição de desfecho clínico de um indivíduo que utiliza tal modelo baseado em inteligência artificial Download PDF

Info

Publication number
BR102022020266A2
BR102022020266A2 BR102022020266-4A BR102022020266A BR102022020266A2 BR 102022020266 A2 BR102022020266 A2 BR 102022020266A2 BR 102022020266 A BR102022020266 A BR 102022020266A BR 102022020266 A2 BR102022020266 A2 BR 102022020266A2
Authority
BR
Brazil
Prior art keywords
time period
vital sign
individual
time
values
Prior art date
Application number
BR102022020266-4A
Other languages
English (en)
Inventor
Adriano José Pereira
Marcelo Franken
Daniel Scaldaferri Lages
Wellington Aparecido De Oliveira
Original Assignee
Sociedade Beneficente Israelita Brasileira Hospital Albert Einstein
Filing date
Publication date
Application filed by Sociedade Beneficente Israelita Brasileira Hospital Albert Einstein filed Critical Sociedade Beneficente Israelita Brasileira Hospital Albert Einstein
Priority to PCT/BR2023/050263 priority Critical patent/WO2024073826A1/pt
Publication of BR102022020266A2 publication Critical patent/BR102022020266A2/pt

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

A presente invenção refere-se a um método de treinamento de um modelo preditivo de deterioração clínica baseado em inteligência artificial, inicialmente a partir de uma rede neural artificial, para predição de desfecho clínico de um indivíduo e compreende, para cada indivíduo de um primeiro conjunto de indivíduos, identificar um evento indicativo do desfecho de evolução clínica para o indivíduo como um evento de desfecho favorável ou como um evento de desfecho desfavorável; obter, para determinados subperíodos de tempo, aferições múltiplas de cada sinal vital de uma pluralidade de sinais vitais do indivíduo; obter um valor representativo para cada sinal vital dentro de cada subperíodo de tempo com base nas aferições múltiplas realizadas para cada sinal vital naquele subperíodo de tempo; estabelecer um sequência temporal de valores agregados de sinais vitais para cada um da pluralidade de sinais vitais; e repetir as etapas acima para todos os indivíduos do primeiro conjunto de indivíduos; em que o as sequências temporais de valores agregados de sinais vitais para cada um de todos os indivíduos do primeiro conjunto de indivíduos são dados de entrada de treinamento do modelo preditivo de deterioração clínica baseado em inteligência artificial; e em que os eventos indicativos do desfecho de evolução clínica identificados como um evento de desfecho favorável ou como um evento de desfecho desfavorável para cada um de todos os indivíduos do primeiro conjunto de indivíduos são dados de saída alvo do treinamento da rede neural artificial.

Description

CAMPO DA INVENÇÃO
[0001] A presente invenção refere-se a um método de treinamento de um modelo baseado em inteligência artificial e, mais especificamente, a um método de treinamento capaz de treinar um modelo baseado em inteligência artificial para predição de desfecho de evolução clínica de um indivíduo internado em hospital ou em risco de internação/reinternação.
FUNDAMENTOS DA INVENÇÃO
[0002] Em um hospital de grande porte e alta complexidade, até 5 a 10% dos pacientes internados podem apresentar intercorrências significativo após a admissão, culminando com parada cardiorrespiratória e/ou necessidade de transferência para UTI. Atrasos na identificação da deterioração clínica, juntamente com intervenções terapêuticas tardias resultam em aumento de morbidade e mortalidade. Sabe-se que pacientes que desenvolvem piora clínica em unidades de internação geral evoluindo para parada cardiorrespiratória (PCR) e/ou necessidade de transferência para unidade de cuidados intensivos apresentam sinais de deterioração fisiológica cerca de 6 a 24 horas antes do evento clínico (vide Churpek MM, Yuen TC, Park SY, Gibbons R, Edelson DP. Using electronic health record data to develop and validate a prediction model for adverse outcomes in the wards. Crit Care Med. 2014;42(4):841- 848 e J Biomed Inform. 2016;64: 10-19).
[0003] Baseado neste racional, no início dos anos 1990, foi proposta a instituição de equipes que pudessem avaliar e atender casos de deterioração inicial, de forma rápida, para obtenção de melhores desfechos, o que levou à diminuição de paradas cardíacas intra-hospitalares (vide Edelson DP, Churpek MM. Web Exclusives. Annals for Hospitalists Inpatient Notes - Predicting Codes-A Future With Fewer In-Hospital Cardiac Arrests. Ann Intern Med. 2017;166(10):HO2-HO3.) Entretanto, mesmo com o avanço alcançado, à luz do conhecimento atual, é possível dizer que os times de resposta rápida ainda funcionam de forma reativa, considerando que sua ação é deflagrada por sinais e sintomas já instalados (presentes há algumas horas) e não detectados, sendo dependente de algum grau de subjetividade e com necessidade de ativação manual. A criação de critérios objetivos, baseados em escores de gravidade trouxe avanços nesse sentido e tem se mostrado útil na predição precoce de eventos intra-hospitalares. Diversos escores foram desenvolvidos com base em sinais vitais, como frequência cardíaca, frequência respiratória, pressão arterial, saturação de oxigênio e nível de consciência, apresentando bom desempenho preditivo (1. Smith GB, Prytherch DR, Meredith P, Schmidt PE, Featherstone PI. The ability of the National Early Warning Score (NEWS) to discriminate patients at risk of early cardiac arrest, unanticipated intensive care unit admission, and death. Resuscitation. 2013;84(4):465-470. 2. Churpek MM, Yuen TC, Park SY, Meltzer DO, Hall JB, Edelson DP. Derivation of a cardiac arrest prediction model using ward vital signs*. Crit Care Med. 2012;40(7):2102-2108).
[0004] Atualmente estes escores são utilizados na prática clínica em diversos hospitais pelo mundo, tendo se tornado um padrão de boas práticas e qualidade, presente, inclusive, como item obrigatório em processos acreditação hospitalar. Em alguns casos, os dados dos pacientes (sinais vitais, principalmente) são integrados, a partir dos prontuários eletrônicos, acrescentando-se que podem também existir sistemas de alerta e acionamento automático dos times de resposta rápida a partir de gatilhos pré-determinados (isto é, quando o escore deste paciente atinge o gatilho, a equipe de urgência é acionada). Ocorre que mesmo nesses casos de completa integração e acionamento automático (que não são realidade no nosso país, e não são comuns em outros países) os sinais vitais nas alas não são registrados com frequência (mesmo em pacientes sob monitorização contínua, por exemplo, em unidades Semi-Intensivas) e, nos casos de deterioração, apenas os valores pontualmente obtidos são utilizados na decisão de disparar o acionamento do médico do Time de Resposta Rápida. Outros fatores, como a carga de trabalho do médico e da equipe multiprofissional, pacientes de alta complexidade, envelhecimento da população etc., também podem prejudicar o reconhecimento imediato e intervenção nos casos de pacientes em deterioração.
[0005] Assim, sistemas automatizados que possam alertar a equipe assistencial sobre a deterioração clínica iminente podem permitir uma intervenção em um momento mais precoce, evitando assim o agravo do processo patológico, a necessidade de intervenções, aumentando as chances de recuperação e reduzindo custos.
[0006] Entretanto, os escores conhecidos do estado da técnica são geralmente baseados em medidas pontuais dos sinais vitais, que ocorrem habitualmente de quatro a seis vezes por dia.
[0007] O uso de escores pontuais desconsidera possíveis tendências de variações destes sinais e, consequentemente, é incapaz de associar tais tendências à predição de evolução clínica do paciente.
OBJETIVOS DA INVENÇÂO
[0008] É um dos objetivos da presente invenção desenvolver uma ferramenta preditiva de desfecho de evolução clínica de um indivíduo. A evolução clínica pode ser, por exemplo, a deterioração clínica em pacientes internados em uma unidade de terapia semi-intensiva, deterioração clínica de pacientes internados em alas/enfermarias ou deterioração clínica domiciliar de pacientes com alto risco de internação/reinternação.
[0009] É outro objetivo da presente invenção fornecer um método de treinamento capaz de treinar uma rede neural artificial para predizer o desfecho de evolução clínica de um indivíduo utilizando tendências e variações nos sinais vitais do indivíduo.
[0010] É ainda outro objetivo da presente invenção fornecer um método de predição de desfecho clínico de um indivíduo capaz de utilizar valores absolutos, tendências e variações nos sinais vitais do indivíduo obtidos em tempo real ou próximo ao tempo real (real time ou near real time).
BREVE DESCRIÇÃO DA INVENÇÃO
[0011] A presente invenção atinge os objetivos acima por meio de um método de treinamento de um modelo baseado em inteligência artificial para predição de desfecho clínico de um indivíduo, que compreende: - para cada indivíduo de um primeiro conjunto de indivíduos: identificar um evento indicativo do desfecho clínico para o indivíduo como um evento de desfecho favorável ou como um evento de desfecho desfavorável; estabelecer um primeiro período de tempo predeterminado, em que o primeiro período de tempo predeterminado é um intervalo de tempo que antecede o evento de desfecho; estabelecer um segundo período de tempo predeterminado, em que o segundo período de tempo predeterminado é um intervalo de tempo que antecede o intervalo de tempo do primeiro período de tempo predeterminado e em que o segundo período de tempo compreende múltiplos subperíodos de tempo iguais; obter, para cada subperíodo de tempo, aferições múltiplas de cada sinal vital de uma pluralidade de sinais vitais do indivíduo; obter um valor representativo para cada sinal vital dentro de cada subperíodo de tempo com base nas aferições múltiplas realizadas para cada sinal vital naquele subperíodo de tempo; estabelecer um sequência temporal de valores agregados de sinais vitais para cada um da pluralidade de sinais vitais dentro do segundo período de tempo, a sequência temporal compreendendo os valores representativos para cada sinal vital nos subperíodos de tempo do segundo período de tempo; e repetir as etapas acima para todos os indivíduos do primeiro conjunto de indivíduos; em que o primeiro período de tempo, o segundo período de tempo e as sequências temporais de valores agregados de sinais vitais para cada um de todos os indivíduos do primeiro conjunto de indivíduos são dados de entrada de treinamento da rede neural artificial; e em que os eventos indicativos do desfecho clínico identificados como um evento de desfecho favorável ou como um evento de desfecho desfavorável para cada um de todos os indivíduos do primeiro conjunto de indivíduos são dados de saída alvo do treinamento do modelo baseado em inteligência artificial.
[0012] Em uma concretização preferida da invenção, o valor representativo para cada sinal vital dentro de cada subperíodo de tempo é obtido a partir do cálculo uma média aritmética das aferições múltiplas realizadas para cada sinal vital naquele subperíodo de tempo.
[0013] Quando o modelo baseado em inteligência artificial é uma rede neural recorrente, o método compreende ainda: a criação de uma matriz tridimensional de treinamento em que, para cada indivíduo do primeiro conjunto de indivíduos, a sequência temporal de valores agregados de sinais vitais para cada um da pluralidade de sinais vitais dentro do segundo período de tempo é organizada em um plano, de modo que um eixo geométrico x do plano compreende os valores de sinais vitais para cada um da pluralidade de sinais vitais e, em um eixo geométrico y do plano, os valores dos subperíodos de tempo do segundo período de tempo, e, em que os planos criados para cada indivíduo do primeiro de conjunto de indivíduos são empilhados em um eixo geométrico z para a criação da matriz; e a utilização da matriz criada com dados de entrada de treinamento da rede neural recorrente.
[0014] Quando o modelo baseado em inteligência artificial é selecionado dentre Bagging, Bernoulli, DNN, Extra Trees, KNN, LightGBM, Regressão Logística, Random Forest, Classificador SGD, SVC e XGBoost, o método compreende ainda, para cada sequência temporal de valores agregados de sinais vitais para cada um da pluralidade de sinais vitais dentro do segundo período de tempo: um valor médio dos sinais vitais da sequência temporal; um valor mínimo dos sinais vitais da sequência temporal; um valor máximo dos sinais vitais da sequência temporal; um valor de diferença entre os valores máximos e mínimos calculados; um valor diferença entre cada um dos valores da sequência temporal que excederam um valor limite preestabelecido e esse valor limite preestabelecido; um valor diferença entre cada um dos valores da sequência temporal que estão abaixo de um valor limite preestabelecido e esse valor limite preestabelecido; utilizar os valores calculados como dados de entrada de treinamento da rede neural de modelo clássico de aprendizado de máquina.
[0015] A presente invenção também contempla um método de predição de desfecho clínico de um indivíduo que utiliza o modelo preditivo de deterioração clínica baseado em inteligência artificial treinado de acordo com o método de treinamento de modelo da presente invenção, e um sistema para predição de desfecho clínico de um indivíduo que compreende pelo menos um dispositivo de monitoramento de sinais vitais configurado para realizar aferições múltiplas de pelo menos um sinal vital de uma pluralidade de sinais vitais do indivíduo; e pelo menos um meio de processamento para execução de tal método de predição.
[0016] Em uma concretização da presente invenção, o sistema compreende uma pluralidade de dispositivos de monitoramento de sinais vitais, cara um dos dispositivos sendo configurado para realizar aferições múltiplas de um sinal vital diferente dentre uma pluralidade de sinais vitais do indivíduo.
[0017] Tais dispositivos de monitoramento podem ser dispositivos de monitoramento instalados no local em que o indivíduo está internado ou localizado - tal como unidade hospitalar ou instalação domiciliar de home care - ou dispositivos vestíveis de monitoramento conectados à internet (dispositivos vestíveis do tipo IOT / Internet das Coisas).
BREVE DESCRIÇÃO DOS DESENHOS
[0018] A presente invenção será descrita a seguir com mais detalhes, com referências aos desenhos anexos, nos quais:
[0019] Figura 1 - ilustra os parâmetros de treinamento do método de treinamento de uma rede neural artificial de acordo com uma concretização da presente invenção;
[0020] Figura 2 -- ilustra um fluxograma simplificado do método de treinamento de rede neural artificial de acordo com uma concretização da presente invenção; e
[0021] Figura 3 - ilustra um fluxograma simplificado do método de predição de desfecho de evolução clínica de um indivíduo de acordo com uma concretização da presente invenção.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[0022] A presente invenção compreende um método de treinamento de um modelo baseado em inteligência artificial para predição de desfecho clínico de um indivíduo.
[0023] Em uma concretização da invenção, o modelo baseado em inteligência artificial é uma rede neural artificial. Assim, nessa concretização, para o treinamento da rede, são utilizados dados de desfechos clínicos de um primeiro conjunto de indivíduos.
[0024] Na concretização exemplificativa da invenção ilustrada nas figuras 1 a 3, esse primeiro conjunto de indivíduos compreende pacientes internados em unidade semi-intensivas, em que o desfecho clínico pode ser classificado como sendo um desfecho favorável ou um desfecho desfavorável segundo um evento definido como a trajetória de passagem do paciente pelo quarto da semi-UTI, como segue:
[0025] Desfecho favorável (desfecho 1): o paciente teve alta do quarto de semi- UTI para um quarto comum ou alta do hospital (saída para casa);
[0026] Desfecho desfavorável (desfecho 0): o paciente foi transferido do quarto de semi-UTI para um quarto de unidade de terapia intensiva (UTI) ou evoluiu para óbito.
[0027] É importante destacar que o mesmo paciente pode ter múltiplas passagens por quartos de semi-UTI. Nestes casos, para cada passagem, considera-se como um “indivíduo” independente, inserido no conjunto de dados.
[0028] A tabela a seguir mostra trajetórias T1 a T6 exemplificando desfechos favoráveis e desfavoráveis de um paciente dentro do hospital conforme a sequência de eventos ordenados de forma cronológica: Tabela I - Sequência de eventos de passagem de paciente e classificação de desfecho
[0029] Assim, na trajetória T1, a primeira passagem compreende a transferência do leito de semi-UTI (S1) para o leito de UTI (U1). Esta passagem corresponde a um “indivíduo” que tem os valores de seus atributos (features) calculados ao longo das horas que antecederam sua transferência. Na segunda passagem da trajetória T1, há transferência do indivíduo de um leito de semi-UTI (S1) para um leito de UTI (U1) ou na evolução do quadro para óbito. Este caso descreve uma trajetória com desfecho de evolução clínica desfavorável.
[0030] A trajetória T2 mostra exemplifica o desfecho desfavorável em que o indivíduo é transferido de um leito comum (L1) para um leito de semi-UTI (S1) ou para um leito de UTI (U1) ou em que seu quadro evolui para óbito após a admissão no leito comum (L1).
[0031] Na trajetória T3 é exemplificado um desfecho desfavorável em que o indivíduo, monitorado em seu domicílio, precisa ser admitido para internação. Nesse caso, o indivíduo tem os valores de seus atributos (features) calculados ao longo das horas que antecederam sua internação. Nesse exemplo, o monitoramento pode ser realizado utilizando-se recursos vestíveis - “wearables” - para aquisição de dados em tempo real ou próximo ao tempo real.
[0032] A trajetória T4 mostra um desfecho favorável, com a transferência do indivíduo de leito de semi-UTI (S1) para leito comum ou com a alta do indivíduo para domicílio. A trajetória T5 possui desfecho favorável similar, com a alta do indivíduo após internação.
[0033] Na trajetória T6 há um desfecho favorável que compreende a manutenção do paciente em seu domicílio por um período determinado.
[0034] Desta forma, a partir da trajetória deste paciente é possível se gerar registros distintos que passam a incorporar o conjunto de dados históricos para um primeiro conjunto de indivíduos. Nesse caso, o indivíduo tem os valores de seus atributos (features) calculados ao longo das horas que antecederam o fim do período determinado ou o fim de um intervalo predeterminado da avaliação.
[0035] Assim, como mostra a figura 2, o treinamento de uma rede neural de acordo com o método da presente invenção compreende uma primeira etapa de coleta dos dados do indivíduo para predição (ET101).
[0036] Nessa etapa, para cada indivíduo de um primeiro conjunto de indivíduos são realizadas aferições de sinais vitais ao longo de um período de tempo que antecede o desfecho.
[0037] Como melhor ilustrado na figura 1, um intervalo de tempo que antecede o evento de desfecho pode ser considerado como uma janela de predição (um primeiro período de tempo predeterminado) e um segundo intervalo de tempo que antecede o primeiro período de tempo pode ser considerado como uma janela de observação (um segundo período de tempo predeterminado), em que os sinais vitais de um indivíduo são observados/aferidos até a janela de predição.
[0038] O primeiro período de tempo determinado e o segundo período de tempo determinado serão utilizados como parâmetros para o treinamento do modelo. Assim, na concretização exemplificativa ilustrada, o primeiro período de tempo predeterminado é o parâmetro “GAP” e o segundo período de tempo predeterminado é o parâmetro “LOOKBACK”.
[0039] A sequência das aferições dos sinais vitais obedece à agregação no tempo, considerando subperíodos de tempos iguais (parâmetro AGG_TIME na figura 1). Assim, a janela de observação (segundo período de tempo predeterminado) compreende múltiplos subperíodos de tempo iguais.
[0040] O método de treinamento da presente invenção faz um pré-processamento dos dados aferidos em uma etapa de pré-processamento de dados (ET102).
[0041] A figura 1 representa o histórico da passagem do paciente 1 por um leito de semi-UTI. A Figura 1 ilustra a trajetória deste paciente e, ao se analisar um segundo período predeterminado de tempo de, por exemplo, 05 horas (janela de observação, parâmetro LOOKBACK) que antecede um primeiro período predeterminado de tempo de, por exemplo, 01 hora (janela de predição, parâmetro GAP) antes da saída do paciente do leito de semi-UTI com alta do hospital, tem-se que cada uma das 05 horas que compõem a janela de observação (LOOKBACK) possui diversas aferições para um mesmo sinal vital. Se na última hora da janela de observação foram realizadas n aferições de frequência respiratória (representadas pelas barras verde-escuro), um valor representativo dos valores obtidos por meio das n aferições é utilizado para representar a frequência respiratória deste paciente nesta hora em análise. Por fim, tem-se, para cada paciente e para cada intervalo de 1 hora (AGG_TIME) durante a janela de observação, um valor correspondente a cada um dos sinais vitais analisados. Diferentes AGG_TIME poderão ser testados pelo modelo, de forma a se buscar alcançar os limiares ótimos para cada um dos parâmetros/hiperparâmetros do modelo.
[0042] Desse modo, o método de treinamento da presente invenção compreende obter um primeiro valor representativo para cada sinal vital dentro de cada subperíodo de tempo a partir das diferentes formas de agregação possíveis, realizadas para cada sinal vital naquele subperíodo de tempo (ou seja, o cálculo do valor-representativo de cada sinal vital no subperíodo AGG_TIME), e estabelecer um sequência temporal de valores de sinais vitais para cada um da pluralidade de sinais vitais dentro do segundo período de tempo (janela de observação, parâmetro LOOKNACK), com a sequência temporal compreendendo os valores-representativos para cada sinal vital nos subperíodos de tempo do segundo período de tempo.
[0043] Na concretização preferida da presente invenção, o valor representativo é a média aritmética dos valores aferidos para o sinal vital.
[0044] Após o pré-processamento dos dados, os dados são formatados segundo o modelo baseado em inteligência artificial que será utilizado pelo método, sendo a formatação dependente do modelo escolhido para treinamento nas etapas ET104a e ET104b. Assim, como mostra a figura 2, quando uma rede neural recorrente é utilizada, é feita uma formatação adequada na etapa ET103a e quando um modelo com algoritmo clássico é utilizado é feita uma formatação adequada na etapa ET103b.
[0045] Como ficará claro a partir dos exemplos de modelagem de modelo preditivo descritos a seguir, o primeiro período de tempo, o segundo período de tempo e as sequências temporais de sinais vitais para cada um de todos os indivíduos do primeiro conjunto de indivíduos são dados de entrada de treinamento do modelo; e o eventos indicativos do desfecho clínico identificados como um evento de desfecho favorável ou como um evento de desfecho desfavorável para cada um de todos os indivíduos do primeiro conjunto de indivíduos são dados de saída alvo do treinamento do presente modelo baseado em inteligência artificial. Exemplos de modelagem de modelos preditivos
[0046] Para a realização dos exemplos descritos a seguir, foram utilizados os seguintes parâmetros de LOOKBACK, GAP e AGG_TIME: Tabela II - Parâmetros propostos para a modelagem Modelagem para rede neural recorrente (exemplo de uma das técnicas utilizadas na invenção)
[0047] A fim de se utilizar um modelo baseado em rede neural recorrente (RNN), foi construída uma matriz tridimensional. Assim, para um determinado paciente, após a agregação de seus valores dos sinais vitais dentro dos intervalos de agregação (AGG_TIME) por meio da média ou outras medidas-representativas, cada uma das sequências de sinais vitais das janelas de observação foi organizada em um plano, tendo, no eixo X, todos os sinais vitais monitorados e, no eixo Y, os valores de todos os intervalos AGG_TIME que compõem a janela de observação (LOOKBACK). Desta forma, as dimensões do plano obtido para o paciente são (número de sinais vitais monitorados) X (largura da janela de observação - LOOKBACK - em unidades de intervalos de agregação AGG_TIME). Por fim, empilhando-se os planos de todos as passagens de pacientes por semi-UTI em um eixo Z, obtém-se a matriz utilizada como insumo para o treinamento, validação e teste da RNN.
[0048] A arquitetura da rede neural recorrente LSTM utilizada possui as seguintes camadas:
[0049] Camada RNN (LSTM) - entrada: - units: dimensão de saída da camada RNN - número de features (valores- representativos derivadas dos valores dos diferentes sinais vitais aferidos ao longo do tempo). - input_shape: dimensão de saída da camada RNN - número de features (valores-representativos derivadas dos valores dos diferentes sinais vitais aferidos ao longo do tempo). - return_sequences: False - retorno da camada RNN com apenas as dimensões (número de passagens de pacientes em semi-UTI X número de features) - activation: função de ativação dos neurônios das camadas intermediárias (“relu” ou “tanh”)2
[0050] Camada Dropout - intermediária: - dropout: taxa de “dropout” (retirada) de neurônios da camada intermediária (0.1 - 0.2)
[0051] Camada Dense - saída: - activation: função de ativação dos neurônios das camadas de saída (“sigmoid”) - units: dimensão de saída da camada de saída - 01
[0052] Modelagem para modelos clássicos de rede neural artificial (exemplo de diferentes técnicas utilizadas pela presente invenção).
[0053] Na abordagem de modelos clássicos de classificação nesta abordagem, todo o conjunto de sinais vitais, após a agregação segundo o parâmetro AGG_TIME, foi agregado um uma só linha para cada passagem por semi-UTI dentro da janela de observação (LOOKBACK) e, com isso, os seguintes critérios de agregação foram aplicados:
[0054] MEAN: para cada sinal vital, foi calculado o valor médio dentro da janela de observação;
[0055] MIN: para cada sinal vital, foi calculado o valor mínimo dentro da janela de observação;
[0056] MÁX: para cada sinal vital, foi calculado o valor máximo dentro da janela de observação;
[0057] AMP: para cada sinal vital, foi calculada a amplitude (diferença entre o valor máximo e mínimo) dentro da janela de observação;
[0058] HIGH_SUM: para cada sinal vital, foram somadas as diferenças entre os valores que excederam o limite superior de normalidade e este limite durante toda a janela de observação;
[0059] LOW_SUM: para cada sinal vital, foram somadas as diferenças entre os valores que ficaram abaixo do limite inferior de normalidade e este limite durante toda a janela de observação.
[0060] Deve ser entendido que concretizações da invenção poderiam utilizar diferentes critérios de agregação, como área sob/sobre curvas, acima ou abaixo de limiares previamente definidos, como valores da normalidade (ou calibrados com limiares mais altos ou baixos, para maior sensibilidade/especificidade).
[0061] A partir dos critérios de agregação que foram aplicados aos sinais vitais estudados na concretização ilustrativa do presente pedido (frequência respiratória, frequência cardíaca, pressão arterial média, pressão arterial sistólica, pressão arterial diastólica e saturação de O2), foram obtidas 34 features iniciais (ou valores- representativos derivadas dos valores dos diferentes sinais vitais aferidos ao longo do tempo). Destaca-se que, uma vez que a saturação de O2 não possui limite máximo, não são aplicáveis os critérios de agregação AMP e HIGH_SUM. A tabela abaixo apresenta os limites mínimos e máximos das faixas de normalidade adotados para os sinais vitais.
[0062] A tabela abaixo apresenta os diferentes modelos clássicos utilizados, bem como os hiperparâmetros testados (cabe ressaltar que os modelos utilizados sempre buscarão a combinação ótima de tais parâmetros/hiperparâmetros, de forma que poderão variar entre versões do modelo). Tabela IV - Modelos, parâmetros e hiperparâmetos de modelagem
[0063] Os hiperparâmetros dos modelos clássicos são obtidos após vários ciclos de validação (sendo cada ciclo uma iteração específica conduzida pelo GridSearchCV ou Hyperopt). Após cada ciclo, a métrica de desempenho escolhida é utilizada para a verificação da qualidade do modelo. Ao final de todos os ciclos de validação que utilizam a mesma métrica de validação, a configuração de hiperparâmetros com o valor médio da métrica de validação mais elevado é selecionado.
[0064] Preferencialmente, o treinamento dos modelos é realizado com os dados de um primeiro conjunto de indivíduos e a validação é realizada com os dados de um segundo conjunto de indivíduos. Esse segundo conjunto, assim como o primeiro conjunto de indivíduos (utilizado para treinamento), é definido em um arquivo de configuração onde um parâmetro determina a data inicial e final das internações dos indivíduos que serão considerados para os testes do modelo. Ao final do treinamento de cada um dos modelos, os dados deste segundo conjunto de indivíduos são submetidos ao modelo e os resultados previstos dos desfechos de cada paciente são comparados com os resultados reais, gerando as métricas dos modelos.
[0065] Além da validação de várias configurações de hiperparâmetros dos modelos clássicos de aprendizado supervisionado de máquina, também são utilizadas duas estratégias de desbalanceamento da base - SMOTE (i) e Associação de pesos (ii):
[0066] (i) SMOTE: utiliza-se como estratégia para o “resampling” a opção “not majority” com o objetivo de não remover “indivíduos” da classe majoritária e, a fim de se gerar artificialmente “indivíduos” da classe minoritária, os 4, 5 ou 6 “indivíduos” mais próximos (“k_neighbors”). O parâmetro 'not majority' indica que serão criadas amostras sintéticas (indivíduos) apenas para a classe minoritária, no caso exemplificativo, indivíduos com desfechos desfavoráveis. O parâmetro 'k_neighbors' indica quantas amostras reais (indivíduos com características mais próximas) serão utilizadas para a criação das amostras sintéticas.
[0067] (ii) Associação de pesos: Para todos os modelos de classificação, foram associados pesos às amostras de forma inversamente proporcional às proporções das classes da variável de interesse, através do parâmetro “class_weight=balanced”, com objetivo de corrigir o desequilíbrio da classe.
[0068] A fim de se buscar a melhor configuração de modelos e hiperparâmetros, tendo em vista a vastidão do espaço de busca ao se utilizar todos os modelos e configurações possíveis de hiperparâmetros listados abaixo, empregou-se a técnica de busca “hyperopt” por meio da biblioteca Python Hyperopt que conduz a busca de forma otimizada com base na técnica “Tree-structured Parzen Estimator Approach (TPE)”. Perfil de Aquisição de dados de treinamento
[0069] Em uma concretização exemplificativa do método da presente invenção, os valores dos sinais vitais monitorados utilizados para o treinamento e testes do modelo de predição foram coletados dos pacientes internados na unidade semi-intensiva, cuja data de admissão (entrada na unidade) está compreendida dentro de um período de 17 meses ininterrupto. Neste cenário, dados de 5.441 pacientes distintos foram utilizados, sendo que o número de passagens na unidade semi-intensiva foi de 7.955, uma vez que um mesmo paciente pode passar por esta unidade mais de uma vez durante sua internação no hospital ou em outras internações. Cada uma dessas passagens pela unidade semi-intensiva (mesmo que se trate do mesmo paciente) juntamente com os sinais vitais coletados ao longo do período da passagem corresponde a uma amostra fornecida para o treinamento e testes do modelo de predição.
[0070] Os dados de sinais vitais de cada paciente passam por um processo de preparação baseado nas janelas de observação (parâmetros AGG_TIME, LOOKBACK e GAP configurados no processo). Dessa forma, diferentes conjuntos de dados poderão ser gerados a partir dos mesmos pacientes e enviados para treinamento e testes, com objetivo de escolher o modelo com melhor desempenho. A alteração desses parâmetros poderá impactar no número de amostras para treinamento e testes, uma vez que uma passagem poderá conter dados (medidas de sinais vitais) em quantidade insuficiente.
[0071] Os seis sinais vitais (frequência respiratória, frequência cardíaca, pressão arterial média, pressão arterial sistólica, pressão arterial diastólica e saturação de O2) foram coletados através de monitores multiparamétricos Drager (https://www.draeger.com/pt-br_br/Products/Infinity-Delta-Series) e enviados para um banco de dados.
[0072] Destes 5.441 pacientes, 56% são do sexo masculino (sendo que 7,7% deterioraram) e 44% são do sexo feminino (com 7,2% de deterioração).
[0073] Em relação à faixa etária, os idosos [75 anos ou mais] predominam, correspondendo a 53% desses pacientes, seguido de 29% de adultos [25 a 64 anos], 16,5% de sêniores (65 a 74 anos) e 1,5% de jovens [15 a 24 anos]. Dos idosos, 9% deterioram. Dos sêniores, 7% deterioram. Já adultos e jovens, 5% e 4,4% respectivamente. Quando se olha os pacientes que deterioraram, os idosos correspondem a 64%, seguido dos adultos (19,5%), sêniores (15,7%) e jovens (0,8%).
[0074] Os brasileiros correspondem a 87,8% dos pacientes, já os estrangeiros ou nacionalidade não informada, 12,2%. Tantos brasileiros, quanto estrangeiros, deterioram na faixa de 7,5%.
[0075] Resultados das modelagens exemplificativas
[0076] A Tabela V apresenta os valores das métricas obtidas ao se aplicar, no conjunto de testes gerados em um primeiro momento de treinamento, os modelos com a agregação dos sinais vitais a cada 60 minutos que alcançaram os níveis mais elevados de área abaixo da curva ROC (0.75 ou 0.74).
[0077] O modelo 632 (com “rnforest without bootstraping”, métrica de validação “roc auc” e parâmetros da janela de observação LOOKBACK=2, GAP=6) possui o melhor desempenho considerando a área abaixo da curva PR para esse valor de agregação.
[0078] A Tabela VI apresenta os valores das métricas obtidas ao se aplicar, no conjunto de testes gerados em um primeiro momento de treinamento, os modelos com a agregação dos sinais vitais a cada 30 minutos que alcançaram o maior nível de área abaixo da curva ROC (0.74). Tabela VI - Valores das métricas obtidas na aplicação dos modelos com a agregação dos sinais vitais a cada 30 minutos.
[0079] Os melhores valores de ROC novamente foram obtidos pelos métodos clássicos (até agora, o “bagging”, “extra trees” e “rnforest” - modelos baseados em árvores de decisão), com o melhor modelo baseado em LSTM novamente obtendo 0.65 contra 0.74 do melhor método clássico.
[0080] Mais uma vez, os melhores resultados foram alcançados com GAP igual a 6 horas e LOOKBACK igual a 2 ou 4 dentre os primeiros.
[0081] O modelo 354 (com “extra trees”, métrica de validação “average precision” e parâmetros da janela de observação LOOKBACK=2, GAP=6) alcança níveis elevados de área abaixo da curva ROC (0.74) e área abaixo da curva PR (0.19) e, utilizando-se o critério baseado nas curvas PDF para o estabelecimento do “threshold”, alcança precisão de 0.13 para um nível de sensibilidade de 0.65.
[0082] A Tabela VII apresenta os valores das métricas obtidas ao se aplicar, no conjunto de testes gerados em um primeiro momento de treinamento, os modelos com a agregação dos sinais vitais a cada 10 minutos que alcançaram o maior nível de área abaixo da curva ROC (0.73) . Tabela VII - Valores das métricas obtidas na aplicação dos modelos com a agregação dos sinais vitais a cada 10 minutos.
[0083] Os modelos com agregação a cada 10 minutos que tiveram os melhores resultados correspondem aos modelos que utilizaram LOOKBACK entre 2 e 4 horas e GAP de 6 horas
[0084] A Tabela VIII apresenta os valores das métricas obtidas ao se aplicar, no conjunto de testes gerados em um primeiro momento de treinamento, os modelos com a agregação dos sinais vitais a cada 2 minutos. Estes modelos são listados em ordem decrescente dos valores de área abaixo da curva ROC e foram descartados os modelos com valores abaixo de 0.65 para esta métrica. Tabela VIII - Valores das métricas obtidas na aplicação dos modelos com a agregação dos sinais vitais a cada 2 minutos.
[0085] Valores inferiores dos parâmetros LOOKBACK e GAP implicam em um número mais elevado de indivíduos tanto no conjunto de treino/validação quanto no conjunto de teste. Esta pode ser uma das justificativas em termos os cinco modelos melhor colocados com LOOKBACK entre 2 e 4 horas e GAP igual a 6 horas;
[0086] O modelo 309 (com DNN, métrica de validação ROC AUC e parâmetros da janela de observação LOOKBACK=8, GAP=12) utilizou um menor número de indivíduos de treino/validação e teste. Entretanto, para um valor de área abaixo da curva ROC de 0.71 (não muito menor do que o melhor modelo, com área abaixo da curva ROC igual a 0.73), ele apresentou uma área abaixo da curva PR igual a 0.40 (excepcionalmente mais elevado quando comparado aos demais modelos);
[0087] Os modelos baseados em rede neural densa DNN apresentaram níveis mais elevados de “brier score” e podem exigir calibração;
[0088] A Tabela IX apresenta os valores das métricas obtidas ao se aplicar, no conjunto de testes gerados em um segundo momento de uma nova rodada de treinamento e testes, os modelos com a agregação dos sinais vitais a cada 60 minutos que alcançaram os níveis mais elevados de área abaixo da curva ROC na primeira rodada dos testes. Tabela IX - Valores das métricas obtidas na aplicação dos modelos com a agregação dos sinais vitais a cada 60 minutos em uma segunda rodada de treinamento e testes.
[0089] O modelo “rnforest without bootstraping”, métrica de validação “recall” e parâmetros da janela de observação LOOKBACK=2, GAP=6 possui o melhor desempenho considerando a sensibilidade para esse valor de agregação.
[0090] Os modelos treinados de acordo com o método da presente invenção são aplicados em um método de predição de desfecho clínico de um indivíduo. O indivíduo tem seus dados monitorados em tempo real por meio de aparelhos de medição dispostos no local de internação, no caso de unidade hospitalar, no domicílio do indivíduo, no caso de home care, ou mesmo por dispositivos vestíveis de monitoramento.
[0091] Assim, como mostrado na figura 3, o método de predição é iniciado com a coleta de dados (etapa EP101). A coleta de dados é baseada nas medidas aferidas durante o monitoramento em tempo real. Tais medidas são processadas e formatadas para que possam servir de dados de entrada ao modelo treinado como descrito anteriormente (etapas EP102 e EP103), e então a predição de desfecho favorável ou desfavorável é realizada com base no modelo treinado (etapa EP104).
[0092] Tendo sido descritos exemplos concretizações exemplificativas da presente invenção, deve ser entendido que o escopo da presente invenção abrange outras variações possíveis do conceito inventivo descrito, sendo limitadas tão somente pelo teor das reivindicações anexas, aí incluídos os possíveis equivalentes.

Claims (10)

1. Método de treinamento de um modelo baseado em inteligência artificial para predição de desfecho clínico de um indivíduo caracterizado pelo fato de que compreende: - para cada indivíduo de um primeiro conjunto de indivíduos: identificar um evento indicativo do desfecho clínico para o indivíduo como um evento de desfecho favorável ou como um evento de desfecho desfavorável; estabelecer um primeiro período de tempo predeterminado, em que o primeiro período de tempo predeterminado é um intervalo de tempo que antecede o evento de desfecho; estabelecer um segundo período de tempo predeterminado, em que o segundo período de tempo predeterminado é um intervalo de tempo que antecede o intervalo de tempo do primeiro período de tempo predeterminado e em que o segundo período de tempo compreende múltiplos subperíodos de tempo iguais; obter, para cada subperíodo de tempo, aferições múltiplas de cada sinal vital de uma pluralidade de sinais vitais do indivíduo; obter um valor representativo para cada sinal vital dentro de cada subperíodo de tempo com base nas aferições múltiplas realizadas para cada sinal vital naquele subperíodo de tempo; estabelecer uma sequência temporal de valores agregados de sinais vitais para cada um da pluralidade de sinais vitais dentro do segundo período de tempo, a sequência temporal compreendendo os valores representativos para cada sinal vital nos subperíodos de tempo do segundo período de tempo; e repetir as etapas acima para todos os indivíduos do primeiro conjunto de indivíduos; em que o primeiro período de tempo, o segundo período de tempo e as sequências temporais de valores agregados de sinais vitais para cada um de todos os indivíduos do primeiro conjunto de indivíduos são dados de entrada de treinamento da rede neural artificial; e em que os eventos indicativos do desfecho clínico identificados como um evento de desfecho favorável ou como um evento de desfecho desfavorável para cada um de todos os indivíduos do primeiro conjunto de indivíduos são dados de saída alvo do treinamento do modelo baseado em inteligência artificial.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o valor representativo para cada sinal vital dentro de cada subperíodo de tempo é obtido a partir do cálculo uma média aritmética das aferições múltiplas realizadas para cada sinal vital naquele subperíodo de tempo.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que modelo baseado em inteligência artificial é uma rede neural recorrente e compreendendo ainda: a criação de uma matriz tridimensional de treinamento em que, para cada indivíduo do primeiro conjunto de indivíduos, a sequência temporal de valores agregados de sinais vitais para cada um da pluralidade de sinais vitais dentro do segundo período de tempo é organizada em um plano, de modo que um eixo geométrico x do plano compreende os valores de sinais vitais para cada um da pluralidade de sinais vitais e, em um eixo geométrico y do plano, os valores dos subperíodos de tempo do segundo período de tempo, e, em que os planos criados para cada indivíduo do primeiro de conjunto de indivíduos são empilhados em um eixo geométrico z para a criação da matriz; e a utilização da matriz criada com dados de entrada de treinamento da rede neural recorrente.
4. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que o modelo baseado em inteligência artificial é selecionado dentre Bagging, Bernoulli, DNN, Extra Trees, KNN, LightGBM, Regressão Logística, Random Forest, Classificador SGD, SVC e XGBoost, e compreendendo ainda calcular, para cada sequência temporal de valores agregados de sinais vitais para cada um da pluralidade de sinais vitais dentro do segundo período de tempo: um valor médio dos sinais vitais da sequência temporal; um valor mínimo dos sinais vitais da sequência temporal; um valor máximo dos sinais vitais da sequência temporal; um valor de diferença entre os valores máximos e mínimos calculados; um valor diferença entre cada um dos valores da sequência temporal que excederam um valor limite preestabelecido e esse valor limite preestabelecido; um valor diferença entre cada um dos valores da sequência temporal que estão abaixo de um valor limite preestabelecido e esse valor limite preestabelecido; utilizar os valores calculados como dados de entrada de treinamento da rede neural de modelo clássico de aprendizado de máquina.
5. Método de predição de desfecho clínico de um indivíduo que utiliza um modelo preditivo de deterioração clínica baseado em inteligência artificial treinado pelo método definido na reivindicação 1, caracterizado pelo fato de que compreende: estabelecer um primeiro período de tempo predeterminado, em que o primeiro período de tempo predeterminado é um intervalo de tempo que antecede o evento de desfecho; estabelecer um segundo período de tempo predeterminado, em que o segundo período de tempo predeterminado é um intervalo de tempo que antecede o intervalo de tempo do primeiro período de tempo predeterminado e em que o segundo período de tempo compreende múltiplos subperíodos de tempo iguais; obter, para cada subperíodo de tempo, aferições múltiplas de cada sinal vital de uma pluralidade de sinais vitais do indivíduo; obter um valor representativo para cada sinal vital dentro de cada subperíodo de tempo com base nas aferições múltiplas realizadas para cada sinal vital naquele subperíodo de tempo; estabelecer uma sequência temporal de valores agregados de sinais vitais para cada um da pluralidade de sinais vitais dentro do segundo período de tempo, a sequência temporal compreendendo os valores representativos para cada sinal vital nos subperíodos de tempo do segundo período de tempo; utilizar o primeiro período de tempo, o segundo período de tempo e as sequências temporais de valores agregados de sinais vitais como dados de entrada de um modelo preditivo de deterioração clínica baseado em inteligência artificial treinado; e obter uma predição de um desfecho clínico como um evento de desfecho favorável ou como um evento de desfecho desfavorável.
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que o valor representativo para cada sinal vital dentro de cada subperíodo de tempo é obtido a partir do cálculo uma média aritmética das aferições múltiplas realizadas para cada sinal vital naquele subperíodo de tempo.
7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que modelo preditivo de deterioração clínica baseado em inteligência artificial inicial é uma rede neural artificial do tipo Extra Trees, o primeiro período de tempo predeterminado é 6 horas, o segundo período de tempo predeterminado é 2 horas e cada um dos subperíodos de tempo é 60 minutos.
8. Sistema para predição de desfecho clínico de um indivíduo, caracterizado pelo fato de que compreende: pelo menos um dispositivo de monitoramento de sinais vitais configurado para realizar aferições múltiplas de pelo menos um sinal vital de uma pluralidade de sinais vitais do indivíduo; e pelo menos um meio de processamento para execução do método de predição de desfecho clínico de um indivíduo definido na reivindicação 5.
9. Sistema, de acordo com a reivindicação 8, caracterizado pelo fato de que o pelo menos um dispositivo de monitoramento de sinais vitais é um dispositivo vestível.
10. Sistema, de acordo com qualquer uma das reivindicações 8 ou 9, caracterizado pelo fato de que compreende uma pluralidade de dispositivos de monitoramento de sinais vitais, cara um dos dispositivos sendo configurado para realizar aferições múltiplas de um sinal vital diferente dentre uma pluralidade de sinais vitais do indivíduo.
BR102022020266-4A 2022-10-06 2022-10-06 Método de treinamento de um modelo baseado em inteligência artificial para predição de desfecho clínico de um indivíduo e método de predição de desfecho clínico de um indivíduo que utiliza tal modelo baseado em inteligência artificial BR102022020266A2 (pt)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/BR2023/050263 WO2024073826A1 (pt) 2022-10-06 2023-08-16 Método de treinamento de um modelo baseado em inteligência artificial para predição de desfecho clínico de um indivíduo e método de predição de desfecho clínico de um indivíduo que utiliza tal modelo baseado em inteligência artificial

Publications (1)

Publication Number Publication Date
BR102022020266A2 true BR102022020266A2 (pt) 2024-04-16

Family

ID=

Similar Documents

Publication Publication Date Title
Alazzam et al. [Retracted] A Novel Smart Healthcare Monitoring System Using Machine Learning and the Internet of Things
Olsson et al. Rapid Emergency Medicine Score can predict long‐term mortality in nonsurgical emergency department patients
KR102008196B1 (ko) 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치 및 그 방법
CN106066933B (zh) 获取房颤识别人工神经网络权重值矩阵的方法
Karimi Moridani et al. Non-linear feature extraction from HRV signal for mortality prediction of ICU cardiovascular patient
CN105228508A (zh) 一种测定用于分类的危险评分的系统和方法
JP2018524137A (ja) 心理状態を評価するための方法およびシステム
Zhang et al. Lstm for septic shock: Adding unreliable labels to reliable predictions
Hever et al. Machine learning applied to multi-sensor information to reduce false alarm rate in the ICU
Li-wei et al. A model-based machine learning approach to probing autonomic regulation from nonstationary vital-sign time series
Techentin et al. 1D Convolutional neural networks for estimation of compensatory reserve from blood pressure waveforms
TWI688371B (zh) 心房顫動信號型態擷取及輔助診斷智能裝置
Shakeri et al. Exploring features contributing to the early prediction of sepsis using machine learning
Papageorgiou A Fuzzy Inference Map approach to cope with uncertainty in modeling medical knowledge and making decisions
Doulani et al. Edge-based smart health monitoring device for infectious disease prediction using biosensors
De Baets et al. Positive blood culture detection in time series data using a BiLSTM network
BR102022020266A2 (pt) Método de treinamento de um modelo baseado em inteligência artificial para predição de desfecho clínico de um indivíduo e método de predição de desfecho clínico de um indivíduo que utiliza tal modelo baseado em inteligência artificial
Koteska et al. Machine learning based SpO2 prediction from PPG signal's characteristics features
CN117116475A (zh) 缺血性脑卒中的风险预测方法、系统、终端及存储介质
WO2024073826A1 (pt) Método de treinamento de um modelo baseado em inteligência artificial para predição de desfecho clínico de um indivíduo e método de predição de desfecho clínico de um indivíduo que utiliza tal modelo baseado em inteligência artificial
Fowler et al. Quality of object representations related to service utilization in a long-term residential treatment center.
Kachhawa et al. An Intelligent System for Early Prediction of Cardiovascular Disease using Machine Learning
Amrollahi et al. Predicting Hospital Readmission among Patients with Sepsis Using Clinical and Wearable Data
Bahrami et al. Heart attack detection in internet of things: modeling with health markov game theory
RU2726988C2 (ru) Устройство, система, способ и компьютерная программа для различения активных периодов и периодов покоя субъекта