BR112020021779B1 - Método de identificação de uma assinatura de câncer de próstata clinicamente significativo usando citometria de microfluxo - Google Patents

Método de identificação de uma assinatura de câncer de próstata clinicamente significativo usando citometria de microfluxo Download PDF

Info

Publication number
BR112020021779B1
BR112020021779B1 BR112020021779-4A BR112020021779A BR112020021779B1 BR 112020021779 B1 BR112020021779 B1 BR 112020021779B1 BR 112020021779 A BR112020021779 A BR 112020021779A BR 112020021779 B1 BR112020021779 B1 BR 112020021779B1
Authority
BR
Brazil
Prior art keywords
particle
particles
sample
biomarker
signal intensities
Prior art date
Application number
BR112020021779-4A
Other languages
English (en)
Other versions
BR112020021779A2 (pt
Inventor
John Lewis
Robert Paproski
Desmond Pink
Catalina Vasquez
Original Assignee
Nanostics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanostics Inc filed Critical Nanostics Inc
Publication of BR112020021779A2 publication Critical patent/BR112020021779A2/pt
Publication of BR112020021779B1 publication Critical patent/BR112020021779B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1429Signal processing
    • G01N15/1431Signal processing the electronics being integrated with the analyser, e.g. hand-held devices for on-site investigation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1429Signal processing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1456Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals
    • G01N15/1459Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals the analysis being performed on a sample stream
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N2015/0038Investigating nanoparticles
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N2015/1006Investigating individual particles for cytology
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N2015/1402Data analysis by thresholding or gating operations performed on the acquired signals or stored data
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N2015/1488Methods for deciding
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57434Specifically defined cancers of prostate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Dispersion Chemistry (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Molecular Biology (AREA)
  • Signal Processing (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Optics & Photonics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computational Linguistics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

MÉTODOS DE DIAGNÓSTICO DEDOENÇA USANDO CITOMETRIA DE MICROFLUXO. São revelados métodos de diagnóstico de doença, como câncer de próstata clinicamente significativo, em um paciente. Também são revelados métodos para identificar uma assinatura de doença. Os métodos envolvem citometria de microfluxo (μFCM) para identificar fenótipos de partícula e, em seguida, usar aprendizado de máquina para determinar se o paciente tem a doença de interesse ou os fenótipos de partícula de uma doença de partícula. O fluxo de trabalho de análise μFCM revelado na presente invenção ajuda a identificar as informações mais clinicamente úteis dentro dos dados μFCM que podem ser negligenciadas pela análise por gating convencional.

Description

CAMPO DA INVENÇÃO
[001] Geralmente, a presente invenção diz respeito a métodos de diagnóstico e biomarcadores testados nos mesmos. Mais especificamente, a presente invenção diz respeito ao uso de vesículas extracelulares para o diagnóstico de câncer de próstata clinicamente significativo e biomarcadores para prever o mesmo.
ANTECEDENTES DA INVENÇÃO
[002] As vesículas extracelulares (EVs) possuem grande potencial para diagnósticos e prognósticos em uma variedade de campos, como imunologia, neurologia, cardiologia e oncologia. As EVs incluem exossomas (30-100 nm), microvesículas (50-2.000 nm), corpos apoptóticos (500-4.000 nm) e oncossomos muito grandes (1.000-10.000 nm). Células saudáveis e doentes liberam EVs continuamente, que contêm muitos dos marcadores de mRNA, miRNA e proteínas de suas células de origem. As EVs foram encontradas em quase todos os fluidos biológicos, incluindo sangue, urina, sêmen e líquido cefalorraquidiano, tornando-os alvos promissores para ensaios diagnósticos minimamente invasivos.
[003] Existem múltiplos métodos para a caracterização de EV (Szatenek R et al., Int J Mol Sci 18 (6), 2017). A microscopia eletrônica fornece as imagens de resolução mais alta de EVs, mas carece de aquisição de dados de alto rendimento, não pode medir facilmente vários marcadores de maneira simultânea e pode exigir análise de dados demorada e complicada, uma vez que os dados brutos são imagens (Harris JR, Arch Biochem Biophys 581: 3- 18, 2015). A análise de rastreamento de nanopartículas e a detecção de pulso resistivo ajustável permitem enumeração e dimensionamento rápidos de partículas, mas não são ideais para caracterizar marcadores de EV (Gardiner C et al., J Extracell Vesicles 2, 2013; Vogel R et al., Anal Chem 83 (9): 3499-35-6, 2011). A citometria de microfluxo (μFCM), também referida como nanoescala ou citometria de fluxo de alta sensibilidade, permite a caracterização de alto rendimento das propriedades ópticas de partículas, permitindo a quantificação do tamanho da partícula, concentração e abundância de marcador para milhões de EVs em minutos (Szatenek supra). Essas características desejáveis tornam o μFCM adequado para ensaios clínicos baseados em EV de alta sensibilidade.
[004] O μFCM gera grandes quantidades de dados que complicam a análise. Uma amostra de plasma de 10 μL típica que foi diluída 100 vezes pode gerar mais de 5.000.000 de eventos cada em um único minuto de análise com mais de uma dúzia de propriedades ópticas. Em outras palavras, um único μL de plasma pode ter >109 eventos. Outros tipos de biópsia líquida podem ter concentrações semelhantes. A análise de EVs por μFCM pode examinar pelo menos 500 -50.000 vezes mais eventos de amostra em comparação com Nanopartícula (NTA) ou microscopia eletrônica por análise de amostra, fornecendo uma análise representativa maior de toda a amostra. A análise de citometria de fluxo baseada em células tradicionais tipicamente envolve a geração de gráficos de dispersão bivariados e a quantificação de concentração de eventos em regiões de interesse definidas por usuário (ROIs) em 4 quadrantes, uma vez que muitas células têm tamanho semelhante e são caracterizadas como marcadores positivos ou negativos. Tais métodos são muito simplistas para μFCM, uma vez que EVs variam em tamanho e, portanto, em abundância de marcadores, o que requer o desenvolvimento de ferramentas de análise de μFCM que podem processar rapidamente conjuntos de dados complexos muito grandes.
[005] Ao gerar um ensaio diagnóstico/prognóstico baseado em EV, as EVs não devem ser apenas caracterizadas dentro de amostras biológicas, mas também analisadas quanto à sua capacidade de prever condições clinicamente significativas que podem melhorar o bem-estar do paciente e/ou a economia de saúde.
SUMÁRIO DA INVENÇÃO
[006] De acordo com um aspecto da presente invenção, é fornecido um método para diagnosticar doenças em um paciente. O método envolve as etapas de: incubar uma biópsia líquida, como um plasma, soro, urina ou outra amostra de fluido corporal do paciente com uma ou mais sondas, que ligam biomarcadores para a doença de interesse; submeter a amostra a citometria de microfluxo; obter intensidades de sinal para um ou mais biomarcadores e, opcionalmente, obter uma ou mais propriedades ópticas associadas à amostra; processar as intensidades de sinal e, se obtidas, as uma ou mais propriedades ópticas processadas com algoritmos personalizados para calcular concentrações de diferentes fenótipos de partícula na amostra. Essas concentrações de fenótipos de partículas são usadas como as características (isto é, entradas) para algoritmos de aprendizado de máquina para determinar a probabilidade de pacientes terem câncer de próstata clinicamente significativo.
[007] De acordo com outro aspecto da presente invenção, é fornecido um método para identificar uma assinatura de doença para uma doença. O método envolve as etapas de: incubar amostras de indivíduos saudáveis e amostras de indivíduos com uma doença conhecida com uma ou mais sondas para biomarcadores; submeter as amostras a citometria de microfluxo; obter intensidades de sinal para um ou mais biomarcadores e, opcionalmente, obter uma ou mais propriedades ópticas associadas a cada amostra; efetuar transformação log das intensidades de sinal de um ou mais biomarcadores e, se presentes, de uma ou mais propriedades ópticas para produzir intensidades de sinal transformadas; efetuar o binning de partículas com intensidades de sinal transformadas semelhantes em regiões de interesse (ROI); determinar a concentração de partículas para cada ROI; comparar os dados de concentração de partícula em cada ROI entre as amostras de indivíduos saudáveis e amostras de indivíduos com uma doença conhecida; determinar os valores de área sob a curva (AUC) característica de operação do receptor (ROC) para cada ROI de cada combinação de marcadores; e selecionar uma combinação de biomarcadores que forneça os valores de AUC mais altos para obter a assinatura de doença para a doença.
[008] De acordo com um aspecto adicional da presente invenção, é fornecido um método para diagnosticar câncer de próstata clinicamente significativo em um paciente. O método envolve as etapas de: incubar uma amostra do paciente com uma ou mais sondas que se ligam a um ou mais biomarcadores para câncer de próstata clinicamente significativo; submeter a amostra a citometria de microfluxo; obter intensidades de sinal para um ou mais biomarcadores e, opcionalmente, obter uma ou mais propriedades ópticas associadas à amostra; processar as intensidades de sinal e, se obtidas, as uma ou mais propriedades ópticas usando um algoritmo personalizado que determina a concentração de diferentes fenótipos de partícula; usar a concentração de fenótipos de partícula como características (isto é, entradas) para algoritmos de aprendizado de máquina para determinar a probabilidade de pacientes terem câncer de próstata clinicamente significativo; e diagnosticar o paciente com a doença com base no uso de um limiar de probabilidade específico.
[009] Em uma modalidade, o processamento envolve: efetuar a transformação log das intensidades de sinal para produzir intensidades de sinal transformadas; e efetuar o binning de partículas com intensidades de sinal transformadas semelhantes em regiões de interesse (ROI) para cada propriedade óptica onde cada ROI é considerada um fenótipo de partícula diferente. Em outras modalidades, as etapas de efetuar a transformação log e o binning ocorrem simultaneamente ou separadamente.
[010] Em outra modalidade, e efetuar o binning das partículas compreende efetuar o binning usando um número estabelecido de bins por propriedade óptica.
[011] Em uma modalidade adicional, o método inclui uma pluralidade de ROIs.
[012] Em outra modalidade, as partículas sofrem binning com base em seu status de positividade para sondas que se ligam a biomarcadores, bem como suas intensidades de dispersão de luz. Para determinar se as partículas são positivas para um biomarcador, uma função de estimativa de densidade por kernel (KDE) é aplicada ao histograma de sinal para um biomarcador específico para um paciente específico. O valor de fluorescência F1 é identificado a partir da região mais alta no gráfico de KDE para a população de partícula negativa do biomarcador. Em seguida, as inclinações da curva de KDE são calculadas para várias intensidades de sinal superior diferentes. Um segundo valor de fluorescência, F2, é identificado a partir de onde a inclinação é mais negativa, que está na metade do lado direito da população de partícula negativa. O valor de intensidade de fluorescência que separa as partículas positivas e negativas do biomarcador (Fs) é igual a F1+(2*(F2-F1))+F3, em que F3 é um pequeno valor de intensidade de fluorescência arbitrário que é adicionado para ajudar a garantir que as partículas negativas do biomarcador não sejam classificadas como partículas positivas de biomarcador. As partículas com intensidades de fluorescência acima ou abaixo de Fs são positivas ou negativas para o biomarcador, respectivamente. Este método de limiar de sinal dinâmico é resistente à mudança de sinal ao longo do tempo e para diferentes pacientes. Depois que todas as partículas de cada paciente são classificadas como positivas/negativas para cada biomarcador, os sinais de dispersão de luz que sofrem transformação log, usados para estimar o tamanho das partículas, sofrem binning em um número arbitrário de grupos. Por exemplo, quando as intensidades de sinal variam dentre 0 a 1 e 10 bins estão presentes, os sinais entre 0 e 0,1 estão no grupo 1, enquanto 0,9 a 1 estão no grupo 10. Finalmente, os fenótipos de partícula são criados com base em todas as combinações possíveis de status de biomarcador (negativo/positivo), bem como bin de dispersão de luz. Por exemplo, o biomarcador A+ e as partículas de bin de dispersão de luz 1/10 são diferentes em relação ao biomarcador A- e as partículas de bin de dispersão de luz 1/10. As concentrações para todos os fenótipos de partícula são determinadas e usadas como características de entrada para algoritmos de aprendizado de máquina.
[013] Em uma modalidade adicional, o algoritmo de aprendizado de máquina é um algoritmo de árvore de decisão individual/ensacado/por boosting, algoritmo de máquina de vetor de suporte linear/quadrático/cúbico/Gaussiano, regressão logística, análise discriminante linear/quadrática/subespaço, ou algoritmo de k-vizinhos mais próximos. Em uma modalidade, o algoritmo de aprendizado de máquina é um algoritmo de árvore de decisão conjunto e por boosting, como o algoritmo XGBoost.
[014] Em uma modalidade, o algoritmo de árvore de decisão reforçado de gradiente extremo compreende um conjunto de pelo menos 100 modelos em que as probabilidades de cada modelo são ponderadas para criar um único valor de probabilidade de câncer de próstata clinicamente significativo.
[015] Em outra modalidade, a pontuação preditiva compreende uma pontuação de atendimento padrão.
[016] Em uma modalidade adicional, o um ou mais biomarcadores são selecionados a partir da Tabela 1 ou Tabela 2.
[017] Em outra modalidade adicional, a amostra é uma amostra de soro sanguíneo.
BREVE DESCRIÇÃO DAS FIGURAS
[018] Estas e outras modalidades e características serão mais bem compreendidos com referência à seguinte descrição e desenhos, nos quais: A FIG. 1 representa uma visão geral gráfica do método de acordo com uma modalidade da presente invenção; A FIG. 2 mostra a previsão/correlação de características clínicas usando dados de μFCM. A) mapas de área sob curva característica de operação do receptor (ROC AUC) para prever vários características clínicas usando os conjuntos de dados LALS-PSMA, LALS-grelina e PSMA-grelina. As maiores AUCs de 10% em cada mapa foram ponderadas e comparadas; B) Mapas de ROC AUC para prever o grupo de graus de PCa 1+, 2+, 3+, 4+ e 5 usando o conjunto de dados de LALS-PSMA; C) Mapas de ROC AUC para prever diabetes usando o conjunto de dados de LALS-grelina; e D) mapas de coeficiente de correlação para PSA (direita), estágio do tumor (meio) e peso (direita) usando o conjunto de dados de LALS-PSMA; A FIG. 3 mostra a variabilidade da coloração da sonda de PSMA/grelina em partículas de amostras de plasma complica a análise por gating manual convencional. A), B) e C) são gráficos de dispersão representativos e mapas de ROC AUC de dispersão de luz de ângulo grande (LALS) e PSMA (a), LALS e grelina (b), e PSMA e grelina (c) para pacientes de PCa clinicamente não significativo e clinicamente significativo; D) quantificação de partículas positivas da sonda de PSMA/grelina no plasma do paciente por gating manual; E) curvas de ROC para prever PCa clinicamente significativo (grupo de grau 3+) usando dados de ROI manuais; A FIG. 4 mostra uma análise de viSNE de dados de μFCM. A) O número igual de partículas (30.000) de pacientes com PCa clinicamente significativo e clinicamente não significativo foi analisado com viSNE; B) as partículas foram agregadas usando o algoritmo de busca rápida/picos de densidade; C) pureza de agregado de viSNE para partículas de PCa clinicamente significativas. Alguns agregados mostram enriquecimento para partículas derivadas de pacientes com PCa clinicamente significativo (seta); FIG. 5 mostra a otimização de aprendizado de máquina de dados de μFCM para prever PCa clinicamente significativo usando o conjunto de dados de PSMA-grelina; A), B), C) o algoritmo de aprendizado de máquina ideal (a), número de bins por parâmetro óptico (b) e número de modelos de XG Boost em um conjunto (c); D) o efeito da busca de grade de parâmetros de XGBoost, seleção de características e conjunto no desempenho de modelo; E) Curvas de ROC para gating manual, CITRUS e um algoritmo de XGBoost de binning personalizado para prever PCa clinicamente significativo. Os valores plotados representam ± SEM com pelo menos 10 repetições de validação cruzada 5 vezes; A FIG. 6 mostra a incorporação de dados clínicos e de μFCM para prever PCa clinicamente significativo. A) O gráfico em cascata de previsões de PCa clinicamente significativo a partir de um modelo de regressão logística usando previsões de XGBoost baseadas em μFCM e característica clínica de SOC, incluindo PSA, idade, raça, DRE, biópsia negativa anterior e histórico familiar de PCa; B) As curvas de características de operação do receptor de modelos de regressão logística de SOC com ou sem dados de μFCM; C) A fração de pacientes com ou sem próstata aumentada (>40cc) com diagnóstico de câncer e DRE anormal; D), E) PSA (d) e densidade de PSA (e) em homens com e sem próstata aumentada. Os valores plotados são a média ± SEM; F) As predições de PCa clinicamente significativo em homens com próstata aumentada usando o modelo de regressão logística de μFCM + SOC; e G) As recomendações sobre se homens com próstata aumentada devem receber biópsias usando o modelo de μFCM + SOC; e A FIG. 7 mostra uma comparação de algoritmos de agregamento de um gráfico de viSNE do conjunto de dados de LALS-PSMA-grelina. A), B) e C) Os algoritmos de agregamento incluem K-médias (a), modelo de mistura Gaussiana de maximização da expectativa (b) e busca rápida/picos de densidade (c); A FIG. 8 é uma representação gráfica do desempenho do modelo XGBoost após as transformações do conjunto de dados de PSMA-grelina; A FIG. 9 mostra o mapa de ganho variável do modelo de XGBoost usando conjunto de dados de PSMA-grelina para prever PCa clinicamente significativo (a) e sobreposição de mapas de AUC (escala de cores) e de ganho variável (escala de cinza) (b); A FIG. 10 representa um método e resulta a partir de uma detecção altamente sensível de células cancerígenas únicas usando citometria de microfluxo e ultrassom; A FIG. 11 representa um método e resultados que mostram precisão melhorada de previsões clínicas sobre dados deslocados de citometria de microfluxo; A FIG. 12 mostra os resultados do biomarcador para Jagged 1; A FIG. 13 mostra resultados de biomarcadores para Caderina 11, tipo 2, caderina OB; A FIG. 14 mostra resultados de biomarcadores para ácido Polisiálico; A FIG. 15 mostra resultados de biomarcadores para MERTK; e A FIG. 16 mostra resultados de biomarcadores para Prosteína.
DESCRIÇÃO DA INVENÇÃO
[019] São descritas na presente invenção modalidades ilustrativas de biomarcadores para o diagnóstico de doença, incluindo câncer de próstata clinicamente significativo; métodos de diagnóstico de doença, incluindo câncer de próstata clinicamente significativo; e métodos de desenvolvimento de modelos de previsão de doenças e testes de diagnóstico usando os mesmos. Será apreciado que as modalidades e exemplos descritos na presente invenção são para fins ilustrativos destinados aos técnicos no assunto e não se destinam a ser limitantes de qualquer forma. Todas as referências a modalidades ou exemplos ao longo da invenção devem ser consideradas uma referência a uma modalidade ilustrativa e não limitativa ou um exemplo ilustrativo e não limitativo.
[020] A menos que definido de outra forma, todos os termos técnicos e científicos usados na presente invenção têm o mesmo significado conforme comumente entendido por um dos técnicos no assunto aos quais essa invenção pertence. Também deve-se notar que, conforme usado no relatório descritivo e nas reivindicações anexas, as formas singulares "um", "uma" e "o", "a" incluem referências plurais a menos que o contexto dite claramente o contrário. Por exemplo, a referência a um "antígeno" ou "anticorpo" pretende incluir uma pluralidade de moléculas de antígeno ou anticorpos.
[021] É fornecido um método de diagnóstico de doenças, tais como câncer de próstata clinicamente significativo, em um paciente. Para o propósito da presente discussão, “câncer de próstata clinicamente significativo” significa um câncer de próstata com um Gleason Grupo 3 ou superior. O método envolve as etapas de: incubar uma amostra do paciente com uma ou mais sondas e/ou anticorpos que se ligam a um ou mais biomarcadores para a doença de interesse; submeter a amostra a citometria de microfluxo; obter intensidades de sinal para um ou mais biomarcadores e, opcionalmente, obter uma ou mais propriedades ópticas associadas com a amostra; processar as intensidades de sinal e, se obtidas, as uma ou mais propriedades ópticas usando algoritmos personalizados para determinar a concentração de diferentes fenótipos de partículas na amostra do paciente; e diagnosticar o paciente com a doença com base na saída de um algoritmo de aprendizado de máquina usando dados de concentração de fenótipo de partículas de amostras de pacientes como entradas para o aprendizado de máquina. Em uma modalidade, a doença pode ser câncer, em particular câncer de próstata clinicamente significativo, e os biomarcadores correlacionados a biomarcadores de câncer, em particular biomarcadores de câncer de próstata clinicamente significativo.
[022] Um método para identificar uma assinatura de doença também é fornecido. O método envolve as etapas de: incubar amostras de indivíduos saudáveis e amostras de indivíduos com uma doença conhecida com uma ou mais sondas que se ligam a um ou mais biomarcadores para uma doença; submeter as amostras a citometria de microfluxo; obter intensidades de sinal para um ou mais biomarcadores e, opcionalmente, obter uma ou mais propriedades ópticas associadas a cada amostra; efetuar a transformação log das intensidades de sinal de um ou mais biomarcadores e, se presentes, de uma ou mais propriedades ópticas para produzir intensidades de sinal transformado; efetuar o binning de partículas com intensidades de sinal transformado semelhantes em regiões de interesse (ROI); determinar a concentração de partículas em cada ROI (que é calculada ao dividir as contagens de partículas totais em cada ROI pelo volume de amostra analisado durante a aquisição de dados), comparando os dados de concentração de partículas em cada ROI entre as amostras de indivíduos saudáveis e amostras dos indivíduos com uma doença conhecida; determinar os valores de área sob curva (AUC) característica de operação do receptor (ROC) para cada ROI de cada combinação de marcadores; e selecionar uma combinação de biomarcadores que forneça os valores de AUC mais altos para obter a assinatura da doença para a doença.
[023] As amostras que são úteis na presente invenção incluem, mas não estão limitadas a, amostras biológicas, como sangue (ou componentes do mesmo), sêmen, leite, etc. Na presente invenção, as vesículas extracelulares não precisam ser isoladas e purificadas, como é exigido em outros métodos. Em vez disso, o soro ou plasma pode ser isolado do sangue de acordo com os procedimentos de diagnóstico clínico padrão e usados, sem purificação e processamento adicionais, nos métodos descritos na presente invenção.
[024] As amostras são incubadas com sondas associadas aos biomarcadores para a doença de interesse ou a doença que está sendo diagnosticada, ou um tipo particular de partícula pequena, como neste caso uma EV. As sondas podem incluir, mas não estão limitadas a, anticorpos inteiros ou componentes de anticorpos, tais como fragmentos F ab), F(ab ')2 ou F(ab'), minicorpos, etc. contra antígenos específicos ou peptídeos contra alvos específicos. As sondas também podem incluir vários corantes que permitem a identificação de componentes particulares na amostra. Por exemplo, a incubação com corantes lipofílicos, que coram pequenas partículas ligadas à membrana, pode auxiliar na segregação de agregados de proteína de partículas ligadas a lipídios em uma amostra. Normalmente as sondas terão um componente secundário diretamente conjugado, como um conjugado fluorescente, que auxilia na detecção do alvo ligado à sonda.
[025] Para detectar EVs positivos para PSMA, a amostra pode ser incubada com o anticorpo monoclonal J591 específico para PSMA (disponível através de BZL Biologics, LLC) que foi conjugado diretamente com um corante como DyLight 405. Alternativamente, uma sonda não conjugada (por exemplo, anticorpo monoclonal J591 específico para PSMA), após incubação com a amostra, pode ser incubada adicionalmente com um agente secundário para identificar a sonda primária usada no ensaio. Por exemplo, a incubação com o anticorpo IgG anti-camundongo de burro conjugado com Qdot565, que então permite a detecção no ensaio de μFCM. Normalmente, as sondas de biomarcador serão específicas para uma molécula biológica que é apenas ou principalmente expressa em células ou tecidos afetados pela doença de interesse. No entanto, os biomarcadores podem ser específicos para um tipo de célula particular. Além disso, mais de um biomarcador pode ser usado para identificar mais de uma característica da doença de interesse e/ou tipo de célula.
[026] A incubação de amostras com sondas de biomarcador pode ser feita como amostra única + formato de sonda único ou como amostra única + múltiplos formatos de sonda. O formato da incubação pode fornecer respostas diferentes, pois cada sonda de biomarcador pode fornecer informações diferentes sobre as populações de EV em uma amostra. Por exemplo, uma sonda pode indicar eventos ligados a lipídios versus não ligados a lipídios, ou uma origem de partícula epitelial versus não epitelial. Em outros casos, uma sonda pode indicar a presença de doenças, presença de doenças e agressividade. Múltiplas sondas em uma incubação podem ter indicações semelhantes de origem de partícula, presença de doença e agressividade da doença. Assim, a combinação de sondas pode ter implicações significativas para a detecção de um fenótipo de doença.
[027] O tamanho e a contagem das partículas podem ser estimados por dispersão de luz. As características de dispersão de luz combinadas com a intensidade de fluorescência descrita acima podem fornecer um fenótipo único para cada partícula. Esses fenótipos de partículas podem ser usados individualmente ou combinados com vários biomarcadores e podem fornecer uma assinatura de doença única para a doença de interesse.
[028] As amostras são então submetidas a μFCM, usando uma máquina comercialmente disponível, como, mas não se limitando a, citômetro de microfluxo Apogee A50 ou Citômetro de Fluxo CytoFLEX ou DxFlex. Os dados brutos obtidos a partir da análise de μFCM podem ser extraídos usando algoritmos, escritos em MATLAB, R ou Python e organizados como partículas individuais como linhas e dispersão de luz e intensidades de fluorescência como colunas. O tempo que cada partícula foi registrada pode ser representado em uma coluna separada.
[029] Os pontos de corte mínimo e máximo para intensidade de dispersão de luz/fluorescência para cada fenótipo de partícula podem ser determinados por meio de experimentos de otimização, que envolvem o uso de uma gama de diferentes pontos de corte para uma gama de diferentes intensidades de dispersão de luz/fluorescência e a identificação dos pontos de corte que fornecem a mais alta característica de operação do receptor sob a curva de dados do paciente adquiridos anteriormente.
[030] O número de partículas em cada fenótipo de partícula pode ser determinado usando scripts de processamento personalizados que agrupam partículas com intensidade de dispersão de luz e de marcador semelhantes. As concentrações de fenótipo de partícula são calculadas com base em contagens de fenótipo de partícula, o período de tempo em que a amostra foi executada, a taxa de fluxo de amostra do μFCM e o fator de diluição da amostra. Se o paciente tiver mais de um arquivo de dados de μFCM (isto é, múltiplas réplicas), as concentrações de fenótipo de partículas podem ser ponderadas em todos os arquivos de dados de μFCM replicados.
[031] Também é possível calcular as concentrações de fenótipo de partícula em amostras usando um algoritmo de Limiar de Fluorescência Dinâmica ao identificar o status de positividade do biomarcador para cada partícula em cada paciente. Para determinar se as partículas para cada amostra do paciente são positivas para um biomarcador, uma função de estimativa de densidade por kernel (KDE) é aplicada aos gráficos de histograma de um único sinal de sonda de uma única amostra do paciente. O valor de fluorescência F1 é identificado como a região no eixo X (intensidade de fluorescência) do gráfico de histograma que atravessa a região mais alta no eixo Y (densidade de partícula) no gráfico de KDE para a população de partículas negativas do biomarcador, que é o maior pico próximo ao lado esquerdo do gráfico de KDE. Em seguida, as inclinações da curva de KDE são calculadas para várias intensidades de sinal superior diferentes de F1. Um segundo valor de fluorescência, F2, é identificado a partir de onde a inclinação é mais negativa, que está na metade do lado direito da população de partícula negativa. O valor de intensidade de fluorescência que separa as partículas positivas e negativas do biomarcador (Fs) é igual a F1+(2*(F2-F1))+F3, em que F3 é um pequeno valor de intensidade de fluorescência arbitrário que é adicionado para ajudar a garantir que as partículas negativas do biomarcador não sejam classificadas como partículas positivas de biomarcador. As partículas com intensidades de fluorescência acima ou abaixo de Fs são positivas ou negativas para o biomarcador, respectivamente. Depois que todas as partículas para cada paciente são classificadas como positivas/negativas para cada biomarcador, os sinais de dispersão de luz que sofrem transformação log, usados para estimar o tamanho de partícula, sofrem binning em um número arbitrário de grupos. Finalmente, os fenótipos de partícula são criados com base em todas as combinações possíveis de status de biomarcador (negativo/positivo), bem como bin de dispersão de luz.
[032] A partir dos dados coletados acima, é construído um conjunto de dados para aprendizado de máquina. Uma tabela pode ser criada com as concentrações de fenótipo de partícula para todos os pacientes. Em uma iteração, as linhas podem representar pacientes e as colunas representam a concentração de fenótipo de partícula. No entanto, será claro para um técnico no assunto que os dados podem ser representados de uma maneira oposta ou em alguma outra forma tabular.
[033] Os dados clinicamente relevantes podem ser adicionados à tabela como colunas ou linhas adicionais, dependendo de como o conjunto de dados é criado. Esses dados podem ser usados como características adicionais para aprendizado de máquina (por exemplo, PSA com os dados de μFCM fornecem melhores previsões de quem tem câncer de próstata clinicamente significativo?) Ou podem ser usados como rótulos que os algoritmos de aprendizado de máquina precisam prever (por exemplo, identificação de quais pacientes têm câncer de próstata clinicamente significativo).
[034] Uma vez que o conjunto de dados é criado, é gerado um modelo de aprendizado de máquina otimizado capaz de prever o status clínico de μFCM com ou sem dados clínicos. O software usado para aprendizado de máquina pode incluir, mas não está limitado a, R, MATLAB, KNIME e python. Os modelos de aprendizado de máquina podem incluir árvore de decisão única, máquinas de vetor de suporte, k-vizinhos mais próximos, regressão linear, regressão logística, análise discriminante, floresta aleatória, redes neurais e XGBoost. O algoritmo que fornece o ROC AUC mais alto para prever uma condição clínica pode ser otimizado adicionalmente. Todos os algoritmos de aprendizado de máquina são analisados usando validação cruzada 5 vezes, que envolve a divisão dos dados em 5 grupos separados. Um modelo pode ser criado usando 4 dos 5 grupos e a precisão de modelo pode ser determinada em relação ao grupo retido. Os grupos são embaralhados e o processo é repetido mais 4 vezes para que cada paciente seja usado uma vez no grupo retido. Isso garante que a precisão do modelo seja determinada em dados que não foram usados para criar o modelo.
[035] A otimização do algoritmo de aprendizado de máquina inclui a identificação de quais μFCM/caracteristicas clínicas devem ser mantidas/removidas antes da criação do modelo usando a eliminação de característica recursiva. Este algoritmo identifica as características mais importantes de um modelo usando todos os dados (por exemplo, a importância da característica de XGBoost usando a função xgb.importance em R). Múltiplos conjuntos de dados são criados, incluindo os 10, 20, 30, 40, 50, 60, 70, 80, 90 ou 100% principais características mais importantes e o conjunto de dados que fornece o ROC AUC mais alto usando validação cruzada 5 vezes contém as características que serão mantidos para o modelo de aprendizado de máquina final. Outros algoritmos de seleção de características, incluindo algoritmos genéticos e anelamento simulado, também podem ser usados nesta etapa.
[036] Após a seleção da característica, os parâmetros ajustáveis do algoritmo de aprendizado de máquina podem ser otimizados por meio de busca de grade. Isso envolve o fornecimento de múltiplos valores para cada parâmetro de algoritmo ajustável (por exemplo, parâmetros de XGBoost, como "nrounds": 100, 200 e 300, bem como "max_depth": 3, 4 e 5) e o teste de cada combinação de valores de parâmetro possíveis. O conjunto de valores de parâmetro que fornece o ROC AUC mais alto usando validação cruzada 5 vezes é usado para o modelo de aprendizado de máquina final.
[037] A otimização do modelo de aprendizado de máquina final envolve o conjunto de vários modelos (normalmente >100), ao ponderar as previsões de todos os modelos. Todos os modelos usarão os características e parâmetros otimizados descritos acima, mas cada modelo usará uma coorte ligeiramente diferente de pacientes (por exemplo, 80% dos pacientes selecionados aleatoriamente) para a criação do modelo. Isso faz com que cada modelo seja único e a média das previsões de todos os modelos fornecerá uma previsão mais precisa e estável do status clínico do que usar um único modelo com o conjunto de dados completo. O modelo final otimizado conjunto é salvo em um computador para uso futuro.
[038] O modelo de aprendizado de máquina final pode ser usado para prever o status clínico de novos pacientes. Novos dados do paciente, que incluem concentrações de fenótipo de partícula com ou sem dados clínicos, podem ser usados como entrada para o modelo de aprendizado de máquina final para prever a probabilidade de um paciente ter uma condição clínica específica.
[039] Usando o método descrito acima, pacientes com câncer de próstata clinicamente significativo previamente diagnosticado foram estudados para determinar os fenótipos/biomarcadores de partículas mais comumente associados à doença. Esses fenótipos/biomarcadores de partículas são mostrados na Tabela 1 com prova de conceito adicional nas Figuras 12, 13, 14, 15 e 16. Tabela 1: Biomarcadores associados ao câncer de próstata clinicamente significativo
Figure img0001
Figure img0002
EXEMPLOS
[040] Devido aos vários tamanhos de EVs diferentes, o objetivo era separar os dados de μFCM em vários ROIs diferentes, em que cada ROI representa a concentração de EVs diferentes, e usar o aprendizado de máquina nos dados de ROI para prever condições clínicas (Fig. 1). Antes de criar tais modelos, era importante primeiro identificar quais condições clínicas os dados de μFCM podem prever melhor. Os scripts de análise automatizada foram usados para criar mapas de AUC dos dados de μFCM para prever 10 condições clínicas diferentes que eram relevantes para as sondas de PSMA e grelina.
[041] Ao ponderar os 10% mais altos de AUCs dentro dos mapas de AUC LALS-PSMA, LALS-grelina e PSMA-grelina, a previsão do grupo de graus de PCa 5 e 4+ forneceu as AUCs ponderadas mais altas (Fig. 2a). Curiosamente, todos os três mapas de AUCs bivariados forneceram os 10% de AUCs principais acima de 0,7 para prever esses PCa de alto grau com LALS-PSMA tendo AUCs acima de 0,8 para prever o PCa de grupo de graus 5. Os mapas de AUC LALS-PSMA exibiram uma mudança de padrão interessante ao comparar os diferentes grupos de grau de PCa (Fig. 2b). Ao estimar o tamanho de partícula usando LALS, a previsão do grupo de grau 1+ exibiu partículas positivas para PSMA relativamente menores com AUCs acima de 0,5, o que significa que a concentração de partículas nessas ROIs em geral é maior em pacientes com PCa do grupo de grau 1+, enquanto partículas positivas para PSMA maiores principalmente exibiu AUCs abaixo de 0,5, o que significa que a concentração de partículas nessas ROIs em geral é menor em pacientes com PCa do grupo de grau 1+. Os mapas de AUC para grupos de grau maiores demonstraram uma inversão progressiva deste fenótipo com PCa do grupo de grau 5 tendo AUCs > 0,8 para partículas positivas para PSMA maiores e AUCs de aproximadamente 0,3 para várias partículas positivas para PSMA menores. Esta inversão de fenótipo tornou-se bastante perceptível com mapas de AUC do grupo de grau 3+. Testes clínicos anteriores mostraram que os pacientes de PCa do grupo de grau 3 que receberam prostatectomia radical tiveram uma progressão livre de recorrência de 10 anos abaixo de 0,5, que foi significativamente menor do que >0,75 para aqueles pacientes com PCa do grupo de grau 2 (28). Isso sugere que a maioria dos homens com PCa do grupo de grau 3 têm doença metastática no diagnóstico, uma vez que a remoção cirúrgica do tumor primário não cura os pacientes com PCa. Sem ser limitado pela teoria, a maior abundância de partículas positivas para PSMA maiores em pacientes com PCa de alto grau pode ser parcialmente devido às células metastáticas circulantes, uma vez que EVs maiores (> 300 nm) de células tumorais localizadas teriam dificuldade de intravasar nos vasos sanguíneos.
[042] Devido ao papel da grelina no metabolismo de energia e glicose (Churm R et al., Obes Rev 18 (2): 140-148, 2017), mapas de AUC foram criados para prever diabetes. Uma gama de partículas positivas para grelina de tamanhos diferentes exibiu AUCs perto de 0,7, sugerindo que homens diabéticos têm EVs com níveis elevados de receptores de grelina (Fig. 2c).
[043] Usando os dados de LALS-PSMA, mapas de correlação foram criados para PSA, estágio do tumor e peso (Fig. 2d). Partículas relativamente grandes ligeiramente positivas para PSMA demonstraram a correlação positiva mais alta com PSA, enquanto partículas grandes com forte positividade para PSMA se correlacionaram melhor com o estágio do tumor. Tais correlações não são surpreendentes, uma vez que 1) a expressão de PSMA da próstata mostrou se correlacionar com PSA no diagnóstico (Kasperzyk JL et al., Cancer Epidemiol Biomarkers Prev 22 (12): 2354-63, 2013), e 2) tumores de grau superior têm maior probabilidade de se espalhar, explicando a semelhança entre os mapas de AUC de grau mais alto e o mapa de correlação de estágio do tumor.
[044] Dados os resultados dos mapas de AUC/correlação, os dados de μFCM foram usados para prever PCa clinicamente significativo, que foram definidos como grupo de grau 3+, uma vez que esses pacientes demonstraram resultados significativamente piores do que o grupo de grau 2 e pacientes com PCa mais baixo.
[045] Os dados de μFCM foram analisados por gating manual para fornecer uma referência de análise convencional. Criar portais manuais em torno de populações de partículas específicas não é uma tarefa trivial, uma vez que diferentes populações de partículas existem em diferentes gráficos de dispersão de pacientes com algumas pequenas mudanças nas localizações da população (Fig. 3a, b, c). Para simplificar, foram criados portais que agrupavam todas as partículas positivas para marcadores. Quando comparado com o PCa clinicamente não significativo, apenas a concentração de partículas positivas para grelina foi significativamente maior no PCa clinicamente significativo em 2,1 vezes (p <0,05, Fig. 3d). As AUCs das concentrações de partículas positivas para PSMA, grelina e PSMA/grelina para prever PCa clinicamente significativo foram todas abaixo de 0,6 (Fig. 3e). Estas AUCs baixas podem ser explicadas pelos mapas de AUC que mostram as portas que abrangem partículas com AUCs acima e abaixo de 0,5 (Fig. 3a, b, c).
[046] Os gráficos de viSNE de partículas clinicamente significativas e não clinicamente significativas em conjunto revelaram mais populações de partículas do que eram visíveis com gráficos de dispersão convencionais (Fig. 4a). As partículas foram agregadas usando K-médias, modelo de mistura Gaussiana de maximização de expectativa e algoritmos de busca rápida/picos de densidade, e o último algoritmo foi o único que conseguiu manter grandes aglomerados com formatos irregulares (Fig. 4b e Fig. 8). Dois agregados alcançaram pureza de agregado de > 0,8 para PCa clinicamente significativo, sugerindo que essas populações de partículas estão em níveis mais elevados em pacientes com PCa clinicamente significativo (Fig. 4c). Embora esses resultados pareçam promissores para serem explorados clinicamente, a natureza não reproduzível do viSNE exige que todos os dados sejam analisados simultaneamente. Visto que o viSNE só pode lidar com até 100.000 eventos, > 99,99% das partículas na coorte de 215 pacientes seriam removidas da análise.
[047] A fim de otimizar a previsão de PCa clinicamente significativo a partir de dados de μFCM, as concentrações de partículas de ROIs foram usadas como dados de treinamento para 24 algoritmos de aprendizado de máquina diferentes. Para conjuntos de dados de LALS-PSMA, LALS-grelina e PSMA- grelina, o XGBoost forneceu as AUCs mais altas em 0,61, 0,62 e 0,66 (Fig. 5a). Todas as análises subsequentes usaram o conjunto de dados de PSMA-grelina com XGBoost.
[048] Como esperado para um modelo baseado em árvore de decisão, as transformações monotônicas dos dados de μFCM não melhoraram o desempenho do modelo XGBoost (Fig. 9). O mapa de ganho variável do XGBoost, que exibe as ROIs mais importantes para a precisão do modelo XGBoost, ilustrou que várias populações de partículas diferentes são importantes para o modelo XGBoost (Fig. 10a). As ROIs com ganho variável relativamente alto se sobrepuseram principalmente às regiões no mapa de AUC que estavam bem acima e abaixo de 0,5, sugerindo que as populações de partículas que tinham concentrações mais altas e mais baixas em pacientes com PCa clinicamente significativos eram importantes para o modelo (Fig. 10b).
[049] Alterar a estratégia de binning para acima ou abaixo de 32 causou a diminuição das AUCs, sugerindo que este nível de resolução é preferido para prever PCa clinicamente significativo. A criação de conjuntos cada vez maiores de modelos XGBoost aumentou o desempenho do modelo (Fig. 5c). Em comparação com modelos XGBoost únicos, um conjunto de 100 modelos forneceu uma melhoria de 5% na AUC e reduziu a variabilidade do modelo em 95%. Conjuntos maiores de XGBoost podem ser feitas para melhor desempenho do modelo, embora esses pequenos benefícios em precisão também tenham maiores exigências de processamento/memória. A busca de grade dos parâmetros de XGBoost e a eliminação recursiva de características aumentaram as AUCs do XGBoost em 3% e 5%, respectivamente (Fig. 5d). A combinação de busca de grade, seleção de caracertísticas e conjunto aumentou significativamente a AUC do XGBoost em 12% (p <0,05), sugerindo uma interação aditiva entre as técnicas de otimização do modelo. A análise por citrus e por gating manual do conjunto de dados de PSMA-grelina forneceu AUCs significativamente menores, 0,52 e 0,59, respectivamente, em comparação com nosso modelo de XGBoost otimizado em 0,75. (p <0,05). O presente modelo XGBoost otimizado também superou o PSA, que foi a única característica clínica que diferiu significativamente entre os pacientes com PCa clinicamente significativos e não clinicamente significativos (p = 0,0015, Tabela 1).
[050] Para comparar o presente modelo otimizado com SOC para prever PCa clinicamente significativo, modelos de regressão logística foram criados usando SOC com ou sem nossas previsões do modelo XGBoost baseado em μFCM. Um gráfico em cascata das previsões do paciente do modelo SOC e μFCM forneceu 89% de sensibilidade e 49% de especificidade ao usar uma probabilidade de corte de 0,07332 (Fig. 6a e Tabela 1). Adicionar SOC às previsões de μFCM aumentou ligeiramente a AUC para 0,76, o que foi significativamente maior do que 0,68 AUC de SOC sozinho (p <0,05), demonstrando o valor clínico do modelo XGBoost baseado em μFCM (Fig. 6b).Tabela 2: Características do paciente por grupo de grau de PCa
Figure img0003
[051] DRE, exame retal digital; SOC, padrão de atendimento; IC, intervalo de confiança de 95%; ROC AUC, área sob curva característica de operação do receptor; PPV, valor preditivo positivo; NPV, valor preditivo negativo;
[052] Mediante uma análise adicional da coorte de 215 pacientes, observou-se que os homens com próstatas aumentadas (> 40 cc) eram significativamente menos propensos a ter PCa, o que significa que, em comparação com os homens com próstatas de tamanho normal, uma porcentagem maior de homens com próstatas aumentadas foi submetido a biópsias desnecessariamente. Com base na prática clínica atual, os homens recebem principalmente biópsias da próstata devido aos altos níveis de PSA e/ou DRE anormal. A fração de pacientes com DRE anormal foi semelhante entre homens com próstata normal e aumentada (Fig. 6c), enquanto os níveis de PSA foram significativamente maiores em homens com próstata aumentada (p <0,05, Fig. 6d), sugerindo que o PSA elevado foi responsável pelo aumento do número de biópsias desnecessárias. A normalização dos níveis de PSA usando a densidade de PSA (PSA dividido pelo volume da próstata) pode não ser ideal, uma vez que a densidade de PSA foi significativamente mais baixa em homens com próstata aumentada (Fig. 6e). Para homens com próstata aumentada, as pontuações de probabilidade de SOC + μFCM para PCa clinicamente significativo foram significativamente diferentes entre pacientes com PCa não clinicamente significativo e clinicamente significativo (p <0,0005, Fig. 6f), e usando o limiar de corte de probabilidade previamente definido na Tabela 2 , 100% e 49% dos pacientes com PCa clinicamente significativo e não clinicamente significativo seriam recomendados para biópsia, respectivamente, eliminando aproximadamente metade das biópsias desnecessárias enquanto mantém 100% de sensibilidade para detectar PCa clinicamente significativo (Fig. 6g).
A. Características do paciente e aquisição de amostra
[053] Amostras de plasma de pré-biópsia foram adquiridas do biorrepositório Alberta Prostate Cancer Research Initiative (APCaRI). Os critérios de inclusão foram homens adultos sem diagnóstico prévio de câncer de próstata que foram: (1) encaminhados para clínicas de urologia em Alberta para questões com a próstata e estavam sendo agendados para uma biópsia da próstata; e (2) submetidos à cirurgia transuretral de próstata para diagnóstico ou tratamento de anomalias da próstata. Todos os pacientes forneceram consentimento informado por escrito, e o estudo foi aprovado pelos comitês de ética científica do Prostate Cancer Centre (Calgary, Alberta, Canadá) e do Northern Alberta Urology Centre (Edmonton, Alberta, Canadá). Os pacientes foram inscritos entre junho de 2014 e setembro de 2015. Biópsias de próstata guiadas por ultrassom transretal foram realizadas com uma mediana de 12 núcleos por paciente e avaliadas de acordo com os SOPs de cada hospital. Os resultados dos testes não foram fornecidos aos centros clínicos para atendimento ao paciente. A equipe do laboratório que adquiriu amostras de pacientes e executou testes com elas não tinha conhecimento das características dos pacientes. O sangue foi coletado e processado para coletar plasma de acordo com os SOPs institucionais e o tempo do braço até o freezer de -80 ° C foi de 2 horas ou menos. Em particular, as amostras de sangue foram coletadas em vacutainers de grau clínico. Para a preparação do plasma, as amostras foram submetidas a um processo de centrifugação em 2 etapas. Primeiro, um padrão de 1300 xg por 10 minutos para fornecer a separação do plasma a partir de outros componentes do sangue, seguido por uma segunda centrifugação de 1300 xg x 10 minutos para plaquetas de pellet. O sangue coletado em tubos de soro é primeiro deixado coagular por 15-30 minutos e, em seguida, é realizada uma única etapa de centrifugação de 1300xg x 10 minutos.
B. Ensaio de μFCM
[054] As amostras de plasma congeladas foram descongeladas, centrifugadas a 16.000 xg por 30 minutos para remover detritos grandes e partículas de plaquetas e incubadas com 400 μg/mL de anticorpo J591 e diluição final de 1/50 de anticorpo IgG anti-camundongo de burro conjugado com Qdot565 secundário. As amostras também foram incubadas com sonda de Grelina Cy5 0,025 mM contendo os primeiros 18 aminoácidos de grelina. Trinta minutos após a incubação da sonda, as amostras foram diluídas 100 vezes em solução salina duplamente tamponada com fosfato filtrada (0,22 μm) e analisadas com citômetro de microfluxo Apogee A50 usando uma taxa de fluxo de 3,01 μL/minuto. As amostras foram executadas por até 2 minutos ou até 5.000.000 de eventos serem registrados, o que ocorrer primeiro. O plasma de cada paciente foi executado em triplicata. A análise por gating manual convencional de dados de μFCM foi realizada usando o software Histogram versão 255.0.0.80 (Apogee Flow Systems).
C. Processando dados de μFCM
[055] Os arquivos de μFCM fcs do paciente foram analisados usando um script de MATLAB personalizado (versão R2017a). Dentro de cada arquivo de fcs, intensidades de sinal para todos os canais sofreram transformação log e partículas com propriedades ópticas semelhantes sofreram binning usando 32bins por propriedade óptica, a menos que indicado de outra forma. Foram criados três histogramas bivariados diferentes de concentração de partículas: 1) dispersão de luz de ângulo grande (LALS) e intensidade de coloração de PSMA, 2) intensidade de coloração de sonda de LALS e grelina e 3) intensidade de coloração de sonda de PSMA e grelina. Cada histograma bivariado continha 1024 ROIs (32x32 bins). A concentração de partículas em cada ROI foi ponderada em três repetições por paciente.
D. Previsão e correlação de características clínicas com dados de μFCM
[056] Os dados de μFCM foram usados para prever características clínicas binárias (por exemplo, pacientes com ou sem diabetes, exame retal digital normal ou anormal) e correlacionar com características clínicas ordinais ou de intervalo (por exemplo, estágio do tumor ou PSA, respectivamente) usando um script de MATLAB personalizado. Para minimizar o código necessário para a análise automatizada, um arquivo de instrução do excel foi criado, o qual descreve como os dados de μFCM devem ser analisados para cada característica clínica. Dentro do arquivo de instruções, cada característica clínica era uma coluna separada e cada linha continha informações ou instruções específicas. As informações específicas incluíram a localização da característica clínica dentro do banco de dados, o tipo de dados para cada característica clínica (binária ou ordinal/intervalo) e o valor que representa os dados ausentes para essa característica clínica. As instruções envolviam principalmente como a característica clínica deveria ser transformada, o que incluía valores de limiar ao binarizar características, derivar os grupos de grau de PCa a partir de pontuações de Gleason e determinar a idade a partir das datas de nascimento. Os pacientes dos quais faltavam dados para a característica clínica foram removidos da análise para essa característica clínica.
[057] Depois que os dados da característica clínica foram recuperados do banco de dados para todos os pacientes e transformados, os dados de concentração de partículas de μFCM para cada ROI foram usados para prever ou correlacionar com características clínicas. Para características clínicas binárias, os valores da área sob a curva (AUC) de característica de operação do receptor (ROC) foram determinados para cada ROI e os mapas de AUC foram gerados para cada conjunto de dados bivariados, incluindo LALS-PSMA, LALS- grelina e PSMA-grelina. Para características clínicas ordinais/de intervalo, coeficientes de correlação de Pearson foram determinados para cada ROI e mapas de correlação foram gerados para cada conjunto de dados bivariados. Os 10% mais altos dos valores de AUC em cada mapa de AUC foram ponderados e esses valores foram comparados entre as características clínicas.
E. Análise viSNE de dados de μFCM
[058] Os gráficos de viSNE foram criados usando o software Cyt versão 2.0 executado no MATLAB (25). Os arquivos de fcs triplicados de cada paciente foram concatenados em um arquivo de fcs. Dois novos arquivos de fcs foram criados: um usando eventos de pacientes com grupo de grau 2 e PCa inferior (PCa não clinicamente significativo) e o outro usando eventos de pacientes com grupo de grau 3 e PCa superior (PCa clinicamente significativo). Esses dois arquivos de fcs tinham um total de aproximadamente 100.000 eventos com um número igual de eventos a partir de cada paciente em seu grupo. Com o software Cyt, 30.000 eventos de ambos os dois arquivos de fcs foram subamostrados aleatoriamente e mesclados para criar 60.000 eventos que foram visualizados com viSNE usando a transformação bh-SNE usando LALS, PSMA e canais de grelina e agregados com as k-médias e expectativa algoritmos de modelo de mistura gaussiana de maximização. Os resultados do viSNE foram exportados do Cyt e também agregados usando o algoritmo de busca rápida/picos de densidade usando a função DensityClust para Matlab (Rodriguez A e Laio A, Science 344 (6191): 1492-6, 2014). As distâncias Euclidianas de par de eventos foram determinadas usando a função de pdist2. Para a configuração dos parâmetros delta e rho usando a função paraSet, a variável vizinha de porcentagem foi definida como 2% e um kernel Gaussiano foi usado. Os centros de agregação foram selecionados usando valores delta entre 1,5 e 5, bem como valores de rho entre 200 e 1900. Para todos os algoritmos de agregação, 248 agregados foram criados em 60.000 eventos. A pureza do agregado para o PCa clinicamente significativo foi definida como o número de eventos de PCa clinicamente significativos dividido pelo número total de eventos dentro de cada agregado. Apenas agregados com pelo menos 60 partículas (0,1% do total de partículas) foram analisados.
F. Otimizando modelos de aprendizado de máquina para prever PCa clinicamente significativo
[059] O aplicativo de aprendizado de classificação de MATLAB foi usado para testar 23 algoritmos de aprendizado de máquina diferentes para prever o PCa clinicamente significativo usando dados de μFCM de concentração de partículas. Esses algoritmos incluíam árvores de decisão individuais/ensacadas/reforçadas, máquinas de vetores de suporte linear/quadrático/cúbico/Gaussiano, regressão logística, análise discriminante linear/quadrática/de subespaço e k vizinhos mais próximos. O XGBoost também foi testado usando o pacote 'xgboost' em R (versão 3.3.3). Todos os algoritmos de aprendizado de máquina usaram configurações padrão e validação cruzada de 5 vezes repetida pelo menos 10 vezes com randomização de paciente entre as repetições.
[060] O algoritmo de aprendizado de máquina com o AUC mais alto foi então otimizado ao 1) comparar 2, 4, 8, 16, 32, 64 e 128 bins ao processar os dados de μFCM, 2) criar conjuntos de 3, 6, 12, 25, 50 e 100 modelos usando o mesmo algoritmo de aprendizado de máquina, mas selecionando aleatoriamente diferentes subconjuntos de pacientes como dados de treinamento e previsões de modelo de média, 3) selecionar o melhor subconjunto de μFCM ROIs usando a eliminação de característica recursiva com o pacote R 'circunflexo' e 4) parâmetros de algoritmo de busca de grade (XGBoost: nrounds = 50, 100, 150, 200, 250, 300, 400; max_depth = 3, 4, 5, 6; eta = 0,01, 0,1; gama = 0; colsample_bytree = 1; min_child_weight = 1; subamostra = 1). O binning//conjunto/características/parâmetros que forneceram as AUCs mais altas foram usados juntos para criar um modelo final para prever o PCa clinicamente significativo. Este modelo foi comparado à análise por gating manual usando o software Histogram e Citrus com configurações padrão usando R. Citrus prediz condições clínicas a partir de dados de citometria de fluxo usando agregação hierárquica e regressão logística regularizada por lasso e métodos centroides encolhidos mais próximos (Bruggner RV et al., Proc Natl Acad Sci USA 111 (26): E2770-7, 2014).
[061] Para incorporar as características clínicas de padrão de atendimento (SOC), incluindo PSA, idade, DRE, histórico familiar de PCa, biópsia negativa anterior e raça (negra = 1, outras raças = 0), com as previsões de probabilidade do modelo de μFCM final, um modelo de regressão logística foi criado usando todos essas características. Este modelo foi comparado a um modelo de regressão logística semelhante sem usar dados de μFCM.
G. Análise estatística
[062] Salvo indicação em contrário, os gráficos de barras/pontos com barras de erro representam a média ± de erro padrão da média. Ao comparar 2 grupos, os testes t bicaudais não pareados foram usados para dados de intervalo e os testes exatos de Fisher foram usados para tabelas de contingência. ANOVA unilateral foi usada para comparar 3 ou mais grupos usando o teste de comparação múltipla de Tukey. As curvas de ROC foram comparadas pelo método de DeLong usando o pacote de 'pROC' em R. Quando possível, os valores de corte de ROC foram determinados usando ~90% de sensibilidade e a especificidade resultante e os valores preditivos positivos/negativos foram determinados usando o software GraphPad Prism versão 6.01.
Desenvolvimento de um ensaio para detecção de células tumorais circulantes ao analisar EVs de amostras sonicadas usando citometria de microfluxo
[063] Conforme mostrado na FIG. 10, para otimização do ensaio, 100.000 células de HeLa-GFP em meio foram incubadas e expostas a várias quantidades de microbolhas e ultrassom. O meio foi analisado para Evs fluorescentes antes e depois da sonicação. Para testar a sensibilidade do ensaio, 0, 1, 5, 10, 100 e 1.000 células cancerígenas de próstata PC3 expressando GFP palmitoilada foram misturadas com 1.000.000 células de HT1080 (fundo) e foram sonicadas com microbolhas. O meio foi analisado por citometria de microfluxo pré/pós- sonicação.
[064] O ensaio tem detecção de uma única célula cancerígena com SNR teórico mais alto do que a citometria de fluxo convencional. A pressão do ultrassom de >15 Mpa gera EVs máximos. A liberação de EV mediada por ultrassom aumenta linearmente com os ciclos de ultrassom e a concentração de microbolhas.
Desenvolvimento de algoritmos para padronizar sinais de dispersão de luz e sinais de fluorescência
[065] Conforme mostrado na FIG. 11, os sinais de dispersão de luz foram registrados a partir de beads de calibração sob diferentes tensões (300 - 400 V em +10 V). Os histogramas de dispersão de luz foram criados e deslocados linearmente para corresponder a beads executados a 350 V. Cada pico do histograma de bead foi deslocado para corresponder ao mesmo pico de beads executados a 350 V (deslocamento não linear).
[066] Amostras de plasma de 281 pacientes foram coradas com antígeno de membrana específico da próstata. Os dados foram processados com binning 16 x 16 fixo (LALS vs PSMA) ou usando um algoritmo que identificou partículas positivas ou negativas para PSMA usando limiar de fluorescência dinâmica e grupos separados com base adicional no grau de positividade para PSMA. Os modelos XGBoost foram criados para prever pacientes com câncer de próstata agressivo (Gleason 4+3 e superior). Os modelos foram usados nos mesmos dados com fluorescência modificada (x 0,125 - 256) e as AUCs foram calculadas.
[067] O algoritmo de calibração de dispersão de luz não linear pode ajudar a corrigir a variabilidade da dispersão de luz em amostras. O processamento de dados com limiares de fluorescência dinâmica ajuda a garantir a confiabilidade do modelo em dados deslocados. Esses algoritmos de padronização irão melhorar as previsões de ensaios clínicos quando usados em várias clínicas ao longo do tempo.

Claims (21)

1. Método de identificação de uma assinatura de câncer de próstata clinicamente significativo, caracterizado pelo fato de que compreende as etapas de: incubar uma amostra compreendendo vesículas extracelulares (EVs) proveniente de um paciente com uma ou mais sondas que ligam biomarcadores para a doença de interesse ligados às EVs; submeter a amostra a citometria de microfluxo para identificar as EVs; obter intensidades de sinal para o um ou mais biomarcadores e, opcionalmente, obter uma ou mais propriedades ópticas associadas com a amostra; processar as intensidades de sinal e, se obtidas, a uma ou mais propriedades ópticas para calcular concentrações de diferentes fenótipos de partícula na amostra; em que o processamento compreende efetuar transformação log das intensidades de sinal para produzir intensidades de sinal transformadas; e efetuar o binning das partículas com intensidades de sinal transformadas similares em regiões de interesse (ROI) para cada propriedade óptica onde cada ROI é considerada um fenótipo de partícula diferente; em que a determinação dos fenótipos das partículas é realizada usando um algoritmo de Limiar de Fluorescência Dinâmica que identifica o estado de positividade do biomarcador para cada partícula em cada paciente; e usar essas concentrações de fenótipos de partícula e as características do paciente como as entradas para algoritmos de aprendizado de máquina para determinar a probabilidade de pacientes terem câncer de próstata clinicamente significativo.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente as etapas de: identificar biomarcadores adicionais para serem incluídos na assinatura de doença para a doença de interesse; efetuar transformação log das intensidades de sinal a partir do um ou mais biomarcadores e, se presentes, da uma ou mais propriedades ópticas para produzir intensidades de sinal transformadas; efetuar o binning das partículas com intensidades de sinal transformadas similares nas regiões de interesse (ROI) usando vários limiares diferentes para cada sinal de biomarcador; comparar os dados de concentração de partículas em cada ROI entre amostras provenientes de um indivíduo saudável e amostras provenientes de indivíduos com uma doença conhecida; determinar os valores de área sob a curva (AUC) característica de operação do receptor (ROC) para cada ROI a partir de cada combinação de marcadores; e selecionar uma combinação de biomarcadores que fornece os valores de AUC mais altos para obter a assinatura de doença para a doença.
3. Método de acordo com a reivindicação 1, caracterizado pelo fato de que compreende as etapas de: processar as intensidades de sinal e, se obtidas, a uma ou mais propriedades ópticas para calcular concentrações de diferentes fenótipos de partícula na amostra; em que o processamento compreende efetuar transformação log das intensidades de sinal para produzir intensidades de sinal transformadas; e efetuar o binning das partículas com intensidades de sinal transformadas similares em regiões de interesse (ROI) para cada propriedade óptica onde cada ROI é considerada um fenótipo de partícula diferente; e usar essas concentrações de fenótipos de partícula e as características do paciente como as entradas para algoritmos de aprendizado de máquina para determinar a probabilidade de pacientes terem câncer de próstata clinicamente significativo.
4. Método de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que as etapas de binning e de transformação log ocorrem simultaneamente.
5. Método de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que as etapas de binning e de transformação log ocorrem separadamente.
6. Método de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que efetuar o binning das partículas compreende efetuar o binning usando um número estabelecido de bins por propriedade óptica.
7. Método de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que compreende uma pluralidade de ROIs.
8. Método de acordo com a reivindicação 1 ou 3, caracterizado pelo fato de que a determinação de fenótipos de partícula é realizada usando-se o algoritmo de Limiar de Fluorescência Dinâmica compreendendo: ajustar uma função de estimativa de densidade de kernel (KDE) aos dados de sinal de partícula para todas as partículas de cada biomarcador; identificar o valor de fluorescência F1 que atravessa a região mais alta no eixo Y (densidade de partícula) no gráfico de KDE para a população de partícula negativa do biomarcador; calcular inclinações na curva de KDE para várias intensidades de sinal fluorescente superiores diferentes de F1 para identificar um segundo valor de fluorescência, F2, que é onde a inclinação é principalmente negativa; calcular o valor de intensidade de fluorescência que separa as partículas positivas e negativas do biomarcador (Fs) que é igual a F1 + (2 * (F2 - F1)) + F3 onde F3 é um pequeno valor de intensidade de fluorescência arbitrário que é adicionado para garantir que as partículas negativas de biomarcador não sejam classificadas como partículas positivas de biomarcador; determinar o status de positividade do biomarcador de todas as partículas com base em se as partículas têm sinal de biomarcador acima (biomarcador positivo) ou abaixo (biomarcador negativo) de Fs; efetuar o binning de partículas em diferentes grupos de tamanhos estimados com base em suas intensidades de dispersão de luz; e determinar fenótipos de partículas por todas as combinações possíveis de positividade de biomarcador e grupos de dispersão de luz.
9. Método de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que o algoritmo de aprendizado de máquina é um algoritmo de árvore de decisão individual/ensacado/reforçado, algoritmo de máquina de vetor de suporte linear/quadrático/cúbico/Gaussiano, regressão logística, análise discriminante linear/quadrática/subespaço ou algoritmo de k- vizinhos mais próximos.
10. Método de acordo com a reivindicação 9, caracterizado pelo fato de que o algoritmo de aprendizado de máquina é um algoritmo de árvore de decisão reforçado.
11. Método de acordo com a reivindicação 10, caracterizado pelo fato de que o algoritmo de árvore de decisão reforçado é um algoritmo XGBoost.
12. Método de acordo com a reivindicação 11, caracterizado pelo fato de que o algoritmo de árvore de decisão reforçado de gradiente extremo compreende um conjunto de pelo menos 100 modelos com probabilidades de saída ponderadas para determinar uma pontuação preditiva.
13. Método de acordo com a reivindicação 12, caracterizado pelo fato de que a pontuação preditiva compreende uma pontuação de atendimento padrão.
14. Método de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o um ou mais biomarcadores são selecionados a partir do grupo que consiste em SLC45A3, FOLH1, GHSR, JAG1, CDH11, SELE, MERTK, GABRA2, TNFRSF10B, ABCC5, LETMD1, CADM1, EMP2, ENTPD2, ABCB11, IL17RA, RNF122, ST14, SYPL1, LDLRAD3, HTR1F, EMP1, TRPV6, KCNN2, CLCN6, SLC17A3, SLC44A4, SLC22A23, C9orf91, RDH10, PNKD e TMEM229.
15. Método de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que as características do paciente são selecionadas a partir do grupo que consiste em raça, histórico familiar de câncer de próstata, biópsia negativa anterior, exame retal digital, idade, PSA, pontuação de atendimento padrão, pontuação de ensaio de fluxo e uma pontuação combinada de ensaio de fluxo mais atendimento padrão.
16. Método de acordo com qualquer uma das reivindicações 1 a 15, caracterizado pelo fato de que a amostra é uma amostra de soro.
17. Método de acordo com qualquer uma das reivindicações 1 a 15, caracterizado pelo fato de que a amostra é uma amostra de plasma.
18. Método de acordo com qualquer uma das reivindicações 1 a 15, caracterizado pelo fato de que a amostra é uma amostra de urina.
19. Método de acordo com qualquer uma das reivindicações 1 a 15, caracterizado pelo fato de que a amostra é uma amostra de sêmen.
20. Método de acordo com a reivindicação 1 ou 3, caracterizado pelo fato de que a citometria de fluxo convencional pode ser usada em vez da citometria de microfluxo.
21. Método de acordo com a reivindicação 1 ou 3, caracterizado pelo fato de que é usada uma mistura de sondas que se ligam a biomarcadores específicos de tecido, tais como biomarcadores específicos de próstata, e/ou biomarcadores específicos de câncer, tais como grelina, e/ou biomarcadores específicos de resultado, tais como ácido polisiálico.
BR112020021779-4A 2018-04-27 2019-04-26 Método de identificação de uma assinatura de câncer de próstata clinicamente significativo usando citometria de microfluxo BR112020021779B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA3003032A CA3003032A1 (en) 2018-04-27 2018-04-27 Methods of diagnosing disease using microflow cytometry
CA3,003,032 2018-04-27
PCT/CA2019/050541 WO2019204940A1 (en) 2018-04-27 2019-04-26 Methods of diagnosing disease using microflow cytometry

Publications (2)

Publication Number Publication Date
BR112020021779A2 BR112020021779A2 (pt) 2021-02-23
BR112020021779B1 true BR112020021779B1 (pt) 2023-03-07

Family

ID=68293427

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020021779-4A BR112020021779B1 (pt) 2018-04-27 2019-04-26 Método de identificação de uma assinatura de câncer de próstata clinicamente significativo usando citometria de microfluxo

Country Status (9)

Country Link
US (1) US20210048383A1 (pt)
EP (1) EP3785014A4 (pt)
JP (1) JP7451424B2 (pt)
CN (1) CN112313497A (pt)
AU (1) AU2019259581A1 (pt)
BR (1) BR112020021779B1 (pt)
CA (2) CA3003032A1 (pt)
CL (1) CL2020002768A1 (pt)
WO (1) WO2019204940A1 (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7428505B2 (ja) 2019-11-19 2024-02-06 富士レビオ株式会社 コンピュータプログラム、学習モデル生成方法及び情報処理装置
CN113218848B (zh) * 2021-04-30 2022-08-12 天津深析智能科技发展有限公司 一种判断非特异细胞群的方法
CN113380318B (zh) * 2021-06-07 2023-04-07 天津金域医学检验实验室有限公司 人工智能辅助流式细胞术40cd免疫表型检测方法及系统
CN114018789A (zh) * 2021-10-08 2022-02-08 武汉大学 基于成像流式细胞检测和机器学习的急性白血病分型方法
CN115294191B (zh) * 2022-10-08 2022-12-27 武汉楚精灵医疗科技有限公司 基于电子内镜的标志物尺寸测量方法、装置、设备及介质

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6025128A (en) * 1994-09-29 2000-02-15 The University Of Tulsa Prediction of prostate cancer progression by analysis of selected predictive parameters
US6140065A (en) * 1997-09-05 2000-10-31 Dianon Systems, Inc. Methods for diagnosing benign prostatic diseases and prostatic adenocarcinoma using an algorithm
WO2001093113A1 (en) * 2000-03-28 2001-12-06 Dana-Farber Cancer Institute, Inc. Molecular database for antibody characterization
US20040265874A1 (en) * 2000-10-17 2004-12-30 Bio-Rad Laboratories, Inc. Pattern recognition method for diagnosis of systemic autoimmune diseases
US20050095611A1 (en) * 2003-05-02 2005-05-05 Chan Daniel W. Identification of biomarkers for detecting pancreatic cancer
US20060195266A1 (en) * 2005-02-25 2006-08-31 Yeatman Timothy J Methods for predicting cancer outcome and gene signatures for use therein
US20070009970A1 (en) * 2005-07-08 2007-01-11 Predicant Biosciences, Inc. Biological patterns for diagnosis and treatment of cancer
US20080133141A1 (en) * 2005-12-22 2008-06-05 Frost Stephen J Weighted Scoring Methods and Use Thereof in Screening
US20070255113A1 (en) * 2006-05-01 2007-11-01 Grimes F R Methods and apparatus for identifying disease status using biomarkers
US20080254482A1 (en) * 2006-11-22 2008-10-16 Invitrogen Corporation Autoimmune disease biomarkers
JP2010256132A (ja) * 2009-04-23 2010-11-11 Okayama Univ 糖尿病性腎症の進行度の検出方法及び糖尿病性腎症の進行度の診断キット並びに糖尿病性腎症の進行度の指標となる物質及びその選別方法
DK2681333T3 (en) * 2011-03-01 2018-01-08 Univ Yale EVALUATION OF RESPONSE TO GASTROENTEROPANCREATIC NEUROENDOCRINE NEOPLASIS (GEP-NENE) THERAPY
US20130095575A1 (en) * 2011-10-03 2013-04-18 The Board Of Trustees Of The Leland Stanford Junior University Methods for Fractionation, Analysis and Collection of Microvesicles From Patient Samples
MX366164B (es) * 2012-01-31 2019-07-01 Genomic Health Inc Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata.
WO2014028494A1 (en) * 2012-08-13 2014-02-20 The Regents Of The University Of California Detecting and treating liver damage
ES2730013T3 (es) * 2013-01-10 2019-11-07 Venatorx Pharmaceuticals Inc Inhibidores de betalactamasa
JP6700173B2 (ja) * 2013-09-24 2020-05-27 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア ターゲット検出方法及びシステム
MX2016009529A (es) * 2014-01-21 2016-10-17 Anjarium Biosciences Ag Hibridosomas, composiciones que comprenden los mismos, procesos para su produccion y usos de los mismos.
CA2969912A1 (en) * 2014-12-10 2016-06-16 Neogenomics Laboratories, Inc. Automated flow cytometry analysis method and system
CN107850600A (zh) * 2015-07-22 2018-03-27 美侬米克国际有限公司 用于前列腺疾病的生物标记物组合
WO2017053592A1 (en) * 2015-09-23 2017-03-30 The Regents Of The University Of California Deep learning in label-free cell classification and machine vision extraction of particles
EP3430137A4 (en) * 2016-03-18 2019-11-06 Caris Science, Inc. OLIGONUCLEOTIDE THONES AND USES THEREOF
CA3021036A1 (en) * 2016-04-15 2017-10-19 Octave Bioscience, Inc. Methods for assessment of multiple sclerosis activity
US10914748B2 (en) * 2016-09-08 2021-02-09 UNIVERSITé LAVAL Erythrocyte-derived extracellular vesicles as a biomarker for clinically assessing Parkinson's disease
WO2018075825A1 (en) * 2016-10-19 2018-04-26 Northwestern University Extracellular vesicle-based diagnostics and engineered exosomes for targeted therapeutics against cancer
US9934364B1 (en) * 2017-02-28 2018-04-03 Anixa Diagnostics Corporation Methods for using artificial neural network analysis on flow cytometry data for cancer diagnosis

Also Published As

Publication number Publication date
CA3003032A1 (en) 2019-10-27
BR112020021779A2 (pt) 2021-02-23
CA3050256A1 (en) 2019-10-27
EP3785014A4 (en) 2022-01-26
WO2019204940A1 (en) 2019-10-31
AU2019259581A1 (en) 2020-11-26
JP2021522503A (ja) 2021-08-30
CL2020002768A1 (es) 2021-05-28
EP3785014A1 (en) 2021-03-03
JP7451424B2 (ja) 2024-03-18
CA3050256C (en) 2023-09-05
US20210048383A1 (en) 2021-02-18
CN112313497A (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
JP7451424B2 (ja) マイクロフローサイトメトリーを使用して疾患を診断する方法
US20230304993A1 (en) Circulating tumor cell diagnostics for lung cancer
CN115323054A (zh) 一种表征疾病异质性的方法
US20230228755A1 (en) Methods of diagnosing and treating lung cancer
US20170059581A1 (en) Methods for diagnosis and prognosis of inflammatory bowel disease using cytokine profiles
US20230176058A1 (en) Markers for the early detection of colon cell proliferative disorders
KR20230079198A (ko) 결장 세포 증식성 장애의 조기 검출을 위한 마커
WO2021006279A1 (en) Data processing and classification for determining a likelihood score for breast disease
WO2019232361A1 (en) Personalized treatment of pancreatic cancer
Leelatian et al. High risk glioblastoma cells revealed by machine learning and single cell signaling profiles
US20230273211A1 (en) Method of diagnosing breast cancer
Futia et al. Statistical performance of image cytometry for DNA, lipids, cytokeratin, & CD45 in a model system for circulation tumor cell detection
JP2023551795A (ja) 非ヒトメタゲノム経路解析によるがん診断および分類
Futia Circulating Tumor Cells: Mathematical Theory of Detectability with Simulations and Experimental Results in a Model System
Moradi et al. Pathological distinction of prostate cancer tumors based on DNA microarray data

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 26/04/2019, OBSERVADAS AS CONDICOES LEGAIS