BR112020026133A2 - métodos e sistemas para monitorar a saúde e as doenças dos órgãos - Google Patents

métodos e sistemas para monitorar a saúde e as doenças dos órgãos Download PDF

Info

Publication number
BR112020026133A2
BR112020026133A2 BR112020026133-5A BR112020026133A BR112020026133A2 BR 112020026133 A2 BR112020026133 A2 BR 112020026133A2 BR 112020026133 A BR112020026133 A BR 112020026133A BR 112020026133 A2 BR112020026133 A2 BR 112020026133A2
Authority
BR
Brazil
Prior art keywords
cfdna
cell
copy number
biological sample
subject
Prior art date
Application number
BR112020026133-5A
Other languages
English (en)
Inventor
Yong Li
Original Assignee
Illumina, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina, Inc. filed Critical Illumina, Inc.
Publication of BR112020026133A2 publication Critical patent/BR112020026133A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/16Assays for determining copy number or wherein the copy number is of special importance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

MÉTODOS E SISTEMAS PARA MONITORAR A SAÚDE E AS DOENÇAS DOS ÓRGÃOS. Métodos, composições e sistemas são fornecidos para monitorar a saúde dos tecidos e órgãos. Os métodos, composições e sistemas fornecidos aqui extraem sinais de número de cópia específicos de locus de amostras de DNA livre de células (cfDNA) para identificar perfis de número de cópias de cfDNA específicos de tecido e permitir a quantificação de frações de tecido nas amostras de cfDNA.

Description

“MÉTODOS E SISTEMAS PARA MONITORAR A SAÚDE E AS DOENÇAS DOS ÓRGÃOS” RELATÓRIO DESCRITIVO CAMPO
[001] Sistemas, métodos e composições fornecidos na presente invenção se referem a métodos para extrair sinais de número de cópias de cfDNA específicos de locus de uma amostra para monitoramento de saúde, diagnóstico ou perfil e análise celular. Especificamente, os sistemas, métodos e composições se referem a métodos para analisar o DNA livre de células (cfDNA) em uma amostra para determinar uma contribuição relativa de tecido ou tipo de célula para o cfDNA total em uma amostra. Os métodos fornecidos na presente invenção utilizam a cobertura de cfDNA específica da sequência, intensidade ou sinais de número de cópias e não envolvem a determinação direta do estado de metilação no cfDNA.
ANTECEDENTES
[002] Nos últimos anos, o DNA livre de células (cfDNA) surgiu como uma fonte promissora para a descoberta de biomarcadores para o diagnóstico de doenças. Em particular, o cfDNA fetal e as células fetais intactas podem entrar na circulação sanguínea materna. Em consequência, a análise desse material genético fetal pode permitir o teste pré-natal não invasivo precoce (NIPT - “non-invasive prenatal testing”). Um desafio chave na realização do NIPT no cfDNA fetal é que ele é tipicamente misturado com o cfDNA materno e, portanto, a análise do cfDNA é dificultada pela necessidade de contabilizar o sinal genotípico materno. Além disso, a análise de cfDNA é útil como ferramenta de diagnóstico para detecção e diagnóstico de câncer.
[003] Os protocolos atuais para a preparação de uma biblioteca de sequenciamento a partir de uma amostra de ácido nucleico livre de células (por exemplo, uma amostra de plasma) geralmente envolvem o isolamento de cfDNA para a preparação de uma biblioteca de sequenciamento para análise. No entanto, os métodos existentes de análise de cfDNA, seja para NIPT ou aplicações oncológicas, dependem da extração de um sinal de alterações genéticas do sequenciamento de cfDNA e, portanto, são limitados a NIPT e oncologia.
SUMÁRIO
[004] A presente divulgação se refere a sistemas, métodos e composições para analisar o cfDNA em uma amostra para extrair sinais de número de cópias específicos do locus de cfDNA para quantificar frações específicas de tecido e/ou células de cfDNA na amostra.
[005] Algumas modalidades fornecidas aqui se referem a métodos de análise de DNA livre de células (cfDNA) em uma amostra biológica. Em algumas modalidades, a amostra é de um sujeito humano com potencial morte celular ou tecido ou dano por doença. Em algumas modalidades, a morte celular ou dano a tecido/órgão incluem trauma contuso, como traumatismo craniano, toxicidade de fármacos no fígado ou rim, doenças que envolvem danos a órgãos, como danos cardíacos em cardiomiopatias, danos renais em doenças renais, danos ao fígado no fígado doenças ou morte de células beta no diabetes. Em algumas modalidades, a morte ou dano celular a tecido/órgão incluem câncer ou gravidez, para os quais ocorrem quantidades excessivas de morte celular ou renovação celular.
[006] Em algumas modalidades, os métodos incluem a obtenção de uma amostra biológica compreendendo cfDNA, em que o cfDNA compreende uma pluralidade de fragmentos de cfDNA, cada fragmento correspondendo a um ou mais tecidos ou tipos de células; quantificar cada fragmento de cfDNA para gerar um perfil de cfDNA de todo o genoma ou alvo (específico do locus), em que o perfil de cfDNA de todo o genoma compreende uma pluralidade de sinais de número de cópia, cada sinal de número de cópia (incluindo cobertura ou intensidade) correspondendo a um fragmento de cfDNA; e comparar o perfil de sinal de número de cópia de cfDNA de todo o genoma a uma coleção de perfis de sinal de número de cópia de referência para determinar ou quantificar fontes de dano celular, dano ao tecido ou dano ao órgão. Em algumas modalidades, o método inclui opcionalmente o enriquecimento de cfDNA por meio de pull down ou PCR da amostra para fornecer cfDNA enriquecido.
[007] Algumas modalidades fornecidas na presente invenção se referem a métodos de monitoramento do progresso de tecido ou dano de órgão em um sujeito. Em algumas modalidades, os métodos incluem a obtenção de uma amostra biológica do sujeito, em que a amostra biológica compreende DNA livre de células (cfDNA); quantificar o cfDNA na amostra para obtenção de um perfil de sinal de número de cópia de cfDNA de todo o genoma compreendendo uma pluralidade de sinais de número de cópia, cada sinal de número de cópia correspondendo a um fragmento de cfDNA de um tipo de célula ou tipo de tecido específico; e comparar o perfil de sinal de número de cópias de cfDNA de todo o genoma com uma coleção de perfis de sinal de número de cópias conhecidos de indivíduos saudáveis ou tipos de tecidos puros. Em algumas modalidades, a quantificação é realizada sem PCR ou enriquecimento. Em algumas modalidades, uma diferença de sinal de número de cópia na amostra em comparação com os sinais de número de cópia conhecidos se correlaciona a uma condição no sujeito relacionada a tecido ou dano de órgão.
BREVE DESCRIÇÃO DOS DESENHOS
[008] A FIG. 1 ilustra um gráfico que representa o tecido renal e perfis de sinal de sangue de cfDNA ao longo de localizações de cromossomos alvos. O sinal específico tipo de tecido/célula é extraído usando métodos de fatoração de matriz não negativa a partir de sinais de número de cópias de cfDNA de plasma de pacientes com doença renal obtidos a partir do sequenciamento de cfDNA. As regiões alvo são testadas através de PCR multiplex em amostras de cfDNA.
[009] A FIG. 2 representa um gráfico que mostra os resultados para prever a insuficiência renal em pacientes com base nas quantificações da fração de cfDNA do rim no plasma sanguíneo.
[0010] As FIGs. 3A e 3B representam gráficos para o padrão de curso do tempo da proporção de DNA do tecido renal em função do tempo em um conjunto de receptores de transplante renal. A FIG. 3A mostra a fração renal estimada do cfDNA de rim do doador e a FIG. 3B mostra a fração renal estimada do cfDNA do rim do próprio paciente. Ambas as FIGs. 3A e 3B mostram mudanças estatisticamente significativas ao longo do tempo, e o padrão de mudanças temporais é consistente com os procedimentos biomédicos conhecidos para esses pacientes.
[0011] A FIG. 4 representa a fração componente do cfDNA de cólon em várias doenças, em que a fração para a doença de Crohn foi significativamente maior do que em outras doenças analisadas.
[0012] A FIG. 5 representa um diagrama de blocos que ilustra um processo para avaliar as amostras de cfDNA para quantificação de cfDNA de tecido.
DESCRIÇÃO DETALHADA
[0013] Na seguinte descrição detalhada, é feita referência aos desenhos anexos, os quais fazem parte deste documento. Nos desenhos, os símbolos semelhantes normalmente identificam componentes semelhantes, a menos que o contexto indique o contrário. As modalidades ilustrativas descritas na descrição detalhada, desenhos e Reivindicações não se destinam a ser limitantes. Outras modalidades podem ser utilizadas, e outras alterações podem ser feitas, sem se afastar do espírito ou escopo do assunto aqui apresentado. Será prontamente entendido que os aspectos da presente divulgação, como geralmente descritos na presente invenção e ilustrados nas Figuras, podem ser dispostos, substituídos, combinados, separados e projetados em uma ampla variedade de configurações diferentes, todas as quais são explicitamente contempladas aqui.
[0014] As modalidades dos sistemas, métodos e composições aqui fornecidas se referem à análise de fragmentos de ácido nucleico em uma amostra para determinar quantos fragmentos de ácido nucleico se originam de várias partes do genoma de várias partes de um corpo de um sujeito. Mais particularmente, os sistemas, métodos e composições fornecidos na presente invenção se referem à análise de populações de cfDNA em uma amostra para determinar uma quantidade relativa de cfDNA de várias partes de um genoma de várias partes de um corpo de um sujeito. Os sistemas, métodos e composições, portanto, se referem à quantificação da origem do tecido de cfDNA e podem ser usados em amplas aplicações envolvendo morte celular elevada ou alterações genéticas elevadas, incluindo, por exemplo, o monitoramento da progressão da doença, monitoramento da saúde de órgãos ou tecidos, diagnostico ou detecção da doença, determinação da eficácia ou toxicidade do medicamento ou monitoramento da saúde do recém-nascido.
[0015] Em uma modalidade, uma amostra biológica que é conhecida por transportar cfDNA, tal como plasma sanguíneo, é retirada de um sujeito suspeito de ter um tipo específico de dano a um órgão ou renovação celular elevada. Uma análise da sequência do genoma completo (WGS -
“whole genome sequence”) é realizada no cfDNA na amostra biológica para identificar regiões genômicas que podem mostrar mais ou menos cfDNA do que em um sujeito típico. Por exemplo, se o sujeito sofre de dano hepático ou insuficiência renal, pode-se esperar ver mais cfDNA derivado do fígado ou rim em comparação com uma população de controle de linha de base. Uma vez que a análise de sequência é concluída, ela é comparada por meio de uma variedade de diferente aprendizagem de máquina, inteligência artificial ou outros protocolos para identificar diferenças no cfDNA do sujeito para um controle de linha de base. Em uma modalidade, parte da análise pode incluir a quantificação das frações relativas de cfDNA de diferentes tecidos do sujeito e controles normais de linha de base. Em algumas modalidades, a quantificação pode incluir um ou ambos dentre determinar o conjunto de perfis de tecido de referência e quantificar as frações de cfDNA de tecido em uma amostra de cfDNA com base em dados de cobertura de cfDNA de todo o genoma.
[0016] Por exemplo, para perfis de número de cópias de cfDNA de todo o genoma ou alvos para um conjunto de amostras normais e/ou doentes, um conjunto de perfis de cobertura de cfDNA de referência é derivado e a combinação linear resultante reconstrói os sinais de número de cópias de cfDNA de amostras normais e/ou doentes. Cada perfil de referência corresponde a um tipo de célula ou tecido específico. Usando métodos de aprendizagem de máquina não supervisionados, como fatoração de matriz não negativa, os sinais de cfDNA de indivíduos podem ser decompostos e os perfis específicos de tecido ou células de referência extraídos, gerando perfis de referência de linha de base. Dependendo do tipo de fluido corporal, os tipos de células ou tecidos dominantes podem ser diferentes. Por exemplo, para o plasma, os perfis de sinal dos glóbulos brancos seriam os principais contribuintes. Uma análise exemplificadora de perfis de sinal de sangue e de tecido renal extraído de cfDNA ao longo de localizações de cromossomos alvos é representada na Figura 1.
[0017] Os métodos tradicionais de análise de cfDNA requerem detecção específica de sequência, o que limita a sensibilidade do ensaio e não fornece determinações precisas, confiáveis ou reproduzíveis de uma contribuição relativa de cada tipo de tecido no sujeito para o cfDNA total em uma amostra biológica. Por exemplo, a abordagem tradicional pode não determinar quanto do cfDNA na amostra veio do pulmão, baço, fígado, rim, etc. em comparação com uma amostra normal. Os métodos anteriores de sequenciamento de cfDNA eram para aplicações relacionadas com o monitoramento do estado de tecidos ou canceres transplantados. No entanto, tais métodos requerem uma análise com base em alelo, que requer o sequenciamento e a detecção de variações únicas de nucleotídeo entre o doador e hospedeiro ou tumor e normal. Não existe nenhum método que possa quantificar o estado de saúde do próprio órgão de um sujeito a partir de sequenciamento de cfDNA, hibridização de matriz ou métodos semelhantes.
[0018] Além disso, os métodos tradicionais de monitoramento da saúde de órgãos ou tecidos são realizados por meio de biópsia de tecido. A biópsia de tecido pode ser usada para examinar e determinar a presença ou extensão de uma doença com base em um tecido específico e pode ser realizada por extração de células ou tecido de uma amostra de biópsia de tecido retirada de um sujeito. No entanto, esses métodos são invasivos, demorados, caros e geralmente apresentam riscos aumentados de consequências indesejadas à saúde.
[0019] Os sistemas, métodos e composições aqui descritos, em contraste, se referem à determinação de uma quantidade de fragmentos de cfDNA que se originam de vários tecidos. Além disso, os presentes sistemas, métodos e composições são não invasivos e podem fornecer uma determinação imediata da dinâmica da morte celular ou dano ao tecido. Os sistemas, métodos e composições fornecidos aqui podem permitir a detecção precoce de uma variedade de indicações antes que sintomas clínicos ou deterioração funcional do corpo de um sujeito sejam encontrados. Além disso, esses métodos não requerem a seleção de um órgão-alvo especificamente, mas permitem ao cuidador descobrir qual órgão pode estar se deteriorando, o que não é possível usando a biópsia de tecido como método de triagem. Da mesma forma, os métodos, sistemas e composições podem permitir a quantificação e monitoramento de vários órgãos ao mesmo tempo, em uma única análise, com menos viés de amostragem do que os métodos de biópsia de tecido.
[0020] A menos que indicado de outra forma, a prática do método e o sistema divulgados na presente invenção envolve técnicas e aparelhos convencionais comumente usados em biologia molecular, microbiologia, purificação de proteínas, engenharia de proteínas, sequenciamento de proteínas e DNA e campos de DNA recombinante, que estão dentro da habilidade na técnica. Tais técnicas e aparelhos são conhecidos pelos versados na técnica e são descritos em vários textos e obras de referência (Ver, por exemplo, Sambrook et al., “Molecular Cloning: A Laboratory Manual,” Terceira Edição (Cold Spring Harbor), [2001]); e Ausubel et al., “Current Protocols in Molecular Biology” [1987]).
[0021] As faixas numéricas incluem os números que definem a faixa. Pretende-se que cada limitação numérica máxima fornecida ao longo deste Relatório Descritivo inclua cada limitação numérica inferior, como se tais limitações numéricas inferiores fossem expressamente escritas aqui. Cada limitação numérica mínima fornecida ao longo deste Relatório Descritivo incluirá todas as limitações numéricas superiores, como se tais limitações numéricas superiores fossem expressamente escritas aqui. Cada faixa numérica dado ao longo deste Relatório Descritivo irá incluir cada faixa numérica mais estreita que cai dentro de um faixa numérica mais ampla,
como se essas faixas numéricas mais estreitas fossem todas expressamente escritas aqui.
[0022] A menos que definido de outra forma na presente invenção, todos os termos técnicos e científicos usados na presente invenção têm o mesmo significado como comumente entendido por um versado na técnica. Vários dicionários científicos que incluem os termos incluídos na presente invenção são bem conhecidos e estão disponíveis para aqueles na técnica. Embora quaisquer métodos e materiais semelhantes ou equivalentes aos aqui descritos encontrem uso na prática ou teste das modalidades aqui divulgadas, alguns métodos e materiais são descritos.
[0023] Os termos definidos imediatamente abaixo são descritos de forma mais completa por referência ao Relatório Descritivo como um todo. Deve ser entendido que esta divulgação não está limitada à metodologia, protocolos e reagentes específicos descritos, uma vez que estes podem variar, dependendo do contexto em que são usados pelos versados na técnica. Como usado na presente invenção, os termos singulares “um”, “uma” e “o/a” incluem a referência no plural, a menos que o contexto indique claramente o contrário.
[0024] Salvo indicação em contrário, os ácidos nucleicos são escritos da esquerda para a direita na orientação 5’ para 3’ e as sequências de aminoácidos são escritas da esquerda para a direita na orientação amino para carboxi, respectivamente.
[0025] Como usado na presente invenção, “polinucleotídeo” e “ácido nucleico” podem ser usados indistintamente e podem se referir a uma forma polimérica de nucleotídeos de qualquer comprimento, seja ribonucleotídeos ou desoxirribonucleotídeos. Assim, esses termos incluem DNA ou RNA de fita simples, dupla ou múltipla. Exemplos de polinucleotídeos incluem um gene ou fragmento de gene, DNA livre de células (cfDNA), DNA genômico total, DNA genômico, epigenômico,
fragmento de DNA genômico, éxon, íntron, RNA mensageiro (mRNA), RNA regulatório, RNA de transferência, RNA ribossomal, RNA não codificador (ncRNA), como RNA de interação com PIWI (piRNA), RNA de interferência pequeno (siRNA) e RNA não codificante longo (lncRNA), hairpin pequeno (shRNA), RNA nuclear pequeno (snRNA), micro RNA (miRNA), RNA nucleolar pequeno (snoRNA) e RNA viral, ribozima, cDNA, polinucleotídeo recombinante, polinucleotídeo ramificado, plasmídeo, vetor, DNA isolado de qualquer sequência, RNA isolado de qualquer sequência, sonda de ácido nucleico, primer ou cópia amplificada de qualquer um dos acima expostos. Um polinucleotídeo pode incluir nucleotídeos modificados, tais como nucleotídeos metilados e análogos de nucleotídeos, incluindo nucleotídeos com bases não naturais, nucleotídeos com bases naturais modificadas, tais como aza- ou desaza-purinas. Um polinucleotídeo pode ser composto por uma sequência específica de quatro bases de nucleotídeo: adenina (A); citosina (C); guanina (G); e timina (T). O uracil (U) também pode estar presente, por exemplo, como um substituto natural para a timina quando o polinucleotídeo é RNA. O uracil também pode ser usado no DNA. O termo “sequência de ácido nucleico” pode se referir à representação alfabética de um polinucleotídeo ou qualquer molécula de ácido nucleico, incluindo bases naturais e não naturais.
[0026] O termo DNA doador (dDNA) se refere a moléculas de DNA originárias de células de um doador de um transplante. Em várias implementações, o dDNA é encontrado em uma amostra obtida de um receptor do doador que recebeu um tecido ou órgão transplantado do doador.
[0027] O DNA livre de células circulante ou simplesmente o DNA livre de células (cfDNA) são fragmentos de DNA que não estão confinados nas células e estão circulando livremente na corrente sanguínea ou em outros fluidos corporais. Sabe-se que o cfDNA tem origens diferentes, em alguns casos de DNA de tecido de doado circulando no sangue de um doado, em alguns casos de células tumorais ou células afetadas por tumor, em outros casos de DNA fetal circulando no sangue materno. Outros exemplos não limitativos incluem cfDNA originado de tecido ou órgãos nativos do mesmo organismo, como rim, pulmão, cérebro e coração, por exemplo. Os níveis de cfDNA específico do tecido podem aumentar ou diminuir quando ocorre morte celular, dano ao tecido ou órgão, incluindo, por exemplo, trauma contuso, como traumatismo craniano, toxicidade por fármacos no fígado ou rim, doenças que envolveram danos aos órgãos, como danos ao coração em cardiomiopatias, dano renal em doença renal, dano hepático em doença hepática e morte de células beta em diabetes. Os exemplos também incluem câncer e gravidez, para os quais ocorre uma quantidade excessiva de morte celular ou renovação celular.
[0028] Em geral, os cfDNAs são fragmentados e incluem apenas uma pequena parte de um genoma, que pode ser diferente do genoma do indivíduo a partir do qual o cfDNA é obtido. O mecanismo exato da biogênese do cfDNA é desconhecido. Geralmente, acredita-se que o cfDNA seja proveniente da morte celular apoptótica ou necrótica, no entanto, também há evidências que sugerem liberação de cfDNA ativa de células vivas. Geralmente, o cfDNA se origina de diversos tipos de células e, dependendo da origem da célula e do estado de saúde, o perfil de cfDNA do genoma de um sujeito pode variar.
[0029] O termo DNA genômico não circulante (gDNA) ou DNA celular é usado para se referir a moléculas de DNA que estão confinadas em células e frequentemente incluem um genoma completo.
[0030] Uma distribuição binomial é uma distribuição de probabilidade discreta do número de sucessos em uma sequência de n experimentos independentes, cada um fazendo uma pergunta sim-não, e cada um com seu próprio resultado de valor booleano: uma variável aleatória contendo um único bit de informação: positivo (com probabilidade p) ou negativo (com probabilidade q = 1 - p). Para um ensaio único, ou seja, n = 1, a distribuição binomial é uma distribuição de Bernoulli. A distribuição binomial é frequentemente usada para modelar o número de sucessos em uma amostra de tamanho n desenhada com substituição de uma população de tamanho N. Se a variável aleatória X segue a distribuição binomial com parâmetros n ∈ ℕ e p ∈ [0,1], a variável aleatória X é escrita como X ~ B(n, p).
[0031] A distribuição de Poisson, denotada como Pois() aqui, é uma distribuição de probabilidade discreta que expressa a probabilidade de um determinado número de eventos ocorrer em um intervalo fixo de tempo e/ou espaço se esses eventos ocorrerem com uma taxa média conhecida e independentemente do tempo desde o último evento. A distribuição de Poisson também pode ser usada para o número de eventos em outros intervalos especificados, como distância, área ou volume. A probabilidade de observar eventos k em um intervalo de acordo com uma distribuição de Poisson é dada pela equação: (K eventos no intervalo) onde λ é o número médio de eventos em um intervalo ou taxa de evento, também chamado de parâmetro de taxa e é 2,71828, o número de Euler, ou a base dos logaritmos naturais, k assume os valores 0, 1, 2, ..., e k! é o fatorial de k.
[0032] A distribuição gama é uma família de dois parâmetros de distribuições de probabilidade contínuas. Existem três parametrizações diferentes em uso comum: com um parâmetro de forma k e um parâmetro de escala θ; com um parâmetro de forma α = k e um parâmetro de escala inversa β = 1/θ, chamado de parâmetro de taxa; ou com um parâmetro de forma k e um parâmetro médio μ = k/β. Em cada uma dessas três formas, ambos os parâmetros são números reais positivos. A distribuição gama é a distribuição de probabilidade máxima de entropia para uma variável aleatória X para a qual E[X] = kθ = α/β é fixo e maior que zero, e E[ln(X)] = ψ(k) + ln(θ) = ψ(α) - ln(β) é fixo (ψ é a função digama).
[0033] O termo “amostra” aqui se refere a uma amostra tipicamente derivada de um fluido biológico, célula, tecido, órgão ou organismo, compreendendo um ácido nucleico ou uma mistura de ácidos nucleicos e pode ser referido na presente invenção como uma amostra biológica. Essas amostras incluem, mas sem limitação a escarro/fluido oral, fluido amniótico, sangue, uma fração de sangue ou amostras de biópsia por agulha fina (por exemplo, biópsia cirúrgica, biópsia por agulha fina, etc.), urina, fluido peritoneal, fluido pleural, e similar. Embora a amostra seja frequentemente retirada de um sujeito humano (por exemplo, paciente), os ensaios podem ser usados em amostras de qualquer mamífero, incluindo, mas sem limitação, cães, gatos, cavalos, cabras, ovelhas, gado, porcos, etc.. A amostra pode ser usada diretamente conforme obtida da fonte biológica ou após um pré-tratamento para modificar o caráter da amostra. Por exemplo, tal pré-tratamento pode incluir a preparação de plasma de sangue, diluição de fluidos viscosos e assim por diante. Os métodos de pré-tratamento também podem envolver, mas sem limitação, filtração, precipitação, diluição, destilação, mistura, centrifugação, congelamento, liofilização, concentração, amplificação, fragmentação de ácido nucleico, inativação de componentes interferentes, adição de reagentes, lise, etc.. Se tais métodos de pré-tratamento forem empregados em relação à amostra, tais métodos de pré-tratamento são tipicamente tais que o(s) ácido(s) nucleico(s) de interesse permanecem na amostra de teste, às vezes, a uma concentração proporcional àquela em uma amostra de teste não tratada
(por exemplo, ou seja, uma amostra que não é submetida a qualquer método(s) de pré-tratamento). Essas amostras “tratadas” ou “processadas” ainda são consideradas amostras de “teste” biológicas com relação aos métodos descritos na presente invenção.
[0034] O termo “fluido biológico” aqui se refere a um líquido retirado de uma fonte biológica e inclui, por exemplo, sangue, soro, plasma, escarro, fluido de lavagem, fluido cerebroespinhal, urina, sêmen, suor, lágrimas, saliva e semelhantes. Como usado na presente invenção, os termos “sangue”, “plasma” e “soro” abrangem expressamente frações ou partes processadas das mesmas. Da mesma forma, quando uma amostra é retirada de uma biópsia, swab, esfregaço, etc., a “amostra” engloba expressamente uma fração processada ou parte derivada da biópsia, swab, esfregaço, etc.
[0035] A amostra pode ser obtida de um sujeito, em que é desejável monitorar a saúde do tecido ou órgão, diagnosticar ou detectar uma doença ou, de outra forma, analisar uma amostra de um sujeito. Como usado na presente invenção, um “sujeito” se refere a um animal que é o objeto de tratamento, observação ou experimento. “Animal” inclui vertebrados e invertebrados de sangue frio e quente, como peixes, crustáceos, répteis e, em particular, mamíferos. “Mamífero” inclui, sem limitação, camundongos, ratos, coelhos, porquinhos-da-índia, cães, gatos, ovelhas, cabras, vacas, cavalos, primatas, como macacos, chimpanzés e símios e, em particular, humanos. O sujeito pode ser um sujeito com ou suspeito de ter câncer, um distúrbio genético, dano a órgãos ou tecidos, ou outra doença ou distúrbio que pode ser monitorado. Em algumas modalidades, o sujeito é um receptor do doador de órgão, como um sujeito que é o receptor de um transplante de órgão. Em algumas modalidades, o sujeito tem dano potencial ao órgão devido a uma doença crônica ou trauma contuso.
[0036] As modalidades dos sistemas, métodos e composições se referem à obtenção de uma amostra de um sujeito e monitoramento, detecção, avaliação, predição ou diagnóstico de uma doença ou distúrbio no sujeito, monitoramento de tecido ou dano de órgão em um sujeito, ou avaliação ou quantificação de origem do tecido de ácido nucleico. As doenças podem incluir, por exemplo, cânceres, distúrbios genéticos, distúrbios específicos de órgãos ou outras doenças ou distúrbios que são caracterizados por cfDNA aumentado em diferentes regiões genômicas com base na origem do tecido e/ou tipo de doença.
[0037] Como usado na presente invenção, o termo genoma de referência se refere a qualquer sequência de genoma conhecida particular, parcial ou completa, de qualquer organismo que pode ser usado para fazer referência a sequências identificadas de um sujeito. Um “genoma” se refere à informação genética completa de um organismo ou vírus, expressa em sequências de ácido nucleico.
[0038] Algumas modalidades dos métodos, sistemas e composições aqui fornecidos se referem a quantificação simultaneamente das contribuições relativas de vários tecidos ou tipos de células em uma amostra de cfDNA, com base em sinais de número de cópias de cfDNA (CN) de todo o genoma. Dependendo da aplicação pretendida, a amostra de cfDNA pode ser derivada de uma amostra biológica, por exemplo, de sangue, plasma, urina, líquido cefalorraquidiano ou qualquer outro tipo de fluido corporal humano. A cobertura de cfDNA de todo o genoma, número de cópias ou sinais de intensidade pode ser obtida por meio de contagem de moléculas de DNA com base em sequenciamento, como por quaisquer tecnologias de sequenciamento ou por tecnologias de quantificação de número de cópias de DNA com base em hibridização. Em algumas modalidades, o cfDNA pode ser submetido a PCR alvo ou um ensaio de enriquecimento ou amplificações amplas do genoma antes das medições de sinal de número de cópias. Em qualquer uma das modalidades, vários métodos de amplificação podem ser usados, incluindo, por exemplo, amplificação não específica de todo o genoma, por exemplo, métodos de amplificação do genoma inteiro (WGA), como MDA, ou amplificação por PCR altamente alvo de alguns ou de uma única região selecionada de, por exemplo, algum kb.
[0039] Dada a cobertura de cfDNA de uma amostra biológica ou um conjunto de amostras biológicas de qualquer um dos sistemas ou métodos aqui descritos, as frações relativas de diferentes tecidos podem ser quantificadas. Em algumas modalidades, a quantificação pode incluir um ou ambos dentre determinar o conjunto de perfis de tecido de referência e quantificar uma fração de cfDNA de tecido em uma amostra de cfDNA com base em dados de cobertura de cfDNA em todo o genoma ou alvos.
[0040] Por exemplo, para perfis de número de cópias de cfDNA de todo o genoma para um conjunto de amostras normais, um conjunto de perfis de cobertura de cfDNA de referência é derivado de modo que as combinações lineares resultantes correspondam aos perfis de número de cópias de cfDNA das amostras normais. Embora um perfil de número de cópias de cfDNA do sangue corresponda a uma mistura de sinais de vários tipos de células ou tecidos, um perfil de referência corresponde a um tipo de célula ou tecido específico. Usando métodos de aprendizagem de máquina não supervisionados, como fatoração de matriz não negativa, um conjunto de sinais de cfDNA de plasma pode ser decomposto e os perfis de referência extraídos, gerando assim um conjunto de perfis de referência de linha de base. Dependendo do tipo de fluido corporal, os tipos de células ou tecidos dominantes podem ser diferentes. Por exemplo, para leucócitos de plasmas, os perfis de sinal seriam os principais contribuintes.
[0041] Da mesma forma, a partir dos perfis de número de cópias de cfDNA do genoma para um conjunto de amostras de pacientes com danos em órgãos conhecidos ou uma doença específica associada a danos em órgãos, a aprendizagem de máquina semissupervisionada pode ser empregada para extrair os perfis de cfDNA específicos de tecido ou doença, além dos perfis de referência de linha de base. Os perfis de referência de linha de base obtidos podem ser usados para contabilizar a parte de linha de base do sinal de cfDNA das amostras de pacientes, e perfis de referência de tecido adicionais são então derivados dos sinais de cobertura de cfDNA não contabilizados.
[0042] A abordagem não supervisionada e semissupervisionada pode ser ainda acoplada a um método de aprendizagem de máquina supervisionada com base em rede neural profunda para perfis de cobertura de cfDNA previstos para tipos de tecido ou células para os quais o acesso a amostras de cfDNA relevantes é limitado. O método de aprendizagem profunda pode ser usado para prever o perfil de cobertura de cfDNA para um tipo de célula, dados os sinais epigenéticos para o tipo de célula dado como recursos de entrada, incluindo, por exemplo, sinais de acessibilidade de DNase, sinais de marca de histona e sinais de metilação de DNA genômico.
[0043] Como consequência, em algumas modalidades, um conjunto de perfis de tecido de referência é usado para quantificação de tecido em amostras de interesse. Para um perfil de cobertura de cfDNA, as frações de tecido podem ser quantificadas projetando linearmente os perfis de cobertura de cfDNA observados nos perfis de referência conhecidos.
[0044] As modalidades dos sistemas, métodos e composições fornecidos na presente invenção podem incluir amplas aplicações, incluindo, por exemplo, monitoramento de saúde de órgãos, monitoramento de toxicidade de fármacos, medicina esportiva, diagnóstico e detecção de doenças, oncologia, teste pré-natal não invasivo (NIPT - “non-invasive prenatal testing”) e monitoramento de saúde neonatal ou pesquisa de patologia de doenças.
[0045] No campo do monitoramento da saúde do órgão, as modalidades dos sistemas, métodos e composições podem ser usadas, por exemplo, para monitorar vários órgãos, como, por exemplo, o rim, pulmão ou coração, e para pré e pós monitoramento e diagnóstico de doenças a partir de um único exame de sangue. As modalidades aqui descritas incluem um teste de sangue universal de baixo custo que tem como alvo aos principais órgãos, permitindo a detecção precoce e prevenção de falhas graves de órgãos, incluindo estratégia de monitoramento para populações de alto risco. Por exemplo, o monitoramento da saúde renal para pacientes com lúpus ou diabetes; monitoramento da saúde cardíaca para indivíduos com histórico familiar de cardiomiopatia; ou monitoramento de saúde de múltiplos órgãos para pacientes com sepse. Além disso, a gravidade do trauma (lesão contusa), por exemplo, na cabeça ou na região do tórax/pulmão, não é fácil de acessar, a menos que sejam observadas consequências funcionais graves. As modalidades dos sistemas, métodos e composições fornecidos na presente invenção permitem o monitoramento quantitativo da gravidade do trauma e informam as intervenções médicas iniciais.
[0046] No campo do monitoramento da toxicidade de fármacos, as modalidades dos sistemas, métodos e composições podem ser usadas, por exemplo, para monitorar a toxicidade hepática ou renal de um medicamento prescrito em um determinado paciente, permitindo assim a medicina personalizada e o ajuste em tempo real aos regimes de medicação para pacientes individuais ou medição da toxicidade hepática ou renal de novos fármacos em ensaios clínicos.
[0047] No campo da medicina esportiva, as modalidades dos sistemas, métodos e composições podem ser usadas, por exemplo, para monitorar a magnitude dos danos corporais devido ao treinamento intenso, permitindo assim o ajuste racional do cronograma de treinamento do atleta e prevenindo a síndrome do treinamento excessivo. O DNA livre de células aumenta com o exercício. Para os atletas, a síndrome do treinamento excessivo (OTS - “over training syndrome”) é uma condição de ocorrência frequente quando eles pressionam constantemente ao limite. Depois que a OTS ocorre, pode levar dias a semanas para se recuperar ou, em alguns casos, os atletas podem nunca se recuperar. Uma abordagem para quantificação de cfDNA muscular e, portanto, a detecção e prevenção precoce de OTS seria de alto valor para o atleta atingir o resultado de treinamento ideal.
[0048] No campo do diagnóstico e detecção de doenças, as modalidades dos sistemas, métodos e composições podem ser usadas, por exemplo, para monitorar ou analisar doenças que são difíceis de diagnosticar ou são frequentemente mal diagnosticadas, por exemplo, síndrome do intestino irritável, doença inflamatória do intestino, doença celíaca, fibromialgia, artrite reumatoide, esclerose múltipla, lúpus, síndrome dos ovários policísticos, apendicite, doença de Crohn, colite ulcerosa ou miopatias idiopáticas. Algumas dessas doenças geralmente só são diagnosticadas de forma confiável com biópsia de tecido. Muitas doenças são atualmente diagnosticadas por biópsia de tecido, como a doença celíaca. Existem muitas doenças que não têm marcadores de diagnóstico existentes ou carecem de bons marcadores de diagnóstico, por exemplo, a síndrome da fadiga crônica. As modalidades dos sistemas, métodos e composições aqui fornecidas permitem monitorar, detectar, avaliar, prever ou diagnosticar essas e outras doenças e distúrbios. Por exemplo, as modalidades dos sistemas e métodos podem ser usadas para determinar frações de um determinado componente de tecido para identificar uma determinada doença. Conforme mostrado na Figura 4, por exemplo, uma fração de componente do cfDNA do cólon é mostrada em várias doenças, onde a fração para a doença de Crohn é significativamente maior do que em outras doenças analisadas.
[0049] No campo da oncologia, as modalidades dos sistemas, métodos e composições podem ser usadas, por exemplo, para a quantificação da origem do tecido de cfDNA e determinação da origem do tecido canceroso, bem como das mutações de um único ensaio de sequência do genoma completo de cfDNA (WGS) . Uma WGS inclui toda a sequência (incluindo todos os cromossomos) do genoma da linhagem germinativa de um indivíduo.
[0050] No campo do NIPT e do monitoramento da saúde do recém- nascido, as modalidades dos sistemas, métodos e composições podem ser usadas, por exemplo, para determinar e monitorar o estado de saúde materna e medir a reação imunológica materna em relação ao feto. Algumas modalidades se referem à previsão de aborto espontâneo e parto prematuro. Algumas modalidades estão relacionadas ao monitoramento, investigação, diagnóstico ou previsão de condições de saúde do recém- nascido, como prematuridade de órgãos, icterícia, defeitos genéticos ou outras condições de saúde do recém-nascido, por meio do sequenciamento de cfDNA de plasma do recém-nascido.
[0051] No campo da pesquisa de patologia de doenças, as modalidades dos sistemas, métodos e composições podem ser usadas, por exemplo, para quantificação de origem de tecido simples e de baixo custo para permitir estudos longitudinais para que os pesquisadores entendam a patogênese de muitas doenças, traçando o perfil das dinâmicas e interações entre os múltiplos órgãos humanos.
[0052] Como consequência, algumas modalidades fornecidas na presente invenção se referem a métodos e sistemas para quantificação de cfDNA em um sujeito. Em algumas modalidades, os métodos incluem a obtenção de uma amostra biológica que é conhecida por transportar cfDNA, como plasma sanguíneo, de um sujeito tendo ou suspeito de ter um tipo específico de câncer. Como usado na presente invenção, “câncer” se refere a todos os tipos de câncer ou neoplasma ou tumores malignos encontrados em mamíferos, especialmente humanos, incluindo leucemias, sarcomas, carcinomas e melanoma. Exemplos de cânceres são câncer de cérebro, mama, colo do útero, cólon, cabeça e pescoço, rim, pulmão, pulmão de células não pequenas, melanoma, mesotelioma, ovário, sarcoma, estômago, útero e meduloblastoma. Cânceres adicionais podem incluir, por exemplo, doença de Hodgkin, linfoma não-Hodgkin, mieloma múltiplo, neuroblastoma, câncer de mama, câncer de ovário, câncer de pulmão, rabdomiossarcoma, trombocitose primária, macroglobulinemia primária, tumores de células pequenas do pulmão, tumores cerebrais primários, câncer de estômago, câncer de cólon, insulanoma pancreático maligno, carcinoide maligno, câncer de bexiga urinária, lesões de pele pré- malignas, câncer testicular, linfomas, câncer de tireoide, neuroblastoma, câncer de esôfago, câncer do trato geniturinário, hipercalcemia maligna, câncer cervical, câncer endometrial, câncer cortical adrenal e câncer de próstata.
[0053] Em algumas modalidades, uma análise da sequência do genoma completo (WGS) é realizada no cfDNA na amostra biológica para identificar regiões que podem mostrar quantidades elevadas ou diminuídas de cfDNA em comparação com as quantidades de cfDNA em um paciente saudável, ou em comparação com os níveis de cfDNA em uma seção transversal de pacientes saudáveis. Por exemplo, se o paciente sofre de dano hepático ou câncer de fígado, pode-se esperar ver níveis elevados de cfDNA identificados como sendo derivados do fígado em comparação com os níveis de cfDNA do fígado de uma população de controle de linha de base. Os níveis de um certo tipo de cfDNA podem ser determinados a partir de um nível de cfDNA total por meio de vários algoritmos fornecidos na presente invenção, incluindo análise por meio de uma variedade dentre aprendizagem de máquina, inteligência artificial ou outros algoritmos para identificar os níveis e diferenças de um cfDNA específico de um sujeito em comparação com um controle de linha de base, ou para identificar e comparar níveis e diferenças de vários tipos de cfDNA derivados de vários tipos de tecido. Em algumas modalidades, a análise de cfDNA inclui quantificar as frações relativas de cfDNA de diferentes tecidos do sujeito e controles de linha de base normais. Em algumas modalidades, a quantificação pode incluir um ou ambos dentre determinar o conjunto de perfis de tecido de referência e quantificar uma fração de cfDNA de tecido em uma amostra de cfDNA com base em dados de cobertura de cfDNA de todo o genoma. Os controles de linha de base podem incluir amostras de controle saudáveis de uma população de amostras, incluindo amostras de várias regiões geográficas, idades, etnia, raça ou gênero para estabelecer uma linha de base adequada.
[0054] Algumas modalidades fornecidas aqui se referem a métodos de análise de DNA livre de células (cfDNA) em uma amostra biológica. Em algumas modalidades, os métodos incluem a obtenção de uma amostra biológica compreendendo cfDNA; enriquecimento de cfDNA da amostra para fornecer cfDNA enriquecido, em que o cfDNA enriquecido compreende uma pluralidade de fragmentos de cfDNA, cada fragmento correspondendo a um tipo de célula ou tecido específico; quantificação de cada fragmento de cfDNA para gerar um perfil de cfDNA de todo o genoma, em que o perfil de cfDNA de todo o genoma compreende uma pluralidade de sinais de número de cópia, cada sinal de número de cópia correspondendo a um fragmento de cfDNA; e comparação do perfil de cfDNA de todo o genoma com um perfil de assinaturas de número de cópias de cfDNA conhecidas para determinar dano celular, dano a tecido ou dano a órgão.
[0055] Em algumas modalidades, a amostra biológica pode ser qualquer amostra biológica tendo ou suspeita de ter um perfil de cfDNA. Assim, a amostra biológica pode ser qualquer amostra derivada ou obtida de um sujeito, tal como um fluido corporal obtido de um sujeito. Assim, a título de exemplo, uma amostra biológica pode ser, ou pode ser derivada de ou obtida de sangue, plasma, soro, urina, fluido cerebroespinal, saliva, fluido linfático, humor aquoso, humor vítreo, fluido coclear, lágrimas, leite, expectoração, corrimento vaginal ou qualquer combinação dos mesmos.
[0056] Em algumas modalidades, o enriquecimento de um ácido nucleico de interesse ou de um fragmento do mesmo, como o enriquecimento de cfDNA em uma amostra, pode incluir quaisquer técnicas de enriquecimento adequadas. Em algumas modalidades, o enriquecimento de cfDNA pode incluir enriquecimento por meio de sondas de inversão molecular, sondas de pulldown de captura em solução, conjuntos de isca, PCR padrão, PCR multiplex, captura híbrida, digestão por endonuclease, hipersensibilidade a DNase I e circularização seletiva. O enriquecimento pode ser alcançado por meio da seleção negativa de ácidos nucléicos, eliminando o material indesejado. Este tipo de enriquecimento inclui técnicas de ‘footprinting’ ou captura híbrida ‘subtrativa’. Durante o primeiro, a amostra alvo está segura da atividade de nuclease por meio da proteção da proteína ou por arranjos de fita simples e dupla. Durante o último, os ácidos nucléicos que se ligam às sondas ‘iscas’ são eliminados. Em algumas modalidades, o enriquecimento inclui a amplificação do cfDNA. Em algumas modalidades, a amplificação compreende a amplificação por PCR ou amplificação de todo o genoma.
[0057] Em algumas modalidades, quantificar um ácido nucleico, como quantificar cfDNA, pode incluir qualquer técnica adequada para determinar uma quantidade de ácido nucleico ou fragmento de ácido nucleico em uma amostra. Assim, por exemplo, a quantificação pode incluir o sequenciamento do cfDNA usando contagem de moléculas de
DNA com base em sequenciamento ou realizando a quantificação de DNA com base em hibridização.
[0058] Em algumas modalidades, cada sinal de número de cópia é indicativo de uma contribuição relativa de cfDNA de um tipo de célula ou tecido específico. Um número de cópia, como usado na presente invenção, se refere a uma cobertura de cfDNA de todo o genoma em uma amostra, com base em sinais obtidos através da contagem de moléculas de DNA, como por quaisquer tecnologias de sequenciamento, ou por tecnologias de quantificação de número de cópias de DNA com base em hibridização.
[0059] Em algumas modalidades, o tipo de tecido é qualquer tipo de tecido que se deseja monitorar, analisar, medir ou para o qual há suspeita de que há dano ou que pode estar ocorrendo dano. Em algumas modalidades, o tipo de tecido é rim, músculo, coração, tecido vascular, fígado, cérebro, olho, pulmão, tecido adiposo, glândula, osso, medula óssea, cartilagem, intestino, estômago, pele ou bexiga. Em algumas modalidades, o tipo de célula é de células sanguíneas, células neuronais, células renais, células epiteliais, células de matriz extracelular ou células imunes, ou quaisquer combinações de células. Por exemplo, o método pode incluir medir ou monitorar um ou uma pluralidade de tipos de tecidos ou órgãos em um sujeito. Assim, em algumas modalidades, o perfil de cfDNA de todo o genoma quantifica uma quantidade de cfDNA de vários órgãos para fornecer uma avaliação da saúde do órgão. Em algumas modalidades, cada fragmento de cfDNA é quantificado simultaneamente. Como usado na presente invenção, simultâneo se refere a uma ação que ocorre ao mesmo tempo ou substancialmente ao mesmo tempo. Assim, a quantificação simultânea se refere à análise de uma pluralidade de fragmentos de cfDNA em um único ensaio ao mesmo tempo ou substancialmente ao mesmo tempo. Como consequência, as modalidades fornecidas na presente invenção se referem a um único teste de sangue universal de análise, em que vários órgãos são monitorados ou são capazes de ser monitorados em um único ensaio. Por exemplo, a quantificação de cfDNA de tecido pode ser determinada em vários tecidos ou em um único tecido. Um exemplo pode ser a quantificação de frações de cfDNA do rim. Conforme mostrado na Figura 2, a fração renal é maior para pacientes com insuficiência renal, e a quantificação aqui descrita permite a previsão de insuficiência renal.
[0060] Em algumas modalidades, a amostra é obtida e analisada periodicamente de um sujeito para monitorar a saúde ao longo do tempo, de modo que uma amostra inicial seja analisada em um primeiro ponto de tempo e uma segunda amostra seja analisada em um segundo ponto de tempo e diferenças no perfil de cfDNA são avaliadas para fornecer uma indicação de alterações no perfil de cfDNA. Essas análises podem fornecer informações relacionadas à melhora ou piora de certos tipos de tecido ao longo do tempo. Por exemplo, tais métodos podem ser usados para monitorar o transplante de órgãos, monitorar a toxicidade do fármaco, monitorar regimes de tratamento, monitorar o estado de saúde de vários órgãos ou tecidos ao longo do tempo, monitorar a saúde materna durante diferentes estágios da gravidez, monitorar a saúde do recém-nascido durante gravidez e antes do nascimento ou após o nascimento, ou para outras avaliações adequadas. Assim, algumas modalidades fornecidas na presente invenção se referem ao monitoramento do transplante de órgãos ao longo do tempo. Em algumas modalidades, o perfil de cfDNA de todo o genoma é indicativo de toxicidade do fármaco em um órgão. Em algumas modalidades, a amostra é uma amostra materna e o perfil de cfDNA de todo o genoma é indicativo da saúde do feto. Períodos de tempo adequados para monitorar um determinado tecido, órgão, célula ou condição podem ser dependentes da aplicação específica e podem ser da ordem de minutos, por exemplo, monitorar a amostra a cada 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12,
15, 20, 25, 30, 35, 40, 45, 50, 55 ou 60 minutos, horas, por exemplo, a cada 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 18, 20 ou 24 horas, dias, por exemplo 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 ou 30, meses, por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 ou 12, ou anos, por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80 ou mais anos, ou por um período de tempo dentro de uma faixa definida por quaisquer dois dos valores acima mencionados. Por exemplo, um transplante de órgão renal pode ser monitorado ao longo do tempo usando os sistemas e métodos aqui descritos. Como mostrado nas Figuras 3A-3B, o padrão de curso de tempo da proporção de DNA do tecido renal como uma função do tempo para o cfDNA do rim doado e o cfDNA do próprio rim do paciente pode ser monitorado ao longo do tempo.
[0061] Em algumas modalidades, os métodos incluem ainda a subtração de um perfil de referência de linha de base do perfil de cfDNA de todo o genoma. Um perfil de referência de linha de base corresponde a um tipo de célula ou tecido específico apresentado em amostras de cfDNA de linha de base, de modo que o perfil de linha de base pode ser contabilizado em uma amostra de teste e mudanças ou variações da linha de base podem ser usadas para diagnóstico ou detecção de anormalidade.
[0062] Algumas modalidades fornecidas na presente invenção se referem a métodos de monitoramento do progresso do câncer em um sujeito. Em algumas modalidades, os métodos incluem a obtenção de uma amostra biológica do sujeito, em que a amostra biológica compreende DNA livre de células (cfDNA); quantificar o cfDNA na amostra para obtenção de um perfil de cfDNA de todo o genoma compreendendo uma pluralidade de sinais de número de cópia, cada sinal de número de cópia correspondendo a um fragmento de cfDNA de um tipo de célula ou tipo de tecido específico; e comparar a pluralidade de sinais de número de cópias a um perfil de sinais de número de cópias conhecidos de indivíduos saudáveis. Em algumas modalidades, uma diferença de sinal de número de cópias na amostra em comparação com os sinais de número de cópias conhecidos se correlaciona a uma condição cancerosa ou pré-cancerosa no sujeito. Em algumas modalidades, o cfDNA total é enriquecido da amostra, antes de quantificar o cfDNA. Em algumas modalidades, os métodos incluem ainda a comparação da pluralidade de sinais de número de cópias a um perfil de sinais de número de cópias conhecidos de amostras de pacientes com câncer. Em algumas modalidades, a amostra biológica compreende sangue, plasma, soro, urina, fluido cerebroespinhal, saliva, fluido linfático, humor aquoso, humor vítreo, fluido coclear, lágrimas, leite, expectoração, corrimento vaginal ou qualquer combinação dos mesmos. Em algumas modalidades, a quantificação compreende o sequenciamento do cfDNA usando contagem de moléculas de DNA com base em sequenciamento. Em algumas modalidades, a quantificação compreende a realização da quantificação de DNA com base em hibridização. Em algumas modalidades, os métodos incluem ainda enriquecimento de cfDNA antes de quantificar o cfDNA. Em algumas modalidades, o enriquecimento compreende a amplificação do cfDNA por meio de amplificação por PCR ou amplificação de todo o genoma.
EXEMPLOS
[0063] Alternativas adicionais são divulgadas em mais detalhes nos exemplos a seguir, que não se destinam de forma alguma a limitar o escopo das Reivindicações.
Procedimentos e Métodos Gerais Extração
[0064] A taxa de circulação normal do sangue é de cerca de 5 litros por minuto, de modo que todo o volume de sangue circula uma vez por minuto. Esta taxa é muito mais alta do que a cinética de geração e degradação do cfDNA, e a composição do cfDNA é uniforme no sangue de uma pessoa em um curto período de tempo (por exemplo, menos de 5 minutos). Nessas condições, uma coleta de sangue é aproximadamente uma amostra de Poisson de cfDNA. Tanto uma distribuição multinomial quanto uma distribuição hipergeométrica multivariada é usada para modelar a extração de DNA.
[0065] O processo de extração segue uma distribuição de Poisson n”l ~ Pois(n” · Σt βt · Atl), ou em conjunto uma distribuição multinomial (n”l) ~ Multi(Σt βt · At, n”), onde n”l são os números de cópias no locus l, n” é o total de cópias de fragmentos de cfDNA, βt é a fração de cfDNA do tipo de tecido t, e At é o perfil do número de cópia de referência para o tipo de tecido t.
Amplificação de PCR
[0066] O processo de PCR é aproximado por uma distribuição Gama n’l ~ Gamma(n”l · ρ, θ), ou em conjunto uma distribuição de Dirichlet (n’l) / θ~ Dir(α = (n”l · ρ)), onde ρ = (1+r)/(1- r)/[1 - (1+r) –t], θ = [(1+r)t - 1] · (1 - r)/(1+ r), e r é a eficiência de amplificação de PCR em cada ciclo, n’l é o número de moléculas de DNA no locus l após a PCR, n’ é o número total de moléculas de DNA amplificadas a partir de fragmentos de cfDNA.
Sequenciamento
[0067] Semelhante à extração, o sequenciamento segue uma distribuição de Poisson nl ~ Pois(n · n’l / n’), ou em conjunto uma distribuição multinomial (nl) ~ Multi(n’l /n’, n), onde n é o número de fragmentos observados no sequenciamento, e nl é o número de cópias de cfDNA observado em um determinado locus l.
Algum Número
[0068] Com aproximadamente 5.000 mL de sangue em uma pessoa típica, 1,8-44 ng/mL de cfDNA de plasma corresponde a 1,35-33 milhões de cópias do genoma humano. Uma fração de tecido de 1% corresponde a
13.500–330.000 cópias. A título de exemplo, quando 3 ng de cfDNA são usados como entrada para um ensaio de cfDNA WGS, isso corresponde a um total de 900 cópias, 9 cópias de um genoma de tecido de 1% e 0,9 cópias de um genoma de tecido de 0,1%.
Exemplo 1 - Modelagem de um Perfil de sinal de cfDNA Agregado
[0069] O exemplo a seguir demonstra uma modalidade de modelagem de um perfil de sinal de cfDNA agregado.
[0070] Ignorando a extração e as variabilidades de PCR, o modelo S do sinal de cfDNA é (nl) ~ Multi(Σt βt · At, n). Dado um grande número de bins (ou loci) que são distribuídos de maneira aproximadamente uniforme, o mesmo é próximo a uma distribuição de Poisson: nl ~ Pois(n · Σt βt · At). Dados os perfis de tecido conhecidos A, apenas as incógnitas são as frações de tecido B = (βt), que podem ser resolvidas por otimização numérica.
[0071] O modelo PS do sinal de cfDNA é uma distribuição gama- Poisson (binomial negativa) nl ~ NB(n”l · ρ, p = n · θ / (n’ + n · θ)). Dado n’ = n” · ρ · θ, n”l = n” · Σt βt · Atl, e ignorando a variabilidade da extração tem-se nl ~ NB(n” · ρ · Σt βt · Atl, n / (n” · ρ + n)). Quando n << n” · ρ, é aproximadamente nl ~ Pois(n · Σt βt · Atl), que é igual ao modelo S.
[0072] Combinando as etapas E P em uma única distribuição Dirichlet (n’l) / θ ~ Dir(n” · α · 1/(1+ 1/ρ)), ou n’l ~ Gama(n” · α · ρ/(1+ρ), (1+ρ) θ). A distribuição de Dirichlet é usada para estimar uma distribuição de probabilidade multinomial desconhecida. Mais especificamente,
estende-se a distribuição Beta em várias dimensões e fornece-se uma transição suave entre a distribuição anterior e a distribuição observada e permite o controle sobre a rapidez com que essa transição ocorre.
[0073] Combinando a extração, PCR e etapa de sequenciamento, o modelo EPS do sinal de cfDNA é (nl) ~ DM(n” / (1+1/ρ) · α, n) ou (nl) ~ DM(n” · α · (1 + r)/2, n), onde DM é uma distribuição Multinomial de Dirichlet. Dado um grande número de bins (ou loci) que são distribuídos de maneira aproximadamente uniforme, ela está próxima de uma distribuição binomial negativa: nl ~ NB(n” · α · ρ/(1+ρ), (1+ρ) θ n / [(1+ρ) θ n + n’] ou nl ~ NB(n”·αl·(1 + r)/2, n / [n + n”·(1 + r)/2]. A média e a variância de μ = n · αl, δ2 = n · αl · [n/ n” · (1/ρ +1) + 1]. Quando n << n”, por exemplo, para 30x WGS com > 1 ng de cfDNA de entrada, nl aproxima- se da distribuição de Poisson nl ~ Pois(n · αl). A Tabela 1 fornece uma lista de modelos probabilísticos envolvidos na quantificação de cfDNA, onde αl = Σt βt · Atl, e α = Σt βt · At.
Tabela 1 Modelo Dependente Modelo Independente Componente (n”l ) ~ Multi(α, n”) n”l ~ Pois(n” · αl)
E Componente (n’l) / θ ~ Dir((n”l · ρ)) n’l ~ Gama(n”l · ρ, θ)
P Componente (nl ) ~ Multi( (n’l / n’) , n) nl ~ Pois(n · n’l / n’)
S Modelo S (nl) ~ Multi(α, n) nl ~ Pois(n · αl) nl ~ NB(n” · ρ · αl, n/(n” · ρ + n)), Modelo PS (nl) ~ DM(n” · ρ · α, n) ou nl ~ Pois(n · αl), se n << n” · ρ.
(nl) ~ DM(n”/(1+1/ρ) · α, nl ~ NB(n”·αl·ρ/(1+ρ), n/[n + n), n”·ρ/(1+ρ)], ou Modelo EPS nl ~ Pois (n · αl), se n << n”.
[0074] O modelo PS do sinal de cfDNA é uma distribuição gama- Poisson (binomial negativa) nl ~ NB(n”l · ρ, p = n · θ / (n’ + n · θ)). Dado n’ = n” · ρ · θ, n”l = n” · Σt βt · Atl, e ignorando a variabilidade da extração tem-se nl ~ NB(n” · ρ · Σt βt · Atl, n / (n” · ρ + n)). Quando n << n” · ρ, é aproximadamente nl ~ Pois(n · Σt βt · Atl), que é igual ao modelo S.
Atualização Multiplicativa
[0075] O modelo de Poisson nl ~ Pois(n · αl) é equivalente à fatoração de matriz não negativa com divergência KL como custo. Aplicando o algoritmo de atualização multiplicativa βst ← βst · Σl Atl · rsl / (β•A)sl / Σl Atl com base no algoritmo de fatoração de matriz não negativa (NMF) descrito em Lee e Seung, 2001, é usado para calcular βt.
Regressão Linear Ponderada Iterativa
[0076] Para uma determinada amostra, com uma fração de tecido estimada β0, uma regressão linear ponderada com função de custo é definida como (β; β0, A) = 1/2 · Σl [(rl - (β•A)l)2/ (β0•A)l]. Esta regressão linear ponderada é resolvida (β0, A), então β ← r •W-1•AT (A•W-1•AT)-1, onde W= diag(β0•A), fornecendo um algoritmo de atualização iterativa adicional. A diferença entre esta e a regressão linear regular E = 1/2 · Σl [(rl - (β•A)l)2 é uma ponderação com base em W = diag(α) = β • AL.
Derivação do Modelo EPS
[0077] Dado (n’l) / θ ~ Dir((n”l · ρ)) e (n”l) ~ Multi(α, n”), e a lei da variância total é dada como: E((n’l) / θ) = α, var((n’l) / θ) = var(n”l/ n”) + E(n”l · ρ ( n” · ρ- n”l · ρ)/ [(n” · ρ)2(n” · ρ + 1)].
~= var(n”l/ n”) + E(n”l / n” (1 - n”l / n”)/ [n”· ρ]).
= α (1-α) / n” + α / [n”· ρ] - (var(n”l / n” ) + α2) / [n”· ρ]) = α (1-α) / n” + α / [n”· ρ] - (α (1-α) / n” + α2) / [n”· ρ]) = α (1-α) {1 / n” (1 - 1/[n”· ρ]) + 1/ [n”· ρ]} ~= α (1-α) {1 / n” + 1/ [n”· ρ]} = α (1-α) / [n” · 1/(1+ 1/ρ))]
[0078] Isso corresponde a um Dir(n” · α · 1/(1+ 1/ρ)). Dado o n”l ~ Pois(n” · αl) e n’l ~ Gama(n”l · ρ, θ), e a lei da variância total dá: E((n’l)) = n” · αl · ρ · θ, var((n’l)) = var(n”l · ρ · θ) + E(n”l · ρ θ2) = n” · αl· ρ (1+ρ) θ2
[0079] Isso corresponde a um (n” · α · ρ/(1+ρ), (1+ρ) θ).
n · n’l / n’ ~ Gama(n” · α · ρ/(1+ρ), (1+ρ) θ n / n’) nl ~ Pois(n · n’l / n’) nl ~ NB(n” · α · ρ/(1+ρ), (1+ρ) θ n / [(1+ρ) θ n + n’]
nl ~ NB(n” · α · ρ/(1+ρ), (1+ρ) n / [(1+ρ) n + n” · ρ] Exemplo 2 - Determinação do Perfil de cfDNA de Tecido
[0080] O exemplo a seguir demonstra as modalidades de um método para determinar um perfil de referência de cfDNA de tecido.
[0081] Duas estratégias complementares podem ser usadas para estimar perfis de sinal de cfDNA específicos de tecido ou de tipo de célula. O primeiro método é usar a aprendizagem de máquina não supervisionada, com base em um conjunto de amostras que contêm o tecido/célula de interesse em frações variáveis. O segundo método é usar a aprendizagem de máquina supervisionada, prevendo os perfis de sinal de cfDNA originados de um determinado tecido/célula com base nos perfis epigenéticos do DNA genômico (gDNA) ou perfis de expressão gênica do tipo de tecido/célula.
Aprendizagem de Máquina não Supervisionado
[0082] O método de aprendizagem de máquina supervisionada aplica a fatoração de matriz não negativa para decompor o sinal de mistura de cfDNA e extrair os perfis de cobertura de cfDNA específicos do tecido. O modelo de Poisson nl ~ Pois(n · αl) é equivalente à fatoração de matriz não negativa com uma divergência de Kullback-Leibler (KL) como custo. Uma divergência KL é uma medida de como uma distribuição de probabilidade difere de uma distribuição de probabilidade de referência. Para um determinado conjunto de dados de tamanho e composição de tecido suficientes de um tipo de tecido de interesse, o algoritmo NMF de Lee e Seung 2001 é aplicado para estimar as frações de tecido em cada amostra, bem como para determinar os perfis de cfDNA do tecido. A fração de tecido para t de tecido na amostra s é estimada por βst ← βst · Σl Atl · rsl / (β•A)sl / Σl Atl, enquanto o sinal de cfDNA no locus l para o tipo de tecido t é estimado por Atl ← Atl · Σs βst · rsl / (β•A)sl / Σs βst, onde • é a multiplicação da matriz, rsl é a fração de leituras cobrindo o locus l na amostra s.
Aprendizagem de Máquina Supervisionada
[0083] Existem duas limitações relacionadas do algoritmo não supervisionado. Primeiro, ele requer amostras de indivíduos em condições fisiológicas ou de doença específicas, por exemplo, para aprender o perfil de cfDNA do rim, é necessário o acesso a várias amostras de cfDNA de pacientes com dano renal elevado. Em segundo lugar, para tipos de tecido com pequenas populações de células ou tipo de célula que é raro, a fração do sinal de cfDNA do sangue contribuída por tais células pode ser muito pequena. Assim, um grande número de amostras de cfDNA é necessário para aprender eficazmente os perfis de sinal de cfDNA para tais tecidos ou tipos de células. Essas limitações podem ser superadas por grandes conjuntos de dados. No entanto, na prática, grandes conjuntos de dados podem impedir a ampla aplicação da quantificação de tecido com base em cfDNA WGS para todos os tipos de tecido.
[0084] Por estas razões, a aprendizagem de máquina supervisionada que prevê perfis de número de cópias de cfDNA específicos de tecido a partir de dados epigenéticos ou de expressão de amostras de células de tecido específicas pode ser usada. A aprendizagem de máquina supervisionada não requer acesso a amostras de cfDNA de pacientes com danos a órgãos específicos, mas apenas usa células de tecido isoladas de amostras normais ou de doenças. Os métodos aplicam rede neural profunda e, mais especificamente, rede neural recorrente ou rede neural convolucional em dados de sequenciamento unidimensional, para prever perfis de cfDNA. Os recursos de entrada para as redes neurais incluem acessibilidade de DNase em todo o genoma, metilação de DNA, metilação de histonas, perfis de acetilação de histonas ou perfis de expressão gênica para o tipo de tecido fornecido. A previsão da aprendizagem de máquina é um perfil de número de cópias de cfDNA de todo o genoma para o tecido de interesse.
[0085] A validação cruzada dentro do tecido e entre tecidos é usada para treinar e avaliar os modelos de aprendizagem de máquina. Mais especificamente, os dados epigenéticos específicos de tecido são preparados como recurso de entrada e perfis de cobertura de cfDNA de tecido estimados (a partir dos algoritmos não supervisionados) são preparados como alvo. Para validação cruzada dentro do tecido, um subconjunto de loci no genoma para validação é retido e os outros loci são usados para treinamento. Para validação cruzada de tecido cruzado, perfis de referência de cfDNA para certos tipos de células, como células sanguíneas, são usados para treinamento e perfis de referência de cfDNA para tipos de células adicionais, como células de rim ou pulmão, são usados para validação.
Exemplo 3 - Estudos de cfDNA
[0086] O exemplo a seguir demonstra modalidades de estudos para analisar cfDNA em uma amostra do sujeito.
Estudo Piloto
[0087] O DNA de plasma de 10 pacientes com doença renal em estágio terminal (ESRD - “end stage renal disease”) e 10 controles normais correspondentes de idade, sexo e peso corporal foram obtidos e estudados. Para cada amostra, 30X WGS foi executado. A presença de fortes sinais de cfDNA que podem diferenciar de forma confiável a ESRD vs controles normais foi obtida. A análise de agrupamento e a análise de componente principal (PCA - “principal component analysis”) mostram que a ESRD e as amostras normais formam grupos distintos. Para controles normais, as frações renais determinadas foram < 0,5%.
Estudo de Mistura
[0088] Para três pares de caso-controle, as misturas de cfDNA sintético foram preparadas misturando a ESRD com cfDNA de controle por meio de diluições em série. Para cada par de caso-controle, oito misturas com cfDNA de ESRD de 100%, 50%, 25%, 12,5%, 6,25%, 3,125%, 1,5625% e 0,78125% foram diluídas com cfDNA de controle. Com este conjunto de dados, o desempenho analítico da quantificação do tecido foi determinado. O estudo de mistura demonstrou que a fração renal estimada é linear à fração renal verdadeira e que a fração renal pode ser determinada com precisão (CV < 20%) para valores tão baixos quanto 0,5%.
[0089] Uma modalidade para validação é representada no diagrama de blocos da Figura 5, que ilustra um processo para avaliar amostras de cfDNA para quantificação de cfDNA de tecido. Conforme mostrado na Figura 5, uma primeira coorte pode incluir controles e sujeitos doentes, que são submetidos à preparação da biblioteca, 30x WGS e, em seguida, analisados. As partes do produto de WGS são submetidas à descoberta de biomarcador, enquanto outras partes estão sujeitas à verificação de sinal ou algoritmos de WGS. Uma segunda coorte pode ser uma coorte de misturas sintéticas, incluindo, por exemplo, numerosas amostras de indivíduos com diabetes, indivíduos com lúpus, hipertensão, doença renal (como doença renal crônica (CKD - “chronic kidney disease”) ou doença renal policística (PKD - “polycystic kidney disease”)), amostras de controle, ou amostras de outros sujeitos. As misturas são aplicadas a um ensaio de amplicon, sequenciamento e algoritmos para determinar o desempenho dos métodos de quantificação de tecido (incluindo a determinação de um limite de quantificação (LOQ - “limit of quantification”) ou limite de detecção LOD - “limit of detection”) e linearidade dos métodos) ou diagnóstico de doença (incluindo a determinação da sensibilidade e especificação dos métodos.
Estudo Completo
[0090] Após o estudo da mistura, cerca de 200 amostras de pacientes diabéticos em vários estágios de doença renal crônica (CKD - “chronic kidney disease”) são coletados e submetidos a 30X cfDNA WGS. Os resultados indicam que a fração renal estimada pode diferenciar de forma confiável pacientes com DRC em estágio inicial versus CKD em estágio final, que a fração renal estimada pode diferenciar com segurança pacientes com DRC em estágio inicial versus pacientes diabéticos sem DRC, e que a fração renal estimada está correlacionada com a gravidade da doença renal.
Estudo de Órgãos Diversos
[0091] Cinco amostras de sangue de pacientes com insuficiência cardíaca ou lesão pulmonar (por exemplo, fibrose cística) ou controles normais são coletadas e submetidas a 30x cfDNA WGS. Os resultados demonstram que os pacientes com insuficiência cardíaca, lesão pulmonar ou doença renal têm perfis de sinal de cfDNA distintos entre si, e são diferentes dos controles normais, e que as frações do cfDNA do coração e do pulmão podem ser quantificadas.
Estudo Diverso de Transplante
[0092] Cinco amostras de sangue de pacientes com transplantes de pulmão ou coração são coletadas e submetidas a 30x cfDNA WGS. Os resultados demonstram que os pacientes com transplantes de coração ou de pulmão têm padrões distintos e que as frações pulmonares estimadas ou frações cardíacas são linearmente correlacionadas às frações de órgãos de doadores com base em variantes genéticas.
[0093] O termo “compreendendo”, como usado na presente invenção, é sinônimo de “incluindo”, “contendo” ou “caracterizado por” e é inclusivo ou em aberto e não exclui elementos adicionais, não recitados ou etapas do método.
[0094] A descrição acima divulga vários métodos e materiais da presente invenção. Esta invenção é suscetível a modificações nos métodos e materiais, bem como alterações nos métodos de fabricação e equipamentos. Tais modificações se tornarão evidentes para os versados na técnica a partir da consideração desta divulgação ou prática da invenção aqui divulgada. Consequentemente, não se pretende que esta invenção seja limitada às modalidades específicas divulgadas na presente invenção, mas que cubra todas as modificações e alternativas que vêm dentro do verdadeiro escopo e espírito da invenção.
[0095] Todas as referências citadas na presente invenção, incluindo, mas sem limitação, pedidos publicados e não publicados, patentes e referências da literatura, são incorporados na presente invenção por referência em sua totalidade e são, por meio deste, feitas parte deste Relatório Descritivo. Na medida em que as publicações e patentes ou pedidos de patentes incorporados por referência contradizem a divulgação contida no Relatório Descritivo, o Relatório Descritivo se destina a substituir e/ou ter precedência sobre qualquer material contraditório.

Claims (33)

REIVINDICAÇÕES
1. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, compreendendo: obter uma amostra biológica que compreende cfDNA; extrair cfDNA da amostra para fornecer cfDNA purificado, caracterizado por que o cfDNA purificado compreende uma pluralidade de fragmentos de cfDNA, cada fragmento correspondendo a um tipo de célula ou tecido específico; quantificar os fragmentos de cfDNA para gerar um perfil de número de cópias de cfDNA de todo o genoma, em que o perfil de número de cópias de cfDNA de todo o genoma compreende uma pluralidade de sinais de número de cópia, cada sinal de número de cópia correspondendo a um fragmento de cfDNA; e comparar o perfil de número de cópias de cfDNA de todo o genoma com um conjunto de assinaturas de cfDNA conhecidas para determinar dano celular, dano a tecido ou dano ao órgão.
2. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que a amostra biológica compreende sangue, plasma, soro, urina, fluido cerebroespinhal, saliva, fluido linfático, humor aquoso, humor vítreo, fluido coclear, lágrimas, leite, expectoração, secreção vaginal ou qualquer combinação dos mesmos.
3. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que a quantificação compreende o sequenciamento do cfDNA com o uso de contagem de moléculas de DNA com base em sequenciamento.
4. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que compreende ainda enriquecer fragmentos de cfDNA de interesse.
5. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que a quantificação compreende a realização quantificação de DNA com base em hibridização.
6. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que a extração compreende o enriquecimento baseado em tamanho para excluir o gDNA e enriquecer para fragmentos de cfDNA.
7. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que o enriquecimento compreende a amplificação do cfDNA.
8. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 7, caracterizado por que a amplificação compreende amplificação por PCR ou amplificação de todo o genoma.
9. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que cada sinal de número de cópia é indicativo de uma contribuição relativa de cfDNA de um tecido ou tipo de célula específico.
10. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que o tipo de tecido é rim, músculo, coração, tecido vascular, fígado, cérebro, olho, pulmão, tecido adiposo, glândula, osso, medula óssea, cartilagem, intestino, estômago, pele ou bexiga.
11. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que o tipo de célula é células do sangue, células de neurônios, células de rim, células epiteliais, células de matriz extracelular, células beta ou células imunes.
12. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que o perfil de cfDNA de todo o genoma é usado para quantificar quantidades de cfDNA de múltiplos órgãos para fornecer uma avaliação da saúde de órgãos ou múltiplos órgãos.
13. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que a amostra é obtida e analisada periodicamente de um sujeito para monitorar a saúde ao longo do tempo.
14. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 13, caracterizado por que compreende ainda o monitoramento do transplante de órgão ao longo do tempo.
15. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que o perfil de cfDNA de todo o genoma é indicativo de toxicidade ou eficácia do fármaco em um órgão.
16. Método de Análise de DNA Livre de Células (cfDNA) em Amostra
Biológica, de acordo com a Reivindicação 1, caracterizado por que a amostra é uma amostra materna e em que o perfil de cfDNA do genoma completo é indicativo da saúde do feto.
17. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que vários órgãos são quantificados simultaneamente projetando o perfil de cfDNA de todo o genoma em um conjunto de perfis de cfDNA de referência correspondendo a vários tecidos e tipos de células.
18. Método de Análise de DNA Livre de Células (cfDNA) em Amostra Biológica, de acordo com a Reivindicação 1, caracterizado por que compreende ainda a subtração de um perfil de referência de linha de base a partir do perfil de cfDNA de todo o genoma.
19. Método Para Monitorar Progresso de Doença em Sujeito, compreendendo: obter uma amostra biológica do sujeito, caracterizado por que a amostra biológica compreende o DNA livre de células (cfDNA); quantificar o cfDNA na amostra para obtenção de um perfil de cfDNA de todo o genoma compreendendo uma pluralidade de sinais de número de cópia, cada sinal de número de cópia correspondendo a um fragmento de cfDNA de um tipo de célula ou tipo de tecido específico; e comparar a pluralidade de sinais de número de cópia de cfDNA a um conjunto de sinais de número de cópia conhecido de indivíduos saudáveis, em que uma diferença de sinal de número de cópias na amostra em comparação com os sinais de número de cópias conhecidos se correlaciona com o progresso de uma doença no sujeito.
20. Método Para Monitorar Progresso de Doença em Sujeito, de acordo com a Reivindicação 19, caracterizado por que o cfDNA total é enriquecido a partir da amostra, antes da quantificação do cfDNA.
21. Método Para Monitorar Progresso de Doença em Sujeito, de acordo com a Reivindicação 19, caracterizado por que compreende ainda comparar a pluralidade de sinais de número de cópia a um perfil de sinais de número de cópia conhecidos de amostras de pacientes doentes.
22. Método Para Monitorar Progresso de Doença em Sujeito, de acordo com a Reivindicação 19, caracterizado por que a amostra biológica compreende sangue, plasma, soro, urina, fluido cerebroespinhal, saliva, fluido linfático, humor aquoso, humor vítreo, fluido coclear, lágrimas, leite, expectoração, secreção vaginal ou qualquer combinação dos mesmos.
23. Método Para Monitorar Progresso de Doença em Sujeito, de acordo com a Reivindicação 19, caracterizado por que a quantificação compreende o sequenciamento do cfDNA com o uso de contagem de moléculas de DNA baseada em sequenciamento.
24. Método Para Monitorar Progresso de Doença em Sujeito, de acordo com a Reivindicação 19, caracterizado por que a quantificação compreende a realização quantificação de DNA com base em hibridização.
25. Método Para Monitorar Progresso de Doença em Sujeito, de acordo com a Reivindicação 19, caracterizado por que a doença é selecionada de insuficiência cardíaca, lesão pulmonar, diabetes, doença de Crohn ou doença renal.
26. Método Para Monitorar Progresso de Doença em Sujeito, de acordo com a Reivindicação 25, caracterizado por que o enriquecimento compreende a amplificação do cfDNA por meio de amplificação direcionada ou amplificação de todo o genoma.
27. Método de Monitoramento de Saúde de Tecidos e Órgãos em Sujeito, compreendendo: obter uma amostra biológica do sujeito, caracterizado por que a amostra biológica compreende o DNA livre de células (cfDNA); quantificar o cfDNA na amostra para obtenção de um perfil de cfDNA de todo o genoma compreendendo uma pluralidade de sinais de número de cópia, cada sinal de número de cópia correspondendo a um fragmento de cfDNA de um tipo de célula ou tipo de tecido específico; e comparar a pluralidade de sinais de número de cópia de cfDNA a um conjunto de sinais de número de cópia conhecido de indivíduos saudáveis, em que uma diferença de sinal de número de cópia na amostra em comparação com os sinais de número de cópia conhecidos se correlaciona a uma mudança na condição de saúde do órgão no sujeito.
28. Método de Monitoramento de Saúde de Tecidos e Órgãos em Sujeito, de acordo com a Reivindicação 27, caracterizado por que o cfDNA total é enriquecido a partir da amostra, antes da quantificação do cfDNA.
29. Método de Monitoramento de Saúde de Tecidos e Órgãos em Sujeito, de acordo com a Reivindicação 27, caracterizado por que compreende ainda a comparação da pluralidade de sinais de número de cópias com um perfil de sinais de número de cópias conhecidos de amostras de um paciente com saúde de tecidos ou órgãos deficiente.
30. Método de Monitoramento de Saúde de Tecidos e Órgãos em Sujeito, de acordo com a Reivindicação 27, caracterizado por que a amostra biológica compreende sangue, plasma, soro, urina, fluido cerebroespinhal, saliva, fluido linfático, humor aquoso, humor vítreo, fluido coclear, lágrimas, leite, expectoração, secreção vaginal ou qualquer combinação dos mesmos.
31. Método de Monitoramento de Saúde de Tecidos e Órgãos em Sujeito, de acordo com a Reivindicação 27, caracterizado por que a quantificação compreende o sequenciamento do cfDNA com o uso de contagem de moléculas de DNA com base em sequenciamento.
32. Método de Monitoramento de Saúde de Tecidos e Órgãos em Sujeito, de acordo com a Reivindicação 27, caracterizado por que a quantificação compreende a realização quantificação de DNA com base em hibridização.
33. Método de Monitoramento de Saúde de Tecidos e Órgãos em Sujeito, de acordo com a Reivindicação 27, caracterizado por que o enriquecimento compreende a amplificação do cfDNA por meio de amplificação direcionada ou amplificação de todo o genoma.
BR112020026133-5A 2019-01-24 2020-01-22 métodos e sistemas para monitorar a saúde e as doenças dos órgãos BR112020026133A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962796481P 2019-01-24 2019-01-24
US62/796,481 2019-01-24
PCT/US2020/014612 WO2020154402A1 (en) 2019-01-24 2020-01-22 Methods and systems for monitoring organ health and disease

Publications (1)

Publication Number Publication Date
BR112020026133A2 true BR112020026133A2 (pt) 2021-07-27

Family

ID=69726743

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020026133-5A BR112020026133A2 (pt) 2019-01-24 2020-01-22 métodos e sistemas para monitorar a saúde e as doenças dos órgãos

Country Status (12)

Country Link
US (1) US20210310067A1 (pt)
EP (1) EP3914731A1 (pt)
JP (1) JP2022517456A (pt)
KR (1) KR20210119282A (pt)
CN (1) CN112424372A (pt)
AU (1) AU2020210912A1 (pt)
BR (1) BR112020026133A2 (pt)
CA (1) CA3104153A1 (pt)
IL (1) IL279433A (pt)
MX (1) MX2020014095A (pt)
SG (1) SG11202012518WA (pt)
WO (1) WO2020154402A1 (pt)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230386607A1 (en) * 2020-10-20 2023-11-30 Bgi Genomics Co., Ltd. Method for determining pregnancy status of pregnant woman
WO2022173698A1 (en) * 2021-02-09 2022-08-18 Illumina, Inc. Methods and systems for monitoring organ health and disease
CA3219753A1 (en) * 2021-05-21 2022-11-24 Kristina KRUGLYAK Methods and compositions for detecting cancer using fragmentomics
CN113403395B (zh) * 2021-06-03 2023-03-24 南京世和基因生物技术股份有限公司 房水cfDNA的提取方法、试剂盒以及在PVRL临床辅助检查中的应用
CA3226436A1 (en) * 2021-07-23 2023-01-26 Megan E. Mcnamara Use of circulating cell-free methylated dna to detect tissue damage
KR20240051739A (ko) * 2022-10-13 2024-04-22 인하대학교 산학협력단 cfDNA의 구조 변이 서열 검출을 통한 미세잔존질환 진단 방법

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2013211850B8 (en) * 2012-01-27 2017-06-29 The Board Of Trustees Of The Leland Stanford Junior University Methods for profiling and quantitating cell-free RNA
WO2014145232A2 (en) * 2013-03-15 2014-09-18 Organ-I, Inc. Methods and compositions for assessing renal status using urine cell free dna
WO2016002875A1 (ja) * 2014-07-02 2016-01-07 株式会社Dnaチップ研究所 核酸分子数計測法
CA2956208A1 (en) * 2014-07-25 2016-01-28 University Of Washington Methods of determining tissues and/or cell types giving rise to cell-free dna, and methods of identifying a disease or disorder using same
WO2016070131A1 (en) * 2014-10-30 2016-05-06 Personalis, Inc. Methods for using mosaicism in nucleic acids sampled distal to their origin
ES2907697T3 (es) * 2015-07-23 2022-04-26 Univ Hong Kong Chinese Análisis de los patrones de fragmentación del ADN acelular
WO2018000031A1 (en) * 2016-06-27 2018-01-04 Olivia Newton-John Cancer Research Institute Use of cell free dna as a measure of organ health following transplantation
AU2017292854B2 (en) * 2016-07-06 2023-08-17 Guardant Health, Inc. Methods for fragmentome profiling of cell-free nucleic acids
CN117604082A (zh) * 2016-08-10 2024-02-27 格瑞尔有限责任公司 分析核酸片段的方法
EP3596233B1 (en) * 2017-03-17 2022-05-18 Sequenom, Inc. Methods and processes for assessment of genetic mosaicism
WO2018187521A2 (en) * 2017-04-06 2018-10-11 Cornell University Methods of detecting cell-free dna in biological samples

Also Published As

Publication number Publication date
KR20210119282A (ko) 2021-10-05
CA3104153A1 (en) 2020-07-30
SG11202012518WA (en) 2021-01-28
EP3914731A1 (en) 2021-12-01
IL279433A (en) 2021-01-31
AU2020210912A1 (en) 2021-01-21
CN112424372A (zh) 2021-02-26
JP2022517456A (ja) 2022-03-09
US20210310067A1 (en) 2021-10-07
MX2020014095A (es) 2021-03-09
WO2020154402A1 (en) 2020-07-30

Similar Documents

Publication Publication Date Title
BR112020026133A2 (pt) métodos e sistemas para monitorar a saúde e as doenças dos órgãos
Farré et al. Concordant and discordant DNA methylation signatures of aging in human blood and brain
CN110100013A (zh) 用于肿瘤检测的方法和系统
Riedmaier et al. Transcriptional biomarkers–high throughput screening, quantitative verification, and bioinformatical validation methods
US11776661B2 (en) Determination of MAPK-AP-1 pathway activity using unique combination of target genes
WO2019191649A1 (en) Methods and systems for analyzing microbiota
US20230175058A1 (en) Methods and systems for abnormality detection in the patterns of nucleic acids
CN115667554A (zh) 通过核酸甲基化分析检测结直肠癌的方法和系统
Zhao et al. Global analysis of methylation profiles from high resolution CpG data
JP2023524016A (ja) 結腸細胞増殖性障害を特定するためのrnaマーカと方法
US20220213558A1 (en) Methods and systems for urine-based detection of urologic conditions
Kurkiewicz et al. Towards development of a statistical framework to evaluate myotonic dystrophy type 1 mRNA biomarkers in the context of a clinical trial
Chatterton et al. Brain-derived circulating cell-free DNA defines the brain region and cell specific origins associated with neuronal atrophy
RU2818052C2 (ru) Способы и системы мониторинга состояния здоровья и патологии органов
Wu et al. Finding gastric cancer related genes and clinical biomarkers for detection based on gene–gene interaction network
CN114267409A (zh) 无创产前基因检测测序数据的分析方法、装置及存储介质
US20230175064A1 (en) Methods and systems for monitoring organ health and disease
JP2024074960A (ja) 臓器健康および疾患をモニタリングするための方法およびシステム
Krumm et al. Diagnosis of ovarian carcinoma homologous recombination DNA repair deficiency from targeted gene capture oncology assays
US20160348175A1 (en) A method of identifying a neonate at risk of having or developing hypoxic-ischaemic encephalopathy (hie)
US20240170099A1 (en) Methylation-based age prediction as feature for cancer classification
WO2020158260A1 (ja) 心房性不整脈検査方法及び心房性不整脈検査システム
Becker et al. Biomarker discovery via RT-qPCR and bioinformatical validation
Koptyra et al. METB-11. EXPANSION OF THE PEDIATRIC BRAIN TUMOR ATLAS: AN OPEN SCIENCE EFFORT OF CHILDREN’S BRAIN TUMOR NETWORK, KIDS FIRST DATA RESOURCE AND CHILDHOOD CANCER DATA INITIATIVE
CN113362884A (zh) 基于单碱基替换特征的肿瘤标志物筛选方法及应用