BR112021009706A2 - detecção e predição de doença infecciosa - Google Patents

detecção e predição de doença infecciosa Download PDF

Info

Publication number
BR112021009706A2
BR112021009706A2 BR112021009706-6A BR112021009706A BR112021009706A2 BR 112021009706 A2 BR112021009706 A2 BR 112021009706A2 BR 112021009706 A BR112021009706 A BR 112021009706A BR 112021009706 A2 BR112021009706 A2 BR 112021009706A2
Authority
BR
Brazil
Prior art keywords
fragment length
nucleic acid
sample
fragment
nucleic acids
Prior art date
Application number
BR112021009706-6A
Other languages
English (en)
Inventor
Sivan BERCOVICI
Michael J. Rosen
Damek Spacek
Igor D. Vilfan
Lily BLAIR
Timothy A. Blauwkamp
Peter J. EUGSTER
Desiree HOLLEMON
David K. HONG
Trupti KAWLI
Mark Alec Kowarsky
Martin M.S. LINDNER
Original Assignee
Karius, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Karius, Inc. filed Critical Karius, Inc.
Publication of BR112021009706A2 publication Critical patent/BR112021009706A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/204Modifications characterised by specific length of the oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/138Amplified fragment length polymorphism [AFLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis
    • C12Q2545/101Reactions characterised by their quantitative nature the purpose being quantitative analysis with an internal standard/control
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/142Toxicological screening, e.g. expression profiles which identify toxicity

Abstract

DETECÇÃO E PREDIÇÃO DE DOENÇA INFECCIOSA. São fornecidos neste documento perfis de comprimento de fragmento de bibliotecas de ácido nucleico, métodos de geração de perfis de comprimento de fragmento de bibliotecas de ácido nucleico e métodos de uso de perfis de comprimento de fragmento para diagnósticos e/ou prognósticos. O pedido fornece ainda métodos, composições e kits para determinar o estágio de infecção ou o sítio de localização em um sujeito.

Description

“DETECÇÃO E PREDIÇÃO DE DOENÇA INFECCIOSA” REFERÊNCIAS CRUZADAS A PEDIDOS RELACIONADOS
[0001] Este pedido reivindica a prioridade e o benefício do Pedido Provisório nº U.S. 62/770.182, intitulado “Detection and Prediction of Infectious Disease”, depositado em 21 de novembro de 2018, Pedido Provisório nº U.S. 62/770.181, intitulado “Direct-to-Library Methods, Systems and Compositions”, depositado em 21 de novembro de 2018 e o Pedido Provisório nº U.S. 62/849,618, intitulado “Fragment Length Distributions and Methods of Using Such”, depositado em 17 de maio de 2019, cujo conteúdo é incorporado ao presente documento em sua totalidade a título de referência para todos os fins.
CAMPO DA INVENÇÃO
[0002] A presente invenção se refere ao uso de distribuições de comprimento de fragmento em bibliotecas de ácido nucleico para identificar micróbios, identificar o tipo de interação biológica hospedeiro- micróbio, identificar sítios de infecção ou sítio de localização, selecionar a terapia ou tratamento, monitorar o tratamento, monitorar a citotoxicidade, detectar rejeição de transplante, monitorar a resposta ou atividade do sistema imunológico, identificar o estágio de infecção, monitorar a rejeição de transplante e para uso em diagnósticos de câncer.
ANTECEDENTES
[0003] Para muitas infecções microbianas, o primeiro estágio é a colonização. Em alguns casos, uma infecção microbiana pode progredir para infecção persistente e pode evoluir para um estágio de doença invasiva. Exemplos de micróbios que podem se desenvolver em doenças invasivas incluem Cytomegalovirus, Epstein-Barr virus, Heliobacter pylori, Clostridium difficile, certas infecções sexualmente transmissíveis e outras. Para pacientes infectados com esses tipos de microrganismos, a identificação de uma infecção no estágio correto, estágio de colonização ou estágio invasivo pode ser um fator importante na tomada de decisões de tratamento eficazes. O sítio de localização também pode impactar a significância e as opções de tratamento disponíveis. Algumas doenças relacionadas a micróbios ocorrem na ausência do que é considerado colonização típica. Por exemplo, a ingestão de C. botulinum pode ser suficiente para causar sintomas.
[0004] Além disso, as infecções no estágio invisível geralmente se apresentam sem sintomas ou sintomas não específicos que podem se assemelhar a várias outras doenças. Consequentemente, tais infecções são frequentemente não diagnosticadas, mal diagnosticadas ou tratadas sintomaticamente, permitindo que o microrganismo persista e aumentando o risco de a infecção do paciente progredir para doença invasiva.
[0005] Helicobacter pylori (H. pylori) é a infecção bacteriana crônica mais comum em humanos. Estima-se que 50% da população mundial esteja infectada. Nos Estados Unidos, aproximadamente 30% dos adultos são infectados aos 50 anos, sendo a maioria dos indivíduos infectados durante a infância. Chen, Y. and M.J. Blaser, J Infect Dis, 2008. 198(4): p. 553 a
560. Existem fortes associações entre a infecção por H. pylori e afecções gastrointestinais (GI), incluindo gastrite crônica, doença ulcerosa péptica, adenocarcinoma gástrico e linfoma. A doença ulcerosa péptica (DUP) é a manifestação mais comum da infecção por H. pylori e tem uma incidência anual de 0,1 a 0,19% para DUP diagnosticada pelo médico. Sung, J.J., E.J. Kuipers, and H.B. El-Serag, Aliment Pharmacol Ther, 2009. 29(9): p. 938 a 946. Estima- se que os indivíduos infectados têm um risco ao longo da vida de 10 a 20% de desenvolver doença ulcerosa péptica. Kuipers, E.J., et al., Aliment Pharmacol Ther, 1995. 9 Suppl 2: p. 59 a 69.
[0006] O principal fenômeno responsável pelo início dessas manifestações da doença é a inflamação da mucosa em resposta à presença de H. pylori. No entanto, apenas uma pequena porcentagem de indivíduos com H. pylori terá a inflamação associada à doença invasiva por H. pylori.
[0007] Atualmente, é desafiador distinguir os pacientes que têm um estágio de infecção invisível por H. pylori daqueles que têm um estágio sintomático ou estão em risco de progredir para um estágio sintomático. Embora a maioria das infecções por H. pylori seja assintomática, os pacientes com doença invasiva podem começar a apresentar sintomas de dispepsia persistente, como dor abdominal, náuseas ou vômitos e falta de apetite. No entanto, esses sintomas não específicos também podem ser causados por outras afecções e são vivenciados por pessoas saudáveis. Alguns médicos testarão todos os pacientes com dispepsia persistente inexplicável. Outros médicos seguem as diretrizes atuais, que recomendam o teste de H. pylori em indivíduos com DUP ativa, um histórico de úlcera péptica documentado ou linfoma MALT gástrico. Chey, W.D., et al., Am J Gastroenterol, 2007. 102(8): p. 1808 a 1825. Portanto, os médicos que seguem as diretrizes testam apenas os pacientes com alta probabilidade de doença associada ao H. pylori, o que pode levar ao subtratamento.
[0008] Atualmente, existem vários métodos para testar o H. pylori. Os métodos de teste não invasivos existentes para H. pylori incluem teste de antígeno fecal, teste respiratório de ureia e sorologia para H. pylori. No entanto, esses métodos podem determinar apenas se o H. pylori está presente, mas não se há invasão do H. pylori ou inflamação associada. Alguns profissionais iniciarão o tratamento primário para erradicação com base em um resultado positivo de um dos testes não invasivos, o que pode levar ao tratamento excessivo.
[0009] O padrão ouro atual para diagnosticar a doença devido a H. pylori é realizar uma endoscopia superior para documentar (por meio de biópsia) alterações patológicas específicas devido à invasão de H. pylori, como inflamação, atrofia e metaplasia intestinal em conjunto com a detecção de H. pylori nas amostras de biópsia. Dixon, M.F., et al., Helicobacter,
1997. 2 Suppl 1: p. S17 a S24. No entanto, existem riscos graves e complicações potenciais desse procedimento, incluindo sangramento, que às vezes pode exigir uma transfusão, infecção e ruptura do trato GI.
[0010] No geral, cerca de 75% dos pacientes que cumprem o tratamento primário da infecção por H. pylori são considerados curados após o primeiro tratamento, com base em um ensaio de diagnóstico de H. pylori negativo para infecção ativa, que era previamente positivo antes do início do tratamento. Se o teste de diagnóstico para infecção gastrointestinal ativa por H. pylori permanecer positivo após a conclusão da terapia de primeira linha, existe a possibilidade de H. pylori resistente a antibióticos e implicaria em tratamento adicional até que um resultado de teste diagnóstico negativo fosse obtido.
[0011] O sequenciamento de próxima geração (NGS) pode ser usado para reunir grandes quantidades de dados sobre o teor de ácido nucleico de uma amostra. Pode ser particularmente útil para analisar ácidos nucleicos em amostras complexas, como amostras clínicas. No entanto, antes de usar os métodos de NGS, uma amostra inicial deve ser frequentemente processada, o que reduz a recuperação de ácido nucleico, atrasa o sequenciamento, atrasa o relatório de chamadas clínicas, introduz erros, introduz polarização e muitas vezes resulta em resíduos químicos que requerem manuseio controlado. Erros e polarizações podem afetar os resultados em muitos casos, como quando há ácidos nucleicos de baixa abundância ou ácidos nucleicos alvo em amostras de pacientes. Os métodos NGS atuais se concentram na abundância ou abundância relativa de leituras ou sequências específicas. Além disso, muitos métodos de preparação de biblioteca de sequenciamento e alguns sistemas de sequenciamento de próxima geração produzem comprimentos de fragmento de ácido nucleico alvo experimentalmente observados e distribuições de comprimento de fragmento que são polarizadas em relação aos comprimentos de fragmento endógeno e distribuições de comprimento de fragmento, particularmente como aqueles métodos e sistemas que utilizam marcação de cauda de poliA variável, marcação de cauda de poliA não contabilizada, desativação térmica de enzimas, uso de métodos de extração polarizados ou uso de outras medidas que introduzem o comprimento do ácido nucleico, estrutura secundária e/ou polarizações de GC dentro da faixa total ou parcial de comprimentos de ácido nucleico alvo e teor de GC. Alguns desses métodos e sistemas impedem uma polarização corrigida bem-sucedida, mesmo na presença de moléculas de controle de processo, se as polarizações são forem fortes que ácido nucleico alvo insuficiente e/ou moléculas de controle de processo são recuperadas dentro de toda ou certa seção dos comprimentos relevantes e teores de GC para a análise final.
[0012] Vários métodos, incluindo NGS, foram usados para identificar um micróbio presente em um hospedeiro, mas a maioria desses métodos se concentrou na abundância de leituras microbianas, em vez de nas propriedades físicas das moléculas que estão sendo lidas. Por exemplo, muitos protocolos de extração, protocolos de geração de biblioteca e protocolos de sequenciamento incluem etapas ou processos projetados para remover comprimentos curtos de fragmentos de ácido nucleico. Comprimentos curtos de fragmentos de ácido nucleico também são frequentemente sacrificados a fim de minimizar subprodutos indesejáveis ou incompletos de extração, geração de biblioteca ou amplificação, tais como dímeros iniciadores ou dímeros adaptadores. Os ácidos nucleicos livres de células microbianas são um exemplo de ácidos nucleicos alvo que são particularmente vulneráveis a polarizações e depleção de ácidos nucleicos curtos, pois os comprimentos de seus fragmentos estão abaixo de cerca de 100 bp.
[0013] A abordagem atual para distinguir entre uma infecção em estágio invisível ou latente e outros estágios de infecção após a identificação de um patógeno potencial pode exigir, às vezes, um procedimento de biópsia invasivo. Testes não invasivos, como a sorologia, podem detectar marcadores de exposição a micróbios, mas não indicam se a infecção está ativa ou se há risco de evolução para doença invasiva. Assim, há uma necessidade de uma abordagem precisa e não invasiva para determinar se o órgão de um paciente foi infectado e distinguir quais pacientes permanecerão no estágio de colonização e quais estão em risco de desenvolver uma doença invasiva secundária. A presente divulgação fornece métodos, composições e kits não invasivos para detectar uma infecção em um sujeito e determinar se a infecção está em um estágio de colonização ou de doença invasiva. A presente divulgação também fornece métodos não invasivos para determinar o sítio de localização em um sujeito e/ou estágio de infecção em um sujeito.
SUMÁRIO
[0014] Uma modalidade do pedido fornece um perfil de comprimento de fragmento a partir de uma biblioteca de ácido nucleico, em que os ácidos nucleicos usados para preparar a biblioteca de ácido nucleico foram obtidos a partir de uma amostra através de um método não polarizado, um método que permite a polarização corrigida ou um método com uma polarização reprodutível. Em vários aspectos, a biblioteca de ácido nucleico foi gerada a partir de uma amostra inicial e os ácidos nucleicos usados para gerar a biblioteca de ácido nucleico não são extraídos da amostra inicial antes de preparar a biblioteca de ácido nucleico ou antes de iniciar o processo de geração da biblioteca. Aspectos dos métodos podem compreender sequenciamento de ácido nucleico como uma etapa após a preparação de ácido nucleico e precedendo a determinação do perfil de comprimento de fragmento de ácidos nucleicos alvo, múltiplos ácidos nucleicos alvo ou um subconjunto de ácidos nucleicos dentro de uma biblioteca de ácido nucleico. Em aspectos da modalidade, o perfil de comprimento de fragmento compreende uma ou mais características selecionadas do grupo que compreende a forma da distribuição, amplitude do segmento, fração do segmento, forma de pico, número de picos, posição de um máximo de um pico, a razão de contagem do fragmento para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmento em dois comprimentos de fragmentos diferentes, razão de contagens de fragmentos em duas faixas de comprimento de fragmentos diferentes, a quantidade de fragmentos dentro de um segmento, a faixa de comprimento de fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos e distribuição do comprimento de fragmento dentro de um subconjunto de leituras, inclinação dentro de um segmento, largura do pico, a taxa de decaimento ou aumento da contagem dentro de um segmento, número de picos, escalonamento do decaimento ou aumento da contagem dentro de um segmento.
[0015] Métodos para gerar um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico são fornecidos. Os vários métodos compreendem as etapas de preparação de uma biblioteca de ácido nucleico a partir de uma amostra inicial usando um método de recuperação com polarização corrigida ou um método com uma polarização reproduzível, determinando o número ou contagem normalizada de leituras de vários comprimentos de fragmento dentro da biblioteca de ácido nucleico, determinação de uma ou mais características de comprimento de fragmento da biblioteca de ácido nucleico e geração de um perfil de comprimento de fragmento para a biblioteca de ácido nucleico usando uma ou mais características de comprimento de fragmento. Em aspectos da modalidade, o perfil de comprimento de fragmento compreende uma ou mais características de comprimento de fragmento selecionadas a partir do grupo que compreende a forma da distribuição, amplitude do segmento, forma de pico, a razão de contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmento diferentes, a razão de contagens de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a faixa de comprimento de fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos, posição de um máximo de um pico, número de picos e distribuição de comprimento de fragmento dentro de um subconjunto de leituras. Métodos para gerar um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico são fornecidos. Os vários métodos compreendem as etapas de preparação de uma biblioteca de ácido nucleico a partir de uma amostra inicial compreendendo as etapas de adicionar opcionalmente uma ou mais moléculas de controle de processo à amostra inicial para fornecer uma amostra inicial preparada e gerar uma biblioteca de ácido nucleico a partir da amostra inicial preparada, em que os ácidos nucleicos usados para gerar a biblioteca de ácido nucleico são opcionalmente não extraídos da amostra inicial antes da preparação da biblioteca de ácido nucleico.
Aspectos dos métodos podem compreender o sequenciamento de ácido nucleico como uma etapa após a preparação do ácido nucleico e precedendo a determinação do perfil de comprimento de fragmento.
Os métodos de geração de um perfil de comprimento de fragmento para ácidos nucleicos alvo dentro da biblioteca de ácido nucleico compreendem ainda as etapas de determinação do número de leituras de múltiplos comprimentos de fragmento dentro da biblioteca de ácido nucleico, determinação de uma ou mais características de comprimento de fragmento da biblioteca de ácido nucleico e a geração de um perfil de comprimento de fragmento para a biblioteca de ácido nucleico usando uma ou mais características de comprimento de fragmento.
Em aspectos da modalidade, o perfil de comprimento de fragmento compreende uma ou mais características do comprimento de fragmento selecionadas a partir do grupo que compreende a forma da distribuição, amplitude do segmento, forma de pico, número de picos, posição de um máximo de um pico, a razão de contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagens de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a faixa de comprimento de fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos e distribuição de comprimento de fragmento dentro de um subconjunto de leituras.
Em certos aspectos, a etapa de geração da biblioteca de ácido nucleico a partir da amostra inicial compreende ainda, consiste em ou consiste essencialmente nas etapas de desfosforilação de ácidos nucleicos a partir da amostra inicial para produzir um grupo de ácidos nucleicos desfosforilados, desnaturação dos ácidos nucleicos desfosforilados para produzir ácidos nucleicos desnaturados,
anexação de um adaptador de extremidade 3’ aos ácidos nucleicos desnaturados para produzir ácidos nucleicos adaptados, separação dos ácidos nucleicos adaptados, anelamento de um iniciador aos ácidos nucleicos adaptados e extensão do iniciador com uma polimerase para gerar filamentos complementares, anexação de um adaptador de extremidade 5’, eluição dos filamentos e ampliação dos filamentos complementares. Aspectos dos métodos podem compreender o sequenciamento de ácido nucleico como uma etapa após a preparação do ácido nucleico e precedendo a determinação do perfil de comprimento de fragmento. Em várias modalidades, o número de leituras é um número normalizado de leituras. Em algumas modalidades, o perfil de comprimento de fragmento é para pelo menos um subconjunto de leituras na biblioteca de ácido nucleico. Em tais modalidades, os métodos compreendem ainda as etapas de identificação de pelo menos um subconjunto de leituras na biblioteca de ácido nucleico e determinação da distribuição do comprimento de fragmento em cada subconjunto de leituras selecionado. Em algumas modalidades, a etapa de geração do perfil de comprimento de fragmento compreende ainda o uso de duas ou mais características do comprimento de fragmento.
[0016] Métodos de identificação de um micróbio presente em uma amostra são fornecidos. Métodos de identificação ou caracterização de um micróbio presente em uma amostra compreendem as etapas de geração de um perfil de comprimento de fragmento para as leituras de sequenciamento de uma biblioteca de ácido nucleico gerada a partir da amostra e alinhada com a sequência de referência do micróbio, comparando o perfil de comprimento de fragmento com os perfis de comprimento de fragmento de referência de um ou mais micróbios, e se o perfil de comprimento de fragmento da amostra for semelhante a um perfil de comprimento de fragmento de referência de um micróbio, identificar, então, o micróbio como presente na amostra. Aspectos do método compreendem a comparação de perfis de comprimento de fragmento para sequências alvo de uma biblioteca de ácido nucleico.
Em várias modalidades, o perfil de comprimento de fragmento pode indicar se o micróbio está presente como um patógeno ou um microrganismo comensal.
Em aspectos dos métodos, a geração de um perfil de comprimento de fragmento para a biblioteca de ácido nucleico compreende as etapas de preparação de uma biblioteca de ácido nucleico a partir de uma amostra inicial, quantificação do número de leituras de múltiplos comprimentos de fragmento dentro da biblioteca de ácido nucleico; determinar uma ou mais características de comprimento de fragmento da biblioteca de ácido nucleico ou pelo menos um subconjunto de leituras da biblioteca de ácido nucleico e gerar um perfil de comprimento de fragmento para a biblioteca de ácido nucleico ou pelo menos um subconjunto de leituras usando uma ou mais características de comprimento de fragmento.
A etapa de preparação de uma biblioteca de ácido nucleico a partir de uma amostra inicial compreende ainda as etapas de adição de uma ou mais moléculas de controle de processo à amostra inicial para fornecer uma amostra inicial preparada e gerar uma biblioteca de ácido nucleico a partir da amostra inicial preparada, em que os ácidos nucleicos usados para gerar a biblioteca de ácido nucleico não são extraídos da amostra inicial antes de preparar a biblioteca de ácido nucleico.
Aspectos dos métodos podem compreender o sequenciamento de ácido nucleico como uma etapa após a preparação do ácido nucleico e precedendo a determinação do perfil de comprimento de fragmento.
Em aspectos da modalidade, o perfil de comprimento de fragmento compreende uma ou mais características de comprimento de fragmento selecionadas a partir do grupo que compreende a forma da distribuição, amplitude do segmento, forma de pico, número de picos, posição do máximo do pico, a razão de contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagens de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a faixa de comprimento de fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos e distribuição de comprimento de fragmento dentro de um subconjunto de leituras. Em vários aspectos dos métodos, o perfil de comprimento de fragmento compreende pelo menos uma característica de comprimento de fragmento selecionada a partir do grupo que compreende a razão de contagem de fragmentos para dois ou mais segmentos, forma de pico, largura de pico, a taxa de decaimento ou aumento da contagem dentro de um segmento, número de picos, escalonamento do decaimento ou aumento da contagem dentro de um segmento, posição do máximo do pico.
[0017] Métodos para determinar o sítio de localização em um sujeito são fornecidos. Os métodos compreendem as etapas de geração de um perfil de comprimento de fragmento para ácidos nucleicos alvo em uma biblioteca de ácido nucleico ou a biblioteca de ácido nucleico inteira gerada a partir da amostra, comparando o perfil de comprimento de fragmento a um perfil de comprimento de fragmento de referência de um ou mais sítios de origem, e se o perfil de comprimento de fragmento da amostra for semelhante a um perfil de comprimento de fragmento a partir de um primeiro sítio de origem, prever, então, o primeiro sítio como um sítio de localização, se o perfil de comprimento de fragmento da amostra for semelhante a um perfil de comprimento de fragmento de um segundo sítio de origem, prever, então, o segundo sítio como um sítio de localização. Em modalidades dos métodos, a geração de um ou mais perfis de comprimento de fragmento para a biblioteca de ácido nucleico compreende as etapas de preparação de uma biblioteca de ácido nucleico a partir de uma amostra inicial, quantificação do número de leituras de múltiplos comprimentos de fragmento dentro da biblioteca de ácido nucleico, geração de um perfil de comprimento de fragmento para ácidos nucleicos alvo em uma biblioteca de ácido nucleico ou biblioteca de ácido nucleico inteira da biblioteca de ácido nucleico usando uma ou mais características de comprimento de fragmento. Em modalidades do método, a preparação de uma biblioteca de ácido nucleico a partir de uma amostra inicial compreende ainda as etapas de adição de uma ou mais moléculas de controle de processo à amostra inicial para fornecer uma amostra inicial preparada e gerar uma biblioteca de ácido nucleico a partir da amostra inicial preparada, em que os ácidos nucleicos usados para gerar a biblioteca de ácido nucleico não são extraídos da amostra inicial antes de preparar a biblioteca de ácido nucleico. Aspectos dos métodos podem compreender o sequenciamento de ácido nucleico como uma etapa após a preparação do ácido nucleico e precedendo a determinação do perfil de comprimento de fragmento. Em aspectos da modalidade, o perfil de comprimento de fragmento compreende uma ou mais características do comprimento de fragmento selecionadas a partir do grupo que compreende a forma da distribuição, amplitude do segmento, forma de pico, número de picos, uma posição do máximo do pico, a razão de contagem do fragmento para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagens de fragmentos em duas faixas de comprimento de fragmento diferentes, a faixa de comprimento de fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos, largura do pico, a taxa de decaimento ou aumento da contagem dentro de um segmento, número de picos, escalonamento de decaimento ou aumento da contagem dentro de um segmento e distribuição do comprimento de fragmento dentro de um subconjunto de leituras. Em aspectos dos métodos, o sítio de localização é selecionado a partir do grupo de sítios de origem compreendendo, consistindo em ou consistindo essencialmente em tecido profundo, pulmão, fígado, osso, rim, cérebro, coração, seios, trato GI, baço, pele, articulação, ouvido, nariz, boca, corrente sanguínea e sangue.
[0018] Métodos de monitoramento do estado do transplante em um sujeito são fornecidos. Os métodos de monitoramento do estado do transplante compreendem as etapas de geração de um perfil de comprimento de fragmento de linha de base a partir de uma biblioteca de ácido nucleico de uma amostra obtida do sujeito, geração de um perfil de comprimento de segundo fragmento para uma biblioteca de ácido nucleico gerada a partir de uma segunda amostra obtida do sujeito e comparação do perfil de comprimento de segundo fragmento com o perfil de comprimento de fragmento da linha de base. Se o perfil de comprimento de segundo fragmento difere do perfil de comprimento de fragmento de linha de base, administrar, então, internamente uma quantidade aumentada de uma terapia antirrejeição ao sujeito, em que um risco de rejeição em um sujeito com um transplante é menor após a administração da terapia antirrejeição. Se o perfil de comprimento de segundo fragmento for semelhante ao perfil de comprimento de fragmento de linha de base, manter ou reduzir, então, uma terapia antirrejeição, em que o risco de um efeito colateral da terapia antirrejeição no sujeito é menor do que seria se o sujeito recebesse uma quantidade aumentada da terapia antirrejeição. Aspectos do método compreendem a etapa de comparar um perfil de comprimento de fragmento para ácidos nucleicos alvo em uma biblioteca de ácido nucleico ou a biblioteca inteira de uma amostra obtida de um sujeito com um transplante e comparar o perfil a um perfil de comprimento de fragmento de referência.
[0019] Métodos para monitorar a toxicidade de um composto administrado a um sujeito são fornecidos. Os métodos compreendem as etapas de geração de um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico ou para ácidos nucleicos alvo na biblioteca de ácido nucleico preparada a partir de uma amostra obtida do sujeito e comparação do perfil de comprimento de fragmento com um ou mais perfis de comprimento de fragmento de referência. Em aspectos do método, o sujeito tem câncer, está em risco de ter câncer ou exibe um sintoma relacionado ao câncer. Em aspectos do método, um ou mais perfis de comprimento de fragmento de referência foram gerados a partir de uma biblioteca de ácido nucleico obtida de um sujeito ou célula exposta ao composto. Em aspectos do método, o um ou mais perfis de comprimento de fragmento de referência compreendem um perfil de comprimento de fragmento de linha de base. Em aspectos do método, o composto é um agente quimioterapêutico. Em modalidades do método, a etapa de geração de um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico compreende as etapas de preparação de uma biblioteca de ácido nucleico a partir de uma amostra inicial usando um método de recuperação com polarização corrigida; determinação do número de leituras de vários comprimentos de fragmento na biblioteca de ácido nucleico; determinação de uma ou mais características de comprimento de fragmento da biblioteca de ácido nucleico; e geração de um perfil de comprimento de fragmento para a biblioteca de ácido nucleico usando uma ou mais características de comprimento de fragmento.
Aspectos dos métodos podem compreender o sequenciamento de ácido nucleico como uma etapa após a preparação do ácido nucleico e precedendo a determinação do perfil de comprimento de fragmento.
Em aspectos da modalidade, o perfil de comprimento de fragmento compreende uma ou mais características do comprimento de fragmento selecionadas a partir do grupo que compreende a forma da distribuição, amplitude do segmento, forma de pico, a razão de contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagens de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a faixa de comprimento de fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos e distribuição de comprimento de fragmento dentro de um subconjunto de leituras.
Em modalidades dos métodos, a geração de um perfil de comprimento de fragmento para a biblioteca de ácido nucleico compreende as etapas de preparação de uma biblioteca de ácido nucleico a partir de uma amostra inicial, compreendendo ainda adicionar uma ou mais moléculas de controle de processo à amostra inicial para fornecer uma amostra inicial preparada e gerar uma biblioteca de ácido nucleico da amostra inicial preparada, em que os ácidos nucleicos usados para gerar a biblioteca de ácido nucleico não são extraídos da amostra inicial antes de preparar a biblioteca de ácido nucleico; quantificação do número de leituras de vários comprimentos de fragmento na biblioteca de ácido nucleico; determinação de uma ou mais características de comprimento de fragmento da biblioteca de ácido nucleico; e geração de um perfil de comprimento de fragmento para a biblioteca de ácido nucleico usando uma ou mais características de comprimento de fragmento. Em aspectos da modalidade, o perfil de comprimento de fragmento compreende uma ou mais características do comprimento de fragmento selecionadas a partir do grupo que compreende a forma da distribuição, amplitude do segmento, forma de pico, a razão de contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagens de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a faixa de comprimento de fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos e distribuição de comprimento de fragmento dentro de um subconjunto de leituras.
[0020] A presente invenção é direcionada a métodos para prever o risco de que um organismo (ou múltiplos organismos) presente em um hospedeiro crie uma mudança ambiental localizada ou sistêmica ou invasão de órgãos ou sistemas anatômicos com resultados de saúde substancialmente negativos. Um organismo é invasivo se passar uma barreira ou o mesmo se translocar de um órgão ou estrutura anatômica para outro, invadir uma estrutura além da camada de tecido que ocupou em um estado de colonização para criar uma invasão localizada, mudar o ambiente de uma estrutura de tal forma que ele crie impactos negativos significativos na estrutura ou causem mutações ou inflamação no DNA, ou, então, sobrecarregam o sistema imunológico do hospedeiro.
[0021] Em certas modalidades, o nível de risco é baseado na abundância do organismo no hospedeiro em comparação com um controle assintomático ou controle infectado. Em outras modalidades, a abundância é um limiar ou faixa. Em ainda outras modalidades, o nível de risco é calculado como uma pontuação de tomada de decisão clínica com base em um ou mais dos seguintes: abundância do organismo, histórico clínico do paciente, cronicidade da doença, fatores de biomarcadores genéticos e características do paciente (como idade, sexo, etc.), perfil de distribuição do comprimento de fragmento e uma característica do perfil de distribuição do comprimento de fragmento.
[0022] Em um aspecto, é fornecido um método para determinar o estágio de infecção de um sujeito suspeito de ter uma infecção microbiana que compreende:
[0023] (a) realizar sequenciamento de alto rendimento de ácidos nucleicos da dita amostra biológica;
[0024] (b) realizar análise de bioinformática para identificar sequências de ácidos nucleicos microbianas presentes na dita amostra biológica; e
[0025] (c) calcular uma medição para os ácidos nucleicos e comparar a medição com um controle, determinando, assim, o estágio de infecção para qualquer micróbio identificado na dita amostra biológica.
[0026] Em algumas modalidades, o método compreende ainda uma ou mais etapas selecionadas a partir do grupo que consiste em (a) extrair ácidos nucleicos de uma porção de uma amostra biológica obtida do sujeito e (b) adicionar spike-ins de ácido nucleico sintéticos.
[0027] Em uma modalidade, a medição da etapa (c) é selecionada a partir de uma abundância absoluta para as sequências de ácidos nucleicos livres de células microbianas, uma distribuição de comprimentos de fragmento para as sequências de ácidos nucleicos, uma característica do perfil de distribuição de comprimento de fragmento de ácido nucleico ou uma combinação dos mesmos. Em outra modalidade, a medição da etapa (c) é uma abundância absoluta e distribuição de comprimentos de fragmento para o patógeno alvo.
[0028] Em uma segunda modalidade, o sujeito apresenta sintomas de uma infecção ou corre o risco de ter uma infecção.
[0029] Em uma terceira modalidade, o estágio de infecção é uma fase invisível, uma fase sintomática de uma infecção, uma fase de tratamento ou um estágio de erradicação. Em uma quarta modalidade, o método compreende ainda repetir o método ao longo do tempo para monitorar uma infecção, estágio de infecção, eficácia de um tratamento para uma infecção ou detectar o início de uma infecção. Em aspectos, os métodos podem compreender ainda a alteração de um regime terapêutico.
[0030] Em uma quinta modalidade, o método compreende ainda a administração de um regime terapêutico ao sujeito com base no estágio de infecção determinado.
[0031] Em uma sexta modalidade, o ensaio de sequenciamento de alto rendimento é o sequenciamento de próxima geração, sequenciamento massivamente paralelo, pirossequenciamento, sequenciamento por síntese, sequenciamento em tempo real de molécula única, sequenciamento de polônia, sequenciamento de nanoesferas de DNA, sequenciamento de molécula única de heliscopo, sequenciamento de nanoporo, sequenciamento de Sanger, sequenciamento shotgun ou sequenciamento de Gilbert.
[0032] Em uma sétima modalidade, a amostra é sangue, plasma, soro, líquido cefalorraquidiano, líquido sinovial, lavagem broncoalveolar, expectoração, urina, fezes, saliva ou uma amostra nasal.
[0033] Em uma oitava modalidade, o método compreende ainda a identificação de genes resistentes a antibióticos do patógeno alvo.
[0034] Em uma nona modalidade, o método compreende ainda a identificação de pelo menos um fator de risco no DNA genômico do sujeito.
[0035] Em uma décima modalidade, o ácido nucleico é DNA livre de células e/ou RNA livre de células. Os ácidos nucleicos podem compreender DNA de patógeno livre de células. Os ácidos nucleicos podem compreender RNA de patógeno livre de células. Os ácidos nucleicos podem compreender DNA microbiano livre de células. Os ácidos nucleicos podem compreender RNA microbiano livre de células.
[0036] Em uma décima primeira modalidade, o patógeno alvo é Heliobacter pylori, Clostridium difficile, Haemophilus influenza, Salmonella, Streptococcus pneumoniae, Citomegalovírus, vírus da hepatite B, vírus da hepatite C, vírus do papiloma humano, vírus Epstein-Barr, vírus de linfoma de células T humanas do tipo 1, poliomavírus de células de Merkel, vírus sarcoma de Kaposi, Herpesvírus Humano 8, Clamídia, Gonorreia, Sífilis ou Tricomoníase.
[0037] Em uma décima segunda modalidade, o sujeito realizou anteriormente outro teste ou outros testes clínicos. Em uma modalidade, o outro teste clínico é o teste de antígeno fecal, teste respiratório de ureia, sorologia, teste de urease, histologia, cultura bacteriana e teste de sensibilidade, biópsia ou endoscopia.
[0038] Em uma décima terceira modalidade, os ácidos nucleicos do patógeno alvo são DNA e/ou RNA. Os ácidos nucleicos do patógeno compreendem DNA livre de células. Os ácidos nucleicos compreendem RNA de patógeno livre de células.
[0039] Em uma décima quarta modalidade, os spike- ins de ácido nucleico sintéticos compreendem pelo menos 1000 ácidos nucleicos sintéticos únicos para a amostra, em que cada um dos 1000 ácidos nucleicos sintéticos únicos compreende (i) uma etiqueta de identificação e (ii) uma região variável que compreende pelo menos 5 bases degeneradas. Em uma outra modalidade, o método compreende ainda
[0040] (a) opcionalmente extrair os ácidos nucleicos da amostra preparada;
[0041] (b) gerar uma biblioteca de amostra preparada;
[0042] (c) opcionalmente, enriquecer a biblioteca de amostra preparada;
[0043] (d) conduzir um ensaio de sequenciamento de alto rendimento para obter leituras de sequência da biblioteca de amostra preparada;
[0044] (e) calcular um valor de perda de diversidade de 1000 ácidos nucleicos sintéticos únicos e;
[0045] (f) calcular uma medição para os ácidos nucleicos e comparar a medição com um controle, determinando, assim, o estágio de infecção no sujeito.
[0046] Em ainda outra modalidade, os pelo menos 1000 ácidos nucleicos sintéticos únicos são ácidos nucleicos sintéticos conforme descrito no documento U.S. 9.976.181.
[0047] Em outro aspecto, há um método para determinar o estágio de infecção de Heliobacter pylori em um sujeito que compreende:
[0048] (a) opcionalmente, extrair ácidos nucleicos livres de células de uma amostra biológica obtida do dito sujeito;
[0049] (b) adicionar spike-ins de ácido nucleico sintéticos à amostra;
[0050] (c) realizar sequenciamento de alto rendimento de ácidos nucleicos da dita amostra biológica;
[0051] (d) realizar análise de bioinformática para identificar sequências de ácidos nucleicos de Heliobacter pylori presentes na dita amostra biológica; e
[0052] (e) calcular uma medição para os ácidos nucleicos de Heliobacter pylori e comparar a medição com um controle, determinando, assim, o estágio de infecção por Heliobacter pylori no dito sujeito.
[0053] Em uma primeira modalidade, a medição é uma abundância absoluta ou uma distribuição de comprimentos de fragmento ou combinação dos mesmos para Heliobacter pylori. Em uma modalidade, a medição é uma abundância absoluta para Heliobacter pylori. Em outra modalidade, a medição é uma distribuição de comprimentos de fragmento para
Heliobacter pylori. Em ainda outra modalidade, a medição é uma abundância absoluta e distribuição de comprimentos de fragmento para Heliobacter pylori. Em várias modalidades, as etapas do método podem ser realizadas em ordem variável.
[0054] Em uma segunda modalidade, o sujeito tem sintomas de uma infecção por Heliobacter pylori ou está em risco de ter uma infecção por Heliobacter pylori. Em uma modalidade, o estágio de infecção é uma fase invisível, uma fase sintomática de uma infecção, uma fase de tratamento ou um estágio de erradicação.
[0055] Em uma terceira modalidade, o método compreende ainda repetir o método ao longo do tempo para monitorar uma infecção ou eficácia de um tratamento para uma infecção.
[0056] Em um aspecto, há um método para determinar o estágio de infecção de Heliobacter pylori em um sujeito que compreende:
[0057] (a) produzir uma amostra preparada obtendo- se uma amostra de um sujeito que compreende ácidos nucleicos livres de células e adicionar uma ou mais moléculas de controle de processo;
[0058] (b) opcionalmente, extrair os ácidos nucleicos da amostra preparada;
[0059] (c) gerar uma biblioteca de amostra preparada, em que a geração compreende (i) anexar um adaptador aos ácidos nucleicos e (ii) amplificar;
[0060] (d) opcionalmente, enriquecer a biblioteca de amostra preparada;
[0061] (e) conduzir um ensaio de sequenciamento de alto rendimento para obter leituras de sequência da biblioteca de amostra preparada;
[0062] (f) calcular um valor de perda de diversidade de 1000 ácidos nucleicos sintéticos únicos e;
[0063] (g) calcular uma medição para os ácidos nucleicos livres de células e comparar a medição com um controle, determinando, assim, o estágio de infecção de Heliobacter pylori no sujeito.
[0064] Em ainda outra modalidade, os pelo menos 1000 ácidos nucleicos sintéticos únicos são ácidos nucleicos sintéticos conforme descrito no documento U.S. 9.976.181.
[0065] Em uma segunda modalidade, o ensaio de sequenciamento de alto rendimento é o sequenciamento de próxima geração, sequenciamento massivamente paralelo, pirossequenciamento, sequenciamento por síntese, sequenciamento em tempo real de molécula única, sequenciamento de polônia, sequenciamento de nanoesferas de DNA, sequenciamento de molécula única de heliscopo, sequenciamento de nanoporo, sequenciamento de Sanger, sequenciamento shotgun ou sequenciamento de Gilbert.
[0066] Em uma terceira modalidade, a amostra é sangue, plasma, soro, líquido cefalorraquidiano, líquido sinovial, lavagem broncoalveolar, urina, fezes, saliva ou uma amostra nasal.
[0067] Em uma quarta modalidade, o método compreende ainda a administração de um regime terapêutico ao sujeito, em que o tratamento pode ser administrado em qualquer estágio do ciclo de infecção.
[0068] Em uma quinta modalidade, o método compreende ainda a identificação de genes resistentes a antibióticos do patógeno alvo.
[0069] Em uma sexta modalidade, o ácido nucleico livre de células é DNA e/ou RNA. Os ácidos nucleicos compreendem DNA de patógeno livre de células. Os ácidos nucleicos compreendem RNA de patógeno livre de células.
[0070] Em uma sétima modalidade, o sujeito realizou anteriormente outro teste clínico. Em uma modalidade, o outro teste clínico é o teste de antígeno fecal, teste respiratório de ureia, sorologia, teste de urease,
histologia, cultura bacteriana e teste de sensibilidade, biópsia ou endoscopia.
[0071] Em uma oitava modalidade, os ácidos nucleicos do patógeno alvo são DNA e/ou RNA. Os ácidos nucleicos do patógeno compreendem DNA livre de células. Os ácidos nucleicos compreendem RNA de patógeno livre de células. Os ácidos nucleicos do patógeno alvo compreendem uma mistura de DNA livre de células e RNA livre de células.
[0072] Outro aspecto fornece um método para determinar um sítio de localização em um sujeito infectado por um patógeno que compreende:
[0073] (a) obter uma amostra de um sujeito que compreende ácidos nucleicos e adicionar uma ou mais moléculas de controle de processo, gerando, assim, uma amostra preparada;
[0074] (b) opcionalmente, extrair os ácidos nucleicos da amostra preparada;
[0075] (c) gerar uma biblioteca a partir da amostra preparada, em que a geração compreende anexar um adaptador aos ácidos nucleicos e amplificar;
[0076] (d) opcionalmente, enriquecer a amostra preparada;
[0077] (e) conduzir um ensaio de sequenciamento de alto rendimento para obter leituras de sequência da amostra preparada comparando com um genoma de referência;
[0078] (f) opcionalmente, calcular um valor de perda de diversidade; e
[0079] (g) calcular uma medição para os ácidos nucleicos e comparar a medição com um controle, determinando, assim, um sítio de localização no sujeito.
[0080] Em uma primeira modalidade, a medição é uma abundância absoluta ou uma distribuição de comprimentos de fragmento ou combinação dos mesmos para um patógeno alvo. Em uma modalidade, a medição é uma abundância absoluta para um patógeno alvo. Em outra modalidade, a medição é uma distribuição de comprimentos de fragmento para um patógeno alvo. Em ainda outra modalidade, a medição é uma abundância absoluta e distribuição de comprimentos de fragmento para um patógeno alvo.
[0081] Em uma segunda modalidade, o sítio de localização é um tecido. Em uma outra modalidade, o sítio de localização é um tipo de tecido. Em ainda outra modalidade, o sítio de localização é um órgão. Em outra modalidade adicional, o sítio de localização é um tipo de tecido que compreende um órgão.
[0082] Em uma terceira modalidade, o sujeito apresenta sintomas de uma infecção ou corre o risco de ter uma infecção. Em uma outra modalidade, o sujeito foi previamente identificado como infectado com Heliobacter pylori, Clostridium difficile, Haemophilus influenza, Salmonella, Streptococcus pneumoniae, Citomegalovírus, vírus da hepatite B, vírus da hepatite C, Vírus do papiloma humano, vírus de Epstein-Barr, vírus de linfoma de células T humanas do tipo 1, poliomavírus de células de Merkel, vírus sarcoma de Kaposi, Herpesvírus Humano 8, Clamídia, Vírus de Herpes Simples, espécies de Neisseria, espécies de Treponema ou espécies de Trichomonas.
[0083] Em uma quarta modalidade, o método é repetido ao longo do tempo para monitorar uma infecção ou eficácia de um tratamento para uma infecção.
[0084] Em uma quinta modalidade, o método compreende ainda a administração de um regime terapêutico ao sujeito com base no estágio de infecção determinado.
[0085] Em uma sexta modalidade, os pelo menos 1000 ácidos nucleicos sintéticos únicos são ácidos nucleicos sintéticos conforme descrito no documento U.S. 9.976.181.
[0086] Em uma sétima modalidade, o ensaio de sequenciamento de alto rendimento é o sequenciamento de próxima geração,
sequenciamento massivamente paralelo, pirossequenciamento, sequenciamento por síntese, sequenciamento em tempo real de molécula única, sequenciamento de polônia, sequenciamento de nanoesferas de DNA, sequenciamento de molécula única de heliscopo, sequenciamento de nanoporo, sequenciamento de Sanger, sequenciamento shotgun ou sequenciamento de Gilbert.
[0087] Em uma oitava modalidade, a amostra é sangue, plasma, soro, líquido cefalorraquidiano, líquido sinovial, lavagem broncoalveolar, urina, fezes, saliva, amostra nasal ou de tecido.
[0088] Em uma nona modalidade, o método compreende ainda a identificação de genes resistentes a antibióticos do patógeno.
[0089] Em uma décima modalidade, o método compreende ainda a identificação de fator de risco no DNA genômico do sujeito.
[0090] Em uma décima primeira modalidade, os ácidos nucleicos do patógeno alvo são DNA e/ou RNA. Os ácidos nucleicos do patógeno compreendem DNA livre de células. Os ácidos nucleicos compreendem RNA de patógeno livre de células. Os ácidos nucleicos do patógeno alvo compreendem uma mistura de DNA livre de células e RNA livre de células.
[0091] Em uma décima segunda modalidade, o ácido nucleico livre de células é DNA e/ou RNA. Os ácidos nucleicos compreendem DNA de patógeno livre de células. Os ácidos nucleicos compreendem RNA livre de células. Os ácidos nucleicos compreendem RNA de patógeno livre de células. Os ácidos nucleicos compreendem RNA de sujeito livre de células. Os ácidos nucleicos compreendem RNA de sujeito e o de patógeno livres de células.
[0092] Em um aspecto, é fornecido um método para determinar o estágio de infecção de um sujeito suspeito de ter uma infecção microbiana que compreende:
[0093] (a) fornecer uma amostra do dito sujeito que compreende ácidos nucleicos
[0094] (b) adicionar pelo menos 1000 ácidos nucleicos sintéticos únicos à amostra, gerando, assim, uma amostra preparada;
[0095] (c) gerar uma biblioteca a partir da amostra preparada;
[0096] (d) conduzir um ensaio de sequenciamento de alto rendimento para obter leituras de sequência da amostra preparada;
[0097] (e) determinar o estágio de infecção do dito sujeito com base nas leituras de sequência.
[0098] Em uma modalidade, a amostra é selecionada a partir sangue, plasma, soro, líquido cefalorraquidiano, líquido sinovial, lavagem broncoalveolar, urina, saliva, fezes, amostra nasal e de tecido. A amostra é sangue, plasma, soro, líquido cefalorraquidiano ou líquido sinovial.
[0099] Em ainda outra modalidade, os pelo menos 1000 ácidos nucleicos sintéticos únicos são ácidos nucleicos sintéticos conforme descrito no documento U.S. 9.976.181.
[0100] Em uma modalidade adicional, o ensaio de sequenciamento de alto rendimento é o sequenciamento de próxima geração, sequenciamento massivamente paralelo, pirossequenciamento, sequenciamento por síntese, sequenciamento em tempo real de molécula única, sequenciamento de polônia, sequenciamento de nanoesferas de DNA, sequenciamento de molécula única de heliscopo, sequenciamento de nanoporo, sequenciamento de Sanger, sequenciamento shotgun ou sequenciamento de Gilbert.
[0101] Em outra modalidade adicional, a determinação do estágio de infecção é baseada em uma abundância absoluta ou um perfil de distribuição de comprimento de fragmento ou combinação dos mesmos para um patógeno alvo. Em uma modalidade, a determinação é baseada em uma abundância absoluta para um patógeno alvo. Em outra modalidade, a determinação é baseada em uma distribuição de comprimentos de fragmento para um patógeno alvo. Em ainda outra modalidade, a determinação é com base em uma abundância absoluta e distribuição de comprimentos de fragmento para um patógeno alvo.
[0102] Um aspecto do pedido fornece um método para determinar o estágio de infecção em um sujeito. O método compreende as etapas de geração de um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico gerada a partir de uma amostra obtida do dito sujeito, comparando o perfil de comprimento de fragmento a um perfil de comprimento de fragmento de referência, e se o perfil de comprimento de fragmento da amostra é semelhante a um perfil de comprimento de fragmento de um sujeito sintomático, determinar, então, o estágio de infecção indica que o sujeito tem um risco aumentado de exibir um sintoma relacionado ao micróbio e se o perfil de comprimento de fragmento da amostra é semelhante a um perfil de comprimento de fragmento de um sujeito assintomático, então, determinar a infecção na fase invisível. Em um aspecto, o perfil de comprimento de fragmento é um perfil de comprimento de fragmento de biblioteca de ácido nucleico hospedeiro não microbiano. Em vários aspectos, o método compreende ainda as etapas de determinação de uma abundância de pelo menos um micróbio significativo em uma amostra do sujeito, comparando a abundância a um limiar e comparando o perfil de comprimento de fragmento a um perfil de comprimento de fragmento de referência. Se o perfil de comprimento de fragmento da amostra for semelhante a um perfil de comprimento de fragmento de um sujeito sintomático e a dita abundância for comparável ou acima de um limiar, então a determinação do estágio de infecção indica que o sujeito tem um risco aumentado de exibir um sintoma relacionado a micróbio. Se o perfil de comprimento de fragmento da amostra for semelhante ao perfil de comprimento de fragmento de um sujeito assintomático, a determinação da infecção está no estágio invisível. Em um aspecto, o método compreende ainda a etapa de administração de um agente antimicrobiano a um sujeito determinado a ter um risco aumentado de exibir um sintoma relacionado ao micróbio.
[0103] Um método para determinar o estágio de infecção de um sujeito suspeito de ter uma infecção microbiana que compreende a realização de sequenciamento de alto rendimento de ácidos nucleicos da amostra biológica, realização de análise de bioinformática para identificar sequências de ácidos nucleicos presentes na amostra biológica e cálculo de uma medição para os ácidos nucleicos e comparação da medição com um controle, determinando, assim, o estágio de infecção para um micróbio identificado na amostra biológica.
O método pode compreender ainda uma ou mais etapas selecionadas a partir do grupo que consiste em (i) extrair ácidos nucleicos de uma amostra biológica obtida do sujeito e (ii) adicionar spike-ins de ácido nucleico sintéticos à amostra biológica obtida do sujeito.
Em um aspecto, os ácidos nucleicos compreendem ácidos nucleicos microbianos, ácido nucleico do hospedeiro ou ambos os ácidos nucleicos microbianos e do hospedeiro.
Em um aspecto, os ácidos nucleicos compreendem ácidos nucleicos microbianos livres de células, ácido nucleico do hospedeiro ou ambos os ácidos nucleicos microbianos e do hospedeiro.
Em um aspecto, a medição é selecionada a partir do grupo de medições que consiste em uma abundância absoluta para os ácidos nucleicos, um perfil de distribuição de comprimento de fragmento para os ácidos nucleicos e uma abundância absoluta e um perfil de distribuição de comprimento de fragmento.
Em um aspecto, o estágio de infecção é selecionado a partir de um estágio invisível de infecção, estágio de colonização, estágio sintomático, estágio ativo, estágio de doença invasiva, estágio de resolução, fase de tratamento ou estágio de erradicação.
Em um aspecto, o método compreende ainda a administração de um regime terapêutico a um sujeito com base no estágio de infecção determinado.
O método pode compreender ainda a repetição do método ao longo do tempo para monitorar a infecção ou eficácia de um tratamento para a infecção.
Em alguns aspectos, o micróbio é selecionado a partir do grupo que compreende Heliobacter pylori, Clostridium difficile, Haemophilus influenza, Salmonella, Streptococcus pneumoniae, Citomegalovírus, vírus da hepatite B, vírus da hepatite C, vírus do papiloma humano, vírus Epstein-Barr, vírus de linfoma de células T humanas do tipo 1, poliomavírus de células de Merkel, vírus do sarcoma de Kaposi, Herpesvírus humano 8, Clamídia, vírus de Herpes Simples, espécies de Neisseria, espécies de Treponema ou espécies de Trichomonas. Em aspectos, adicionar os spike- ins de ácidos nucleicos sintéticos compreende ainda produzir uma amostra preparada obtendo-se uma amostra de um sujeito que compreende ácidos nucleicos livres de células e adicionando-se uma ou mais moléculas de controle de processo; extrair os ácidos nucleicos da amostra preparada; gerar uma biblioteca de amostra preparada; enriquecer a biblioteca de amostra preparada; conduzir um ensaio de sequenciamento de alto rendimento para obter leituras de sequência da biblioteca de amostra preparada; calcular um valor de perda de diversidade dos 1000 ácidos nucleicos sintéticos únicos e; calcular uma medição para os ácidos nucleicos livres de células e comparar a medição com um controle, determinando, assim, o estágio de infecção no sujeito.
[0104] Em uma modalidade, o pedido fornece um método para determinar o estágio de infecção por Heliobacter pylori em um sujeito que compreende extrair ácidos nucleicos de uma amostra biológica obtida do sujeito, adicionar spike-ins de ácido nucleico sintéticos à amostra, realizar sequenciamento de alto rendimento de nucleico ácidos da amostra biológica, realizar análise de bioinformática para identificar sequências de ácidos nucleicos de Heliobacter pylori livres de células presentes em uma amostra biológica e calcular uma medição para os ácidos nucleicos de Heliobacter pylori livres de células e comparar a medição com um controle, determinando, assim, o estágio de infecção por Heliobacter pylori no sujeito.
[0105] Em uma modalidade, o pedido fornece um método para determinar o estágio de infecção por Heliobacter pylori em um sujeito que compreende: produzir uma amostra preparada através da obtenção de uma amostra de um sujeito que compreende ácidos nucleicos livres de células e adicionar uma ou mais moléculas de controle de processo; extrair os ácidos nucleicos da amostra preparada; gerar uma biblioteca de amostra preparada, em que a geração compreende (i) anexar um adaptador aos ácidos nucleicos e (ii) amplificar; opcionalmente, enriquecer a biblioteca de amostra preparada; conduzir um ensaio de sequenciamento de alto rendimento para obter leituras de sequência da biblioteca de amostra preparada; calcular um valor de perda de diversidade dos 1000 ácidos nucleicos sintéticos únicos e calcular uma medição para os ácidos nucleicos livres de células e comparar a medição com um controle, determinando, assim, o estágio de infecção por Heliobacter pylori no sujeito.
[0106] Uma modalidade fornece métodos para determinar um sítio de localização em um sujeito infectado por um patógeno que compreende obter uma amostra de um sujeito que compreende ácidos nucleicos, adicionar uma ou mais moléculas de controle de processo à amostra inicial para fornecer uma amostra preparada, opcionalmente, extrair os ácidos nucleicos a partir da amostra preparada, gerar uma biblioteca a partir da amostra preparada, em que a geração compreende anexar um adaptador aos ditos ácidos nucleicos e amplificar; opcionalmente, enriquecer a amostra preparada, conduzir um ensaio de sequenciamento de alto rendimento para obter leituras de sequência da amostra preparada por comparação com um genoma de referência; determinar uma ou mais características de comprimento de fragmento da biblioteca de ácido nucleico, gerar um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico gerada a partir da amostra, comparar o perfil de comprimento de fragmento a um perfil de comprimento de fragmento de referência de um ou mais sítios de origem e, se o perfil de comprimento de fragmento da amostra é semelhante a um perfil de comprimento de fragmento de um primeiro sítio de origem, identificar, então, o primeiro sítio como um sítio de localização; se o perfil de comprimento de fragmento da amostra for semelhante a um perfil de comprimento de fragmento de um segundo sítio de origem, identificar, então, o segundo sítio como um sítio de localização.
[0107] Um aspecto fornece um método para determinar um sítio de localização em um sujeito infectado por um patógeno que compreende obter uma amostra de um sujeito que compreende ácidos nucleicos livres de células e adicionar uma ou mais moléculas de controle de processo, gerando, assim, uma amostra preparada; opcionalmente, extrair os ácidos nucleicos da amostra preparada; gerar uma biblioteca a partir da amostra preparada, em que a geração compreende anexar um adaptador aos ditos ácidos nucleicos e amplificar; opcionalmente, enriquecer a amostra preparada; conduzir um ensaio de sequenciamento de alto rendimento para obter leituras de sequenciamento da amostra preparada, comparando-se com um genoma de referência; calcular um valor de perda de diversidade dos 1000 ácidos nucleicos sintéticos únicos e calcular uma medição para os ácidos nucleicos livres de células e comparar a medição com um controle, determinando, assim, o sítio de localização no sujeito.
INCORPORAÇÃO A TÍTULO DE REFERÊNCIA
[0108] Todas as publicações, patentes e pedidos de patente mencionados neste relatório descritivo são incorporados neste documento a título de referência em sua totalidade na mesma medida como se cada publicação, patente ou pedido de patente individual fosse específica e individualmente indicado para ser incorporado a título de referência.
BREVE DESCRIÇÃO DOS DESENHOS
[0109] As novas funcionalidades da invenção são apresentadas com particularidade nas reivindicações anexas. Uma melhor compreensão das funcionalidades e vantagens da presente invenção será obtida por referência à seguinte descrição detalhada que estabelece modalidades ilustrativas, nas quais os princípios da invenção são utilizados, e os desenhos anexos dos quais:
[0110] A Figura 1 representa um dos métodos desta divulgação.
[0111] A Figura 2 representa um dos métodos livres de células desta divulgação.
[0112] A Figura 3 mostra um esquema de uma infecção exemplificativa.
[0113] A Figura 4 representa um dos métodos de detecção do sítio de infecção desta divulgação.
[0114] A Figura 5 representa um esquema geral de um método para determinar o valor de perda de diversidade.
[0115] A Figura 6 mostra um fluxo de trabalho de diagnóstico terminando com tratamento para um diagnóstico positivo de H. pylori.
[0116] A Figura 7 representa um sistema de controle de computador que é programado ou de outra forma configurado para implementar métodos fornecidos neste documento.
[0117] A Figura 8 representa a distribuição de comprimentos de fragmentos para leituras de três micróbios detectados em três diferentes amostras de plasma humano a partir das quais as bibliotecas de ácido nucleico foram geradas. A característica do comprimento de fragmento de interesse na Figura é a forma de distribuição. Cada painel fornece um exemplo de um forma de distribuição diferente. Em cada painel, o número normalizado de leituras é mostrado no eixo y e o comprimento de fragmento é indicado no eixo x. O painel esquerdo fornece um exemplo de um forma de distribuição de “pico de 50 pares de bases”. O painel do meio fornece um exemplo de um forma de distribuição semelhante ao exponencial curto. O painel direito fornece um exemplo de um forma de distribuição complexo, em que esse forma de distribuição complexo particular compreende aspectos do forma de distribuição do tipo decaimento exponencial e uma distribuição de 50 pares de base de pico único. É reconhecido que cada forma de distribuição representado reflete a distribuição de comprimentos de fragmento em uma biblioteca de ácido nucleico, sendo que cada uma é gerada a partir de uma amostra de plasma humano distinta, e fornece um exemplo do tipo de forma de distribuição indicado. Outros formas de distribuição são descritos em outro lugar neste documento. Outros formas de distribuição são possíveis.
[0118] A Figura 9 fornece exemplos relacionados às características de comprimento de fragmento de amplitude de segmento de distribuição e razões de amplitude de segmento. Os painéis representam a distribuição dos comprimentos de fragmento para leituras do mesmo patógeno (Candida tropicalis) de três amostras clínicas diferentes. Em cada painel, o número normalizado de leituras é mostrado no eixo y e o comprimento de fragmento é indicado no eixo x. As amostras clínicas são enumeradas de 1 a 3 para os fins dessa Figura. Candida tropicalis nas amostras Clínicas 1 e 2 mostra uma distribuição com fração longa maior (> 65 bp) em relação ao pico de 50 bp, em comparação com Candida tropicalis nas amostras Clínicas 3, enquanto todos os perfis de comprimento de fragmento têm um pico claro em aproximadamente 45 a 50 bp. A razão de leituras curtas (<40 bp) em relação ao pico de 50 bp também varia entre as três amostras. A amplitude do segmento de distribuição e as razões de amplitude do segmento (pico de < 40 bp a 50 bp e pico de >65 bp a 50 bp) refletem os resultados obtidos de um experimento.
[0119] A Figura 10 representa a distribuição do comprimento de fragmento de poliomavírus WU a partir de duas amostras clínicas. O painel esquerdo mostra uma distribuição com um único pico em torno do comprimento de fragmento de 50 pares de bases (bp). O painel direito mostra o padrão de combinação que compreende uma contribuição de formato distribuída exponencialmente, um pico e uma contribuição de fração longa. Sem ser limitado pelo mecanismo, a fração semelhante à exponencial curta pode sugerir a incorporação do vírus no genoma humano ou a degradação dos ácidos nucleicos microbianos por um processo distinto daquele que gera os fragmentos dentro do “pico de 50 bp”.
[0120] A Figura 11 fornece exemplos relacionados às características do comprimento de fragmento da razão de contagem de fragmentos em diferentes distribuições. Os painéis representam a razão de contagens de fragmentos na fração de “pico de 50 bp” vs. fração semelhante à exponencial curta (densidade de leitura 40 a 55 pb/densidade de leitura 23 a 35 bp, eixo x) versus contagens normalizadas (eixo y). A mesma fração para humanos e mitocôndrias humanas foram adicionadas para referência. A razão varia entre os tipos de reino. As razões para leituras bacterianas variam amplamente, enquanto as razões para leituras fúngicas mostram um padrão bimodal. As razões de leituras virais também são mostradas.
[0121] A Figura 12 fornece um sumário das distribuições de comprimento de fragmento para ácidos nucleicos livres de células maternas (linha tracejada) e fetais (linha sólida). O “pico de 50 bp” parece mais estreito na distribuição fetal, o que indica uma faixa de comprimento de fragmento menor dentro do pico dos ácidos nucleicos fetais. Além disso, a razão de leituras fetais e maternas é maior na região de “pico de 50 bp”, em comparação com os fragmentos de comprimento nucleossômico (por exemplo, região de 150 a 200 bp).
[0122] A Figura 13 fornece um sumário da distribuição do comprimento de fragmento para micróbios presentes como um patógeno ou como um microrganismo comensal. Os patógenos tendem a ter comprimentos de fragmento mais longos do que os microrganismos comensais em um ensaio à base de DNA de cadeia dupla reparável nas extremidades.
[0123] A Figura 14 fornece um sumário da distribuição do comprimento de fragmento de patógenos em bibliotecas de ácido nucleico geradas a partir de amostras nas quais a infecção foi confirmada por urina ou hemocultura. Os patógenos detectados em bibliotecas de ácido nucleico de amostras com testes de hemocultura ortogonal mostram uma fração mais alta de leituras longas do que os patógenos detectados em bibliotecas de ácido nucleico de amostras com culturas de urina ortogonais. O comprimento de leitura é mostrado no eixo x; a fração de leituras é mostrada no eixo y. A média das amostras de cultura de urina (linha sólida clara) e a média das amostras de cultura de sangue (linha tracejada clara) são mostradas no gráfico, assim como a diferença entre urina e sangue (pontos tracejados em negrito).
[0124] A Figura 15 sumariza os dados obtidos de amostras assintomáticas (AP), amostras positivas para diagnóstico (DP),
amostras positivas para diagnóstico confirmadas com qualquer método ortogonal (DPc) e amostras positivas para diagnóstico confirmadas com um método NGS ortogonal (DPNGS) e amostras positivas para diagnóstico confirmadas com um método microbiológico não NGS ortogonal (DP micro), conforme indicado.
A Figura 15A fornece plotagens de abundância em unidades de moléculas por microlitro (MPM) para os micróbios encontrados em níveis significativos no tipo de amostra indicado.
A Figura 15B fornece plotagens de abundâncias de MPM em amostras assintomáticas (AP) e amostras positivas para diagnóstico (DP) para os micróbios da mesma espécie presentes em ambos os tipos de amostras.
A Figura 15C fornece um exemplo de um eletroferograma TapeStation representativo de uma biblioteca obtida a partir de uma amostra positiva de diagnóstico incluída nesse estudo.
Os dados foram obtidos no TapeStation usando uma fita HS TapeStation D1000 com o Tampão de Carregamento e Escada de DNA de acordo com as instruções do fabricante.
Os marcadores de DNA Superior e Inferior são indicados na plotagem.
Um subconjunto de regiões de interesse nas faixas de comprimento de fragmento é indicado na plotagem para orientação (observa-se que os comprimentos de fragmento em um eletroferograma de uma biblioteca refletem os comprimentos das moléculas de ácido nucleico totalmente adaptadas, em vez dos comprimentos reais dos originais endógenos). O comprimento de fragmento da biblioteca é mostrado no eixo x; a intensidade normalizada (FU) é mostrada no eixo y.
A Figura 15D fornece plotagens das frações molares das leituras de sequenciamento que mapeiam a referência humana e mais de 64 bp (isto é, a maioria dessas leituras são de comprimento nucleossômico) após a etapa de corte de sequência do adaptador para amostras assintomáticas (AP) e amostras positivas para diagnóstico (DP) incluídas nesse estudo.
A Figura 15E fornece uma comparação sumarizada da abundância máxima de MPM para os micróbios encontrados em níveis significativos em cada amostra assintomática (AP) e positiva para diagnóstico (DP) nesse estudo com a fração das longas leituras humanas, conforme definido na legenda da Figura 15D, e encontrados nas mesmas amostras. Apenas as amostras de AP e DP onde nosso ensaio detectou micróbios em níveis significativos foram incluídas nesta análise. As setas indicam as amostras de AP que mostraram MPMs máximos e fração de leitura humana longa superior a 3000 e 0,4, respectivamente. A Figura 15F fornece uma comparação sumarizada das abundâncias máximas de MPM para os micróbios encontrados em níveis significativos em amostras assintomáticas (AP) e amostras negativas de diagnóstico (DN), com a fração das leituras humanas longas conforme definido para a Figura 15D e encontrados nas mesmas amostras. Apenas as amostras AP e DN em que nosso ensaio detectou micróbios em níveis significativos foram incluídas nesta análise.
[0125] A Figura 16A representa os resultados do treinamento de um preditor de um estado de infecção com base nos fragmentos humanos recuperados para sequenciamento de pacientes assintomáticos e sintomáticos. O painel esquerdo mostra as probabilidades de uma amostra ser assintomática com base em um modelo treinado por humanos. O painel direito representa as regiões dos comprimentos de fragmento relevantes para cada estado de infecção usado pelo modelo treinado por humanos. A Figura 16B descreve os resultados do treinamento de um preditor de um estado de infecção com base nos fragmentos mitocondriais humanos recuperados para sequenciamento de pacientes assintomáticos e sintomáticos. O painel esquerdo mostra as probabilidades de uma amostra ser assintomática com base no modelo treinado por mitocôndrias humanas. O painel direito representa as regiões dos comprimentos de fragmento relevantes para cada estado de infecção usado pelo modelo humano treinado com mitocôndrias. A Figura 16C descreve os resultados do treinamento de um preditor de um estado de infecção com base em todos os fragmentos de patógenos recuperados para sequenciamento de pacientes assintomáticos e sintomáticos. O painel esquerdo mostra as probabilidades de uma amostra ser assintomática com base em todos os modelos treinados por fragmentos de patógenos. O painel direito representa as regiões dos comprimentos de fragmento relevantes para cada estado de infecção usado por todos os modelos treinados de fragmentos de patógenos.
A Figura 16D descreve os resultados do treinamento de um preditor de um estado de infecção com base nos fragmentos de patógenos significativos recuperados para sequenciamento de pacientes assintomáticos e sintomáticos.
O painel esquerdo mostra as probabilidades de uma amostra ser assintomática com base no modelo treinado apenas nas leituras derivadas dos patógenos significativos.
O painel direito representa as regiões dos comprimentos de fragmento relevantes para cada estado de infecção reconhecido pelo modelo treinado nos patógenos significativos.
A Figura 16E descreve os resultados do treinamento de um preditor de um estado de infecção com base nos fragmentos bacterianos recuperados para sequenciamento de pacientes assintomáticos e sintomáticos.
O painel esquerdo mostra as probabilidades de uma amostra ser assintomática com base no modelo treinado por bactérias.
O painel direito representa as regiões dos comprimentos de fragmento relevantes para cada estado de infecção reconhecido pelo modelo treinado por bactérias.
A Figura 16F descreve os resultados do treinamento de um preditor de um estado de infecção com base nos fragmentos microbianos eucarióticos recuperados para sequenciamento de pacientes assintomáticos e sintomáticos.
O painel esquerdo mostra as probabilidades de uma amostra ser assintomática com base no modelo treinado por eucariotos.
O painel direito representa as regiões dos comprimentos de fragmento relevantes para cada estado de infecção reconhecido pelo modelo treinado em eucariotas.
A Figura 16G descreve os resultados do treinamento de um preditor de um estado de infecção com base nos fragmentos virais recuperados para sequenciamento de pacientes assintomáticos e sintomáticos.
O painel esquerdo mostra as probabilidades de uma amostra ser assintomática com base no modelo treinado por vírus.
O painel direito representa as regiões dos comprimentos de fragmento relevantes para cada estado de infecção reconhecido pelo modelo treinado por vírus.
A Figura 16H descreve os resultados do treinamento de um preditor de um estado de infecção com base nos fragmentos de arquea recuperados para sequenciamento de pacientes assintomáticos e sintomáticos. O painel esquerdo mostra as probabilidades de uma amostra ser assintomática com base no modelo treinado por arqueas. O painel direito representa as regiões dos comprimentos de fragmento relevantes para cada estado de infecção reconhecido pelo modelo treinado por arqueas.
[0126] Na Figura 17A as distribuições de comprimento de fragmento normalizado para os micróbios suspeitos de estarem infectando os pulmões são mostradas com cada painel mostrando uma distribuição para as espécies indicadas de micróbio e uma ID de Amostra indicada na parte superior de cada painel. A frequência é definida como a contagem das leituras alinhadas à referência do micróbio indicado de um comprimento de leitura particular (fragmento) normalizado pela contagem total das leituras alinhadas à referência do micróbio indicado. Na Figura 17B as distribuições de comprimento de fragmento normalizado para os micróbios suspeitos de infectar a corrente sanguínea são mostradas com cada painel mostrando uma distribuição para as espécies indicadas de micróbio e uma ID de Amostra indicada na parte superior de cada painel. A frequência é definida como a contagem das leituras alinhadas à referência do micróbio indicado de um comprimento de leitura particular (fragmento) normalizado pela contagem total das leituras alinhadas à referência do micróbio indicado.
[0127] A Figura 18A representa a distribuição normalizada do comprimento de fragmento para dois micróbios detectados nas amostras venosas de dois doadores diferentes. A distribuição normalizada do comprimento de fragmento do mapeamento das leituras para Haemophilus influenzae, um micróbio detectado no plasma obtido da coleta de sangue venoso do Doador 1 é mostrada no painel esquerdo. A distribuição normalizada do comprimento de fragmento do mapeamento das leituras para Streptococcus thermophilus, um micróbio detectado no plasma obtido da coleta de sangue venoso do Doador 2 é mostrada no painel direito. A Figura 18B representa distribuições normalizadas de comprimento de fragmento para os micróbios detectados nas amostras biológicas obtidas durante o processo de coleta de extração capilar dos mesmos dois doadores e retiradas no mesmo tempo de amostragem que as amostras venosas na Figura 18A. O painel superior esquerdo mostra a distribuição normalizada do comprimento de fragmento de Haemophilus influenzae, conforme detectado na amostra biológica obtida durante o processo de coleta de extração capilar do Doador 1. O painel inferior esquerdo mostra as distribuições de comprimento de fragmento normalizado para os micróbios adicionais detectados na amostra biológica obtida durante o processo de coleta de extração capilar do Doador 1. Seu padrão de distribuição médio é mostrado em linha preta em negrito. O painel superior direito mostra a distribuição normalizada do comprimento de fragmento de Streptococcus thermophilus, conforme detectado na amostra biológica obtida durante o processo de coleta de extração capilar do Doador 2. O painel inferior direito mostra as distribuições de comprimento de fragmento normalizado para os micróbios adicionais detectados na amostra biológica obtida durante o processo de coleta de extração capilar do Doador 2. Seu padrão de distribuição médio é mostrado em linha preta em negrito. A Figura 18C compara as abundâncias dos micróbios que ocorrem simultaneamente nas duas réplicas da amostra biológica obtida durante o processo de coleta por extração capilar para o Doador 1 (painel esquerdo) e Doador 2 (painel direito). A Figura 18D representa uma comparação das abundâncias microbianas para os micróbios detectados na amostra biológica obtida com um procedimento de coleta de sangue capilar (eixo x) com a abundância microbiana nas Amostras de Microvette Negativas. Os resultados obtidos para o Doador 1 e Doador 2 são mostrados no painel esquerdo e direito, respectivamente.
[0128] Na Figura 19A o sujeito RD-02 foi confirmado ortogonalmente como tendo uma infecção da corrente sanguínea por espécies de Enterobacter. Os painéis representam distribuições normalizadas de comprimento de fragmento para as sequências alinhadas ao complexo Enterobacter cloacae em bibliotecas de ácido nucleico geradas a partir de amostras de plasma coletadas em diferentes tempos de coleta indicados acima de cada painel. Na Figura 19B o sujeito RD-11 foi confirmado ortogonalmente como tendo endocardite causada por infecção por Staphylococcus aureus. Os painéis representam distribuições normalizadas de comprimento de fragmento para as sequências alinhadas a Staphylococcus aureus em bibliotecas de ácido nucleico geradas a partir de amostras de plasma coletadas em diferentes tempos de coleta indicados acima de cada painel. Na Figura 19C o sujeito RD-13 foi confirmado ortogonalmente para neutropenia febril causada por infecção por Escherichia coli. Os painéis representam distribuições normalizadas de comprimento de fragmento para as sequências alinhadas a Escherichia coli em bibliotecas de ácido nucleico geradas a partir de amostras de plasma coletadas em diferentes tempos de coleta indicados acima de cada painel.
[0129] A Figura 20A representa a fração de leituras fora da região de “pico de 50 bp” (<30 bp e> 60 bp) como uma função do tempo pós-admissão para distribuições de comprimento de fragmento de todos os micróbios confirmados ortogonalmente. São mostrados apenas os traços de tempo para os micróbios confirmados ortogonalmente, onde mais de 50 sequências únicas alinhadas às referências do micróbio foram detectadas. A Figura 20B representa as abundâncias em unidades de MPM em função do tempo pós-admissão para todos os micróbios confirmados ortogonalmente que foram detectados pelo método.
[0130] A Figura 21A mostra pares de micróbios confirmados ortogonalmente e não confirmados ortogonalmente na amostra de plasma coletada no ponto de tempo de admissão (t = 0) para dois sujeitos, RD- 06 e RD-13. O micróbio confirmado ortogonalmente em RD-06 (Staphylococcus aureus) é mostrado no painel superior esquerdo. O micróbio não confirmado em RD-06 (Haemophilus influenzae) é mostrado no painel esquerdo inferior. O micróbio confirmado ortogonalmente em RD-13 (Escherichia coli) é mostrado no painel superior direito. O micróbio não confirmado em RD-13 (Prevotella melaninogenica) é mostrado no painel inferior direito. Na Figura 21B as distribuições de comprimento de fragmento normalizado para Enterococcus gallinarum, um micróbio não confirmado ortogonalmente foi detectado em vários pontos de tempo pós-admissão em amostras de plasma coletadas do sujeito RD-
15. Os pontos de tempo são indicados acima dos painéis.
[0131] A Figura 22 representa os três modos principais de resposta da distribuição do comprimento de fragmento humano durante o tratamento de um sujeito infectado. O painel esquerdo mostra um exemplo em que a fração humana longa (> 60 bp) diminuiu durante o tratamento. O painel do meio mostra um exemplo em que a fração humana longa (> 60 bp) oscilou durante o tratamento. O painel direito mostra um exemplo em que a fração humana longa (> 60 bp) aumentou durante o tratamento.
[0132] A Figura 23 fornece um sumário das informações de comprimento de fragmento e conteúdo de GC para amostras de Streptococcus pasteuranius. A frequência relativa é mostrada no eixo y; o conteúdo de GC é mostrado no eixo x. As faixas de comprimento de fragmento de menos de 45 pares de bases, 45 a 54 pares de bases, 55 a 64 pares de bases, 65 a 74 pares de bases e mais de 74 pares de bases são mostradas. A distribuição do comprimento de fragmento em combinação com a informação do conteúdo de GC sugere uma polarização de temperatura induzida pelo processo para este micróbio.
DESCRIÇÃO DETALHADA
[0133] O sequenciamento de próxima geração (NGS) pode ser usado para reunir grandes quantidades de dados sobre o teor de ácido nucleico de uma amostra. Pode ser particularmente útil para analisar ácidos nucleicos em amostras complexas, como amostras clínicas. Até agora, esses sistemas de NGS se concentravam em determinar a abundância de leituras individuais. As propriedades primárias de interesse antes deste trabalho foram a sequência de cada leitura e a abundância de leituras associadas a uma fonte específica. Isso é particularmente verdadeiro para ácidos nucleicos microbianos e ácidos nucleicos microbianos livres de células. Em parte, isso se deve ao fato de que o processamento de amostra anterior necessário para muitos sistemas de NGS frequentemente resulta em erros e polarizações, particularmente para ácidos nucleicos de baixa abundância. Karius desenvolveu métodos de preparação de bibliotecas de ácido nucleico a partir de amostras iniciais que reduzem a polarização na recuperação das bibliotecas de ácido nucleico de uma amostra inicial ou que permitem a correção da polarização. A polarização reduzida nas bibliotecas de ácido nucleico obtidas a partir das amostras iniciais permitiu o desenvolvimento de perfis de comprimento de fragmento e métodos de geração de perfis de comprimento de fragmento para bibliotecas de ácido nucleico ou ácidos nucleicos alvo dentro das bibliotecas de ácido nucleico. Há uma necessidade de métodos eficientes e precisos para gerar perfis de comprimento de fragmento para bibliotecas de ácido nucleico. Esta necessidade pode ser vista, por exemplo, no que diz respeito à distinção entre micróbios intimamente relacionados, determinar se um micróbio está presente como um patógeno ou um microrganismo comensal, determinar a relação biológica do micróbio com um hospedeiro, prever infecção ou sítio de colonização em um sujeito, monitorar estado do transplante, monitoramento do desenvolvimento e estado fetal, monitoramento do tumor, monitoramento do estado e resposta do sistema imunológico e monitoramento da toxicidade de um composto administrado a um sujeito.
[0134] Um perfil de comprimento de fragmento compreende uma ou mais características de comprimento de fragmento para uma biblioteca de ácido nucleico ou um subconjunto de leituras de uma biblioteca de ácido nucleico. Um perfil de comprimento de fragmento pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais características de comprimento de fragmento. Um valor ponderado pode ser atribuído a uma ou mais características de comprimento de fragmento em um perfil de comprimento de fragmento de modo que uma ou mais características de comprimento de fragmento possam ter pesos ou valores iguais ou diferentes dentro do perfil de comprimento de fragmento. As características do comprimento de fragmento incluem, mas não estão limitadas à forma da distribuição, amplitude do segmento, forma de pico, a razão da contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagem de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a faixa de comprimento de fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos, a posição de um pico ou picos e a distribuição do comprimento de fragmento dentro de um subconjunto de leituras. Pretende-se que as razões “entre 2 ou mais segmentos” englobem, mas não se limitem a, dois ou mais segmentos de uma biblioteca de ácido nucleico, dois ou mais segmentos de duas ou mais bibliotecas de ácido nucleico, dois ou mais segmentos da mesma forma de pico, dois ou mais segmentos de diferentes formas de pico, dois ou mais segmentos de tipos de biblioteca de ácido nucleico semelhantes ou diferentes e dois ou mais segmentos de subconjuntos semelhantes ou diferentes de leituras de uma biblioteca de ácido nucleico.
[0135] Os tipos de distribuição incluem, mas não estão limitados a, um forma de pico único, uma forma de pico múltiplo, distribuições exponenciais ou do tipo exponenciais, distribuições infladas para fragmentos longos ou curtos, distribuições planas ou uniformes, formas de distribuição complexas e suas combinações. A distribuição complexa pode incluir aspectos de pelo menos 2, pelo menos 3, pelo menos 4, pelo menos 5, pelo menos 6, pelo menos 7, pelo menos 8 ou mais formas de pico. Uma forma de pico único pode ocorrer em torno de qualquer comprimento de fragmento, incluindo, mas não se limitando a cerca do comprimento de fragmento de 50 pares de bases. Fragmentos longos podem incluir comprimentos de fragmento maiores do que cerca de 60 pares de bases, cerca de 65 pares de bases, cerca de 70 pares de bases, cerca de 75 pares de bases, cerca de 80 pares de bases, cerca de 85 pares de bases, cerca de 90 pares de bases, cerca de 95 pares de bases, cerca de 100 pares de bases, cerca de 150 pares de bases, cerca de 175 pares de bases, cerca de 200 pares de bases, cerca de 250 pares de bases,
cerca de 300 pares de bases, cerca de 350 pares de bases e cerca de 400 pares de bases. Fragmentos curtos podem incluir comprimentos de fragmento mais curtos que cerca de 500 bp, cerca de 400 bp, cerca de 300 bp, cerca de 200 bp, cerca de 100 bp, cerca de 50 bp, cerca de 40 bp, cerca de 35 bp, cerca de 30 bp, cerca de 25, cerca de 20 bp. Os aspectos do forma de pico incluem, mas não estão limitados à faixa do segmento, amplitude do segmento e o número total de leituras dentro do segmento, largura do pico, inclinação do pico, derivada do pico; aspectos do forma de pico podem variar.
[0136] Uma distribuição de forma de pico único pode abranger uma faixa de comprimentos de fragmento, incluindo, mas não se limitando a pelo menos cerca de 5 pares de bases, pelo menos cerca de 10 pares de bases, pelo menos cerca de 15 pares de bases, pelo menos cerca de 20 pares de bases, pelo menos cerca de 30 pares de bases, pelo menos cerca de 35 pares de bases, pelo menos cerca de 40 pares de bases, ou mais do que pelo menos cerca de uma faixa de comprimento de fragmento de 45 pares de bases dentro de um segmento. A faixa de comprimento de fragmento dentro de um segmento pode variar. Por exemplo, a faixa de comprimento de fragmento em torno de uma distribuição de pico único de 50 pares de bases inclui, mas não está limitada a comprimentos de fragmento de 30 a 60 pares de bases, 35 a 60 pares de bases, 40 a 60 pares de bases e 45 a 55 pares de bases.
[0137] A amplitude do segmento abrange a abundância ou abundância relativa de leituras para um comprimento de fragmento dentro de um segmento definido. Em alguns aspectos, a amplitude de distribuição pode ser a maior abundância ou abundância relativa dentro de uma faixa de comprimento de fragmento definida; amplitude de distribuição também pode abranger a maior abundância média ou abundância relativa dentro de um intervalo de comprimento de fragmento definido. Em alguns aspectos do pedido, uma distribuição de comprimento de fragmento ou perfil de distribuição de comprimento de fragmento é obtido para um subconjunto de leituras de uma biblioteca de ácido nucleico. Um subconjunto de leituras de uma biblioteca de ácido nucleico se destina a abranger menos do que o conjunto completo de leituras de uma biblioteca de ácido nucleico. Os subconjuntos podem refletir leituras determinadas como sendo de um tipo específico de micróbio, de espécies de micróbio específicas, leituras do hospedeiro, leituras maternas, leituras fetais, leituras de doadores de órgãos, leituras de não hospedeiros, leituras de ácido nucleico livre de células microbianas, leituras de ácido nucleico livre de células, leituras microbianas ou qualquer outro grupo; alternativamente, um subconjunto de leituras pode refletir o conjunto completo de leituras menos as de um tipo específico de micróbio, leitura materna, leitura fetal ou qualquer outro grupo. Em alguns aspectos do pedido, uma distribuição de comprimento de fragmento é obtida para ácidos nucleicos alvo. “Ácidos nucleicos alvo” podem ser fragmentos de ácido nucleico derivados de micróbios, órgão transplantado, células tumorais, células cancerosas, DNA mitocondrial hospedeiro ou não hospedeiro, sequências de genes de resistência a antibiótico, DNA genômico do hospedeiro, sequências microbianas integradas no genoma do hospedeiro ou qualquer outra sequência ou sequências de interesse em uma biblioteca de ácido nucleico. Uma sequência alvo pode ter migrado de outro sítio, como um sítio de infecção ou órgão doado.
[0138] Em alguns casos, o ácido nucleico alvo pode constituir apenas uma porção muito pequena de toda a amostra, por exemplo, menos de 0,1%, menos de 0,01%, menos de 0,001%, menos de 0,0001%, menos de 0,00001%, menos de 0,000001%, menos de 0,0000001% do total de ácidos nucleicos em uma amostra. Frequentemente, os ácidos nucleicos totais em uma amostra original podem variar. Por exemplo, os ácidos nucleicos livres de células totais (por exemplo, DNA, mRNA, RNA) podem estar em uma faixa de 0,01 a 10000 ng/ml, por exemplo, (cerca de 0,01, 0,1, 1, 5, 10, 20, 30, 40, 50, 80, 100, 1000, 5000, 10000 ng/ml). Em alguns casos, a concentração total de ácidos nucleicos livres de células em uma amostra está fora desta faixa (por exemplo, menos de 0,01 ng/ml; em outros casos, a concentração total é maior que 10000 ng/ml). Este pode ser o caso com amostras de ácido nucleico livre de células (por exemplo, DNA) que são predominantemente compostas de DNA e/ou RNA humano. Em tais amostras, os ácidos nucleicos alvo do patógeno podem ter presença escassa em comparação com os ácidos nucleicos humanos ou hospedeiros.
[0139] O comprimento dos ácidos nucleicos alvo pode variar. Em algumas modalidades particulares, os ácidos nucleicos alvo são relativamente curtos; em outras modalidades, os alvos são relativamente longos. Em algumas modalidades particulares, os ácidos nucleicos alvo são mais curtos do que 110 bp.
[0140] Como usado neste documento, “ácido nucleico” refere-se a um polímero ou oligômero de nucleotídeos e é geralmente sinônimo do termo “polinucleotídeo” ou “oligonucleotídeo”. Os ácidos nucleicos podem compreender, consistir em ou consistir essencialmente em um desoxirribonucleotídeo, um ribonucleotídeo, um análogo de desoxirribonucleotídeo, desoxirribonucleotídeos canônicos quimicamente modificados, ribonucleotídeos e/ou análogo de ribonucleotídeo, ácidos nucleicos com estruturas principais modificadas ou qualquer combinação dos mesmos.
[0141] Os ácidos nucleicos podem ser qualquer tipo de ácido nucleico incluindo, mas não se limitando a: ácidos nucleicos de fita dupla (ds), ácidos nucleicos de fita simples (ss), DNA, RNA, cDNA, mRNA, cRNA, tRNA, RNA ribossômico, dsDNA, ssDNA, miRNA, siRNA, RNA em formato de grampo curto, ácidos nucleicos circulantes, ácidos nucleicos livres de células circulantes, DNA circulante, RNA circulante, ácidos nucleicos livres de células, DNA livre de células, RNA livre de células, DNA livre de células circulantes, células dsDNA livre, ssDNA livre de célula, RNA livre de célula circulante, DNA genômico, exossomos, ácidos nucleicos de patógenos livres de células, micróbio circulante ou ácidos nucleicos de patógenos, ácidos nucleicos mitocondriais, ácidos nucleicos não mitocondriais, DNA nuclear, RNA nuclear, DNA cromossômico, DNA tumoral circulante, RNA tumoral circulante, ácidos nucleicos circulares, DNA circular, RNA circular, DNA circular de fita simples,
DNA circular de fita dupla, plasmídeos, ácidos nucleicos bacterianos, ácidos nucleicos fúngicos, ácidos nucleicos do parasita, ácidos nucleicos virais, ácidos nucleicos bacterianos livres de células, ácidos nucleicos fúngicos livres de células, ácidos nucleicos de parasitas livres de células, ácidos nucleicos associados a partículas virais, DNA mitocondrial, ácidos nucleicos hospedeiros, ácidos nucleicos livres de células hospedeiras, ácidos nucleicos de sinal intercelular, ácidos nucleicos exógenos, enzimas de DNA, enzimas de RNA, ácidos nucleicos terapêuticos, ou qualquer combinação dos mesmos. Os ácidos nucleicos podem ser ácidos nucleicos derivados de micróbios ou patógenos, incluindo, mas não se limitando a vírus, bactérias, fungos, parasitas e qualquer outro micróbio, particularmente um micróbio infeccioso ou micróbio potencialmente infeccioso. Os ácidos nucleicos podem derivar de arqueas, bactérias, fungos, bolores, eucariotas e/ou vírus. Em algumas modalidades, os ácidos nucleicos podem ser derivados diretamente do sujeito ou hospedeiro, em oposição a um micróbio ou patógeno.
[0142] Tal como utilizado no presente documento, uma “biblioteca de ácido nucleico” refere-se a uma coleção de fragmentos de ácido nucleico. A coleção de fragmentos de ácido nucleico pode ser usada, por exemplo, para sequenciamento. Uma biblioteca de ácido nucleico pode ser preparada a partir de uma amostra inicial usando um método de recuperação com polarização corrigida para gerar uma biblioteca de sequenciamento ou usando um método de recuperação de polarização para gerar uma biblioteca de sequenciamento permitindo a polarização corrigida. Conforme usado neste documento, os métodos de “recuperação corrigida de polarização” são métodos com produção de comprimento de fragmento consistente que geralmente recuperam fragmentos de ácidos nucleicos de amostra dentro de um comprimento alvo e faixa de GC sem comprimento apreciável e polarização de GC, métodos que permitem a polarização corrigida, métodos capazes de contabilizar a polarização a partir de uma amostra e métodos capazes de contabilizar uma polarização introduzida por um processo do método de geração de uma biblioteca de ácido nucleico. Métodos de recuperação corrigida de polarização podem incluir, mas não estão limitados a adicionar uma molécula de controle de processo, extração, geração de uma biblioteca, sequenciamento, amplificação e qualquer combinação dos mesmos. Os métodos de recuperação não polarizada incluem, mas não estão limitados aos descritos nos documentos de Nº provisório U.S.: 62/770,181 e 62/644.357. Métodos para gerar uma biblioteca de ácido nucleico a partir de uma amostra inicial sem extrair os ácidos nucleicos antes de iniciar o processo de geração da biblioteca de ácido nucleico a partir da amostra inicial são fornecidos. Em algumas modalidades, as substâncias que podem diminuir o rendimento ou inibir a geração de uma biblioteca de ácido nucleico, por si só, podem ser extraídas ou removidas, mas os ácidos nucleicos não são extraídos da amostra inicial antes de a biblioteca de ácido nucleico ser gerada. O método compreende, consiste em, ou consiste essencialmente em adicionar uma ou mais moléculas de controle de processo a uma amostra inicial e gerar a biblioteca de ácido nucleico a partir da amostra inicial preparada. O método compreende, consiste em, ou consiste essencialmente em gerar a biblioteca de ácido nucleico a partir da amostra inicial preparada. As bibliotecas de ácido nucleico podem utilizar ácidos nucleicos de fita simples e/ou de fita dupla.
[0143] Métodos de geração de uma biblioteca de ácido nucleico a partir de uma amostra com extração também estão incluídos.
[0144] As moléculas de controle de processo podem ser uma ou mais de ID Spike(s), SPANKs, Sparks ou GC Spike-in Panel, moléculas de controle de desfosforilação, moléculas de controle de desnaturação e/ou moléculas de controle de ligação. Consultar, por exemplo, o Pedido de Patente Publicado nº U.S. 2015-0133391 e o Pedido de Patente Publicado nº U.S. 2017-0016048, as divulgações completas de cada um estão incorporadas neste documento por referência em sua totalidade para todos os fins). Em algumas modalidades, a amostra inicial compreende, consiste em ou consiste essencialmente em ácidos nucleicos doadores circulantes (consultar,
por exemplo, documento nº U.S. 20150211070, que é incorporado a título de referência neste documento em sua totalidade, incluindo quaisquer desenhos).
[0145] Como usado neste documento, “desnaturação” refere-se a um processo no qual biomoléculas, como proteínas ou ácidos nucleicos, perdem sua estrutura nativa ou de ordem superior. A estrutura nativa e de ordem superior pode incluir, por exemplo, sem limitação, estrutura quaternária, estrutura terciária ou estrutura secundária. Por exemplo, uma molécula de ácido nucleico de fita dupla pode ser desnaturada em duas moléculas de fita simples.
[0146] Como usado neste documento, o termo “desfosforilação” ou “desfosforilar” refere-se à remoção de um fosfato, tal como o fosfato de extremidade 5’ e/ou 3’, de um ácido nucleico, tal como, por exemplo, DNA.
[0147] Conforme usado neste documento, “detectar” refere-se à detecção quantitativa ou qualitativa, incluindo, sem limitação, detecção por meio da identificação da presença, ausência, quantidade, frequência, concentração, sequência, forma, estrutura, origem ou quantidade de um analito.
[0148] Em algumas modalidades, anexar um adaptador de extremidade 3’ a ácidos nucleicos, por exemplo, ácidos nucleicos desnaturados ou desfosforilados e/ou anexar um adaptador de extremidade 5’ compreende, consiste em, ou consiste essencialmente em ligar-se a uma enzima que compreende, consiste em, ou consistindo essencialmente em uma ligase, por exemplo, uma T4 DNA ligase, CircLigase II. Em algumas modalidades, a ligase é uma ligase de fita simples. Em algumas modalidades, anexar um adaptador de extremidade 3’ a ácidos nucleicos, por exemplo, ácidos nucleicos desnaturados ou desfosforilados e/ou anexar um adaptador de extremidade 5’ compreende, consiste em ou consiste essencialmente na utilização de reação de troca de modelo. Em algumas modalidades, anexar um adaptador de extremidade 3’ aos ácidos nucleicos, por exemplo, ácidos nucleicos desnaturados ou desfosforilados compreende, consiste em, ou consiste essencialmente em se estender com uma enzima que compreende, consiste em, ou consiste essencialmente em uma polimerase, por exemplo, uma polimerase TdT. Em algumas modalidades, o método compreende ainda, consiste em, ou consiste essencialmente na utilização de uma DNA polimerase, por exemplo, fragmento de Klenow, transcriptase reversa SuperScript IV, Transcriptase Reversa SMART MMLV, etc. para estender um iniciador hibridizado com ácidos nucleicos ou ácidos nucleicos adaptados e para gerar fitas complementares. Em algumas modalidades, um ácido nucleico alvo pode ser anexado a um ou mais adaptadores. Em algumas modalidades, um ácido nucleico alvo é anexado ao mesmo adaptador ou adaptadores diferentes em ambas as extremidades.
[0149] Conforme usado neste documento, “polarização de GC” refere-se ao desempenho, tratamento ou recuperação diferencial de ácidos nucleicos de diferentes teores de GC, mas com comprimento idêntico.
[0150] Conforme usado neste documento, “conteúdo de GC” ou “conteúdo de guanina-citosina” referem-se à porcentagem de bases nitrogenadas em um ácido nucleico, como uma molécula de DNA ou RNA, que são guanina ou citosina ou suas modificações químicas.
[0151] Conforme usado neste documento, “hospedeiro” se refere a um organismo que abriga outro organismo. Este último é definido como organismo “não hospedeiro”. Por exemplo, um humano pode ser um hospedeiro que abriga um micróbio, patógeno ou feto, o micróbio, patógeno ou feto sendo o não hospedeiro. Os ácidos nucleicos ou materiais do hospedeiro são derivados de um hospedeiro. Os ácidos nucleicos ou materiais não hospedeiros podem derivar de um organismo não hospedeiro, de material transplantado ou de um feto ou material fetal dentro de um hospedeiro.
[0152] Conforme usado neste documento, “micróbio”, “microbiano” ou “microrganismo” refere-se a um organismo, tal como, por exemplo, um organismo microscópico ou macroscópico, que pode existir como uma única célula ou como uma colônia de células, capsídeos, esporos, filamentos ou organismos multicelulares. Micróbios incluem todos os organismos unicelulares e alguns organismos multicelulares, como, por exemplo, os de arqueas, bactérias, protozoários, nematoides, vírus e eucariotas. Os micróbios são frequentemente patógenos responsáveis por doenças, mas também podem existir em uma relação simbiótica não patogênica com um hospedeiro, como um ser humano. Um “microrganismo comensal” se destina a incluir micróbios que existem em uma relação simbiótica não patogênica com um hospedeiro. Um organismo hospedeiro pode abrigar vários tipos de organismos não hospedeiros simultaneamente. Na coinfecção, um organismo hospedeiro abriga vários tipos de organismos não hospedeiros. Os vários tipos de organismos não hospedeiros podem incluir um ou mais patógenos, um ou mais microrganismos comensais, ou pelo menos um patógeno e pelo menos um microrganismo comensal. Os métodos do pedido atual podem ser usados para distinguir entre microrganismos intimamente relacionados, distinguir entre micróbios presentes como um patógeno, um microrganismo comensal ou como microrganismos incidentais, mas clinicamente sem importância.
[0153] Micróbios ou patógenos podem incluir arqueas, bactérias, leveduras, fungos, bolores, protozoários, nematoides, eucariotas e/ou vírus. Micróbios ou patógenos também podem incluir vírus de DNA, vírus de RNA, bactérias cultiváveis, bactérias fastidiosas e não cultiváveis adicionais, micobactérias e patógenos eucarióticos (Consultar Bennett J.E., D., R., Blaser, M.J. Mandell, Douglas, and Bennett’s Principles and Practice of Infectious Diseases; Saunders, Philadelphia, PA, 2014; and Netter's Infectious Disease, 1ª Edição, editado por Elaine C. Jong, MD and Dennis L. Stevens, MD, PhD (2015)). Micróbios ou patógenos também podem incluir qualquer um dos micróbios estabelecidos em https://www.ncbi.nlm.nih.gov/genome/microbes/ ou https://www.ncbi.nlm.nih.gov/biosample/.
[0154] Exemplos de micróbios são uma ou mais das espécies ou cepas de um ou mais dos seguintes gêneros: Coniosporium,
Hantavirus, Talaromyces, Machlomovirus, Betatetravirus, Raoultella, Aeromonas, Ephemerovirus, Empedobacter, Loa, Macluravirus, Stenotrophomonas, Alfamovirus, Rosavirus, Emmonsia, Aggregatibacter, Orthopneumovirus, Weeksella, Nairovirus, Salivirus, Weissella, Mosavirus, Gammapartitivirus, Strongyloides, Passerivirus, Erysipelatoclostridium, Bacillarnavirus, Iotatorquevirus, Taenia, Trypanosoma, Olsenella, Cladosporium, Rhizobium, Prevotella, Leclercia, Paracoccus, Ilarvirus, Lagovirus, Rasamsonia, Plasmodium, Acremonium, Chlamydia, Clonorchis, Vibrio, Bartonella, Nakazawaea, Franconibacter, Anisakis, Norovirus, Nocardia, Solobacterium, Parechovirus, Avenavirus, Orthohepevirus, Aphthovirus, Hepandensovirus, Microbacterium, Lichtheimia, Lomentospora, Achromobacter, Ipomovirus, Tsukamurella, Elizabethkingia, Hepevirus, Seadornavirus, Alternaria, Trueperella, Gammatorquevirus, Bifidobacterium, Chrysosporium, Thogotovirus, Curtovirus, Deltatorquevirus, Balamuthia, Mastrevirus, Bdellomicrovirus, Mupapillomavirus, Pseudozyma, Wickerhamiella, Aquamavirus, Alloscardovia, Thielavia, Idaeovirus, Henipavirus, Coxiella, Haemophilus, Gammacoronavirus, Negevirus, Brevibacterium, Peptoniphilus, Alphacarmotetravirus, Nosema, Trichovirus, Arenavirus, Thermomyces, Necator, Waikavirus, Blosnavirus, Jonesia, Tetraparvovirus, Emaravirus, Plectrovirus, Sclerodarnavirus, Toxocara, Umbravirus, Burkholderia, Chromobacterium, Paracoccidioides, Brugia, Eragrovirus, Macrococcus, Absidia, Colletotrichum, Inovirus, Phycomyces, Wickerhamomyces, Acidaminococcus, Moraxella, Rothia, Phlebovirus, Slackia, Purpureocillium, Betapapillomavirus, Tupavirus, Cryspovirus, Saksenaea, Erysipelothrix, Kobuvirus, Mimoreovirus, Echinococcus, Mannheimia, Bergeyella, Cyclospora, Xylanimonas, Leptospira, Finegoldia, Curvularia, Cryptosporidium, Babuvirus, Pecluvirus, Lambdatorquevirus, Pythium, Carlavirus, Entomobirnavirus, Kocuria, Anaplasma, Ampelovirus, Avihepatovirus, Nepovirus, Rhodococcus, Bordetella, Mischivirus, Scedosporium, Gardnerella, Maculavirus, Trichoderma, Aveparvovirus, Salmonella, Avastrovirus, Copiparvovirus, Trachipleistophora, Clostridioides,
Nanovirus, Siccibacter, Leptotrichia, Citrivirus, Odoribacter, Sanguibacter, Novirhabdovirus, Acremonium, Hafnia, Chaetomium, Tenuivirus, Yokenella, Rubulavirus, Varicellovirus, Alphamesonivirus, Sicinivirus, Leuconostoc, Microvirus, Gallantivirus, Morbillivirus, Lolavirus, Pantoea, Hepatovirus, Nupapillomavirus, Metschnikowia, Barnavirus, Kytococcus, Tritimovirus, Tannerella, Respirovirus, Pneumocystis, Dirofilaria, Pediococcus, Lactococcus, Blastomyces, Dianthovirus, Actinobacillus, Teschovirus, Oscivirus, Begomovirus, Potyvirus, Byssochlamys, Alphacoronavirus, Molluscipoxvirus, Lymphocryptovirus, Sapelovirus, Parabacteroides, Pyrenochaeta, Listeria, Senecavirus, Brevidensovirus, Potexvirus, Parvimonas, Flavivirus, Recovirus, Toxoplasma, Yatapoxvirus, Opisthorchis, Trichuris, Cyphellophora, Morganella, Perhabdovirus, Micrococcus, Pequenovirus, Mastadenovirus, Anaeroglobus, Tropheryma, Dolosigranulum, Wolbachia, Lelliottia, Mycoplasma, Tobravirus, Shewanella, Paeniclostridium, Erythroparvovirus, Sutterella, Sporopachydermia, Narnavirus, Nyavirus, Francisella, Arthroderma, Epsilontorquevirus, Sigmavirus, Amdoparvovirus, Actinomyces, Alphapermutotetravirus, Cardiobacterium, Influenzavirus C, Orthopoxvirus, Poacevirus, Phialophora, Lactobacillus, Polyomavirus, Debaryomyces, Foveavirus, Bymovirus, Mycoflexivirus, Grimontia, Mucor, Rhytidhysteron, Quadrivirus, Thermoascus, Aureusvirus, Trichosporon, Myceliophthora, Dermacoccus, Dysgonomonas, Pseudoramibacter, Becurtovirus, Gordonia, Sapovirus, Orthobunyavirus, Spiromicrovirus, Pomovirus, Exophiala, Sneathia, Helicobacter, Photorhabdus, Mogibacterium, Betapartitivirus, Avibirnavirus, Ambidensovirus, Oleavirus, Orientia, Deltacoronavirus, Anulavirus, Trichomonasvirus, Budvicia, Geotrichum, Enamovirus, Lachnoclostridium, Schistosoma, Paecilomyces, Panicovirus, Rhizoctonia, Brevibacillus, Beauveria, Pestivirus, Tombusvirus, Cilevirus, Cokeromyces, Peptostreptococcus, Phanerochaete, Proteus, Idnoreovirus, Aspergillus, Pasteurella, Malassezia, Hanseniaspora, Endornavirus, Azospirillum, Velarivirus, Cystovirus, Avisivirus, Bacteroides, Picobirnavirus, Myroides, Circovirus, Arterivirus, Aquaparamyxovirus, Onchocerca, Cosavirus,
Kluyveromyces, Fijivirus, Candida, Hepacivirus, Dermabacter, Ourmiavirus, Allexivirus, Enterobacter, Acidovorax, Bracorhabdovirus, Carmovirus, Pluralibacter, Coltivirus, Fonsecaea, Streptobacillus, Corynebacterium, Macrophomina, Marburgvirus, Comovirus, Fabavirus, Alphanodavirus, Cellulomonas, Enterobius, Catabacter, Moellerella, Nakaseomyces, Cucumovirus, Valsa, Deltapartitivirus, Plesiomonas, Pseudomonas, Torovirus, Cuevavirus, Hypovirus, Trichomonas, Influenzavirus D, Giardiavirus, Crinivirus, Tepovirus, Sakobuvirus, Cyberlindnera, Paenalcaligenes, Bafinivirus, Rymovirus, Pegivirus, Yarrowia, Treponema, Borreliella, Rubivirus, Aureobasidium, Angiostrongylus, Filobasidium, Photobacterium, Rhizopus, Orthoreovirus, Ustilago, Simplexvirus, Aquareovirus, Protoparvovirus, Propionibacterium, Sprivivirus, Hunnivirus, Apophysomyces, Meyerozyma, Alphapapillomavirus, Candida, Brucella, Gallivirus, Dinovernavirus, Anaerobiospirillum, Eubacterium, Tatlockia, Terrisporobacter, Quaranjavirus, Sobemovirus, Dicipivirus, Arcanobacterium, Macanavirus, Atopobium, Vesivirus, Lodderomyces, Dinornavirus, Betatorquevirus, Kerstersia, Aparavirus, Neisseria, Agrobacterium, Edwardsiella, Labyrnavirus, Totivirus, Actinomadura, Tobamovirus, Influenzavirus B, Mandarivirus, Anaerococcus, Kunsagivirus, Naegleria, Campylobacter, Veillonella, Yamadazyma, Filobasidiella, Oerskovia, Penicillium, Anncaliia, Leptosphaeria, Pneumovirus, Psychrobacter, Isavirus, Granulicatella, Torradovirus, Cladophialophora, Influenzavirus A, Ophiostoma, Aerococcus, Ureaplasma, Etatorquevirus, Bocaparvovirus, Megasphaera, Reptarenavirus, Comamonas, Capnocytophaga, Alphatorquevirus, Syncephalastrum, Wallemia, Betacoronavirus, Hyphopichia, Nocardiopsis, Legionella, Trichinella, Paraburkholderia, Mammarenavirus, Echinostoma, Sphingobacterium, Enterovirus, Methanobrevibacter, Ochroconis, Cheravirus, Pasivirus, Enterococcus, Mycoreovirus, Tospovirus, Betanodavirus, Phytoreovirus, Enterocytozoon, Ferlavirus, Stemphylium, Filifactor, Leishmaniavirus, Gemella, Bromovirus, Alloiococcus, Cunninghamella, Cronobacter, Oribacterium, Orbivirus, Chrysovirus, Cripavirus, Tatumella,
Pandoraea, Ogataea, Dracunculus, Volvariella, Iflavirus, Benyvirus, Rhadinovirus, Histoplasma, Rahnella, Morococcus, Verticillium, Janibacter, Gyrovirus, Alphapartitivirus, Mycobacterium, Roseomonas, Varicosavirus, Chryseobacterium, Parapoxvirus, Rhizomucor, Aureimonas, Levivirus, Leishmania, Luteovirus, Cypovirus, Ochrobactrum, Microsporum, Piscihepevirus, Ceratocystis, Sporothrix, Vesiculovirus, Cupriavidus, Cryptococcus, Metapneumovirus, Alphanecrovirus, Eikenella, Brevundimonas, Escherichia, Leifsonia, Schizophyllum, Granulibacter, Gordonibacter, Lachancea, Madurella, Ophiovirus, Phellinus, Nebovirus, Acanthamoeba, Fusobacterium, Pichia, Verruconis, Ehrlichia, Tibrovirus, Higrevirus, Wohlfahrtiimonas, Rhinocladiella, Neorickettsia, Sadwavirus, Roseobacter, Sequivirus, Pannonibacter, Rotavirus, Turicella, Cardiovirus, Propionimicrobium, Furovirus, Naumovozyma, Closterovirus, Fluoribacter, Zeavirus, Clavispora, Megrivirus, Gammapapillomavirus, Rickettsia, Polemovirus, Corynespora, Encephalitozoon, Shimwellia, Fusarium, Yersinia, Capronia, Delftia, Victorivirus, Marafivirus, Kluyvera, Iteradensovirus, Isoptericola, Vitivirus, Roseolovirus, Conidiobolus, Abiotrophia, Babesia, Phoma, Sanguibacteroides, Staphylococcus, Rhodotorula, Zetatorquevirus, Hymenolepis, Fasciola, Cytorhabdovirus, Cardoreovirus, Memnoniella, Trichophyton, Mitovirus, Phaeoacremonium, Providencia, Lysinibacillus, Giardia, Oligella, Streptomyces, Paraclostridium, Ralstonia, Coccidioides, Brambyvirus, Biatriospora, Allolevivirus, Acinetobacter, Starmerella, Omegatetravirus,Porphyromonas, Avulavirus, Streptococcus, Arcobacter, Topocuvirus, Mamastrovirus, Ancylostoma, Bornavirus, Capillovirus, Alphavirus, Tymovirus, Nucleorhabdovirus, Diaporthe, Chlamydiamicrovirus, Turncurtovirus, Saccharomyces, Riemerella, Betanecrovirus, Clostridium, Mobiluncus, Cercospora, Marnavirus, Mortierella, Aquabirnavirus, Xanthomonas, Dependoparvovirus, Ebolavirus, Neofusicoccum, Borrelia, Leminorella, Klebsiella, Blastocystis, Alcaligenes, Citrobacter, Eggerthella, Cedecea, Serratia, Penstyldensovirus, Bacillus, Laribacter, Wuchereria, Hordeivirus,
Cytomegalovirus, Actinomucor, Ascaris, Shigella, Vittaforma, Torulaspora, Kingella, Oryzavirus, Polerovirus, Tremovirus, Erbovirus, Entamoeba, Lyssavirus, Paenibacillus, Facklamia, Kappatorquevirus, Metarhizium, Stachybotrys, Okavirus, Botrexvirus, Thetatorquevirus e Basidiobolus.
[0155] Tal como utilizado no presente documento, o estágio de infecção ou estágio de infecção refere-se à fase invisível da infecção, a fase sintomática de uma infecção, a fase de resolução de uma infecção, a fase de tratamento, uma fase recorrente, uma fase recrudescente, uma fase aguda ou infecção, uma fase crônica ou infecção, uma fase lenta ou latente ou infecção, uma infecção persistente, um estágio de infecção disseminada, uma fase primária, uma fase secundária ou uma fase terciária da infecção. A fase invisível de uma infecção ocorre antes do surgimento dos sintomas ou antes que os sintomas sejam percebidos pelo sujeito ou por outras pessoas. Sinônimos de “fase invisível” incluiriam “estágio de infecção pré-sintomática”, “estágio inicial de uma infecção” e “estágio inicial de infecção”. Um organismo comensal pode persistir no estágio invisível da infecção. A fase sintomática de uma infecção ocorre quando o sujeito ou outras pessoas notam os sintomas ou alterações clínicas, como, por exemplo, febre, dor, erupção cutânea, dor de cabeça, dores, problemas respiratórios, etc. A fase de resolução de uma infecção durante a qual uma infecção se resolve por si mesma ou administrando um tratamento. A fase de tratamento pode fazer parte da fase de resolução se um tratamento for administrado. Uma fase recorrente ocorre se um sujeito experimenta a recorrência de uma infecção em qualquer um dos estágios acima. Uma fase recrudescente ocorre se a infecção não for tratada adequadamente ou suficientemente na primeira vez e voltar. A infecção crônica é um tipo de infecção persistente que acaba sendo eliminada. Uma fase aguda ou infecção ocorre repentinamente, como hepatite. Uma fase ou infecção lenta ou latente é uma infecção que dura o resto da vida do hospedeiro. Uma infecção persistente é uma infecção que dura por longos períodos; infecções persistentes ocorrem quando a infecção primária não é eliminada pelo hospedeiro. Alguns micróbios infectam hospedeiros com infecções de fase primária, secundária e terciária; um exemplo é a infecção por Treponema pallidum. Uma infecção pode permanecer em qualquer um dos estágios acima por um período indefinido de tempo, sem necessariamente progredir para uma fase diferente. Um micróbio comensal ou simbiótico pode permanecer no estágio invisível de infecção indefinidamente ou não pode infectar.
[0156] Uma variedade de relações ou interações biológicas hospedeiro-micróbio são conhecidas na técnica. As interações biológicas hospedeiro-micróbio incluem, mas não estão limitadas a comensalismo, mutualismo, amensalismo, parasitismo, simbiose e competição. É reconhecido que um micróbio pode exibir um tipo de interação com o hospedeiro quando está localizado em certos sítios, mas pode exibir outro tipo de interação com o hospedeiro quando é localizado em outro sítio dentro do hospedeiro. Por exemplo, um micróbio pode existir em uma relação comensalística com o hospedeiro na pele do hospedeiro, mas pode existir em uma relação parasitária ou competitiva interna ao hospedeiro. Conforme usado neste documento, "patógeno" se refere a um microrganismo que causa, ou pode causar, ou é suspeito de causar doença.
[0157] Conforme usado neste documento, a frase "amostra inicial preparada" refere-se a uma amostra inicial à qual moléculas de controle de processo foram adicionadas antes do início da geração de uma biblioteca de sequenciamento.
[0158] O termo "derivado de" abrange os termos "originado de", "obtido de", "obtido de" e "criado de" geralmente indica que um material especificado encontra sua origem em outro material especificado ou tem características que podem ser descritas com referência a outro material especificado. Por exemplo, uma amostra inicial pode ser derivada de uma amostra biológica bruta.
[0159] Em algumas modalidades, a amostra inicial compreende, consiste em ou consiste essencialmente em um sólido ou um fluido corporal, como sangue, plasma, soro, fluido cerebroespinhal, fluido sinovial, lavagem broncoalveolar, urina, fezes, saliva, fluido abdominal, fluido ascite, lavagem peritoneal, fluido gástrico, fluido intersticial, fluido linfático, bile, fluido de abscesso, tecido, fluido amniótico, mecônio, aspirado de seio nasal, linfonodo, medula óssea, cabelo, unhas, esfregaço de bochecha, esfregaço de pele, esfregaço uretral, esfregaço cervical, swab nasofaríngeo, aspirado nasofaríngeo, swab vaginal, células epiteliais, sêmen, secreção vaginal, fluido intercelular, fluido pericárdico, swab retal, osso, tecido da pele, tecido mole, lágrimas e/ou uma amostra nasal. Em algumas modalidades, a amostra inicial compreende, consiste em ou consiste essencialmente em plasma. Em algumas modalidades, a amostra inicial compreende, consiste em ou consiste essencialmente em urina. Em algumas modalidades, a amostra inicial compreende, consiste em ou consiste essencialmente em líquido cefalorraquidiano. Em algumas modalidades, a amostra inicial é de um sujeito humano.
[0160] Em algumas modalidades, uma amostra inicial pode ser composta de, no todo ou em parte, células e/ou tecido. A amostra inicial pode estar isenta de células ou esgotada. A amostra livre de células inicial pode compreender, consistir em ou consistir essencialmente em ácidos nucleicos que se originaram de um sítio diferente no corpo, como um sítio de infecção patogênica. No caso de sangue, soro, linfa ou plasma, a amostra livre de células ou amostra inicial esgotada de células pode conter ácidos nucleicos livres de células "circulantes" que se originaram em locais anatômicos diferentes do sítio de coleta de fluido corporal do fluido em questão. No caso da urina, os ácidos nucleicos sem células podem ser ácidos nucleicos sem células que se originaram em um sítio diferente no corpo. As amostras livres de células ou amostras iniciais esgotadas de células podem ser obtidas esgotando ou removendo células, fragmentos de células ou exossomos por uma técnica conhecida, como por centrifugação ou filtração.
[0161] Tal como utilizado no presente documento, o termo "doença invasiva" refere-se a uma doença baseada, em parte, na capacidade de determinados patógenos de comprometer seriamente a saúde de certos indivíduos infectados, em oposição a simplesmente colonizar outros indivíduos infectados, como um comensal ou infecção com nenhum ou sintomas menores. Por exemplo, certos micróbios podem colonizar tecidos localmente sem causar nenhum problema de saúde em alguns hospedeiros, enquanto, em outros hospedeiros, eles podem invadir tecidos a ponto de causar inflamação grave, dano a tecidos ou órgãos, sepse, câncer e outras doenças graves questões. Os micróbios também podem colonizar um sujeito que é assintomático em um momento, mas posteriormente desenvolve sintomas graves quando o micróbio se transloca e/ou se torna "ativo".
[0162] Tal como utilizado no presente documento, o termo "livre de células" refere-se à condição do ácido nucleico fora de uma célula, partícula viral ou vírion conforme apareceu no corpo imediatamente antes de a amostra ser obtida do corpo. Por exemplo, os ácidos nucleicos livres de células circulantes em uma amostra podem ter se originado como ácidos nucleicos livres de células circulando na corrente sanguínea de um sujeito. Em contraste, os ácidos nucleicos que são extraídos após a coleta de um microrganismo intacto, como um patógeno transmitido pelo sangue, ou removidos após a coleta de vírions intactos em uma amostra de plasma, geralmente não são considerados "livres de células".
[0163] O presente pedido fornece métodos para determinar um sítio de localização em um sujeito. Os ácidos nucleicos de micróbios ou microrganismos de diferentes sítios dentro de um sujeito podem exibir diferentes perfis de comprimento de fragmento. O perfil de comprimento de fragmento de uma biblioteca de ácido nucleico ou um subconjunto da biblioteca de ácido nucleico contendo ácidos nucleicos microbianos difere se a infecção microbiana está circulando em vez de localizada em um ou mais sítios de localização. Assim, comparar um perfil de comprimento de fragmento a um perfil de comprimento de fragmento de referência de um ou mais sítios de origem pode prever um sítio de localização se o perfil de comprimento de fragmento da amostra for semelhante a um perfil de comprimento de fragmento de referência de um sítio de origem. Por "sítio de localização" entende-se qualquer sítio de origem dentro de um sujeito onde um micróbio ocorre, persiste, sobrevive ou prolifera. Os sítios de origem incluem, mas não estão limitados à corrente sanguínea, sangue, tecido profundo, tais como, mas não limitados a, rins, fígado, estômago, bexiga, órgãos digestivos, células nervosas, pulmão, osso, cérebro, coração, revestimento do coração, seios da face, trato gastrointestinal, baço, pele, articulação, ouvido, nariz e boca. Prevê-se que um sujeito pode ter mais de um sítio de localização para um determinado micróbio. É ainda entendido que alguns sítios de localização para um micróbio específico podem não contribuir para um estado ou condição de doença. Em vez disso, alguns sítios de localização para um micróbio específico podem indicar uma relação comensal entre o micróbio e o hospedeiro, enquanto outros sítios de localização para um micróbio específico podem indicar uma relação parasitária ou amensal entre o micróbio e o hospedeiro. É ainda reconhecido que a ocorrência de múltiplos sítios de localização para um determinado micróbio pode indicar uma infecção sistêmica do hospedeiro. Além disso, é reconhecido que o sítio de localização para um determinado micróbio ou patógeno de interesse pode impactar a decisão de tratar ou não tratar e pode impactar a seleção de opções de tratamento apropriadas. Por exemplo, e sem ser limitado por mecanismo, um patógeno fúngico localizado na pele pode ser tratado de forma diferente de um patógeno fúngico localizado no pulmão e um micróbio bacteriano localizado no tecido cardíaco incluindo, mas não se limitando ao revestimento do ouvido, pode ser tratado de forma diferente de um micróbio bacteriano localizado no sangue ou corrente sanguínea.
[0164] Em algumas modalidades, uma amostra inicial compreende, consiste em ou consiste essencialmente em tumor circulante ou ácidos nucleicos fetais. (Consultar, por exemplo, Análise de ácidos nucleicos sanguíneos ou sanguíneos, como tumor circulante ou ácidos nucleicos fetais, por exemplo, conforme descrito nas Patentes nºs U.S. 8.877.442 e 9.353.414,
ou na identificação de patógenos por meio de, por exemplo, análise de microrganismos circulantes ou ácidos nucleicos virais, por exemplo, conforme descrito no pedido de patente publicado nos EUA nº 2015-0133391 e no pedido de patente publicado nos EUA nº 2017-0016048, as divulgações completas de cada um são incorporadas neste documento a título de referência em sua totalidade para todos os fins). Em algumas modalidades, a amostra inicial compreende, consiste em ou consiste essencialmente em ácidos nucleicos doadores circulantes (consultar, por exemplo, documento nº U.S. 20150211070, que é incorporado a título de referência neste documento em sua totalidade, incluindo quaisquer desenhos).
[0165] Uma amostra inicial pode ser derivada de qualquer sujeito (por exemplo, um sujeito humano, um sujeito não humano, etc.). O assunto pode ser saudável. Em algumas modalidades, o sujeito é um paciente humano com, suspeito de ter, ou em risco de ter, uma doença ou infecção. Em algumas modalidades, a doença ou infecção está relacionada ao patógeno.
[0166] Um sujeito humano pode ser homem ou mulher. Em algumas modalidades, a amostra pode ser de um embrião humano ou de um feto humano. Em algumas modalidades, o humano pode ser um bebê, criança, adolescente, adulto ou idoso. Em algumas modalidades, o sujeito é um sujeito do sexo feminino que está grávida, com suspeita de gravidez ou planejando engravidar.
[0167] Em algumas modalidades, o sujeito é um sujeito humano que foi submetido a um transplante de órgão ou que está planejando se submeter a um transplante de órgão.
[0168] Em algumas modalidades, o sujeito é um animal de fazenda, um animal de laboratório ou um animal de estimação doméstico. Em algumas modalidades, o animal pode ser um inseto, um cachorro, um gato, um cavalo, uma vaca, um camundongo, um rato, um porco, um peixe, um pássaro, uma galinha ou um macaco.
[0169] O sujeito pode ser um organismo, como um organismo unicelular ou multicelular. Em algumas modalidades, a amostra pode ser obtida de uma planta, fungo, eubactéria, arqueabactéria, protista ou qualquer organismo multicelular. O sujeito pode ser células em cultura, que podem ser células primárias ou células de uma linha celular estabelecida.
[0170] Em algumas modalidades, o sujeito tem uma doença ou distúrbio genético, é afetado por uma doença ou distúrbio genético ou está em risco de ter uma doença ou distúrbio genético. Uma doença ou distúrbio genético pode ser ligado a uma variação genética, como mutações, inserções, adições, deleções, translocações, mutações pontuais, distúrbios de repetição de trinucleotídeos, polimorfismos de nucleotídeo único (SNPs) ou uma combinação de variações genéticas.
[0171] Em alguns aspectos, o sujeito é saudável ou assintomático, ou exibe sintomas clínicos leves ou não específicos. Em alguns casos, um sujeito pode estar infectado ou suspeito de estar infectado por um patógeno específico. Em outros casos, o sujeito é suspeito de ter uma infecção de origem desconhecida. Em alguns casos, o sujeito foi exposto a um patógeno, ou suspeito de ter sido exposto a um patógeno, como pelas condições de vida, por viagem a uma determinada região geográfica ou por interação ou interação sexual com um indivíduo infectado.
[0172] A amostra inicial pode ser de um sujeito que tem uma doença, condição ou infecção específica, ou é suspeito de ter (ou em risco de ter) uma doença, condição ou infecção específica. Por exemplo, a amostra inicial pode ser de um paciente com câncer, um paciente com suspeita de câncer ou um paciente em risco de ter câncer. Em algumas modalidades, a amostra inicial pode ser de um paciente com uma infecção, um paciente com suspeita de uma infecção ou um paciente em risco de ter uma infecção. Em algumas modalidades, a amostra inicial é de um sujeito que foi submetido ou será submetido a um transplante de órgão.
[0173] As reações de extensão do iniciador podem ser realizadas com uma polimerase dependente de DNA ou uma polimerase dependente de RNA ou transcriptase reversa ou uma combinação das mesmas. Em algumas modalidades, a reação de extensão do iniciador pode ser realizada por uma polimerase de DNA ou RNA com atividade de deslocamento de fita. Em algumas modalidades, a reação de extensão do primer é realizada por um DNA ou RNA polimerase que tem atividade não modelada. Em algumas outras modalidades, a reação de extensão do iniciador pode ser realizada por uma polimerase de DNA ou RNA com atividade de deslocamento de fita e uma polimerase de DNA ou RNA que tem atividade não modelada. Em algumas modalidades, a extensão do primer é realizada com um fragmento de Klenow.
[0174] Perfis de comprimento de fragmento de referência são geralmente predeterminados. O perfil ou perfis de comprimento de fragmento de referência adequados podem variar dependendo do método, tipo de comparação ou propósito do método. Um especialista na técnica selecionaria um perfil ou perfis de comprimento de fragmento de referência apropriado. Perfis de comprimento de fragmento de referência podem ser obtidos de um sujeito ou célula exposta a um composto de interesse, um sujeito ou célula exposta a um composto semelhante, de um sujeito ou célula semelhante ao referido sujeito, de um sujeito ou célula que hospeda um micróbio conhecido, de um sujeito ou célula previamente determinado como tendo uma infecção em um sítio de origem, ou um sujeito ou célula em qualquer outra condição de interesse adequada para uso conforme determinado por um versado na técnica.
[0175] Os sujeitos com um transplante correm o risco de rejeição do transplante, mesmo quando recebem terapias para reduzir o risco de rejeição. A rejeição do transplante e o distúrbio da rejeição do transplante são riscos significativos, muitas vezes com risco de vida, para os indivíduos com um transplante. Muitas terapias antirrejeição suprimem o sistema imunológico do sujeito, aumentando assim o risco de infecção ou doença do sujeito. Portanto, é necessário equilibrar o uso e a dose das terapias antirrejeição. O aplicativo atual fornece métodos de monitoramento do estado do transplante em um sujeito com um transplante. Os métodos compreendem as etapas de geração de um perfil de comprimento de fragmento de linha de base para um ácido nucleico alvo dentro da biblioteca de ácido nucleico ou toda a biblioteca de ácido nucleico gerada a partir de uma amostra obtida do referido sujeito ou doador. Os ácidos nucleicos alvo de particular interesse no monitoramento do estado do transplante incluem, mas não estão limitados a, DNA mitocondrial doador e receptor (mtDNA). Os métodos de monitoramento do estado do transplante podem compreender ainda a avaliação da abundância de DNA mitocondrial do transplante. O monitoramento do estado do transplante abrange o monitoramento de qualquer coisa relacionada ao estado de um transplante, incluindo, mas não se limitando a, rejeição do transplante pelo hospedeiro, reação imune do hospedeiro ao transplante, reação do hospedeiro ao transplante, deterioração do transplante, saúde do transplante, vascularização do transplante, oxigenação do transplante e quebra do transplante. Um perfil de comprimento de fragmento de linha de base pode ser gerado a partir de uma amostra do doador e/ou receptor obtida antes do transplante, após o transplante ou após o transplante. Os métodos compreendem ainda a etapa de gerar um perfil de comprimento de segundo fragmento a partir de uma amostra obtida do sujeito e comparar o perfil de comprimento de segundo fragmento com o perfil de comprimento de fragmento de linha de base. Se o perfil de comprimento de segundo fragmento difere do perfil de comprimento de fragmento de linha de base, então uma quantidade aumentada de uma terapia antirrejeição pode ser administrada internamente ao sujeito.
[0176] Métodos e sistemas da presente divulgação podem ser implementados por meio de um ou mais algoritmos. Um algoritmo pode ser implementado por meio de software após a execução por uma unidade de processamento central. O algoritmo pode, por exemplo, facilitar o enriquecimento, sequenciamento e/ou detecção de patógeno ou micróbio ou outros ácidos nucleicos alvo, ou geração de um perfil de comprimento de fragmento.
[0177] Um composto pode incluir, mas não está limitado a um agente quimioterapêutico, um agente antiviral, um agente antibiótico, um agente antifúngico, um agente de interesse, uma pequena molécula, um agente experimental, um composto de ensaio clínico, um medicamento, um fármaco e ingrediente ativo.
[0178] A toxicidade inclui, mas não está limitada à citotoxicidade. É ainda reconhecido que a toxicidade pode ocorrer preferencialmente em classes particulares de células, incluindo, mas não se limitando a células cancerosas e patógenos.
[0179] Os perfis de comprimento de fragmento e métodos do presente pedido podem ser usados em testes pré-natais não invasivos (NIPT). Os métodos permitem monitoramento não invasivo, diagnóstico e rastreamento da condição fetal.
[0180] Em algumas modalidades, a separação dos ácidos nucleicos adaptados compreende, consiste em ou consiste essencialmente na imobilização dos ácidos nucleicos adaptados. Em algumas modalidades, a imobilização ocorre em grânulos magnéticos ou grânulos magnéticos funcionalizados. Em algumas modalidades, a imobilização ocorre em um vidro modificado, superfícies capilares modificadas e/ou colunas modificadas. Em algumas modalidades, a separação dos ácidos nucleicos adaptados compreende, consiste em ou consiste essencialmente na purificação dos ácidos nucleicos adaptados. Em algumas modalidades, a separação dos ácidos nucleicos adaptados compreende, consiste em ou consiste essencialmente em precipitar os ácidos nucleicos adaptados. Em algumas modalidades, a separação dos ácidos nucleicos adaptados compreende, consiste em, ou consiste essencialmente no uso de um adaptador de extremidade 3 'protegido de extremidade 3'. Em algumas modalidades, a separação dos ácidos nucleicos adaptados compreende, consiste em, ou consiste essencialmente na separação de ácidos nucleicos adaptados de ácidos nucleicos não adaptados por digestão de ácidos nucleicos não adaptados com uma exonuclease 3 ', os ácidos nucleicos adaptados compreendendo,
consistindo em, ou consistindo essencialmente de um adaptador de extremidade 3 'com proteção de extremidade 3'. Algumas modalidades ainda compreendem, consistem em, ou consistem essencialmente em ácidos nucleicos de enriquecimento para fragmentos de um determinado comprimento. Em algumas modalidades, a desnaturação é usada para separar ainda mais os ácidos nucleicos ou ácidos nucleicos alvo. Em algumas modalidades, a desnaturação compreende, consiste em ou consiste essencialmente em desnaturação seletiva. Em algumas modalidades, a desnaturação seletiva compreende, consiste em, ou consiste essencialmente em uma ou mais etapas de desnaturação eficazes para a seleção de fragmentos de um determinado comprimento e/ou conteúdo de GC. Em algumas modalidades, a separação de fragmentos de um determinado comprimento pode ocorrer por meio do uso de proteinases, detergentes, heparina, hemólise e concentração plasmática.
[0181] Os métodos fornecidos neste documento incluem vários métodos não invasivos para o sujeito que sofre de uma infecção, um sujeito em risco de contrair uma infecção e/ou para um sujeito que apresenta sintomas indefinidos que simulam várias outras doenças. Os métodos fornecidos neste documento podem ser aplicados para uma variedade de propósitos, tais como diagnosticar ou detectar uma infecção, determinar o estágio de infecção, prever o estágio de infecção do micróbio, prever se a infecção irá progredir para um estágio de doença invasiva monitorar a eficácia e/ou resposta a um tratamento ou procedimento, para interromper o tratamento, para determinar o sítio de infecção, para determinar o sítio de colonização ou para modificar ou otimizar uma terapia para uma melhor resposta clínica. Consequentemente, os métodos fornecidos neste documento podem reduzir os efeitos adversos causados por um diagnóstico incorreto ou por um procedimento invasivo, como uma biópsia, para determinar se, qual e como um órgão foi infectado no sujeito.
[0182] A Figura 1 fornece uma visão geral de alguns dos métodos fornecidos neste documento. Frequentemente, os métodos podem compreender a obtenção de uma amostra clínica de um sujeito infectado ou de um sujeito em risco de ter uma infecção; fazer uma "amostra preparada" adicionando os ácidos nucleicos sintéticos fornecidos pela divulgação; opcionalmente, extrair os ácidos nucleicos da amostra preparada; gerar uma biblioteca de amostra preparada; opcionalmente, enriquecimento para um ácido nucleico alvo de interesse; conduzir um ensaio de detecção, tal como um ensaio de sequenciamento para obter leituras de sequência da biblioteca de amostra preparada; e determinar uma medição dos ácidos nucleicos detectados e comparar esta medição com um controle ou uma referência para determinar o estágio de infecção, relação biológica entre micróbio e hospedeiro, ou sítio de localização (por exemplo, órgão ou tipo de tecido) em um sujeito. Em alguns casos, a comparação da abundância absoluta de um ácido nucleico alvo com um controle ou referência pode indicar um estágio de infecção ou sítio de localização no sujeito. Em alguns casos, a comparação da distribuição de comprimentos de fragmento para o ácido nucleico alvo com um controle ou referência pode indicar o estágio de infecção ou sítio de localização no sujeito. Em alguns casos, a comparação da abundância absoluta e distribuição de comprimentos de fragmento para um ácido nucleico alvo para um controle ou referência pode indicar o estágio de infecção ou sítio de localização no sujeito.
[0183] Os métodos fornecidos neste documento podem ser aplicados a qualquer tipo de ácido nucleico encontrado em uma amostra clínica. A Figura 2 fornece uma visão geral de um exemplo de um método sem células. A Figura 17 fornece um esquema de uma infecção exemplificativa em um sujeito. Uma fonte de infecção por patógenos pode ser, por exemplo, no pulmão ou em qualquer outro órgão (por exemplo, cérebro, pele, tecido cardíaco, estômago, fígado, intestino). Os ácidos nucleicos livres de células, como o DNA livre de células, derivados do patógeno, podem viajar pela corrente sanguínea e podem ser coletados em uma amostra de plasma para análise. Alguns dos métodos livres de células fornecidos neste documento podem compreender a obtenção de uma amostra clínica de um sujeito infectado ou um sujeito em risco de ter uma infecção; fazer uma "amostra preparada"
adicionando os ácidos nucleicos sintéticos fornecidos pela divulgação; isolar os ácidos nucleicos livres de células, opcionalmente, extraindo os ácidos nucleicos livres de células da amostra preparada; gerar uma biblioteca de amostra preparada; opcionalmente, enriquecimento para um ácido nucleico alvo de interesse; conduzir um ensaio de detecção, tal como um ensaio de sequenciamento para obter leituras de sequência da biblioteca de amostra preparada; e determinar uma medição dos ácidos nucleicos livres de células detectados e comparar esta medição com um controle ou uma referência para determinar o estágio de infecção ou sítio de localização no sujeito.
[0184] Em alguns casos, os métodos podem ser combinados com um método de sequenciamento para identificar um órgão ou tecido que pode estar infectado ou para descartar a possibilidade de que um órgão esteja infectado em um sujeito (consultar Koh W. et al, Noninvasive in vivo monitoramento da expressão gênica global específica de tecido em humanos, PNAS 2014: 111 (7361-7366), cuja publicação é no presente documento incorporada a título de referência em sua totalidade para todos os fins). A Figura 4 fornece um exemplo de um método de sítio de órgão usando sequenciamento de RNA livre de células. Um ensaio de detecção de sítio de órgão pode ser usado em um caso em que os métodos da divulgação ou outro teste clínico determinam que o sujeito tem uma infecção no estágio de doença invasiva. Neste caso, o método pode compreender ainda a condução de um dos métodos sítio de órgão fornecidos neste documento para detectar se um órgão foi infectado.
[0185] A presente divulgação também fornece métodos para tratamento individualizado para um sujeito infectado ou um sujeito que é suscetível ou em risco de infecções (por exemplo, imunossuprimidos, imunocomprometidos, condições de vida ou variações genéticas resultando em aumento da suscetibilidade para infecção). O tratamento individualizado fornecido pela presente divulgação inclui métodos de prever se uma infecção irá progredir para um estágio de doença invasiva, métodos para monitorar a eficácia de uma terapia em um sujeito, modificar um regime terapêutico dependendo da resposta do sujeito à terapia e determinar o a resistência do patógeno a uma determinada terapêutica ou a predisposição genética de um sujeito para uma resposta a uma determinada terapêutica.
[0186] Os ácidos nucleicos produzidos de acordo com os presentes métodos podem ser analisados para obter vários tipos de informações, incluindo genômica, epigenética (por exemplo, metilação) e expressão de RNA. A análise de metilação pode ser realizada por, por exemplo, conversão de bases metiladas seguida de sequenciamento de DNA. A análise da expressão de RNA pode ser realizada, por exemplo, por hibridização de matriz de polinucleotídeos, por técnicas de sequenciamento de RNA ou por sequenciamento de cDNA produzido a partir de RNA.
[0187] O sequenciamento pode ser por qualquer método conhecido na técnica. Os métodos de sequenciamento incluem, mas não estão limitados a, técnicas baseadas em sequenciamento Maxam-Gilbert, técnicas baseadas em terminação de cadeia, sequenciamento shotgun, sequenciamento PCR de ponte, sequenciamento em tempo real de molécula única, sequenciamento de semicondutor de íons (por exemplo, sequenciamento Ion Torrent), sequenciamento de nanoporo, pirossequenciamento (454), sequenciamento por síntese, sequenciamento por ligação (sequenciamento SOLiD), sequenciamento por microscopia eletrônica, reações de sequenciamento didesóxi (método de Sanger), sequenciamento massivamente paralelo, sequenciamento de polônia e sequenciamento de nanoesferas de DNA. O termo "Sequenciamento de Próxima Geração (NGS)" no presente documento se refere a métodos de sequenciamento que permitem o sequenciamento massivamente paralelo de moléculas de ácido nucleico durante as quais uma pluralidade, por exemplo, milhões, de fragmentos de ácido nucleico de uma única amostra ou de várias amostras diferentes são sequenciados simultaneamente. Exemplos não limitativos de NGS incluem sequenciamento por síntese, sequenciamento por ligação, sequenciamento em tempo real e sequenciamento de nanoporos. Em algumas modalidades, o sequenciamento envolve a hibridização de um iniciador para o molde para formar um duplex de molde/iniciador, contatando o duplex com uma enzima polimerase na presença de nucleotídeos marcados ou não marcados de forma detectável sob condições que permitem que a polimerase adicione nucleotídeos marcados ou não marcados ao iniciador de uma maneira dependente do modelo, detectando um sinal do nucleotídeo marcado incorporado ou detectando um sinal resultante do processo de incorporação de nucleotídeo marcado ou não marcado (por exemplo, liberação de próton) e repetindo sequencialmente as etapas de contato e/ou detecção pelo menos uma vez, em que a detecção sequencial de nucleotídeos marcados ou não marcados incorporados determina a sequência do ácido nucleico.
[0188] Marcadores detectáveis exemplares incluem marcadores radioativos, marcadores fluorescentes, marcadores de proteína, marcadores de corante, marcadores enzimáticos, etc. Em algumas modalidades, o marcador detectável pode ser um marcador opticamente detectável, tal como um marcador fluorescente. Marcadores fluorescentes exemplares incluem cianina, rodamina, fluoresceína, cumarina, BODIPY, alexa ou multicorantes conjugados.
[0189] Em algumas modalidades, o sequenciamento compreende, consiste em ou consiste essencialmente na obtenção de leituras finais emparelhadas. Em algumas modalidades, o sequenciamento compreende, consiste em ou consiste essencialmente na obtenção de leituras de consenso.
[0190] A precisão ou precisão média da informação de sequência pode ser maior do que cerca de 80%, cerca de 90%, cerca de 95%, cerca de 99%, cerca de 99,98% ou cerca de 99,99%. A precisão da sequência ou precisão média pode ser maior do que cerca de 95% ou cerca de 99%. A cobertura da sequência pode ser maior do que cerca de 0,00001 vezes, 0,0001 vezes, 0,001 vezes, cerca de 0,01 vezes, cerca de 0,1 vezes, cerca de 0,5 vezes, cerca de 0,7 vezes ou cerca de 0,9 vezes. A cobertura da sequência pode ser inferior a cerca de 200000 vezes, cerca de 100000 vezes, cerca de 10000 vezes,
cerca de 1000 vezes ou cerca de 500 vezes.
[0191] Em algumas modalidades, a informação de sequência obtida por modelo de ácido nucleico é mais do que cerca de 10 pares de bases, cerca de 15 pares de bases, cerca de 20 pares de bases, cerca de 50 pares de bases, cerca de 100 pares de bases ou cerca de 200 pares de bases. A informação da sequência pode ser obtida em menos de 1 mês, 2 semanas, 1 semana, 2 dias, 1 dia, 14 horas, 10 horas, 3 horas, 1 hora, 30 minutos, 10 minutos ou 5 minutos.
[0192] Embora os Exemplos (abaixo) usem sequências específicas para certos sistemas de sequenciamento, por exemplo, sistemas Illumina, será entendido que a referência a essas sequências é apenas para fins ilustrativos e os métodos descritos neste documento podem ser configurados para uso com outros sistemas de sequenciamento incorporando iniciação específica, fixação, índice e outras sequências operacionais usadas nesses sistemas, por exemplo, sistemas disponíveis em Ion Torrent, Oxford Nanopore, Genia Technologies, Pacific Biosciences, Complete Genomics e semelhantes.
[0193] Os métodos fornecidos neste documento podem incluir o uso de um sistema, tal como um sistema que contém um sequenciador de ácido nucleico (por exemplo, sequenciador de DNA, sequenciador de RNA) para gerar informações de sequência de DNA ou RNA. O sistema pode incluir um computador que compreende software que realiza análise bioinformática nas informações de sequência de DNA ou RNA. A análise bioinformática pode incluir, sem limitação, reunir dados de sequência, detectar e quantificar variantes genéticas em uma amostra, incluindo variantes de linha germinativa e variantes de células somáticas (por exemplo, uma variação genética associada ao câncer ou condição pré-cancerosa, uma variação genética associada à infecção).
[0194] Os dados de sequenciamento podem ser usados para determinar informações de sequência genética, estados de ploidia,
a identidade de uma ou mais variantes genéticas, bem como uma medida quantitativa das variantes, incluindo medidas relativas e absolutas.
[0195] Em alguns casos, o sequenciamento do genoma envolve o sequenciamento do genoma completo ou sequenciamento parcial do genoma. O sequenciamento pode ser imparcial e pode envolver o sequenciamento de todos ou substancialmente todos (por exemplo, mais de 70%, 80%, 90%) dos ácidos nucleicos em uma amostra. O sequenciamento do genoma pode ser seletivo, por exemplo, direcionado a porções do genoma de interesse. O sequenciamento de genes selecionados ou porções de genes pode ser suficiente para a análise desejada. O mapeamento de polinucleotídeos para loci específicos no genoma que são o assunto de interesse pode ser isolado para sequenciamento por, por exemplo, captura de sequência ou amplificação específica do sítio.
ALINHAMENTO DE LEITURAS DE SEQUÊNCIA
[0196] Após o sequenciamento, o conjunto de dados de sequências pode ser carregado em um processador de dados para análise de bioinformática para subtrair o hospedeiro ou sequências relacionadas ao hospedeiro, por exemplo, humano, gato, cachorro, etc. da análise; e determinar a presença e prevalência de patógenos ou sequências contaminantes (por exemplo sequências microbianas), por exemplo, por uma comparação da cobertura de mapeamento de sequências para uma sequência de referência microbiana para a cobertura da sequência de referência do hospedeiro. A subtração de sequências do hospedeiro pode incluir a etapa de identificação de uma sequência de referência do hospedeiro e mascaramento de sequências microbianas ou sequências que mimetizam microbianas presentes no genoma do hospedeiro de referência. Da mesma forma, determinar a presença de uma sequência microbiana por comparação com uma sequência de referência microbiana pode incluir a etapa de identificar uma sequência microbiana de referência e mascarar as sequências do hospedeiro ou sequências que mimetizam o hospedeiro presentes nas sequências do genoma microbiano de referência.
[0197] O conjunto de dados pode ser opcionalmente limpo para verificar a qualidade da sequência, remover restos de nucleotídeos específicos do sequenciador (por exemplo, sequências adaptadoras) e mesclar leituras finais emparelhadas que se sobrepõem para criar uma sequência de consenso de qualidade superior com menos erros de leitura. As sequências duplicadas podem ser identificadas como aquelas que têm sítios de início e comprimento idênticos ou sequência idêntica ou quase idêntica. Opcionalmente, duplicatas podem ser removidas da análise.
[0198] Em alguns aspectos, o hospedeiro ou sequências relacionadas ao hospedeiro (por exemplo, humano) podem ser subtraídas da análise. Em alguns aspectos, as sequências do hospedeiro são retidas na análise. Em alguns aspectos, as etapas de amplificação/sequenciamento podem ser imparciais e a preponderância de sequências em uma amostra será sequências do hospedeiro. O processo de subtração pode ser otimizado de várias maneiras para melhorar a velocidade e precisão do processo, por exemplo, realizando várias subtrações onde o alinhamento inicial é definido em um filtro grosso, por exemplo, com um alinhador rápido, e realizando alinhamentos adicionais com um filtro fino filtro como um alinhador sensível ou banco de dados de referência estendido.
[0199] O conjunto de dados de leituras pode ser inicialmente alinhado contra um genoma de referência do hospedeiro, incluindo, sem limitação, as sequências de referência do Genbank hg19 ou do Genbank hg38, para subtrair bioinformaticamente o DNA do hospedeiro. Cada sequência pode ser alinhada com a sequência de melhor ajuste na sequência de referência do host. As sequências identificadas como hospedeiros podem ser removidas bioinformaticamente da análise.
[0200] A remoção do hospedeiro ou sequências relacionadas ao hospedeiro também pode ser otimizada pela adição de contigs que têm uma alta taxa de acerto, incluindo, sem limitação, sequência altamente repetitiva presente no genoma que não está bem representada em bancos de dados de referência. Por exemplo, foi observado que das leituras que não se alinham a hg19 ou hg38, uma quantidade significativa é eventualmente identificada como humana em um estágio posterior do pipeline, quando um banco de dados que inclui um grande conjunto de sequências humanas é usado, por exemplo, todo o banco de dados NCBI NT. A remoção dessas leituras no início da análise pode ser realizada construindo um host expandido ou uma referência relacionada ao host. Essa referência pode ser criada identificando contigs de host em um banco de dados de sequência diferente do de referência, por exemplo, banco de dados NCBI NT, que tem alta cobertura após a subtração inicial de leitura do host. Esses contigs podem ser adicionados à referência do host para criar um conjunto de referência mais abrangente. Além disso, novos contigs relacionados ao hospedeiro montados a partir de estudos de coorte podem ser usados como uma referência adicional para filtrar leituras derivadas do hospedeiro.
[0201] As regiões da sequência de referência do genoma hospedeiro que contêm sequências não hospedeiras relevantes podem ser mascaradas, por exemplo, sequências virais e bacterianas que são integradas no genoma da amostra de referência.
[0202] Opcionalmente, o hospedeiro ou sequências relacionadas ao hospedeiro podem ser identificadas e removidas por métodos não baseados em alinhamento, como a identificação de sequências por características de sequência, incluindo frequência de certos motivos, padrões de sequência, frequências de palavra ou enviesamentos de nucleotídeos.
[0203] As leituras de sequência identificadas como não humanas podem então ser alinhadas a um banco de dados de nucleotídeos de sequências de referência microbianas. O banco de dados pode ser selecionado para aquelas sequências microbianas conhecidas por estarem associadas ao hospedeiro, por exemplo, o conjunto de microrganismos humanos comensais e patogênicos.
[0204] O banco de dados microbiano pode ser otimizado para mascarar ou remover sequências contaminantes. Por exemplo, muitas entradas de bancos de dados públicos incluem sequências artificiais não derivadas do microrganismo, por exemplo, sequências de primer, sequências de hospedeiros e outros contaminantes. Pode ser desejável realizar um alinhamento inicial ou uma pluralidade de alinhamentos em um banco de dados. As regiões que mostram irregularidades na cobertura de leitura quando várias amostras estão alinhadas podem ser mascaradas ou removidas como um artefato. A detecção dessa cobertura irregular pode ser feita por várias métricas, como a razão entre a cobertura de um nucleotídeo específico e a cobertura média de todo o contig dentro do qual esse nucleotídeo se encontra. Em geral, uma sequência que é representada como maior do que cerca de 5X, cerca de 10X, cerca de 25X, cerca de 50X, cerca de 100X a cobertura média dessa sequência de referência pode ser artificial. Alternativamente, um teste binomial pode ser aplicado para fornecer uma probabilidade de cobertura por base, dada a cobertura geral do contig. A remoção da sequência de contaminantes dos bancos de dados de referência permite a identificação precisa de micróbios.
[0205] Cada leitura de alta confiança pode se alinhar a vários organismos no banco de dados microbiano fornecido. Para atribuir corretamente a abundância do organismo com base nesta possível redundância de mapeamento, um algoritmo pode ser usado para calcular o organismo mais provável (por exemplo, ver Lindner et al. Nucl. Acids Res. (2013) 41 (1): e10). Por exemplo, os algoritmos GRAMMy ou GASiC podem ser usados para calcular o organismo mais provável de onde veio uma determinada leitura.
[0206] Alinhamentos e atribuição a uma sequência hospedeira ou a uma sequência não hospedeira (por exemplo, microbiana) podem ser realizados de acordo com métodos reconhecidos na técnica. Por exemplo, uma leitura de 50 nt. pode ser atribuído como correspondente a um determinado genoma se não houver mais de 1 incompatibilidade, não mais de 2 incompatibilidades, não mais de 3 incompatibilidades, não mais de 4 incompatibilidades, não mais de 5 incompatibilidades, etc. ao longo do comprimento da leitura. Algoritmos disponíveis publicamente podem ser usados para alinhamentos e identificação. Um exemplo não limitativo de tal algoritmo de alinhamento é o programa bowtie2 (Johns Hopkins University).
[0207] Essas atribuições de leituras a um organismo (por exemplo, organismo hospedeiro, organismo não hospedeiro, micróbio, patógeno, etc.) podem então totalizar e usar para calcular o número estimado de leituras atribuídas a cada organismo em uma determinada amostra, em uma determinação de a prevalência do organismo na amostra (por exemplo, uma amostra de ácido nucleico livre de células). Essas informações podem ser usadas para determinar a origem de um patógeno ou contaminante. A análise pode normalizar as contagens para o tamanho do genoma microbiano para fornecer um cálculo de cobertura para o micróbio. A cobertura normalizada para cada micróbio pode ser comparada à cobertura da sequência do hospedeiro na mesma amostra para levar em conta as diferenças na profundidade de sequenciamento entre as amostras.
[0208] Além disso, um conjunto de dados de organismos microbianos representados por sequências na amostra e a prevalência desses microrganismos podem ser opcionalmente agregados e exibidos para visualização pronta, por exemplo, na forma de um relatório.
[0209] A presente divulgação fornece métodos de normalização. Em alguns casos, os métodos da presente divulgação podem compreender um ou mais métodos de normalização. Os métodos de normalização fornecidos pela presente divulgação permitem medições ou quantidades eficientes e melhoradas de ácidos nucleicos específicos da doença, específicos do patógeno ou específicos do órgão detectados em uma amostra.
[0210] Os métodos de normalização da presente divulgação geralmente usam ácidos nucleicos sintéticos spike-in. Os ácidos nucleicos sintéticos spike-in podem ser usados para normalizar a amostra de várias maneiras diferentes. Os ácidos nucleicos spike-in podem se normalizar em todas as amostras e todos os métodos de medição de ácidos nucleicos específicos de doenças, ácidos nucleicos específicos de patógenos ou outros ácidos nucleicos alvo. Em alguns casos, os spike-ins podem ser usados para aumentar a precisão de um cálculo de abundância relativa de um ácido nucleico do patógeno (ou ácido nucleico específico da doença ou ácido nucleico alvo) em uma amostra em comparação com outros ácidos nucleicos do patógeno na amostra.
[0211] Em geral, uma concentração (ou concentrações) conhecidas de espécies de ácidos nucleicos sintéticos pode ser preparada em cada amostra. Em muitos casos, as espécies de ácidos nucleicos sintéticos podem ser preparadas na concentração equimolar de cada espécie. Em alguns casos, as concentrações das espécies de ácidos nucleicos sintéticos podem ser diferentes.
[0212] A abundância das espécies de ácido nucleico pode ser alterada devido às tendências inerentes ao manuseio, preparação e medição da amostra (por exemplo, detecção). Após a medição, a eficiência de recuperação de ácidos nucleicos de cada comprimento pode ser determinada comparando a abundância medida de cada "espécie" de ácido nucleico preparado com a quantidade preparada originalmente. Isso pode resultar em um “perfil de recuperação baseado em comprimento”.
[0213] O "perfil de recuperação com base no comprimento" pode ser usado para normalizar a abundância de todos (ou a maioria, ou alguns) ácidos nucleicos específicos da doença, ácidos nucleicos patogênicos ou outros ácidos nucleicos alvo normalizando as abundâncias de ácido nucleico específico da doença (ou as abundâncias dos ácidos nucleicos patogênicos ou outros ácidos nucleicos alvo) para a molécula preparada de comprimento mais próximo ou para uma função ajustada às moléculas preparadas de comprimentos diferentes
[0214] Este processo pode ser aplicado a ácidos nucleicos alvo, como os ácidos nucleicos específicos do patógeno, e pode resultar em uma estimativa da "distribuição de comprimento original de todos os ácidos nucleicos específicos do patógeno" no momento de fortificação da amostra. A "distribuição de comprimento original de todos os ácidos nucleicos alvo" pode mostrar o perfil de distribuição de comprimento para os ácidos nucleicos alvo (por exemplo, ácidos nucleicos específicos para patógenos ou ácidos nucleicos específicos para órgãos) no momento da fortificação da amostra. É essa distribuição de comprimento que os ácidos nucleicos preparados podem buscar recapitular a fim de alcançar normalização de abundância perfeita ou quase perfeita. É esta distribuição de comprimento que os ácidos nucleicos preparados podem procurar recapitular a fim de conseguir determinar a distribuição de comprimento de fragmento endógeno de ácidos nucleicos alvo.
[0215] Como pode não ser possível aumentar uma amostra com uma mistura de ácidos nucleicos conhecidos que recapitula exatamente o perfil de abundância relativa de ácidos nucleicos específicos de doenças, ácidos nucleicos de patógenos ou outros ácidos nucleicos alvo nessa amostra específica, em parte porque a amostra pode ter se esgotado ou o tempo pode ter alterado o perfil de abundância relativa, cada "espécie" de spike-in pode ser ponderada em proporção à sua abundância relativa dentro da "distribuição de comprimento original de todos os ácidos nucleicos específicos da doença". A soma de todos os “fatores de ponderação” pode ser igual a 1,0.
[0216] A normalização pode envolver uma única etapa ou uma série de etapas. Em alguns casos, a abundância de ácidos nucleicos específicos da doença (ou ácidos nucleicos patogênicos ou outros ácidos nucleicos alvo) pode ser normalizada usando a medição bruta da abundância de ácido nucleico preparado de tamanho mais próximo para produzir o "ácido nucleico específico da doença normalizado (ou abundância de ácidos nucleicos de patógenos ou outro ácido nucleico alvo”. Em seguida, a "abundância de ácido nucleico específico da doença normalizada" (ou ácidos nucleicos de patógenos ou outra abundância de ácido nucleico alvo) pode ser multiplicada pelo "fator de ponderação" para ajustar a importância relativa de recuperar esse comprimento, produzindo a "doença normalizada ponderada - abundância de ácido nucleico específico (ou específico do patógeno ou outro alvo)”. Uma vantagem deste método de normalização pode ser que ele permite medições comparáveis da abundância de ácido nucleico alvo (por exemplo, ácido nucleico específico da doença, ácido nucleico patogênico) em todos (ou a maioria) métodos de medição da abundância de ácido nucleico específico da doença, independentemente de método.
[0217] Tais ensaios podem envolver a medição da quantidade de ácidos nucleicos alvo (por exemplo, ácidos nucleicos específicos da doença) em amostras biológicas (por exemplo, plasma) para detectar a presença de um patógeno ou identificar estados de doença ou para determinar se um ácido nucleico alvo é baseado em amostra, com base em reagentes ou com base no ambiente. Os métodos descritos neste documento podem tornar essas medições comparáveis em amostras, tempos de medição, métodos de extração de ácido nucleico, métodos de manipulação de ácido nucleico, métodos de medição de ácido nucleico e/ou uma variedade de condições de manipulação de amostra.
[0218] A presente divulgação fornece uma medição do valor de perda de diversidade. Em alguns casos, os métodos da presente divulgação podem compreender a determinação de um valor de perda de diversidade.
[0219] O número de moléculas SPANK deduplicadas (por exemplo, réplicas removidas) detectadas em uma biblioteca específica é um proxy para a concentração mínima detectável nessa biblioteca. Isso pode ser útil para definir um limiar com base na concentração mínima das moléculas SPANK detectáveis nessa biblioteca. O limiar pode ser útil para garantir profundidade de sequenciamento suficiente para a detecção de patógenos. O limiar também pode ser útil para garantir que o sinal do patógeno não seja devido à contaminação cruzada de outras amostras. Por exemplo, o enriquecimento de patógenos em relação ao limiar estabelecido pelas moléculas SPANK pode ser comparado entre diferentes amostras. De forma mais geral, é proporcional à eficiência com a qual essa biblioteca converteu moléculas de DNA na amostra original para leituras nos dados de sequenciamento de DNA
[0220] As moléculas SPANK preparadas fornecidas pela divulgação podem ser usadas para calcular o valor de perda de diversidade. Um valor de perda de diversidade pode ser determinado como mostrado na Figura 5. Em alguns casos, se a diversidade das sequências SPANK for alta o suficiente, as sequências SPANK preparadas em uma amostra podem ser consideradas essencialmente únicas. Portanto, quaisquer sequências SPANK duplicadas que são sequenciadas são provavelmente devido à amplificação por PCR e não devido a múltiplas cópias da mesma sequência SPANK sendo adicionadas à amostra e podem ser removidas da análise. Além disso, se cada sequência SPANK for única, o número total de sequências SPANK originalmente adicionadas a uma amostra é conhecido com base na concentração de ácido nucleico e no volume adicionado à amostra, e o número total de leituras de sequenciamento SPANK exclusivas após o sequenciamento ser conhecido; juntos, esses valores podem ser usados para calcular um valor de perda de diversidade. C. ABUNDÂNCIA ABSOLUTA (MPM)
[0221] A presente divulgação fornece uma medição de abundância absoluta (também referida como "moléculas por microlitro" (MPMs)).
[0222] Geralmente, a abundância absoluta de um ácido nucleico alvo em uma amostra (por exemplo, DNA ou RNA), pode ser determinada normalizando o número de leituras de sequência de um ácido nucleico alvo com o valor de perda de diversidade determinado empiricamente.
[0223] Em alguns casos, uma medição de abundância absoluta pode compreender fortificar a amostra com ácidos nucleicos de vários comprimentos ou um único comprimento e em concentrações conhecidas. Em alguns casos, a fração de informação da amostra que é realmente observada nos dados de sequenciamento pode ser observada para cada comprimento de spike-in (por exemplo, comparando-se leituras observadas com leituras associadas aos ácidos nucleicos preparados ou dividindo-se as leituras observadas pelas leituras de pico). Os números originais de moléculas de não hospedeiros ou patógenos em cada comprimento também podem ser calculados de volta (por exemplo, inferidos em parte a partir do número de leituras de spike-in em cada comprimento). Esta carga pode ser convertida em uma medição de "moléculas por microlitro".
[0224] Em muitos casos, os métodos para detectar moléculas por microlitro (bem como outros métodos fornecidos no presente documento) podem envolver a remoção ou sequestro de leituras de baixa qualidade. A remoção de leituras de baixa qualidade pode melhorar a precisão e confiabilidade dos métodos fornecidos neste documento. Em alguns casos, o método pode compreender a remoção ou sequestro de (em qualquer combinação): leituras não mapeáveis, leituras resultantes de duplicatas de PCR, leituras de baixa qualidade, leituras de dímero de adaptador, leituras de adaptador de sequenciamento, leituras mapeadas não exclusivas e/ou lê o mapeamento para uma sequência não informativa.
[0225] Em alguns casos, as leituras de sequência podem ser mapeadas para um genoma de referência e as leituras não mapeadas para tal genoma de referência podem ser mapeadas para o alvo ou genoma do patógeno ou genomas. As leituras, em alguns casos, podem ser mapeadas para um genoma de referência humano (por exemplo, hgl9), enquanto as leituras restantes são mapeadas para um banco de dados de referência com curadoria de patógenos virais, bacterianos, fúngicos e outros eucarióticos (por exemplo, fungos, protozoários, parasitas).
[0226] A presente divulgação fornece vários controles e referências, que podem ser usados para determinar se uma medição fornecida pela presente divulgação indica que o sujeito tem uma infecção em um determinado estágio de infecção ou em um sítio de localização.
[0227] Frequentemente, os métodos compreendem o processamento de uma referência ou controle usando os métodos da presente divulgação. Em alguns casos, os valores de controle ou referência podem ser medidos como uma concentração ou como uma série de leituras de sequenciamento. O nível pode ser qualitativo ou quantitativo. Com base nas leituras de sequência das amostras de controle ou referência, um nível de linha de base do ácido nucleico alvo (por exemplo, espécies de patógenos, variantes genéticas, contaminantes introduzidos do ambiente de laboratório ou derivados de órgãos) pode ser determinado.
[0228] Em alguns casos, os valores de controle ou referência podem ser dependentes de patógenos. Por exemplo, um valor de controle para H. pylori pode ser diferente de um valor de controle para Clostridium difficile. Um banco de dados de níveis ou valores de controle pode ser gerado com base em amostras obtidas de um ou mais sujeitos, para um ou mais patógenos e/ou para um ou mais pontos de tempo. Esse banco de dados pode ser com curadoria ou proprietário.
[0229] Em alguns casos, o controle ou valor de referência é um valor absoluto predeterminado que indica a presença ou ausência de ácidos nucleicos de patógenos livres de células ou ácidos nucleicos derivados de órgãos livres de células. O controle ou valor de referência pode ser um valor obtido pela análise dos níveis de ácido nucleico livre de células de um sujeito sem uma infecção. Em alguns casos, o controle ou valor de referência pode ser um valor de controle positivo e pode ser obtido através da análise de ácidos nucleicos livres de células de um sujeito com uma infecção conhecida particular, ou com uma infecção conhecida particular de um órgão específico.
[0230] Em alguns casos, um controle pode incluir a identificação de um conjunto de microrganismos comensais ou microflora natural que são ou não causadores de uma infecção usando amostras de controle de indivíduos saudáveis. Um limiar pode ser definido com base no conjunto de microrganismos comensais em amostras de controle.
[0231] Um modelo de Poisson ou outro modelo estatístico pode ser usado para determinar se o nível de linha de base determinado da amostra clínica é significativamente maior do que o controle de referência. Onde a leitura de sequência de uma amostra clínica é significativamente maior do que o controle de referência, isso indica que a leitura é informativa. Em alguns casos, essas leituras informativas podem ser selecionadas para determinar um limiar para dois grupos clínicos diferentes.
[0232] Dependendo do ácido nucleico alvo e do nível de fundo observado nas amostras, pode ser desejável subtrair ou filtrar as leituras de sequência usando uma ou mais referências. A filtragem pode ser feita em combinação com a seleção e antes ou depois da seleção. Em algumas modalidades, o pelo menos um valor de referência é baseado nos níveis dos ácidos nucleicos do patógeno detectados em uma ou mais amostras selecionadas do grupo que consiste em amostra de água, amostra de sangue, amostra de plasma, amostra de soro, amostra de urina, amostra de fluido corporal, amostra de reagente, amostra de um sujeito saudável ou qualquer combinação dos mesmos.
[0233] O valor de controle pode ser um nível de patógeno livre de células ou ácidos nucleicos específicos de órgãos livres de células obtidos do sujeito em um ponto de tempo diferente.
[0234] Em alguns casos, uma amostra pode ser coletada em um ponto de tempo anterior a um ponto de teste posterior (por exemplo, após intervenção terapêutica ou após um certo tempo decorrido para espera vigilante). Nesses casos, a comparação do nível em pontos de tempo diferentes pode indicar a presença de infecção, a presença de infecção em um órgão específico, melhora da infecção ou agravamento da infecção. Por exemplo, um aumento de patógeno ou ácidos nucleicos livres de células de órgãos específicos em uma certa quantidade ao longo do tempo pode indicar a presença de infecção ou de agravamento da infecção, por exemplo, um aumento de pelo menos 5%, 10%, 20%, 25%, 30%, 50%, 75%, 100%, 200%, 300% ou 400% em comparação com um valor original pode indicar a presença de infecção ou agravamento da infecção. Em outros exemplos, uma redução de patógenos ou ácidos nucleicos livres de células específicos de órgão em pelo menos 5%, 10%, 20%, 25%, 30%, 50%, 75%, 100%, 200%, 300%, ou 400% em comparação com um valor original pode indicar a ausência de infecção ou de uma infecção melhorada (por exemplo, erradicação de uma infecção).
[0235] As amostras podem ser coletadas em um determinado período de tempo, como todos os dias, dias alternados, semanais, semanais, mensais ou a cada dois meses. Por exemplo, um aumento de patógenos ou ácidos nucleicos livres de células de órgãos de pelo menos 50% ao longo de uma semana pode indicar a presença de infecção.
[0236] Os métodos podem compreender a determinação de um valor limiar ou faixa de valores. Um limiar pode ser usado para identificar amostras que estão em um determinado grupo clínico (estágio colonizado vs. estágio de doença invasiva ou sem infecção de órgão vs. órgão infectado). Um limiar pode ser usado para identificar ou selecionar leituras de sequência que são informativas de uma amostra clínica. Geralmente, um limiar desejável é aquele que maximiza o número de verdadeiros positivos, enquanto minimiza o número de falsos positivos. Em alguns casos, o limiar pode ser selecionado usando uma análise da curva ROC. Em alguns casos, o limiar pode ser selecionado com base em métricas de desempenho.
SELEÇÃO DE LIMIAR
[0237] Um limiar pode ser selecionado com base em seu desempenho usando vários métodos estatísticos, como a análise da curva Receiver Operating Characteristic (ROC). A análise ROC pode ser usada para avaliar o desempenho do classificador em toda a sua faixa operacional antes de selecionar um valor limiar de corte. Para determinar qual limiar de corte deve ter o melhor desempenho usando uma curva ROC, pode-se mover o limiar progressivamente ao longo do intervalo (por exemplo, de 0 a 1,0) para encontrar um corte de resultados na diminuição do número de falsos positivos e no aumento do número de verdadeiros positivos.
[0238] A análise ROC pode ser conduzida plotando os dados obtidos a partir dos métodos da presente divulgação da seguinte forma: TP (sensibilidade) contra FP (1-especificidade). Usando o gráfico ROC, um classificador perfeito ou quase perfeito geralmente vai direto para cima no eixo Y e, em seguida, ao longo do eixo X, enquanto um classificador sem poder para classificar as amostras em diferentes grupos clínicos geralmente fica na diagonal. A maioria dos classificadores ficará em algum lugar entre esses dois casos extremos e o usuário pode escolher um limiar com base em seu melhor desempenho possível ou desejado.
[0239] Métricas de desempenho como precisão, sensibilidade, especificidade, valor preditivo positivo ou valor preditivo negativo podem ser usadas para selecionar um limiar. Em alguns casos, uma métrica de desempenho pode ser usada para selecionar um limiar. Em alguns casos, várias métricas de desempenho podem ser usadas para selecionar um limiar.
[0240] Qualquer limiar aplicado a um conjunto de dados (em que PP é a população positiva e NP é a população negativa) irá produzir verdadeiros positivos (TP), falsos positivos (FP), verdadeiros negativos (TN) e falsos negativos (FN).
[0241] Em alguns casos, a métrica de desempenho de precisão pode ser usada para determinar a probabilidade de uma classificação correta. A precisão pode ser calculada aplicando a seguinte equação: (TP + TN)/(PP + NP). Em alguns casos, a precisão é calculada usando um algoritmo treinado.
[0242] Em alguns casos, a métrica de desempenho de sensibilidade pode ser usada para determinar a capacidade do teste de detectar doenças em uma população de indivíduos doentes. A sensibilidade percentual pode ser calculada aplicando a seguinte equação: TP/(TP + FN).
[0243] Em alguns casos, a métrica de desempenho de especificidade pode ser usada para determinar a capacidade do teste de descartar corretamente a doença em uma população livre de doença. A especificidade pode ser calculada aplicando a seguinte equação: TN/(TN + FP).
[0244] Ao classificar uma amostra para diagnóstico de infecção, normalmente existem quatro resultados possíveis de um classificador binário. Se o resultado de uma previsão for p e o valor real também for p, então é chamado de verdadeiro positivo (TP); entretanto, se o valor real for n, ele é considerado um falso positivo (FP). Por outro lado, um verdadeiro negativo ocorreu quando o resultado da previsão e o valor real são n, e falso negativo é quando o resultado da previsão é n enquanto o valor real é p. Para um teste que detecta uma doença ou distúrbio, como uma infecção, um falso positivo neste caso pode ocorrer quando o teste é positivo, mas na verdade não tem a infecção. Um falso negativo, por outro lado, pode ocorrer quando o sujeito realmente tem uma infecção, mas o teste é negativo para essa infecção.
[0245] O valor preditivo positivo (VPP), ou taxa de precisão, ou probabilidade de doença pós-teste, é a proporção de pacientes com resultados de teste positivos que são diagnosticados corretamente. Pode ser calculado aplicando a seguinte equação: PPV = TP/(TP + FP) x 100. O PPV pode refletir a probabilidade de que um teste positivo reflita a condição subjacente que está sendo testada. Seu valor, entretanto, pode depender da prevalência da doença, que pode variar.
[0246] O valor preditivo negativo (NPV) pode ser calculado pela seguinte equação: TN/(TN + FN) x 100. O valor preditivo negativo pode ser a proporção de pacientes com resultados de teste negativos que são diagnosticados corretamente. As medições de PPV e NPV podem ser derivadas usando estimativas apropriadas de prevalência de doenças.
[0247] Um valor limiar pode ser definido com base no desempenho desejado do usuário em especificidade e sensibilidade para distinguir entre os dois grupos clínicos. Em alguns casos, um método fornecido pela divulgação pode ter uma especificidade maior que 70%, 75%, 80%, 85%,
86%, 87%, 88%, 89%, 90%, 91%, 92%, 93 %, 94%, 95%, 96%, 97%, 98%, 99% ou 99,5% e uma sensibilidade maior que 95%, 95,5%, 96%, 96,5%, 97%, 97,5%, 98%, 98,5%, 99%, 99,5% ou mais.
APLICAÇÕES
[0248] Os métodos fornecidos pela divulgação podem ser aplicados para uma variedade de propósitos, tais como diagnosticar ou detectar uma infecção, para determinar a relação biológica entre um micróbio e um hospedeiro, estágio de infecção de uma infecção, para prever se a infecção irá progredir para um estágio de doença invasiva, para monitorar a eficácia e a resposta a um tratamento para infecção, para modificar ou otimizar uma terapia para uma melhor resposta clínica, para interromper um tratamento ou terapia. Assim, usando os métodos fornecidos pela divulgação, pode-se fornecer tratamento individualizado a um sujeito que é adaptado de acordo com os dados obtidos pelos métodos.
[0249] Espera-se que os patógenos que estão causando a infecção em um sujeito tenham várias características, tais como, mas não se limitando a, níveis de abundância absoluta elevados, perfis de distribuição de comprimento de ácido nucleico anormal em comparação com uma referência assintomática ou um controle, ou eles podem ter ambas as características. Da mesma forma, espera-se que os patógenos que estão infectando o órgão de um sujeito tenham níveis de abundância absoluta elevados, perfis de distribuição de comprimento de ácido nucleico anormal em comparação com uma referência assintomática ou um controle, ou eles podem ter ambas as características. Os patógenos que estão causando a infecção em um sujeito podem ter várias características, tais como, mas não se limitando a, perfis de distribuição de comprimento de ácido nucleico comparáveis a uma referência sintomática ou um controle. A. ESTÁGIO DE INFECÇÃO
[0250] Os métodos fornecidos pela presente divulgação podem ser usados para detectar, diagnosticar, tratar, monitorar,
prever ou prognosticar o estágio de infecção em um sujeito. O patógeno que causa a infecção pode ser uma bactéria, vírus, fungo, parasita, levedura ou outro micróbio, particularmente um micróbio infeccioso. Em alguns casos, os métodos podem ser usados para determinar se o sujeito está no estágio de colonização ou doença invasiva. Em alguns casos, os métodos podem ser usados para detectar se o sujeito está no estágio de incubação, estágio prodrômico, estágio de doença, estágio de declínio, estágio de convalescença, estágio de erradicação, estágio crônico ou estágio invasivo. Em alguns casos, um método determina se uma infecção está em estágio ativo ou latente.
[0251] Os métodos da divulgação podem ser usados em conjunto com outros testes médicos. Por exemplo, os métodos podem ser usados antes ou depois de um teste de antígeno fecal, teste respiratório de ureia, sorologia, teste de urease, histologia, cultura bacteriana e teste de sensibilidade, biópsia ou endoscopia de um sujeito. Em alguns casos, o método descrito no presente documento é conduzido sem a realização de um teste de antígeno fecal, teste respiratório de ureia, sorologia, teste de urease, histologia, cultura bacteriana e teste de sensibilidade, biópsia ou endoscopia no sujeito.
[0252] Em alguns casos de um método descrito no presente documento, o método reduz o risco de uma infecção progredir para o estágio de doença invasiva em pelo menos 10%, pelo menos 20%, pelo menos 30%, pelo menos 40%, pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80% ou pelo menos 90%. Em alguns casos de um método descrito no presente documento, o método reduz o risco de mortalidade e/ou morbidade relacionada a complicações no estágio de doença invasiva em pelo menos 10%, pelo menos 20%, pelo menos 30%, pelo menos 40%, em pelo menos 50%, pelo menos 60%, pelo menos 70%, pelo menos 80% ou pelo menos 90%.
[0253] Os métodos descritos neste documento podem compreender ainda o sequenciamento de RNA (RNA-Seq) de ácidos nucleicos livres de células derivados do órgão do sujeito. A lesão tecidual causada por uma infecção pode levar à liberação de ácidos nucleicos livres de células do órgão ou tecido infectado para o sangue. A Figura 3 representa um exemplo para a liberação de DNA livre de células. Um aumento de, por exemplo, RNA livre de células derivado de um órgão em uma amostra pode indicar que o órgão do sujeito foi infectado por um patógeno.
[0254] Por exemplo, um método pode compreender a análise de ácidos nucleicos de patógenos livres de células circulantes de um patógeno associado a um ou mais sintomas clínicos. O método pode compreender ainda a condução de um RNA-Seq para detectar um aumento no RNA livre de células derivado de órgãos no sangue do sujeito. A combinação desses resultados de teste pode indicar que o patógeno infectou o sujeito, bem como determinar qual órgão está infectado no sujeito.
[0255] O teste de RNA-Seq pode ser conduzido simultaneamente com outro método clínico para detectar uma infecção, subsequente a um método clínico para detectar uma infecção, ou antes de um método clínico detectar e infecção. Em outros casos, o RNA-Seq pode ser usado independentemente para investigar a saúde do órgão ou pode fornecer maior confiança de que uma infecção detectada por outro método clínico descrito no presente documento é uma infecção de um órgão específico.
[0256] Em alguns casos, um teste de RNA-Seq pode ser capaz de determinar se uma infecção está em um estágio de doença invasiva. Em alguns casos, o teste de sequenciamento de RNA pode ser repetido ao longo do tempo para determinar se a infecção está piorando ou melhorando em um determinado órgão ou tecido, ou se está se espalhando para um órgão ou tecido diferente no sujeito. Da mesma forma, o ensaio de detecção de patógenos fornecido neste documento também pode ser repetido ao longo do tempo em conjunto com o ensaio de infecção de órgão.
[0257] Um teste de RNA-Seq (ou série de testes de RNA-Seq) pode às vezes ser realizado depois que um método no presente documento descrito produz um resultado de teste positivo (por exemplo, detecção de uma infecção por patógeno). O teste de RNA-Seq pode ser especialmente útil para confirmar a infecção ou para identificar a localização da infecção. Por exemplo, os métodos podem detectar a presença de um patógeno em um sujeito, analisando os ácidos nucleicos livres de células circulantes, mas o sítio da infecção pode não ser claro. Nesse caso, o método pode compreender ainda o sequenciamento de RNA livre de células do sujeito para confirmar que a infecção está dentro de um órgão.
ABUNDÂNCIA ABSOLUTA DE RNA ESPECÍFICO DE ÓRGÃO
[0258] Em alguns casos, um nível de abundância absoluta de sequências de RNA específicas do órgão pode ser usado como um indicador de que um órgão no sujeito está infectado por um patógeno. A detecção de uma infecção de órgão pode envolver a comparação de um nível de ácidos nucleicos específicos do órgão com um controle ou valor de referência para determinar a presença ou ausência dos ácidos nucleicos do órgão e/ou a quantidade de ácidos nucleicos específicos do órgão. O nível pode ser qualitativo ou quantitativo.
[0259] Em alguns casos, o controle ou valor de referência é um valor absoluto predeterminado indicando a presença ou ausência de ácidos nucleicos derivados de órgãos livres de células. Por exemplo, a detecção de um nível de ácidos nucleicos de patógenos livres de células acima do valor de controle pode indicar a presença de uma infecção em um órgão, enquanto um nível abaixo do valor de controle pode indicar a ausência de uma infecção em um órgão.
[0260] O valor de controle pode ser um valor obtido pela análise dos níveis de ácido nucleico livre de células de um sujeito sem infecção (por exemplo, um controle saudável). Em alguns casos, o valor de controle pode ser um valor de controle positivo obtido pela análise de ácidos nucleicos livres de células de um sujeito com uma infecção particular ou com uma infecção particular de um órgão específico.
[0261] Os valores de controle ou referência podem ser medidos como uma concentração ou como uma série de leituras de sequenciamento. Os valores de controle ou de referência podem ser dependentes de patógenos, dependentes de órgãos ou ambos dependentes de patógenos e dependentes de órgãos. Um banco de dados de níveis ou valores de controle pode ser gerado com base em amostras obtidas de um ou mais sujeitos, para um ou mais patógenos e/ou para um ou mais pontos de tempo. Esse banco de dados pode ser com curadoria ou proprietário.
[0262] Em algumas modalidades, o controle ou valor de abundância absoluta de referência indica a presença ou ausência de um sítio de localização em um sujeito. Por exemplo, a detecção de um nível de abundância absoluta de ácidos nucleicos de patógenos livres de células acima do controle ou valor de referência pode indicar que a infecção está em um órgão, enquanto um valor de abundância absoluta abaixo do controle ou valor de referência pode indicar que a infecção não está em um órgão. Em alguns casos, a detecção de um nível de abundância absoluta de ácidos nucleicos de patógenos livres de células acima do controle ou valor de referência pode indicar que a infecção está em um órgão, enquanto um valor de abundância absoluta abaixo do controle ou valor de referência pode indicar que a infecção não é em um órgão.
DISTRIBUIÇÃO DE COMPRIMENTOS DE FRAGMENTOS DE RNA ESPECÍFICO DE ÓRGÃO
[0263] Em alguns casos, a distribuição de comprimentos de fragmentos de sequências de RNA específicas de órgãos indica que um órgão em um sujeito está infectado por um patógeno.
[0264] Por exemplo, a detecção de uma distribuição anormal de ácidos nucleicos específicos de órgãos livres de células pode indicar que o órgão está infectado, enquanto uma distribuição normal de ácidos nucleicos específicos de órgãos livres de células pode indicar que o órgão não está infectado.
[0265] A distribuição do comprimento de fragmento de controle pode ser predeterminada analisando os níveis de ácido nucleico livre de células de um sujeito sem uma infecção em um órgão (por exemplo, um controle saudável). A distribuição do comprimento de fragmento de controle pode ser obtida em paralelo, analisando os níveis de ácido nucleico livre de células em um sujeito com uma infecção de órgão que não está associada à infecção.
[0266] Em algumas modalidades, a distribuição de controle ou referência de comprimentos de fragmento indica a presença ou ausência de um sítio de localização. Por exemplo, a detecção de uma distribuição anormal de ácidos nucleicos de patógenos livres de células pode indicar que a infecção está em um órgão, enquanto uma distribuição normal de ácidos nucleicos de patógenos livres de células pode indicar que a infecção não está em um órgão. Em alguns casos, a detecção de uma distribuição anormal de ácidos nucleicos de patógenos livres de células pode indicar que a infecção está em um órgão, enquanto uma distribuição normal de ácidos nucleicos de patógenos livres de células pode indicar que a infecção não está em um órgão.
VALOR LIMIAR OU INTERVALO DE VALORES PARA RNA ESPECÍFICO DE ÓRGÃO
[0267] Em alguns casos, um limiar de corte pode ser usado como um indicador de que um órgão no sujeito está infectado por um patógeno, conforme fornecido neste documento. Um limiar de corte pode ser determinado conforme fornecido neste documento, usando sequências de RNA específicas de órgão de um sujeito infectado por um patógeno e comparando-as a um controle ou referência.
[0268] Em alguns casos, a amostra é identificada como tendo um órgão infectado com uma precisão superior a 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93 %, 94%, 95%, 96%, 97%, 98%, 99%, 99,5% ou mais. Em alguns casos, a amostra é identificada como tendo um órgão infectado com uma sensibilidade superior a 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93 %, 94%, 95%, 96%, 97%, 98%, 99%, 99,5% ou mais. Em alguns casos, a amostra é identificada como tendo um órgão infectado com especificidade superior a 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93 %, 94%, 95%, 96%, 97%, 98%, 99%, 99,5% ou mais 95%.
[0269] Em alguns casos, a amostra é identificada como tendo um órgão infectado com um valor preditivo positivo de pelo menos 95%, 95,5%, 96%, 96,5%, 97%, 97,5%, 98%, 98,5%, 99%, 99,5% ou mais. Em alguns casos, a amostra é identificada como tendo um órgão infectado com um valor preditivo negativo de pelo menos 95%, 95,5%, 96%, 96,5%, 97%, 97,5%, 98%, 98,5%, 99%, 99,5% ou mais.
[0270] Em alguns casos, a amostra é identificada como tendo um órgão infectado com uma sensibilidade superior a 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93 %, 94%, 95%, 96%, 97%, 98%, 99%, 99,5% ou mais, e uma especificidade maior que 75%, 80%, 85%, 86%, 87%, 88%, 89 %, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5% ou mais 95%. B. TRATAMENTO E MONITORAMENTO
INDIVIDUALIZADO
[0271] A presente divulgação também fornece métodos para tratamento individualizado para um sujeito infectado ou um sujeito que é suscetível ou em risco de infecções (por exemplo, imunossuprimidos, imunocomprometidos, condições de vida ou variações genéticas resultando em aumento da suscetibilidade para infecção). O tratamento individualizado pode incluir prever se uma infecção irá progredir para um estágio de doença invasiva, monitorar a eficácia de uma terapia em um sujeito, modificar um regime terapêutico dependendo da resposta do sujeito à terapia e determinar a resistência do patógeno a um determinado terapêutico.
[0272] Em alguns casos, os métodos podem ser usados para detectar, diagnosticar, prever ou prognosticar a resistência do patógeno a um determinado terapêutico. Em alguns casos, os métodos podem compreender ainda o sequenciamento do DNA do sujeito para variações genéticas que estão associadas à resistência terapêutica a terapêuticas ou a uma terapêutica particular.
[0273] Em alguns casos, as amostras podem ser coletadas em série em vários momentos antes ou durante o curso da infecção para determinar a resposta do patógeno e do sujeito a um tratamento, proporcionando assim um regime que é adaptado individualmente. Em alguns casos, as amostras coletadas em série são comparadas umas às outras para determinar se a infecção está melhorando ou piorando no sujeito.
[0274] O tratamento pode envolver a administração de um medicamento ou outra terapia para reduzir ou eliminar a colonização ou doença invasiva associada à infecção. Em alguns casos, o sujeito pode ser tratado profilaticamente para prevenir o desenvolvimento de uma infecção. Qualquer procedimento ou tratamento médico, incluindo a administração de um medicamento, pode ser usado para melhorar ou reduzir os sintomas de uma infecção. Alguns medicamentos exemplares não limitantes que podem ser usados são antibióticos (como ampicilina, sulbactam, penicilina, vancomicina, gentamicina, aminoglicosídeo, clindamicina, cefalosporina, metronidazol, timentina, ticarcilina, ácido clavulânico, terapia antiretroviral altamente ativa, por exemplo, cefoxitina), (HAART), inibidores da transcriptase reversa, inibidores da transcriptase reversa de nucleosídeo/nucleotídeo (NRTIs), inibidores de RT não nucleosídeos e/ou inibidores de protease) ou imunoglobulinas.
[0275] A presente divulgação também fornece métodos de ajuste de um regime terapêutico. Por exemplo, pode ter sido administrado ao sujeito um medicamento para tratar a infecção. Os métodos fornecidos neste documento podem ser usados para rastrear ou monitorar a eficácia do tratamento com fármacos. Em alguns casos, o regime terapêutico pode ser ajustado, dependendo do curso ascendente ou descendente da infecção. Por exemplo, se os métodos fornecidos neste documento indicam que uma infecção não está melhorando com o tratamento com fármacos, o regime terapêutico pode ser ajustado mudando o tipo de fármaco ou tratamento, descontinuando o uso do fármaco, continuando o uso do fármaco, aumentando a dose do medicamento, ou adição de um novo medicamento ou tratamento ao regime terapêutico do sujeito.
[0276] Em alguns casos, o regime terapêutico pode envolver um procedimento específico. Por exemplo, em alguns casos, os métodos podem indicar a necessidade de um procedimento cirúrgico ou um procedimento de diagnóstico invasivo, como a remoção de um tumor ou a realização de uma biópsia para determinar se um órgão está infectado. Da mesma forma, se os métodos indicam que uma infecção está melhorando ou resolvida por uma intervenção terapêutica, então o ajuste de um regime terapêutico pode envolver a redução ou descontinuação do tratamento. Em outros casos, nenhum regime terapêutico pode ser administrado em vez da abordagem de “observação vigilante” ou “observação e espera” pode ser usada para ver se a infecção desaparece sem qualquer intervenção médica adicional.
[0277] Os métodos da divulgação podem compreender a detecção de um patógeno em um sujeito. Em alguns casos, o método pode compreender o uso de sequenciamento do genoma completo da amostra. Em alguns casos, o método pode compreender o uso de sequenciamento direcionado da amostra, onde primers específicos são usados para detectar um patógeno de interesse particular. Frequentemente, um patógeno pode ter um ciclo de tratamento sugerido. Por exemplo, o ciclo de tratamento para H. pylori é mostrado na Figura 6. Os métodos fornecidos pela divulgação podem ser usados em qualquer estágio do ciclo de tratamento.
[0278] Os métodos da divulgação podem ser aplicados a qualquer patógeno que tenha vários estágios de infecção. Os métodos podem ser especialmente úteis para patógenos que têm um estágio de colonização e um estágio de doença invasiva. Em alguns casos, o estágio da doença invasiva pode ser causado pela infecção do patógeno. Em alguns casos, o estágio da doença invasiva pode estar associado à infecção do patógeno.
[0279] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, monitorar, prever ou prevenir a colonização por Heliobacter pylori (H. pylori). A colonização por H. pylori pode ser assintomática. Em alguns casos, a colonização pode aparecer como uma gastrite aguda com dor abdominal (dor de estômago) ou náusea. A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a doença invasiva por H. pylori. Os indivíduos com doença invasiva por H. pylori podem desenvolver complicações como gastrite crônica, úlcera péptica, adenocarcinoma gástrico, câncer de estômago e/ou linfoma.
[0280] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a colonização por Clostridium difficile (CDI). O CDI pode se apresentar assintomático ou sintomático. O espectro clínico de uma infecção por CDI pode variar de doença leve a moderada, grave ou complicada. Os indivíduos com ICD leve a moderada podem apresentar diarreia, colite, incluindo febre, leucocitose e/ou cólicas. A gravidade dos sintomas abdominais e sistêmicos de CDI pode aumentar com a gravidade da infecção. Os métodos podem ser usados para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a doença invasiva de CDI. Os indivíduos com doença CDI complicada ou invasiva podem desenvolver colite pseudomembranosa, megacólon tóxico, perfuração do cólon e/ou sepse.
[0281] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a colonização por Haemophilus influenza. Geralmente, o Haemophilus influenza coloniza o trato respiratório superior de um sujeito. A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a doença invasiva por Haemophilus influenza. Os indivíduos com doença invasiva por Haemophilus influenza podem desenvolver complicações como sepse e/ou meningite.
[0282] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a colonização por Salmonella. A divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a doença invasiva por Salmonella. Alguns exemplos não limitativos de serótipos de Salmonella que estão associados a doenças invasivas incluem, mas não estão limitados a, Typhimurium, Typhi, Enteritidis, Heidelberg, Dublin, Paratyphi A, Choleraesuis e Schwarzengrund. Os indivíduos com doença invasiva por Salmonella podem desenvolver bacteremia, meningite, febre entérica e/ou doença invasiva não tifoide por Salmonella (iNTS).
[0283] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a colonização por Streptococcus pneumoniae. A divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a doença invasiva por Streptococcus pneumoniae. Os indivíduos com doença pneumocócica invasiva podem desenvolver bacteremia e/ou meningite.
[0284] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a colonização por Citomegalovírus (CMV). Os indivíduos infectados com CMV podem não apresentar sintomas, pois o vírus pode atingir períodos de dormência. A divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a doença invasiva por CMV. Os indivíduos com doença invasiva por CMV podem desenvolver complicações nos olhos, pulmões e/ou sistema digestivo.
[0285] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a colonização pelo vírus do papiloma humano (HPV). Indivíduos com colonização por HPV podem se apresentar como neoplasias intraepiteliais cervicais não invasivas e/ou verrugas genitais. A presente divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a doença invasiva por HPV. Indivíduos com doença HPV invasiva podem desenvolver câncer cervical, carcinoma de células escamosas anal e/ou carcinoma anal in situ.
[0286] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a colonização pelo vírus Epstein-Barr (EBV). Os indivíduos colonizados com EBV podem ser assintomáticos ou apresentar fadiga, febre, inflamação da garganta, aumento dos gânglios linfáticos no pescoço, aumento do baço, aumento do fígado e/ou erupção cutânea. A divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a doença invasiva por EBV. Indivíduos com doença invasiva por EBV podem desenvolver mononucleose infecciosa (por exemplo, febre glandular), têm maior risco de certas doenças autoimunes, desenvolver cânceres como linfoma de Hodgkin, linfoma de Burkitt, câncer gástrico, carcinoma nasofaríngeo, leucoplasia pilosa e/ou linfomas do sistema nervoso central.
[0287] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a colonização por hepatite B (HBV). As infecções por HBV podem ser transitórias ou crônicas. A divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir doenças invasivas associadas a uma infecção por HBV. Os indivíduos com doença VHB invasiva podem desenvolver cirrose, carcinoma hepatocelular, infecção hepática e/ou insuficiência hepática.
[0288] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a colonização pelo vírus da hepatite C (HCV). A infecção pelo HCV pode ser aguda ou crônica. Frequentemente, a colonização do HCV pode ser assintomática. Quando os sinais e sintomas estão presentes, eles podem incluir icterícia, juntamente com fadiga, náuseas, febre e dores musculares. Alguns indivíduos podem ter eliminação viral espontânea, enquanto outros podem progredir para um estágio crônico. No entanto, quando uma infecção por HCV se torna crônica, pode resultar em doença invasiva por HCV. A divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a doença invasiva por HCV. Os indivíduos com doença invasiva por HCV podem desenvolver cirrose, carcinoma hepatocelular, infecção hepática e/ou insuficiência hepática.
[0289] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a colonização pelo vírus do linfoma de células T humanas 1 (HTLV-1). O HTLV-1 infecta as células T de um sujeito. Os indivíduos infectados com HTLV-1 podem permanecer assintomáticos por anos. A divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a doença invasiva por HTLV-1. Indivíduos com doença invasiva por HTLV-1 podem desenvolver câncer de células T (ATL), leucemia, mielopatia associada ao HTLV- 1/paraparesia espástica tropical (HAM/TSP) ou outras condições.
[0290] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a colonização por gonorreia. Os indivíduos com infecção de colonização podem não apresentar sintomas, enquanto outros podem apresentar sintomas como ardor ao urinar, dor testicular ou pélvica e/ou secreção genital. A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a doença invasiva por gonorreia. Os indivíduos com doença invasiva de gonorreia podem desenvolver lesões de pele, infecção nas articulações (por exemplo, dor e inchaço nas articulações), endocardite e/ou meningite.
[0291] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a colonização por sífilis. A infecção por sífilis pode ser dividida em estágios primário, secundário, latente e terciário. Um sujeito com estágio primário pode apresentar uma ferida. Um sujeito em estágio secundário pode apresentar erupção cutânea, gânglios linfáticos inchados e/ou febre. Durante o estágio latente ou invisível da infecção por sífilis, os indivíduos geralmente são assintomáticos. A divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a sífilis invasiva. Um sujeito com estágio terciário ou doença invasiva pode desenvolver complicações em outros sistemas de órgãos, incluindo, mas não se limitando ao coração, vasos sanguíneos, cérebro e/ou sistema nervoso.
[0292] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a colonização por tricomoníase. Os indivíduos com infecção de colonização podem ser assintomáticos ou podem desenvolver inflamação na área genital. A presente divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a doença tricomoníase invasiva. Indivíduos com doença tricomoníase invasiva podem desenvolver câncer cervical e/ou câncer de próstata.
[0293] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a colonização pelo herpesvírus humano 8 (HHV-8), também conhecido como herpesvírus associado ao sarcoma de Kaposi ou KSHV. Indivíduos saudáveis com infecção de colonização geralmente são assintomáticos. No entanto, indivíduos com sistema imunológico enfraquecido podem desenvolver doença invasiva HHV-8. A divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a doença invasiva por HHV-8. Os indivíduos com doença HHV-8 invasiva podem desenvolver sarcoma de Kaposi e/ou vários distúrbios linfoproliferativos, como linfoma de derrame primário, doença de Castleman multicêntrica ou linfoma de células B.
[0294] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a colonização por poliomavírus de células de Merkel. Os indivíduos com infecção de colonização podem ser assintomáticos. A divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a doença invasiva de poliomavírus de células de Merkel. Indivíduos com doença invasiva de poliomavírus de células de Merkel podem desenvolver tumores de carcinoma de células de Merkel (MCC), uma forma rara, mas agressiva de câncer de pele.
[0295] A divulgação fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar ou prevenir a colonização por clamídia. Os indivíduos com infecção de colonização podem ser assintomáticos ou podem apresentar sensação de queimação ao urinar ou secreção genital. A divulgação também fornece métodos para detectar, monitorar, diagnosticar, prognosticar, tratar, prever ou prevenir a doença invasiva por clamídia. A clamídia não tratada pode progredir para o estágio de doença invasiva se espalhando para o útero e/ou trompas de falópio em mulheres. Indivíduos com doença invasiva por clamídia podem desenvolver doença inflamatória pélvica (DIP), que pode resultar em dor pélvica de longo prazo, incapacidade de engravidar e gravidez ectópica.
[0296] Em alguns casos, o sujeito está infectado ou em risco de infecção por um patógeno que tem diferentes estágios de infecção, como o estágio de colonização e um estágio de doença invasiva. Um sujeito colonizado pode não ter sinais ou sintomas clínicos. Em outros casos, um sujeito colonizado pode apresentar sinais ou sintomas clínicos. Um sujeito com doença invasiva pode apresentar sinais ou sintomas clínicos. Em outros casos, um sujeito com doença invasiva pode se apresentar sem sinais ou sintomas clínicos.
[0297] O sujeito pode ter ou estar em risco de ter outra doença ou distúrbio. Por exemplo, o sujeito pode ter, estar em risco de ter, ou ser suspeito de ter câncer (por exemplo, câncer de mama, câncer de pulmão, câncer de estômago, câncer hematológico, etc.).
[0298] Em alguns casos, o sujeito pode ter fatores de risco aumentados para contrair uma doença infecciosa ou progredir para um estágio de doença invasiva. Em alguns casos, os fatores de risco estão associados às condições de vida. Alguns exemplos não limitantes de fatores de risco associados às condições de vida incluem, mas não estão limitados a, condições de vida superlotadas, nenhuma fonte confiável de água potável, viver ou visitar um país em desenvolvimento e/ou coabitar com pessoas infectadas.
[0299] Em alguns casos, os fatores de risco para contrair uma infecção ou para a progressão para uma doença invasiva são variantes genéticas no DNA genômico do sujeito. Variantes genéticas que podem ser fatores de risco para infecção incluem, mas não estão limitadas a,
polimorfismos de nucleotídeo único, deleções, inserções ou semelhantes. Em alguns outros casos, os indivíduos podem ter história familiar de doença, como câncer gástrico, história familiar de gastrite linfocítica, pólipos gástricos hiperplásicos ou hiperêmese gravídica.
[0300] O sujeito pode ter ou estar em risco de ter outra doença ou coinfecção por mais de um patógeno. Em alguns casos, o sujeito está imunossuprimido (por exemplo, pacientes com transplante de órgãos). Em alguns casos, o sujeito está imunocomprometido (por exemplo, por tratamento de quimioterapia, deficiência imunológica causada por AIDS ou doença geral, como diabetes ou linfoma).
[0301] Em alguns casos, o sujeito pode apresentar um ou mais sintomas clínicos. Exemplos não limitantes de sintomas clínicos podem incluir dor ou queimação no abdômen, dor abdominal que piora quando o estômago está vazio, náuseas, perda de apetite, arrotos frequentes, inchaço na área do estômago, perda de peso, dor abdominal grave ou persistente, dificuldade em engolir, fezes com sangue ou alcatrão preto e/ou vômito com sangue ou preto. Sintomas clínicos adicionais são conhecidos na técnica.
[0302] Em alguns casos, o sujeito pode apresentar uma patologia clínica, como gastrite atrófica, gastrite aguda ou crônica, hiperacidez, estimulação antigênica, úlcera péptica ativa, história pregressa de DUP, linfoma de tecido linfoide associado à mucosa gástrica de baixo grau, um história de ressecção endoscópica de câncer gástrico precoce, dispepsia, esôfago de Barrett, dispepsia funcional, deficiência de ferro inexplicada ou púrpura trombocitopênica idiopática (PTI).
[0303] O sujeito pode ser infectado por um patógeno ou microrganismo de qualquer tipo, incluindo bacteriano, viral, fúngico, parasitário, procariótico, eucariótico, etc. Em alguns casos, o patógeno é conhecido, enquanto em outros casos pode ser um comensal conhecido.
[0304] Em alguns casos, o sujeito pode ter uma infecção ativa ou latente. Em alguns casos, o sujeito está infectado, mas a infecção está abaixo do nível de sensibilidade diagnóstica de outros testes realizados anteriormente no sujeito. Em alguns casos, o sujeito está infectado, mas assintomático ou a infecção está em um nível subclínico.
[0305] Em alguns casos, o sujeito pode ter sido tratado anteriormente ou pode ser tratado com um medicamento, como um medicamento antimicrobiano, antibacteriano, antiviral e/ou antiparasitário ou um procedimento médico. Em alguns casos, o sujeito pode não ter feito biópsia, endoscopia, colonoscopia, hemocultura ou outro procedimento antes do uso dos métodos no presente documento. Em alguns casos, o sujeito pode ter ou pode ter feito um teste de antígeno fecal, teste respiratório de ureia, sorologia, teste de urease, histologia, cultura bacteriana e teste de sensibilidade, biópsia ou endoscopia antes do uso dos métodos descritos no presente documento.
[0306] A presente divulgação fornece métodos para determinar o estágio ou sítio da infecção em um sujeito usando os ácidos nucleicos obtidos a partir de uma amostra clínica (por exemplo, sangue, soro, células ou tecido). Em algumas modalidades, o método compreende fazer uma amostra preparada adicionando-se ácidos nucleicos sintéticos fornecidos pela divulgação; extrair os ácidos nucleicos da amostra preparada; gerar uma biblioteca de amostra preparada; enriquecimento da biblioteca de amostra preparada para um ácido nucleico alvo de interesse; conduzir um ensaio de sequenciamento para obter leituras de sequência da biblioteca de amostra preparada; e determinar uma medição a partir dos ácidos nucleicos detectados (por exemplo, DNA, DNA livre de células de RNA ou RNA livre de células), e comparar essa medição a um controle ou uma referência para determinar o estágio de infecção ou um sítio de localização (por exemplo, órgão ou tipo de tecido) em um sujeito.
[0307] As modalidades dos métodos podem compreender a extração de ácidos nucleicos ou ácidos nucleicos alvo da amostra ou purificação de ácidos nucleicos ou ácido nucleico alvo de componentes indesejados em uma mistura de reação (por exemplo, ligação,
amplificação, enzima de restrição, reparo final, etc.). Qualquer meio de extrair ácidos nucleicos conhecido na técnica pode ser usado nos métodos do pedido.
[0308] A extração pode compreender a separação dos ácidos nucleicos de outros componentes celulares e contaminantes que podem estar presentes na amostra. Os ácidos nucleicos podem ser extraídos de uma amostra usando técnicas de extração líquida (por exemplo, Trizol, DNAzol). Em alguns casos, a extração é realizada por extração com fenol-clorofórmio ou precipitação por solventes orgânicos (por exemplo, etanol ou isopropanol). Em alguns casos, a extração é realizada usando colunas de ligação de ácido nucleico.
[0309] Em alguns casos, a extração é realizada usando kits disponíveis comercialmente, como o kit de ácido nucleico circulante Qiagen Qiamp Qiagen Qubit dsDNA HS Assay kit, kit Agilent™ DNA 1000, preparação de biblioteca de sequenciamento TruSeq™, kit de ácido nucleico circulante QIAamp, kit Qiagen DNeasy, Kit QIAamp, kit Qiagen Midi, kit spin QIAprep) ou colunas spin de ligação de ácido nucleico (por exemplo, kit mini- prep de DNA Qiagen). Em alguns casos, a extração de ácidos nucleicos livres de células pode envolver filtração ou ultrafiltração.
[0310] Os ácidos nucleicos podem ser extraídos ou purificados pelo uso de esferas magnéticas. Por exemplo, podem ser usados grânulos magnéticos com um núcleo de óxido de ferro e uma superfície revestida com moléculas contendo um ácido carboxílico livre ou um polímero sintético. A concentração de sal ou polialquilenoglicol pode ser ajustada para controlar a força das ligações entre os grupos funcionais e o ácido nucleico, permitindo a ligação controlada e reversível. Finalmente, os ácidos nucleicos podem ser liberados das partículas magnéticas com um tampão de eluição. Em alguns casos, a extração ou purificação é realizada usando kits disponíveis comercialmente, como o kit de esferas magnéticas Omega Biotek Mag-Bind®, Agencourt®, RNAClean® e/ou esferas magnéticas XP.
[0311] O método pode compreender a purificação dos ácidos nucleicos alvo. A purificação pode ser realizada quando um usuário deseja isolar o ácido nucleico alvo de componentes indesejados em uma mistura de reação. Métodos de purificação exemplificativos não limitativos incluem precipitação com etanol, precipitação com isopropanol, purificação com fenol clorofórmio e purificação em coluna (por exemplo, purificação em coluna baseada em afinidade), diálise, filtração ou ultrafiltração.
[0312] Os métodos de geração de bibliotecas de ácido nucleico são conhecidos na técnica.
SISTEMAS DE CONTROLE DE COMPUTADOR
[0313] A presente divulgação fornece sistemas de controle de computador que são programados para implementar métodos da divulgação. A Figura 7 mostra um sistema de computador 201 que é programado ou de outra forma configurado para implementar métodos da presente divulgação.
[0314] O sistema de computador 201 inclui uma unidade de processamento central (CPU, também "processador" e "processador de computador" no presente documento) 205, que pode ser um processador de núcleo único ou núcleo múltiplo, ou uma pluralidade de processadores para processamento paralelo. O sistema de computador 201 também inclui memória ou localização de memória 210 (por exemplo, memória de acesso aleatório, memória somente leitura, memória flash), unidade de armazenamento eletrônico 215 (por exemplo, disco rígido), interface de comunicação 220 (por exemplo, adaptador de rede) para comunicação com um ou mais outros sistemas e dispositivos periféricos 225, como cache, outra memória, armazenamento de dados e/ou adaptadores de exibição eletrônicos. A memória 210, unidade de armazenamento 215, interface 220 e dispositivos periféricos 225 estão em comunicação com a CPU 205 através de um barramento de comunicação (linhas sólidas), como uma placa-mãe. A unidade de armazenamento 215 pode ser uma unidade de armazenamento de dados (ou repositório de dados) para armazenar dados. O sistema de computador 201 pode ser operativamente acoplado a uma rede de computador ("rede") 230 com o auxílio da interface de comunicação 220. A rede 230 pode ser a Internet, uma internet e/ou extranet, ou uma intranet e/ou extranet que está em comunicação com a Internet. A rede 230 em alguns casos é uma rede de telecomunicações e/ou dados. A rede 230 pode incluir um ou mais servidores de computador, que podem permitir computação distribuída, como computação em nuvem. A rede 230, em alguns casos com o auxílio do sistema de computador 201, pode implementar uma rede ponto a ponto, que pode permitir que dispositivos acoplados ao sistema de computador 201 se comportem como um cliente ou servidor.
[0315] A CPU 205 pode executar uma sequência de instruções legíveis por máquina, que podem ser incorporadas em um programa ou software. As instruções podem ser armazenadas em um local de memória, como a memória 210. As instruções podem ser direcionadas para a CPU 205, que pode subsequentemente programar ou de outra forma configurar a CPU 205 para implementar métodos da presente divulgação. Exemplos de operações realizadas pela CPU 205 podem incluir buscar, decodificar, executar e reescrever.
[0316] A CPU 205 pode fazer parte de um circuito, como um circuito integrado. Um ou mais outros componentes do sistema 201 podem ser incluídos no circuito. Em alguns casos, o circuito é um circuito integrado específico de aplicação (ASIC).
[0317] A unidade de armazenamento 215 pode armazenar arquivos, como drivers, bibliotecas e programas salvos. A unidade de armazenamento 215 pode armazenar dados do usuário, por exemplo, preferências do usuário e programas do usuário. O sistema de computador 201, em alguns casos, pode incluir uma ou mais unidades de armazenamento de dados adicionais que são externas ao sistema de computador 201, como localizadas em um servidor remoto que está em comunicação com o sistema de computador 201 por meio de uma intranet ou da Internet.
[0318] O sistema de computador 201 pode se comunicar com um ou mais sistemas de computador remotos através da rede
230. Por exemplo, o sistema de computador 201 pode se comunicar com um sistema de computador remoto de um usuário (por exemplo, provedor de saúde). Exemplos de sistemas de computador remoto incluem computadores pessoais (por exemplo, PC portátil), slate ou tablet PC (por exemplo, Apple® iPad, Samsung® Galaxy Tab), telefones, smartphones (por exemplo, Apple® iPhone, dispositivo habilitado para Android, Blackberry®) ou assistentes digitais pessoais. O usuário pode acessar o sistema de computador 201 através da rede
230.
[0319] Os métodos descritos neste documento podem ser implementados por meio de código executável por máquina (por exemplo, processador de computador) armazenado em um local de armazenamento eletrônico do sistema de computador 201, tal como, por exemplo, na memória 210 ou unidade de armazenamento eletrônico 215. O código executável ou legível por máquina pode ser fornecido na forma de software. Durante o uso, o código pode ser executado pelo processador 205. Em alguns casos, o código pode ser recuperado da unidade de armazenamento 215 e armazenado na memória 210 para pronto acesso pelo processador 205. Em algumas situações, a unidade de armazenamento eletrônico 215 pode ser impedida e as instruções executáveis por máquina são armazenadas na memória 210.
[0320] O código pode ser pré-compilado e configurado para uso com uma máquina que possui um processador adaptado para executar o código ou pode ser compilado durante o tempo de execução. O código pode ser fornecido em uma linguagem de programação que pode ser selecionada para permitir que o código seja executado em um modo pré- compilado ou conforme compilado.
[0321] Aspectos dos sistemas e métodos fornecidos neste documento, como o sistema de computador 201, podem ser incorporados na programação. Vários aspectos da tecnologia podem ser considerados como
"produtos" ou "artigos de manufatura", normalmente na forma de código executável por máquina (ou processador) e/ou dados associados que são transportados ou incorporados em um tipo de meio legível por máquina. O código executável por máquina pode ser armazenado em uma unidade de armazenamento eletrônico, como memória (por exemplo, memória somente leitura, memória de acesso aleatório, memória flash) ou um disco rígido. A mídia do tipo "armazenamento" pode incluir qualquer ou todas as memórias tangíveis dos computadores, processadores ou semelhantes, ou módulos associados dos mesmos, como várias memórias de semicondutor, unidades de fita, unidades de disco e semelhantes, que podem fornecer armazenamento não transitório a qualquer momento para a programação do software. Todo ou parte do software pode, às vezes, ser comunicado por meio da Internet ou de várias outras redes de telecomunicações. Tais comunicações, por exemplo, podem permitir o carregamento do software de um computador ou processador para outro, por exemplo, de um servidor de gerenciamento ou computador host para a plataforma de computador de um servidor de aplicativos. Assim, outro tipo de mídia que pode conter os elementos de software inclui ondas ópticas, elétricas e eletromagnéticas, como as usadas em interfaces físicas entre dispositivos locais, por meio de redes fixas com fio e ópticas e através de vários links aéreos. Os elementos físicos que carregam tais ondas, como links com ou sem fio, links ópticos ou semelhantes, também podem ser considerados como mídia portadora do software. Conforme usado neste documento, a menos que restrito a mídia de "armazenamento" tangível e não transitória, termos como "meio legível" de computador ou máquina referem-se a qualquer meio que participa no fornecimento de instruções a um processador para execução.
[0322] Portanto, um meio legível por máquina, como código executável por computador, pode assumir muitas formas, incluindo, mas não se limitando a, um meio de armazenamento tangível, um meio de onda portadora ou meio de transmissão física. Os meios de armazenamento não voláteis incluem, por exemplo, discos ópticos ou magnéticos, tais como qualquer um dos dispositivos de armazenamento em qualquer computador ou semelhantes, tais como podem ser usados para implementar os bancos de dados, etc. mostrados nos desenhos. A mídia de armazenamento volátil inclui memória dinâmica, como a memória principal de uma plataforma de computador. Os meios de transmissão tangíveis incluem cabos coaxiais; fio de cobre e fibra óptica, incluindo os fios que compõem um barramento dentro de um sistema de computador. A mídia de transmissão de onda portadora pode assumir a forma de sinais elétricos ou eletromagnéticos, ou ondas acústicas ou de luz, como aquelas geradas durante as comunicações de dados de radiofrequência (RF) e infravermelho (IR). Formas comuns de mídia legível por computador, portanto, incluem, por exemplo: um disquete, um disco flexível, disco rígido, fita magnética, qualquer outro meio magnético, um CD-ROM, DVD ou DVD-ROM, qualquer outro meio óptico, papel para cartões perfurados fita, qualquer outro meio de armazenamento físico com padrões de orifícios, uma RAM, um ROM, um PROM e EPROM, um FLASH-EPROM, qualquer outro chip de memória ou cartucho, uma onda portadora transportando dados ou instruções, cabos ou links transportando tal portador onda, ou qualquer outro meio a partir do qual um computador pode ler o código de programação e/ou dados. Muitas dessas formas de mídia legível por computador podem estar envolvidas no transporte de uma ou mais sequências de uma ou mais instruções para um processador para execução.
[0323] O sistema de computador 201 pode incluir ou estar em comunicação com um visor eletrônico 235 que compreende uma interface de usuário (UI) 240 para fornecer uma saída de um relatório, que pode incluir um diagnóstico de um sujeito ou uma intervenção terapêutica para o sujeito. Exemplos de UIs incluem, sem limitação, uma interface gráfica de usuário (GUI) e uma interface de usuário baseada na web. A análise pode ser fornecida como um relatório. O relatório pode ser fornecido a um sujeito, um profissional de saúde, um trabalhador de laboratório ou outro indivíduo.
[0324] Métodos e sistemas da presente divulgação podem ser implementados por meio de um ou mais algoritmos. Um algoritmo pode ser implementado por meio de software mediante execução pela unidade de processamento central 205. O algoritmo pode, por exemplo, facilitar o enriquecimento, sequenciamento e/ou detecção de ácidos nucleicos de patógenos.
[0325] As informações sobre um podem ser inseridas em um sistema de computador, por exemplo, um identificador de paciente, como informações sobre o estágio de infecção ou risco de infecção, histórico do paciente, histórico médico do paciente, infecções anteriores ou varreduras de ultrassom. Os identificadores de pacientes podem ser separados das amostras clínicas para obter amostras não identificadas, por exemplo, pelo remetente da amostra ou pelo destinatário da amostra. Os identificadores do paciente podem ser substituídos por números de acesso ou outro código de identificação não individual. As amostras clínicas podem ser sequenciadas usando um sequenciador de alto rendimento. Os dados de sequência de amostra não identificados gerados pelo sequenciador podem ser carregados em um servidor, como um servidor em nuvem. Usando-se os métodos divulgados no presente documento, ácidos nucleicos de patógenos em amostras não identificadas podem ser detectados para obter dados de resultados não identificados. Os dados de resultados não identificados podem ser baixados do servidor. Os dados de resultados não identificados podem ser associados a identificadores de pacientes, por exemplo, pelo remetente da amostra ou pelo destinatário da amostra.
[0326] Um relatório eletrônico pode ser gerado para indicar o estágio de infecção de um patógeno. Um relatório eletrônico pode ser gerado para indicar o prognóstico. Um relatório eletrônico pode ser gerado para indicar o diagnóstico. Se um relatório eletrônico indicar que há uma infecção tratável, o relatório eletrônico pode ser gerado para prescrever um regime terapêutico ou plano de tratamento. O sistema de computador pode ser usado para analisar os resultados de um método descrito no presente documento,
relatar os resultados a um paciente ou médico ou propor um plano de tratamento.
KITS
[0327] Também são fornecidos reagentes e kits dos mesmos para a prática de um ou mais dos métodos descritos no presente documento. Os reagentes em questão e seus kits podem variar muito. Os reagentes de interesse incluem reagentes especificamente projetados para uso na identificação, detecção e/ou quantificação de um ou mais ácidos nucleicos de patógenos em uma amostra obtida de um sujeito infectado com um patógeno ou em risco de infecção.
[0328] Os kits podem compreender reagentes necessários para realizar a extração de ácido nucleico e/ou detecção de ácido nucleico usando os métodos descritos no presente documento, como PCR e sequenciamento. O kit pode compreender ainda um pacote de software para análise de dados, que pode incluir perfis de referência para comparação com o perfil de teste de uma amostra clínica e, em particular, pode incluir bancos de dados de referência. Os kits podem incluir reagentes, como tampões e água.
[0329] Esses kits também podem incluir informações, tais como referências da literatura científica, materiais de bula, resultados de ensaios clínicos e/ou resumos destes e semelhantes, que indicam ou estabelecem as atividades e/ou vantagens da composição e/ou que descrevem dosagem, administração, efeitos colaterais, interações medicamentosas ou outras informações úteis para o profissional de saúde. Esses kits também podem incluir instruções para acessar um banco de dados. Essas informações podem ser baseadas nos resultados de vários estudos, por exemplo, estudos com animais de experimentação envolvendo modelos in vivo e estudos baseados em ensaios clínicos em humanos. Os kits descritos neste documento podem ser fornecidos, comercializados e/ou promovidos para provedores de saúde, incluindo médicos, enfermeiras, farmacêuticos, funcionários de formulários e semelhantes. Os kits também podem, em algumas modalidades, ser comercializados diretamente ao consumidor.
[0330] Será entendido que a referência aos exemplos abaixo é apenas para fins ilustrativos e não limita o escopo das reivindicações.
EXEMPLOS EXEMPLO 1. FORMAS DE DISTRIBUIÇÃO E ESTADO
DO MICRÓBIO
[0331] O processamento de amostras biológicas com um método que carece de polarização ou permite a correção da tendência na região de comprimentos de fragmento de interesse permite a medição das distribuições de comprimento de fragmento endógeno e cria o potencial de usar perfis de distribuição de comprimento de fragmento endógeno para informar o diagnóstico também como aspectos terapêuticos de um tratamento. Diversas amostras clínicas diferentes foram processadas, portanto, mostram a diversidade dos perfis de distribuição do comprimento de fragmento. Um processo direto para a biblioteca sem comprimento detectável e tendência de GC dentro da faixa de comprimento de fragmento investigado foi aplicado para obter as formas das distribuições de comprimento de fragmento endógeno.
[0332] Amostras clínicas de plasma: 36 com diagnóstico positivo (ou seja, a presença de micróbios confirmada com um teste ortogonal, por exemplo: hemocultura, PCR direcionada, teste de Karius) foram coletadas de 36 indivíduos. O processo de extração de plasma de etapa única de centrifugação do sangue total dentro de 24 horas da coleta da amostra foi realizado para cada amostra, conforme descrito anteriormente (ver a primeira etapa de centrifugação em Fan HC et al., PNAS 2008; 105 (42): 16266-16271, que é incorporado por referência em sua totalidade neste documento, incluindo quaisquer desenhos), e armazenado a -80 °C até o uso. As amostras foram então descongeladas e 200 µl de cada plasma foram preparados com 2 µl de Spike-in Master Mix (ver abaixo).
[0333] Amostras de controle de ensaio positivo: Dois controles positivos, denominados amostras de controle de ensaio (AC), foram processados para cada grupo de 18 amostras, respectivamente. As amostras de
AC foram preparadas a partir de plasma humano assintomático preparado com genomas cortados enzimaticamente de patógenos humanos, adquiridos na forma purificada da ATCC (American Type Culture Collection). Os patógenos humanos selecionados foram Aspergillus fumigatus, Escherichia coli, Pseudomonas aeruginosa e Staphylococcus epidermidis. 10 µl de Spike-in Master Mix (consultar abaixo) foram adicionados por 1 ml de amostra AC.
[0334] Amostras de controle negativo: Quatro amostras de 500 µl de controle negativo (EC) por 18 amostras foram feitas a partir de tampão aquoso (Tris 10 mM pH 8, EDTA 0,1 mM, 0,05% em v/v Tween- 20) com 5 µl de Spiked-in Master Mix (consultar abaixo) e serviu como controle para contaminação ambiental (isto é, micróbio e contaminação de ácido nucleico patogênico introduzida pelos reagentes, instrumentação, consumíveis, operadores e/ou ar durante o processamento). Esses ácidos nucleicos sintéticos foram usados para normalizar o sinal nas amostras, a fim de contabilizar as variações no processamento da amostra.
[0335] Spike-in Master Mix: um conjunto de moléculas de controle de processo foram pré-misturadas em uma única Spike-in Master Mix, com cada Spike-in Master Mix contendo uma única molécula de controle de processo “ID Spike”, consultar, por exemplo, Patente dos Estados Unidos 9.976.181. O Spike-in Master Mix continha três classes de moléculas: moléculas ID Spike, moléculas SPANK e moléculas SPARK. O último grupo de moléculas era composto por duas classes de SPARKs: GC dSPARKs e Long SPARKs. A concentração molar de ID Spike, moléculas SPANK e moléculas longas SPARK na Spike-in Master Mix foi de 500 pM por molécula, enquanto as moléculas GC dSPARK estavam presentes em 50 pM por molécula.
[0336] Moléculas “ID Spike”: Cada amostra recebeu uma única molécula de DNA de fita simples ID Spike caracterizada por uma sequência única de 50 pares de bases que não estava presente em nenhum genoma de referência disponível em bancos de dados públicos no momento do processamento.
[0337] Moléculas SPANK: as moléculas SPANK usadas eram um pool de moléculas de DNA de fita simples, cada um com 50 pares de bases de comprimento com sequências idênticas de extremidade 3 'e 5' que não estavam presentes em nenhum genoma de referência disponível em bancos de dados públicos no momento do processamento. Além disso, dois trechos de 8 pares de bases aninhados entre as sequências constantes de extremidade 3 'e 5' estavam presentes e degeneraram totalmente dentro do conjunto. O pool de moléculas SPANK continha 416 moléculas SPANK exclusivas. Os dois trechos degenerados foram separados por um trecho de quatro bases não degeneradas.
[0338] Moléculas SPARK: Um GC Spike-in Panel era um conjunto de moléculas de 32, 42, 52 e 75 nt de comprimento, onde 7 sequências diferentes com conteúdo de GC 20%, 30%, 40%, 50%, 60%, 70% e 80% foram incluídos para cada comprimento. Como algumas das outras moléculas fornecidas acima, as sequências GC dSPARK não ocorreram nos genomas de referência disponíveis. Um conjunto de sequências Long SPARK era um grupo de 4 sequências não naturais, cada uma com 50% de conteúdo GC e comprimentos de 100 nt, 125 nt, 150 nt e 175 nt. Um conjunto completo de moléculas SPARK continha 32 sequências diferentes.
[0339] Geração de Biblioteca: A geração direta para a biblioteca foi descrita no Pedido Provisório US 62/770.181, depositado em 21 de novembro de 2018, no presente documento incorporado a título de referência em sua totalidade. No presente documento, um método baseado em troca de modelo com Proteinase K foi utilizado. Resumidamente, 50,0 µl de cada amostra preparada foram misturados com 20,0 µl de 10x Terminal Transferase Reaction Buffer (NEB, Ipswich, MA), 5,0 µl de Proteinase K (Sigma), 2,0 µl de Tween-20 10% (Thermo-Fisher Scientific, Waltham, MA), 2,0 µl de Triton X100 a 10% (Thermo-Fisher Scientific, Waltham, MA) e 121,0 µl de água sem nuclease. A mistura foi aquecida a 60 °C durante 20 minutos e 95 °C durante 10 minutos e colocada em gelo até arrefecer. 2,0 µl de dATP 10 mM, 2,0 µl de Terminal
Transferase (20 u/µl, NEB, Ipswich, MA) e 6,0 µl de água livre de nuclease foram adicionados para preparar a reação de cauda A que foi incubada a 37 °C por 40 min. 300,0 µl de tampão de lise/ligação (Thermo-Fisher Scientific, Waltham, MA) foram adicionados à reação.
O volume total foi então adicionado a 50,0 µl de Dynabeads oligo (dT) 25 (Thermo-Fisher Scientific, Waltham, MA), que foi lavado uma vez com tampão de lise/ligação (Thermo-Fisher Scientific, Waltham, MA). A mistura foi incubada a 25 °C e 600 RPM.
As contas foram então lavadas duas vezes com 600,0 µl de tampão de lavagem A (Thermo-Fisher Scientific, Waltham, MA) e duas vezes com 300,0 µl de tampão de lavagem B (Thermo- Fisher Scientific, Waltham, MA) antes da eluição em 24,0 pF de tampão de eluição (Thermo-Fisher Scientific, Waltham, MA) a 80 °C e 600 RPM por 3 minutos.
Todo o eluato foi transferido para uma nova placa. 2,0 µl de iniciador Poly dT 1 µM (IDT) e 6 µl de tampão SMARTScribe 1st Strand (5x) (Takara, Kusatsu, Japão) foram adicionados ao eluato e a mistura resultante incubada a 95 °C por 1 minuto antes de colocar no gelo.
A mistura de extensão e troca de modelo foi preparada combinando 4,5 µl de tampão SMARTScribe 1st Strand (5x) (Takara, Kusatsu, Japão), 0,5 µl de mistura de dNTP (25 mM por nucleotídeo, Thermo-Fisher Scientific, Waltham, MA), 2,0 µl Transcriptase reversa SMARTScribe (100 u/µl, Takara, Kusatsu, Japão), 2,0 µl de 5 µM de Oligo de troca de modelo (TS Oligo) (IDT), 5,0 µl de DTT (20M, Takara, Kusatsu, Japão) e 4 µl de água livre de nuclease.
A mistura de reação resultante foi incubada durante 90 min a 42 °C e a reação foi desnaturada por calor a 70 °C durante 15 min.
Em seguida, 50,0 µl de NEBNext Ultra II Q5 (NEB, Ipswich, MA) e 8,0 µl de mistura de iniciador de indexação (NEB, Ipswich, MA) foram adicionados à reação da etapa anterior.
A amplificação dos ácidos nucleicos foi realizada então usando o seguinte programa de ciclagem de temperatura: 98 °C por 30 segundos, 8 ciclos de 98 °C por 10 segundos, 65 °C por 75 segundos e uma extensão final de 65 °C por 5 min.
Bibliotecas de ácido nucleico finais foram então agrupadas em grupos de quatro ECs, dois ACs e dezoito amostras clínicas antes de usar esferas RNAclean™ Ampure para purificar o conjunto como descrito acima. Após a purificação, a concentração dos ácidos nucleicos nos pools da biblioteca foi medida com TapeStation conforme descrito acima e carregada no sequenciador de acordo com as recomendações do fabricante.
[0340] Sequenciamento: As amostras foram sequenciadas para obter leituras de sequência usando um sequenciador NextSeqTM 500 da Illumina. O sequenciamento foi conduzido seguindo as instruções do fabricante usando 76 ciclos.
[0341] Análise de dados de sequenciamento: A saída de sequenciamento primária foi demultiplexada por bcl2fastq v2.17.1.14 (com parâmetros padrão), seguido pela remoção dos oligos de troca de modelo usando Cutadapt. A cauda poli A foi removida e as leituras foram cortadas com qualidade e, subsequentemente, filtradas se menores que 20 bases por Trimmomatic v 0.32. As leituras que passaram por esses filtros foram alinhadas com referências humanas e sintéticas (incluindo moléculas de controle de processo e adaptador de sequenciamento) usando Bowtie v2.2.4. As leituras com alinhamentos de qualquer um foram postas de lado. Leituras potencialmente representando DNA de satélite humano também foram filtradas por meio de um método baseado em k-mer. As leituras restantes foram alinhadas contra um banco de dados de referência de microrganismos usando BLAST v2.2.30. As leituras com alinhamentos que exibiram alta porcentagem de identidade e alta cobertura de consulta foram mantidas, com exceção das leituras que se alinharam com qualquer sequência de referência de mitocondrial ou plasmídeo. As duplicatas de PCR foram removidas com base em seus alinhamentos. Abundâncias relativas foram atribuídas a cada táxon em uma amostra com base nas leituras de sequenciamento e seus alinhamentos. Para cada combinação de leitura e táxon, foi definida uma probabilidade de sequência de leitura que explica a divergência entre o microrganismo presente na amostra e os conjuntos de referência no banco de dados. Um modelo de mistura foi usado para atribuir uma probabilidade à coleção completa de leituras de sequenciamento que incluía as probabilidades de sequência de leitura e as abundâncias (desconhecidas) de cada táxon na amostra.
Um algoritmo de maximização de expectativa foi aplicado para calcular a estimativa de máxima verossimilhança da abundância de cada táxon.
A partir dessas abundâncias, o número de leituras provenientes de cada táxon foi agregado na árvore taxonômica.
Um conjunto de bibliotecas pode ser preparado a partir dos respectivos tampões de controle negativo e processado e sequenciado dentro de cada lote.
Abundâncias estimadas de táxons das amostras de controle negativo dentro do lote podem ser combinadas para parametrizar um modelo de abundância de leitura proveniente do ambiente com variações impulsionadas por ruído de contagem.
Os valores de significância estatística podem ser calculados para cada abundância de táxons estimada e aqueles dentro do CRR em altos níveis de significância compreendem chamadas candidatas (isto é, chamadas significativas). As chamadas finais (ou seja, chamadas relatáveis) foram feitas após a aplicação de filtragem adicional, levando em consideração a uniformidade de localização de leitura, a porcentagem de identidade lida e a reatividade cruzada originada de chamadas de maior abundância.
O número de leituras de vários comprimentos de fragmento para cada micróbio relatável em cada biblioteca de ácido nucleico processado foi determinado, as distribuições de comprimento de fragmento foram avaliadas e a característica de comprimento de fragmento do forma de distribuição foi determinada.
A Figura 8 mostra exemplos de algumas das formas de distribuição de comprimento de fragmento distintas observadas entre os micróbios detectados dentro das amostras clínicas testadas.
O intervalo de comprimentos de fragmento mostrado é limitado a 22 bp na extremidade mais curta devido ao comprimento mínimo de mapeamento e 68 bp definido por uma combinação de comprimento máximo de leitura no experimento de sequenciamento descrito e algoritmo de corte do adaptador.
Consequentemente, os fragmentos com mais de 68 bp contribuíram para a contagem no compartimento de comprimento de 68 bp.
Os três micróbios detectados nos três exemplos mostrados foram Candida tropicalis, Aspergillus oryzae e poliomavírus WU.
As formas de distribuição do comprimento de fragmento variam consideravelmente entre esses micróbios e não estão relacionados à espécie particular ou ao super-reino, conforme mostrado pelo restante dos dados (não mostrado).
[0342] Candida tropicalis foi detectada em três diferentes amostras clínicas no presente documento processadas. O subconjunto de leituras de cada amostra que se alinhou ao genoma de referência de Candida tropicalis foi identificado e suas distribuições de comprimento de fragmento foram determinadas. Os resultados são mostrados na Figura 9 com distribuições de comprimento de fragmentos de Candida tropicalis de cada uma das três amostras em um painel separado. Os painéis esquerdo e do meio mostram uma distribuição com fração maior curta (<40 bp) e longa (> 65 bp) em relação ao pico de 50 bp em comparação com o painel direito, embora ambos tenham um pico claro em aproximadamente 45-50 bp. Os 2 painéis da esquerda são de pacientes com infecção disseminada por Candida tropicalis, o que, sem ser limitado pelo mecanismo, pode explicar o aumento da quantidade de fragmentos longos e curtos em relação ao pico. As diferentes distribuições de comprimento de fragmento podem indicar um estado diferente de doença ou condição. O poliomavírus WU foi outro exemplo de um micróbio que foi detectado em várias amostras clínicas processadas neste estudo e exibiu distribuição de comprimento de fragmento diferente em cada amostra (Figura 10). Em um sujeito, o poliomavírus WU mostrou apenas o “pico de 50 bp”. O segundo sujeito mostrou uma contribuição considerável da fração semelhante a exponencial curta, bem como uma fração mais alta de leituras com mais de 68 bp. Embora não seja limitado pelo mecanismo, o poliomavírus WU pode ter sido incorporado ao genoma humano nesta amostra ou seu genoma foi liberado no fluido corporal, o que causou diferentes padrões de fragmentação. Em um total de 36 amostras clínicas (ver acima), 60, 24 e 13 micróbios bacterianos, fúngicos e virais foram detectados, respectivamente. As distribuições do comprimento dos fragmentos desses micróbios variam consideravelmente, conforme demonstrado pelos exemplos acima. Em seguida, _a proporção de contagens de leitura detectada no pico de “pico de 50 bp” vs. a região curta de tipo exponencial da distribuição para todos os micróbios ou patógenos detectados foi determinada. As proporções obtidas foram agrupadas por seu super-reino e o histograma de proporções características de cada super-reino foi gerado. Os resultados de uma dessas análises são apresentados na Figura 11. A mesma análise foi realizada para o DNA humano (isto é, DNA do hospedeiro) e DNA mitocondrial humano (isto é, DNA mitocondrial do hospedeiro) como um controle (Figura 11). O comportamento dos micróbios depende do superreino e esse aspecto deve ser levado em consideração ao usar formas e propriedades de distribuição de comprimento de fragmentos para fins de diagnóstico. EXEMPLO 2. ANÁLISE DE AMOSTRAS DE PLASMA DE
UM SUJEITO GESTANTE
[0343] Muitos tipos de ácidos nucleicos não hospedeiros podem ser encontrados em uma amostra obtida de um hospedeiro. Os ácidos nucleicos livres de células fetais podem ser detectados no sangue materno. Nessas amostras, as amostras de plasma foram obtidas de 15 mulheres grávidas com consentimento e não identificadas. As amostras foram processadas e sequenciadas de acordo com o método direto à biblioteca baseado em ligação descrito como Exemplo 1 do Pedido Provisório US 62/770.181, depositado em 21 de novembro de 2018, no presente documento incorporado a título de referência em sua totalidade. Apenas as amostras de mulheres grávidas de feto masculino foram consideradas nesta análise. As leituras que se alinharam apenas ao cromossomo Y foram consideradas fetais. As leituras foram alinhadas ao genoma humano usando bowtie2. As leituras mapeadas para o cromossomo Y foram então alinhadas usando bowtie2 para um índice criado a partir de todos os cromossomos humanos, exceto para Y. Quaisquer leituras alinhadas com este índice foram descartadas para que apenas as leituras exclusivas do cromossomo Y permanecessem.
[0344] As distribuições de comprimento de fragmento para ácidos nucleicos livres de células maternas (linha tracejada) e fetais (linha sólida) de um indivíduo são apresentadas na Figura 12. Neste exemplo, a proporção de leituras fetais para maternas é maior na região de "pico de 50 bp" em comparação com a região do fragmento nucleossômico (por exemplo, região de 150-200 bp). Em média, uma concentração 4x mais alta dos fragmentos fetais foi observada na região do "pico de 50 bp" em comparação com a região do fragmento de comprimento nucleossômico. O processo empregado no presente documento pode ser usado para enriquecimento da fração fetal. EXEMPLO 3. ANÁLISE DE MICRÓBIOS USANDO
PERFIS DE COMPRIMENTO DE FRAGMENTO
[0345] Bibliotecas de ácido nucleico foram preparadas e sequenciadas a partir de mais de 4000 amostras de plasma livre de células usando um teste Karius validado, um método baseado em extração que recupera fragmentos de DNA de fita dupla de uma forma imparcial em relação ao seu comprimento e conteúdo de GC dentro de um comprimento de fragmento intervalo relevante para os ácidos nucleicos livres de células. Os perfis de comprimento dos fragmentos para micróbios detectados foram gerados e avaliados para 33 táxons que foram chamados de 10 ou mais vezes dentro do grupo de amostra estudado. Mais especificamente, a proporção da fração de leituras curtas em chamadas de baixa probabilidade e alta probabilidade foi avaliada. Os resultados de uma dessas experiências são apresentados na Figura 13. Neste experimento, o gráfico indica que mais chamadas de baixa probabilidade têm leituras curtas do que chamadas de alta probabilidade. Embora não sejam limitados pelo mecanismo, esses resultados podem sugerir que as infecções clínicas têm uma distribuição de comprimento de fragmento mais longa do que os colonizadores ou organismos não patogênicos translocados na corrente sanguínea quando os DNAs livres de células de fita dupla reparáveis nas extremidades são considerados. EXEMPLO 4. ANÁLISE DE SÍTIO DE LOCALIZAÇÃO
USANDO PERFIS DE COMPRIMENTO DE FRAGMENTO
[0346] Dezenove amostras clínicas foram obtidas de indivíduos que foram confirmados como sofrendo de uma infecção, conforme determinado por testes de urina positivos (n = 19) e/ou hemocultura (n = 11). Bibliotecas de ácido nucleico foram preparadas a partir dessas amostras e sequenciadas usando um teste Karius validado, um método baseado em extração que recupera fragmentos de DNA de fita dupla de uma forma imparcial em relação ao seu comprimento e conteúdo de GC dentro de uma faixa de comprimento de fragmento relevante para ácidos nucleicos livres de células. . Em todos os dezenove indivíduos, as culturas de sangue e urina identificaram 19 e 11 micróbios, respectivamente. As formas do perfil de distribuição do comprimento de fragmento para os micróbios detectados por culturas de sangue e urina foram avaliadas. Os resultados são mostrados na Figura 14. Embora não seja limitado pelo mecanismo, o DNA do patógeno proveniente de uma infecção profunda do tecido (pulmão, cérebro, etc.) pode sofrer diferentes mecanismos de degradação que afetam o comprimento de fragmento observado como DNA proveniente de um patógeno que infecta a corrente sanguínea. EXEMPLO 5. PERFIL DE DISTRIBUIÇÃO DE
COMPRIMENTO DE ÁCIDOS NUCLEICOS HOSPEDEIROS E ESTADO DE INFECÇÃO
[0347] A distribuição do comprimento de fragmento para os ácidos nucleicos do hospedeiro pode ajudar a informar o sinal do ácido nucleico não-hospedeiro dentro de um hospedeiro, por exemplo, sinal de ácido nucleico microbiano ou estágio de infecção de um hospedeiro (por exemplo, assintomático vs. sintomático). Por exemplo, a abundância de ácidos nucleicos microbianos em uma amostra de um hospedeiro humano pode variar em várias ordens de magnitude (Blauwkamp et al. (2016)). Enquanto as amostras obtidas de indivíduos assintomáticos tendem a exibir menores abundâncias de ácidos nucleicos microbianos em comparação com os indivíduos infectados, as abundâncias medidas em algumas amostras assintomáticas podem exceder as menores abundâncias entre os indivíduos infectados (Blauwkamp et al. (2016)). Propriedades adicionais do pool de ácido nucleico obtido a partir de uma amostra podem ajudar a distinguir entre os diferentes estágios infecciosos ou a relação biológica de um micróbio com o hospedeiro (por exemplo, comensal vs. patogênico). No presente documento, testa-se a utilidade da distribuição do comprimento dos ácidos nucleicos do hospedeiro na previsão do estado de infecção dos micróbios dentro de um plasma de um hospedeiro. Nossos métodos permitem o acesso a perfis de comprimento de fragmento endógeno com comprimentos de fragmento que métodos anteriores normalmente não acessavam de forma imparcial. Nossos métodos também permitem o acesso a perfis de comprimento de fragmento endógeno com comprimentos de fragmento que os métodos anteriores normalmente descartaram, foram desconsiderados ou considerados sem importância.
[0348] Amostras clínicas de plasma: 100 assintomáticos (critérios de coleta: sem problemas de saúde ativos relacionados à infecção e. Passou nos testes de triagem de sangue normais), 85 com diagnóstico positivo (ou seja, a presença de micróbios confirmada com um teste ortogonal, por exemplo: hemocultura, PCR direcionada, Teste de Karius), e 45 amostras de plasma com diagnóstico negativo foram coletadas de sujeitos humanos. O processo de extração de plasma de etapa única de centrifugação do sangue total dentro de 24 horas da coleta da amostra foi realizado para cada amostra, conforme descrito anteriormente (Consultar Fan HC et al., PNAS 2008; 105 (42): 16266-16271, que é incorporado a título de referência em sua totalidade neste documento, incluindo quaisquer desenhos), e armazenado a - 80 °C até o uso. As amostras foram então descongeladas e 500 µl de cada plasma foram preparados com 5 µl de Spike-in Master Mix (ver acima). Se volumes menores foram obtidos, um volume proporcionalmente menor de Spike- in Master Mix foi adicionado para manter uma concentração constante das moléculas de controle de processo em todas as amostras iniciais e amostras de controle.
[0349] As amostras de controle positivo e negativo foram preparadas como descrito acima.
[0350] Geração e sequenciamento direto da biblioteca de ácido nucleico do plasma: A geração direta para a biblioteca foi descrita no Pedido Provisório US 62/770.181, depositado em 21 de novembro de 2018, incorporado no presente documento a título de referência em sua totalidade. As bibliotecas foram preparadas e sequenciadas conforme descrito acima no Exemplo 1.
[0351] Resultados: As abundâncias dos micróbios significativos presentes em cada amostra foram determinadas conforme descrito acima e foram dadas em unidades de concentração de moléculas por microlitro (MPM) da amostra de plasma, uma quantidade normalizada que dá o número estimado de fragmentos de ácido nucleico únicos para um organismo em 1 microlitro de amostra de plasma. Este cálculo foi derivado do número de sequências únicas ou deduplicadas presentes para cada organismo normalizado para a quantidade conhecida de spike-ins sintéticos exclusivos adicionados à amostra de plasma antes do início do processo (consultar a Patente nº U.S.
9.976.181). A Figura 9A mostra a distribuição em valores de MPM em tipos de amostra assintomática (AP) e de diagnóstico positivo (DP). Os valores de abundância mais baixos nos tipos de amostra DP se sobrepõem à faixa de MPMs observada nas amostras AP, mesmo se apenas os micróbios que foram confirmados ortogonalmente forem incluídos. (DPNGS inclui micróbios confirmados pelo Teste de Karius e DPmicro inclui micróbios confirmados por cultura ou métodos baseados em PCR). Além disso, se a análise for restrita a espécies microbianas que estão presentes no conjunto de amostras de AP e também no conjunto de amostras de DP (neste conjunto de dados, as seguintes espécies se encaixam nesta descrição: Bacillus coagulans, Enterococcus cecorum, Enterococcus faecalis, Haemophilus influenzae, Haemophilus parainfluenzae, Mastadenovírus humano D, Neisseria mucosa, Pediococcus acidilactici, Prevotella intermedia, Prevotella melaninogenica, Saccharomyces cerevisiae, Streptococcus agalactiae, Streptococcus salivarius, Streptococcus thermophilus, a abundância no grupo de diagnóstico positivo (Figura 15B) ainda não é sempre a maior. Consequentemente, a abundância não é suficiente para distinguir o estado infeccioso do hospedeiro não microbiano.
[0352] Uma combinação de vários parâmetros mensuráveis pode então ser usada para distinguir pacientes assintomáticos/saudáveis de pacientes submetidos a uma infecção. Para este fim, uma combinação de abundâncias microbianas de MPM e a distribuição do comprimento dos fragmentos de ácido nucleico mapeados para a referência do hospedeiro (ou seja, referência humana nesta coorte de amostras) foi investigada como um classificador potencial.
[0353] A Figura 15C mostra um exemplo de uma distribuição típica de fragmentos de ácido nucleico após o processo de geração da biblioteca ser concluído e medido por um instrumento TapeStation. Dois picos principais no comprimento de fragmento podem ser observados: (1) um pico "nucleossômico" (faixa de 300 a 450 bp no eletroferograma) e (2) um pico "subnucleossômico" (intervalo de 180 a 280 bp no eletroferograma). Este sinal é determinado pelas propriedades dos ácidos nucleicos humanos (isto é, hospedeiro), visto que os ácidos nucleicos microbianos (isto é, não hospedeiro) representam uma fração menor da população total de ácidos nucleicos nessas amostras, incluindo os tipos de amostra DP. A razão molar e de massa dos fragmentos humanos que contribuem para os dois picos varia entre as amostras e é distinta entre os tipos de amostra AP e DP (Figura 15D). A grande maioria das amostras de AP (92%) mostra que a fração molar de pico "nucleossômico" é inferior a 0,4, enquanto o mesmo valor é distribuído igualmente em uma faixa mais ampla para as amostras de DP (<0,7).
[0354] As abundâncias microbianas de MPM, bem como as propriedades da distribuição do comprimento de fragmento humano, mostram valores sobrepostos entre as amostras AP e DP. Uma combinação das duas medições independentes pode ajudar a distinguir as chamadas assintomáticas das chamadas infecciosas em uma amostra desconhecida onde o estágio infeccioso é desconhecido. A Figura 15E mostra a fração de leituras humanas longas conforme medido a partir dos dados de sequenciamento (todas as leituras mapeadas para referência humana mais de 65 bp após o corte do adaptador) e o valor MPM máximo medido na mesma amostra para todas as amostras AP e DP. A região abrangida pelas coordenadas [(0,3000), (0,04)] é preenchida exclusivamente por amostras AP. Três das 100 amostras AP ficam fora deste espaço (setas na Figura 15E). Os micróbios detectados nessas três amostras foram Helicobacter pylori, Human mestadenovirus D e Nisseria gonorrhoeae. Todos os três micróbios são patógenos humanos conhecidos, embora não saibamos se eles eram patogênicos nesses indivíduos.
[0355] Uma comparação entre MPM microbiano e as propriedades da distribuição do comprimento de fragmento humano em tipos de amostras AP e DN (Figura 15F) revela que nenhuma das amostras de DN caiu dentro de uma faixa assintomática típica, embora fossem negativas de acordo com o teste ortogonal.
[0356] O sinal não microbiano, tal como, por exemplo, propriedades da distribuição do comprimento de fragmento para os ácidos nucleicos do hospedeiro não microbiano podem ser utilizados na identificação de estados assintomáticos ou não infecciosos de um sujeito.
[0357] Os dados também indicam que os indivíduos assintomáticos podem ser identificados a partir de dados como os apresentados no presente documento, combinando as abundâncias (por exemplo, MPM máximo) e os parâmetros de distribuição do comprimento de fragmento, mesmo que os valores de MPM para os micróbios se sobreponham ao intervalo que pode ser observado nas amostras positivas para diagnóstico. Também sugere que uma detecção precoce da infecção pode ser possível na ausência de sintomas padrão. A região em tal plano bidimensional que pode ajudar a distinguir entre diferentes estados infecciosos de indivíduos pode ser posteriormente otimizada em relação a, por exemplo, MPMs para espécies microbianas específicas, ou reino, bem como comprimento de fragmento microbiano para melhor desempenho do teste.
[0358] Finalmente, a distribuição de tamanho normalizada de fragmentos alinhados ao genoma humano (dominado pelo genoma nuclear), genoma mitocondrial humano, todos os patógenos, patógenos significativos; e bactérias, eucariotos, vírus e arqueias foram calculados para todas as amostras.
Para diferenciar AP de amostras DP/DN, um classificador foi treinado nas distribuições de tamanho de fragmento (recursos), neste caso, usando regressão logística com regularização L2. A regressão logística é um modelo linear para classificação que multiplica recursos por um conjunto de pesos antes da transformação com uma função logística.
Os pesos são determinados usando técnicas de otimização numérica padrão com regularização L2 fornecendo uma restrição adicional para minimizar a soma dos quadrados dos pesos.
Isso tem o efeito de diminuir o sobreajuste e os efeitos da multicolinearidade nos recursos.
A precisão desse modelo é avaliada usando o modelo treinado para prever a probabilidade de que cada amostra seja assintomática ou sintomática.
Valores> 0,5 indicam que a amostra está prevista para ser assintomática, valores <0,5 indicam que a mesma está prevista para ser sintomática.
Além disso, o modelo treinado fornece os pesos (coeficientes). Coeficientes positivos indicam associação com indivíduos assintomáticos, coeficientes negativos com sintomáticos.
A Figura 16 mostra a precisão de prever um treinamento assintomático e sintomático com base no estado de infecção usando a distribuição de tamanho normalizada de fragmentos alinhados ao genoma humano (dominado pelo genoma nuclear), genoma mitocondrial humano, todos os patógenos, patógenos significativos; e, bactérias, eucariotas, vírus e arqueas.
O subgrupo de ácidos nucleicos da biblioteca usada para treinar o modelo afeta a precisão do modelo.
Além disso, o subgrupo de ácidos nucleicos da biblioteca afeta as regiões da distribuição do comprimento de fragmento que têm um valor preditivo positivo para o estado assintomático ou sintomático.
Por exemplo, a presença de fragmentos humanos longos (> 60 bp) prevê um estado sintomático (Figura 16A, painel direito), assim como fragmentos patogênicos curtos (<30 bp) (Figura 16C, painel direito). Por outro lado, a alta concentração de fragmentos em torno de 50 bp prediz um estado assintomático (Figura 16A, painel direito), assim como fragmentos patogênicos longos (> 65 bp) (Figura 16C, painel direito). EXEMPLO 6. DISTINGUIR PACIENTES ASSINTOMÁTICOS COLONIZADOS POR H. PYLORI VERSUS PACIENTES COM INFLAMAÇÃO ASSOCIADA A H. PYLORI ATIVA
[0359] Processamento de plasma e extração de DNA: o plasma é extraído de amostras de sangue total dentro de 24 horas após a coleta da amostra, conforme descrito anteriormente (Fan HC et al., PNAS 2008; 105 (42): 16266-16271), e é armazenado a -80 ¬∞C. Quando necessário para análise, as amostras de plasma são descongeladas e o DNA circulante é imediatamente extraído de 0,5-1 ml de plasma.
[0360] Preparação e sequenciamento da biblioteca de sequenciamento: As bibliotecas de sequenciamento são preparadas a partir do DNA purificado do plasma do paciente usando o conjunto de mistura principal NEBNext DNA Library Prep para Illumina com adaptadores indexados Illumina padrão (adquiridos na IDT) e purificação de reparo pós-final (por exemplo, esferas MagBind, NEBNext End Repair Module), ou usando uma plataforma de preparação de biblioteca automatizada baseada em microfluídica (Mondrian ST, Ovation SP Ultralow library system). As bibliotecas são caracterizadas usando o Agilent 2100 Bioanalyzer (kit de DNA de alta sensibilidade) e quantificadas por qPCR.
[0361] Validação qPCR de resultados de sequenciamento para alvos bacterianos selecionados. Kits qPCR padrão para a quantificação de alvos bacterianos selecionados (por exemplo, H. pylori) são usados para validar os resultados de sequenciamento para um subconjunto de amostras de DNA livre de células. Os ensaios de qPCR são executados em cfDNA extraído de ~ 1 ml de plasma e eluído em 100 ml de tampão Tris (50 mM [pH 8,1-8,2]). Os experimentos de extração de plasma e PCR são realizados em diferentes instalações. Os controles sem modelo são executados para verificar se os reagentes de PCR estão incluídos em todos os experimentos.
[0362] Depois de remover as leituras de baixa qualidade, as leituras são mapeadas para o genoma de referência humano. As leituras restantes, presumivelmente derivadas do microbioma, são mapeadas para um banco de dados de referência de genomas de microrganismos alvo. A abundância relativa para cada microrganismo é calculada usando um algoritmo proprietário. O algoritmo relata organismos que estão presentes em quantidades estatisticamente significativas em comparação com os controles. Organismos com sequências super-representadas são relatados como positivos.
[0363] As medidas de controle de qualidade (QC) incluíram a adição de um ácido nucleico sintético preparado com ID, que é um tipo de spike-in único para cada amostra em um lote de sequenciamento, e outros spike-ins de ácidos nucleicos sintéticos ("moléculas SPANK") que são preparados em uma concentração constante em todas as bibliotecas. Assim, o número de moléculas SPANK deduplicadas detectadas em uma biblioteca particular é um proxy para a concentração mínima detectável nessa biblioteca. Isso pode ser útil para definir um limiar com base na concentração mínima das moléculas SPANK detectáveis nessa biblioteca. O limiar pode ser útil para garantir profundidade de sequenciamento suficiente para a detecção de patógenos. O limiar também pode ser útil para garantir que o sinal do patógeno não seja devido à contaminação cruzada de outras amostras. Por exemplo, o enriquecimento de patógenos em relação ao limiar estabelecido pelas moléculas SPANK pode ser comparado entre diferentes amostras. De forma mais geral, é proporcional à eficiência com a qual aquela biblioteca converteu moléculas de DNA na amostra original em leituras nos dados de sequenciamento de DNA. O objetivo das moléculas SPANK é ajudar a estabelecer a abundância relativa das moléculas do patógeno dentro da mistura representada em uma amostra, relatada como "moléculas por ml" (MPM). Os dados do MPM foram usados para construir mapas de calor e gráficos de correlação. O Sample Purity Ratio (SPR) visa capturar o quão significativo é o número de leituras associadas ao táxon,
dado o grau estimado de contaminação cruzada na amostra. Em caso de falha do SPANK e/ou SPR deduplicado, a amostra foi enfileirada e executada novamente uma vez. Se o QC falhou duas vezes na mesma amostra, o relatório foi "nenhum resultado". RESULTADOS.
[0364] O método é capaz de detectar DNA livre de células de H. pylori em plasma obtido de pacientes com úlcera péptica associada a H. pylori. O método foi capaz de distinguir entre pacientes com H. pylori assintomático e doença de H. pylori. Para o último caso, as amostras foram obtidas de indivíduos saudáveis (isto é, assintomáticos) e infectados e foram analisadas usando-se o sequenciamento de próxima geração de plasma livre de células para detectar DNA patógeno (The Karius Test™, Karius, Redwood City, CA). Em voluntários saudáveis, o teste detectou H. pylori em 8/106 amostras testadas. Alguns pacientes identificados no conjunto de dados com uma colonização assintomática causada por H. pylori (C) (n = 1) ou uma infecção crônica sintomática causada por H. pylori (IC) (n = 7) (consultar a Tabela 1, abaixo). Amostras positivas para H. pylori foram associadas à raça afroamericana ou hispânica, o que é consistente com a epidemiologia da infecção por H. pylori. TABELA 1. DETECÇÃO DE H. PYLORI NO PLASMA. INFECÇÕES POR H. PYLORI COMO CAUSAS PROVÁVEIS, POSSÍVEIS OU
IMPROVÁVEIS DE SEPSE
[0365] Sem serem limitados pelo mecanismo, os ácidos nucleicos livres de células podem ser derivados de patógenos que estão mortos ou morrendo. Assim, o presente método é exclusivamente adequado para detectar organismos que estão sendo ativamente eliminados pelo sistema imunológico. Na verdade, o ensaio foi capaz de distinguir entre H. pylori no contexto de inflamação ativa, em vez de colonização assintomática. EXEMPLO 7: MÉTODO PARA DETECTAR INFECÇÃO DO TRATO GI POR H. PYLORI ENTRE PACIENTES DE ALTO RISCO
[0366] Os objetivos deste estudo são avaliar a utilidade clínica do presente método (i) para detectar infecção por H. pylori ativa em comparação com testes de diagnóstico convencionais em pacientes sintomáticos para úlcera péptica (H. pylori PUD); (ii) para confirmar a erradicação da infecção gastrointestinal por H. pylori ativa em comparação com os testes de diagnóstico convencionais após terapias de primeira linha; e (iii) avaliar os limiares de MPM ideais, distinguindo os pacientes com PUD de H. pylori ativa daqueles sem (assintomáticos). O uso deste método não invasivo permite que os médicos tomem decisões de tratamento eficazes sem recorrer aos métodos tradicionais de diagnóstico invasivos. PROJETO DE ESTUDO.
[0367] A concordância percentual positiva (PPA) e concordância percentual negativa (PA) do presente método em comparação com os testes de diagnóstico convencionais de H. pylori não serológicos em duas populações de estudo de adultos bem descritos sob condições de teste específicas são determinados conforme descrito abaixo no presente documento no início do estudo, pacientes com PUD de H. pylori sintomático que atendem aos critérios clínicos e têm pelo menos um teste de diagnóstico convencional de H. pylori aprovado por protocolo positivo antes de qualquer administração de tratamento de erradicação primária. Um teste de plasma é realizado em todos os pacientes com PUD de H. pylori documentados. Posteriormente, esses pacientes com PUD recebem um regime de erradicação padrão de 2 a 4 semanas (de acordo com o tratamento padrão) seguido por 1 mês de férias para o medicamento. Em 30 dias (+/- 3 dias) após a conclusão do tratamento primário, todos os pacientes com PUD no final da participação no estudo passam por uma avaliação de teste de plasma repetida e pelo menos um dos testes de diagnóstico convencionais de H. pylori não serológicos originais realizados antes ao tratamento.
[0368] No início do estudo, os pacientes de controle negativo submetidos à colonoscopia por qualquer motivo não têm evidência de doença gastrointestinal por H. pylori ativa com base em critérios clínicos e pelo menos um teste de diagnóstico de H. pylori convencional aprovado por protocolo negativo, não sorológico, durante a triagem. Depois disso, os pacientes com colonoscopia de controle negativo têm um teste de plasma realizado para completar todos os requisitos do protocolo.
[0369] Os dados dessas comparações de teste de diagnóstico fornecem insights quanto à utilidade clínica do presente método para detectar a doença H. pylori ativa e para confirmar a erradicação após o tratamento primário em comparação com os testes de diagnóstico convencionais de H. pylori não serológicos.
MÉTODOS E MATERIAIS
[0370] O método de teste quantitativo é usado para detectar microrganismos por meio da análise de DNA não humano no plasma sanguíneo. O analito para este método é o ácido nucleico livre de células de microrganismos, que é muito curto (com média de menos de 100 nucleotídeos de comprimento) em comparação com o cfDNA humano.
[0371] O sangue total é centrifugado duas vezes para tornar o plasma livre de células (cf). Para lidar com o potencial de contaminantes ambientais, tampões não voláteis podem ser aquecidos a uma temperatura superior a 85 ° C e resfriados antes do uso. Moléculas de controle interno são adicionadas a cada amostra após a primeira centrifugação usando os métodos estabelecidos em PCT-US2017-024176. O plasma é extraído e o DNA livre de células purificado (cfDNA) usado para preparar bibliotecas de sequenciamento usando o conjunto de mistura principal NEBNext DNA Library Prep para Illumina com adaptadores indexados Illumina padrão (adquiridos na IDT) e purificação de reparo pós-final (por exemplo, esferas MagBind, NEBNext End Repair Module), ou usando uma plataforma de preparação de biblioteca automatizada baseada em microfluídica (Mondrian ST, Ovation SP Ultralow library system). Os adaptadores são ligados e a purificação realizada sem calor usando AMPure Beads, antes da amplificação por qPCR. As bibliotecas são caracterizadas usando o Agilent HS TapeStation e as concentrações totais de ácidos nucleicos medidas para controlar os volumes de carregamento para a etapa de seleção de tamanho integrando o sinal (por exemplo, entre 50 bp e 1000 bp.
[0372] Os fragmentos de cfDNA sequenciados são mapeados para uma base de dados de referência de sequências microbianas para determinar a identidade de material de controle não humano, não interno, presente na amostra em níveis significativos (acima do fundo do ensaio). Os dados de sequenciamento são primeiro transformados em leituras que representam sequências de DNA e, em seguida, desmultiplexados com base em sequências de índice em coleções de leituras (leituras) derivadas de cada biblioteca carregada no sequenciador. As leituras que se alinham com as sequências humanas são filtradas e as leituras restantes que se alinham às sequências das moléculas de controle interno são reservadas para análises adicionais. Em seguida, as leituras que não correspondem às referências humanas ou de controle interno são alinhadas aos genomas microbianos conhecidos. As leituras com um ou mais alinhamentos a este banco de dados (leituras de patógenos) são a base da análise subsequente.
[0373] Os alinhamentos de cada patógeno lidos no banco de dados do genoma microbiano são usados para inferir as abundâncias relativas de cada táxon associado às sequências de referência. Essas abundâncias são agregadas na árvore de taxonomia para fornecer abundâncias em todas as classificações taxonômicas. Finalmente, as abundâncias em amostras clínicas são comparadas com as abundâncias em bibliotecas de controle negativo na mesma execução de sequenciamento para determinar se elas aumentam acima do nível de fundo esperado devido à contaminação de DNA ambiental. Taxas que atendem a este critério são relatadas em unidades de moléculas por mililitro (MPM) com base em uma proporção da abundância de leituras de microrganismos e certas leituras de controle interno obtidas. Antes de resultar, o pipeline aplica um conjunto de filtros para limitar os organismos relatáveis àqueles que são maiores do que, por exemplo, 3-10% do microrganismo com o maior número de leituras e maior do que, por exemplo, 25- 50% de qualquer outro organismo relacionado à família taxonômica. O filtro é aplicado a todas as amostras de pacientes e controles de ensaio.
[0374] Fontes potenciais de viés de desempenho de propriedades específicas de amostra ou micróbio incluem a classe de propriedades específicas de microrganismo, incluindo a classe de microrganismo (por exemplo, bactérias, vírus, eucariotos, procariotos, fungos, etc.), conteúdo de GC, tamanho do genoma, abundância na microflora endógena, níveis de contaminação ambiental (EC) e número de montagem de referência e qualidade dos dados. Para abordar essas fontes de viés, este método inclui o uso de um painel representativo de 10-100 microrganismos que capturam todo o espectro de viés de desempenho potencial ao longo do conteúdo de GC, tamanho do genoma e cepa. Esses organismos representativos devem abranger reinos, variar em conteúdo de GC (por exemplo, de 10% a 80%) e ter genomas que variam de quilobases a megabases. A população representativa deve incluir uma mistura de tipos, como comensais e não comensais, micróbios comumente encontrados como contaminantes ambientais e cepas intimamente relacionadas. O método adicional incorpora medidas de controle de qualidade padrão, como intervalos de referência para níveis de microrganismos em uma população saudável e controles negativos de CE.
[0375] O teste será considerado positivo se o teste mostrar que os níveis de H. pylori são significativos contra controles de fundo negativos. Observe, entretanto, que a concordância percentual negativa (NPA) provavelmente não refletirá o NPA do teste depois de considerarmos o corte de MPM quantitativo.
[0376] Além da avaliação de PPA e NPA dentro de cada uma das coortes do estudo, PUD e colonoscopia, usando o limiar no MPM para positivo e negativo conforme determinado pelo laboratório, outros limiares no MPM também serão considerados. Primeiro, MPM será resumido com médias, desvios-padrão, medianas e intervalos para cada coorte de estudo. Em segundo lugar, as curvas de características de operação do receptor (ROC) serão usadas para identificar os pontos de corte ideais no MPM para maximizar o PPA e o NPA nas amostras.
[0377] Finalmente, para avaliar a capacidade do presente método de identificar a erradicação em 30 dias, o sucesso da erradicação será estimado com proporções e intervalos de confiança de 95% dentro de cada uma das coortes do estudo. EXEMPLO 8. PERFIL DE DISTRIBUIÇÃO DE
COMPRIMENTO DE FRAGMENTO E SÍTIO DE LOCALIZAÇÃO
[0378] Foram comparadas as características da distribuição do comprimento de fragmento das leituras de sequenciamento microbiano obtidas a partir de amostras clínicas de pacientes com infecção localizada na corrente sanguínea e nos pulmões, como exemplo de infecção de tecido profundo. As características de distribuição do comprimento de fragmento variam dependendo do sítio de localização. Sem ser limitado pelo mecanismo, diferentes respostas do hospedeiro em diferentes sítios de infecção podem contribuir para várias características de distribuição do comprimento de fragmento. Novamente, sem ser limitado pelo mecanismo, diferentes sítios de infecção podem exibir diferentes mecanismos de fragmentação de ácido nucleico não hospedeiro.
[0379] Amostras clínicas de plasma: foram coletadas 10 amostras clínicas não identificadas de pacientes com infecção confirmada da corrente sanguínea e 10 amostras clínicas não identificadas de pacientes com infecção pulmonar confirmada. O processo de extração de plasma de etapa única de centrifugação do sangue total dentro de 24 horas da coleta da amostra foi realizado para cada amostra, conforme descrito anteriormente (Consultar Fan HC et al., PNAS 2008; 105 (42): 16266-16271, que é incorporado a título de referência em sua totalidade neste documento, incluindo quaisquer desenhos), e armazenado a -80 °C até o uso. As amostras foram então descongeladas e 150 µl de cada plasma foram preparados com 1,5 µl de Spike-in Master Mix (ver abaixo). Se volumes diferentes foram obtidos, um volume proporcionalmente menor ou maior de Spike-in Master Mix foi adicionado para manter uma concentração constante das moléculas de controle de processo em todas as amostras iniciais e amostras de controle.
[0380] Amostras de controle negativo: Quatro amostras de controle negativo de 500 pF (EC) foram feitas a partir de tampão aquoso (Tris 10 mM pH 8, EDTA 0,1 mM, 0,05% em v/v Tween-20) com 5 µL de Mistura Principal preparada (consultar abaixo) e serviu como controle de contaminação ambiental (isto é, micróbio e contaminação de ácido nucleico patogênico introduzida pelos reagentes, instrumentação, consumíveis, operadores e/ou ar durante o processamento). Esses ácidos nucleicos sintéticos são posteriormente usados para normalizar o sinal nas amostras, a fim de compensar as variações no processamento da amostra.
[0381] Um Spike-In Master Mix foi preparado conforme descrito acima com moléculas ID-Spike, moléculas SPANK e moléculas SPARK.
[0382] Um processo direto para a biblioteca baseado em ligação, conforme descrito no Exemplo 1 do Pedido Provisório dos EUA 62/770.181 foi usado para preparar uma biblioteca de sequenciamento de 5 μl de plasma assintomático preparado. A análise de dados de sequenciamento e sequenciamento foi realizada conforme descrito no Exemplo 8.
[0383] Resultados: A Tabela 2 lista todas as 20 amostras clínicas processadas como parte deste exemplo, juntamente com o sítio da infecção e as espécies do micróbio infectante para cada indivíduo que doou a amostra clínica. As distribuições de comprimento de fragmento para os micróbios infectantes em todas as amostras testadas são mostradas na Figura
17. As distribuições de comprimento de fragmento normalizado para o mapeamento de leituras para as referências de micróbios infectantes foram analisadas quanto à presença de características de perfil de distribuição de comprimento de fragmento (por exemplo, fragmentos exponencialmente decadentes curtos, Pico, fragmentos longos): (1) fração distribuída semelhante a exponencial curta ("Curto” na Tabela 2), (2) fração de pico (“ Pico ”na Tabela 2) e (3) Fração de leituras mais longa do que o comprimento de leitura do experimento (75 bp; “Longo” na Tabela 2). Além disso, as frações do comprimento típico variam nas distribuições de comprimento dos fragmentos microbianos. Uma comparação dos tipos de perfil de distribuição do comprimento de fragmento revelou que as infecções da corrente sanguínea exibem desproporcionalmente um perfil de distribuição do comprimento de fragmento caracterizado por (1) uma alta fração dos fragmentos curtos pseudoexponencialmente distribuídos, (2) a ausência de um pico entre 20 comprimentos de leitura bp e 75 bp e (3) uma fração de leituras longas (> 64 bp) maior que 10% em. Por outro lado, as infecções dos pulmões exibem desproporcionalmente um perfil de distribuição de comprimento de fragmento caracterizado por (1) uma presença de fragmentos curtos pseudoexponencialmente distribuídos, (2) a presença de um pico entre comprimentos de leitura de 20 bp e 75 bp, e (3) fração das leituras longas menor que 10%. Isso sugere que as características das distribuições de comprimento de fragmento microbiano podem ser usadas para determinar se a infecção está presente na corrente sanguínea ou no tecido profundo. TABELA 2 LISTA DAS AMOSTRAS CLÍNICAS E SÍTIO DA INFECÇÃO, AS ESPÉCIES DO MICRÓBIO INFECTANTE E AS
PROPRIEDADES DA DISTRIBUIÇÃO DO COMPRIMENTO DE FRAGMENTO PARA AS LEITURAS DE SEQUENCIAMENTO QUE MAPEIAM A REFERÊNCIA DAS ESPÉCIES MICROBIANAS INFECTANTES. PARA CADA PROPRIEDADE, SUA AVALIAÇÃO QUALITATIVA (PRESENTE/AUSENTE) É
INDICADA E A FRAÇÃO DO TOTAL DE LEITURAS QUE EXISTE NAQUELE SEGMENTO É DADA ENTRE PARÊNTESES. NO PRESENTE DOCUMENTO, A SEÇÃO DE FRAGMENTO CURTO INCLUI LEITURAS DE 22 BP ATÉ, E INCLUINDO, 29 BP; A FAIXA DE COMPRIMENTO DE FRAGMENTO DE PICO INCLUI LEITURAS DE 30 BP ATÉ, E INCLUINDO, 59 BP; E A LONGA FAIXA DE FRAGMENTOS INCLUI LEITURAS COM MAIS DE 59 BP.
EXEMPLO 9. PERFIL DE DISTRIBUIÇÃO DE COMPRIMENTO DE FRAGMENTO E SÍTIO DE LOCALIZAÇÃO 2
[0384] As características da distribuição do comprimento de fragmento do sequenciamento microbiano são leituras obtidas a partir de amostras clínicas de pacientes com uma infecção localizada na corrente sanguínea (plasma de uma coleta de sangue venoso) e plasma de sangue capilar que entrou em contato com a pele na ponta do dedo antes à coleta no sistema de coleta por extração capilar, como exemplo de infecção cutânea.
[0385] Amostras clínicas de plasma: O sangue de 20 dadores adultos saudáveis foi coletado em tubos PPT com K2EDTA como anticoagulante (Becton Dickinson, Franklin Lakes, NJ) de acordo com as instruções do fabricante. Imediatamente após a coleta de sangue venoso, uma coleta de sangue capilar foi realizada no mesmo grupo de 20 doadores saudáveis usando dispositivos de amostragem de sangue Microvette CB300 usando K2EDTA como anticoagulante (Sarstedt Inc, Sparks, NV). O seguinte procedimento foi aplicado durante a extração capilar: (1) O dedo do doador foi mantido em uma posição para cima e lancetou a superfície do lado da palma do dedo com lanceta de tamanho adequado, (2) Pressionando firmemente o dedo ao fazer a punção foi evitado para prevenir a hemólise do sangue coletado, e (3) a gota de sangue espalhada sobre a ponta do dedo foi coletada em um dispositivo de amostragem de sangue Microvette CB300 limpo. Um processo de extração de plasma de etapa única de centrifugação do sangue total dentro de 12 horas da coleta da amostra foi realizado para cada amostra de acordo com as instruções do fabricante, e o plasma armazenado a -80 ° C até o uso. As amostras foram então descongeladas e cada plasma foi preparado com o volume da Spike-in Master Mix igual a 1% do volume do plasma.
[0386] Amostras de Controle Negativo: Quatro amostras de 500 µl de controle negativo (EC) foram feitas a partir de tampão aquoso (Tris 10 mM pH 8, EDTA 0,1 mM, 0,05% em v/v Tween-20) com 5 µl de Mistura Principal preparada (consultar abaixo) e serviu como controle de contaminação ambiental (isto é, contaminação de micróbios e ácido nucleico patogênico introduzida pelos reagentes, instrumentação, consumíveis, operadores e/ou ar durante o processamento). Esses ácidos nucleicos sintéticos são posteriormente usados para normalizar o sinal nas amostras, a fim de compensar as variações no processamento da amostra.
[0387] Amostras de Microvette Negativas: Para 300 µl de tampão aquoso (Tris 10 mM pH 8, EDTA 0,1 mM, 0,05% em v/v Tween- 20) foram adicionados quatro dispositivos de amostragem de sangue Microvette CB300 limpos e não usados e incubados por 6 horas em temperatura ambiente antes de coletar quantitativamente o conteúdo e fortificar 3 µl de Spiked-in Master Mix (consultar abaixo).
[0388] Um Spike-in Master Mix foi preparado como descrito acima no presente documento com moléculas ID-Spike, moléculas Spank e moléculas Spark.
[0389] Geração de biblioteca de ácido nucleico direto do plasma: 25,0 µl de cada amostra preparada foi misturada com 10,0 µl de Tampão de Reação de Transferase Terminal 10x (NEB, Ipswich, MA), 2,5 µl de Proteinase K (Sigma), 1,0 µl de Tween 10% -20 (Thermo-Fisher Scientific, Waltham, MA), 1,0 µl de Triton X100 a 10% (Thermo-Fisher Scientific, Waltham, MA) e 60,5,0 µl de água sem nuclease. A mistura foi aquecida a 60 °C durante 20 minutos e 95 °C durante 10 minutos e colocada em gelo até arrefecer. 1,0 µl de dATP 10 mM, 1,0 µl de Terminal Transferase (20 u/µl, NEB, Ipswich, MA) e 3,0 µl de água livre de nuclease foram adicionados para preparar a reação de cauda A que foi incubada a 37 °C por 40 min. 150,0 μl de tampão de lise/ligação (Thermo-Fisher Scientific, Waltham, MA) foram adicionados à reação. Todo o volume foi então adicionado a 25,0 μl de Dynabeads oligo (dT)25 (Thermo-Fisher Scientific, Waltham, MA), que foi lavado uma vez com tampão de lise/ligação (Thermo-Fisher Scientific, Waltham, MA). A mistura foi incubada a 25 °C e 600 RPM. O restante do procedimento seguiu as etapas do protocolo descritas no Exemplo 1.
[0390] Sequenciamento: As amostras foram sequenciadas para obter leituras de sequência usando um sequenciador NextSeq™ 500 da Illumina. O sequenciamento foi conduzido de acordo com as instruções do fabricante. A análise de sequenciamento foi realizada conforme descrito acima no Exemplo 1.
[0391] Resultados: a Figura 18A mostra uma distribuição normalizada do comprimento de fragmento dos micróbios detectados na extração venosa de dois dos doadores deste estudo, e a Figura 18B mostra as distribuições normalizadas do comprimento de fragmento dos micróbios detectados em um dos extratos capilares replicados dos mesmos dois doadores.
Os dois micróbios detectados nas amostras venosas (por exemplo, Haemophilus influenzae no doador 1 e Streptococcus thermophilus no doador 2) também foram detectados nas amostras biológicas obtidas durante o processo de coleta de extração capilar e mostraram uma distribuição de comprimento de fragmento semelhante em ambos os tipos de coleta, isto é, uma distribuição de comprimento de fragmento com pico (Figura 18A e Figura 18B). Os micróbios adicionais detectados nas amostras obtidas com o processo aplicado durante a extração capilar incluíram um conjunto mais diverso de micróbios (Tabela 3). A maioria desses micróbios adicionais coocorrem em ambas as repetições de cada doador (Figura 18C). A fim de confirmar que esses micróbios adicionais não são contribuídos pela contaminação presente nos dispositivos de amostragem de sangue Microvette CB300 usados para coletar as amostras obtidas no procedimento aplicado durante a extração capilar ou derivadas da contaminação do processo, analisamos os dados de sequenciamento obtidos a partir de as amostras de microvette negativa (veja acima). A Figura 18D mostra a comparação da abundância em unidades de MPM para os micróbios adicionais na amostra biológica obtida a partir do processo aplicado durante a coleta de sangue capilar (eixo x) e a abundância em unidades de MPM para os mesmos micróbios nas Amostras de Microvette Negativa.
A grande maioria do sinal dos micróbios adicionais nos dados obtidos na extração capilar não é contribuída pelo perfil de contaminação do tubo e pode-se concluir que derivou da amostra biológica obtida pela coleta da gota de sangue da ponta do dedo.
Como o sinal para esses micróbios não foi detectado na coleta venosa, eles devem ter se originado da superfície da pele sobre a qual o sangue se espalhou após a pele da ponta do dedo ter sido lancetada, sugerindo que os ácidos nucleicos microbianos derivados da pele apresentam propriedades diferentes de seu comprimento de fragmento distribuições, por exemplo, a ausência de um pico entre 20 bp e 75 bp, e um declínio do tipo exponencial na frequência dos fragmentos com comprimento de fragmento. As mesmas tendências são observadas nos outros doadores da amostra (dados não mostrados). TABELA 3. LISTA DAS ESPÉCIES MICROBIANAS
DETECTADAS NA AMOSTRA BIOLÓGICA OBTIDA NO PROCESSO APLICADO DURANTE A COLETA DE SANGUE CAPILAR PARA DOADOR 1 E DOADOR 2. Espécies microbianas detectadas no Espécies microbianas detectadas Doador 1 no Doador 2 Alternarla arborescens Acinetobacter baumannii Bacteroides stercoris Bacteroides ovatus Bacteroides uniformis Bacteroides stercoris Bacteroides vulgatus Bacteroides uniformis Corynebacterium afermentans Bacteroides vulgatus Corynebacterium amycolatum Corynebacterium aurimucosum Corynebacterium aurimucosum Corynebacterium simulans Dermabacter hominis Corynebacterium tuscaniense Finegoldia magna Facklamia hominis Gardnerella vaginalis Finegoldia magna Lactobacillus iners Lactobacillus crispatus Malassezia globosa Moraxella catarrhalis Micrococcus lylae Oligella urethralis Peptoniphilus rhinitidis Peptoniphilus harei Propionibacterium granulosum Saccharomyces cerevisiae Rhodococcus fascians Staphylococcus capitis Staphylococcus capitis Staphylococcus epidermidis Staphylococcus epidermidis Staphylococcus warneri Staphylococcus hominis Streptococcus mitis Streptococcus mitis Streptococcus thermophilus Streptococcus thermophilus Streptococcus tigurinus EXEMPLO 10. INFECÇÃO PÓS-TRANSPLANTE
[0392] 10 pacientes transplantados são monitorados para possíveis infecções pós-cirurgia de transplante, e os patógenos detectados no estágio pré-sintomático são monitorados quanto às mudanças na distribuição do comprimento de fragmento para correlacionar o estágio da infecção com o comprimento de fragmento observado. Em particular, a presença do pico entre 20 bp e 75 bp, bem como a fração de fragmentos não associados ao pico, é rastreada à medida que a infecção progride em diferentes estágios. Além desses 10 pacientes transplantados, 10 conjuntos de amostras em série não identificados da produção da Karius são selecionados a fim de rastrear o mesmo comportamento. EXEMPLO 11. AVALIAÇÃO DO SÍTIO DE LOCALIZAÇÃO
[0393] 1000 amostras não identificadas da produção Karius são preparadas e processadas juntamente com os Controles de Ensaio e os Controles Ambientais usando o método direto para biblioteca baseado em troca de modelo com Proteinase K, conforme descrito no Pedido Provisório nº U.S. 62/770.181. As 1000 amostras não identificadas incluem amostras de plasma de pacientes que têm pneumonia, estado de imunocomprometimento, endocardite, sepse ou infecção fúngica invasiva, abundância microbiana e distribuições de comprimento de fragmento de hospedeiro e microbiana são analisadas a fim de relacionar características das distribuições de comprimento de fragmento (por exemplo, a presença ou ausência do pico entre 20 e 75 bp, a fração das leituras maior que 65 bp, a fração das leituras menor que 40 bp) para o sítio da infecção, em particular relacionada à presença do pico em qualquer uma das profundidades infecção do tecido ou comensal. EXEMPLO 12. DETERMINAÇÃO DO ESTÁGIO DE
INFECÇÃO A PARTIR DA DISTRIBUIÇÃO DO COMPRIMENTO DE FRAGMENTO MICROBIANO
[0394] A fim de determinar o valor de previsibilidade diagnóstica do perfil de comprimento de fragmento para medir um estágio de infecção, um conjunto de amostras clínicas de plasma foi coletado de 16 diferentes indivíduos consentidos com suspeita de infecção, retirando sangue para tubos PPT e extraindo plasma por uma única etapa de centrifugação de acordo com as recomendações do fabricante. As amostras de plasma foram enviadas congeladas ou à temperatura ambiente durante a noite para o laboratório Karius em Redwood City, CA. Para cada sujeito, a primeira amostra foi obtida no momento da admissão hospitalar, momento em que um teste ortogonal (por exemplo, hemocultura) também foi realizado para confirmar a provável espécie de micróbio responsável ou em parte responsável pela infecção. Posteriormente, amostras adicionais foram retiradas dos indivíduos em vários pontos de tempo durante o tratamento para monitorar o progresso da infecção e os efeitos do tratamento. No total, as amostras foram coletadas em pelo menos dois momentos por sujeito, incluindo o momento da admissão. O número máximo de pontos de tempo por sujeito foi 7. As amostras de plasma e as amostras de controle negativo foram processadas em bibliotecas de ácido nucleico e sequenciadas conforme descrito acima.
[0395] O grupo de indivíduos deste estudo incluiu 3 pacientes diagnosticados ortogonalmente com infecções da corrente sanguínea, 8 pacientes diagnosticados ortogonalmente com endocardite e 5 pacientes diagnosticados ortogonalmente como pacientes neutropênicos febris. As Figuras 19A, 19B e 19C mostram mudanças na distribuição do comprimento de fragmento em um caso representativo de infecção da corrente sanguínea, endocardite e neutropenia febril, respectivamente. As distribuições de comprimento de fragmento de exemplo na Figura 19 indicam alta probabilidade para fragmentos curtos com distribuição exponencial (faixa <40 bp) e maior probabilidade para a distribuição com pico em torno de 50 bp após o início do tratamento. A fração dos fragmentos curtos com distribuição exponencial ou próxima com distribuição exponencial foi, portanto, estudada em todas as amostras processadas. A Figura 20A representa a cinética das mudanças nesta fração de leitura curta. Isso sugere que uma infecção invasiva pode ser diagnosticada com base na presença da fração de leitura curta e distribuída exponencialmente, especialmente no caso de uma infecção da corrente sanguínea ou bacteremia. Em um único sujeito, uma alta fração de leituras> 64 bp estava presente, possivelmente indicando saturação do mecanismo que produz a pequena fração distribuída exponencialmente (dados não mostrados). Uma medição simultânea de abundâncias microbianas (Figura 20B) permite a determinação do estágio de infecção por um uso combinado de abundância e medições de perfil de comprimento de fragmento.
[0396] Os dados de sequenciamento também indicam a presença de micróbios não confirmados ortogonalmente por outros testes microbiológicos realizados. A distribuição do comprimento de fragmento também pode ser estudada no caso desses micróbios. Por exemplo, Haemophilus influenzae e Prevotella melaninogenica foram detectados pelo método divulgado nas amostras de admissão dos sujeitos RD-06 e RD-13, respectivamente (Figura 21A). Enquanto o micróbio detectado ortogonalmente, a causa presumida da infecção mostrou alta fração de leitura curta em ambos os casos, os micróbios adicionais mostraram tendências variáveis; A distribuição do comprimento de fragmento de Haemophilus influenzae foi consistente com uma infecção invasiva ou bacteriêmica, enquanto Prevotella melaninogenica mostrou apenas a presença de um pico de distribuição, consistente com um estágio invisível de infecção ou comportamento comensal em pacientes assintomáticos (consultar, por exemplo, distribuição do comprimento de fragmento de Helicobacter pylori Pedido Provisório nº U.S. 62/770.181, intitulado “Direct-to- Library Methods, Systems and Compositions”, depositado em 21 de novembro de 2018) ou pegada de infecção controlada. Além disso, novos micróbios podem surgir durante o curso do tratamento, e a análise do comprimento de fragmento também pode auxiliar no diagnóstico do estado de infecção destes. Por exemplo, a Figura 21B mostra as distribuições de comprimento de fragmento das leituras alinhadas a Enterococcus gallinarum, que mostram uma fração detectável de leituras curtas distribuídas exponencialmente com uma fração de pico de sequência. A decisão de tratar esta infecção pode ser baseada na magnitude da fração de leitura curta. A inspeção dos prontuários clínicos confirmou que o paciente estava de fato tratado para esta infecção.
[0397] Finalmente, as mudanças na distribuição do comprimento de fragmento humano foram analisadas à medida que os indivíduos estudados avançavam no ciclo de infecção, desde o estágio sintomático da infecção na admissão e diagnóstico até o estágio de tratamento da infecção durante a terapia. A Figura 22 representa os três principais modos de comportamento das distribuições de fragmentos humanos em pacientes infectados estudados no presente documento: (1) a fração das leituras humanas longas (principalmente nucleossômicas) diminuem durante o tratamento (painel esquerdo na Figura 22, 37,5% do total de indivíduos em este estudo), (2) a fração das leituras humanas longas flutuam durante o tratamento (painel do meio na Figura 22, 37,5% do total de indivíduos neste estudo), e (3) a fração das leituras humanas longas (principalmente nucleossômicas) aumento durante o tratamento (painel direito na Figura 22, 37,5% do total de indivíduos neste estudo 25%). Como mostrado acima, a forma e as propriedades da distribuição do comprimento de fragmento humano podem ser preditivas de um estágio de infecção de um sujeito. Os parâmetros derivados da distribuição humana podem então ser usados em combinação com o comprimento de fragmento do micróbio infectante ou outros micróbios detectados na amostra para prever a trajetória de recuperação em um sujeito, por exemplo, se o sujeito está se recuperando, se outro micróbio infecta um sujeito durante o tratamento para a infecção inicial, ou reconhecer uma infecção invisível ou presença comensal.

Claims (40)

REIVINDICAÇÕES
1. Perfil de comprimento de fragmento de uma biblioteca de ácido nucleico caracterizado pelo fato de que a dita biblioteca de ácido nucleico foi gerada a partir de uma amostra inicial e em que os ácidos nucleicos usados para gerar a biblioteca de ácido nucleico não são extraídos a partir da dita amostra inicial antes de preparar a biblioteca de ácido nucleico, em que o dito perfil de comprimento de fragmento compreende uma ou mais características selecionadas a partir do grupo que compreende a forma da distribuição, amplitude do segmento, forma de pico, a razão de contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagem de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a razão de comprimento do fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos e a distribuição do comprimento do fragmento dentro de um subconjunto de leituras.
2. Método para gerar um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico, em que o dito método é caracterizado pelo fato de que compreende as etapas de: (a) preparar uma biblioteca de ácido nucleico a partir de uma amostra inicial com uso de um método de recuperação com polarização corrigida; (b) determinar o número de leituras de múltiplos comprimentos de fragmentos dentro da dita biblioteca de ácido nucleico; (c) determinar uma ou mais características de comprimento de fragmento da dita biblioteca de ácido nucleico, em que a dita uma ou mais características de comprimento de fragmento são selecionadas a partir do grupo que compreende a forma da distribuição, amplitude do segmento, forma de pico,
a razão de contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagem de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a razão de comprimento do fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos e a distribuição do comprimento do fragmento dentro de um subconjunto de leituras; e (d) gerar um perfil de comprimento de fragmento para a dita biblioteca de ácido nucleico com uso das ditas uma ou mais características de comprimento de fragmento.
3. Método para gerar um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico, em que o dito método é caracterizado pelo fato de que compreende as etapas de: (a) preparar uma biblioteca de ácido nucleico a partir de uma amostra inicial, que compreende: (i) adicionar uma ou mais moléculas de controle de processo à amostra inicial para fornecer uma amostra inicial preparada; e (ii) gerar uma biblioteca de ácido nucleico a partir da amostra inicial preparada; em que os ácidos nucleicos usados para gerar a biblioteca de ácido nucleico não são extraídos a partir da amostra inicial antes de preparar a biblioteca de ácido nucleico; (b) determinar o número de leituras de múltiplos comprimentos de fragmentos dentro da dita biblioteca de ácido nucleico; (c) determinar uma ou mais características de comprimento de fragmento da dita biblioteca de ácido nucleico, em que a dita uma ou mais características de comprimento de fragmento são selecionadas a partir do grupo, o grupo que compreende a forma da distribuição, amplitude de segmento, forma de pico, a razão de contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagem de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a razão de comprimento do fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos e a distribuição do comprimento do fragmento dentro de um subconjunto de leituras, e (d) gerar um perfil de comprimento de fragmento para a dita biblioteca de ácido nucleico com uso das ditas uma ou mais características de comprimento de fragmento.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que a geração da biblioteca de ácido nucleico a partir da amostra inicial compreende, consiste em, ou consiste essencialmente em: (a) desfosforilar ácidos nucleicos a partir da amostra inicial para produzir um grupo de ácidos nucleicos desfosforilados; (b) desnaturar os ácidos nucleicos desfosforilados para produzir ácidos nucleicos desnaturados; (c) anexar um adaptador de extremidade 3’ aos ácidos nucleicos desnaturados para produzir ácidos nucleicos adaptados; (d) separar ácidos nucleicos adaptados; (e) anelar um iniciador aos ácidos nucleicos adaptados e estender o iniciador com uma polimerase para gerar filamentos complementares; (f) anexar um adaptador de extremidade 5’; (g) eluir os filamentos; e (h) amplificar os filamentos complementares.
5. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que o dito número de leituras é um número normalizado de leituras.
6. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que o dito perfil de comprimento de fragmento é para pelo menos um subconjunto de leituras e compreende adicionalmente: (a) identificar pelo menos um subconjunto de leituras na dita biblioteca de ácido nucleico, e (b) determinar o perfil de comprimento do fragmento dentro do dito pelo menos um subconjunto de leituras.
7. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a etapa de gerar pelo menos um perfil de comprimento de fragmento compreende ainda o uso de duas ou mais características de fragmentos de comprimento.
8. Método para identificar um micróbio presente em uma amostra, em que o dito método é caracterizado pelo fato de que compreende as etapas de: (a) gerar um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico gerado a partir da dita amostra (b) comparar o dito perfil de comprimento de fragmento com perfis de comprimento de fragmento de referência de um ou mais micróbios; e (c) se o dito perfil de comprimento de fragmento da dita amostra for semelhante a um perfil de comprimento de fragmento de referência de um micróbio, então identificar o dito micróbio como presente na dita amostra.
9. Método, de acordo com a reivindicação 8, caracterizado pelo fato de que gerar um perfil de comprimento de fragmento para a dita biblioteca de ácido nucleico compreende as etapas de:
(a) preparar uma biblioteca de ácido nucleico a partir de uma amostra inicial, que compreende:
(i) adicionar uma ou mais moléculas de controle de processo à amostra inicial para fornecer uma amostra inicial preparada; e
(ii) gerar uma biblioteca de ácido nucleico a partir da amostra inicial preparada; em que os ácidos nucleicos usados para gerar a biblioteca de ácido nucleico não são extraídos a partir da amostra inicial antes de preparar a biblioteca de ácido nucleico;
(b) quantificar o número de leituras de múltiplos comprimentos de fragmentos dentro da dita biblioteca de ácido nucleico;
(c) determinar uma ou mais características de comprimento de fragmento da dita biblioteca de ácido nucleico, em que a dita uma ou mais características de comprimento de fragmento são selecionadas a partir do grupo que compreende a forma da distribuição, amplitude de segmento, forma de pico, a razão de contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagem de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a razão de comprimento do fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos e a distribuição do comprimento do fragmento dentro de um subconjunto de leituras, e
(d) gerar um perfil de comprimento de fragmento para a dita biblioteca de ácido nucleico com uso das ditas uma ou mais características de comprimento de fragmento.
10. Método, de acordo com a reivindicação 8, caracterizado pelo fato de que o dito perfil de comprimento do fragmento indica o dito micróbio presente como um patógeno ou um microrganismo comensal.
11. Método, de acordo com a reivindicação 8, caracterizado pelo fato de que o dito perfil de comprimento de fragmento compreende pelo menos uma característica de comprimento de fragmento selecionada a partir do grupo que compreende a razão de contagem de fragmentos para dois ou mais picos e forma de distribuição de comprimento de fragmento.
12. Método para identificar um sítio de localização em um sujeito, em que o dito método é caracterizado pelo fato de que compreende as etapas de: (a) gerar um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico gerado a partir da dita amostra (b) comparar o dito perfil de comprimento de fragmento com perfis de comprimento de fragmento de referência de um ou mais sítios de origem, e (c) se o dito perfil de comprimento de fragmento da dita amostra for semelhante a um perfil de comprimento de fragmento de um primeiro sítio de origem, então identificar o dito primeiro sítio como um sítio de localização; se o dito perfil de comprimento de fragmento da dita amostra for semelhante a um perfil de comprimento de fragmento de um segundo sítio de origem, então identificar o dito segundo sítio como um sítio de localização.
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que gerar um perfil de comprimento de fragmento para a dita biblioteca de ácido nucleico compreende as etapas de: (a) preparar uma biblioteca de ácido nucleico a partir de uma amostra inicial, que compreende:
(i) adicionar uma ou mais moléculas de controle de processo à amostra inicial para fornecer uma amostra inicial preparada; e (ii) gerar uma biblioteca de ácido nucleico a partir da amostra inicial preparada; em que os ácidos nucleicos usados para gerar a biblioteca de ácido nucleico não são extraídos a partir da amostra inicial antes de preparar a biblioteca de ácido nucleico; (b) quantificar o número de leituras de múltiplos comprimentos de fragmentos dentro da dita biblioteca de ácido nucleico; (c) determinar uma ou mais características de comprimento de fragmento da dita biblioteca de ácido nucleico, em que a dita uma ou mais características de comprimento de fragmento são selecionadas a partir do grupo que compreende a forma da distribuição, amplitude de segmento, forma de pico, a razão de contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagem de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a razão de comprimento do fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos e a distribuição do comprimento do fragmento dentro de um subconjunto de leituras, e (d) gerar um perfil de comprimento de fragmento para a dita biblioteca de ácido nucleico com uso das ditas uma ou mais características de comprimento de fragmento.
14. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que o dito sítio de localização é selecionado a partir do grupo de sítios de origem que compreendem tecido profundo, corrente sanguínea, pele, pulmão, coração, cérebro e sangue.
15. Método para monitorar o status do transplante em um sujeito com um transplante, em que o dito método é caracterizado pelo fato de que compreende as etapas de: (a) gerar um perfil de comprimento de fragmento de linha de base para uma biblioteca de ácido nucleico gerada a partir de uma amostra obtida do dito sujeito; (b) gerar um perfil de comprimento de segundo fragmento para uma biblioteca de ácido nucleico gerada a partir de uma segunda amostra obtida do dito sujeito; e (c) comparar o dito perfil de comprimento do segundo fragmento com os ditos perfis de comprimento do fragmento de linha de base; se o dito perfil de comprimento de segundo fragmento difere do dito perfil de comprimento de fragmento de linha de base, então administrar internamente uma quantidade aumentada de uma terapia antirrejeição, em que um risco de rejeição em um sujeito com um transplante é menor após a administração da dita terapia antirrejeição; se o dito perfil de comprimento de segundo fragmento for semelhante ao dito perfil de comprimento de fragmento de linha de base, então manter ou reduzir uma terapia antirrejeição, em que o risco de efeito colateral para a dita terapia antirrejeição em um paciente é menor do que seria se o paciente recebesse uma quantidade aumentada da dita terapia antirrejeição.
16. Método para monitorar a toxicidade de um composto administrado a um sujeito, em que o dito método é caracterizado pelo fato de que compreende as etapas de: (a) gerar um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico gerada a partir da dita amostra; e
(b) comparar o dito perfil de comprimento de fragmento com um ou mais perfis de comprimento de fragmento de referência.
17. Método, de acordo com a reivindicação 16, caracterizado pelo fato de que os ditos um ou mais perfis de comprimento de fragmento de referência foram gerados a partir de uma biblioteca de ácido nucleico obtida de um sujeito ou célula exposta ao dito composto.
18. Método, de acordo com a reivindicação 16, caracterizado pelo fato de que o dito sujeito tem câncer, está em risco de câncer ou exibe um sintoma relacionado ao câncer.
19. Método, de acordo com a reivindicação 16, caracterizado pelo fato de que o dito composto é um agente quimioterapêutico.
20. Método, de acordo com a reivindicação 16, caracterizado pelo fato de que gerar um perfil de comprimento de fragmento para a dita biblioteca de ácido nucleico compreende as etapas de: (a) preparar uma biblioteca de ácido nucleico a partir de uma amostra inicial com uso de um método de recuperação com polarização corrigida; (b) determinar o número de leituras de múltiplos comprimentos de fragmentos dentro da dita biblioteca de ácido nucleico; (c) determinar uma ou mais características de comprimento de fragmento da dita biblioteca de ácido nucleico, em que a dita uma ou mais características de comprimento de fragmento são selecionadas a partir do grupo que compreende a forma da distribuição, amplitude de segmento, forma de pico, a razão de contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagem de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a razão de comprimento do fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos e a distribuição do comprimento do fragmento dentro de um subconjunto de leituras, e (d) gerar um perfil de comprimento de fragmento para a dita biblioteca de ácido nucleico com uso das ditas uma ou mais características de comprimento de fragmento.
21. Método, de acordo com a reivindicação 16, caracterizado pelo fato de que gerar um perfil de comprimento de fragmento para a dita biblioteca de ácido nucleico compreende as etapas de: (a) preparar uma biblioteca de ácido nucleico a partir de uma amostra inicial, que compreende: (i) adicionar uma ou mais moléculas de controle de processo à amostra inicial para fornecer uma amostra inicial preparada; e (ii) gerar uma biblioteca de ácido nucleico a partir da amostra inicial preparada; em que os ácidos nucleicos usados para gerar a biblioteca de ácido nucleico não são extraídos a partir da amostra inicial antes de preparar a biblioteca de ácido nucleico; (b) quantificar o número de leituras de múltiplos comprimentos de fragmentos dentro da dita biblioteca de ácido nucleico; (c) determinar uma ou mais características de comprimento de fragmento da dita biblioteca de ácido nucleico, em que a dita uma ou mais características de comprimento de fragmento são selecionadas a partir do grupo que compreende o grupo que compreende a forma da distribuição, amplitude de segmento, forma de pico, a razão de contagem de fragmentos para dois ou mais segmentos, a altura dos picos de fase helicoidal, razão de contagem de fragmentos em dois comprimentos de fragmentos diferentes, razão de contagem de fragmentos dentro de duas faixas de comprimento de fragmento diferentes, a razão de comprimento do fragmento dentro de um segmento, a razão de amplitudes máximas para dois ou mais segmentos e a distribuição do comprimento do fragmento dentro de um subconjunto de leituras, e (d) gerar um perfil de comprimento de fragmento para a dita biblioteca de ácido nucleico com uso das ditas uma ou mais características de comprimento de fragmento.
22. Método para determinar o estágio de infecção em um sujeito, em que o dito método é caracterizado pelo fato de que compreende as etapas de: (a) gerar um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico gerada a partir de uma amostra obtida do dito sujeito; (b) comparar o dito perfil de comprimento de fragmento com perfis de comprimento de fragmento de referência, e (c) se o dito perfil de comprimento de fragmento da dita amostra for semelhante a um perfil de comprimento de fragmento de um sujeito sintomático, então determinar o dito estágio de infecção indica que o sujeito tem um risco aumentado de exibir um sintoma relacionado ao micróbio; se o dito perfil de comprimento de fragmento da dita amostra for semelhante a um perfil de comprimento de fragmento de um sujeito assintomático, então determinar que a dita infecção está no estágio invisível.
23. Método, de acordo com a reivindicação 22, caracterizado pelo fato de que o dito perfil de comprimento do fragmento é um hospedeiro não microbiano ou subconjunto microbiano do perfil de comprimento do fragmento da biblioteca de ácido nucleico.
24. Método, de acordo com a reivindicação 22, caracterizado pelo fato de que compreende ainda as etapas de (a) determinar uma abundância de pelo menos um micróbio significativo em uma amostra do dito sujeito; (b) comparar a dita abundância com um limiar e comparar o dito perfil de comprimento de fragmento com um perfil de comprimento de fragmento de referência; e (c) se o dito perfil de comprimento de fragmento da dita amostra for semelhante a um perfil de comprimento de fragmento de um sujeito sintomático e a dita abundância for comparável a ou acima de um limiar, então determinar o dito estágio de infecção indica que o sujeito tem um risco aumentado de exibir um sintoma relacionado ao micróbio; se o dito perfil do comprimento do fragmento da dita amostra for semelhante a um perfil de comprimento do fragmento de um sujeito assintomático, então determinar que a dita infecção está no estágio invisível.
25. Método, de acordo com a reivindicação 22, caracterizado pelo fato de que compreende ainda a administração de um agente antimicrobiano a um sujeito determinado a ter um risco aumentado de exibir um sintoma relacionado ao micróbio.
26. Método para determinar o estágio de infecção de um sujeito suspeito de ter uma infecção microbiana, caracterizado pelo fato de que compreende: a) realizar sequenciamento de alto desempenho de ácidos nucleicos da dita amostra biológica; b) realizar análise de bioinformática para identificar sequências de ácido nucleico livres de células presentes na dita amostra biológica; e c) obter uma medição para os ácidos nucleicos livres de células e comparar a medição com um controle, determinando assim o estágio de infecção para um micróbio identificado na dita amostra biológica.
27. Método, de acordo com a reivindicação 26, caracterizado pelo fato de que compreende ainda uma ou mais etapas selecionadas a partir do grupo que consiste em: (a) extrair ácidos nucleicos livres de células a partir de uma amostra biológica obtida do dito sujeito; e (b) adicionar spike-ins de ácido nucleico sintético à dita porção livre de células.
28. Método, de acordo com a reivindicação 26, caracterizado pelo fato de que os ditos ácidos nucleicos compreendem ácidos nucleicos microbianos, ácidos nucleicos de hospedeiro ou ambos os ácidos nucleicos microbianos e de hospedeiro.
29. Método, de acordo com a reivindicação 26, caracterizado pelo fato de que a medição é selecionada a partir do grupo de medições que consiste em uma abundância absoluta para os ácidos nucleicos livres de células, uma distribuição de comprimentos de fragmentos para os ácidos nucleicos livres de células e tanto uma abundância absoluta quanto uma distribuição de comprimentos de fragmento para um micróbio alvo.
30. Método, de acordo com a reivindicação 26, caracterizado pelo fato de que o estágio de infecção é selecionado a partir de uma fase invisível, uma fase sintomática de uma infecção, uma fase de tratamento ou um estágio de erradicação.
31. Método, de acordo com a reivindicação 26, caracterizado pelo fato de que compreende ainda a administração de um regime terapêutico ao sujeito, em que o dito regime terapêutico é apropriado para o estágio de infecção determinado.
32. Método, de acordo com a reivindicação 26, caracterizado pelo fato de que compreende ainda repetir o método em amostras obtidas de um sujeito em vários pontos de tempo para monitorar a infecção ou eficácia de um tratamento para a infecção.
33. Método, de acordo com a reivindicação 26, caracterizado pelo fato de que o micróbio é selecionado a partir do grupo que compreende Heliobacter pylori, Clostridium difficile, Haemophilus influenza, Salmonella, Streptococcus pneumoniae, citomegalovírus, vírus da hepatite b, vírus da hepatite c, vírus do papiloma humano, vírus Epstein-Barr, vírus de linfoma de células T humanas do tipo 1, poliomavírus de células de Merkel, vírus sarcoma de Kaposi, herpesvírus humano 8, Clamídia, Gonorreia, Sífilis ou Tricomoníase.
34. Método, de acordo com a reivindicação 27, caracterizado pelo fato de que adicionar spike-ins de ácido nucleico sintético compreende ainda: (a) produzir uma amostra preparada obtendo uma amostra de um sujeito que compreende ácidos nucleicos livres de células e adicionando pelo menos 1.000 ácidos nucleicos sintéticos únicos à amostra, em que cada um dos 1.000 ácidos nucleicos sintéticos únicos compreende (i) uma etiqueta de identificação e (ii) uma região variável que compreende pelo menos 5 bases degeneradas; (b) extrair os ácidos nucleicos a partir da amostra preparada; (c) gerar uma biblioteca de amostra preparada; (d) enriquecer a biblioteca de amostra preparada; (e) conduzir um ensaio de sequenciamento de alto desempenho para obter leituras de sequência da biblioteca de amostra preparada;
(f) calcular um valor de perda de diversidade de 1.000 ácidos nucleicos sintéticos únicos e; (g) calcular uma medição para os ácidos nucleicos livres de células e comparar a medição com um controle, determinando assim o estágio de infecção no sujeito.
35. Método para determinar o estágio de infecção de Heliobacter pylori em um sujeito, caracterizado pelo fato de que compreende: (b) extrair ácidos nucleicos livres de células de uma amostra biológica obtida do dito sujeito; (c) adicionar ácido nucleico sintético preparado à dita porção livre de células; (d) realizar sequenciamento de alto desempenho de ácidos nucleicos da dita amostra biológica; (e) realizar análise de bioinformática para identificar sequências de ácido nucleico de Heliobacter pylori livres de células presentes na dita amostra biológica; e (f) calcular uma medição para os ácidos nucleicos de Heliobacter pylori livres de células e comparar a medição com um controle, determinando assim o estágio de infecção para Heliobacter pylori no dito sujeito.
36. Método para determinar o estágio de infecção de Heliobacter pylori em sujeito, caracterizado pelo fato de que compreende: a) produzir uma amostra preparada obtendo uma amostra de um sujeito que compreende ácidos nucleicos livres de células e adicionando pelo menos 1.000 ácidos nucleicos sintéticos únicos à amostra, em que cada um dos 1.000 ácidos nucleicos sintéticos únicos compreende (i) uma etiqueta de identificação e (ii) uma região variável que compreende pelo menos 5 bases degeneradas; b) extrair os ácidos nucleicos a partir da amostra preparada; c) gerar uma biblioteca de amostra preparada, em que a geração compreende (i) ligar um adaptador à amostra preparada de extremidade reparada e (ii) amplificar; d) enriquecer a biblioteca de amostra preparada; e) conduzir um ensaio de sequenciamento de alto desempenho para obter leituras de sequência da biblioteca de amostra preparada; f) calcular um valor de perda de diversidade de 1.000 ácidos nucleicos sintéticos únicos e; g) calcular uma medição para os ácidos nucleicos livres de células e comparar a medição com um controle, determinando assim o estágio de infecção de Heliobacter pylori no sujeito.
37. Método para determinar uma interação biológica hospedeiro-micróbio em um sujeito, caracterizado pelo fato de que compreende: (a) gerar um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico gerada a partir de uma amostra do dito sujeito; (b) opcionalmente, determinar uma abundância de um ácido nucleico alvo e comparar a dita abundância com um limiar; (c) comparar o dito perfil de comprimento de fragmento com um perfil de comprimento de fragmento de referência de uma ou mais interações biológicas hospedeiro-micróbio; e
(d) se o dito perfil de comprimento de fragmento for semelhante a um perfil de comprimento de fragmento de referência para uma interação biológica hospedeiro-micróbio, então identificar a dita interação biológica hospedeiro-micróbio.
38. Método, de acordo com a reivindicação 37, caracterizado pelo fato de que se o dito perfil de comprimento de fragmento e abundância do dito ácido nucleico alvo for semelhante a um perfil de comprimento de fragmento de referência e limiar para uma interação biológica hospedeiro-micróbio, então identificar a interação biológica hospedeiro-micróbio.
39. Método, de acordo com a reivindicação 32, caracterizado pelo fato de que compreende ainda alterar um regime terapêutico.
40. Método para identificar a presença de uma infecção viral em um sujeito suspeito de ter uma infecção microbiana, caracterizado pelo fato de que compreende: a) gerar um perfil de comprimento de fragmento para uma biblioteca de ácido nucleico gerada a partir da dita amostra do dito sujeito; b) comparar o dito perfil de comprimento de fragmento com um perfil de comprimento de fragmento viral de referência; c) opcionalmente, quantificar uma abundância para um ácido nucleico alvo e comparar a dita abundância com um limiar; e d) se o dito perfil de comprimento do fragmento se assemelhar a um dito perfil de referência, então identificar a presença de uma infecção viral no dito sujeito.
BR112021009706-6A 2018-11-21 2019-11-21 detecção e predição de doença infecciosa BR112021009706A2 (pt)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862770182P 2018-11-21 2018-11-21
US201862770181P 2018-11-21 2018-11-21
US62/770,182 2018-11-21
US62/770,181 2018-11-21
US201962849618P 2019-05-17 2019-05-17
US62/849,618 2019-05-17
PCT/US2019/062665 WO2020106987A1 (en) 2018-11-21 2019-11-21 Detection and prediction of infectious disease

Publications (1)

Publication Number Publication Date
BR112021009706A2 true BR112021009706A2 (pt) 2021-08-17

Family

ID=70773088

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021009706-6A BR112021009706A2 (pt) 2018-11-21 2019-11-21 detecção e predição de doença infecciosa

Country Status (7)

Country Link
US (1) US20210403986A1 (pt)
EP (1) EP3884087A4 (pt)
CN (1) CN113227468A (pt)
BR (1) BR112021009706A2 (pt)
CA (1) CA3118742A1 (pt)
IL (1) IL283247A (pt)
WO (1) WO2020106987A1 (pt)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
AU2011255641A1 (en) 2010-05-18 2012-12-06 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
RU2717641C2 (ru) 2014-04-21 2020-03-24 Натера, Инк. Обнаружение мутаций и плоидности в хромосомных сегментах
WO2016183106A1 (en) 2015-05-11 2016-11-17 Natera, Inc. Methods and compositions for determining ploidy
JP6743268B2 (ja) 2016-03-25 2020-08-19 カリウス・インコーポレイテッド 合成核酸スパイクイン
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US10697008B2 (en) 2017-04-12 2020-06-30 Karius, Inc. Sample preparation methods, systems and compositions
CA3082601A1 (en) 2018-03-16 2019-09-19 Karius, Inc. Sample series to differentiate target nucleic acids from contaminant nucleic acids
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
US20230203573A1 (en) * 2020-05-29 2023-06-29 Natera, Inc. Methods for detection of donor-derived cell-free dna
EP4263866A1 (en) * 2020-12-21 2023-10-25 Karius, Inc. Sequencing microbial cell-free nucleic acids to detect inflammation, secondary infection, and disease severity
EP4274913A1 (en) * 2021-01-11 2023-11-15 Karius Inc. Rapid, non-invasive detection and serial monitoring of infections in subjects using microbial cell-free dna sequencing
WO2023006175A1 (de) * 2021-07-26 2023-02-02 Siemens Aktiengesellschaft Verfahren zur klassifizierung mindestens einer nukleinsäuresequenz sowie vorrichtung, computerprogramm, computerlesbares speichermedium und digitales abbild
CN113854470B (zh) * 2021-08-04 2023-07-25 江西农业大学 鞘氨醇杆菌sc015及其在制备诺如病毒吸附剂中的应用
CN114496088B (zh) * 2022-01-27 2023-06-20 中国农业科学院兰州兽医研究所 一种棘球蚴病微生物标志物及其筛选方法和应用
CN114496085B (zh) * 2022-04-15 2022-07-05 中国医学科学院北京协和医院 病原微生物宏基因组生信分析参考品及其制备方法和应用
WO2024077097A1 (en) * 2022-10-04 2024-04-11 Rhode Island Hospital Using deep rna sequencing data to identify antimicrobial-resistant bacteria
CN117344061B (zh) * 2023-12-05 2024-02-27 云南省细胞质量检测评价中心有限公司 一种同时检测五种人源病毒ebv、hbv、hcv、hiv、hpv的方法、试剂盒、引物和探针及其应用

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009117031A2 (en) * 2007-12-18 2009-09-24 Advanced Analytical Technologies, Inc. System and method for nucleotide sequence profiling for sample identification
CN106103713B (zh) * 2014-02-03 2021-05-28 赛默飞世尔科技波罗的海封闭股份公司 用于经控制dna片段化的方法
AU2016264102A1 (en) * 2015-05-18 2017-12-21 Karius, Inc. Compositions and methods for enriching populations of nucleic acids
JP6743268B2 (ja) * 2016-03-25 2020-08-19 カリウス・インコーポレイテッド 合成核酸スパイクイン
WO2018009723A1 (en) * 2016-07-06 2018-01-11 Guardant Health, Inc. Methods for fragmentome profiling of cell-free nucleic acids
EP3535415A4 (en) * 2016-10-24 2020-07-01 The Chinese University of Hong Kong TUMOR DETECTION METHODS AND SYSTEMS
WO2018187521A2 (en) * 2017-04-06 2018-10-11 Cornell University Methods of detecting cell-free dna in biological samples
CA3118990A1 (en) * 2018-11-21 2020-05-28 Karius, Inc. Direct-to-library methods, systems, and compositions

Also Published As

Publication number Publication date
US20210403986A1 (en) 2021-12-30
WO2020106987A1 (en) 2020-05-28
CA3118742A1 (en) 2020-05-28
EP3884087A1 (en) 2021-09-29
CN113227468A (zh) 2021-08-06
IL283247A (en) 2021-07-29
EP3884087A4 (en) 2022-09-07

Similar Documents

Publication Publication Date Title
US20210403986A1 (en) Detection and prediction of infectious disease
Reck et al. Stool metatranscriptomics: A technical guideline for mRNA stabilisation and isolation
CN108368551B (zh) 用于诊断结核病的方法
ES2611000T3 (es) Método para usar la expresión génica para determinar el pronóstico de cáncer de próstata
US8765371B2 (en) Method for the in vitro detection and differentiation of pathophysiological conditions
US20110076685A1 (en) Method for in vitro detection and differentiation of pathophysiological conditions
US20170226590A1 (en) Locked nucleic acids for capturing fusion genes
US20140128277A1 (en) Method for Identifying a Subset of Polynucleotides from an Initial Set of Polynucleotides Corresponding to the Human Genome for the In Vitro Determination of the Severity of the Host Response of a Patient
AU2015213486A1 (en) Biomarker signature method, and apparatus and kits therefor
US20230040907A1 (en) Diagnostic assay for urine monitoring of bladder cancer
CN114807368A (zh) 用于评估肺癌状态的方法
EP3245298B1 (en) Biomarkers for colorectal cancer related diseases
US11674167B2 (en) Sample series to differentiate target nucleic acids from contaminant nucleic acids
CN111187860A (zh) 新型冠状病毒多重pcr快速检测试剂盒
JP2018524972A (ja) 肺癌の診断または検出のための方法及び組成物
No et al. Comparison of targeted next-generation sequencing for whole-genome sequencing of Hantaan orthohantavirus in Apodemus agrarius lung tissues
US20230197269A1 (en) Systems and methods for detecting viral dna from sequencing
US20220349013A1 (en) Detection and treatment of residual disease using circulating tumor dna analysis
Guo et al. Evaluation of exosomal miRNAs as potential diagnostic biomarkers for acute myocardial infarction using next-generation sequencing
US20220084632A1 (en) Clinical classfiers and genomic classifiers and uses thereof
US20210381047A1 (en) Circulating micrornas in knee osteoarthritis and uses thereof
KR102229647B1 (ko) 신장이식 환자의 급성거부반응 진단용 miRNA 바이오 마커 및 이의 용도
Dutta et al. Nucleic Acid in Diagnostics
Gòdia et al. Urinary microRNAome in healthy cats and cats with pyelonephritis or other urological conditions
Xu et al. Identification of an Excellent PCR-Based Classifier to Predict Tumor Relapse in Stage II/III Colorectal Cancer and Its Clinical Application Irrespective of Consensus Molecular Subtypes

Legal Events

Date Code Title Description
B11A Dismissal acc. art.33 of ipl - examination not requested within 36 months of filing
B11Y Definitive dismissal - extension of time limit for request of examination expired [chapter 11.1.1 patent gazette]