BR112020027023A2 - Métodos para detecção de dna livre de células derivado de doador - Google Patents

Métodos para detecção de dna livre de células derivado de doador Download PDF

Info

Publication number
BR112020027023A2
BR112020027023A2 BR112020027023-7A BR112020027023A BR112020027023A2 BR 112020027023 A2 BR112020027023 A2 BR 112020027023A2 BR 112020027023 A BR112020027023 A BR 112020027023A BR 112020027023 A2 BR112020027023 A2 BR 112020027023A2
Authority
BR
Brazil
Prior art keywords
dna
transplant
donor
fact
cfdna
Prior art date
Application number
BR112020027023-7A
Other languages
English (en)
Inventor
Solomon Moshkevich
Bernhard Zimmermann
Tudor Pompiliu Constantin
Huseyin Eser Kirkizlar
Allison Ryan
Styrmir Sigurjonsson
Felipe Acosta Archila
Ryan SWENERTON
Original Assignee
Natera, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Natera, Inc. filed Critical Natera, Inc.
Publication of BR112020027023A2 publication Critical patent/BR112020027023A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

métodos para detecção de dna livre de células derivado de doador. a presente divulgação refere-se a métodos para determinar o estado de um aloenxerto dentro de um receptor de transplante a partir de dados genotípicos medidos a partir de uma amostra mista de dna que compreende dna tanto do receptor quanto do doador de transplante. a amostra mista de dna pode ser, preferencialmente, enriquecida em uma pluralidade de locais polimórficos de uma forma que minimize a tendência alélica, por exemplo, com o uso de pcr alvejada massivamente multiplexada.

Description

“MÉTODOS PARA DETECÇÃO DE DNA LIVRE DE CÉLULAS DERIVADO DE DOADOR” REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
[0001] O presente pedido reivindica a prioridade do Pedido Provisório nº 62/693.833 depositado em 3 de julho de 2018; do Pedido Provisório nº 62/715,178, depositado em 6 de agosto de 2018; do Pedido Provisório nº 62/781,882, depositado em 19 de dezembro de 2018; e do Pedido Provisório nº 62/834.315 depositado em 15 de abril de 2019. Cada um desses pedidos mencionados acima incorpora-se ao presente documento a título de referência em sua totalidade.
CAMPO
[0002] Em termos gerais, a presente divulgação se refere a métodos para detectar DNA derivado de doador em um receptor de transplante.
ANTECEDENTES
[0003] Existem, atualmente, cerca de 190.000 receptores de rins vivos nos Estados Unidos e cerca de 20.000 cirurgias de transplante renal ocorrem anualmente. A detecção rápida de lesão e/ou rejeição do aloenxerto renal permanece um desafio. Tentativas anteriores de usar creatinina sérica para determinar o estado do transplante renal têm carecido de especificidade e os transplantes de biópsia são invasivos e caros e possivelmente levam ao diagnóstico tardio de lesão e/ou rejeição ao transplante.
[0004] Visto que o sistema imunológico reconhece um aloenxerto como estranho a um corpo e ativa vários mecanismos imunológicos para rejeitar o aloenxerto, geralmente é necessário suprimir clinicamente a resposta normal do sistema imunológico para rejeitar um transplante. Portanto, existe a necessidade de um teste não invasivo para rejeição de transplante que seja mais sensível e mais específico do que os testes convencionais.
SUMÁRIO
[0005] Em um aspecto, a presente invenção se refere a um método para quantificar a quantidade de DNA livre de células derivado de doador (dd-cfDNA) em uma amostra de sangue de um receptor de transplante compreendendo: extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado do receptor; realizar a amplificação alvejada em 500 a 50.000 locais-alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos, e em que cada par de iniciadores é projetado para amplificar uma sequência-alvo de não mais de 100 pb; e quantificar a quantidade de DNA livre de células derivado de doador nos produtos de amplificação.
[0006] Em outro aspecto, a presente invenção se refere a um método para quantificar a quantidade de DNA livre de células derivado de doador (dd-cfDNA) em uma amostra de sangue de um receptor de transplante compreendendo: extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado do receptor; e em que a etapa de extração compreende a seleção do tamanho para enriquecer o DNA livre de células derivado de doador e reduzir a quantidade de DNA livre de células derivado de receptor eliminado a partir de leucócitos em erupção; realizar a amplificação alvejada em 500 a 50.000 locais-alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos, e quantificar a quantidade de DNA livre de células derivado de doador nos produtos de amplificação.
[0007] Em outro aspecto, a presente invenção se refere a um método para detectar DNA livre de células derivado de doador (dd- cfDNA) em uma amostra de sangue de um receptor de transplante compreendendo: extrair DNA da amostra de sangue do receptor de transplante,
em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado do receptor; realizar a amplificação alvejada em 500 a
50.000 locais-alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos; sequenciar os produtos de amplificação por meio do sequenciamento de alto rendimento; e quantificar a quantidade de DNA livre de células derivado de doador.
[0008] Em algumas modalidades, o método compreende, ainda, realizar a amplificação universal do DNA extraído. Em algumas modalidades, a amplificação universal preferencialmente amplifica o DNA livre de células derivado de doador em relação ao DNA livre de células derivado de receptor que é eliminado a partir de leucócitos em erupção.
[0009] Em algumas modalidades, o receptor de transplante é um mamífero. Em algumas modalidades, o receptor de transplante é um ser humano.
[0010] Em algumas modalidades, o receptor de transplante recebeu um transplante selecionado a partir de transplante de órgão, transplante de tecido, transplante de células e transplante de fluido. Em algumas modalidades, o receptor de transplante recebeu um transplante selecionado a partir de transplante de rim, transplante de fígado, transplante de pâncreas, transplante intestinal, transplante cardíaco, transplante pulmonar, transplante de coração/pulmão, transplante de estômago, transplante de testículo, transplante de pênis, transplante de ovário, transplante de útero, transplante de timo, transplante de face, transplante de mão, transplante de perna, transplante de osso, transplante de medula óssea, transplante de córnea, transplante de pele, transplante de células de ilhotas pancreáticas, transplante de válvula cardíaca, transplante de vaso sanguíneo e transfusão de sangue. Em algumas modalidades, o receptor de transplante recebeu um transplante de rim.
[0011] Em algumas modalidades, a etapa de quantificação compreende determinar a porcentagem de DNA livre de células derivado de doador em relação ao total de DNA livre de células derivado de doador e DNA livre de células derivado de receptor na amostra de sangue. Em algumas modalidades, a etapa de quantificação compreende determinar o número de cópias de DNA livre de células derivado de doador por unidade de volume da amostra de sangue.
[0012] Em algumas modalidades, o método compreende, ainda, detectar a ocorrência ou provável ocorrência de rejeição ativa de transplante com o uso da quantidade quantificada de DNA livre de células derivado de doador. Em algumas modalidades, o método é realizado sem conhecimento prévio dos genótipos do doador.
[0013] Em algumas modalidades, cada par de iniciadores é projetado para amplificar uma sequência-alvo de cerca de 50 a 100 pb. Em algumas modalidades, cada par de iniciadores é projetado para amplificar uma sequência-alvo de não mais de 75 pb. Em algumas modalidades, cada par de iniciadores é projetado para amplificar uma sequência-alvo de cerca de 60 a 75 pb. Em algumas modalidades, cada par de iniciadores é projetado para amplificar uma sequência-alvo de cerca de 65 pb.
[0014] Em algumas modalidades, a amplificação alvejada compreende amplificar pelo menos 1.000 locais polimórficos e um único volume de reação. Em algumas modalidades, a amplificação alvejada compreende amplificar pelo menos 2.000 locais polimórficos e um único volume de reação. Em algumas modalidades, a amplificação alvejada compreende amplificar pelo menos 5.000 locais polimórficos e um único volume de reação. Em algumas modalidades, a amplificação alvejada compreende amplificar pelo menos 10.000 locais polimórficos e um único volume de reação.
[0015] Em algumas modalidades, o método compreende, ainda, medir uma quantidade de um ou mais alelos nos locais- alvo que sejam locais polimórficos. Em algumas modalidades, os locais polimórficos e os locais não polimórficos são amplificados em uma única reação.
[0016] Em algumas modalidades, a etapa de quantificação compreende detectar os locais-alvo amplificados com o uso de um microarranjo. Em algumas modalidades, a etapa de quantificação não compreende o uso de um microarranjo.
[0017] Em algumas modalidades, a amplificação alvejada compreende amplificar, simultaneamente, 500 a 50.000 locais-alvo em um único volume de reação com o uso de (i) pelo menos 500 a 50.000 pares de iniciadores diferentes, ou (ii) pelo menos 500 a 50.000 iniciadores alvo- específicos e um iniciador universal ou etiqueta-específico, 500 a 50.000 pares de iniciadores.
[0018] Em um aspecto adicional, a presente invenção se refere a um método para determinar a probabilidade de rejeição ao transplante em um receptor de transplante, em que o método compreende: extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado do receptor; realizar a amplificação alvejada em 500 a 50.000 locais- alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos; sequenciar os produtos de amplificação por meio do sequenciamento de alto rendimento; e quantificar a quantidade de DNA livre de células derivado de doador na amostra de sangue, em uma quantidade maior de dd-cfDNA indica uma probabilidade maior de rejeição ao transplante.
[0019] Em um aspecto adicional, a presente invenção se refere a um método para diagnosticar um transplante em um receptor de transplante que está passando por rejeição aguda, em que o método compreende: extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado do receptor; realizar a amplificação alvejada em 500 a 50.000 locais-alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos; sequenciar os produtos de amplificação por sequenciamento de alto rendimento; e quantificar a quantidade de DNA livre de células derivado de doador na amostra de sangue, em que uma quantidade de dd-cfDNA superior a 1% indica que o transplante está passando por rejeição aguda.
[0020] Em algumas modalidades, a rejeição ao transplante é uma rejeição ao transplante mediada por anticorpos. Em algumas modalidades, a rejeição ao transplante é uma rejeição ao transplante mediada por células T.
[0021] Em algumas modalidades, uma quantidade de dd-cfDNA de menos de 1% indica que o transplante está passando por rejeição limítrofe, sofrendo outra lesão ou estável.
[0022] Em um aspecto adicional, a presente invenção se refere a um método para monitorar a terapia imunossupressora em um sujeito, em que o método compreende: extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado do receptor; realizar a amplificação universal do DNA extraído; realizar a amplificação alvejada em 500 a 50.000 locais-alvo em um único volume de reação com o uso de 500 a
50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos; sequenciar os produtos de amplificação por sequenciamento de alto rendimento; e quantificar a quantidade de DNA livre de células derivado de doador na amostra de sangue, em que uma mudança nos níveis de dd-cfDNA ao longo de um intervalo de tempo é indicativa do estado do transplante.
[0023] Em algumas modalidades, o método compreende, ainda, o ajuste de terapia imunossupressora com base nos níveis de dd-cfDNA ao longo do intervalo de tempo.
[0024] Em algumas modalidades, um aumento nos níveis de dd-cfDNA é indicativo de rejeição ao transplante e uma necessidade de ajuste da terapia imunossupressora. Em algumas modalidades, nenhuma mudança ou diminuição nos níveis de dd-cfDNA indica tolerância ou estabilidade ao transplante e uma necessidade de ajuste da terapia imunossupressora.
[0025] Em algumas modalidades, uma quantidade de dd-cfDNA superior a 1% indica que o transplante está passando por rejeição aguda. Em algumas modalidades, a rejeição ao transplante é uma rejeição ao transplante mediada por anticorpos. Em algumas modalidades, a rejeição ao transplante é uma rejeição ao transplante mediada por células T.
[0026] Em algumas modalidades, uma quantidade de dd-cfDNA de menos de 1% indica que o transplante está passando por rejeição limítrofe, sofrendo outra lesão ou estável.
[0027] Em algumas modalidades, o método não compreende a genotipagem do doador de transplante e/ou do receptor de transplante.
[0028] Em algumas modalidades, o método compreende, ainda, medir uma quantidade de um ou mais alelos nos locais- alvo que sejam locais polimórficos.
[0029] Em algumas modalidades, os locais-alvo compreendem pelo menos 1.000 locais polimórficos, ou pelo menos 2.000 locais polimórficos, ou pelo menos 5.000 locais polimórficos ou pelo menos
10.000 locais polimórficos.
[0030] Em algumas modalidades, os locais-alvo que são amplificados em amplicons de cerca de 50 a 100 pb de comprimento, ou cerca de 50 a 90 pb de comprimento, ou cerca de 60 a 80 pb de comprimento, ou cerca de 60 a 75 pb de comprimento, ou cerca de 65 pb de comprimento.
[0031] Em algumas modalidades, o receptor de transplante é um ser humano. Em algumas modalidades, o receptor de transplante recebeu um transplante selecionado a partir de transplante de rim, transplante de fígado, transplante de pâncreas, transplante de células de ilhotas, transplante intestinal, transplante cardíaco, transplante pulmonar, transplante de medula óssea, transplante de válvula cardíaca ou um transplante de pele. Em algumas modalidades, o receptor de transplante recebeu um transplante de rim.
[0032] Em algumas modalidades, a etapa de extração compreende a seleção de tamanho para enriquecer o DNA livre de células derivado de doador e reduzir a quantidade de DNA livre de células derivado de receptor eliminado a partir de leucócitos em erupção.
[0033] Em algumas modalidades, a amplificação universal preferencialmente amplifica o DNA livre de células derivado de doador em relação ao DNA livre de células derivado de receptor que é eliminado a partir de leucócitos em erupção.
[0034] Em algumas modalidades, o método compreende, ainda, coletar longitudinalmente uma pluralidade de amostras de sangue do receptor de transplante após o transplante e repetir as etapas (a) a (e) para cada amostra de sangue coletada. Em algumas modalidades, o método compreende coletar e analisar amostras de sangue do receptor de transplante por um período de tempo de cerca de três meses, ou cerca de seis meses, ou cerca de doze meses, ou cerca de dezoito meses ou cerca de vinte e quatro meses, etc. Em algumas modalidades, o método compreende a coleta de amostras de sangue do receptor de transplante em um intervalo de cerca de uma semana, ou cerca de duas semanas, ou cerca de três semanas, ou cerca de um mês, ou cerca de dois meses ou cerca de três meses, etc.
[0035] Em algumas modalidades, o método tem uma sensibilidade de pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98% na identificação de rejeição aguda (AR) em relação a não AR com um limite de corte de 1% de dd-cfDNA e um intervalo de confiança de 95%.
[0036] Em algumas modalidades, o método tem uma especificidade de pelo menos 60%, ou pelo menos 65%, ou pelo menos 70%, ou pelo menos 75%, ou pelo menos 80%, ou pelo menos 85%, ou pelo menos 90% na identificação de AR em relação a não AR, com um limite de corte de 1% de dd-cfDNA em um intervalo de confiança de 95%.
[0037] Em algumas modalidades, o método tem uma área sob a curva (AUC) de pelo menos 0,8 ou 0,85, ou pelo menos 0,9 ou pelo menos 0,95 na identificação de AR em relação a não AR com um limite de corte de 1% de dd-cfDNA e um intervalo de confiança de 95%.
[0038] Em algumas modalidades, o método tem uma sensibilidade de pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98% na identificação de AR em relação a aloenxertos normais e estáveis (STA) com um limite de corte de 1% de dd- cfDNA e um intervalo de confiança de 95%.
[0039] Em algumas modalidades, o método tem uma especificidade de pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98% na identificação de AR em relação a STA com um limite de corte de 1% de dd-cfDNA e um intervalo de confiança de 95%.
[0040] Em algumas modalidades, o método tem uma AUC de pelo menos 0,8 ou 0,85 ou pelo menos 0,9, ou pelo menos 0,95, ou pelo menos 0,98, ou pelo menos 0,99 na identificação de AR em relação a STA com um limite de corte de 1% de dd-cfDNA e um intervalo de confiança de 95%.
[0041] Em algumas modalidades, o método tem uma sensibilidade conforme determinado por um limite de branco (LoB) de 0,5% ou menos e um limite de detecção (LoD) de 0,5% ou menos. Em algumas modalidades, LoB é de 0,23% ou menos e LoD é de 0,29% ou menos. Em algumas modalidades, a sensibilidade é, ainda, determinada por um limite de quantificação (LoQ). Em algumas modalidades, LoQ é 10 vezes maior do que
LoD; LoQ pode ser 5 vezes maior que o LoD; LoQ pode ser 1,5 vez maior que o LoD; LoQ pode ser 1,2 vez maior que o LoD; LoQ pode ser 1,1 vez maior que o LoD; ou LoQ pode ser igual ou maior do que o LoD. Em algumas modalidades, LoB é igual ou menor que 0,04%, LoD é igual ou menor que 0,05% e/ou LoQ é igual a o LoD.
[0042] Em algumas modalidades, o método tem uma precisão conforme determinado pela avaliação de um valor de linearidade obtido a partir da análise de regressão linear de frações de doador medidas como uma função dos níveis de pico tentados correspondentes, em que o valor de linearidade é um valor de R2, em que o valor de R2 é de cerca de 0,98 a cerca de 1,0. Em algumas modalidades, o valor de R2 é de 0,999. Em algumas modalidades, o método tem uma precisão conforme determinado pelo uso de regressão linear em frações de doador medidas como uma função dos níveis de pico tentados correspondentes para calcular um valor de coeficiente angular e um valor de interceptação, em que o valor de coeficiente angular é de cerca de 0,9 a cerca de 1,2 e o valor de interceptação é de cerca de - 0,0001 a cerca de 0,01. Em algumas modalidades, o valor do coeficiente angular é de aproximadamente 1 e o valor de interceptação é de aproximadamente 0.
[0043] Em algumas modalidades, o método tem uma precisão conforme determinado pelo cálculo de um coeficiente de variação (CV), em que o CV é menor que cerca de 10,0%. Cv é menor que cerca de 6%. Em algumas modalidades, o Cv é menor que cerca de 4%. Em algumas modalidades, o Cv é menor que cerca de 2%. Em algumas modalidades, o Cv é menor que cerca de 1%.
[0044] Em algumas modalidades, a AR é rejeição mediada por anticorpos (ABMR). Em algumas modalidades, a AR é rejeição mediada por células T (TCMR).
[0045] Ainda são divulgados aqui métodos para detecção de DNA livre de células derivado de doador de transplante (dd- cfDNA) em uma amostra de um receptor de transplante. Em algumas modalidades, nos métodos aqui divulgados, o receptor de transplante é um mamífero. Em algumas modalidades, o receptor de transplante é um ser humano. Em algumas modalidades, o receptor de transplante recebeu um transplante selecionado a partir de transplante de rim, transplante de fígado, transplante de pâncreas, transplante de células de ilhotas, transplante intestinal, transplante cardíaco, transplante pulmonar, transplante de medula óssea, transplante de válvula cardíaca ou um transplante de pele. Em algumas modalidades, o receptor de transplante recebeu um transplante de rim. Em algumas modalidades, o método pode ser realizado em receptores de transplante no dia ou após a cirurgia de transplante, até um ano após a cirurgia de transplante.
[0046] Em algumas modalidades, é divulgado aqui um método de amplificação de locais-alvo de DNA livre de células derivado de doador (dd-cfDNA) de uma amostra de sangue de um receptor de transplante, em que o método compreende: a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado tanto das células transplantadas quanto do receptor de transplante, b) enriquecer o DNA extraído em locais-alvo, em que os locais-alvo compreendem 50 a 5.000 locais-alvo compreendendo locais polimórficos e não polimórficos; e c) amplificar os locais-alvo.
[0047] Em algumas modalidades, é divulgado aqui um método de detecção de DNA livre de células derivado de doador (dd- cfDNA) em uma amostra de sangue de um receptor de transplante, em que o método compreende: a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado tanto das células transplantadas quanto do receptor de transplante, b) enriquecer o DNA extraído em locais-alvo, em que os locais-alvo compreendem 50 a 5.000 locais-alvo compreendendo locais polimórficos e não polimórficos; c) amplificar os locais-alvo; d) contatar os locais-alvo amplificados com sondas que hibridizam especificamente aos locais-alvo; e e) detectar a ligação dos locais-
alvo com as sondas, detectando, assim, dd-cfDNA na amostra de sangue. Em algumas modalidades, as sondas são marcadas com um marcador detectável.
[0048] Em algumas modalidades, é divulgado aqui um método para determinar a probabilidade de rejeição ao transplante dentro de um receptor de transplante, em que o método compreende: a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado tanto das células transplantadas quanto do receptor de transplante, b) enriquecer o DNA extraído em locais-alvo, em que os locais-alvo compreendem 50 a 5.000 locais-alvo compreendendo locais polimórficos e não polimórficos; c) amplificar os locais-alvo; e d) medir uma quantidade de DNA de transplante e uma quantidade de DNA de receptor na amostra de sangue de receptor; em que uma quantidade maior de dd-cfDNA indica uma maior probabilidade de rejeição ao transplante.
[0049] Em algumas modalidades, é divulgado aqui um método para diagnosticar um transplante dentro de um receptor de transplante como sofrendo rejeição aguda, em que o método compreende: a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado tanto das células transplantadas quanto do receptor de transplante, b) enriquecer o DNA extraído em locais- alvo, em que os locais-alvo compreendem 50 a 5.000 locais-alvo compreendendo locais polimórficos e não polimórficos; c) amplificar os locais- alvo; e d) medir uma quantidade de DNA de transplante e uma quantidade de DNA de receptor na amostra de sangue de receptor; em que uma quantidade de dd-cfDNA superior a 1% indica que o transplante está passando por rejeição aguda.
[0050] Em algumas modalidades, nos métodos aqui divulgados, a rejeição ao transplante é uma rejeição ao transplante mediada por anticorpos. Em algumas modalidades, a rejeição ao transplante é uma rejeição ao transplante mediada por células T. Em algumas modalidades, uma quantidade de dd-cfDNA de menos de 1% indica que o transplante está passando por rejeição limítrofe, sofrendo outra lesão ou estável.
[0051] Em algumas modalidades, é divulgado aqui um método de monitoramento de terapia imunossupressora em um sujeito, em que o método compreende a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado tanto das células transplantadas quanto do receptor de transplante, b) enriquecer o DNA extraído em locais-alvo, em que os locais-alvo compreendem 50 a 5.000 locais-alvo compreendendo locais polimórficos e não polimórficos; c) amplificar os locais-alvo; e d) medir uma quantidade de DNA de transplante e uma quantidade de DNA de receptor na amostra de sangue de receptor; em que uma mudança nos níveis de dd-cfDNA ao longo de um intervalo de tempo é indicativa do estado do transplante. Em algumas modalidades, o método compreende, ainda, o ajuste de terapia imunossupressora com base nos níveis de dd-cfDNA ao longo do intervalo de tempo. Em algumas modalidades, um aumento nos níveis de dd-cfDNA é indicativo de rejeição ao transplante e uma necessidade de ajuste da terapia imunossupressora. Em algumas modalidades, uma mudança ou uma diminuição nos níveis de dd-cfDNA indica tolerância ou estabilidade ao transplante e uma necessidade de ajuste da terapia imunossupressora.
[0052] Em algumas modalidades, nos métodos aqui divulgados, os locais-alvo que são amplificados em amplicons de cerca de 50 a 100 pb de comprimento ou cerca de 60 a 80 pb de comprimento. Em algumas modalidades, os amplicons têm cerca de 65 pb de comprimento.
[0053] Em algumas modalidades, os métodos aqui divulgados compreendem, ainda, medir uma quantidade de DNA de transplante e uma quantidade de DNA de receptor na amostra de sangue do receptor.
[0054] Em algumas modalidades, os métodos aqui divulgados não compreendem a genotipagem do doador de transplante e do receptor de transplante.
[0055] Em algumas modalidades, os métodos aqui divulgados compreendem, ainda, detectar os locais-alvo amplificados com o uso de um microarranjo.
[0056] 6. Em algumas modalidades, nos métodos aqui divulgados, os locais polimórficos e os locais não polimórficos são amplificados em uma única reação.
[0057] Em algumas modalidades, nos métodos aqui divulgados, o DNA é preferencialmente enriquecido nos locais-alvo.
[0058] Em algumas modalidades, enriquecer preferencialmente o DNA na amostra na pluralidade de locais polimórficos inclui a obtenção de uma pluralidade de sondas pré-circularizadas, em que cada sonda tem como alvo um dos locais polimórficos e em que as extremidades 3' e 5' das sondas são projetadas para hibridizar a uma região de DNA que é separada do sítio polimórfico do local por um pequeno número de bases, em que o pequeno número é 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 a 25, 26 a 30, 31 a 60, ou uma combinação dos mesmos, a hibridização das sondas pré-circularizadas ao DNA da amostra, o preenchimento do vão entre as extremidades da sonda hibridizada usando DNA polimerase, a circularização da sonda pré-circularizada e amplificação da sonda circularizada.
[0059] Em algumas modalidades, enriquecer preferencialmente o DNA na pluralidade de locais polimórficos inclui a obtenção de uma pluralidade de sondas de PCR mediada por ligação, em que cada sonda de PCR tem como alvo um dos locais polimórficos e em que as sondas de PCR a montante e a jusante são projetadas para hibridizar a uma região de DNA, em uma fita de DNA, que é separada do sítio polimórfico do local por um pequeno número de bases, em que o pequeno número é 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 a 25, 26 a 30, 31 a 60, ou uma combinação dos mesmos, hibridização das sondas de PCR mediada por ligação ao DNA da primeira amostra, o preenchimento do vão entre as extremidades da sonda de PCR mediada por ligação usando DNA polimerase,
a ligação das sondas de PCR mediada por ligação e a amplificação das sondas ligadas de PCR mediada por ligação.
[0060] Em algumas modalidades, enriquecer preferencialmente o DNA na pluralidade de locais polimórficos inclui a obtenção de uma pluralidade de sondas de captura híbridas que têm como alvo os locais polimórficos, a hibridização das sondas de captura híbridas ao DNA na amostra e a remoção física de parte ou todo o DNA não hibridizado da primeira amostra de DNA.
[0061] Em algumas modalidades, as sondas de captura híbridas são projetadas para hibridizar a uma região que flanqueia, mas não se sobrepõe ao sítio polimórfico. Em algumas modalidades, as sondas de captura híbridas são projetadas para hibridizar a uma região que flanqueia, mas não se sobrepõe ao sítio polimórfico, e em que o comprimento da sonda de captura de flanqueamento pode ser selecionado do grupo que consiste em menos de cerca de 120 bases, menos cerca de 110 bases, menos de cerca de 100 bases, menos de cerca de 90 bases, menos de cerca de 80 bases, menos de cerca de 70 bases, menos de cerca de 60 bases, menos de cerca de 50 bases, menos de cerca de 40 bases, menos de cerca de 30 bases e menos do que cerca de 25 bases. Em algumas modalidades, as sondas de captura híbridas são projetadas para hibridizar a uma região que se sobrepõe ao sítio polimórfico, e em que a pluralidade de sondas de captura híbridas compreende pelo menos duas sondas de captura híbridas para cada local polimórfico, e em que cada sonda de captura híbrida é projetada para ser complementar a um alelo diferente nesse local polimórfico.
[0062] Em algumas modalidades, enriquecer preferencialmente o DNA em uma pluralidade de locais polimórficos inclui a obtenção de uma pluralidade de iniciadores diretos interiores em que cada iniciador tem como alvo um dos locais polimórficos e em que a extremidade 3’ dos iniciadores diretos interiores é projetada para hibridizar a uma região de DNA a montante do sítio polimórfico, e separada do sítio polimórfico por um pequeno número de bases, em que o pequeno número é selecionado do grupo que consiste em 1, 2, 3, 4, 5, 6 a 10, 11 a 15, 16 a 20, 21 a 25, 26 a 30 ou 31 a 60 pares de bases, opcionalmente a obtenção de uma pluralidade de iniciadores reversos interiores em que cada iniciador tem como alvo um dos locais polimórficos, e em que a extremidade 3’ dos iniciadores reversos interiores é projetada para hibridizar a uma região de DNA a montante do sítio polimórfico, e separada do sítio polimórfico por um pequeno número de bases, em que o pequeno número é selecionado a partir do grupo que consiste em 1, 2, 3, 4, 5, 6 a 10, 11 a 15, 16 a 20, 21 a 25, 26 a 30 ou 31 a 60 pares de bases, hibridização dos iniciadores interiores ao DNA e a amplificação do DNA usando a reação em cadeia da polimerase para formar amplicons.
[0063] Em algumas modalidades, o método também inclui a obtenção de uma pluralidade de iniciadores diretos exteriores em que cada iniciador tem como alvo um dos locais polimórficos e em que os iniciadores diretos exteriores são projetados para hibridizar à região de DNA a montante do iniciador direto interior, opcionalmente a obtenção de uma pluralidade de iniciadores reversos exteriores em que cada iniciador tem como alvo um dos locais polimórficos, e em que os iniciadores reversos exteriores são projetados para hibridizar à região de DNA imediatamente a jusante do iniciador reverso interior, a hibridização dos primeiros iniciadores ao DNA e a amplificação do DNA usando a reação em cadeia da polimerase.
[0064] Em algumas modalidades, o método também inclui a obtenção de uma pluralidade de iniciadores reversos exteriores, em que cada iniciador tem como alvo um dos locais polimórficos, e em que os iniciadores reversos exteriores são projetados para hibridizar à região de DNA imediatamente a jusante do iniciador reverso interior, opcionalmente a obtenção de uma pluralidade de iniciadores diretos exteriores em que cada iniciador tem como alvo um dos locais polimórficos, e em que os iniciadores diretos exteriores são projetados para hibridizar à região de DNA a montante do iniciador direto interior, a hibridização dos primeiros iniciadores para o DNA e a amplificação do DNA usando a reação em cadeia da polimerase.
[0065] Em algumas modalidades, a preparação da primeira amostra inclui ainda anexar adaptadores universais ao DNA na primeira amostra e amplificar o DNA na primeira amostra usando a reação em cadeia da polimerase. Em algumas modalidades, pelo menos uma fração dos amplicons que são amplificados são menos de 100 pb, menos de 90 pb, menos de 80 pb, menos de 70 pb, menos de 65 pb, menos de 60 pb, menos de 55 pb, menos de 50 pb ou menos de 45 pb e em que a fração é 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% ou 99%.
[0066] Em algumas modalidades, a amplificação do DNA é feita em um ou uma pluralidade de volumes de reação individuais, e em que cada volume de reação individual contém mais de 100 pares de iniciadores diretos e reversos diferentes, mais de 200 pares de iniciadores diretos e reversos diferentes, mais de 500 pares de iniciadores diretos e reversos diferentes, mais de 1.000 pares de iniciadores diretos e reversos diferentes, mais de 2.000 pares de iniciadores diretos e reversos diferentes, mais de 5.000 pares de iniciadores diretos e reversos diferentes, mais de 10.000 pares de iniciadores diretos e reversos diferentes, mais de 20.000 pares de iniciadores diretos e reversos diferentes, mais de 50.000 pares de iniciadores diretos e reversos diferentes ou mais de 100.000 pares de iniciadores diretos e reversos diferentes.
[0067] Em algumas modalidades, a preparação da amostra compreende, ainda, dividir a amostra em uma pluralidade de porções, e em que o DNA em cada porção é preferencialmente enriquecido em um subconjunto da pluralidade de locais polimórficos. Em algumas modalidades, os iniciadores interiores são selecionados identificando pares de iniciadores propensos a formar duplexes de iniciadores indesejados e removendo da pluralidade de iniciadores pelo menos um do par de iniciadores identificados como sendo propensos a formar duplexes de iniciadores indesejados. Em algumas modalidades, os iniciadores interiores contêm uma região que é projetada para hibridizar a montante ou a jusante do local polimórfico alvejado e, opcionalmente, contém uma sequência de iniciação universal projetada para permitir a amplificação por PCR. Em algumas modalidades, pelo menos alguns dos iniciadores contêm adicionalmente uma região aleatória que difere para cada molécula de iniciador individual. Em algumas modalidades, pelo menos alguns dos iniciadores contêm adicionalmente um código de barras molecular.
[0068] Em algumas modalidades, o método compreende: (a) realizar a reação em cadeia da polimerase (PCR) multiplex em uma amostra de ácido nucleico compreendendo locais-alvo para amplificar simultaneamente pelo menos 1.000 locais-alvo distintos usando (i) pelo menos
1.000 pares de iniciadores diferentes, ou (ii) pelo menos 1.000 iniciadores alvo- específicos e um iniciador universal ou etiqueta-específico, em um único volume de reação para produzir produtos amplificados compreendendo amplicons-alvo; e (b) sequenciar os produtos amplificados. Em algumas modalidades, o método não compreende usar um microarranjo.
[0069] Em algumas modalidades, o método compreende (a) realizar a reação em cadeia da polimerase (PCR) multiplex na amostra de DNA livre de células compreendendo locais-alvo para amplificar simultaneamente pelo menos 1.000 locais-alvo distintos usando (i) pelo menos
1.000 pares de iniciadores diferentes, ou (ii) pelo menos 1.000 iniciadores alvo- específicos e um iniciador universal ou etiqueta-específico, em um volume de reação único para produzir produtos amplificados compreendendo amplicons- alvo; e b) sequenciar os produtos amplificados. Em algumas modalidades, o método não compreende usar um microarranjo.
[0070] Em algumas modalidades, o método também inclui a obtenção de dados genotípicos de um ou ambos dentre o doador de transplante e o receptor de transplante. Em algumas modalidades, a obtenção de dados genotípicos de um ou ambos dentre o doador de transplante e o receptor de transplante inclui a preparação do DNA do doador e do receptor, em que a preparação compreende preferencialmente o enriquecimento do DNA na pluralidade de locais polimórficos para dar o DNA preparado, opcionalmente a amplificação do DNA preparado e a medição do DNA na amostra preparada na pluralidade de locais polimórficos.
[0071] Em algumas modalidades, a construção de um modelo de distribuição conjunta para as probabilidades de contagem de alelos esperadas da pluralidade de locais polimórficos no cromossomo é feita usando os dados genéticos obtidos de um ou ambos dentre o doador de transplante e o receptor de transplante. Em algumas modalidades, a primeira amostra foi isolada do plasma do receptor de transplante e em que a obtenção de dados genotípicos do receptor de transplante é feita estimando os dados genotípicos do receptor a partir das medições de DNA feitas na amostra preparada.
[0072] Em algumas modalidades, o enriquecimento preferencial resulta em grau médio de polarização alélica entre a amostra preparada e a primeira amostra de um fator selecionado do grupo que consiste em não mais do que um fator de 2, não mais do que um fator de 1,5, não mais do que um fator de 1,2, não mais do que um fator de 1,1, não mais do que um fator de 1,05, não mais do que um fator de 1,02, não mais do que um fator de 1,01, não mais do que um fator de 1,005, não mais do que um fator de 1,002, não mais do que um fator de 1,001 e não mais do que um fator de 1,0001. Em algumas modalidades, a pluralidade de locais polimórficos consiste em SNPs. Em algumas modalidades, a medição do DNA na amostra preparada é feita por sequenciamento.
[0073] Em algumas modalidades, uma caixa de diagnóstico é divulgada para ajudar a determinar o estado do transplante em um receptor de transplante, em que a caixa de diagnóstico é capaz de executar as etapas de preparação e medição dos métodos divulgados.
[0074] Em algumas modalidades, as contagens de alelos são probabilísticas em vez de binárias. Em algumas modalidades, as medições do DNA na amostra preparada na pluralidade de locais polimórficos também são usadas para determinar se o transplante herdou ou não um ou uma pluralidade de haplótipos ligados.
[0075] Em algumas modalidades, a construção de um modelo de distribuição conjunta para probabilidades de contagem de alelos é feita usando dados sobre a probabilidade de cruzamento de cromossomos em diferentes locais em um cromossomo para modelar a dependência entre alelos polimórficos no cromossomo. Em algumas modalidades, a construção de um modelo de distribuição conjunta para contagens de alelos e a etapa de determinação da probabilidade relativa de cada hipótese são feitas usando um método que não requer o uso de um cromossomo de referência.
[0076] Em algumas modalidades, a determinação da probabilidade relativa de cada hipótese faz uso de uma fração estimada de DNA livre de células derivado de doador (dd-cfDNA) na amostra preparada. Em algumas modalidades, as medições de DNA da amostra preparada usadas no cálculo das probabilidades de contagem de alelos e na determinação da probabilidade relativa de cada hipótese compreendem dados genéticos primários. Em algumas modalidades, a seleção do estado do transplante correspondente à hipótese com a maior probabilidade é realizada usando estimativas de máxima verossimilhança ou estimativas máximas a posteriori.
[0077] Em algumas modalidades, chamar o estado do transplante também inclui combinar as probabilidades relativas de cada uma das hipóteses de estado determinadas usando o modelo de distribuição conjunta e as probabilidades de contagem de alelos com probabilidades relativas de cada uma das hipóteses de estado que são calculadas usando técnicas de estatística retiradas de um grupo consistindo em uma análise de contagem de leitura, comparando taxas de heterozigosidade, uma estatística que está disponível apenas quando as informações genéticas parentais são usadas, a probabilidade de sinais de genótipo normalizados para determinados contextos de doador/receptor, uma estatística que é calculada usando uma fração estimada de transplante da primeira amostra ou da amostra preparada,
e suas combinações.
[0078] Em algumas modalidades, uma estimativa de confiança é calculada para o estado de transplante chamado. Em algumas modalidades, o método também inclui realizar uma ação clínica com base no estado de transplante chamado.
[0079] Em algumas modalidades, um relatório exibindo um determinado estado de transplante é gerado usando o método. Em algumas modalidades, um kit é divulgado para determinar um estado de transplante projetado para ser usado com os métodos aqui divulgados, em que o kit inclui uma pluralidade de iniciadores diretos interiores e, opcionalmente, a pluralidade de iniciadores reversos interiores, em que cada um dos iniciadores é projetado para hibridizar à região do DNA imediatamente a montante e/ou a jusante de um dos sítios polimórficos no cromossomo-alvo e, opcionalmente, cromossomos adicionais, em que a região de hibridização é separada do sítio polimórfico por um pequeno número de bases, em que o pequeno número é selecionado do grupo que consiste em 1, 2, 3, 4, 5, 6 a 10, 11 a 15, 16 a 20, 21 a 25, 26 a 30, 31 a 60, e suas combinações.
[0080] Em algumas modalidades, os métodos aqui divulgados compreendem uma etapa de seleção para selecionar cfDNA mais curto.
[0081] Em algumas modalidades, os métodos aqui divulgados compreendem uma etapa de aplicação universal para enriquecer cfDNA.
[0082] Em algumas modalidades, a determinação da quantidade de dd-cfDNA acima de um limite de corte é indicativa de rejeição aguda ao transplante. O aprendizado de máquina pode ser usado para resolver entre rejeição versus não rejeição.
[0083] Em algumas modalidades, o valor limite de corte é expresso como porcentagem de dd-cfDNA (% de dd-cfDNA) na amostra de sangue.
[0084] Em algumas modalidades, o valor limite de corte é expresso como número de cópias de dd-cfDNA por unidade de volume da amostra de sangue.
[0085] Em algumas modalidades, o valor limite de corte é expresso como o número de cópias de dd-cfDNA por unidade de volume da amostra de sangue multiplicado pela massa corporal ou volume de sangue do receptor de transplante.
[0086] Em algumas modalidades, o valor limite de corte leva em consideração a massa corporal ou volume de sangue do paciente.
[0087] Em algumas modalidades, o valor limite de corte leva em consideração um ou mais dos seguintes: cópias do genoma do doador por volume de plasma, rendimento de DNA livre de células por volume de plasma, altura do doador, peso do doador, idade do doador, gênero do doador, etnia do doador, massa de órgão do doador, órgão do doador, doador vivo versus falecido, doador relacionado versus não relacionado, altura do receptor, peso do receptor, idade do receptor, gênero do receptor, etnia do receptor, creatinina, eGFR (taxa de filtração glomerular estimada), metilação de cfDNA, DSA (anticorpos doador-específicos), KDPI (índice de perfil do doador renal), medicamentos (imunossupressão, esteroides, anticoagulantes, etc.), infecções (BKV, EBV, CMV, UTI), incompatibilidades de epítopo ou alelos HLA do receptor e/ou doador, classificação de Banff de patologia do aloenxerto renal e causa versus vigilância ou biópsia de protocolo.
[0088] Em algumas modalidades, o valor limite de corte é escalonado de acordo com a quantidade de cfDNA total na amostra de sangue.
[0089] Em algumas modalidades, o método tem uma sensibilidade de pelo menos 80% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue e um intervalo de confiança de 95%.
[0090] Em algumas modalidades, o método tem uma especificidade de pelo menos 70% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue e um intervalo de confiança de 95%.
[0091] Em algumas modalidades, o método tem uma sensibilidade de pelo menos 80% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue e um intervalo de confiança de 95%. Em algumas modalidades, o método tem uma sensibilidade de pelo menos 85% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue um intervalo de confiança de 95%. Em algumas modalidades, o método tem uma sensibilidade de pelo menos 90% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue e um intervalo de confiança de 95%. Em algumas modalidades, o método tem uma sensibilidade de pelo menos 95% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue e um intervalo de confiança de 95%.
[0092] Em algumas modalidades, o método tem uma especificidade de pelo menos 70% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue e um intervalo de confiança de 95%. Em algumas modalidades, o método tem uma especificidade de pelo menos 75% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue e um intervalo de confiança de 95%. Em algumas modalidades, o método tem uma especificidade de pelo menos 85% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue e um intervalo de confiança de 95%. Em algumas modalidades, o método tem uma especificidade de pelo menos 90% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue e um intervalo de confiança de 95%. Em algumas modalidades, o método tem uma especificidade de pelo menos 95% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue e um intervalo de confiança de 95%.
BREVE DESCRIÇÃO DOS DESENHOS
[0093] As modalidades aqui divulgadas serão, ainda, explicadas com referência aos desenhos anexos, em que estruturas semelhantes são referidas por números semelhantes ao longo das várias vistas. Os desenhos mostrados não são necessariamente proporcionais às dimensões reais, enfatizando, em vez disso, a ilustração dos princípios das modalidades aqui divulgadas.
[0094] A Figura 1 exemplifica como o DNA liberado de rins transplantados para a corrente sanguínea é elevado na rejeição aguda do enxerto.
[0095] A Figura 2 exemplifica a alta capacidade que o dd-cfDNA demonstra para a detecção de rejeição ao transplante renal. Usando um limite de 1% de dd-cfDNA, uma sensibilidade de 92,3%, uma especificidade de 72,9% e uma AUC de 0,9 são alcançadas.
[0096] A Figura 3 exemplifica a % de dd-cfDNA entre receptores de transplante de rim que estavam estáveis, sofrendo rejeição aguda, passando por rejeição limítrofe ou experimentando outra lesão de transplante.
[0097] A Figura 4 exemplifica a capacidade dos métodos divulgados para detectar rejeições de transplante limítrofes ou agudas, em que os transplantes estão sofrendo rejeição mediada por anticorpos (ABMR) ou rejeição mediada por células T (TCMR).
[0098] A Figura 5 exemplifica a relevância clínica da detecção de dd-cfDNA, conforme divulgado neste documento, para a detecção de rejeição ao transplante imediatamente após a cirurgia.
[0099] A Figura 6 exemplifica o valor de medições repetidas em pacientes receptores de transplante individuais após cirurgia de transplante.
[0100] A Figura 7 exemplifica a capacidade discriminatória dos níveis de creatinina sérica para discriminar entre transplantes passando por rejeição aguda (AR) e aqueles que não passam por rejeição aguda (não AR).
[0101] A Figura 8 é um fluxograma que ilustra uma abordagem convencional para a chamada de mutação e uma abordagem motivo-específica para a chamada de mutação.
[0102] A Figura 9 ilustra uma ou mais implementações de modelagem de um processo de preparação de amostra.
[0103] A Figura 10 ilustra um diagrama de blocos de uma ou mais implementações de um sistema de análise de erro.
[0104] A Figura 11 ilustra uma ou mais implementações de um método para chamar uma mutação usando um modelo de erro motivo-específico.
[0105] A Figura 12 ilustra uma ou mais implementações de um método para determinar uma fração de mutação.
[0106] Figura 13: Decomposição de Amostras de plasma.
[0107] Figuras 14A a 14C: Discriminação da rejeição ativa por dd-cfDNA (A) versus creatinina (B) e eGFR (C). Caixas indicam a faixa interquartil (25º a 75º percentil); linhas horizontais em caixas representam medianas; os pontos indicam aberrantes > 1,5 vez o valor do quartil superior. Para o Painel C, os valores de eGFR foram calculados apenas para 200 amostras devido à disponibilidade de dados; o grupo não AR para análise de eGFR incluiu 79 limítrofes, 65 outras lesões e 7 amostras estáveis. P- valores para dd-cfDNA ajustados usando teste de soma de postos de Kruskal-Wallis seguido de testes de comparação múltipla de Dunn com correção de Holm; valores de P para creatinina e eGFR ajustados pelo teste de Tukey.
[0108] Figuras 15A a 15C: Estatísticas preditivas para rejeição aguda versus não rejeição aguda.
[0109] Figura 16: Estatísticas preditivas para rejeição aguda versus estável. As caixas indicam a faixa interquartil, as linhas horizontais representam as medianas.
[0110] Figura 17: dd-cfDNA como uma função de rejeição mediada por anticorpos versus mediada por células T. Caixas indicam faixa interquartil (25º a 75º percentil); linhas horizontais em caixas representam medianas; pontos indicam todos os pontos de dados individuais. Valores de P para dd-cfDNA ajustados usando teste de soma de postos de Kruskal-Wallis seguido por testes de comparação múltipla de Dunn com correção de Holm. ABMR, rejeição mediada por anticorpos; b, limítrofe; TCMR, rejeição mediada por células T.
[0111] Figuras 18A a 18F: Modelagem de dd-cfDNA como uma função de pontuações de Banff. Seis (de 15) características histológicas com diferenças significativas no nível de dd-cfDNA por pontuações de Banff são mostradas aqui (P<0,01 para todas). Caixas indicam faixa interquartil (25º a 75º percentil); linhas horizontais em caixas representam medianas; os pontos indicam todos os pontos de dados individuais por estado de rejeição. Valores de P para dd-cfDNA ajustados usando teste de soma de postos de Kruskal-Wallis seguido por testes de comparação múltipla de Dunn com correção de Holm.
[0112] Figura 19: Relação entre dd-cfDNA e tipo de doador. Não foi observada diferença significativa por tipo de doador (P > 0,46). Valores de P para dd-cfDNA ajustados usando teste de soma de postos de Kruskal-Wallis seguido por testes de comparação múltipla de Dunn com correção de Holm.
[0113] Figuras 20A a 20B: Variabilidade no dd-cfDNA ao longo do tempo. (A) Variabilidade interpaciente (60 amostras de 60 pacientes ao longo do tempo). (B) Variabilidade intrapaciente (amostras dos mesmos 10 pacientes ao longo do tempo)
[0114] Figuras 21A a 21D: níveis de dd-cfDNA ao longo do tempo em pacientes com rejeição aguda.
[0115] Figura 22: Fluxograma do projeto experimental
[0116] Figuras 23A a 23D: Histogramas de frações de doador medidas. A Figura 23A mostra frações de doador medidas para amostras relacionadas do Lote 1. A Figura 23B mostra frações de doador medidas para amostras não relacionadas do Lote 1. A Figura 23C mostra frações de doador medidas para amostras relacionadas do Lote 2. A Figura 23D mostra frações de doador medidas para amostras não relacionadas do Lote 2.
[0117] Figuras 24A a 24B: Gráficos que mostram os valores percentuais de CV medidos como uma função da média empírica percentual correspondente para amostras relacionadas (A) e amostras não relacionadas (B).
[0118] Figuras 25A a 25C: Gráficos que mostram as frações de doador medidas com uma função dos níveis de pico tentados correspondentes, juntamente com o ajuste linear calculado para casos relacionados apenas (A), para casos não relacionados apenas (B), para casos relacionados e não relacionados juntos (C).
[0119] Figuras 26A a 26C: Gráficos que mostram as frações de doador medidas como uma função dos níveis de pico tentados correspondentes na escala log-log para casos relacionados apenas (A), para casos não relacionados apenas (B), para casos relacionados e não relacionados juntos (C).
[0120] Figuras 27A a 27C: Gráficos que mostram as frações de doador medidas como uma função dos valores de ddPCR correspondentes, juntamente com o ajuste linear calculado para casos relacionados apenas (A), casos não relacionados apenas (B), casos relacionados e não relacionados juntos (C).
[0121] Figuras 28A a 28B: Gráficos que mostram as frações de doador medidas do Lote 2 como uma função dos valores do Lote 1 na escala linear, junto com o ajuste linear calculado (A) e na escala log-log (B).
[0122] Figuras 29A a 29D: Gráficos que mostram histogramas de frações de doador medidas para: gDNA relacionado (A), gDNA não relacionado (B), cfDNA relacionado (C) e amostras de cfDNA não relacionado (D).
[0123] Figuras 30A a 30D: Gráficos que mostram histogramas de frações de doador centralizadas e medidas para: amostras relacionadas do Lote 1 (A), amostras relacionadas do Lote 2 (B), amostras não relacionadas do Lote 1 (C) e amostras não relacionadas do Lote 2 (D).
[0124] Figuras 31A a 31B: Gráficos que representam os desvios padrão empíricos como uma função da média empírica correspondente para: amostras relacionadas do Lote 1 e Lote 2 (A), amostras não relacionadas do Lote 1 e Lote 2 (B).
[0125] Figuras 32A a 32B: Gráficos que representam os valores percentuais de CV medidos como uma função da média empírica percentual correspondente, particularizados com relação à quantidade de entrada, para amostras de gDNA: de amostras relacionadas (A) e de amostras não relacionadas (B).
[0126] Figuras 33A a 33B: Gráficos que representam os valores percentuais de CV medidos como uma função da média empírica percentual correspondente para amostras de cfDNA: de amostras relacionadas (A) e de amostras não relacionadas (B).
[0127] Figuras 34A a 34C: Gráficos que representam as frações de doador medidas como uma função dos valores da fração do doador correspondentes medidos usando HNR, juntamente com o ajuste linear calculado apenas para casos relacionados (A), apenas para casos não relacionados (B) e tanto casos relacionados quanto não relacionados (C).
[0128] Figuras 35A a 35C: Gráficos que representam as frações de doador medidas como uma função dos níveis de pico tentados correspondentes, juntamente com o ajuste linear calculado, para amostras de gDNA de casos relacionados apenas (A), de casos não relacionados apenas (B) e casos relacionados e não relacionados juntos (C).
[0129] Figuras 36A a 36C: Gráficos que representam as frações de doador medidas como uma função dos níveis de pico tentados correspondentes na escala log-log para amostras de gDNA: apenas de casos relacionados (A), apenas de casos não relacionados (B) e casos relacionados e não relacionados juntos (C).
[0130] Figuras 37A a 37C: Gráficos que representam as frações de doador medidas como uma função dos níveis de pico tentados correspondentes, juntamente com o ajuste linear calculado, para amostras de cfDNA apenas de casos relacionados (A), apenas de casos não relacionados (B) e de casos relacionados e não relacionados juntos (C)
[0131] Figuras 38A a 38C: Gráficos que representam as frações de doador medidas como uma função dos níveis de pico tentados correspondentes na escala log-log para amostras de cfDNA: apenas de casos relacionados (A), apenas de casos não relacionados (B) e casos relacionados e não relacionados juntos (C).
[0132] Figuras 39A a 39B: Gráficos mostrando histogramas de frações de doador medidas para (A) nível de pico de 0,6% e (B) nível de pico de 2,4%.
[0133] Figuras 40A a 40B: Avaliação da precisão de KidneyScan (A) e ensaio de Grskovic et al (B).
[0134] Figura 41: Discriminação da rejeição ativa por dd-cfDNA em amostras compatíveis com biópsia (dados estratificados por tipo de biópsia). As caixas indicam a faixa interquartil, as linhas horizontais representam as medianas.
[0135] Figura 42: Discriminação da rejeição ativa por dd-cfDNA (A) versus eGFR (B). Caixas indicam faixa interquartil (25º a 75º percentil); linhas horizontais em caixas representam medianas; os pontos indicam aberrantes > 1,5 vez o valor do quartil superior. Os valores de P para dd-cfDNA e eGFR usando o teste de soma de postos de Kruskal-Wallis indicam uma diferença significativa entre as medianas dos grupos de AR e de não rejeição para ambos os marcadores
[0136] Figura 43: dd-cfDNA como uma função de rejeição mediada por anticorpos versus mediada por células T. Caixas indicam faixa interquartil (25º a 75º percentil); linhas horizontais em caixas representam medianas; pontos indicam todos os pontos de dados individuais. Valores de P para dd-cfDNA ajustados usando teste de soma de postos de Kruskal-Wallis a seguido por testes de comparação múltipla de Dunn com correção de Holm. b Amostras atribuídas a ABMR e bTCMR. As amostras atribuídas a ABMR e
TCMR. c Amostras atribuídas a TCMR e bABMR. ABMR, rejeição mediada por anticorpos; b, limítrofe; TCMR, rejeição mediada por células T.
[0137] Figura 44: Relação entre dd-cfDNA e tipo de doador. Não foi observada diferença significativa por tipo de doador (P > 0,46). Valores de P para dd-cfDNA ajustados usando teste de soma de postos de Kruskal-Wallis seguido por testes de comparação múltipla de Dunn com correção de Holm.
[0138] Figura 45: Distribuições cumulativas de frequência de alelo menor de SNP de acordo com a etnia.
[0139] Figura 46: Razões de alelos para SNPs nos cromossomos 13, 18, 21 para amostra com fração de doador de 9%. Os SNPs entre as linhas horizontais pretas são removidos do cálculo.
[0140] Figura 47: Razões de alelos para SNPs nos cromossomos 13, 18, 21 para amostra com fração de doador de 0,4%.
[0141] Figura 48: Desempenho de usar cópias de doador/ml e cópias de doador/ml * kg como a métrica com limite fixo. As setas pretas mostram a rejeição ativa e as rejeições mediadas por células T do protocolo perdidas usando % de dd-cfDNA como a métrica de limite.
[0142] Figura 49: Gráfico representando % de dd- cfDNA (painel superior), cópias do doador/ml (painel do meio) e cópias do doador/ml * kg (painel inferior) dos dados do paciente como uma função de ng cfDNA/ml de plasma.
[0143] Figura 50: Estratificação de amostras por quantidades de cfDNA ng/ml. À medida que o cfDNA ng/ml aumenta, a sensibilidade e a especificidade aumentam para cópias do doador/ml e cópias do doador/ml * kg como a métrica.
[0144] Figura 51: Distribuição de amostras de rejeição ativa (AR) e não rejeição (NON_AR) em através de estratificação de quartil (painel superior) e octil (painel inferior) de amostras por quantidades de cfDNA ng/ml.
[0145] Figura 52: Estratificação de amostras por quantidades de cfDNA ng/ml e, ainda, categorizadas com base na determinação de rejeição mediada por anticorpos (ABMR) ou rejeição mediada por células T (TCMR). Os painéis mostram a determinação de ABMR ou TCMR com base em métricas de limite de % de dd-cfDNA, cópias do doador/ml ou cópias do doador/ml * kg, conforme indicado no painel da Figura.
[0146] Embora os desenhos acima identificados apresentem modalidades aqui divulgadas, outras modalidades também são contempladas, conforme observado na discussão. Esta divulgação apresenta modalidades ilustrativas a título de representação e não de limitação. Inúmeras outras modificações e modalidades podem ser concebidas, por aqueles versados na técnica, abrangidas pelo escopo e pelo espírito dos princípios das modalidades aqui divulgadas.
DESCRIÇÃO DETALHADA
[0147] São divulgados aqui métodos para a detecção de DNA livre de células derivado de um doador de transplante (dd-cfDNA) em uma amostra de um receptor de transplante.
[0148] Em algumas modalidades, é divulgado aqui um método de amplificação de locais-alvo de DNA livre de células derivado de doador (dd-cfDNA) de uma amostra de sangue de um receptor de transplante, em que o método compreende: a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado tanto das células transplantadas quanto do receptor de transplante, b) enriquecer o DNA extraído em locais-alvo, em que os locais-alvo compreendem 50 a 5.000 locais-alvo compreendendo locais polimórficos e não polimórficos; e c) amplificar os locais-alvo.
[0149] Em algumas modalidades, é divulgado aqui um método de detecção de DNA livre de células derivado de doador (dd- cfDNA) em uma amostra de sangue de um receptor de transplante, em que o método compreende: a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado tanto das células transplantadas quanto do receptor de transplante, b) enriquecer o DNA extraído em locais-alvo, em que os locais-alvo compreendem 50 a 5.000 locais-alvo compreendendo locais polimórficos e não polimórficos; c) amplificar os locais-alvo; d) contatar os locais-alvo amplificados com sondas que hibridizam especificamente aos locais-alvo; e e) detectar a ligação dos locais- alvo com as sondas, detectando, assim, dd-cfDNA na amostra de sangue. Em algumas modalidades, as sondas são marcadas com um marcador detectável.
[0150] Em algumas modalidades, é divulgado aqui um método para determinar a probabilidade de rejeição ao transplante dentro de um receptor de transplante, em que o método compreende: a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado tanto das células transplantadas quanto do receptor de transplante, b) enriquecer o DNA extraído em locais-alvo, em que os locais-alvo compreendem 50 a 5.000 locais-alvo compreendendo locais polimórficos e não polimórficos; c) amplificar os locais-alvo; e d) medir uma quantidade de DNA de transplante e uma quantidade de DNA de receptor na amostra de sangue de receptor; em que uma quantidade maior de dd-cfDNA indica uma maior probabilidade de rejeição ao transplante.
[0151] Em algumas modalidades, é divulgado aqui um método para diagnosticar um transplante dentro de um receptor de transplante como sofrendo rejeição aguda, em que o método compreende: a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado tanto das células transplantadas quanto do receptor de transplante, b) enriquecer o DNA extraído em locais- alvo, em que os locais-alvo compreendem 50 a 5.000 locais-alvo compreendendo locais polimórficos e não polimórficos; c) amplificar os locais- alvo; e d) medir uma quantidade de DNA de transplante e uma quantidade de DNA de receptor na amostra de sangue de receptor; em que uma quantidade de dd-cfDNA superior a 1% indica que o transplante está passando por rejeição aguda.
[0152] Em uma modalidade, um método divulgado neste documento usa técnicas de enriquecimento seletivo que preservam as frequências de alelo relativas que estão presentes na amostra original de DNA em cada local polimórfico de um conjunto de locais polimórficos. Em algumas modalidades, a técnica de amplificação e/ou de enriquecimento seletivo pode envolver PCR, como PCR mediada por ligação, captura de fragmento por hibridização, SONDAS DE INVERSÃO MOLECULAR ou outras sondas de circularização. Em algumas modalidades, os métodos para amplificação ou enriquecimento seletivo podem envolver o uso de sondas em que, após a hibridização correta à sequência-alvo, a extremidade de 3-prime ou 5-prime de uma sonda de nucleotídeo é separada do sítio polimórfico do alelo por um pequeno número de nucleotídeos. Esta separação reduz a amplificação preferencial de um alelo, denominada polarização de alelo. Este é um aprimoramento em relação aos métodos que envolvem o uso de sondas em que a extremidade de 3-prime ou 5-prime de uma sonda hibridizada corretamente são diretamente adjacentes ou muito próximas ao sítio polimórfico de um alelo. Em uma modalidade, as sondas nas quais a região de hibridização pode conter ou certamente contém um local polimórfico são excluídas. Sítios polimórficos no local de hibridização podem causar hibridização desigual ou inibir totalmente a hibridização em alguns alelos, resultando na amplificação preferencial de certos alelos. Estas modalidades são melhorias em relação a outros métodos que envolvem amplificação alvejada e/ou enriquecimento seletivo na medida em que preservam melhor as frequências de alelos originais da amostra em cada local polimórfico, seja a amostra uma amostra genômica pura de um único indivíduo ou uma mistura de indivíduos.
[0153] Após a coleta de sangue e antes da extração de DNA, as células sanguíneas em uma amostra de sangue podem estourar e liberar longos fragmentos de DNA na amostra, o que aumentaria a quantidade total de DNA livre de células (cfDNA) e ruído de fundo, distorcendo a % de thd de dd-cfDNA detectada. A fim de reduzir esse ruído de fundo, e com base na observação de que o dd-cfDNA é normalmente mais curto do que o DNA fragmentado de uma célula sanguínea do receptor de transplante, dois enriquecimentos específicos para dd-cfDNA são contemplados. Em uma modalidade, uma seleção de tamanho é aplicada para selecionar cfDNA mais curto. Em outra modalidade, uma etapa de amplificação universal é aplicada para reduzir o ruído (por exemplo, antes de aplicar PCR multiplex), com base na hipótese de que dd-cfDNA mais curto (muitas vezes na forma de mononucleossomo) é amplificado de forma mais eficiente do que DNA derivado de receptor de transplante mais longo
[0154] Em uma modalidade, um método divulgado neste documento usa PCR alvejada altamente multiplexada altamente eficiente para amplificar DNA seguido por sequenciamento de alto rendimento para determinar as frequências de alelo em cada local-alvo. A capacidade de multiplexar mais de cerca de 50 ou 100 iniciadores de PCR em uma reação de uma forma que a maior parte das leituras de sequência resultante mapeie para locais alvejados é inovadora e não óbvia. Uma técnica que permite que a PCR alvejada altamente multiplexada atue de uma maneira altamente eficiente envolve a concepção de iniciadores que dificilmente hibridizam entre si. As sondas de PCR, normalmente referidas como iniciadores, são selecionadas criando um modelo termodinâmico de interações potencialmente adversas entre pelo menos 500, pelo menos 1.000, pelo menos 5.000, pelo menos
10.000, pelo menos 20.000, pelo menos 50.000 ou pelo menos 100.000 pares de iniciadores em potencial ou interações não intencionais entre os iniciadores e o DNA da amostra e, em seguida, usar o modelo para eliminar projetos que são incompatíveis com outros projetos no pool. Outra técnica que permite que a PCR alvejada altamente multiplexada seja executada de maneira altamente eficiente é o uso de uma abordagem de aninhamento parcial ou total para a PCR alvejada. O uso de uma ou uma combinação dessas abordagens permite a multiplexação de pelo menos 300, pelo menos 800, pelo menos 1.200, pelo menos 4.000 ou pelo menos 10.000 iniciadores em um único pool com o DNA amplificado resultante compreendendo uma maioria das moléculas de DNA que, quando sequenciadas, mapearão para locais alvejados. O uso de uma ou uma combinação dessas abordagens permite a multiplexação de um grande número de iniciadores em um único pool com o DNA amplificado resultante compreendendo mais de 50%, mais de 80%, mais de 90%, mais de 95%, mais de 98% ou mais de 99% de moléculas de DNA que mapeiam para locais alvejados.
[0155] Em uma modalidade, um método divulgado neste documento produz uma medida quantitativa do número de observações independentes de cada alelo em um local polimórfico. Isso é diferente da maioria dos métodos, como microarranjos ou PCR qualitativa, que fornecem informações sobre a razão de dois alelos, mas não quantificam o número de observações independentes de qualquer um dos alelos. Com métodos que fornecem informações quantitativas sobre o número de observações independentes, apenas a razão é utilizada nas determinações relevantes, enquanto as informações quantitativas por si só não são úteis. Para ilustrar a importância de reter informações sobre o número de observações independentes, considera-se o local da amostra com dois alelos, A e B. Em um primeiro experimento vinte alelos A e vinte alelos B são observados, em um segundo experimento 200 alelos A e 200 alelos B são observados. Em ambos os experimentos a razão (A/(A+B)) é igual a 0,5, porém o segundo experimento transmite mais informações do que o primeiro sobre a certeza da frequência do alelo A ou B. Alguns métodos conhecidos na técnica anterior envolvem a média ou soma de razões de alelos (razões de canal) (isto é, x i/yi) de alelos individuais e analisa essa razão, seja comparando a mesma a um cromossomo de referência ou usando uma regra referente a como se espera que essa razão se comporte em situações particulares. Nenhuma ponderação de alelo está implícita em tais métodos conhecidos na técnica, em que se presume que se pode assegurar aproximadamente a mesma quantidade de produto de PCR para cada alelo e que todos os alelos devem se comportar da mesma maneira. Tal método tem uma série de desvantagens e, mais importante, impede o uso de uma série de melhorias que são descritas em outra parte desta divulgação.
[0156] O uso de um modelo de distribuição conjunta é diferente e uma melhoria significativa em relação aos métodos que determinam as taxas de heterozigosidade, tratando locais polimórficos de forma independente, em que as determinações resultantes são de precisão significativamente maior. Sem ser limitado por nenhuma teoria em particular, acredita-se que uma razão pela qual eles são de maior precisão é que o modelo de distribuição conjunta leva em consideração a ligação entre SNPs. O objetivo de usar o conceito de ligação ao criar a distribuição esperada de medições de alelos para uma ou mais hipóteses é que ele permite a criação de distribuições de medições de alelos esperadas que correspondem à realidade consideravelmente melhor do que quando a ligação não é usada.
[0157] Uma razão pela qual se acredita que as determinações de ploidia que usam um método que compreende a comparação das medições de alelos observadas com hipóteses teóricas correspondentes a possíveis estados de transplante são de maior precisão é que quando o sequenciamento é usado para medir os alelos, este método pode obter mais informações a partir de dados de alelos em que o número total de leituras é baixo do que outros métodos; por exemplo, um método que depende do cálculo e da agregação de proporções de alelos produziria ruído estocástico desproporcionalmente ponderado. Por exemplo, imagina-se um caso que envolvesse medir os alelos usando sequenciamento e em que houvesse um conjunto de locais em que apenas cinco leituras de sequência foram detectadas para cada local. Em uma modalidade, para cada um dos alelos, os dados podem ser comparados com a distribuição de alelos hipotética e ponderados de acordo com o número de leituras de sequência; portanto, os dados dessas medições seriam ponderados apropriadamente e incorporados na determinação geral. Isso está em contraste com um método que envolveu a quantificação de uma razão de alelos em um local heterozigótico, já que este método só poderia calcular razões de 0%, 20%, 40%, 60%, 80% ou 100% como as possíveis razões de alelos; nenhum deles pode estar próximo das razões alélicas esperadas. Neste último caso, as razões de alelos calculadas teriam que ser descartadas devido a leituras insuficientes ou teriam uma ponderação desproporcional e introduziriam ruído estocástico na determinação, diminuindo assim a precisão da determinação. Em uma modalidade, as medições de alelos individuais podem ser tratadas como medições independentes, em que a relação entre as medições feitas em alelos no mesmo local não é diferente da relação entre as medições feitas em alelos em diferentes locais.
[0158] Em uma modalidade, um método divulgado neste documento demonstra como observar as distribuições de alelos em locais polimórficos pode ser usado para determinar o estado de um transplante com maior precisão do que os métodos da técnica anterior. Em uma modalidade, o método observa as informações quantitativas do alelo obtidas na mistura doador/receptor de transplante e avalia qual hipótese se ajusta melhor aos dados, em que o estado do transplante correspondente à hipótese com o melhor ajuste aos dados é chamado de estado correto do transplante. Em uma modalidade, um método divulgado neste documento também usa o grau de ajuste para gerar uma confiança de que o estado genético chamado é o estado de transplante correto. Em uma modalidade, um método divulgado neste documento envolve o uso de algoritmos que analisam a distribuição de alelos encontrados para locais que têm contextos diferentes e a comparação das distribuições de alelos observadas com as distribuições de alelos esperadas para diferentes estados de transplante para os diferentes contextos genotípicos. Isso é diferente e uma melhoria em relação aos métodos que não usam métodos que permitem a estimativa do número de ocorrências independentes de cada alelo em cada local em uma amostra mista.
[0159] Em uma modalidade, um método divulgado neste documento usa um modelo de distribuição conjunta que presume que as frequências de alelos em cada local são multinomiais (e, portanto, binomiais quando SNPs são bialélicos) na natureza.
Em algumas modalidades, o modelo de distribuição conjunta usa distribuições beta-binomiais.
Quando o uso de uma técnica de medição, como o sequenciamento, fornece uma medida quantitativa para cada alelo presente em cada local, o modelo binomial pode ser aplicado a cada local e o grau subjacente às frequências dos alelos e a confiança nessa frequência podem ser verificados.
Com métodos conhecidos na técnica que geram chamadas de estado de transplante a partir de razões de alelos, ou métodos nos quais as informações quantitativas de alelos são descartadas, a certeza na razão observada não pode ser determinada.
O presente método é diferente e uma melhoria em relação aos métodos que calculam razões de alelos e agregam essas razões para fazer uma chamada de estado de transplante, uma vez que qualquer método que envolve calcular uma razão de alelos em um local particular e, em seguida, agregar essas razões, necessariamente presume que as intensidades medidas ou contagens que são indicativas da quantidade de DNA de qualquer alelo ou local dado serão distribuídas de uma forma gaussiana.
O método divulgado neste documento não envolve o cálculo de razões de alelos.
Em algumas modalidades, um método divulgado neste documento pode envolver a incorporação do número de observações de cada alelo em uma pluralidade de locais em um modelo.
Em algumas modalidades, um método divulgado neste documento pode envolver o cálculo das próprias distribuições esperadas, permitindo o uso de um modelo de distribuição binomial conjunta que pode ser mais preciso do que qualquer modelo que presume uma distribuição gaussiana de medições de alelos.
A probabilidade de que o modelo de distribuição binomial seja significativamente mais preciso do que a distribuição gaussiana aumenta à medida que o número de locais aumenta.
Por exemplo, quando menos de 20 locais são interrogados, a probabilidade de que o modelo de distribuição binomial seja significativamente melhor é baixa. No entanto, quando mais de 100, ou especialmente mais de 400, ou especialmente mais de
1.000, ou especialmente mais de 2.000 locais são usados, o modelo de distribuição binomial terá uma probabilidade muito alta de ser significativamente mais preciso do que o modelo de distribuição gaussiana, portanto resultando em uma determinação mais precisa do estado do transplante. A probabilidade de que o modelo de distribuição binomial seja significativamente mais preciso do que a distribuição gaussiana também aumenta à medida que o número de observações em cada local aumenta. Por exemplo, quando menos de 10 sequências distintas são observadas em cada local, a probabilidade de que o modelo de distribuição binomial seja significativamente melhor é baixa. No entanto, quando mais de 50 leituras de sequência, ou especialmente mais de 100 leituras de sequência, ou especialmente mais de 200 leituras de sequência, ou especialmente mais de 300 leituras de sequência são usadas para cada local, o modelo de distribuição binomial terá uma probabilidade muito alta de ser significativamente mais preciso do que o modelo de distribuição gaussiana, resultando assim em uma determinação de ploidia mais precisa.
[0160] Em uma modalidade, um método aqui divulgado usa sequenciamento para medir o número de ocorrências de cada alelo em cada local em uma amostra de DNA. Cada leitura de sequenciamento pode ser mapeada para um local específico e tratada como uma leitura de sequência binária; alternativamente, a probabilidade da identidade da leitura e/ou do mapeamento pode ser incorporada como parte da leitura de sequência, resultando em uma leitura de sequência probabilística, isto é, o provável número inteiro ou fracionário de leituras de sequência que mapeiam para um determinado local. Usando as contagens binárias ou probabilidade de contagens é possível usar uma distribuição binomial para cada conjunto de medições, permitindo que um intervalo de confiança seja calculado em torno do número de contagens. Essa capacidade de usar a distribuição binomial permite que estimativas de ploidia mais precisas e intervalos de confiança mais precisos sejam calculados. Isso é diferente de e uma melhoria em relação a métodos que usam intensidades para medir a quantidade de um alelo presente, por exemplo, métodos que usam microarranjos ou métodos que fazem medições usando leitores de fluorescência para medir a intensidade do DNA marcado com fluorescência em bandas eletroforéticas
[0161] Em uma modalidade, um método divulgado neste documento usa aspectos do presente conjunto de dados para determinar parâmetros para a distribuição de frequência de alelo estimada para tal conjunto de dados. Esta é uma melhoria em relação aos métodos que utilizam um conjunto de dados de treinamento ou conjuntos de dados anteriores para definir parâmetros para as atuais distribuições de frequência de alelos esperadas ou razões de alelos possivelmente esperadas. Isso ocorre porque existem diferentes conjuntos de condições envolvidas na coleta e medição de cada amostra genética e, portanto, um método que usa dados do presente conjunto de dados para determinar os parâmetros para o modelo de distribuição conjunta que deve ser usado na determinação do estado de transplante para tal amostra tende a ser mais preciso.
[0162] Em uma modalidade, um método divulgado neste documento envolve determinar se a distribuição de medições de alelos observadas é indicativa do estado de rejeição ao transplante usando uma técnica de verossimilhança máxima. O uso de uma técnica de verossimilhança máxima é diferente e uma melhoria significativa em relação aos métodos que usam a técnica de rejeição de hipótese única em que as determinações resultantes serão feitas com uma precisão significativamente maior. Uma razão é que as técnicas de rejeição de hipótese única definem limites de corte com base em apenas uma distribuição de medição em vez de duas, o que significa que os limites geralmente não são ideais. Outra razão é que a técnica de verossimilhança máxima permite a otimização do limite de corte para cada amostra individual em vez de determinar um limite de corte a ser usado para todas as amostras, independentemente das características particulares de cada amostra individual. Outro motivo é que o uso de uma técnica de verossimilhança máxima permite o cálculo de uma confiança para cada chamada de estado de transplante. A capacidade de fazer um cálculo de confiança para cada chamada permite que o médico saiba quais chamadas são precisas e quais têm maior probabilidade de estar erradas. Em algumas modalidades, uma ampla variedade de métodos pode ser combinada com uma técnica de estimativa de verossimilhança máxima para aumentar a precisão das chamadas de estado de transplante. Em uma modalidade, a técnica de verossimilhança máxima pode ser usada em combinação com o método descrito na Patente nº U.S. 7.888.017. Em uma modalidade, a técnica de verossimilhança máxima pode ser usada em combinação com o método de uso de amplificação de PCR alvejada para amplificar o DNA na amostra mista seguida por sequenciamento e análise usando um método de contagem de leitura, tal como usado por TANDEM DIAGNOSTICS, conforme apresentado no Congresso Internacional de Genética Humana 2011, em Montreal, em outubro de 2011. Em uma modalidade, um método divulgado neste documento envolve estimar a fração de doador de DNA na amostra mista e usar essa estimativa para calcular a chamada de estado de transplante e a confiança da chamada de estado de transplante.
[0163] Em uma modalidade, um método divulgado neste documento leva em consideração a tendência de os dados serem ruidosos e conterem erros ao anexar uma probabilidade a cada medição. O uso de técnicas de máxima verossimilhança para escolher a hipótese correta do conjunto de hipóteses que foram feitas usando os dados de medição com estimativas probabilísticas anexadas torna mais provável que as medições incorretas sejam descontadas e as medições corretas sejam usadas nos cálculos que levam à chamada de estado do transplante. Para ser mais preciso, este método reduz sistematicamente a influência dos dados que são medidos incorretamente na determinação do estado do transplante. Esta é uma melhoria em relação aos métodos em que todos os dados são considerados igualmente corretos ou aos métodos em que os dados remotos são arbitrariamente excluídos dos cálculos que levam a uma chamada de estado do transplante. Os métodos existentes que usam medições de razão de canal pretendem estender o método a vários SNPs, calculando a média de razões de canal de SNP individuais. Não ponderar SNPs individuais pela variância de medição esperada com base na qualidade de SNP e profundidade de leitura observada reduz a precisão da estatística resultante, resultando em uma redução significativa da precisão da chamada do estado do transplante, especialmente em casos limítrofes.
[0164] Em uma modalidade, um método divulgado neste documento não pressupõe o conhecimento de quais SNPs ou outros locais polimórficos são heterozigóticos no transplante. Este método permite que uma chamada de ploidia seja feita nos casos em que as informações genotípicas paternas não estão disponíveis. Esta é uma melhoria em relação aos métodos em que o conhecimento de quais SNPs são heterozigóticos deve ser conhecido com antecedência, a fim de selecionar os locais de forma adequada para o alvo, ou para interpretar as medições genéticas feitas na amostra de DNA de doador/receptor.
[0165] Os métodos aqui descritos são particularmente vantajosos quando usados em amostras em que uma pequena quantidade de DNA está disponível, ou em que a porcentagem de DNA derivado de doador é baixa. Isso se deve à taxa de abandono de alelo correspondentemente mais alta que ocorre quando apenas uma pequena quantidade de DNA está disponível e/ou à taxa de abandono de alelo do doador correspondentemente mais alta quando a porcentagem de DNA do doador é baixa em uma amostra mista de DNA de doador e receptor de transplante. Uma alta taxa de abandono do alelo, o que significa que uma grande porcentagem dos alelos não foi medida para o indivíduo-alvo, resulta em cálculos de frações de doador pouco precisos e determinações de estado de transplante pouco precisas. Uma vez que os métodos divulgados neste documento podem usar um modelo de distribuição conjunta que leva em considerando a ligação nos padrões de herança entre os SNPs, podem ser feitas determinações do estado do transplante significativamente mais precisas.
[0166] Uma discussão adicional dos pontos acima pode ser encontrada em outra parte deste documento.
MONITORAMENTO DE TRANSPLANTE NÃO INVASIVO
[0167] O processo de monitoramento não invasivo do transplante envolve várias etapas. Algumas das etapas podem incluir: (1) obter o material genético do transplante; (2) enriquecer o material genético do transplante que pode estar em uma amostra mista, ex vivo; (3) amplificar o material genético, ex vivo; (4) enriquecer preferencialmente os locais específicos no material genético, ex vivo; (5) medir o material genético, ex vivo; e (6) analisar os dados genotípicos, em um computador e ex vivo. Métodos para reduzir à prática essas seis e outras etapas relevantes são descritos neste documento. Pelo menos algumas das etapas do método não são aplicadas diretamente no corpo. Em uma modalidade, a presente divulgação se refere a métodos de tratamento e diagnóstico aplicados a tecidos e outros materiais biológicos isolados e separados do corpo. Pelo menos algumas das etapas do método são executadas em um computador.
[0168] A alta precisão dos métodos divulgados neste documento é um resultado de uma abordagem de informática para a análise dos dados do genótipo, conforme descrito neste documento. Os avanços tecnológicos modernos resultaram na capacidade de medir grandes quantidades de informações genéticas de uma amostra genética usando tais métodos como sequenciamento de alto rendimento e arranjos de genotipagem. Os métodos divulgados neste documento permitem que um clínico tire maior vantagem das grandes quantidades de dados disponíveis e faça um diagnóstico mais preciso do estado de um transplante em um receptor. Os detalhes de inúmeras modalidades são fornecidos abaixo. Diferentes modalidades podem envolver diferentes combinações das etapas acima mencionadas. Várias combinações das diferentes modalidades das diferentes etapas podem ser usadas de modo intercambiável.
[0169] Em uma modalidade, uma amostra de sangue é retirada de um receptor de transplante e o DNA flutuante livre no plasma do sangue do receptor de transplante, que contém uma mistura de DNA de origem de doador de transplante e DNA de origem de receptor de transplante, é isolado e usado para determinar o estado do transplante. Em uma modalidade, um método divulgado neste documento envolve o enriquecimento preferencial dessas sequências de DNA em uma mistura de DNA que corresponde a alelos polimórficos de uma forma que as razões de alelos e/ou distribuições de alelos permaneçam principalmente consistentes após o enriquecimento. Em uma modalidade, um método divulgado neste documento envolve a amplificação com base em PCR alvejada altamente eficiente de modo que uma porcentagem muito alta das moléculas resultantes corresponda a locais-alvo. Em uma modalidade, um método divulgado neste documento envolve o sequenciamento de uma mistura de DNA que contém tanto DNA de origem de doador quanto DNA de origem de receptor. Em uma modalidade, um método divulgado neste documento envolve o uso de distribuições de alelos medidas para determinar o estado de um transplante em um receptor de transplante. Em uma modalidade, um método divulgado neste documento envolve relatar o estado de transplante determinado a um médico. Em uma modalidade, um método divulgado neste documento envolve a realização de uma ação clínica, como alterar a terapia imunossupressora no receptor de transplante.
[0170] Este pedido faz referência ao Pedido de Modelo de Utilidade nº de série U.S. 15/727.428, depositado em 6 de outubro de 2017 (Publicação nº U.S. 20180025109); Pedido de Modelo de Utilidade nº de série U.S. 11/603.406, depositado em 28 de novembro de 2006 (Publicação nº U.S. 20070184467); Pedido de Modelo de Utilidade nº de série U.S. 12/076.348, depositado em 17 de março de 2008 (Publicação nº U.S
20080243398); Pedido de Modelo de Utilidade PCT nº de série PCT/US09/52730, depositado em 4 de agosto de 2009 (Publicação PCT nº WO/2010/017214); Pedido de Modelo de Utilidade PCT nº de série PCT/US10/050824, depositado em 30 de setembro de 2010 (Publicação PCT nº WO/2011/041485) e Pedido de Modelo de Utilidade nº de série U.S. 13/110.685, depositado em 18 de maio de 2011. Parte do vocabulário utilizado neste arquivo pode ter seus antecedentes nessas referências. Alguns dos conceitos aqui descritos podem ser mais bem compreendidos à luz dos conceitos encontrados nestas referências.
TRIAGEM DE SANGUE DE RECEPTOR DE TRANSPLANTE COMPREENDENDO DNA DE DOADOR FLUTUANTE LIVRE
[0171] Em uma modalidade, o sangue pode ser coletado de um receptor de transplante. A pesquisa mostrou que o sangue do receptor de transplante pode conter uma pequena quantidade de DNA flutuante livre do derivado do transplante, além do DNA flutuante livre de origem do receptor de transplante. Existem muitos métodos conhecidos na técnica para isolar DNA livre de células ou criar frações enriquecidas em DNA livre de células. Por exemplo, foi demonstrado que a cromatografia cria certas frações que são enriquecidas em DNA livre de células.
[0172] Uma vez que a amostra de sangue, plasma ou outro fluido, coletada de uma maneira relativamente não invasiva, e que contém uma quantidade de DNA derivado de doador, seja celular ou flutuante livre, seja enriquecido em sua proporção com o DNA derivado do receptor, ou em sua proporção original, está em mãos, pode-se genotipar o DNA encontrado na referida amostra. Em algumas modalidades, o sangue pode ser coletado usando uma agulha para retirar sangue de uma veia, por exemplo, a veia basílica. O método descrito no presente documento pode ser usado para determinar dados genotípicos do transplante. Por exemplo, pode ser usado para determinar a identidade de um ou um conjunto de SNPs, incluindo inserções, deleções e translocações. Ele pode ser usado para determinar um ou mais haplótipos, incluindo o pai de origem de uma ou mais características genotípicas.
[0173] Observa-se que este método funcionará com qualquer ácido nucleico que possa ser usado para qualquer método de genotipagem e/ou sequenciamento, como a plataforma ILLUMINA INFINIUM ARRAY, AFFYMETRIX GENECHIP, ILLUMINA GENOME ANALYZER ou LIFE TECHNOLGIES 'SOLID SYSTEM. Isso inclui DNA flutuante livre extraído do plasma ou amplificações (por exemplo, amplificação do genoma completo, PCR) do mesmo; DNA genômico de outros tipos de células (por exemplo, linfócitos humanos de sangue total) ou amplificações dos mesmos. Para a preparação do DNA, qualquer método de extração ou purificação que gere DNA genômico adequado para uma dessas plataformas também funcionará. Este método pode funcionar igualmente bem com amostras de RNA. Em uma modalidade, o armazenamento das amostras pode ser feito de uma maneira que irá minimizar a degradação (por exemplo, abaixo do congelamento, a cerca de - 20 ºC ou a uma temperatura mais baixa).
DEFINIÇÕES
[0174] Polimorfismo de nucleotídeo único (SNP) se refere a um único nucleotídeo que pode diferir entre os genomas de dois membros da mesma espécie. O uso do termo não deve implicar em qualquer limite na frequência com que cada variante ocorre.
[0175] Sequência se refere a uma sequência de DNA ou uma sequência genética. Pode se referir à estrutura física primária da molécula ou fita de DNA de um indivíduo. Pode se referir à sequência de nucleotídeos encontrada naquela molécula de DNA, ou à fita complementar à molécula de DNA. Pode se referir às informações contidas na molécula de DNA como sua representação in silico.
[0176] Local se refere a uma determinada região de interesse no DNA de um indivíduo, que pode se referir a um SNP, o sítio de uma possível inserção ou deleção ou o sítio de alguma outra variação genética relevante. SNPs ligados a doenças também podem se referir a locais ligados a doenças.
[0177] Alelo polimórfico, também “local polimórfico”, se refere a um alelo ou local em que o genótipo varia entre os indivíduos de uma determinada espécie. Alguns exemplos de alelos polimórficos incluem polimorfismos de nucleotídeo único, repetições curtas em tandem, deleções, duplicações e inversões.
[0178] Sítio polimórfico se refere aos nucleotídeos específicos encontrados em uma região polimórfica que variam entre os indivíduos.
[0179] Alelo se refere aos genes que ocupam um determinado local.
[0180] Dados genéticos, também “dados genotípicos", se referem aos dados que descrevem aspectos do genoma de um ou mais indivíduos. Pode se referir a um ou um conjunto de locais, sequências parciais ou inteiras, cromossomos parciais ou inteiros ou todo o genoma. Pode se referir à identidade de um ou de uma pluralidade de nucleotídeos; pode se referir a um conjunto de nucleotídeos sequenciais, ou nucleotídeos de diferentes localizações no genoma ou uma combinação dos mesmos. Dados genotípicos são tipicamente in silico, no entanto, também é possível considerar nucleotídeos físicos em uma sequência como dados genéticos codificados quimicamente. Os dados genotípicos podem ser considerados “sobre", "de", "em", “a partir de" ou “sobre" o indivíduo (ou indivíduos). Dados genotípicos podem se referir a medições de saída de uma plataforma de genotipagem em que essas medições são feitas em material genético.
[0181] Material genético, também “amostra genética", se refere à matéria física, como tecido ou sangue, de um ou mais indivíduos compreendendo DNA ou RNA.
[0182] Dados genéticos ruidosos se referem a dados genéticos com qualquer um dos seguintes: abandonos de alelo, medições de pares de bases incertas, medições de pares de bases incorretas, medições de pares de bases ausentes, medições incertas de inserções ou deleções, medições incertas de números de cópias de segmentos de cromossomos, sinais espúrios, medições ausentes, outros erros ou combinações dos mesmos.
[0183] Confiança se refere à verossimilhança estatística de que o SNP chamado, alelo, conjunto de alelos, chamada de ploidia ou número de cópias do segmento cromossômico determinado represente corretamente o estado genético real do indivíduo.
[0184] Cromossomo pode se referir a uma única cópia do cromossomo, significando uma única molécula de DNA da qual existem 46 em uma célula somática normal; um exemplo é “o cromossomo 18 de derivação materna”. Cromossomo também pode se referir a um tipo de cromossomo, dos quais existem 23 em uma célula somática humana normal; um exemplo é “cromossomo 18”.
[0185] Identidade cromossômica pode se referir ao número do cromossomo referente, isto é, o tipo de cromossomo. Os humanos normais têm 22 tipos de cromossomos autossômicos numerados e dois tipos de cromossomos sexuais. Também pode se referir à origem parental do cromossomo. Também pode se referir a um cromossomo específico herdado dos pais. Também pode se referir a outras características de identificação de um cromossomo.
[0186] O estado do material genético, ou simplesmente "estado genético", pode se referir à identidade de um conjunto de SNPs no DNA, aos haplótipos faseados do material genético e à sequência do DNA, incluindo inserções, deleções, repetições e mutações. Também pode se referir ao estado de ploidia de um ou mais cromossomos, segmentos cromossômicos ou conjunto de segmentos cromossômicos.
[0187] Dados alélicos se referem a um conjunto de dados genotípicos relativos a um conjunto de um ou mais alelos. Pode se referir aos dados haplotípicos e faseados. Pode se referir a identidades de SNP e pode se referir aos dados de sequência do DNA, incluindo inserções, deleções, repetições e mutações. Pode incluir a origem parental de cada alelo.
[0188] Estado alélico se refere ao estado real dos genes em um conjunto de um ou mais alelos. Pode se referir ao estado real dos genes descritos pelos dados alélicos.
[0189] Razão alélica ou razão de alelos, se refere à razão entre a quantidade de cada alelo em um local que está presente em uma amostra ou em um indivíduo. Quando a amostra tiver sido medida por sequenciamento, a razão alélica pode se referir à razão de leituras de sequência que mapeiam para cada alelo no local. Quando a amostra tiver sido medida por um método de medição baseado em intensidade, a razão do alelo pode se referir à razão das quantidades de cada alelo presente naquele local conforme estimado pelo método de medição.
[0190] Contagem de alelos se refere ao número de sequências que mapeiam para um local específico e, se esse local for polimórfico, se refere ao número de sequências que mapeiam para cada um dos alelos. Se cada alelo for contado de forma binária, a contagem de alelos será um número inteiro. Se os alelos forem contados probabilisticamente, então, a contagem de alelos pode ser um número fracionário.
[0191] Probabilidade de contagem de alelos se refere ao número de sequências que são propensas a mapear para um local específico ou um conjunto de alelos em um local polimórfico, combinado com a probabilidade do mapeamento. Observa-se que as contagens de alelos são equivalentes às probabilidades de contagens de alelos em que a probabilidade do mapeamento para cada sequência contada é binária (zero ou um). Em algumas modalidades, as probabilidades de contagem de alelos podem ser binárias. Em algumas modalidades, as probabilidades de contagem de alelos podem ser definidas para serem iguais às medições de DNA.
[0192] Distribuição alélica, ou “distribuição de contagem de alelos” se refere à quantidade relativa de cada alelo que está presente para cada local em um conjunto de locais. Uma distribuição alélica pode se referir a um indivíduo, a uma amostra ou a um conjunto de medições feitas em uma amostra. No contexto de sequenciamento, a distribuição alélica se refere ao número ou número provável de leituras que mapeiam para um determinado alelo para cada alelo em um conjunto de locais polimórficos. As medições do alelo podem ser tratadas probabilisticamente, ou seja, a verossimilhança de um determinado alelo estar presente para uma dada sequência de leitura é uma fração entre 0 e 1, ou podem ser tratadas de forma binária, ou seja, qualquer leitura dada é considerada como sendo exatamente zero ou uma cópia de um alelo particular.
[0193] Padrão de distribuição alélica se refere a um conjunto de diferentes distribuições de alelos para diferentes contextos parentais. Certos padrões de distribuição alélica podem ser indicativos de certos estados de ploidia.
[0194] Polarização alélica se refere ao grau em que a razão medida de alelos em um local heterozigótico é diferente da razão que estava presente na amostra original de DNA. O grau de polarização alélica em um determinado local é igual à razão alélica observada naquele local, conforme medida, dividida pela razão de alelos na amostra de DNA original naquele local. A polarização alélica pode ser definida como maior do que um, de modo que, se o cálculo do grau de polarização alélica retornar um valor, x, que é menor que 1, então, o grau de polarização alélica pode ser reafirmado como 1/x. A polarização alélica pode ser devido à polarização de amplificação, polarização de purificação ou algum outro fenômeno que afeta alelos diferentes de forma diferente.
[0195] Iniciador, também "sonda de PCR", se refere a uma única molécula de DNA (um oligômero de DNA) ou uma coleção de moléculas de DNA (oligômeros de DNA) em que as moléculas de DNA são idênticas, ou quase, e em que o iniciador contém uma região que é projetada para hibridizar a um local polimórfico alvejado e m contém uma sequência de iniciação projetada para permitir a amplificação por PCR. Um iniciador também pode conter um código de barras molecular. Um iniciador pode conter uma região aleatória que difere para cada molécula individual.
[0196] Sonda de captura híbrida se refere a qualquer sequência de ácido nucleico, possivelmente modificada, que é gerada por vários métodos, como PCR ou síntese direta e que se destina a ser complementar a uma fita de uma sequência de DNA-alvo específica em uma amostra. As sondas de captura híbridas exógenas podem ser adicionadas a uma amostra preparada e hibridizadas por meio de um processo de hibridização de desnaturação para formar duplexes de fragmentos exógenos- endógenos. Esses duplexes podem, então, ser fisicamente separados da amostra por vários meios.
[0197] Leitura de sequência se refere a dados que representam uma sequência de bases de nucleotídeos que foram medidas usando um método de sequenciamento clonal. O sequenciamento clonal pode produzir dados de sequência representando um único, ou clones, ou grupos de uma molécula de DNA original. Uma leitura de sequência também pode ter uma pontuação de qualidade associada em cada posição de base da sequência, indicando a probabilidade de que o nucleotídeo tenha sido chamado corretamente.
[0198] Mapear uma leitura de sequência é o processo de determinar a localização de origem da leitura de sequência na sequência do genoma de um organismo específico. A localização da origem das leituras de sequência é baseada na similaridade da sequência de nucleotídeos da leitura e da sequência do genoma.
[0199] Erro de cópia compatível, também “aneuploidia cromossômica compatível” (MCA), se refere a um estado de aneuploidia em que uma célula contém dois cromossomos idênticos ou quase idênticos. Este tipo de aneuploidia pode surgir durante a formação dos gametas na meiose e pode ser referido como um erro de não disjunção meiótica. Este tipo de erro pode surgir na mitose. A trissomia de compatibilidade pode se referir ao caso em que três cópias de um determinado cromossomo estão presentes em um indivíduo e duas das cópias são idênticas.
[0200] Cromossomos homólogos se referem a cópias de cromossomos que contêm o mesmo conjunto de genes que normalmente se emparelham durante a meiose.
[0201] Cromossomos idênticos se referem a cópias de cromossomos que contêm o mesmo conjunto de genes e, para cada gene, eles têm o mesmo conjunto de alelos que são idênticos ou quase idênticos.
[0202] Abandono de alelo (ADO) se refere à situação em que pelo menos um dos pares de bases em um conjunto de pares de bases de cromossomos homólogos em um determinado alelo não é detectado.
[0203] Abandono de local (LDO) se refere à situação em que ambos os pares de bases em um conjunto de pares de bases de cromossomos homólogos em um determinado alelo não são detectados.
[0204] Homozigótico se refere a ter alelos semelhantes como locais cromossômicos correspondentes.
[0205] Heterozigótico se refere a ter alelos diferentes como locais cromossômicos correspondentes.
[0206] Taxa de heterozigosidade se refere à taxa de indivíduos na população com alelos heterozigóticos em um determinado local. A taxa de heterozigosidade também pode se referir à razão esperada ou medida de alelos, em um determinado local em um indivíduo ou em uma amostra de DNA.
[0207] Polimorfismo de nucleotídeo único altamente informativo (HISNP) se refere a um SNP em que o transplante tem um alelo que não está presente no genótipo do receptor de transplante.
[0208] Região cromossômica se refere a um segmento de um cromossomo ou um cromossomo completo.
[0209] Segmento de um cromossomo se refere a uma seção de um cromossomo que pode variar em tamanho de um par de bases a todo o cromossomo.
[0210] Cromossomo se refere a um cromossomo completo ou a um segmento ou seção de um cromossomo.
[0211] Cópias se refere ao número de cópias de um segmento cromossômico. Pode se referir a cópias idênticas ou a cópias homólogas não idênticas de um segmento de cromossomo, em que as diferentes cópias do segmento de cromossomo contêm um conjunto substancialmente semelhante de locais e em que um ou mais dentre os alelos são diferentes. Observa-se que em alguns casos de aneuploidia, como o erro de cópia de M2, é possível ter algumas cópias do dado segmento cromossômico que são idênticas, bem como algumas cópias do mesmo segmento cromossômico que não são idênticas.
[0212] Haplótipo se refere a uma combinação de alelos em vários locais que normalmente são herdados juntos no mesmo cromossomo. O haplótipo pode se referir a apenas dois locais ou a um cromossomo inteiro, dependendo do número de eventos de recombinação que ocorreram entre um determinado conjunto de locais. O haplótipo também pode se referir a um conjunto de polimorfismos de nucleotídeo único (SNPs) em um único cromatídio que estão estatisticamente associados.
[0213] Dados haplotípicos, também “dados faseados" ou “dados genéticos ordenados", se referem a dados de um único cromossomo em um genoma diploide ou poliploide, isto é, a cópia materna ou paterna segregada de um cromossomo em um genoma diploide.
[0214] Faseamento se refere ao ato de determinar os dados genéticos haplotípicos de um indivíduo considerando dados genéticos não ordenados, diploides (ou poliploidias). Pode se referir ao ato de determinar qual dentre os dois genes em um alelo, para um conjunto de alelos encontrados em um cromossomo, está associado a cada um dos dois cromossomos homólogos em um indivíduo.
[0215] Dados faseados se referem a dados genéticos em que um ou mais haplótipos foram determinados.
[0216] Hipótese se refere a um possível estado de ploidia em um determinado conjunto de cromossomos ou a um conjunto de possíveis estados alélicos em um determinado conjunto de locais. O conjunto pode compreender um ou mais elementos.
[0217] Indivíduo-alvo se refere ao indivíduo cujo estado genético está sendo determinado. Em algumas modalidades, apenas está disponível uma quantidade limitada de DNA do indivíduo-alvo. Em algumas modalidades, o indivíduo-alvo é um transplante. Em algumas modalidades, pode haver mais de um indivíduo-alvo. Em algumas modalidades, cada transplante originado de um par de pais pode ser considerado como indivíduo-alvo. Em algumas modalidades, os dados genéticos que estão sendo determinados consistem em uma ou um conjunto de chamadas de alelo. Em algumas modalidades, os dados genéticos que estão sendo determinados são uma chamada de ploidia.
[0218] Indivíduo relacionado se refere a qualquer indivíduo que é geneticamente relacionado e, portanto, compartilha blocos de haplótipos com o indivíduo-alvo. Em um contexto, o indivíduo relacionado pode ser um pai genético do indivíduo-alvo ou qualquer material genético derivado de um pai, como um espermatozoide, um corpo polar, um embrião, um transplante ou uma criança. Também pode se referir a um irmão, pai ou avô.
[0219] DNA de origem do doador se refere ao DNA que era originalmente parte de uma célula cujo genótipo era essencialmente equivalente ao do doador de transplante.
[0220] DNA de origem do receptor se refere ao DNA que era originalmente parte de uma célula cujo genótipo era essencialmente equivalente ao do receptor de transplante.
[0221] Plasma de receptor de transplante se refere à porção de plasma do sangue de uma mulher de um paciente que recebeu um aloenxerto, por exemplo, um receptor de transplante de órgão.
[0222] Decisão clínica se refere a qualquer decisão de realizar ou não uma ação que tenha um resultado que afete a saúde ou a sobrevivência de um indivíduo.
[0223] Caixa de diagnóstico se refere a uma ou uma combinação de máquinas projetadas para realizar um ou uma pluralidade de aspectos dos métodos divulgados neste documento. Em uma modalidade, a caixa de diagnóstico pode ser colocada em um ponto de atendimento ao paciente. Em uma modalidade, a caixa de diagnóstico pode realizar amplificação alvejada seguida de sequenciamento. Em uma modalidade, a caixa de diagnóstico pode funcionar sozinha ou com a ajuda de um técnico.
[0224] Método baseado em informática se refere a um método que depende muito de estatísticas para dar sentido a uma grande quantidade de dados. No contexto do diagnóstico pré-natal, se refere a um método projetado para determinar o estado de ploidia em um ou mais cromossomos ou o estado alélico em um ou mais alelos inferindo estatisticamente o estado mais provável, em vez de medir fisicamente de modo direto o estado, considerando uma grande quantidade de dados genéticos, por exemplo, de um arranjo molecular ou sequenciamento.
[0225] Dados genéticos primários se referem aos sinais de intensidade analógicos que são emitidos por uma plataforma de genotipagem. No contexto de arranjos de SNP, os dados genéticos primários se referem aos sinais de intensidade antes que qualquer chamada de genótipo seja feita. No contexto do sequenciamento, os dados genéticos primários se referem às medições analógicas, análogas ao cromatograma, que saem do sequenciador antes que a identidade de quaisquer pares de bases tenha sido determinada, e antes que a sequência seja mapeada para o genoma.
[0226] Dados genéticos secundários se referem a dados genéticos processados que são emitidos por uma plataforma de genotipagem. No contexto de um arranjo de SNP, os dados genéticos secundários se referem às chamadas de alelo feitas por software associado ao leitor de arranjo de SNP, em que o software fez uma chamada quanto à possibilidade de um determinado alelo estar presente ou não na amostra. No contexto do sequenciamento, os dados genéticos secundários se referem às identidades dos pares de bases das sequências que foram determinadas e, possivelmente, também em que as sequências foram mapeadas para o genoma.
[0227] Enriquecimento preferencial de DNA que corresponde a um local, ou enriquecimento preferencial de DNA em um local, se refere a qualquer método que resulta na porcentagem de moléculas de DNA em uma mistura de DNA pós-enriquecimento que corresponde ao local sendo maior do que a porcentagem de moléculas de DNA na mistura de DNA de pré- enriquecimento que correspondem ao local. O método pode envolver a amplificação seletiva de moléculas de DNA que correspondem a um local. O método pode envolver a remoção de moléculas de DNA que não correspondem ao local. O método pode envolver uma combinação de métodos. O grau de enriquecimento é definido como a porcentagem de moléculas de DNA na mistura pós-enriquecimento que correspondem ao local dividida pela porcentagem de moléculas de DNA na mistura pré-enriquecimento que correspondem ao local. O enriquecimento preferencial pode ser executado em uma pluralidade de locais. Em algumas modalidades da presente divulgação, o grau de enriquecimento é maior que 20. Em algumas modalidades da presente divulgação, o grau de enriquecimento é maior que 200. Em algumas modalidades da presente divulgação, o grau de enriquecimento é maior que
2.000. Quando o enriquecimento preferencial é realizado em uma pluralidade de locais, o grau de enriquecimento pode se referir ao grau de enriquecimento médio de todos os locais no conjunto de locais.
[0228] Amplificação se refere a um método que aumenta o número de cópias de uma molécula de DNA.
[0229] Amplificação seletiva pode se referir a um método que aumenta o número de cópias de uma determinada molécula de DNA, ou moléculas de DNA que correspondem a uma determinada região de DNA. Também pode se referir a um método que aumenta o número de cópias de uma determinada molécula de DNA alvejada, ou região de DNA alvejada mais do que aumenta moléculas ou regiões de DNA não alvejadas. A amplificação seletiva pode ser um método de enriquecimento preferencial.
[0230] Sequência de iniciação universal se refere a uma sequência de DNA que pode ser anexada a uma população de moléculas de DNA-alvo, por exemplo, por ligação, PCR ou PCR mediada por ligação. Uma vez adicionados à população de moléculas-alvo, os iniciadores específicos para as sequências de iniciação universal podem ser usados para amplificar a população-alvo usando um único par de iniciadores de amplificação. As sequências de iniciação universal normalmente não estão relacionadas às sequências-alvo.
[0231] Adaptadores universais, ou “adaptadores de ligação” ou “marcações de biblioteca”, são moléculas de DNA contendo uma sequência de iniciação universal que pode ser ligada covalentemente às extremidades de 5-prime e 3-prime de uma população-alvo de moléculas de DNA de fita dupla. A adição dos adaptadores fornece sequências de iniciação universal para as extremidades de 5-prime e 3-prime da população-alvo a partir da qual a amplificação por PCR pode ocorrer, amplificando todas as moléculas da população-alvo, usando um único par de iniciadores de amplificação.
[0232] Direcionamento se refere a um método usado para amplificar seletivamente ou, de outra forma, enriquecer preferencialmente tais moléculas de DNA que correspondem a um conjunto de locais em uma mistura de DNA.
[0233] Modelo de distribuição conjunta se refere a um modelo que define a probabilidade de eventos definidos em termos de múltiplas variáveis aleatórias, dada uma pluralidade de variáveis aleatórias definidas no mesmo espaço de probabilidade, em que as probabilidades da variável estão ligadas. Em algumas modalidades, o caso degenerado em que as probabilidades das variáveis não estão ligadas pode ser usado.
[0234] Limite de branco (LoB) é a maior concentração aparente de analito que se espera encontrar quando são testadas réplicas de uma amostra em branco que não contém analito. Por exemplo, tal como aqui utilizado, LoB pode ser definido como o valor empírico do 95º percentil medido a partir de um conjunto de amostras em branco (sem analito). Por conseguinte, em uma modalidade da presente divulgação, a sensibilidade do método de determinação do estado do transplante pode ser determinada por um limite de branco (LoB). O LoB desejado pode ser igual ou inferior a 5%; pode ser igual ou inferior a 2%; pode ser igual ou inferior a 1%; pode ser igual ou inferior a 0,5%; pode ser igual ou inferior a 0,25%; pode ser igual ou inferior a 0,23%; pode ser igual ou inferior a 0,11%; pode ser igual ou inferior a 0,08%; pode ser igual ou inferior a 0,04%.
[0235] Limites de detecção (LoD) consistem na menor concentração de analito que pode ser distinguida de forma confiável do LoB e na qual a detecção é viável. LoD é determinado utilizando o LoB medido e réplicas de teste de uma amostra que se sabe que contém uma baixa concentração de analito. Por exemplo, LoD pode ser calculado seguindo o método de estimativa paramétrica especificado em EP-17A2, que computa LoD adicionando um termo de desvio padrão ao LoB. Por conseguinte, em uma modalidade da presente divulgação, a sensibilidade do método de determinação do estado do transplante pode ser determinada por um LoD inferior a 1%; pode ser inferior a 0,5%; pode ser inferior a 0,25%; pode ser igual ou inferior a 0,23%; pode ser igual ou inferior a 0,11%; pode ser igual ou inferior a 0,08%; pode ser igual ou inferior a 0,04%.
[0236] Limites de quantificação (LoQ) consistem na concentração mais baixa na qual o analito pode, não apenas ser detectado de forma confiável, mas na qual algumas metas predefinidas de polarização e imprecisão são atendidas. LoQ pode ser equivalente a LoD ou pode estar em uma concentração mais alta.
HIPÓTESES
[0237] No contexto desta divulgação, uma hipótese se refere a um possível estado de transplante. Em algumas modalidades, um conjunto de hipóteses pode ser projetado de modo que uma hipótese do conjunto corresponda ao estado real do transplante de qualquer determinado indivíduo. Em algumas modalidades, um conjunto de hipóteses pode ser projetado de modo que cada estado de transplante possível possa ser descrito por pelo menos uma hipótese do conjunto. Em algumas modalidades da presente divulgação, um aspecto de um método é determinar qual hipótese corresponde ao estado de transplante real do indivíduo em questão.
[0238] Em outra modalidade da presente divulgação, uma etapa evolve criar uma hipótese. A criação de uma hipótese pode se referir ao ato de estabelecer os limites das variáveis de modo que todo o conjunto de estados de transplante possíveis que estão sob consideração seja englobado por essas variáveis.
CONTEXTOS GENOTÍPICOS
[0239] O contexto genotípico se refere ao estado genético de um determinado alelo, em cada um dos dois cromossomos relevantes para uma ou ambas dentre as duas fontes do alvo. O contexto genotípico para um determinado SNP pode consistir em quatro pares de bases; eles podem ser iguais ou diferentes um do outro. É normalmente escrito como “m1m2|f1f2", em que m1 e m2 são o estado genético do determinado SNP nos dois cromossomos doadores e f1 e f2 são o estado genético do SNP fornecido nos dois cromossomos do receptor. Em algumas modalidades, o contexto genotípico pode ser escrito como “f1f2|m1m2”. Observa-se que os subscritos “1” e “2” se referem ao genótipo, no alelo fornecido, do primeiro e do segundo cromossomos; observa-se também que a escolha de qual cromossomo é identificado como “1” e qual é identificado como “2” é arbitrária.
[0240] Observa-se que nesta divulgação, A e B são frequentemente usados para representar genericamente identidades de par de bases; A ou B podem igualmente representar C (citosina), G (guanina), A (adenina) ou T (timina). Por exemplo, se, em um determinado alelo baseado em SNP, o genótipo do receptor de transplante era T naquele SNP em um cromossomo, e G naquele SNP no cromossomo homólogo e o genótipo do doador de transplante naquele alelo é G naquele SNP em ambos dos cromossomos homólogos, pode-se dizer que o alelo do indivíduo-alvo tem o contexto genotípico de AB|BB; também pode-se dizer que o alelo tem o contexto genotípico de AB|AA. Observa-se que, em teoria, qualquer um dos quatro nucleotídeos possíveis poderia ocorrer em um determinado alelo e, assim, é possível, por exemplo, que o receptor de transplante tenha um genótipo de AT e o doador de transplante tenha um genótipo de GC em um determinado alelo. No entanto, os dados empíricos indicam que, na maioria dos casos, apenas dois dos quatro pares de bases possíveis são observados em um determinado alelo. É possível, por exemplo, ao usar repetições em tandem simples, ter mais de dois, mais de quatro e até mais de dez contextos parentais. Nesta divulgação, a discussão presume que apenas dois pares de bases possíveis serão observados em um determinado alelo, embora as modalidades divulgadas neste documento possam ser modificadas para levar em consideração os casos em que esta suposição não é válida.
[0241] Um "contexto genotípico" pode se referir a um conjunto ou subconjunto de SNPs-alvo que têm o mesmo contexto genotípico. Por exemplo, se alguém fosse medir 1.000 alelos em um determinado cromossomo em um indivíduo-alvo, então, o contexto AA|BB poderia se referir ao conjunto de todos os alelos no grupo de 1.000 alelos em que o genótipo do receptor de transplante do alvo era homozigótico, e o genótipo do doador de transplante do alvo é homozigótico, mas em que o genótipo do receptor e o genótipo do doador são diferentes nesse local. Se os dados não forem faseados e, portanto, AB = BA, então existem nove contextos genotípicos possíveis: AA|AA, AA|AB, AA|BB, AB|AA, AB|AB, AB|BB, BB|AA, BB|AB e BB|BB. Se os dados forem faseados e, portanto, AB ≠ BA, então existem dezesseis contextos genotípicos diferentes possíveis: AA|AA, AA|AB, AA|BA, AA|BB, AB|AA, AB|AB, AB|BA, AB|BB, BA|AA, BA|AB, BA|BA, BA|BB, BB|AA, BB|AB, BB|BA e BB|BB. Cada alelo de SNP em um cromossomo, excluindo alguns SNPs nos cromossomos sexuais, tem um desses contextos genotípicos. O conjunto de SNPs em que o contexto genotípico para um dos pais é heterozigótico pode ser referido como o contexto heterozigótico.
USO DE CONTEXTOS GENOTÍPICOS NA DETERMINAÇÃO NÃO INVASIVA DO ESTADO DO TRANSPLANTE
[0242] A determinação não invasiva do estado de transplante é uma técnica importante que pode ser usada para determinar o estado genético de um transplante a partir de material genético obtido de maneira não invasiva, por exemplo, a partir de uma coleta de sangue no receptor de transplante. O sangue pode ser separado e o plasma isolado, seguido pelo isolamento do DNA de plasma. A seleção de tamanho pode ser usada para isolar o DNA do comprimento apropriado. O DNA pode ser enriquecido preferencialmente em um conjunto de locais. Este DNA pode, então, ser medido por uma série de meios, como por hibridização a um arranjo de genotipagem e medição da fluorescência, ou por sequenciamento em um sequenciador de alto rendimento.
[0243] Ao considerar quais alelos alvejar, pode-se considerar a probabilidade de que alguns contextos parentais sejam provavelmente mais informativos do que outros. Por exemplo, AA|BB e o contexto simétrico BB|AA são os contextos mais informativos, porque sabe-se que o transplante carrega um alelo diferente do receptor de transplante. Por razões de simetria, os contextos AA|BB e BB|AA podem ser referidos como AA|BB. Outro conjunto de contextos genotípicos informativos são AA|AB e BB|AB, pois nesses casos o transplante tem 50% de chance de carregar um alelo que o receptor de transplante não tem. Por razões de simetria, os contextos AA|AB e BB|AB podem ser referidos como AA|AB. Um terceiro conjunto de contextos parentais informativos são AB|AA e AB|BB, porque, nesses casos, o transplante carrega um alelo de doador conhecido e esse alelo também está presente no genoma do receptor. Por razões de simetria, os contextos AB|AA e AB|BB podem ser referidos como AB|AA. Um quarto contexto é AB|AB, em que o transplante tem um estado alélico desconhecido e, seja qual for o estado alélico, é um em que o receptor de transplante tem os mesmos alelos. O quinto contexto é AA|AA, em que o receptor de transplante e o doador de transplante são heterozigóticos.
DIFERENTES IMPLEMENTAÇÕES DAS MODALIDADES AQUI DIVULGADAS
[0244] Em algumas modalidades, a fonte do material genético a ser usado na determinação do estado genético do transplante pode ser células derivadas de doador transplantadas. O método pode envolver a obtenção de uma amostra de sangue do receptor de transplante.
[0245] Em uma modalidade da presente divulgação, o indivíduo-alvo é um transplante e as diferentes medições de genótipo são feitas em uma pluralidade de amostras de DNA do transplante. Em algumas modalidades da presente divulgação, as amostras de DNA derivadas de doador são de células transplantadas isoladas, em que as células derivadas de doador podem ser misturadas com células de receptor. Em algumas modalidades da presente divulgação, as amostras de DNA derivadas de doador são de DNA derivado de doador de flutuação livre, em que o DNA do doador pode ser misturado com DNA de receptor de flutuação livre.
[0246] Em algumas modalidades, a amostra genética pode ser preparada e/ou purificada. Existem vários procedimentos-padrão conhecidos na técnica para alcançar tal fim. Em algumas modalidades, a amostra pode ser centrifugada para separar várias camadas. Em algumas modalidades, o DNA pode ser isolado usando filtração. Em algumas modalidades, a preparação do DNA pode envolver amplificação, separação,
purificação por cromatografia, separação líquido-líquido, isolamento, enriquecimento preferencial, amplificação preferencial, amplificação alvejada ou qualquer uma de uma série de outras técnicas conhecidas na técnica ou aqui descritas.
[0247] Em algumas modalidades, um método da presente divulgação pode envolver amplificar DNA. A amplificação do DNA, um processo que transforma uma pequena quantidade de material genético em uma quantidade maior de material genético que compreende um conjunto semelhante de dados genéticos, pode ser feito por uma ampla variedade de métodos, incluindo, mas não se limitando à reação em cadeia da polimerase (PCR). Um método de amplificação do DNA é a amplificação do genoma completo (WGA). Existem vários métodos disponíveis para WGA: PCR mediada por ligação (LM-PCR), PCR de iniciador de oligonucleotídeo degenerado (DOP-PCR) e amplificação de deslocamento múltiplo (MDA). Em LM-PCR, sequências curtas de DNA chamadas adaptadores são ligadas às extremidades cegas do DNA. Esses adaptadores contêm sequências de amplificação universais, que são usadas para amplificar o DNA por PCR. Em DOP-PCR, iniciadores aleatórios que também contêm sequências de amplificação universais são usados em uma primeira rodada de hibridização e PCR. Em seguida, uma segunda rodada de PCR é usada para amplificar ainda mais as sequências com as sequências de iniciador universais. A MDA usa a phi-29 polimerase, que é uma enzima altamente processual e não específica que replica o DNA e tem sido usada para análises de células únicas. As principais limitações para a amplificação do material de uma única célula são (1) a necessidade de usar concentrações de DNA extremamente diluídas ou um volume extremamente pequeno de mistura de reação e (2) a dificuldade de dissociar de forma confiável o DNA das proteínas em todo o genoma. Independentemente disso, a amplificação do genoma inteiro de célula única tem sido usada com sucesso para uma variedade de aplicações por vários anos. Existem outros métodos de amplificação de DNA a partir de uma amostra de DNA. A amplificação do DNA transforma a amostra inicial de DNA em uma amostra de DNA semelhante no conjunto de sequências, mas em quantidade muito maior. Em alguns casos, a amplificação pode não ser necessária.
[0248] Em algumas modalidades, o DNA pode ser amplificado usando uma amplificação universal, como WGA ou MDA. Em algumas modalidades, o DNA pode ser amplificado por amplificação alvejada, por exemplo, utilizando PCR alvejada ou sondas de circularização. Em algumas modalidades, o DNA pode ser preferencialmente enriquecido usando um método de amplificação alvejada, ou um método que resulta na separação total ou parcial do DNA desejado do indesejado, como captura por abordagens de hibridização. Em algumas modalidades, o DNA pode ser amplificado usando uma combinação de um método de amplificação universal e um método de enriquecimento preferencial. Uma descrição mais completa de alguns desses métodos pode ser encontrada em outras partes deste documento.
[0249] Os dados genéticos do indivíduo-alvo e/ou do indivíduo relacionado podem ser transformados de um estado molecular para um estado eletrônico medindo o material genético apropriado usando ferramentas e/ou técnicas retiradas de um grupo, incluindo, mas sem limitações: microarranjos de genotipagem e sequenciamento de alto rendimento. Alguns métodos de sequenciamento de alto rendimento incluem sequenciamento de DNA de Sanger, pirossequenciamento, plataforma ILLUMINA SOLEXA, ANALISADOR DE GENOMAS da ILLUMINA ou plataforma de sequenciamento 454 da APPLIED BIOSYSTEM, plataforma TRUE SINGLE MOLECULE SEQUENCING da HELICOS, método de sequenciamento de microscópio eletrônico da HALCYON MOLECULAR ou qualquer outro método de sequenciamento. Todos esses métodos transformam fisicamente os dados genéticos armazenados em uma amostra de DNA em um conjunto de dados genéticos que é tipicamente armazenado em um dispositivo de memória a caminho de ser processados.
[0250] Os dados genéticos de um indivíduo relevante podem ser medidos através da análise de substâncias retiradas de um grupo incluindo, mas sem limitações: o tecido diploide em massa do indivíduo, uma ou mais células diploides do indivíduo, uma ou mais células haploides do indivíduo, um ou mais blastômeros do indivíduo-alvo, material genético extracelular encontrado no indivíduo, material genético extracelular do indivíduo encontrado no sangue materno, células do indivíduo encontradas no sangue materno, um ou mais embriões criados a partir de (a) gameta (ou gametas) do indivíduo relacionado, um ou mais blastômeros retirados de tal embrião, material genético extracelular encontrado no indivíduo relacionado, material genético que se sabe que é originado do indivíduo relacionado e combinações dos mesmos.
[0251] Em algumas modalidades, o conhecimento do estado de transplante determinado pode ser usado para tomar uma decisão clínica. Esse conhecimento, normalmente armazenado como uma disposição física da matéria em um dispositivo de memória pode, então, ser transformado em um relatório. Pode-se, então, agir mediante o relatório. Por exemplo, a decisão clínica pode consistir em ajustar a ingestão de medicamentos imunossupressores por um receptor de transplante.
[0252] Em uma modalidade da presente divulgação, qualquer um dos métodos descritos neste documento pode ser modificado para permitir que múltiplos alvos venham do mesmo indivíduo-alvo, por exemplo, várias coletas de sangue do mesmo receptor de transplante. Isso pode melhorar a precisão do modelo, pois múltiplas medições genéticas podem fornecer mais dados com os quais o genótipo-alvo pode ser determinado. Em uma modalidade, um conjunto de dados genéticos-alvo serviu como os dados primários que foram relatados, e o outro serviu como dados para verificar novamente os dados genéticos-alvo primários. Em uma modalidade, uma pluralidade de conjuntos de dados genéticos, cada um medido a partir de material genético retirado do indivíduo-alvo, são considerados em paralelo.
[0253] Em uma modalidade, o material genético bruto do receptor de transplante e do doador de transplante é transformado por meio de amplificação em uma quantidade de DNA que é semelhante em sequência, porém, maior em quantidade.
Então, por meio de um método de genotipagem, os dados genotípicos que são codificados por ácidos nucleicos são transformados em medições genéticas que podem ser armazenadas física e/ou eletronicamente em um dispositivo de memória, como aqueles descritos acima.
Então, por meio da execução do programa de computador no hardware do computador, em vez de bits e bytes codificados fisicamente, dispostos em um padrão que representa dados de medição brutos, eles se transformam em um padrão que representa uma determinação de alta confiança do estado do transplante do receptor.
Os detalhes desta transformação dependerão dos próprios dados e da linguagem de computador e do sistema de hardware usado para executar o método aqui descrito.
Em seguida, os dados fisicamente configurados para representar uma determinação do estado do transplante de alta qualidade do receptor são transformados em um relatório que pode ser enviado a um profissional de saúde.
Esta transformação pode ser executada em uma impressora ou um visor de computador.
O relatório pode ser uma cópia impressa, em papel ou outra mídia adequada, ou pode ser eletrônico.
No caso de um relatório eletrônico, ele pode ser transmitido, pode ser armazenado fisicamente em um dispositivo de memória em um local no computador acessível ao profissional de saúde; também pode ser exibido em uma tela para que possa ser lido.
No caso de uma exibição de tela, os dados podem ser transformados em um formato legível, causando a transformação física de pixels no dispositivo de exibição.
A transformação pode ser realizada por meio do disparo físico de elétrons em uma tela fosforescente, por meio da alteração de uma carga elétrica que altera fisicamente a transparência de um conjunto específico de pixels em uma tela que pode estar na frente de um substrato que emite ou absorve fótons.
Esta transformação pode ser realizada por meio da alteração da orientação em nanoescala das moléculas em um cristal líquido, por exemplo, de fase nemática para colestérica ou esmética, em um conjunto específico de pixels. Esta transformação pode ser realizada por meio de uma corrente elétrica fazendo com que fótons sejam emitidos de um conjunto específico de pixels feito de uma pluralidade de diodos emissores de luz dispostos em um padrão significativo. Essa transformação pode ser realizada por qualquer outra forma usada para exibir informações, como uma tela de computador ou algum outro dispositivo de saída ou forma de transmissão de informações. O profissional de saúde pode então agir quanto ao relatório, de modo que os dados no relatório sejam transformados em uma ação. A ação pode ser continuar ou descontinuar a medicação imunossupressora. Em algumas modalidades, a ação pode ser aumentar ou diminuir a medicação imunossupressora.
[0254] Em algumas modalidades, os métodos aqui descritos podem ser usados em um período de tempo muito precoce após a cirurgia de transplante, por exemplo, logo no dia da cirurgia, um dia após a cirurgia, dois dias após a cirurgia, três dias após a cirurgia, quatro dias após cirurgia, cinco dias após a cirurgia, seis dias após a cirurgia, uma semana após a cirurgia, duas semanas após a cirurgia, três semanas após a cirurgia, quatro semanas após a cirurgia, um mês após a cirurgia, dois meses após a cirurgia, três meses após a cirurgia, quatro meses após cirurgia, cinco meses após a cirurgia, seis meses após a cirurgia, sete meses após a cirurgia, oito meses após a cirurgia, nove meses após a cirurgia, dez meses após a cirurgia, onze meses após a cirurgia ou um ano ou mais após a cirurgia.
[0255] Qualquer uma das modalidades aqui divulgadas pode ser implementada em conjuntos de circuitos eletrônicos digitais, conjuntos de circuitos integrados, ASICs (circuitos integrados de aplicativos específicos) especialmente projetados, hardware de computador, firmware, software ou em combinações dos mesmos. O aparelho das modalidades aqui divulgadas pode ser implementado em um produto de programa de computador tangivelmente incorporado em um dispositivo de armazenamento legível por máquina para execução por um processador programável; e as etapas do método das modalidades aqui divulgadas podem ser realizadas por um processador programável executando um programa de instruções para realizar funções das modalidades aqui divulgadas operando em dados de entrada e gerando saída. As modalidades aqui divulgadas podem ser implementadas com vantagem em um ou mais programas de computador que são executáveis e/ou interpretáveis em um sistema programável incluindo pelo menos um processador programável, que pode ser especial ou de propósito geral, acoplado para receber dados e instruções de, e para transmitir dados e instruções para um sistema de armazenamento, pelo menos um dispositivo de entrada e pelo menos um dispositivo de saída. Cada programa de computador pode ser implementado em uma linguagem de programação processual de alto nível ou orientada por objeto ou em linguagem de máquina ou montagem, se desejado; e, em todo caso, a linguagem pode ser linguagem compilada ou interpretada. Um programa de computador pode ser implantado em qualquer forma, incluindo como um programa autônomo ou como um módulo, componente, sub-rotina ou outra unidade adequada para uso em um ambiente de computação. Um programa de computador pode ser implantado para ser executado ou interpretado em um computador ou em vários computadores em um local, ou distribuído em vários locais e interconectado por uma rede de comunicação.
[0256] As mídias de armazenamento legíveis por computador, como utilizado no presente documento, se referem a armazenamento físico ou tangível (em oposição a sinais) e incluem, sem limitações, mídias voláteis e não voláteis, removíveis e não removíveis implementadas em qualquer método ou tecnologia para o armazenamento de informações, tais como instruções legíveis por computador, estruturas de dados, módulos de programa ou outros dados. As mídias de armazenamento legíveis por computador incluem, mas sem limitações, RAM, ROM, EPROM, EEPROM, memória flash ou outra tecnologia de memória de estado sólido, CD- ROM, DVD ou outro armazenamento óptico, cassetes magnéticos, fita magnética, armazenamento em disco magnético ou outros dispositivos de armazenamento magnético, ou qualquer outra mídia física ou material que possa ser usada para armazenar as informações ou dados ou instruções desejadas e que possa ser acessada por um computador ou processador.
[0257] Qualquer um dos métodos descritos neste documento pode incluir a saída de dados em um formato físico, como em uma tela de computador ou em uma impressão em papel. Em explicações de quaisquer modalidades em outras partes deste documento, deve ser entendido que os métodos descritos podem ser combinados com a saída dos dados acionáveis em um formato mediante o qual um médico pode agir. Além disso, os métodos descritos podem ser combinados com a execução efetiva de uma decisão clínica que resulte em um tratamento clínico, ou a execução de uma decisão clínica de não tomar providências. Algumas das modalidades descritas no documento para determinar os dados genéticos relativos a um indivíduo- alvo podem ser combinadas com uma decisão ou ação clínica. Algumas das modalidades descritas no documento para determinar os dados genéticos relativos a um indivíduo-alvo podem ser combinadas com a notificação de uma rejeição potencial ao transplante, ou a falta dela, com um profissional médico. Algumas das modalidades aqui descritas podem ser combinadas com a saída dos dados acionáveis e a execução de uma decisão clínica que resulta em um tratamento clínico ou a execução de uma decisão clínica para não realizar nenhuma ação.
ENRIQUECIMENTO ALVEJADO E SEQUENCIAMENTO
[0258] O uso de uma técnica para enriquecer uma amostra de DNA em um conjunto de locais-alvo seguido de sequenciamento como parte de um método para determinação não invasiva do estado do transplante em um receptor de transplante pode conferir uma série de vantagens inesperadas. Em algumas modalidades da presente divulgação, o método envolve a medição de dados genéticos para uso com um método baseado em informática. O resultado final de algumas das modalidades consiste nos dados acionáveis do estado de um transplante. Existem muitos métodos que podem ser usados para medir os dados genéticos do indivíduo e/ou dos indivíduos relacionados como parte dos métodos incorporados. Em uma modalidade, um método para enriquecer a concentração de um conjunto de alelos alvejados é aqui divulgada, em que o método compreende uma ou mais das seguintes etapas: amplificação alvejada de material genético, adição de sondas oligonucleotídicas específicas para o local, ligação de fitas de DNA especificadas, isolamento de conjuntos de DNA desejado, remoção de componentes indesejados de uma reação, detecção de certas sequências de DNA por hibridização e detecção da sequência de uma ou uma pluralidade de fitas de DNA por métodos de sequenciamento de DNA. Em alguns casos, as fitas de DNA podem se referir ao material genético-alvo, em alguns casos, podem se referir a iniciadores, em alguns casos, podem se referir a sequências sintetizadas ou combinações dos mesmos. Estas etapas podem ser realizadas em inúmeras ordens diferentes. Dada a natureza altamente variável da biologia molecular, geralmente não é óbvio quais métodos e quais combinações de etapas terão um desempenho insatisfatório, bom ou melhor em várias situações.
[0259] Por exemplo, uma etapa de amplificação universal do DNA antes da amplificação alvejada pode conferir várias vantagens, como remover o risco de formação de gargalo e reduzir a polarização alélica. O DNA pode ser misturado a uma sonda de oligonucleotídeo que pode hibridizar com duas regiões vizinhas da sequência- alvo, uma de cada lado. Após a hibridização, as extremidades da sonda podem ser conectadas por adição de uma polimerase, um meio para ligação e quaisquer reagentes necessários para permitir a circularização da sonda. Após a circularização, uma exonuclease pode ser adicionada para digerir o material genético não circularizado, seguida pela detecção da sonda circularizada. O DNA pode ser misturado com iniciadores de PCR que podem hibridizar com duas regiões vizinhas da sequência-alvo, uma de cada lado. Após a hibridização, as extremidades da sonda podem ser conectadas adicionando uma polimerase, um meio para ligação e quaisquer reagentes necessários para completar a amplificação por PCR. O DNA amplificado ou não amplificado pode ser alvejado por sondas de captura híbridas que têm como alvo um conjunto de locais; após a hibridização, a sonda pode ser localizada e separada da mistura para fornecer uma mistura de DNA que é enriquecida em sequências-alvo.
[0260] Em algumas modalidades, a detecção do material genético-alvo pode ser feita de uma forma multiplexada. O número de sequências genéticas-alvo que podem ser executadas em paralelo pode variar de um a dez, dez a cem, cem a mil, mil a dez mil, dez mil a cem mil, cem mil a um milhão ou um milhão a dez milhões. Observa-se que a técnica anterior inclui divulgações de reações de PCR multiplexadas com sucesso envolvendo pools de até cerca de 50 ou 100 iniciadores, e não mais. As tentativas anteriores de multiplexar mais de 100 iniciadores por pool resultaram em problemas significativos com reações colaterais indesejadas, como a formação de iniciador-dímero.
[0261] Em algumas modalidades, este método pode ser usado para genotipar uma única célula, um pequeno número de células, duas a cinco células, seis a dez células, dez a vinte células, vinte a cinquenta células, cinquenta a cem células, cem a mil células, ou uma pequena quantidade de DNA extracelular, por exemplo, de um a dez picogramas, de dez a cem pictogramas, de cem pictogramas a um nanograma, de um a dez nanogramas, de dez a cem nanogramas, ou de cem nanogramas a um micrograma.
[0262] O uso de um método para alvejar certos locais seguido por sequenciamento como parte de um método para chamada de estado de transplante pode conferir uma série de vantagens inesperadas. Alguns métodos pelos quais o DNA pode ser alvejado, ou preferencialmente enriquecido, incluem o uso de sondas de circularização, sondas invertidas ligadas (LIPs, MIPs), captura por métodos de hibridização, como
SURESELECT, e estratégias de amplificação de PCR alvejada ou PCR mediada por ligação.
[0263] Existem muitos métodos que podem ser usados para medir os dados genéticos do indivíduo e/ou dos indivíduos relacionados nos contextos acima mencionados. Os diferentes métodos compreendem uma série de etapas, em que tais etapas frequentemente envolvem amplificação de material genético, adição de sondas de olgionucleotídeos, ligação de fitas de DNA especificadas, isolamento de conjuntos de DNA desejado, remoção de componentes indesejados de uma reação, detecção de certas sequências de DNA por hibridação, detecção da sequência de uma ou uma pluralidade de fitas de DNA por métodos de sequenciamento de DNA. Em alguns casos, as fitas de DNA podem se referir ao material genético-alvo, em alguns casos, podem se referir a iniciadores, em alguns casos, podem se referir a sequências sintetizadas ou combinações dos mesmos. Estas etapas podem ser realizadas em inúmeras ordens diferentes. Dada a natureza altamente variável da biologia molecular, geralmente não é óbvio quais métodos e quais combinações de etapas terão um desempenho insatisfatório, bom ou melhor em várias situações.
[0264] Observa-se que, em teoria, é possível ter como alvo qualquer número de locais no genoma, de um local a bem mais de um milhão de locais. Se uma amostra de DNA for submetida ao alvejamento e, em seguida, sequenciada, a porcentagem dos alelos que são lidos pelo sequenciador será enriquecida em relação à sua abundância natural na amostra. O grau de enriquecimento pode ser de um por cento (ou até menos) a dez vezes, cem vezes, mil vezes ou mesmo muitas milhões de vezes. No genoma humano, existem cerca de 3 bilhões de pares de bases e nucleotídeos, compreendendo aproximadamente 75 milhões de locais polimórficos. Quanto mais locais forem alvejados, menor será o grau de enriquecimento possível. Quanto menor o número de locais que são alvejados, maior será o grau de enriquecimento possível e maior a profundidade de leitura que pode ser alcançada nesses locais para um determinado número de leituras de sequência.
[0265] Em uma modalidade exemplificativa da presente divulgação, o alvejamento ou preferência pode se concentrar totalmente em SNPs. Em uma modalidade, o alvejamento ou preferência pode se concentrar em qualquer sítio polimórfico. Uma série de produtos de alvejamento comercial estão disponíveis para enriquecer éxons. Surpreendentemente, ter como alvo SNPs exclusivamente, ou locais polimórficos exclusivamente, é particularmente vantajoso. Esses tipos de metodologia que não se concentram em alelos polimórficos não se beneficiariam tanto com o alvejamento ou enriquecimento preferencial de um conjunto de alelos.
[0266] Em uma modalidade da presente divulgação, é possível usar um método de alvejamento que se concentra em SNPs para enriquecer uma amostra genética em regiões polimórficas do genoma. Em uma modalidade, é possível se concentrar em um pequeno número de SNPs, por exemplo, entre 1 e 100 SNPs, ou um número maior, por exemplo, entre 100 e
1.000, entre 1.000 e 10.000, entre 10.000 e 100.000 ou mais de 100.000 SNPs. Em uma modalidade, é possível se concentrar em um ou um pequeno número de cromossomos que estão correlacionados com nascimentos trissômicos vivos, por exemplo, cromossomos 13, 18, 21, X e Y ou alguma combinação dos mesmos. Em uma modalidade, é possível enriquecer os SNPs alvejados por um pequeno fator, por exemplo, entre 1,01 vezes e 100 vezes, ou por um fator maior, por exemplo, entre 100 vezes e 1.000.000 vezes, ou mesmo por mais de
1.000.000 vezes. Em uma modalidade da presente divulgação, é possível usar um método de alvejamento para criar uma amostra de DNA que é preferencialmente enriquecida em regiões polimórficas do genoma. Em uma modalidade, é possível usar este método para criar uma mistura de DNA com qualquer uma dessas características, em que a mistura de DNA contém DNA de receptor de transplante e também DNA derivado de doador de flutuação livre. Em uma modalidade, é possível usar este método para criar uma mistura de DNA que tem qualquer combinação desses fatores. Qualquer um dos métodos de alvejamento aqui descritos pode ser usado para criar misturas de DNA que são preferencialmente enriquecidas em certos locais.
[0267] Em algumas modalidades, um método da presente divulgação inclui, ainda, medir o DNA na fração mista usando um sequenciador de DNA de alto rendimento, em que o DNA na fração mista contém um número desproporcional de sequências de um ou mais cromossomos.
[0268] São descritos aqui três métodos: PCR multiplex, captura alvejada por hibridização e sondas invertidas ligadas (LIPs), que podem ser usados para obter e analisar medições de um número suficiente de locais polimórficos de uma amostra de plasma de receptor de transplante, a fim de detectar a rejeição ao transplante; isso não se destina a excluir outros métodos de enriquecimento seletivo de locais-alvo. Outros métodos podem ser igualmente usados sem alterar a essência do método. Em cada caso, o polimorfismo submetido a ensaio pode incluir polimorfismos de nucleotídeo único (SNPs), pequenas indels ou STRs. Um método preferencial envolve o uso de SNPs. Cada abordagem produz dados de frequência de alelo; os dados de frequência de alelo para cada local alvejado e/ou as distribuições de frequência de alelo conjuntas desses locais podem ser analisados para determinar o estado de rejeição e/ou o de lesão do transplante. Cada abordagem tem suas próprias considerações devido ao material de origem limitado e ao fato de que o plasma do receptor de transplante consiste na mistura de DNA derivado do receptor e do doador. Este método pode ser combinado com outras abordagens para fornecer uma determinação mais precisa. Em uma modalidade, este método pode ser combinado com uma abordagem de contagem de sequência, como a descrita na Patente nº U.S.
7.888.017.
MEDINDO AS DISTRIBUIÇÕES ALÉLICAS EM UMA AMOSTRA COM PRECISÃO
[0269] As abordagens de sequenciamento atuais podem ser usadas para estimar a distribuição de alelos em uma amostra. Um desses métodos envolve a amostragem aleatória de sequências de um DNA de pool, denominado sequenciamento shotgun. A proporção de um alelo específico nos dados de sequenciamento é normalmente muito baixa e pode ser determinada por estatísticas simples. O genoma humano contém aproximadamente 3 bilhões de pares de bases. Portanto, se o método de sequenciamento usado fizer leituras de 100 pb, um alelo específico será medido cerca de uma vez a cada 30 milhões de leituras de sequência.
[0270] Em uma modalidade, um método da presente divulgação é usado para determinar a presença ou ausência de dois ou mais haplótipos diferentes que contêm o mesmo conjunto de locais em uma amostra de DNA a partir das distribuições de alelos medidas de locais de tal cromossomo. Alelos que são polimórficos entre os haplótipos tendem a ser mais informativos, no entanto, quaisquer alelos em que tanto o receptor de transplante quanto o doador de transplante não sejam homozigóticos para o mesmo alelo produzirão informações úteis por meio de distribuições de alelos medidas além das informações disponíveis a partir da análise de contagem de leitura simples.
[0271] O sequenciamento shotgun de tal amostra, no entanto, é extremamente ineficiente, pois resulta em muitas sequências para regiões que não são polimórficas entre os diferentes haplótipos na amostra, ou são para cromossomos que não são de interesse e, portanto, não revelam informações sobre a proporção dos haplótipos-alvo. São descritos, neste documento, métodos que têm como alvo especificamente e/ou enriquecem preferencialmente segmentos de DNA na amostra que são mais propensos a serem polimórficos no genoma para aumentar o rendimento de informações alélicas obtidas por sequenciamento. Observa-se que para as distribuições de alelos medidas em uma amostra enriquecida serem verdadeiramente representativas das quantidades reais presentes no indivíduo-alvo, é fundamental que haja pouco ou nenhum enriquecimento preferencial de um alelo em comparação com o outro alelo em um determinado local nos segmentos alvejados.
Os métodos atuais conhecidos na técnica para alvejar alelos polimórficos são projetados para garantir que pelo menos alguns de quaisquer alelos presentes sejam detectados.
No entanto, esses métodos não foram projetados com o propósito de medir as distribuições alélicas não polarizadas de alelos polimórficos presentes na mistura original.
Não é óbvio que qualquer método particular de enriquecimento-alvo seria capaz de produzir uma amostra enriquecida, em que as distribuições de alelos medidas representariam com precisão as distribuições de alelos presentes na amostra original não amplificada melhor do que qualquer outro método.
Embora seja possível esperar que muitos métodos de enriquecimento, em teoria, atinjam tal objetivo, uma pessoa comum versada na técnica está bem ciente de que há uma grande tendência estocástica ou determinística na amplificação, alvejamento e outros métodos atuais de enriquecimento preferencial.
Uma modalidade de um método aqui descrito permite que uma pluralidade de alelos encontrados em uma mistura de DNA que corresponde a um determinado local no genoma seja amplificada, ou preferencialmente enriquecida de uma forma que o grau de enriquecimento de cada um dos alelos seja quase igual.
Outra maneira de dizer isso é que o método permite que a quantidade relativa dos alelos presentes na mistura como um todo seja aumentada, enquanto a razão entre os alelos que correspondem a cada local permanece essencialmente igual à que era na mistura original de DNA.
Os métodos do enriquecimento preferencial de locais da técnica anterior podem resultar em polarizações alélicas de mais de 1%, mais de 2%, mais de 5% e até mais de 10%. Este enriquecimento preferencial pode ser devido à polarização de captura ao usar uma abordagem de captura por hibridização, ou polarização de amplificação que pode ser pequena para cada ciclo, mas pode se tornar grande quando composta ao longo de 20, 30 ou 40 ciclos.
Para os fins desta divulgação, a razão permanecer essencialmente a mesma significa que a razão dos alelos na mistura original dividida pela razão dos alelos na mistura resultante está entre 0,95 e 1,05, entre 0,98 e 1,02, entre 0,99 e 1,01, entre 0,995 e 1,005, entre 0,998 e 1,002, entre 0,999 e 1,001 ou entre 0,9999 e 1,0001. Observa-se que o cálculo das razões alélicas apresentadas aqui não pode ser usado na determinação do estado do transplante do receptor de transplante e pode ser apenas uma métrica a ser usada para medir a polarização alélica.
[0272] Em uma modalidade, uma vez que uma mistura tiver sido preferencialmente enriquecida no conjunto de locais-alvo, ela pode ser sequenciada usando qualquer um dos instrumentos de sequenciamento de geração anterior, atual ou seguinte que sequenciam uma amostra clonal (uma amostra gerada a partir de uma única molécula; exemplos incluem ILLUMINA GAIIx, ILLUMINA HISEQ, LIFE TECHNOLOGIES SOLiD, 5500XL). As razões podem ser avaliadas por sequenciamento por meio dos alelos específicos dentro da região-alvo. Estas leituras de sequenciamento podem ser analisadas e contadas de acordo com o tipo de alelo e as razões de diferentes alelos determinadas em conformidade. Para variações de uma a algumas bases de comprimento, a detecção dos alelos será realizada por sequenciamento e é essencial que a leitura do sequenciamento abranja o alelo em questão para avaliar a composição alélica daquela molécula capturada. O número total de moléculas capturadas submetidas a ensaio para o genótipo pode ser aumentado através do aumento do comprimento da leitura de sequenciamento. O sequenciamento completo de todas as moléculas garantiria a coleta da quantidade máxima de dados disponíveis no pool enriquecido. No entanto, o sequenciamento é atualmente caro e um método que pode medir distribuições de alelos usando um número menor de leituras de sequência terá grande valor. Além disso, existem limitações técnicas para o comprimento máximo possível de leitura, bem como limitações de precisão conforme aumentam os comprimentos de leitura. Os alelos de maior utilidade terão comprimento de uma a algumas bases, mas, teoricamente qualquer alelo menor que o comprimento da leitura de sequenciamento pode ser usado. Embora as variações de alelo venham em todos os tipos, os exemplos fornecidos aqui se concentram em SNPs ou variantes contendo apenas alguns pares de bases vizinhos. Variantes maiores, como variantes de número de cópias segmentares, podem ser detectadas por agregações dessas variações menores em muitos casos, já que coleções inteiras de SNP internas ao segmento são duplicadas. Variantes maiores do que algumas bases, como STRs, exigem consideração especial e algumas abordagens de alvejamento funcionam, enquanto outras não.
[0273] Existem múltiplas abordagens de alvejamento que podem ser usadas para isolar e enriquecer especificamente uma ou uma pluralidade de posições de variantes no genoma. Normalmente, elas dependem de tirar vantagem da sequência invariável que flanqueia a sequência variante. Existe uma técnica anterior relacionada ao alvejamento no contexto de sequenciamento em que o substrato é o plasma materno (consultar, por exemplo, Liao et al., Clin. Chem. 2011; 57(1): páginas 92 a 101). No entanto, todas as abordagens na técnica anterior utilizam sondas de alvejamento que têm como alvo os éxons e não se concentram em alvejar regiões polimórficas do genoma. Em uma modalidade, um método da presente divulgação envolve o uso de sondas de alvejamento que se concentram exclusivamente ou quase exclusivamente em regiões polimórficas. Em uma modalidade, um método da presente divulgação envolve o uso de sondas de alvejamento que se concentram exclusivamente ou quase exclusivamente em SNPs. Em algumas modalidades da presente divulgação, os sítios polimórficos alvejados consistem em pelo menos 10% SNPs, pelo menos 20% SNPs, pelo menos 30% SNPs, pelo menos 40% SNPs, pelo menos 50% SNPs, pelo menos 60% SNPs, pelo menos 70% SNPs, pelo menos 80% SNPs, pelo menos 90% SNPs, pelo menos 95% SNPs, pelo menos 98% SNPs, pelo menos 99% SNPs, pelo menos 99,9% SNPs ou exclusivamente SNPs.
[0274] Em uma modalidade, um método da presente divulgação pode ser usado para determinar genótipos (composição de base do DNA em locais específicos) e proporções relativas desses genótipos a partir de uma mistura de moléculas de DNA, em que essas moléculas de DNA podem ter se originado de um ou vários indivíduos geneticamente distintos. Em uma modalidade, um método da presente divulgação pode ser usado para determinar os genótipos em um conjunto de locais polimórficos e as razões relativas da quantidade de alelos diferentes presentes nesses locais. Em uma modalidade, os locais polimórficos podem consistir inteiramente em SNPs. Em uma modalidade, os locais polimórficos podem compreender SNPs, repetições em tandem simples e outros polimorfismos. Em uma modalidade, um método da presente divulgação pode ser usado para determinar as distribuições relativas de alelos em um conjunto de locais polimórficos em uma mistura de DNA, em que a mistura de DNA compreende DNA que se origina de um receptor de transplante e DNA que se origina de um transplante. Em uma modalidade, as distribuições conjuntas de alelos podem ser determinadas em uma mistura de DNA isolado do sangue de um receptor de transplante. Em uma modalidade, as distribuições de alelos em um conjunto de locais podem ser usadas para determinar os estados de rejeição ao transplante e/ou o de lesão de um transplante.
[0275] Em uma modalidade, a mistura de moléculas de DNA pode ser derivada de DNA extraído de múltiplas células de um indivíduo. Em uma modalidade, a coleção original de células da qual o DNA é derivado pode compreender uma mistura de células diploides ou haploides de genótipos iguais ou diferentes, se esse indivíduo for mosaico (linha germinativa ou somática). Em uma modalidade, a mistura de moléculas de DNA também pode ser derivada de DNA extraído de células únicas. Em uma modalidade, a mistura de moléculas de DNA também pode ser derivada de DNA extraído da mistura de duas ou mais células do mesmo indivíduo ou de indivíduos diferentes. Em uma modalidade, a mistura de moléculas de DNA pode ser derivada de DNA isolado de material biológico que já foi liberado de células,
como plasma sanguíneo, que é conhecido por conter DNA livre de células. Em uma modalidade, este material biológico pode ser uma mistura de DNA de um ou mais indivíduos, como é o caso durante a gravidez, em que foi demonstrado que o DNA fetal está presente na mistura. Em uma modalidade, o material biológico pode ser de uma mistura de células que foram encontradas no sangue do receptor de transplante, em que algumas das células se originam do transplante.
SONDAS DE CIRCULARIZAÇÃO
[0276] Algumas modalidades da presente divulgação envolvem o uso de "Sondas Invertidas Ligadas" (LIPs), que foram descritas anteriormente na literatura. LIPs é um termo genérico que se destina a englobar tecnologias que envolvem a criação de uma molécula circular de DNA, em que as sondas são projetadas para hibridizar à região-alvo do DNA em qualquer um dos lados de um alelo-alvo, de modo que a adição de polimerases e/ou ligases apropriadas e as condições apropriadas, tampões e outros reagentes, completem a região invertida complementar do DNA através do alelo-alvo para criar um laço circular de DNA que captura as informações encontradas no alelo-alvo. As LIPs também podem ser chamadas de sondas pré-circularizadas, sondas de pré-circularização ou sondas de circularização. A sonda tipo LIPs pode ser uma molécula de DNA linear entre 50 e 500 nucleotídeos de comprimento e, em uma modalidade, entre 70 e 100 nucleotídeos de comprimento; em algumas modalidades, pode ser mais longa ou mais curta do que descrito aqui. Outras modalidades da presente divulgação envolvem diferentes encarnações da tecnologia LIPs, tais como Sondas de Cadeado e SONDAS DE INVERSÃO MOLECULAR (MIPs).
[0277] Um método para alvejar locais específicos para sequenciamento é sintetizar sondas em que as extremidades 3' e 5' das sondas se anelam para alvejar o DNA em locais adjacentes e em qualquer um dos lados da região-alvo, de maneira invertida, de modo que a adição de DNA polimerase e DNA ligase resulte na extensão da extremidade 3’, adicionando bases à sonda de fita simples que são complementares à molécula-alvo (preenchimento de vão), seguido pela ligação da nova extremidade 3' à extremidade 5’ da sonda original, resultando em uma molécula de DNA circular que pode ser subsequentemente isolada do DNA de fundo. As extremidades da sonda são projetadas para flanquear a região-alvo de interesse. Um aspecto dessa abordagem é comumente chamado de MIPS e tem sido usado em conjunto com tecnologias de arranjo para determinar a natureza da sequência preenchida. Uma desvantagem do uso de MIPs no contexto de medição de razões de alelos é que as etapas de hibridização, circularização e amplificação não ocorreram em taxas iguais para diferentes alelos nos mesmos locais. Isso resulta em razões de alelos medidas que não são representativas das reais razões de alelos presentes na mistura original.
[0278] Em uma modalidade, as sondas de circularização são construídas de modo que a região da sonda que é projetada para hibridizar a montante do local polimórfico alvejado e a região da sonda que é projetada para hibridizar a jusante do local polimórfico alvejado sejam covalentemente conectadas através de uma cadeia principal não ácido nucléico. Esta cadeia principal pode ser qualquer molécula biocompatível ou combinação de moléculas biocompatíveis. Alguns exemplos de moléculas biocompatíveis possíveis são poli(etilenoglicol), policarbonatos, poliuretanos, polietilenos, polipropilenos, polímeros de sulfona, silicone, celulose, fluoropolímeros, compostos acrílicos, copolímeros de bloco de estireno e outros copolímeros de bloco.
[0279] Em uma modalidade da presente divulgação, esta abordagem foi modificada para ser facilmente passível de sequenciamento como meio de interrogar a sequência preenchida. A fim de reter as proporções alélicas originais da amostra original, pelo menos uma consideração-chave deve considerada. As posições variáveis entre diferentes alelos na região de preenchimento de vão não devem estar muito próximas aos sítios de ligação da sonda, pois pode haver polarização de iniciação pela DNA polimerase,
resultando em diferencial das variantes. Outra consideração é que variações adicionais podem estar presentes nos sítios de ligação da sonda que estão correlacionados com as variantes na região de preenchimento de vão, que pode resultar na amplificação desigual de diferentes alelos. Em uma modalidade da presente divulgação, as extremidades 3' e 5' da sonda pré- circularizada são projetadas para hibridizar a bases que estão a uma ou algumas posições de distância das posições de variantes (sítios polimórficos) do alelo alvejado. O número de bases entre o sítio polimórfico (SNP ou outro) e a base à qual a extremidade 3’ e/ou 5' da sonda pré-circularizada é projetada para hibridizar pode ser de uma base, pode ser de duas bases, pode ser de três bases, pode ser de quatro bases, pode ser de cinco bases, pode ser de seis bases, pode ser de sete a dez bases, pode ser de onze a quinze bases ou pode ser de dezesseis a vinte bases, vinte a trinta bases ou trinta a sessenta bases. Os iniciadores direto e reverso podem ser projetados para hibridizar um número diferente de bases de distância do sítio polimórfico. As sondas de circularização podem ser geradas em grandes números com a tecnologia de síntese de DNA atual, permitindo que um grande número de sondas seja gerado e potencialmente disposto em pool, permitindo a interrogação de muitos locais simultaneamente. Foi relatado que funciona com mais de 300.000 sondas. Dois artigos que discutem um método envolvendo sondas de circularização que pode ser usado para medir os dados genômicos do indivíduo-alvo incluem: Porreca et al., Nature Methods, 2007 4 (11), páginas 931 a 936; e também Turner et al., Nature Methods, 2009, 6(5), páginas 315 a
316. Os métodos descritos nestes artigos podem ser usados em combinação com outros métodos aqui descritos. Certas etapas do método destes dois artigos podem ser usadas em combinação com outras etapas de outros métodos aqui descritos.
[0280] Em algumas modalidades dos métodos aqui divulgados, o material genético do indivíduo-alvo é opcionalmente amplificado, seguido pela hibridização das sondas pré-circularizadas, realizando um preenchimento de vão para preencher as bases entre as duas extremidades das sondas hibridizadas, ligando as duas extremidades para formar uma sonda circularizada e amplificando a sonda circularizada, usando, por exemplo, amplificação por círculo rolante. Uma vez que as informações genéticas alélicas-alvo desejadas são capturadas por circularização de sondas oligonucleicas apropriadamente projetadas, tal como no sistema de LIPs, a sequência genética das sondas circularizadas pode ser medida para fornecer os dados de sequência desejados. Em uma modalidade, as sondas de oligonucleotídeos apropriadamente projetadas podem ser circularizadas diretamente no material genético não amplificado do indivíduo-alvo e amplificadas posteriormente. Observa-se que uma série de procedimentos de amplificação podem ser usados para amplificar o material genético original ou as LIPs circularizadas, incluindo amplificação por círculo rolante, MDA ou outros protocolos de amplificação. Diferentes métodos podem ser usados para medir a informação genética no genoma-alvo, por exemplo, usando sequenciamento de alto rendimento, sequenciamento de Sanger, outros métodos de sequenciamento, captura por hibridização, captura por circularização, PCR multiplex, outros métodos de hibridização e combinações dos mesmos.
[0281] Uma vez que o material genético do indivíduo tenha sido medido usando um ou uma combinação dos métodos acima, um método baseado em informática, junto com as medições genéticas apropriadas, pode, então, ser usado para determinar o estado do transplante de um receptor de transplante.
[0282] A aplicação de um método baseado em informática para determinar o estado do transplante de um receptor de transplante a partir de dados genéticos conforme medidos por arranjos de hibridização, como o arranjo ILLUMINA INFINIUM ou o chip do gene AFFYMETRIX, foi descrita em referências de documentos em outras partes deste documento. No entanto, o método descrito neste documento mostra melhorias em relação aos métodos descritos anteriormente na literatura. Por exemplo, a abordagem baseada em LIPs seguida por sequenciamento de alto rendimento fornece inesperadamente melhores dados genotípicos devido ao fato de a abordagem ter melhor capacidade para multiplexação, melhor especificidade de captura, melhor uniformidade e baixa polarização alélica. A maior multiplexação permite que mais alelos sejam alvejados, fornecendo resultados mais precisos. Uma melhor uniformidade resulta em mais alelos- alvo sendo medidos, fornecendo resultados mais precisos. Taxas mais baixas de polarização alélica resultam em taxas mais baixas de chamadas incorretas, fornecendo resultados mais precisos. Resultados mais precisos resultam em uma melhora nos resultados clínicos e melhor atendimento médico.
[0283] É importante notar que os LIPs podem ser usados como um método para alvejar locais específicos em uma amostra de DNA para genotipagem por métodos diferentes de sequenciamento. Por exemplo, os LIPs podem ser usados para alvejar o DNA para genotipagem usando arranjos de SNP ou outros microarranjos com base em DNA ou RNA.
PCR MEDIADA POR LIGAÇÃO
[0284] PCR mediada por ligação é o método de PCR usado para enriquecer preferencialmente uma amostra de DNA pela amplificação de um ou uma pluralidade de locais em uma mistura de DNA, em que o método compreende: a obtenção de um conjunto de pares de iniciadores, em que cada iniciador no par contém uma sequência alvo- específica e uma sequência não alvo, em que a sequência alvo-específica é projetada para hibridizar a uma região-alvo, uma a montante e uma a jusante do sítio polimórfico, e que pode ser separada do sítio polimórfico por 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 a 20, 21 a 30, 31 a 40, 41 a 50, 51 a 100 ou mais de 100; polimerização do DNA da extremidade de 3-prime do iniciador a montante para preencher a região de fita simples entre ela e a extremidade de 5-prime do iniciador a jusante com nucleotídeos complementares à molécula-alvo; ligação da última base polimerizada do iniciador a montante à base de 5-prime adjacente do iniciador a jusante; e amplificação de apenas moléculas polimerizadas e ligadas usando as sequências não alvo contidas na extremidade de 5-prime do iniciador a montante e na extremidade de 3-prime do iniciador a jusante. Pares de iniciadores para alvos distintos podem ser misturados na mesma reação. As sequências não alvo servem como sequências universais, de modo que todos os pares de iniciadores que foram polimerizados e ligados com sucesso possam ser amplificados com um único par de iniciadores de amplificação.
CAPTURA POR HIBRIDIZAÇÃO
[0285] O enriquecimento preferencial de um conjunto específico de sequências em um genoma-alvo pode ser realizado de várias maneiras. Em outra parte deste documento há uma descrição de como as LIPs podem ser usadas para alvejar um conjunto específico de sequências, porém, em todas essas aplicações, outros métodos de alvejamento e/ou enriquecimento preferencial podem ser usados igualmente bem para os mesmos fins. Um exemplo de outro método de alvejamento é a abordagem de captura por hibridização. Alguns exemplos de tecnologias de captura por hibridização comerciais incluem SURE SELECT da AGILENT e TRUSEQ da ILLUMINA. Na captura por hibridização, um conjunto de oligonucleotídeos que é complementar ou principalmente complementar às sequências-alvo desejadas pode hibridizar a uma mistura de DNA e, em seguida, ser fisicamente separado da mistura. Uma vez que as sequências desejadas tiverem hibridizado aos oligonucleotídeos de alvejamento, o efeito da remoção física dos oligonucleotídeos de alvejamento é remover também as sequências alvejadas. Uma vez que os oligos hibridizados forem removidos, eles podem ser aquecidos acima de sua temperatura de fusão e podem ser amplificados. Algumas maneiras de remover fisicamente os oligonucleotídeos de alvejamento são por ligação covalente dos oligos de alvejamento a um suporte sólido, por exemplo, uma microesfera magnética ou um chip. Outra maneira de remover fisicamente os oligonucleotídeos de alvejamento é ligando-os covalentemente a uma porção química molecular com uma forte afinidade para outra porção química molecular. Um exemplo desse par molecular é a biotina e a estreptavidina, tal como é usado em SURE SELECT. Assim, essas sequências alvejadas podem ser covalentemente ligadas a uma molécula de biotina e, após a hibridização, um suporte sólido com estreptavidina afixada pode ser usado para puxar para baixo os oligonucleotídeos biotinilados, aos quais são hibridizadas as sequências-alvo.
[0286] A captura híbrida envolve a hibridização de sondas, que são complementares aos alvos de interesse, às moléculas-alvo. As sondas de captura híbridas foram originalmente desenvolvidas para alvejar e enriquecer grandes frações do genoma com relativa uniformidade entre os alvos. Nesta aplicação, era importante que todos os alvos fossem amplificados com uniformidade suficiente para que todas as regiões pudessem ser detectadas por sequenciamento, no entanto, nenhuma consideração foi dada à retenção da proporção de alelos na amostra original. Após a captura, os alelos presentes na amostra podem ser determinados por sequenciamento direto das moléculas capturadas. Essas leituras de sequenciamento podem ser analisadas e contadas de acordo com o tipo de alelo. No entanto, usando a tecnologia atual, as distribuições de alelos medidas nas sequências capturadas normalmente não são representativas das distribuições de alelos originais.
[0287] Em uma modalidade, a detecção dos alelos é realizada por sequenciamento. Para capturar a identidade do alelo no sítio polimórfico, é essencial que a leitura do sequenciamento abranja o alelo em questão para avaliar a composição alélica dessa molécula capturada. Uma vez que as moléculas de captura são frequentemente de comprimentos variáveis mediante o sequenciamento, não pode ser garantido que se sobreponham às posições de variantes, a menos que toda a molécula seja sequenciada. No entanto, considerações de custo, bem como limitações técnicas quanto ao comprimento máximo possível e precisão de leituras de sequenciamento, tornam o sequenciamento de toda a molécula inviável. Em uma modalidade, o comprimento de leitura poder ser aumentado de cerca de 30 para cerca de 50 ou cerca de 70 bases pode aumentar muito o número de leituras que se sobrepõem às posições de variantes dentro das sequências-alvo.
[0288] Outra forma de aumentar o número de leituras que interrogam a posição de interesse é diminuir o comprimento da sonda, desde que não resulte em polarização nos alelos enriquecidos subjacentes. O comprimento da sonda sintetizada deve ser longo o suficiente para que duas sondas projetadas para hibridizar a dois alelos diferentes encontrados em um local hibridizem com afinidade quase igual aos vários alelos na amostra original. Atualmente, os métodos conhecidos na técnica descrevem sondas que são normalmente mais longas do que 120 bases. Em uma modalidade atual, se o alelo tiver uma ou algumas bases, então, as sondas de captura podem ter menos do que cerca de 110 bases, menos do que cerca de 100 bases, menos do que cerca de 90 bases, menos do que cerca de 80 bases, menos do que cerca de 70 bases, menos do que cerca de 60 bases, menos do que cerca de 50 bases, menos do que cerca de 40 bases, menos do que cerca de 30 bases e menos do que cerca de 25 bases, e isso é suficiente para assegurar o enriquecimento igual de todos os alelos. Quando a mistura de DNA a ser enriquecida usando a tecnologia de captura híbrida é uma mistura que compreende DNA de flutuação livre isolado de sangue, por exemplo, sangue materno, o comprimento médio do DNA é bastante curto, normalmente menos de 200 bases. O uso de sondas mais curtas resulta em uma chance maior de que as sondas de captura híbridas capturem os fragmentos de DNA desejados. Variações maiores podem exigir sondas mais longas. Em uma modalidade, as variações de interesse têm de uma (um SNP) a algumas bases de comprimento. Em uma modalidade, as regiões-alvo no genoma podem ser preferencialmente enriquecidas usando sondas de captura híbridas, em que as sondas de captura híbridas têm um comprimento abaixo de 90 bases e podem ter menos de 80 bases, menos de 70 bases, menos de 60 bases, menos de 50 bases, menos de 40 bases, menos de 30 bases ou menos de 25 bases. Em uma modalidade, para aumentar a chance de que o alelo desejado seja sequenciado, o comprimento da sonda que é projetada para hibridizar às regiões que flanqueiam a localização do alelo polimórfico pode ser diminuído de acima de 90 bases, a cerca de 80 bases, ou a cerca de 70 bases, ou a cerca de 60 bases, ou a cerca de 50 bases, ou a cerca de 40 bases, ou a cerca de 30 bases ou a cerca de 25 bases.
[0289] Há uma sobreposição mínima entre a sonda sintetizada e a molécula-alvo para permitir a captura. Esta sonda sintetizada pode ser tão curta quanto possível, embora ainda seja maior do que esta sobreposição mínima exigida. O efeito de usar um comprimento de sonda mais curto para alvejar uma região polimórfica é que haverá mais moléculas que se sobrepõem à região do alelo-alvo. O estado de fragmentação das moléculas de DNA originais também afeta o número de leituras que irão se sobrepor aos alelos-alvo. Algumas amostras de DNA, como as amostras de plasma, já são fragmentadas devido a processos biológicos que ocorrem in vivo. No entanto, as amostras com fragmentos mais longos se beneficiam da fragmentação antes do enriquecimento e preparação da biblioteca de sequenciamento. Quando tanto as sondas quanto os fragmentos são curtos (~ 60 a 80 pb), a especificidade máxima pode ser alcançada com relativamente poucas leituras de sequência falhando em se sobrepor à região crítica de interesse.
[0290] Em uma modalidade, as condições de hibridização podem ser ajustadas para maximizar a uniformidade na captura de diferentes alelos presentes na amostra original. Em uma modalidade, as temperaturas de hibridização são diminuídas para minimizar as diferenças na polarização de hibridização entre os alelos. Os métodos conhecidos na técnica evitam o uso de temperaturas mais baixas para a hibridização porque a redução da temperatura tem o efeito de aumentar a hibridização de sondas aos alvos indesejados. No entanto, quando o objetivo é preservar as razões de alelos com fidelidade máxima, a abordagem de usar temperaturas de hibridização mais baixas fornece razões de alelos perfeitamente precisas,
apesar do fato de que a técnica atual ensina a evitar esta abordagem. A temperatura de hibridização também pode ser aumentada para exigir maior sobreposição entre o alvo e a sonda sintetizada, de modo que apenas os alvos com sobreposição substancial da região-alvo sejam capturados. Em algumas modalidades da presente divulgação, a temperatura de hibridização é reduzida a partir da temperatura de hibridização normal a cerca de 40 ºC, a cerca de 45 ºC, a cerca de 50 ºC, a cerca de 55 ºC, a cerca de 60 ºC, a cerca de 65 ºC ou a cerca de 70 ºC.
[0291] Em uma modalidade, as sondas de captura híbridas podem ser projetadas de modo que a região da sonda de captura com DNA que é complementar ao DNA encontrado nas regiões que flanqueiam o alelo polimórfico não seja imediatamente adjacente ao sítio polimórfico. Em vez disso, a sonda de captura pode ser projetada de modo que a região da sonda de captura que é projetada para hibridizar ao DNA que flanqueia o sítio polimórfico do alvo seja separada da porção da sonda de captura que estará em contato de van der Waals com o sítio polimórfico por uma pequena distância que é equivalente em comprimento a uma ou um pequeno número de bases. Em uma modalidade, a sonda de captura híbrida é projetada para hibridizar a uma região que flanqueia o alelo polimórfico, mas não o cruza; isso pode ser denominado uma sonda de captura de flanqueamento. O comprimento da sonda de captura de flanqueamento pode ser menor que cerca de 120 bases, menor que cerca de 110 bases, menor que cerca de 100 bases, menor que cerca de 90 bases, e pode ser menor que cerca de 80 bases, menor que cerca de 70 bases, menor que cerca de 60 bases, menor que cerca de 50 bases, menor que cerca de 40 bases, menor que cerca de 30 bases, ou menor que cerca de 25 bases. A região do genoma que é alvejada pela sonda de captura de flanqueamento pode ser separada pelo local polimórfico por 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 a 20, ou mais de 20 pares de bases.
[0292] Descrição de um teste de rastreamento de doenças baseado em captura alvejada usando captura de sequência alvejada.
Captura de sequência alvejada personalizada, como aquelas oferecidas atualmente pela AGILENT (SURE SELECT), ROCHE-NIMBLEGEN ou ILLUMINA. As sondas de captura podem ser projetadas de forma personalizada para garantir a captura de vários tipos de mutações. Para mutações pontuais, uma ou mais sondas que se sobrepõem à mutação pontual devem ser suficientes para capturar e sequenciar a mutação.
[0293] Para pequenas inserções ou deleções, uma ou mais sondas que se sobrepõem à mutação podem ser suficientes para capturar e sequenciar fragmentos que compreendem a mutação. A hibridização pode ser menos eficiente entre a eficiência de captura de limitação de sonda, normalmente projetada para a sequência do genoma de referência. Para garantir a captura de fragmentos que compreendem a mutação, pode-se projetar duas sondas, uma compatível com o alelo normal e outra compatível com o alelo mutante. Uma sonda mais longa pode aumentar a hibridização. Múltiplas sondas sobrepostas podem melhorar a captura. Finalmente, colocar uma sonda imediatamente adjacente, mas não sobreposta, à mutação pode permitir eficiência de captura relativamente semelhante dos alelos normais e mutantes.
[0294] Para Repetições em Tandem Simples (STRs), é improvável que uma sonda que se sobreponha a esses sítios altamente variáveis capture bem o fragmento. Para melhorar a captura, uma sonda pode ser colocada adjacente, mas não sobreposta ao sítio variável. O fragmento pode, então, ser sequenciado normalmente para revelar o comprimento e a composição da STR.
[0295] Para grandes deleções, uma série de sondas sobrepostas, uma abordagem comum atualmente usada em sistemas de captura de exoma, pode funcionar. No entanto, com esta abordagem, pode ser difícil determinar se um indivíduo é ou não heterozigótico. Alvejar e avaliar SNPs na região capturada pode revelar potencialmente a perda de heterozigosidade em toda a região, indicando que um indivíduo é um portador.
Em uma modalidade, é possível colocar sondas não sobrepostas ou de singleton através da região potencialmente deletada e usar o número de fragmentos capturados como uma medida de heterozigosidade. No caso em que um indivíduo porta uma grande deleção, espera-se que metade do número de fragmentos esteja disponível para captura em relação a um local de referência não deletado (diploide). Consequentemente, o número de leituras obtido a partir das regiões excluídas deve ser aproximadamente a metade do obtido em um local diploide normal. Agregar e calcular a média da profundidade de leitura de sequenciamento de várias sondas de singleton em toda a região potencialmente excluída pode aumentar o sinal e melhorar a confiança do diagnóstico. As duas abordagens, alvejamento de SNPs para identificar a perda de heterozigosidade e utilização de várias sondas de singleton para obter uma medida quantitativa da quantidade de fragmentos subjacentes desse local também podem ser combinadas. Uma ou ambas essas estratégias podem ser combinadas com outras estratégias para obter melhor o mesmo fim.
[0296] Existem várias maneiras de diminuir a variabilidade da profundidade de leitura (DOR): por exemplo, pode-se aumentar as concentrações de iniciador, pode-se usar sondas de amplificação de alvejamento mais longas ou pode-se executar mais ciclos de STA (como mais de 25, mais de 30, mais de 35 ou até mais de 40)
PCR ALVEJADA
[0297] Em algumas modalidades, a PCR pode ser usada para alvejar locais específicos do genoma. Em amostras de plasma, o DNA original é altamente fragmentado (normalmente menos de 500 pb, com um comprimento médio menor que 200 pb). Na PCR, tanto os iniciadores diretos quanto os reversos devem hibridizar ao mesmo fragmento para permitir a amplificação. Portanto, se os fragmentos forem curtos, os ensaios de PCR também devem amplificar regiões relativamente curtas. Como MIPS, se as posições polimórficas estiverem muito próximas do sítio de ligação da polimerase, isso pode resultar em polarizações na amplificação de diferentes alelos. Atualmente, os iniciadores de PCR que têm como alvo regiões polimórficas, tais como aquelos contendo SNPs, são tipicamente projetados de modo que a extremidade 3’ do iniciador hibridize à base imediatamente adjacente à base ou bases polimórficas. Em uma modalidade da presente divulgação, as extremidades 3’ de ambos os iniciadores de PCR direta e reverso são projetadas para hibridizar a bases que estão a uma ou algumas posições de distância das posições de variantes (sítios polimórficos) do alelo alvejado. O número de bases entre o sítio polimórfico (SNP ou outro) e a base à qual a extremidade 3’ do iniciador é projetada para hibridizar pode ser uma base, pode ser de duas bases, pode ser de três bases, pode ser de quatro bases, pode ser de cinco bases, pode ser de seis bases, pode ser de sete a dez bases, pode ser de onze a quinze bases, ou pode ser de dezesseis a vinte bases. Os iniciadores direto e reverso podem ser projetados para hibridizar um número diferente de bases de distância do sítio polimórfico.
[0298] O ensaio de PCR pode ser gerado em grandes números, no entanto, as interações entre diferentes ensaios de PCR tornam difícil multiplexá-los além de cerca de cem ensaios. Várias abordagens moleculares complexas podem ser usadas para aumentar o nível de multiplexação, mas ainda pode ser limitado a menos de 100, talvez 200 ou possivelmente 500 ensaios por reação. Amostras com grandes quantidades de DNA podem ser divididas entre múltiplas sub-reações e, então, recombinadas antes do sequenciamento. Para amostras em que a amostra geral ou alguma subpopulação de moléculas de DNA é limitada, a divisão da amostra introduziria ruído estatístico. Em uma modalidade, uma quantidade pequena ou limitada de DNA pode se referir a uma quantidade abaixo de 10 pg, entre 10 e 100 pg, entre 100 pg e 1 ng, entre 1 e 10 ng ou entre 10 e 100 ng. Observa-se que, embora este método seja particularmente útil em pequenas quantidades de DNA, em que outros métodos que envolvem a divisão em vários pools podem causar problemas significativos relacionados ao ruído estocástico introduzido, este método ainda fornece o benefício de minimizar a polarização quando é executado em amostras de qualquer quantidade de DNA. Nessas situações, uma etapa de pré-amplificação universal pode ser usada para aumentar a quantidade geral da amostra. Idealmente, esta etapa de pré- amplificação não deve alterar apreciavelmente as distribuições alélicas.
[0299] Em uma modalidade, um método da presente divulgação pode gerar produtos de PCR que são específicos para um grande número de locais alvejados, especificamente 1.000 a 5.000 locais, 5.000 a
10.000 locais ou mais de 10.000 locais, para genotipagem por sequenciamento ou algum outro método de genotipagem, a partir de amostras limitadas, como células únicas ou DNA de fluidos corporais. Atualmente, a realização de reações de PCR multiplex de mais de 5 a 10 alvos apresenta um grande desafio e é frequentemente dificultada por produtos secundários de iniciador, como dímeros de iniciador e outros artefatos. Ao detectar sequências-alvo usando microarranjos com sondas de hibridização, dímeros de iniciador e outros artefatos podem ser ignorados, pois não são detectados. No entanto, ao usar o sequenciamento como um método de detecção, a grande maioria das leituras de sequenciamento sequenciaria esses artefatos e não as sequências- alvo desejadas em uma amostra. Os métodos descritos na técnica anterior usados para multiplexar mais de 50 ou 100 reações em uma reação seguida por sequenciamento resultarão tipicamente em mais de 20%, e muitas vezes mais de 50%, em muitos casos mais de 80% e em alguns casos mais de 90% de leituras de sequência fora do alvo.
[0300] Em geral, para realizar o sequenciamento alvejado de múltiplos (n) alvos de uma amostra (maior que 50, maior que 100, maior que 500 ou maior que 1.000), pode-se dividir a amostra em uma série de reações paralelas que amplificam um alvo individual. Isso tem sido realizado em placas de múltiplos poços de PCR ou pode ser feito em plataformas comerciais, como FLUIDIGM ACCESS ARRAY (48 reações por amostra em chips microfluídicos) ou DROPLET PCR por RAIN DANCE TECHNOLOGY
(centenas a alguns milhares de alvos). Infelizmente, esses métodos de divisão e pool são problemáticos para amostras com uma quantidade limitada de DNA, já que muitas vezes não há cópias do genoma suficientes para garantir que haja uma cópia de cada região do genoma em cada poço. Este é um problema especialmente grave quando os locais polimórficos são alvejados e as proporções relativas dos alelos nos locais polimórficos são necessárias, já que o ruído estocástico introduzido pela divisão e formação de pool causará medições de precisão muito precária das proporções dos alelos que estavam presentes na amostra original de DNA. É descrito aqui um método para amplificar de forma efetiva e eficiente muitas reações de PCR que é aplicável a casos em que apenas uma quantidade limitada de DNA está disponível. Em uma modalidade, o método pode ser aplicado para análise de células únicas, fluidos corporais, misturas de DNA, como o DNA de flutuação livre encontrado no plasma do receptor de transplante, biópsias, amostras ambientais e/ou forenses.
[0301] Em uma modalidade, o sequenciamento alvejado pode envolver uma, uma pluralidade ou todas as etapas a seguir. a) Gerar e amplificar uma biblioteca com sequências adaptadoras em ambas as extremidades dos fragmentos de DNA. b) Dividir em várias reações após a amplificação da biblioteca. c) Gerar e opcionalmente amplificar uma biblioteca com sequências adaptadoras em ambas as extremidades dos fragmentos de DNA. d) Realize amplificação de 1.000 a 10.000-plex de alvos selecionados usando um iniciador “direto” alvo-específico por alvo e um iniciador etiqueta- específico. e) Executar uma segunda amplificação a partir deste produto usando iniciadores alvo-específicos “reversos” e um (ou mais) iniciador específico para uma etiqueta universal que foi introduzido como parte dos iniciadores diretos alvo-específicos na primeira rodada. f) Executar uma pré- amplificação de 1.000-plex do alvo selecionado por um número limitado de ciclos. g) Dividir o produto em múltiplas alíquotas e amplificar subpool de alvos em reações individuais (por exemplo, 50 a 500-plex, embora isso possa ser usado até singleplex. h) Formar pool de produtos de reações de subpools paralelas. i) Durante essas amplificações, os iniciadores podem portar etiquetas compatíveis de sequenciamento (comprimento parcial ou total) de modo que os produtos possam ser sequenciados.
PCR ALTAMENTE MULTIPLEXADA
[0302] São divulgados aqui métodos que permitem a amplificação alvejada de mais de cem a dezenas de milhares de sequências- alvo (por exemplo, locais de SNP) de DNA genômico obtido do plasma. A amostra amplificada pode ser relativamente livre de produtos de dímero de iniciador e ter baixa polarização alélica em locais-alvo. Se durante ou após a amplificação os produtos forem anexados com adaptadores compatíveis de sequenciamento, a análise desses produtos pode ser realizada por sequenciamento.
[0303] A realização de uma amplificação de PCR altamente multiplexada usando métodos conhecidos na técnica resulta na geração de produtos de dímero de iniciador que estão em excesso dos produtos de amplificação desejados e não adequados para sequenciamento. Estes podem ser reduzidos empiricamente eliminando os iniciadores que formam esses produtos ou realizando uma seleção in silico de iniciadores. Porém, quanto maior o número de ensaios, mais difícil se torna este problema.
[0304] Uma solução é dividir a reação 5.000-plex em várias amplificações de plexo inferior, por exemplo, cem reações de 50-plex ou cinquenta reações de 100-plex, ou usar microfluídicos ou mesmo dividir a amostra em reações de PCR individuais. No entanto, se o DNA da amostra for limitado, como em diagnósticos pré-natais não invasivos de plasma de gravidez, a divisão da amostra entre múltiplas reações deve ser evitada, pois isso resultará em formação de gargalos.
[0305] São descritos aqui métodos para, primeiro, amplificar globalmente o DNA de plasma de uma amostra e, em seguida, dividir a amostra em múltiplas reações de enriquecimento de alvo multiplexadas com números mais moderados de sequências-alvo por reação. Em uma modalidade, um método da presente divulgação pode ser usado para enriquecer preferencialmente uma mistura de DNA em uma pluralidade de locais, em que o método compreende uma ou mais das seguintes etapas: gerar e amplificar uma biblioteca a partir de uma mistura de DNA, em que as moléculas na biblioteca têm sequências adaptadoras ligadas em ambas as extremidades dos fragmentos de DNA, dividir a biblioteca amplificada em múltiplas reações, realizar uma primeira rodada de amplificação multiplex de alvos selecionados usando um iniciador "direto" alvo-específico por alvo e um ou uma pluralidade de iniciadores “reversos” universais adaptador-específicos. Em uma modalidade, um método da presente divulgação inclui ainda a realização de uma segunda amplificação usando iniciadores alvo-específicos “reversos" e um ou uma pluralidade de iniciadores específicos para uma etiqueta universal que foram introduzidos como parte dos iniciadores diretos alvo-específicos na primeira rodada. Em uma modalidade, o método pode envolver uma abordagem de PCR totalmente aninhada, hemianinhada, semianinhada, unilateral totalmente aninhada, unilateral hemianinhada ou unilateral semianinhada. Em uma modalidade, um método da presente divulgação é usado para enriquecer preferencialmente uma mistura de DNA em uma pluralidade de locais, em que o método compreende a realização de uma pré-amplificação multiplex de alvos selecionados por um número limitado de ciclos, dividindo o produto em múltiplas alíquotas e amplificando subpools de alvos em reações individuais e produtos de formação de pool de reações de subpools paralelas. Observa-se que esta abordagem poderia ser usada para realizar a amplificação alvejada de uma maneira que resultaria em níveis baixos de polarização alélica para 50 a 500 locais, para 500 a 5.000 locais, para 5.000 a 50.000 locais, ou mesmo para 50.000 a 500.000 locais. Em uma modalidade, os iniciadores carregam etiquetas compatíveis de sequenciamento de comprimento total ou parcial.
[0306] O fluxo de trabalho pode envolver (1) extração de DNA de plasma, (2) preparação da biblioteca de fragmentos com adaptadores universais em ambas as extremidades dos fragmentos, (3) amplificação da biblioteca usando iniciadores universais específicos para os adaptadores, (4) divisão da "biblioteca" de amostra amplificada em múltiplas alíquotas, (5) realização de amplificações multiplex (por exemplo, cerca de 100- plex, 1.000 ou 10.000-plex com um iniciador alvo-específico por alvo e um iniciador etiqueta-específico) em alíquotas, (6) formação de pool de alíquotas de uma amostra, (7) codificação em barras da amostra, (8) mistura das amostras e ajuste da concentração, (9) sequenciamento da amostra. O fluxo de trabalho pode compreender várias subetapas que contêm uma das etapas listadas (por exemplo, a etapa (2) de preparação da etapa da biblioteca pode envolver três etapas enzimáticas (extremidade cega, cauda de dA e ligação do adaptador) e três etapas de purificação). As etapas do fluxo de trabalho podem ser combinadas, divididas ou executadas em ordem diferente (por exemplo, codificação em barras e formação de pool de amostras).
[0307] É importante notar que a amplificação de uma biblioteca pode ser realizada de tal forma que seja polarizada para amplificar fragmentos curtos de forma mais eficiente. Desta forma, é possível amplificar preferencialmente sequências mais curtas, por exemplo, fragmentos de DNA mononucleossômicos como o DNA fetal livre de células (de origem placentária) encontrado na circulação de mulheres grávidas. Observa-se que os ensaios de PCR podem ter as etiquetas, por exemplo, etiquetas de sequenciamento (geralmente uma forma truncada de 15 a 25 bases). Após a multiplexação, os multiplexes de PCR de uma amostra são dispostos em pool e, em seguida, as etiquetas são concluídas (incluindo a codificação em barras) por um PCR etiqueta-específico (também pode ser feito por ligação). Além disso, as etiquetas de sequenciamento completo podem ser adicionadas na mesma reação que a multiplexação. Nos primeiros ciclos, os alvos podem ser amplificados com os iniciadores alvo-específicos, subsequentemente os iniciadores etiqueta-específicos assumem para completar a sequência do adaptador SQ. Os iniciadores de PCR não podem conter etiquetas. As etiquetas de sequenciamento podem ser anexadas aos produtos de amplificação por ligação.
[0308] Em uma modalidade, a PCR altamente multiplex seguida pela avaliação do material amplificado por sequenciamento clonal pode ser usada para detectar o estado de rejeição ao transplante. Considerando que os PCRs multiplex tradicionais avaliam até cinquenta locais simultaneamente, a abordagem aqui descrita pode ser usada para permitir a avaliação simultânea de mais de 50 locais simultaneamente, mais de 100 locais simultaneamente, mais de 500 locais simultaneamente, mais de 1.000 locais simultaneamente, mais de 5.000 locais simultaneamente, mais de 10.000 locais simultaneamente, mais de 50.000 locais simultaneamente e mais de
100.000 locais simultaneamente. Experimentos mostraram que até, incluindo e mais de 10.000 locais distintos podem ser avaliados simultaneamente, em uma única reação, com eficiência e especificidade suficientemente boas para fazer chamadas de estado de transplante não invasivas com alta precisão. Os ensaios podem ser combinados em uma única reação com a totalidade de uma amostra de cfDNA isolada de plasma de receptor de transplante, uma fração deste ou um derivado processado adicional da amostra de cfDNA. O cfDNA ou derivado também pode ser dividido em múltiplas reações multiplex paralelas. A divisão e o multiplex ótimos da amostra são determinados pela troca de várias especificações de desempenho. Devido à quantidade limitada de material, a divisão da amostra em várias frações pode introduzir ruído de amostragem, tempo de manuseio e aumentar a possibilidade de erro. Por outro lado, a multiplexação mais alta pode resultar em maiores quantidades de amplificação espúria e maiores desigualdades na amplificação, ambas as quais podem reduzir o desempenho do teste.
[0309] Duas considerações cruciais relacionadas na aplicação dos métodos descritos neste documento são a quantidade limitada de plasma original e o número de moléculas originais naquele material a partir do qual a frequência do alelo ou outras medições são obtidas. Se o número de moléculas originais cair abaixo de um certo nível, o ruído de amostragem aleatória torna-se significativo e pode afetar a precisão do teste. Normalmente, os dados de qualidade suficiente para fazer diagnósticos de aneuploidia pré- natal não invasivos podem ser obtidos se as medições forem feitas em uma amostra compreendendo o equivalente a 500 a 1.000 moléculas originais por local-alvo. Existem várias maneiras de aumentar o número de medições distintas, por exemplo, aumentando o volume da amostra. Cada manipulação aplicada à amostra também resulta potencialmente em perdas de material. É essencial caracterizar as perdas incorridas por várias manipulações e evitar ou, conforme necessário, melhorar o rendimento de certas manipulações para evitar perdas que possam degradar o desempenho do teste.
[0310] Em uma modalidade, é possível mitigar perdas potenciais em etapas subsequentes amplificando toda ou uma fração da amostra de cfDNA original. Os seguintes métodos estão disponíveis para amplificar todo o material genético em uma amostra, aumentando a quantidade disponível para procedimentos posteriores. Em uma modalidade, fragmentos de DNA de PCR mediada por ligação (LM-PCR) são amplificados por PCR após a ligação de um dos adaptadores distintos, dois adaptadores distintos ou muitos adaptadores distintos. Em uma modalidade, a amplificação de deslocamento múltiplo (MDA) de phi-29 polimerase é usada para amplificar todo o DNA isotermicamente. No DOP-PCR e variações, a iniciação aleatória é usada para amplificar o DNA do material original. Cada método tem certas características, como uniformidade de amplificação em todas as regiões representadas do genoma, eficiência de captura e amplificação do DNA original e desempenho de amplificação com uma função do comprimento do fragmento.
[0311] Em uma modalidade, o LM-PCR pode ser usado com um único adaptador heteroduplexado tendo uma tirosina de 3- prime. O adaptador heteroduplexado permite o uso de uma única molécula adaptadora que pode ser convertida em duas sequências distintas nas extremidades de 5-prime e de 3-prime do fragmento de DNA original durante a primeira rodada de PCR. Em uma modalidade, é possível fracionar a biblioteca amplificada por separações de tamanho, ou produtos como AMPURE, TASS ou outros métodos semelhantes. Antes da ligação, o DNA da amostra pode ser de extremidade cega e, em seguida, uma única base de adenosina é adicionada à extremidade de 3-prime. Antes da ligação, o DNA pode ser clivado usando uma enzima de restrição ou algum outro método de clivagem. Durante a ligação, a adenosina de 3-prime dos fragmentos da amostra e a saliência de tirosina de 3-prime complementar do adaptador podem aumentar a eficiência da ligação. A etapa de extensão da amplificação por PCR pode ser limitada de um ponto de vista de tempo para reduzir a amplificação de fragmentos mais longos do que cerca de 200 pb, cerca de 300 pb, cerca de 400 pb, cerca de 500 pb ou cerca de 1.000 pb. Como o DNA mais longo encontrado no plasma do receptor de transplante é quase exclusivamente materno, isso pode resultar no enriquecimento do DNA fetal em 10 a 50% e na melhora do desempenho do teste. Várias reações foram realizadas usando as condições especificadas pelos kits disponíveis comercialmente; isso resultou na ligação bem-sucedida de menos de 10% das moléculas de DNA da amostra. Uma série de otimizações das condições de reação para isso melhorou a ligação a aproximadamente 70%. MINI-PCR
[0312] O projeto de ensaio de PCR tradicional resulta em perdas significativas de moléculas de ácido nucléico derivadas de doadores distintos, mas as perdas podem ser bastante reduzidas projetando ensaios de PCR muito curta, denominados ensaios de mini-PCR. O cfDNA no soro receptor é altamente fragmentado e os tamanhos dos fragmentos são distribuídos de forma aproximadamente gaussiana com uma média de 160 pb, um desvio padrão de 15 pb, um tamanho mínimo de cerca de 100 pb e um tamanho máximo de cerca de 220 pb. A distribuição de posições inicial e final do fragmento em relação aos polimorfismos alvejados, embora não necessariamente aleatória, varia amplamente entre os alvos individuais e entre todos os alvos coletivamente e o sítio polimórfico de um local-alvo particular pode ocupar qualquer posição do início ao fim entre os vários fragmentos provenientes desse local. Observa-se que o termo mini-PCR também pode se referir a PCR normal, sem restrições ou limitações adicionais.
[0313] Durante a PCR, a amplificação ocorrerá apenas a partir de fragmentos de DNA de molde compreendendo locais de iniciador direto e reverso. Visto que os fragmentos de cfDNA derivados do doador são curtos, a probabilidade de ambos os locais de iniciador estarem presentes, a probabilidade de um fragmento fetal de comprimento L compreendendo os locais de iniciador direto e reverso, é a razão entre o comprimento do amplicon e o comprimento do fragmento. Em condições ideais, os ensaios em que o amplicon é de 45, 50, 55, 60, 65 ou 70 pb amplificarão com sucesso de 72%, 69%, 66%, 63%, 59% ou 56%, respectivamente, das moléculas de fragmento de molde disponíveis. O comprimento do amplicon é a distância entre as extremidades de 5 iniciadores de iniciação direta e reversa. O comprimento do amplicon que é mais curto do que o tipicamente usado por aqueles conhecidos na técnica pode resultar em medições mais eficientes dos locais polimórficos desejados, exigindo apenas leituras de sequência curta. Em uma modalidade, uma fração substancial dos amplicons deve ser inferior a 100 pb, inferior a 90 pb, inferior a 80 pb, inferior a 70 pb, inferior a 65 pb, inferior a 60 pb, inferior a 55 pb, inferior a 50 pb ou inferior a 45 pb. Em algumas modalidades, os amplicons têm entre 50 a 100 pb de comprimento ou entre 60 e 80 pb de comprimento. Em algumas modalidades, os amplicons têm cerca de 65 pb de comprimento.
[0314] Observa-se que em métodos conhecidos na técnica anterior, ensaios curtos como os descritos neste documento, são geralmente evitados porque não são necessários e impõem uma restrição considerável no projeto do iniciador, limitando o comprimento do iniciador, as características de hibridização e a distância entre o iniciador direto e reverso.
[0315] Observa-se também que há o potencial para amplificação polarizada se a extremidade de 3-prime de qualquer um dos iniciadores estiver dentro de aproximadamente 1 a 6 bases do sítio polimórfico. Essa diferença de base única no local da ligação inicial da polimerase pode resultar na amplificação preferencial de um alelo, o que pode alterar as frequências alélicas observadas e degradar o desempenho. Todas essas restrições tornam muito desafiador identificar iniciadores que amplificarão um local específico com sucesso e, além disso, projetar grandes conjuntos de iniciadores que sejam compatíveis na mesma reação multiplex. Em uma modalidade, a extremidade 3’ dos iniciadores diretos e reversos interiores é projetada para hibridizar a uma região de DNA a montante do sítio polimórfico e separada do sítio polimórfico por um pequeno número de bases. Idealmente, o número de bases pode estar entre 6 e 10 bases, mas pode igualmente estar entre 4 e 15 bases, entre três e 20 bases, entre duas e 30 bases, ou entre 1 e 60 bases, e atingir substancialmente o mesmo fim.
[0316] A PCR multiplex pode envolver uma única rodada de PCR em que todos os alvos são amplificados ou pode envolver uma rodada de PCR seguida por uma ou mais rodadas de PCR aninhada ou alguma variante de PCR aninhada. A PCR aninhada consiste em uma rodada ou rodadas subsequentes de amplificação por PCR usando um ou mais novos iniciadores que se ligam internamente, por pelo menos um par de bases, aos iniciadores usados em uma rodada anterior. A PCR aninhada reduz o número de alvos de amplificação espúrios ao amplificar, em reações subsequentes, apenas aqueles produtos de amplificação da anterior que têm a sequência interna correta. A redução de alvos de amplificação espúrios melhora o número de medições úteis que podem ser obtidas, especialmente no sequenciamento. A PCR aninhada normalmente envolve projetar iniciadores completamente internos aos sítios de ligação do iniciador anterior, necessariamente aumentando o tamanho mínimo do segmento de DNA necessário para a amplificação. Para amostras tais como cfDNA de plasma de receptor de transplante, em que o DNA está altamente fragmentado, o tamanho do ensaio maior reduz o número de moléculas de cfDNA distintas a partir das quais uma medição pode ser obtida. Em uma modalidade, para compensar este efeito, pode-se usar uma abordagem de aninhamento parcial em que um ou ambos os iniciadores da segunda rodada se sobrepõem aos primeiros sítios de ligação que se estendem internamente por algum número de bases para atingir especificidade adicional enquanto aumenta minimamente no tamanho total do ensaio.
[0317] Em uma modalidade, um pool multiplex de ensaios de PCR é projetado para amplificar SNP potencialmente heterozigótico ou outros locais polimórficos ou não polimórficos em um ou mais cromossomos e esses ensaios são usados em uma única reação para amplificar o DNA. O número de ensaios de PCR pode estar entre 50 e 200 ensaios de PCR, entre 200 e 1.000 ensaios de PCR, entre 1.000 e 5.000 ensaios de PCR ou entre
5.000 e 20.000 ensaios de PCR (50 a 200-plex, 200 a 1.000-plex, 1.000 a
5.000-plex, 5.000 a 20.000-plex, mais de 20.000-plex, respectivamente). Em uma modalidade, um pool multiplex de cerca de 10.000 ensaios de PCR (10.000-plex) é projetado para amplificar locais de SNP potencialmente heterozigóticos nos cromossomos X, Y, 13, 18 e 21 e 1 ou 2 e esses ensaios são usados em uma única reação para amplificar o cfDNA obtido de uma amostra de plasma de material, amostras de vilo de corio, amostras de amniocentese, células únicas ou um pequeno número de células, outros fluidos ou tecidos corporais, cânceres ou outro material genético. As frequências SNP de cada local podem ser determinadas por clonal ou algum outro método de sequenciamento dos amplicons. A análise estatística das distribuições de frequência de alelo ou razões de todos os ensaios pode ser usada para determinar se a amostra contém uma trissomia de um ou mais dos cromossomos incluídos no teste. Em outra modalidade, as amostras de cfDNA originais são divididas em duas amostras e ensaios paralelos de 5.000-plex são realizados. Em outra modalidade, as amostras de cfDNA originais são divididas em n amostras e ensaios paralelos (~ 10.000/n)-plex são realizados, em que n está entre 2 e 12, ou entre 12 e 24, ou entre 24 e 48 ou entre 48 e 96. Os dados são coletados e analisados de maneira semelhante à já descrita. Observa-se que esse método é igualmente aplicável para detectar translocações, deleções, duplicações e outras anormalidades cromossômicas.
[0318] Em uma modalidade, caudas sem homologia com o genoma-alvo também podem ser adicionadas às extremidades de 3- prime ou 5-prime de qualquer um dos iniciadores. Essas caudas facilitam manipulações, procedimentos ou medições subsequentes. Em uma modalidade, a sequência de cauda pode ser a mesma para os iniciadores alvo- específicos diretos e reversos. Em uma modalidade, caudas diferentes podem ser usadas para os iniciadores alvo-específicos diretos e reversos. Em uma modalidade, uma pluralidade de caudas diferentes pode ser usada para diferentes locais ou conjuntos de locais. Certas caudas podem ser compartilhadas entre todos os locais ou entre subconjuntos de locais. Por exemplo, o uso de caudas diretas e reversas correspondentes às sequências diretas e reversas exigidas por qualquer uma das plataformas de sequenciamento atuais pode permitir o sequenciamento direto após a amplificação. Em uma modalidade, as caudas podem ser usadas como sítios de iniciação comuns entre todos os alvos amplificados que podem ser usados para adicionar outras sequências úteis. Em algumas modalidades, os iniciadores interiores podem conter uma região que é projetada para hibridizar a montante ou a jusante do local polimórfico alvejado. Em algumas modalidades, os iniciadores podem conter um código de barras molecular. Em algumas modalidades, o iniciador pode conter uma sequência de iniciação universal projetada para permitir a amplificação por PCR.
[0319] Em uma modalidade, um pool de ensaio de PCR de 10.000-plex é criado de modo que os iniciadores diretos e reversos tenham caudas correspondentes às sequências diretas e reversas exigidas por um instrumento de sequenciamento de alto rendimento, como o HISEQ, GAIIX ou MYSEQ disponíveis junto à ILLUMINA. Além disso, o 5-prime incluído nas caudas de sequenciamento é uma sequência adicional que pode ser usada como um sítio de iniciação em uma PCR subsequente para adicionar sequências de código de barras de nucleotídeos aos amplicons, permitindo o sequenciamento multiplex de várias amostras em uma única faixa do instrumento de sequenciamento de alto rendimento.
[0320] Em uma modalidade, um pool de ensaio de PCR de 10.000-plex é criado de modo que os iniciadores reversos tenham caudas correspondentes às sequências reversas exigidas por um instrumento de sequenciamento de alto rendimento. Após a amplificação com o primeiro ensaio de 10.000-plex, uma amplificação de PCR subsequente pode ser realizada usando um outro pool de 10.000-plex tendo iniciadores diretos parcialmente aninhados (por exemplo, aninhados com 6 bases) para todos os alvos e um iniciador reverso correspondente à cauda de sequenciamento reverso incluída na primeira rodada. Esta rodada subsequente de amplificação parcialmente aninhada com apenas um iniciador alvo-específico e um iniciador universal limita o tamanho necessário do ensaio, reduzindo o ruído de amostragem, mas reduz amplamente o número de amplicons espúrios. As etiqeutas de sequenciamento podem ser adicionadas a adaptadores de ligação anexados e/ou como parte de sondas de PCR, de modo que a etiqeuta seja parte do amplicon final.
[0321] O método de mini-PCR descrito nesta divulgação permite amplificação altamente multiplexada e análise de centenas a milhares ou até milhões de locais em uma única reação, a partir de uma única amostra. Ao mesmo tempo, a detecção do DNA amplificado pode ser multiplexada; dezenas a centenas de amostras podem ser multiplexadas em uma faixa de sequenciamento usando PCR de codificação em barras. Esta detecção multiplexada foi testada com sucesso até 49-plex, e um grau muito mais alto de multiplexação é possível. Na verdade, isso permite que centenas de amostras sejam genotipadas em milhares de SNPs em uma única execução de sequenciamento. Para essas amostras, o método permite a determinação do genótipo e da taxa de heterozigosidade. Este método pode ser usado para qualquer quantidade de DNA ou RNA, e as regiões-alvo podem ser SNPs, outras regiões polimórficas, regiões não polimórficas e suas combinações.
[0322] Em algumas modalidades, a amplificação por PCR universal mediada por ligação de DNA fragmentado pode ser usada. A amplificação por PCR universal mediada por ligação pode ser usada para amplificar o DNA de plasma, que pode, então, ser dividido em múltiplas reações paralelas. Também pode ser usada para amplificar preferencialmente fragmentos curtos, enriquecendo, assim, a fração fetal. Em algumas modalidades, a adição de etiquetas aos fragmentos por ligação pode permitir a detecção de fragmentos mais curtos, o uso de porções específicas de sequência-alvo mais curtas dos iniciadores e/ou hibridização a temperaturas mais altas que reduz as reações inespecíficas.
[0323] Os métodos descritos neste documento podem ser usados para uma série de propósitos em que existe um conjunto- alvo de DNA que é misturado com uma quantidade de DNA contaminante. Em algumas modalidades, o alvo e o DNA contaminante podem ser do mesmo indivíduo, mas em que o alvo e o DNA contaminante são diferentes por uma ou mais mutações, por exemplo, no caso de câncer. (consultar, por exemplo, H. Mamon et al. Preferential Amplification of Apoptotic DNA from Plasma: Potential for Enhancing Detection of Minor DNA Alterations in Circulating DNA. Clinical Chemistry 54: 9 (2008). Em algumas modalidades, o DNA pode ser encontrado no sobrenadante de cultura de células (apoptótica). Em algumas modalidades, é possível induzir a apoptose em amostras biológicas (por exemplo, sangue) para subsequente preparação de biblioteca, amplificação e/ou sequenciamento. Uma série de fluxos de trabalho e protocolos de capacitação para atingir esse fim são apresentados em outra parte desta divulgação.
[0324] Em algumas modalidades, o DNA-alvo pode se originar de células únicas, de amostras de DNA que consistem em menos de uma cópia do genoma-alvo, de baixas quantidades de DNA, de DNA de origem mista, de outros fluidos corporais, de culturas de células, de sobrenadantes de cultura, de amostras forenses de DNA, de amostras antigas de DNA (por exemplo, insetos presos em âmbar), de outras amostras de DNA e suas combinações.
[0325] Em algumas modalidades, um tamanho de amplicon curto pode ser usado. Tamanhos de amplicon curtos são especialmente adequados para DNA fragmentado (ver, por exemplo, A. Sikora, et sl. Detecção de quantidades aumentadas de DNA fetal livre de células com amplicons de PCR curtos. Clin Chem. 2010 de janeiro; 56(1):136 a 138).
[0326] O uso de tamanhos de amplicon curtos pode resultar em alguns benefícios significativos. Tamanhos de amplicon curtos podem resultar em eficiência de amplificação otimizada. Tamanhos de amplicon curtos normalmente produzem produtos mais curtos, portanto, há menos chance de iniciação não específica. Produtos mais curtos podem ser agrupados de maneira mais densa na célula de fluxo de sequenciamento, pois os agrupamentos serão menores. Em uma modalidade, uma fração substancial dos amplicons deve ser inferior a 100 pb, inferior a 90 pb, inferior a 80 pb, inferior a 70 pb, inferior a 65 pb, inferior a 60 pb, inferior a 55 pb, inferior a 50 pb ou inferior a 45 pb. Em algumas modalidades, os amplicons têm entre 50 a 100 pb de comprimento ou entre 60 e 80 pb de comprimento. Em algumas modalidades, os amplicons têm cerca de 65 pb de comprimento.
[0327] Observa-se que os métodos descritos neste documento podem funcionar igualmente bem para amplicons de PCR mais longos. O comprimento do amplicon pode ser aumentado se necessário, por exemplo, ao sequenciar trechos de sequência maiores. Os experimentos com amplificação alvejada de 146-plex com ensaios de comprimento de 100 pb a 200 pb como primeira etapa em um protocolo de PCR aninhada foram executados em células únicas e em DNA genômico com resultados positivos.
[0328] Em algumas modalidades, os métodos descritos aqui podem ser usados para amplificar e/ou detectar SNPs, número de cópias, metilação de nucleotídeos, níveis de mRNA, outros tipos de níveis de expressão de RNA, outras características genéticas e/ou epigenéticas. Os métodos de mini-PCR aqui descritos podem ser usados juntamente com o sequenciamento de próxima geração; pode ser usado com outros métodos a jusante, como microarranjos, contagem por PCR digital, PCR em tempo real, análise de espectrometria de massa etc.
[0329] Em algumas modalidades, os métodos de amplificação de mini-PCR aqui descritos podem ser usados como parte de um método para quantificação precisa de populações minoritárias. Pode ser usado para quantificação absoluta usando calibradores de pico. Pode ser usado para mutação/quantificação de alelo menor por meio de sequenciamento muito profundo e pode ser executado de uma forma altamente multiplexada. Pode ser usado para testes padrão de paternidade e identidade de parentes ou ancestrais, em seres humanos, animais, plantas ou outras criaturas. Pode ser usado para teste forense. Pode ser usado para genotipagem rápida e análise do número de cópias (CN), em qualquer tipo de material, por exemplo, líquido amniótico e CVS, espermatozoides, produto da concepção (POC). Pode ser usado para análises de células únicas, como genotipagem em amostras biopsiadas de embriões. Pode ser usado para análise embrionária rápida (em menos de um, um ou dois dias de biópsia) por sequenciamento alvejado usando min-PCR.
[0330] Em algumas modalidades, pode ser usado para análise de tumor: as biópsias de tumor são frequentemente uma mistura de células saudáveis e tumorais. A PCR alvejada permite o sequenciamento profundo de SNPs e locais com quase nenhuma sequência de fundo. Pode ser usado para análise de número de cópias e perda de heterozigosidade no DNA do tumor. O dito DNA de tumor pode estar presente em muitos fluidos corporais ou tecidos diferentes de pacientes com tumor. Pode ser usado para detecção de recorrência tumoral e/ou rastreamento tumoral. Pode ser usado para testes de controle de qualidade de sementes. Pode ser usado para propósitos de reprodução ou pesca. Observa-se que qualquer um desses métodos pode igualmente ser usado alvejando locais não polimórficos para fins de chamada de ploidia.
[0331] Parte da literatura que descreve alguns dos métodos fundamentais que fundamentam os métodos aqui divulgados incluem: (1) Wang HY, Luo M, Tereshchenko IV, Frikker DM, Cui X, Li JY, Hu G, Chu Y, Azaro MA, Lin Y, Shen L, Yang Q, Kambouris ME, Gao R, Shih W, Li H. Genome Res. fevereiro de 2005; l5(2):276 a 283. Department of Molecular Genetics, Microbiology and Immunology/The Cancer Institute of New Jersey, Robert Wood Johnson Medical School, New Brunswick, New Jersey 08903, EUA. (2) Genotipagem de alto rendimento de polimorfismos de nucleotídeo único com alta sensibilidade. Li H, Wang HY, Cui X, Luo M, Hu G, Greenawalt DM, Tereshchenko IV, Li JY, Chu Y, Gao R. Methods Mol Biol. 2007; 396 - PubMed PMID: 18025699. (3) Um método que compreende a multiplexação de uma média de 9 ensaios para sequenciamento é descrito em: Nested Patch PCR enables highly multiplexed mutation discovery in candidate genes. Varley KE, Mitra RD. Genome Res. novembro de 2008;18(11):1.844 a 1.850. Epub, 10 de outubro de 2008. Observa-se que os métodos divulgados neste documento permitem a multiplexação de ordens de magnitude maior do que nas referências acima.
PROJETO DE INICIADOR
[0332] A PCR altamente multiplexada pode, muitas vezes, resultar na produção de uma proporção muito alta de DNA do produto que resulta de reações colaterais não produtivas, como a formação de dímero de iniciador. Em uma modalidade, os iniciadores particulares que são mais propensos a causar reações colaterais não produtivas podem ser removidos da biblioteca de iniciadores para fornecer uma biblioteca de iniciadores que resultará em uma proporção maior de DNA amplificado que mapeia para o genoma. A etapa de remoção de iniciadores problemáticos, isto é, aqueles iniciadores que são particularmente propensos a firmar dímeros, de forma inesperada, permitiu níveis de multiplexação de PCR extremamente altos para análise subsequente por sequenciamento. Em sistemas como o sequenciamento, em que o desempenho degrada significativamente por dímeros de iniciador e/ou outros produtos de dano, foi alcançada uma multiplexação mais que 10, mais que 50 e mais que 100 vezes maior do que outra multiplexação descrita. Observa-se que isso se opõe aos métodos de detecção baseados em sonda, por exemplo, microarranjos, TAQMAN, PCR etc., em que um excesso de dímeros de iniciador não afetará o resultado de forma apreciável. Observa-se também que a crença geral na técnica é que a multiplexação de PCR para sequenciamento é limitada a cerca de 100 ensaios no mesmo poço. Por exemplo, A Fluidigm e a Rain Dance oferecem plataformas para realizar 48 ou milhares de ensaios de PCR em reações paralelas para uma amostra.
[0333] Existem várias maneiras de escolher iniciadores para uma biblioteca em que a quantidade de dímero de iniciador sem mapeamento ou outros produtos de dano de iniciador é minimizada. Dados empíricos indicam que um pequeno número de iniciadores “ruins” é responsável por uma grande quantidade de reações colaterais de dímero de iniciador sem mapeamento. A remoção desses iniciadores “ruins” pode aumentar a porcentagem de leituras de sequência que mapeiam para os locais- alvo. Uma maneira de identificar os iniciadores "ruins" é examinar os dados de sequenciamento do DNA que foi amplificado por amplificação alvejada; aqueles dímeros de iniciador que são vistos com maior frequência podem ser removidos para fornecer uma biblioteca de iniciador que é significativamente menos propensa a resultar em DNA de produto secundário que não mapeia para o genoma. Também existem programas disponíveis publicamente que podem calcular a energia de ligação de várias combinações de iniciadores, e remover aqueles com a energia de ligação mais alta também fornecerão uma biblioteca de iniciadores que é significativamente menos propensa a resultar em DNA de produto secundário que não mapeia para o genoma.
[0334] Multiplexar um grande número de iniciadores impõe uma restrição considerável aos ensaios que podem ser incluídos. Os ensaios que interagem de forma não intencional resultam em produtos de amplificação espúrios. As restrições de tamanho de mini-PCR podem resultar em outras restrições. Em uma modalidade, é possível começar com um número muito grande de alvos SNP potenciais (entre cerca de 500 a mais de 1 milhão) e tentar projetar iniciadores para amplificar cada SNP. Onde os iniciadores podem ser projetados, é possível tentar identificar pares de iniciadores prováveis de formar produtos espúrios, avaliando a probabilidade de formação de duplex de iniciador espúrio entre todos os pares possíveis de iniciadores usando parâmetros termodinâmicos publicados para a formação de duplex de DNA. As interações de iniciador podem ser classificadas por uma função de pontuação relacionada à interação e os iniciadores com as piores pontuações de interação são eliminados até que o número de iniciadores desejado seja alcançado. Nos casos em que SNPs provavelmente heterozigóticos são mais úteis, é possível também classificar a lista de ensaios e selecionar os ensaios compatíveis mais heterozigóticos. Experimentos validaram que iniciadores com altas pontuações de interação têm maior probabilidade de formar dímeros de iniciador. Em alta multiplexação não é possível eliminar todas as interações espúrias, mas é essencial remover os iniciadores ou pares de iniciadores com as pontuações de interação mais altas in silico, pois eles podem dominar uma reação inteira, limitando muito a amplificação dos alvos pretendidos. Foi realizado este procedimento para criar conjuntos de iniciadores multiplex de até 10.000 iniciadores. A melhoria devido a este procedimento é substancial, permitindo a amplificação de mais de 80%, mais de 90%, mais de 95%, mais de 98% e até mais de 99% nos produtos- alvo, conforme determinado pelo sequenciamento de todos os produtos de PCR, em comparação com 10% de uma reação em que os piores iniciadores não foram removidos. Quando combinado com uma abordagem semianinhada parcial, conforme descrito anteriormente, mais de 90% e até mais de 95% dos amplicons mapear para as sequências-alvo.
[0335] Observa-se que existem outros métodos para determinar quais sondas de PCR têm probabilidade de formar dímeros. Em uma modalidade, a análise de um pool de DNA que foi amplificado usando um conjunto não otimizado de iniciadores pode ser suficiente para determinar iniciadores problemáticos. Por exemplo, a análise pode ser feita usando sequenciamento, e os dímeros que estão presentes em maior número são determinados como aqueles com maior probabilidade de formar dímeros e podem ser removidos.
[0336] Este método tem uma série de aplicações potenciais, por exemplo, para genotipagem de SNP, determinação da taxa de heterozigosidade, medição do número de cópias e outras aplicações de sequenciamento alvejadas. Em uma modalidade, o método do projeto do iniciador pode ser usado em combinação com o método de mini-PCR descrito em outra parte deste documento. Em algumas modalidades, o método de projeto de iniciador pode ser usado como parte de um método de PCR multiplexada massiva.
[0337] O uso de etiquetas nos iniciadores pode reduzir a amplificação e o sequenciamento dos produtos dímeros dos iniciadores. Os iniciadores de etiqueta podem ser usados para encurtar a sequência alvo-específica necessária para abaixo de 20, abaixo de 15, abaixo de 12 e até abaixo de 10 pares de bases. Isso pode ser fortuito com o projeto de iniciador padrão quando a sequência-alvo é fragmentada dentro do sítio de ligação do iniciador ou pode ser projetada no projeto do iniciador. As vantagens deste método incluem: aumenta o número de ensaios que podem ser projetados para um determinado comprimento máximo do amplicon e encurta o sequenciamento "não informativo" da sequência do iniciador. Ele também pode ser usado em combinação com etiquetagem (consultar outra parte deste documento).
[0338] Em uma modalidade, a quantidade relativa de produtos não produtivos na amplificação de PCR alvejada multiplexada pode ser reduzida aumentando a temperatura de hibridização. Nos casos em que se está amplificando bibliotecas com a mesma etiqueta que os iniciadores alvo- específicos, a temperatura de hibridização pode ser aumentada em comparação com o DNA genômico, pois as etiquetas contribuirão para a ligação do iniciador. Em algumas modalidades, estão sendo usadas concentrações de iniciador consideravelmente mais baixas do que relatado anteriormente, juntamente com o uso de tempos de hibridização mais longos do que relatado em outro lugar. Em algumas modalidades, os tempos de hibridização podem ser mais longos do que 10 minutos, mais do que 20 minutos, mais do que 30 minutos, mais do que 60 minutos, mais do que 120 minutos, mais do que 240 minutos, mais do que 480 minutos e ainda mais longos do que 960 minutos. Em uma modalidade, são usados tempos de hibridização mais longos do que em relatórios anteriores, permitindo concentrações de iniciador mais baixas. Em algumas modalidades, as concentrações do iniciador são tão baixas quanto 50 nM, 20 nM, 10 nM, 5 nM, 1 nM e inferiores a 1 uM. Isso resulta surpreendentemente em um desempenho robusto para reações altamente multiplexadas, por exemplo, reações de 1.000- plex, reações de 2.000-plex, reações de 5.000-plex, reações de 10.000-plex, reações de 20.000-plex, reações de 50.000-plex e até mesmo reações de
100.000-plex. Em uma modalidade, a amplificação usa um, dois, três, quatro ou cinco ciclos executados com tempos de hibridização longos, seguidos por ciclos de PCR com tempos de hibridização mais comuns com iniciadores etiquetados.
[0339] Para selecionar localizações-alvo, pode-se começar com um pool de projetos de pares de iniciadores candidatos e criar um modelo termodinâmico de interações potencialmente adversas entre pares de iniciadores e, em seguida, usar o modelo para eliminar projetos que são incompatíveis com outros projetos no pool.
VARIANTES DE PCR ALVEJADA - ANINHAMENTO
[0340] Existem muitos fluxos de trabalho possíveis durante a realização de PCR; alguns fluxos de trabalho típicos para os métodos divulgados neste documento são descritos. As etapas descritas neste documento não se destinam a excluir outras etapas possíveis, nem implicam que qualquer uma das etapas descritas neste documento sejam necessárias para que o método funcione corretamente. Um grande número de variações de parâmetros ou outras modificações são conhecidas na literatura e podem ser feitas sem afetar a essência da invenção. Um determinado fluxo de trabalho generalizado é fornecido a seguir, seguido por uma série de variantes possíveis. As variantes normalmente se referem a possíveis reações de PCR secundárias, por exemplo, diferentes tipos de aninhamento que podem ser realizados (etapa 3). É importante observar que as variantes podem ser feitas em momentos diferentes ou em ordens diferentes das explicitamente descritas neste documento.
[0341] 1. O DNA na amostra pode ter adaptadores de ligação, muitas vezes referidos como etiquetas de biblioteca ou etiquetas de adaptador de ligação (LTs), anexados, em que os adaptadores de ligação contêm uma sequência de iniciação universal, seguida por uma amplificação universal. Em uma modalidade, isso pode ser feito usando um protocolo padrão projetado para criar bibliotecas de sequenciamento após a fragmentação. Em uma modalidade, a amostra de DNA pode ter extremidade cega e, em seguida, um A pode ser adicionado na extremidade 3'. Um adaptador em Y com uma saliência em T pode ser adicionado e ligado. Em algumas modalidades, outras extremidades pegajosas podem ser usadas diferentes de uma saliência em T ou A. Em algumas modalidades, outros adaptadores podem ser adicionados, por exemplo, adaptadores de ligação em laço. Em algumas modalidades, os adaptadores podem ter etiqueta projetada para amplificação de PCR.
[0342] 2. Amplificação de alvo específico (STA): A pré-amplificação de centenas a milhares a dezenas de milhares e até mesmo centenas de milhares de alvos pode ser multiplexada em uma reação. STA é tipicamente executada de 10 a 30 ciclos, embora possa ser executada de 5 a 40 ciclos, de 2 a 50 ciclos e mesmo de 1 a 100 ciclos. Os iniciadores podem ter cauda, por exemplo, para um fluxo de trabalho mais simples ou para evitar o sequenciamento de uma grande proporção de dímeros. Observa-se que, normalmente, os dímeros de ambos os iniciadores que carregam a mesma etiqueta não serão amplificados ou sequenciados de forma eficiente. Em algumas modalidades, podem ser realizados entre 1 e 10 ciclos de PCR; em algumas modalidades, podem ser realizados entre 10 e 20 ciclos de PCR; em algumas modalidades, podem ser realizados entre 20 e 30 ciclos de PCR; em algumas modalidades, podem ser realizados entre 30 e 40 ciclos de PCR; em algumas modalidades, mais de 40 ciclos de PCR podem ser realizados. A amplificação pode ser uma amplificação linear. O número de ciclos de PCR pode ser otimizado para resultar em um perfil de profundidade de leitura ideal (DOR). Perfis de DOR diferentes podem ser desejáveis para finalidades diferentes. Em algumas modalidades, uma distribuição mais uniforme de leituras entre todos os ensaios é desejável; se a DOR for muito pequena para alguns ensaios, o ruído estocástico pode ser muito alto para que os dados sejam muito úteis, enquanto, se a profundidade de leitura for muito alta, a utilidade marginal de cada leitura adicional é relativamente pequena.
[0343] Caudas de iniciador podem melhorar a detecção de DNA fragmentado de bibliotecas etiquetadas universalmente. Se a etiqueta da biblioteca e as caudas do iniciador contiverem uma sequência homóloga, a hibridização pode ser melhorada (por exemplo, a temperatura de fusão (TM) é reduzida) e os iniciadores podem ser estendidos se apenas uma porção da sequência-alvo do iniciador está no fragmento de DNA da amostra. Em algumas modalidades, 13 ou mais pares de bases alvo-específicos podem ser usados. Em algumas modalidades, podem ser usados 10 a 12 pares de base específicos de alvo. Em algumas modalidades, podem ser usados 8 a 9 pares de bases específicas. Em algumas modalidades, podem ser usados 6 a
7 pares de bases específicas. Em algumas modalidades, STA pode ser realizada em DNA pré-amplificado, por exemplo, MDA, RCA, outras amplificações de genoma completo ou PCR universal mediada por adaptador. Em algumas modalidades, STA pode ser realizada em amostras que são enriquecidas ou esgotadas de certas sequências e populações, por exemplo, por seleção de tamanho, captura de alvo, degradação dirigida.
[0344] 3. Em algumas modalidades, é possível realizar PCRs multiplex secundárias ou reações de extensão de iniciador para aumentar a especificidade e reduzir produtos indesejáveis. Por exemplo, aninhamento completo, semianinhamento, hemianinhamento e/ou subdivisão em reações paralelas de pools de ensaio menores são, todos, técnicas que podem ser usadas para aumentar a especificidade. Experimentos mostraram que dividir uma amostra em três reações de 400-plex resultou em DNA de produto com maior especificidade do que uma reação de 1.200-plex com exatamente os mesmos iniciadores. Da mesma forma, experimentos mostraram que dividir uma amostra em quatro reações de 2.400-plex resultou em um DNA de produto com maior especificidade do que uma reação de
9.600-plex com exatamente os mesmos iniciadores. Em uma modalidade, é possível usar iniciadores específicos de alvo e específicos de etiqueta de direcionalidade igual e oposta.
[0345] 4. Em algumas modalidades, é possível amplificar uma amostra de DNA (diluição, purificada ou de outro modo) produzida por uma reação de STA usando iniciadores específicos de etiqueta e "amplificação universal", isto é, para amplificar muitos ou todos os alvos pré- amplificados e etiquetados. Os iniciadores podem conter sequências funcionais adicionais, por exemplo, códigos de barras ou uma sequência de adaptador completa necessária para o sequenciamento em uma plataforma de sequenciamento de alto rendimento.
[0346] Estes métodos podem ser usados para a análise de qualquer amostra de DNA e são especialmente úteis quando a amostra de DNA é particularmente pequena, ou quando é uma amostra de DNA em que o DNA se origina de mais de um indivíduo, como no caso de plasma de receptor de transplante. Estes métodos podem ser usados em amostras de DNA, tais como uma célula única ou pequeno número de células, DNA genômico, DNA de plasma, bibliotecas de plasma amplificadas, bibliotecas de sobrenadantes apoptóticos amplificados ou outras amostras de DNA misturadas. Em uma modalidade, esses métodos podem ser usados no caso em que células de constituição genética diferente podem estar presentes em um único indivíduo, como no caso de câncer ou transplantes. VARIANTES DE PROTOCOLO (VARIANTES E/OU ADIÇÕES AO FLUXO DE TRABALHO ACIMA)
[0347] Mini-PCR multiplexada direta: Em algumas modalidades, é realizada a amplificação de alvo específico (STA) de uma pluralidade de sequências-alvo com iniciadores etiquetados. Em algumas modalidades, STA pode ser feita em mais de 100, mais de 200, mais de 500, mais de 1.000, mais de 2.000, mais de 5.000, mais de 10.000, mais de 20.000, mais de 50.000, mais de 100.000 ou mais de 200.000 alvos. Em uma reação subsequente, os iniciadores específicos de etiqueta amplificam todas as sequências-alvo e alongam as etiquetas para incluir todas as sequências necessárias para o sequenciamento, incluindo índices de amostra. Em uma modalidade, os iniciadores podem não ser etiquetados ou apenas certos iniciadores podem ser etiquetados. Os adaptadores de sequenciamento podem ser adicionados por ligação de adaptador convencional. Em uma modalidade, os iniciadores iniciais podem portar as etiquetas.
[0348] Em uma modalidade, os iniciadores são projetados de modo que o comprimento do DNA amplificado seja inesperadamente curto. A técnica anterior demonstra que as pessoas comuns versadas na técnica tipicamente projetam amplicons de 100+ pb. Em uma modalidade, os amplicons podem ser projetados para serem menores que 80 pb. Em uma modalidade, os amplicons podem ser projetados para serem menores que 70 pb. Em uma modalidade, os amplicons podem ser projetados para serem menores que 60 pb. Em uma modalidade, os amplicons podem ser projetados para serem menores que 50 pb. Em uma modalidade, os amplicons podem ser projetados para serem menores que 45 pb. Em uma modalidade, os amplicons podem ser projetados para serem menores que 40 pb. Em uma modalidade, os amplicons podem ser projetados para serem menores que 35 pb. Em uma modalidade, os amplicons podem ser projetados para serem entre 40 e 65 pb.
[0349] PCR sequencial: Após STA1, múltiplas alíquotas do produto podem ser amplificadas em paralelo com pools de complexidade reduzida com os mesmos iniciadores. A primeira amplificação pode fornecer material suficiente para dividir. Este método é especialmente bom para pequenas amostras, por exemplo aquelas que são de cerca de 6 a 100 pg, cerca de 100 pg a 1 ng, cerca de 1 ng a 10 ng ou cerca de 10 ng a 100 ng. O protocolo foi realizado com 1.200-plex em três 400-plexes. O mapeamento de leituras de sequenciamento aumentou de cerca de 60 a 70% no 1.200-plex sozinho para mais de 95%.
[0350] Mini-PCR semianinhada: Em algumas modalidades, após STA 1, uma segunda STA é realizada compreendendo um conjunto multiplex de iniciadores diretos internos aninhados e um (ou poucos) iniciadores reversos específicos de etiqueta. Com esse fluxo de trabalho, geralmente mais de 95% das sequências mapeiam para os alvos pretendidos. O iniciador aninhado pode se sobrepor à sequência externa do iniciador direto exterior, mas introduz bases adicionais na extremidade 3'. Em algumas modalidades, é possível usar entre uma e 20 bases de 3’ extras. Experimentos mostraram que usar 9 ou mais bases de 3’ extras em projetos de 1.200-plex funciona bem.
[0351] Mini-PCR totalmente aninhada: Após a etapa 1 de STA, é possível realizar uma segunda PCR multiplex (ou PCRs de m.p. paralelas de complexidade reduzida) com dois iniciadores aninhados portando etiquetas (A, a, B, b). Em algumas modalidades, é possível usar dois conjuntos completos de iniciadores. Experimentos usando um protocolo de mini-PCR totalmente aninhada foram usados para realizar a amplificação de 146-plex em célula única e três células sem a etapa de anexação de adaptadores de ligação universal e amplificação.
[0352] Mini-PCR hemianinhada: É possível usar o DNA-alvo que tem adaptadores nas extremidades do fragmento. STA é realizada compreendendo um conjunto multiplex de iniciadores diretos (B) e um (ou poucos) iniciadores reversos específicos de etiqueta (A). Uma segunda STA pode ser realizada usando um iniciador direto específico de etiqueta universal e um iniciador reverso específico de alvo. Neste fluxo de trabalho, iniciadores diretos e reversos específicos do alvo são usados em reações separadas, reduzindo, assim, a complexidade da reação e evitando a formação de dímeros de iniciadores diretos e reversos. Observa-se que, neste exemplo, os iniciadores A e B podem ser considerados primeiros iniciadores, e os iniciadores “a” e 'b” podem ser considerados iniciadores interiores. Este método é uma grande melhoria na PCR direta, pois é tão bom quanto a PCR direta, mas evita dímeros de iniciador. Após a primeira rodada do protocolo hemianinhado, normalmente se vê ~ 99% do DNA não alvejado, no entanto, após a segunda rodada, normalmente há uma grande melhoria.
[0353] Mini-PCR hemianinhada triplamente: É possível usar o DNA-alvo que tem um adaptador nas extremidades do fragmento. STA é realizada compreendendo um conjunto multiplex de iniciadores diretos (B) e um (ou poucos) iniciadores reversos específicos de etiqueta (A) e (a). Uma segunda STA pode ser realizada usando um iniciador direto específico de etiqueta universal e um iniciador reverso específico de alvo. Observa-se que, neste exemplo, os iniciadores “a” e B podem ser considerados iniciadores interiores e A pode ser considerado um primeiro iniciador. Opcionalmente, A e B podem ser considerados primeiros iniciadores e “a” pode ser considerado um iniciador interior. A designação de iniciadores reversos e diretos pode ser trocada. Neste fluxo de trabalho, iniciadores diretos e reversos específicos do alvo são usados em reações separadas, reduzindo, assim, a complexidade da reação e evitando a formação de dímeros de iniciadores diretos e reversos. Este método é uma grande melhoria na PCR direta, pois é tão bom quanto a PCR direta, mas evita dímeros de iniciador. Após a primeira rodada do protocolo hemianinhado, normalmente se vê ~ 99% do DNA não alvejado, no entanto, após a segunda rodada, normalmente há uma grande melhoria.
[0354] Mini-PCR aninhada unilateral: É possível usar o DNA-alvo que tem um adaptador nas extremidades do fragmento. STA também pode ser realizada com um conjunto multiplex de iniciadores diretos aninhados e usando a etiqueta do adaptador de ligação como o iniciador reverso. Uma segunda STA pode, então, ser realizada usando um conjunto de iniciadores diretos aninhados e um iniciador reverso universal. Este método pode detectar sequências-alvo mais curtas do que a PCR padrão, usando iniciadores sobrepostos na primeira e na segunda STAs. O método é normalmente realizado a partir de uma amostra de DNA que já foi submetida à etapa 1 da STA acima - anexação de etiquetas universais e amplificação; os dois iniciadores aninhados estão apenas em um lado, o outro lado usa a etiqueta da biblioteca. O método foi realizado em bibliotecas de sobrenadantes apoptóticos e plasma de gravidez. Com esse fluxo de trabalho, cerca de 60% das sequências mapearam para os alvos pretendidos. Observa-se que as leituras que continham a sequência reversa do adaptador não foram mapeadas, portanto, espera-se que esse número seja maior se as leituras que contêm a sequência reversa do adaptador forem mapeadas
[0355] Mini-PCR unilateral: É possível usar o DNA- alvo que tem um adaptador nas extremidades do fragmento. STA pode ser realizada com um conjunto multiplex de iniciadores diretos e um (ou poucos) iniciador reverso específico de etiqueta. Este método pode detectar sequências-alvo mais curtas do que a PCR padrão. No entanto, pode ser relativamente inespecífico, uma vez que apenas um iniciador alvo-específico é usado. Este protocolo é efetivamente a metade da mini-PCR aninhada unilateral
[0356] Mini-PCR semianinhada reversa: É possível usar o DNA-alvo que tem um adaptador nas extremidades do fragmento. STA pode ser realizada com um conjunto multiplex de iniciadores diretos e um (ou poucos) iniciador reverso específico de etiqueta. Este método pode detectar sequências-alvo mais curtas do que a PCR padrão.
[0357] Também pode haver mais variantes que são simplesmente iterações ou combinações dos métodos acima, como PCR duplamente aninhada, em que três conjuntos de iniciadores são usados. Outra variante é a mini-PCR aninhada de um lado e meio, em que STA também pode ser realizada com um conjunto multiplex de iniciadores diretos aninhados e um (ou poucos) iniciador reverso específico de etiqueta.
[0358] Observa-se que em todas essas variantes, a identidade do iniciador direto e do iniciador reverso pode ser trocada. Observa- se que, em algumas modalidades, a variante aninhada pode igualmente ser executada sem a preparação inicial da biblioteca que compreende anexar as etiquetas do adaptador e uma etapa de amplificação universal. Observa-se que em algumas modalidades, rodadas adicionais de PCR podem ser incluídas, com iniciadores diretos e/ou reversos adicionais e etapas de amplificação; estas etapas adicionais podem ser particularmente úteis se for desejável aumentar ainda mais a percentagem de moléculas de DNA que correspondem aos locais-alvo.
ADAPTADORES DE LIGAÇÃO EM LAÇO
[0359] Ao adicionar adaptadores etiquetados universais, por exemplo, com o propósito de fazer uma biblioteca para sequenciamento, existem várias maneiras de ligar adaptadores. Uma maneira é embotar a extremidade do DNA da amostra, realizar a formação de cauda A e ligar com adaptadores que tenham uma saliência em T. Há diversas maneiras de ligar adaptadores. Também há inúmeros adaptadores que podem ser ligados. Por exemplo, um adaptador em Y pode ser usado onde o adaptador consiste em duas fitas de DNA, em que uma fita tem uma região de fita dupla e uma região especificada por uma região de iniciador direto, e em que a outra fita é especificada por uma região de fita dupla que é complementar à região de fita dupla na primeira fita e uma região com um iniciador reverso. A região de fita dupla, quando hibridizada, pode conter uma saliência em T com a finalidade de se ligar ao DNA de fita dupla com uma saliência A.
[0360] Em uma modalidade, o adaptador pode ser uma alça de DNA em que as regiões terminais são complementares, e em que a região de alça contém uma região etiquetada com iniciador direto (LFT), uma região etiquetada com iniciador reverso (LRT) e um sítio de clivagem entre as duas. LFT se refere à etiqueta direta do adaptador de ligação e LRT se refere à etiqueta reversa do adaptador de ligação. A região complementar pode terminar em uma saliência em T, ou outra característica que pode ser usada para ligação ao DNA-alvo. O sítio de clivagem pode ser uma série de uracilos para clivagem por UNG, ou uma sequência que pode ser reconhecida e clivada por uma enzima de restrição ou outro método de clivagem ou apenas uma amplificação básica. Esses adaptadores podem ser usados para qualquer preparação de biblioteca, por exemplo, para sequenciamento. Estes adaptadores podem ser usados em combinação com qualquer um dos outros métodos descritos no presente documento, por exemplo, os métodos de amplificação por mini-PCR.
INICIADORES ETIQUETADOS INTERNAMENTE
[0361] Ao usar o sequenciamento para determinar o alelo presente em um determinado local polimórfico, a leitura de sequência normalmente começa a montante do sítio de ligação do iniciador (a) e, em seguida, para o sítio polimórfico (X). A fim de evitar a hibridização não específica, o sítio de ligação do iniciador (região do DNA-alvo complementar a
“a”) tem tipicamente 18 a 30 pb de comprimento. A etiqueta de sequência “b” é tipicamente de cerca de 20 pb; em teoria, elas podem ter qualquer comprimento maior que cerca de 15 pb, embora muitas pessoas usem as sequências de iniciador que são vendidas pela companhia de plataforma de sequenciamento. A distância “d” entre “a” e “X” pode ser de pelo menos 2 pb para evitar a polarização do alelo. Ao realizar a amplificação de PCR multiplexada usando os métodos divulgados neste documento ou outros métodos, em que o projeto do iniciador cuidadoso é necessário para evitar a interação excessiva de iniciador-iniciador, a janela de distância permissível “d” entre “a” e “X” pode variar bastante: de 2 pb a 10 pb, de 2 pb a 20 pb, de 2 pb a 30 pb, ou mesmo de 2 pb a mais de 30 pb. Portanto, ao usar certas configurações de iniciador, as leituras de sequência devem ter um comprimento mínimo para obter leituras longas o suficiente para medir o local polimórfico e, dependendo dos comprimentos de "a" e “d”, as leituras de sequência podem precisar ser de até 60 ou 75 pb. Normalmente, quanto mais longas as leituras de sequência, maior o custo e o tempo de sequenciamento de um determinado número de leituras; portanto, minimizar o comprimento de leitura necessário pode economizar tempo e dinheiro. Além disso, uma vez que, em média, as bases lidas mais cedo na leitura são lidas com mais precisão do que aquelas lidas mais tarde na leitura, diminuir o comprimento de leitura de sequência necessário também pode aumentar a precisão das medições da região polimórfica.
[0362] Em uma modalidade, denominada iniciadores etiquetados internamente, o sítio de ligação do iniciador (a) é dividido em uma pluralidade de segmentos (a', a”, a’”....), e a etiqueta de sequência (b) está em um segmento de DNA que está no meio de dois dos sítios de ligação do iniciador. Esta configuração permite que o sequenciador faça leituras de sequência mais curtas. Em uma modalidade, a’ + a” deve ser de pelo menos cerca de 18 pb e pode ser tão longo quanto 30, 40, 50, 60, 80, 100 ou mais de 100 pb. Em uma modalidade, a” deve ser de pelo menos cerca de 6 pb, e em uma modalidade está entre cerca de 8 e 16 pb. Todos os outros fatores sendo iguais, usar os iniciadores etiquetados internamente pode cortar o comprimento das leituras de sequência necessárias em pelo menos 6 pb, tanto quanto 8 pb, 10 pb, 12 pb, 15 pb e até mesmo tanto quanto 20 ou 30 pb. Isso pode resultar em uma vantagem significativa de dinheiro, tempo e precisão.
INICIADORES COM REGIÃO DE LIGAÇÃO DO ADAPTADOR DE LIGAÇÃO
[0363] Um problema com o DNA fragmentado é que, por ter comprimento curto, a chance de um polimorfismo estar próximo à extremidade de uma fita de DNA é maior do que para uma fita longa. Uma vez que a captura por PCR de um polimorfismo requer um sítio de ligação do iniciador de comprimento adequado em ambos os lados do polimorfismo, um número significativo de fitas de DNA com o polimorfismo alvejado será perdido devido à sobreposição insuficiente entre o iniciador e o sítio de ligação alvejado. Nos casos em que a região de ligação é mais curta do que os 18 pb tipicamente necessários para hibridização, a região (cr) no iniciador, do que é complementar à etiqueta da biblioteca é capaz de aumentar a energia de ligação a um ponto em que a PCR pode prosseguir. Observa-se que qualquer especificidade que é perdida devido a uma região de ligação mais curta pode ser compensada por outros iniciadores de PCR com regiões de ligação-alvo adequadamente longas. Observa-se que esta modalidade pode ser usada em combinação com PCR direta, ou qualquer um dos outros métodos aqui descritos, como PCR aninhada, PCR semianinhada, PCR hemianinhada, PCR unilateral aninhada ou semianinhada ou hemianinhada, ou outros protocolos de PCR.
[0364] Ao usar os dados de sequenciamento para determinar a ploidia em combinação com um método analítico que envolve a comparação dos dados de alelos observados com as distribuições de alelos esperadas para várias hipóteses, cada leitura adicional de alelos com uma baixa profundidade de leitura renderá mais informações do que uma leitura de um alelo com alta profundidade de leitura. Portanto, idealmente, seria desejável ver uma profundidade de leitura (DOR) uniforme, em que cada local terá um número semelhante de leituras de sequência representativas. Portanto, é desejável minimizar a variância de DOR. Em uma modalidade, é possível diminuir o coeficiente de variância da DOR (isso pode ser definido como o desvio padrão da DOR/a DOR média) aumentando os tempos de hibridização. Em algumas modalidades, as temperaturas de hibridização podem ser superiores a 2 minutos, superiores a 4 minutos, superiores a dez minutos, superiores a 30 minutos e superiores a uma hora ou até mais. Uma vez que a hibridização é um processo de equilíbrio, não há limite para a melhoria da variância de DOR com o aumento dos tempos de hibridização. Em uma modalidade, aumentar a concentração do iniciador pode diminuir a variância de DOR.
CAIXA DE DIAGNÓSTICO
[0365] Em uma modalidade, a presente divulgação compreende uma caixa de diagnóstico que é capaz de realizar parcial ou completamente qualquer um dos métodos descritos nesta divulgação. Em uma modalidade, a caixa de diagnóstico pode estar localizada em um consultório médico, um laboratório de hospital ou qualquer local adequado razoavelmente próximo ao ponto de atendimento ao paciente. A caixa pode ser capaz de executar todo o método de uma forma totalmente automatizada, ou a caixa pode exigir que uma ou várias etapas sejam concluídas manualmente por um técnico. Em uma modalidade, a caixa pode ser capaz de analisar pelo menos os dados genotípicos medidos no plasma do receptor de transplante. Em uma modalidade, a caixa pode ser ligada a meios para transmitir os dados genotípicos medidos na caixa de diagnóstico para uma instalação de computação externa que pode, então, analisar os dados genotípicos e, possivelmente, também gerar um relatório. A caixa de diagnóstico pode incluir uma unidade robótica que é capaz de transferir amostras aquosas ou líquidas de um recipiente para outro. O sistema pode compreender inúmeros reagentes,
tanto sólidos quanto líquidos. Ela pode compreender um sequenciador de alto rendimento. Ela pode compreender um computador.
KIT DE INICIADORES
[0366] Em algumas modalidades, pode ser formulado um kit que compreende uma pluralidade de iniciadores projetados para atingir os métodos descritos nesta divulgação. Os iniciadores podem ser iniciadores exteriores diretos e reversos, iniciadores interiores diretos e reversos como aqui divulgado, eles podem ser iniciadores que foram concebidos para ter baixa afinidade de ligação a outros iniciadores no kit, conforme divulgado na seção sobre o projeto de iniciador, eles podem ser sondas de captura híbridas ou sondas pré-circularizadas conforme descrito nas seções relevantes, ou alguma combinação das mesmas. Em uma modalidade, um kit pode ser formulado para determinar o estado do transplante de um receptor de transplante e projetado para ser usado com os métodos aqui divulgados, o kit compreendendo uma pluralidade de iniciadores diretos interiores e, opcionalmente, a pluralidade de iniciadores reversos interiores e, opcionalmente, iniciadores diretos exteriores e iniciadores reversos exteriores, em que cada um dos iniciadores é projetado para hibridizar à região de DNA imediatamente a montante e/ou a jusante de um dos sítios polimórficos no cromossomo-alvo e, opcionalmente, cromossomos adicionais. Em uma modalidade, o kit de iniciador pode ser usado em combinação com a caixa de diagnóstico descrita em outra parte deste documento.
COMPOSIÇÃO DE DNA
[0367] Ao realizar uma análise informática de dados de sequenciamento medidos em uma mistura de DNA do doador e receptor de transplante para determinar informações relativas ao transplante, por exemplo, o estado de ploidia do transplante, pode ser vantajoso medir as distribuições de alelos em um conjunto de alelos. Infelizmente, em muitos casos, como ao tentar determinar o estado de um transplante a partir da mistura de DNA encontrada no plasma de uma amostra de sangue de receptor de transplante, a quantidade de DNA disponível não é suficiente para medir diretamente as distribuições de alelos com boa fidelidade na mistura. Nestes casos, a amplificação da mistura de DNA fornecerá um número suficiente de moléculas de DNA para que as distribuições de alelos desejadas possam ser medidas com boa fidelidade. No entanto, os métodos atuais de amplificação tipicamente usados na amplificação de DNA para sequenciamento são frequentemente muito tendenciosos, o que significa que eles não amplificam ambos os alelos em um local polimórfico na mesma quantidade. Uma amplificação tendenciosa pode resultar em distribuições de alelos que são bastante diferentes das distribuições de alelos na mistura original. Para a maioria dos propósitos, medições altamente precisas das quantidades relativas de alelos presentes em locais polimórficos não são necessárias. Em contraste, em uma modalidade da presente divulgação, os métodos de amplificação ou enriquecimento que enriquecem especificamente os alelos polimórficos e preservam as razões alélicas são vantajosos.
[0368] No presente documento são descritos inúmeros métodos que podem ser usados para enriquecer uma amostra de DNA em uma pluralidade de locais de uma forma que minimize a polarização alélica. Alguns exemplos estão usando sondas de circularização para alvejar uma pluralidade de locais em que as extremidades 3' e 5' da sonda pré- circularizada são projetadas para hibridizar a bases que estão a uma ou algumas posições de distância dos sítios polimórficos do alelo alvejado. Outro é usar sondas de PCR em que a sonda de PCR da extremidade 3’ é projetada para hibridizar a bases que estão a uma ou algumas posições de distância dos locais polimórficos do alelo-alvo. Outro é usar uma abordagem de divisão e pool para criar misturas de DNA em que os locais preferencialmente enriquecidos são enriquecidos com baixa polarização alélica sem as desvantagens da multiplexação direta. Outro é usar uma abordagem de captura híbrida em que as sondas de captura são projetadas de modo que a região da sonda de captura que é projetada para hibridizar ao DNA que flanqueia o sítio polimórfico do alvo seja separada do sítio polimórfico por um ou um pequeno número de bases.
[0369] No caso em que distribuições de alelos medidas em um conjunto de locais polimórficos são usadas para determinar o estado de transplante de um receptor de transplante, é desejável preservar as quantidades relativas de alelos em uma amostra de DNA conforme ela é preparada para medições genéticas. Esta preparação pode envolver amplificação WGA, amplificação alvejada, técnicas de enriquecimento seletivo, técnicas de captura híbrida, sondas de circularização ou outros métodos destinados a amplificar a quantidade de DNA e/ou aumentar seletivamente a presença de moléculas de DNA que correspondem a certos alelos.
[0370] Em algumas modalidades da presente divulgação, há um conjunto de sondas de DNA projetadas para locais-alvo em que os locais têm frequências de alelos menores máximas. Em algumas modalidades da presente divulgação, há um conjunto de sondas que são projetadas para alvejar onde os locais têm a probabilidade máxima de o transplante ter um SNP altamente informativo nesses locais. Em algumas modalidades da presente divulgação, há um conjunto de sondas que são projetadas para locais-alvo em que as sondas são otimizadas para um determinado subgrupo da população. Em algumas modalidades da presente divulgação, há um conjunto de sondas que são projetadas para locais-alvo em que as sondas são otimizadas para uma determinada mistura de subgrupos da população. Em algumas modalidades da presente divulgação, há um conjunto de sondas que são projetadas para locais-alvo em que as sondas são otimizadas para um determinado par de pais que são de diferentes subgrupos da população que têm diferentes perfis de frequência de alelo menor. Em algumas modalidades da presente divulgação, há uma fita circularizada de DNA que compreende pelo menos um par de bases que se hibridiza a um pedaço de DNA que é de origem de transplante. Em algumas modalidades da presente divulgação, há uma fita circularizada de DNA que circularizou enquanto pelo menos alguns dos nucleotídeos foram hibridizados ao DNA que era de origem de transplante. Em algumas modalidades da presente divulgação, há um conjunto de sondas em que algumas das sondas têm como alvo repetições em tandem únicas e algumas das sondas têm como alvo polimorfismos de nucleotídeo único. Em algumas modalidades, os locais são selecionados com a finalidade de diagnóstico não invasivo do estado do transplante. Em algumas modalidades, os locais são alvejados usando um método que pode incluir sondas de circularização, MIPs, captura por sondas de hibridização, sondas em um arranjo de SNP ou combinações dos mesmos. Em algumas modalidades, as sondas são usadas como sondas de circularização, MIPs, captura por sondas de hibridização, sondas em um arranjo de SNP ou suas combinações. Em algumas modalidades, os locais são sequenciados para fins de determinação do estado do transplante.
[0371] No caso em que a informatividade relativa de uma sequência é maior quando combinada com contextos genotípicos relevantes, segue-se que maximizar o número de leituras de sequência que contêm um SNP para o qual o contexto genotípico é conhecido pode maximizar a informatividade do conjunto de leituras de sequenciamento na amostra mista. Em uma modalidade, o número de leituras de sequência que contêm um SNP para o qual os contextos genotípicos são conhecidos pode ser aprimorado usando qPCR para amplificar preferencialmente sequências específicas. Em uma modalidade, o número de leituras de sequência que contêm um SNP para o qual os contextos genotípicos são conhecidos pode ser aumentado usando sondas de circularização (por exemplo, MIPs) para amplificar preferencialmente sequências específicas. Em uma modalidade, o número de leituras de sequência que contêm um SNP para o qual os contextos genotípicos são conhecidos pode ser aumentado usando um método de captura por hibridização (por exemplo, SURESELECT) para amplificar preferencialmente sequências específicas. Métodos diferentes podem ser usados para aumentar o número de leituras de sequência que contêm um SNP para o qual os contextos genotípicos são conhecidos. Em uma modalidade, o alvejamento pode ser realizado por ligação de extensão, ligação sem extensão, captura por hibridização ou PCR.
[0372] Em uma amostra de DNA genômico fragmentado, uma fração das sequências de DNA mapeia exclusivamente para cromossomos individuais; outras sequências de DNA podem ser encontradas em cromossomos diferentes. Observa-se que o DNA encontrado no plasma é tipicamente fragmentado, muitas vezes em comprimentos abaixo de 500 pb. Em uma amostra genômica típica, cerca de 3,3% das sequências mapeáveis serão mapeadas para o cromossomo 13; 2,2% das sequências mapeáveis serão mapeadas para o cromossomo 18; 1,35% das sequências mapeáveis serão mapeadas para o cromossomo 21; 4,5% das sequências mapeáveis serão mapeadas para o cromossomo X em uma mulher; 2,25% das sequências mapeáveis serão mapeadas para o cromossomo X (em um homem); e 0,73% das sequências mapeáveis serão mapeadas para o cromossomo Y (em um homem). Além disso, entre as sequências curtas, aproximadamente 1 em 20 sequências conterá um SNP, usando os SNPs contidos no dbSNP. A proporção pode muito bem ser mais alta, visto que pode haver muitos SNPs que não foram descobertos.
[0373] Em uma modalidade da presente divulgação, métodos de alvejamento podem ser usados para aumentar a fração de DNA em uma amostra de DNA que mapeia para um determinado cromossomo de modo que a fração exceda significativamente as porcentagens listadas acima que são típicas para amostras genômicas. Em uma modalidade da presente divulgação, métodos de alvejamento podem ser usados para aumentar a fração de DNA em uma amostra de DNA de modo que a porcentagem de sequências que contêm um SNP seja significativamente maior do que o que pode ser encontrado tipicamente em amostras genômicas. Em uma modalidade da presente divulgação, métodos de alvejamento podem ser usados para alvejar DNA de um cromossomo ou de um conjunto de SNPs em uma mistura de DNA derivado de doador e de receptor de transplante para fins de determinação do estado do transplante.
[0374] Ao fazer uso de abordagens de alvejamento no sequenciamento da amostra mista, pode ser possível atingir um certo nível de precisão com menos leituras de sequência. A precisão pode se referir à sensibilidade, pode se referir à especificidade ou pode se referir a alguma combinação dos mesmos. O nível de precisão desejado pode estar entre 90% e 95%; pode estar entre 95% e 98%; pode estar entre 98% e 99%; pode estar entre 99% e 99,5%; pode estar entre 99,5% e 99,9%; pode estar entre 99,9% e 99,99%; pode estar entre 99,99% e 99,999%, pode estar entre 99,999% e 100%. Os níveis de precisão acima de 95% podem ser chamados de alta precisão.
[0375] Em uma modalidade, a precisão pode ser medida usando regressão linear em frações de doador medidas como uma função dos níveis de pico tentados correspondentes para calcular uma linearidade, um valor de coeficiente angular e um valor de interceptação. A linearidade pode ser representada pelo R 2 valorizado determinado a partir da análise de regressão linear. Em algumas modalidades, a linearidade é de cerca de 0,9 a 1,0; pode ser de cerca de 0,95 a 1,0; pode ser de cerca de 0,98 a 1,0; pode ser de cerca de 0,99 a 1,0; pode ser de cerca de 0,999 a 1,0; pode ser 0,999. O valor do coeficiente angular pode ser de 0,5 a 5,0, pode ser de 0,5 a 2,5; pode ser de 0,5 a 2,0; pode 0,5 a 1,5; pode ser de 0,75 a 1,25; pode ser de 0,9 a 1,2. O valor de interceptação pode ser de cerca de - 0,01 a cerca de 0,1; pode ser de cerca de - 0,001 a cerca de 0,1; pode ser de cerca de - 0,0001 a cerca de 0,1; pode ser de cerca de - 0,0001 a cerca de 0,01; pode ser de cerca de - 0,0001 a cerca de 0,001; pode ser de cerca de - 0,0001 a cerca de 0,0001; pode ser 0.
[0376] Em uma modalidade, a precisão pode se referir à precisão conforme determinado pelo cálculo de um coeficiente de variação (CV) e um intervalo de confiança de 95% para a determinação da fração de doador alvejada. A estimativa de precisão pelo cálculo de um CV também pode ser chamada de medição de reprodutividade. O valor do CV pode ser representado com um intervalo de confiança. O intervalo de confiança para o CV pode ser de 99%; pode ser 95%; pode ser 90%. O CV pode ser inferior a 10%; pode ser inferior a 9%; pode ser inferior a 8%; pode ser inferior a 7%; pode ser inferior a 6%; pode ser inferior a 5%; pode ser inferior a 4%; pode ser inferior a 3%; pode ser inferior a 2%; pode ser inferior a 1%. O CV pode ser diferente dependendo da fração de doador alvejada. Para uma fração de doador alvejada de 0,6%, o CV pode ser 1,85% com um intervalo de confiança de 95%. Para uma fração de doador alvejada de 2,4%, o CV pode ser 1,22% com um intervalo de confiança de 95%. O CV pode ser diferente dependendo da quantidade de DNA na amostra. Por exemplo, para 15 ng de DNA, o CV pode ser 3,1% com um intervalo de confiança de 95%; para 30 ng de DNA, o CV pode ser 3,07% com um intervalo de confiança de 95%; para 45 ng de DNA, o CV pode ser 1,99% com um intervalo de confiança de 95%.
[0377] Em uma modalidade da presente divulgação, uma determinação precisa do estado do transplante pode ser feita usando sequenciamento alvejado, usando qualquer método de alvejamento, por exemplo qPCR, PCR mediada por ligante, outros métodos de PCR, captura por hibridização ou sondas de circularização, em que o número de locais ao longo de um cromossomo que precisam ser alvejados pode estar entre 5.000 e 2.000 locais; pode estar entre 2.000 e 1.000 locais; pode estar entre 1.000 e 500 locais; pode estar entre 500 e 300 locais; pode estar entre 300 e 200 locais; pode estar entre 200 e 150 locais; pode estar entre 150 e 100 locais; pode estar entre 100 e 50 locais; pode ser entre 50 e 20 locais; pode ser entre 20 e 10 locais. Idealmente, pode estar entre 100 e 500 locais. O alto nível de precisão pode ser alcançado alvejando um pequeno número de locais e executando um número inesperadamente pequeno de leituras de sequência. O número de leituras pode estar entre 100 milhões e 50 milhões de leituras; o número de leituras pode estar entre 50 milhões e 20 milhões de leituras; o número de leituras pode estar entre 20 milhões e 10 milhões de leituras; o número de leituras pode estar entre 10 milhões e 5 milhões de leituras; o número de leituras pode estar entre 5 milhões e 2 milhões de leituras; o número de leituras pode estar entre 2 milhões e 1 milhão; o número de leituras pode estar entre 1 milhão e 500.000; o número de leituras pode estar entre
500.000 e 200.000; o número de leituras pode estar entre 200.000 e 100.000; o número de leituras pode estar entre 100.000 e 50.000; o número de leituras pode estar entre 50.000 e 20.000; o número de leituras pode estar entre 20.000 e 10.000; o número de leituras pode ser inferior a 10.000. Um número menor de leituras é necessário para quantidades maiores de DNA de entrada.
[0378] Em algumas modalidades, uma composição é descrita compreendendo uma mistura de DNA de origem de doador e DNA de origem do receptor, em que a porcentagem de sequências que mapeiam exclusivamente para um cromossomo e que contêm pelo menos um polimorfismo de nucleotídeo único é maior que 0,2%, maior que 0,3%, maior que 0,4%, maior que 0,5%, maior que 0,6%, maior que 0,7%, maior que 0,8%, maior que 0,9 %, maior que 1%, maior que 1,2%, maior que 1,4%, maior que 1,6%, maior que 1,8%, maior que 2%, maior que 2,5%, maior que 3%, maior que 4%, maior que 5 %, maior que 6%, maior que 7%, maior que 8%, maior que 9%, maior que 10%, maior que 12%, maior que 15% ou maior que 20%, e em que o cromossomo é retirado do grupo 13, 18, 21, X ou Y. Em algumas modalidades da presente divulgação, há uma composição que compreende uma mistura de DNA de origem de doador e DNA de origem do receptor, em que a porcentagem de sequências que mapeiam exclusivamente para um cromossomo e que contêm pelo menos um polimorfismo de nucleotídeo único de um conjunto de polimorfismos de nucleotídeo único é maior que 0,15%, maior que 0,2%, maior que 0,3%, maior que 0,4%, maior que 0,5%, maior que 0,6%, maior que 0,7%, maior que 0,8%, maior que 0,9%, maior que 1%, maior que 1,2%, maior que 1,4%, maior que 1,6%, maior que 1,8%, maior que 2%, maior que 2,5%, maior que 3%, maior que 4%, maior que 5%, maior que 6%,
maior que 7%, maior que 8%, maior que 9%, maior que 10%, maior que 12%, maior que 15% ou maior que 20%, em que o cromossomo é retirado do conjunto de cromossomos 13, 18, 21, X e Y, e em que o número de polimorfismos de nucleotídeo único no conjunto de polimorfismos de nucleotídeo único está entre 1 e 10, entre 10 e 20, entre 20 e 50, entre 50 e 100, entre 100 e 200, entre 200 e 500, entre 500 e 1.000, entre 1.000 e 2.000, entre 2.000 e 5.000, entre 5.000 e 10.000, entre 10.000 e 20.000, entre 20.000 e 50.000 e entre 50.000 e 100.000.
[0379] Em teoria, cada ciclo na amplificação dobra a quantidade de DNA presente; entretanto, na realidade, o grau de amplificação é ligeiramente inferior a dois. Em teoria, a amplificação, incluindo a amplificação alvejada, resultará na amplificação livre de polarização de uma mistura de DNA; na realidade, porém, alelos diferentes tendem a ser amplificados em uma extensão diferente de outros alelos. Quando o DNA é amplificado, o grau de polarização alélica normalmente aumenta com o número de etapas de amplificação. Em algumas modalidades, os métodos descritos neste documento envolvem a amplificação de DNA com um baixo nível de polarização alélica. Uma vez que a tendência alélica se compõe com cada ciclo adicional, pode-se determinar a tendência alélica por ciclo, calculando a n-ésima raiz da polarização geral, em que n é o logaritmo de base 2 do grau de enriquecimento. Em algumas modalidades, há uma composição que compreende uma segunda mistura de DNA, em que a segunda mistura de DNA foi preferencialmente enriquecida em uma pluralidade de locais polimórficos de uma primeira mistura de DNA, em que o grau de enriquecimento é de pelo menos 10, pelo menos 100, pelo menos 1.000, pelo menos 10.000, pelo menos
100.000 ou pelo menos 1.000.000, e em que a razão dos alelos na segunda mistura de DNA em cada local difere da razão dos alelos nesse local na primeira mistura de DNA por um fator que é, em média, inferior a 1.000%, 500%, 200%, 100%, 50%, 20%, 10 %, 5%, 2%, 1%, 0,5%, 0,2%, 0,1%, 0,05%, 0,02% ou 0,01%. Em algumas modalidades, há uma composição que compreende uma segunda mistura de DNA, em que a segunda mistura de DNA foi preferencialmente enriquecida em uma pluralidade de locais polimórficos de uma primeira mistura de DNA em que a polarização alélica por ciclo para a pluralidade de locais polimórficos é, em média, menor que 10%, 5%, 2%, 1%, 0,5%, 0,2%, 0,1%, 0,05% ou 0,02%. Em algumas modalidades, a pluralidade de locais polimórficos compreende pelo menos 10 locais, pelo menos 20 locais, pelo menos 50 locais, pelo menos 100 locais, pelo menos 200 locais, pelo menos 500 locais, pelo menos 1.000 locais, pelo menos 2.000 locais, pelo menos 5.000 locais, pelo menos 10.000 locais, pelo menos 20.000 locais ou pelo menos 50.000 locais.
ESTIMATIVAS DE MÁXIMA VEROSSIMILHANÇA
[0380] A maioria dos métodos conhecidos na técnica para detectar a presença ou ausência de fenômeno biológico ou afecção médica envolve o uso de um teste de rejeição de hipótese única, em que uma métrica que está correlacionada com a condição é medida, e se a métrica está em um lado de um dado limite, a afecção está presente, enquanto, se a métrica cair do outro lado do limite, a afecção está ausente. Um teste de rejeição de hipótese única apenas examina a distribuição nula ao decidir entre as hipóteses nula e alternativa. Sem levar em consideração a distribuição alternativa, não se pode estimar a verossimilhança de cada hipótese com base nos dados observados e, portanto, não se pode calcular uma confiança na chamada. Portanto, com um teste de rejeição de hipótese única, obtém-se uma resposta sim ou não, sem sentir a confiança associada ao caso específico.
[0381] Em algumas modalidades, o método divulgado neste documento é capaz de detectar a presença ou ausência de fenômeno biológico ou afecção médica usando um método de verossimilhança máxima. Esta é uma melhoria substancial em relação a um método que usa uma técnica de rejeição de hipótese única, pois o limite para chamar a ausência ou presença da afecção pode ser ajustado conforme apropriado para cada caso.
[0382] O método de estimativa de máxima verossimilhança usa as distribuições associadas a cada hipótese para estimar a verossimilhança dos dados condicionados em cada hipótese. Essas probabilidades condicionais podem então ser convertidas em uma chamada de hipótese e confiança. De forma similar, o método de estimativa máxima a posteriori usa as mesmas probabilidades condicionais que a estimativa de máxima verossimilhança, mas também incorpora antecedentes populacionais ao escolher a melhor hipótese e determinar a confiança.
[0383] Portanto, o uso de uma técnica de estimativa de máxima verossimilhança (MLE), ou da técnica de máxima a posteriori (MAP) intimamente relacionada, oferece duas vantagens: primeiro aumenta a chance de uma chamada correta e também permite que uma confiança seja calculada para cada chamada. Em uma modalidade, a seleção do estado de ploidia correspondente à hipótese com a maior probabilidade é realizada usando estimativas de máxima verossimilhança ou estimativas de máxima a posteriori. Em uma modalidade, é divulgado um método para determinar o estado do transplante em um receptor de transplante que envolve tomar qualquer método atualmente conhecido na técnica que use uma técnica de rejeição de hipótese única e reformular o mesmo de modo que use uma técnica de MLE ou MAP. Alguns exemplos de métodos que podem ser significativamente melhorados pela aplicação dessas técnicas podem ser encontrados na Patente nº U.S.
8.008.018, Patente nº U.S. 7.888.017 ou Patente nº U.S. 7.332.277.
[0384] Em uma modalidade, um método é descrito para determinar a presença ou ausência de aneuploidia fetal em uma amostra de plasma de receptor de transplante compreendendo DNA genômico fetal e materno, em que o método compreende: obter uma amostra de plasma de receptor de transplante; medir os fragmentos de DNA encontrados na amostra de plasma com um sequenciador de alto rendimento; calcular a fração de DNA derivado de doador na amostra de plasma; e, usando uma MLE ou MAP, determinar qual das distribuições é mais propensa a estar correta, indicando,
assim, a presença ou ausência de um transplante que passa por rejeição aguda, rejeição limítrofe, outra lesão ou estabilidade. Em uma modalidade, a medição do DNA do plasma pode envolver a realização de sequenciamento shotgun massivamente paralelo. Em uma modalidade, a medição do DNA da amostra de plasma pode envolver o sequenciamento de DNA que foi preferencialmente enriquecido, por exemplo, através de amplificação alvejada, em uma pluralidade de locais polimórficos ou não polimórficos. O objetivo do enriquecimento preferencial é aumentar o número de leituras de sequência que são informativas para a determinação do estado do transplante.
MÉTODOS DE INFORMÁTICA DE CHAMADA DE ESTADO DE TRANSPLANTE
[0385] É aqui descrito um método para determinar o estado de um transplante considerando os dados de sequência. Em algumas modalidades, esses dados de sequência podem ser medidos em um sequenciador de alto rendimento. Em algumas modalidades, os dados de sequência podem ser medidos no DNA que se originou de DNA de flutuação livre isolado do sangue do receptor, em que o DNA de flutuação livre compreende algum DNA de origem do receptor de transplante e algum DNA de origem do doador de transplante. Esta seção descreverá uma modalidade da presente divulgação em que o estado do transplante é determinado presumindo que a fração de DNA derivado de doador na mistura que foi analisada não seja conhecida e será estimada a partir dos dados. Ele também descreverá uma modalidade em que a fração de DNA derivado de doador ("fração de doador") ou a porcentagem de DNA derivado de doador na mistura pode ser medida por outro método. Em algumas modalidades, a fração do doador pode ser calculada usando apenas as medições de genotipagem feitas na própria amostra de sangue, que é uma mistura de DNA do doador e de receptor de transplante. Em algumas modalidades, a fração pode ser calculada também usando o genótipo medido ou, de outra forma, conhecido do receptor de transplante e/ou o genótipo medido ou conhecido do doador de transplante.
Em outra modalidade, o estado do transplante pode ser determinado apenas com base na fração calculada de DNA derivado de um doador.
[0386] Métodos informáticos úteis e relevantes para os métodos divulgados neste documento podem ser encontrados na Publicação de Patente nº U.S. 20180025109, incorporada neste documento a título de referência, em que os métodos informáticos são divulgados no contexto da determinação do estado genético de um feto por meio de teste pré- natal não invasivo.
[0387] Por exemplo, em uma modalidade, o método de informática pode incorporar polarização aleatória. Como costuma ser o caso, supõe-se que haja uma polarização nas medições, de forma que a probabilidade de obter um A neste SNP seja igual a q, que é um pouco diferente de p conforme definido acima. O quanto p é diferente de q depende da precisão do processo de medição e de inúmeros outros fatores e pode ser quantificado por desvios padrão de q em relação a p. Em uma modalidade, é possível modelar q como tendo uma distribuição beta, com os parâmetros α, β dependendo da média dessa distribuição sendo centralizada em p, e alguns desvios padrão especificados s. Em particular, isso fornece X | q ~ Bin (q, D i), em que q ~ Beta (α, β). Se for deixado E (q) = p, V (q) = s2, e os parâmetros α,β podem ser derivados como α = pN, β = (1 — p) N, em que
[0388] Em algumas modalidades, o método pode ser escrito para levar em consideração especificamente ruído adicional, qualidade de amostra diferencial, qualidade de SNP diferencial e polarização de amostragem aleatória. Em algumas modalidades, o método envolve várias etapas em que cada uma introduz diferentes tipos de ruído e/ou polarização para o modelo final:
[0389] (1) Supõe-se que a primeira amostra que compreende uma mistura de DNA materno e fetal contenha uma quantidade original de DNA de tamanho = N 0 moléculas, geralmente na faixa de 1.000 a
40.000, em que p = % de refs. verdadeira
[0390] (2) Na amplificação usando os adaptadores de ligação universal, supõe-se que N1 moléculas sejam amostradas; geralmente N1 ~ N0/2 moléculas e polarização de amostragem aleatória é introduzida devido à amostragem. A amostra amplificada pode conter várias moléculas N2 em que N2 >> N1. Deixa-se que X1 represente a quantidade de locais de referência (por SNP) de N 1 moléculas amostradas, com uma variação em p1 = X1/N1 que introduz polarização de amostragem aleatória em todo o resto do protocolo. Esta polarização de amostragem é incluída no modelo usando uma distribuição Beta-Binomial (BB) em vez de usar um modelo de distribuição Binomial simples. O parâmetro N da distribuição Beta-Binomial pode ser estimado posteriormente por amostra a partir dos dados de treinamento após o ajuste para vazamento e polarização de amplificação, em SNPs com 0<p<1. O vazamento é a tendência de um SNP ser lido incorretamente.
[0391] (3) A etapa de amplificação amplificará qualquer polarização alélica, portanto, a polarização de amplificação introduzida devido à possível amplificação desigual. Supõe-se que um alelo em um local seja amplificado f vezes em que outro alelo naquele local é amplificado g vezes, em que f = geb, em que b = 0 indica nenhuma polarização. O parâmetro de polarização, b, está centralizado em 0 e indica quanto mais ou menos o alelo A é amplificado em oposição ao alelo B em um SNP particular. O parâmetro b pode ser diferente de SNP para SNP. O parâmetro de polarização b pode ser estimado por SNP, por exemplo, a partir de dados de treinamento.
[0392] (4) A etapa de sequenciamento envolve o sequenciamento de uma amostra de moléculas amplificadas. Nesta etapa, pode haver vazamento, em que vazamento é a situação em que um SNP é lido incorretamente. O vazamento pode resultar de uma série de problemas e pode resultar em um SNP sendo lido não como o alelo A correto, mas como outro alelo B encontrado naquele local ou como um alelo C ou D tipicamente não encontrado naquele local. Supõe-se que o sequenciamento mede os dados de sequência de várias moléculas de DNA de uma amostra amplificada de tamanho N3, em que N3 < N2. Em algumas modalidades, N3 pode estar na faixa de 20.000 a 100.000; 100.000 a 500.000; 500.000 a 4.000.000; 4.000.000 a
20.000.000; ou 20.000.000 a 100.000.000. Cada molécula amostrada tem uma probabilidade pg de ser lida corretamente, caso em que aparecerá corretamente como alelo A. A amostra será lida incorretamente como um alelo não relacionado à molécula original com probabilidade 1 - pg, e será semelhante ao alelo A com probabilidade pr, ao alelo B com probabilidade pmou ao alelo C ou alelo D com probabilidade p 0, em que pr + pm + po = 1. Os parâmetros Pg, Pr, Pm, Po são estimados por SNP a partir dos dados de treinamento.
[0393] Protocolos diferentes podem envolver etapas semelhantes com variações nas etapas de biologia molecular, resultando em diferentes quantidades de amostragem aleatória, diferentes níveis de amplificação e diferentes tendências de vazamento. O modelo a seguir pode ser igualmente bem aplicado a cada um desses casos. O modelo para a quantidade de DNA amostrado, por SNP, é dado por:
[0394] em que p = a quantidade verdadeira de DNA de referência, b = por polarização de SNP, e conforme descrito acima, p g é a probabilidade de uma leitura correta, p r é a probabilidade de a leitura ser lida incorretamente, mas por acaso parecer o alelo correto, em caso de leitura ruim, conforme descrito acima, e:
[0395] Em algumas modalidades, o método usa uma distribuição Beta-Binomial em vez de uma distribuição binomial simples; isso cuida da polarização de amostragem aleatória. O parâmetro N da distribuição Beta-Binomial é estimado por amostra com base na necessidade. Usar a correção de polarização F(p, b), H(p, b), em vez de apenas p, cuida da polarização de amplificação. O parâmetro b da polarização é estimado por SNP a partir dos dados de treinamento antecipadamente.
[0396] Em algumas modalidades, o método usa correção de vazamento L(p, pr, pg), em vez de apenas p; isso cuida da polarização de vazamento, isto é, variando o SNP e a qualidade da amostra. Em algumas modalidades, os parâmetros p g, pr, p0 são estimados por SNP a partir dos dados de treinamento antecipadamente. Em algumas modalidades, os parâmetros pg, pr, p0 podem ser atualizados com a amostra atual em movimento, para considerar a variação da qualidade da amostra.
[0397] O modelo descrito aqui é bastante geral e pode ser considerar tanto a qualidade da amostra diferencial quanto a qualidade de SNP diferencial. Amostras e SNPs diferentes são tratados de forma diferente, conforme exemplificado pelo fato de que algumas modalidades usam distribuições Beta-Binomiais, cuja média e variância são uma função da quantidade original de DNA, bem como da qualidade da amostra e do SNP.
MODELAGEM DE PLATAFORMA
[0398] Uma observação em um SNP consiste no número de leituras mapeadas com cada alelo presente, n a e nb, que somam a profundidade da leitura d. Supõe-se que os limites já tenham sido aplicados às probabilidades de mapeamento e pontuações de phred de modo que os mapeamentos e as observações de alelos possam ser considerados corretos. Uma pontuação de phred é uma medida numérica que se relaciona à probabilidade de que uma medição específica em uma base específica esteja errada. Em uma modalidade, em que a base foi medida por sequenciamento, a pontuação de phred pode ser calculada a partir da razão da intensidade do corante correspondendo à base chamada para a intensidade de corante das outras bases. O modelo mais simples para a verossimilhança de observação é uma distribuição binomial que presume que cada uma das leituras de d seja obtida independentemente de um grande pool que tem razão de alelo r. A
Equação 2 descreve esse modelo.
[0399] O modelo binomial pode ser estendido de inúmeras formas. Quando os genótipos do doador e do receptor são todos A ou B, a proporção de alelos esperada no plasma será 0 ou 1, e a probabilidade binomial não será bem definida. Na prática, alelos inesperados às vezes são observados na prática. Em uma modalidade, é possível usar uma razão de alelo corrigida para permitir um pequeno número do alelo inesperado. Em uma modalidade, é possível usar dados de treinamento para modelar a taxa do alelo inesperado que aparece em cada SNP e usar este modelo para corrigir a razão alélica esperada. Quando a razão alélica esperada não é 0 ou 1, a razão alélica observada pode não convergir com uma profundidade de leitura suficientemente alta à razão alélica esperada devido à polarização de amplificação ou outros fenômenos. A razão de alelos pode, então, ser modelada como uma distribuição beta centralizada na razão de alelos esperada, levando a uma distribuição beta-binomial para P(na, nb|r) que tem maior variância do que o binomial.
[0400] O modelo de plataforma para a resposta em um único SNP será definido como F(a, b, g c, gm, f) (3), ou a probabilidade de observar na = a e nb = b considerando genótipos materno e fetal, que também dependem da fração fetal pela equação 1. A forma funcional de F pode ser uma distribuição binomial, distribuição beta-binomial ou funções semelhantes conforme discutido acima.
[0401] Em uma modalidade, um método da presente divulgação que é usado para determinar o estado do transplante do receptor de planta envolve levar em consideração a fração de DNA de doador na amostra.
Em outra modalidade da presente divulgação, o método envolve o uso de estimativas de máxima verossimilhança. Em uma modalidade, um método da presente divulgação envolve o cálculo da porcentagem de DNA em uma amostra que é derivada de doador. Em uma modalidade, o limite para chamar a rejeição aguda de um transplante é ajustado de forma adaptativa com base na porcentagem calculada de DNA derivado de doador.
[0402] Em uma modalidade da presente divulgação, a fração de DNA derivado do doador ou a porcentagem de DNA do doador na mistura pode ser medida. Em algumas modalidades, a fração pode ser calculada usando apenas as medições de genotipagem feitas na própria amostra de plasma do receptor de transplante, que é uma mistura de DNA derivado do doador e do receptor de transplante. Em algumas modalidades, a fração pode ser calculada também usando o genótipo medido ou, de outra forma, conhecido do receptor de transplante e/ou o genótipo medido ou conhecido do doador de transplante. Em algumas modalidades, a porcentagem de DNA do doador pode ser calculada usando as medições feitas na mistura de DNA derivado de doador e receptor de transplante, juntamente com o conhecimento dos contextos genotípicos. Em uma modalidade, a fração de DNA de doador pode ser calculada usando frequências de população para ajustar o modelo na probabilidade em medições de alelos particulares.
[0403] Em uma modalidade da presente divulgação, uma confiança pode ser calculada sobre a precisão da determinação do estado do transplante. Em uma modalidade, a confiança da hipótese de maior verossimilhança (Hmaior) pode ser calculada como (1- Hmaior)/∑(H todo). É possível determinar a confiança de uma hipótese se as distribuições de todas as hipóteses forem conhecidas. É possível determinar a distribuição de todas as hipóteses se as informações do genótipo do doador e do receptor forem conhecidas. Em uma modalidade, pode-se usar o conhecimento da distribuição de uma estatística de teste em torno de uma hipótese normal e em torno de uma hipótese anormal para determinar a confiabilidade da chamada, bem como refinar o limite para fazer uma chamada mais confiável. Isto é particularmente útil quando a quantidade e/ou porcentagem de DNA de doador na mistura é baixa.
DESCRIÇÃO ADICIONAL DO MÉTODO
[0404] Em uma modalidade, um método divulgado neste documento utiliza uma medida quantitativa do número de observações independentes de cada alelo em um local polimórfico, em que isso não envolve o cálculo da razão dos alelos. Isso é diferente de métodos, como alguns métodos baseados em microarranjo, que fornecem informações sobre a razão de dois alelos em um local, mas não quantificam o número de observações independentes de qualquer um dos alelos. Alguns métodos conhecidos na técnica podem fornecer informações quantitativas em relação ao número de observações independentes, mas os cálculos que levam à determinação da ploidia utilizam apenas as razões de alelos e não utilizam as informações quantitativas. Para ilustrar a importância de reter informações sobre o número de observações independentes, considera-se o local da amostra com dois alelos, A e B. Em um primeiro experimento vinte alelos A e vinte alelos B são observados, em um segundo experimento 200 alelos A e 200 alelos B são observados. Em ambos os experimentos, a razão (A/(A + B)) é igual a 0,5, no entanto, o segundo experimento transmite mais informações do que o primeiro sobre a certeza da frequência do alelo A ou B. O presente método, em vez de utilizar as razões de alelos, usa os dados quantitativos para modelar com mais precisão as frequências de alelos mais prováveis em cada local polimórfico.
[0405] Em uma modalidade, um cromossomo de referência é usado para determinar a fração de doador e a quantidade de nível de ruído ou distribuição de probabilidade. O presente método funciona sem o cromossomo de referência, bem como sem fixar a fração de doador ou nível de ruído particulares.
[0406] As medições de DNA são ruidosas e/ou sujeitas a erros, especialmente medições em que a quantidade de DNA é pequena ou quando o DNA está misturado com DNA contaminante. Este ruído resulta em dados genotípicos menos precisos e determinação menos precisa do estado do transplante. Em algumas modalidades, a modelagem de plataforma ou algum outro método de modelagem de ruído pode ser usado para combater os efeitos deletérios do ruído na determinação do estado do transplante. O presente método usa um modelo conjunto de ambos os canais, que considera o ruído aleatório devido à quantidade de DNA de entrada, a qualidade do DNA e/ou a qualidade do protocolo.
[0407] Em particular, os erros nas medições normalmente não dependem especificamente da razão de intensidade do canal medida, o que reduz o modelo ao uso de informações unidimensionais. A modelagem precisa de ruído, qualidade do canal e interação do canal exigem um modelo conjunto bidimensional, que não pode ser modelado usando-se razões de alelos.
[0408] Em particular, projetar informações de dois canais para a razão r em que f(x,y) é r=x/y, não se presta a ruído de canal preciso e modelagem de polarização. O ruído em um SNP específico não é uma função da razão, isto é, ruído(x,y) ≠ f(x,y), mas é, na verdade, uma função conjunta de ambos os canais. Por exemplo, no modelo binomial, o ruído da razão medida tem uma variância de r(1-r)/(x+y) que não é uma função puramente de r. Nesse modelo, em que qualquer polarização de canal ou ruído está incluído, supõe-se que no SNPi, o valor do canal X observado seja x=aiX+bi, em que X é o valor verdadeiro do canal, b i é a polarização do canal extra ruído aleatório. Da mesma forma, supõe-se que y=ciY+di. A razão observada r=x/y não pode prever com precisão a verdadeira razão X/Y ou modelar o ruído restante, uma vez que (aiX+bi)/(ciY+di) não é uma função de X/Y.
[0409] O método divulgado neste documento descreve uma maneira eficaz de modelar ruído e polarização usando distribuições binomiais conjuntas de todos os canais de medição individualmente. Equações relevantes podem ser encontradas em outras partes do documento nas seções que falam de polarização consistente por SNP, P(bom) e P(ref|ruim), P(mut|ruim) que efetivamente ajustam o comportamento de SNP. Em uma modalidade, um método da presente divulgação usa uma distribuição BetaBinomial, que evita a prática limitante de depender apenas das razões de alelos, mas em vez disso, modela o comportamento com base em ambas as contagens de canal.
[0410] Em uma modalidade, um método aqui divulgado pode chamar o estado do transplante de um receptor de transplante a partir de dados genéticos encontrados no plasma do receptor de transplante usando todas as medições disponíveis. Alguns métodos conhecidos na técnica usam apenas dados genéticos medidos em que o contexto genotípico é do contexto AA|BB, isto é, em que o doador e o receptor são ambos homozigóticos em um determinado local, mas para um alelo diferente. Um problema com este método é que uma pequena proporção de locais polimórficos é do contexto AA|BB, normalmente menos de 10%. Em uma modalidade de um método aqui divulgado, o método não usa medições genéticas do plasma de receptor de transplante feitas em locais em que o contexto genotípico é AA|BB. Em uma modalidade, o presente método usa medições de plasma apenas para aqueles locais polimórficos com o contexto genotípico AA|BB, AB|AA e AB|AB.
PROFUNDIDADE DE LEITURA VARIÁVEL PARA MINIMIZAR O CUSTO DE SEQUENCIAMENTO
[0411] Em muitos ensaios clínicos relativos a um diagnóstico, por exemplo, em Chiu et al. BMJ 2011; 342:c7401, um protocolo com vários parâmetros é definido e, em seguida, o mesmo protocolo é executado com os mesmos parâmetros para cada um dos pacientes do ensaio. No caso de determinar o estado do transplante em um receptor de transplante usando o sequenciamento como método para medir o material genético, um parâmetro pertinente é o número de leituras. O número de leituras pode se referir ao número de leituras reais, o número de leituras pretendidas, faixas fracionárias, faixas completas ou células de fluxo total em um sequenciador. Nesses estudos, o número de leituras é normalmente definido em um nível que garantirá que todas ou quase todas as amostras atinjam o nível desejado de precisão. O sequenciamento é atualmente uma tecnologia cara, um custo de cerca de US$ 200 por 5 milhões de leituras mapeáveis e, embora o preço esteja caindo, qualquer método que permite que um diagnóstico baseado em sequenciamento opere em um nível semelhante de precisão, mas com menos leituras, necessariamente economizará uma quantia de dinheiro considerável.
[0412] A precisão da determinação do estado de um transplante normalmente depende de vários fatores, incluindo o número de leituras e a fração de DNA derivado de doador na mistura. A precisão é normalmente maior quando a fração de DNA derivado de doador na mistura é maior. Ao mesmo tempo, a precisão normalmente é maior se o número de leituras for maior. É possível ter uma situação com dois casos em que o estado do transplante é determinado com precisões comparáveis, em que o primeiro caso tem uma fração menor de DNA derivado de doador na mistura do que o segundo, e mais leituras foram sequenciadas no primeiro caso do que no segundo. É possível usar a fração estimada de DNA do doador na mistura como um guia para determinar o número de leituras necessárias para atingir um determinado nível de precisão.
[0413] Em uma modalidade da presente divulgação, um conjunto de amostras pode ser executado, em que diferentes amostras no conjunto são sequenciadas a diferentes profundidades de leitura, em que o número de leituras executadas em cada uma das amostras é escolhido para atingir um determinado nível de precisão considerando a fração calculada de DNA de doador em cada mistura. Em uma modalidade da presente divulgação, isso pode implicar em fazer uma medição da amostra misturada para determinar a fração de DNA de doador na mistura; esta estimativa da fração de doador pode ser feita com sequenciamento, pode ser feita com TAQMAN, pode ser feita com qPCR, pode ser feita com arranjos de SNP, pode ser feita com qualquer método que possa distinguir diferentes alelos em um determinado local. A necessidade de uma estimativa da fração do doador pode ser eliminada incluindo hipóteses que cobrem todas ou um conjunto selecionado de frações de doador no conjunto de hipóteses que são consideradas na comparação com os dados reais medidos. Após a determinação da fração de DNA de doador na mistura, o número de sequências a serem lidas para cada amostra pode ser determinado.
UTILIZAÇÃO DE DADOS BRUTOS DE GENOTIPAGEM
[0414] Há uma série de métodos que podem realizar os métodos divulgados neste documento usando informação genética de doador medida no DNA derivado de doador encontrado no sangue de receptor de transplante. Alguns desses métodos envolvem fazer medições do DNA fetal usando arranjos de SNP, alguns métodos envolvem sequenciamento não alvejado e alguns métodos envolvem sequenciamento alvejado. O sequenciamento alvejado pode ter como alvo SNPs, pode ter como alvo STRs, pode ter como alvo outros locais polimórficos, pode ter como alvo locais não polimórficos ou alguma combinação dos mesmos. Alguns desses métodos podem envolver o uso de um chamador de alelo comercial ou proprietário que chama a identidade dos alelos a partir dos dados de intensidade provenientes dos sensores na máquina que faz a medição. Por exemplo, o sistema ILLUMINA INFINIUM ou o sistema de microarranjo AFFYMETRIX GENECHIP envolve microesferas ou microchips com sequências de DNA anexadas que podem hibridizar a segmentos complementares de DNA; após a hibridização, há uma mudança nas propriedades fluorescentes da molécula do sensor que podem ser detectadas. Existem também métodos de sequenciamento, por exemplo o ILLUMINA SOLEXA GENOME SEQUENCER ou o ABI SOLID GENOME SEQUENCER, em que a sequência genética de fragmentos de DNA é sequenciada; após a extensão da fita de DNA complementar à fita sendo sequenciada, a identidade do nucleotídeo estendido é tipicamente detectada por meio de uma etiqueta fluorescente ou de rádio anexado ao nucleotídeo complementar. Em todos estes métodos, os dados genotípicos ou de sequenciamento são tipicamente determinados com base em sinais fluorescentes ou outros, ou na falta deles. Esses sistemas são normalmente combinados com pacotes de software de baixo nível que fazem chamadas de alelos específicos (dados genéticos secundários) a partir da saída analógica do dispositivo fluorescente ou outro dispositivo de detecção (dados genéticos primários). Por exemplo, no caso de um determinado alelo em um arranjo de SNP, o software fará uma chamada, por exemplo, que um certo SNP está presente ou não presente se a intensidade fluorescente for medida acima ou abaixo de um certo limite. Da mesma forma, a saída de um sequenciador é um cromatograma que indica o nível de fluorescência detectado para cada um dos corantes, e o software fará uma chamada de que um determinado par de bases é A ou T ou C ou G. Os sequenciadores de alto rendimento normalmente fazem uma série dessas medições, chamada de leitura, que representa a estrutura mais provável da sequência de DNA que foi sequenciada. A saída analógica direta do cromatograma é definida aqui como os dados genéticos primários, e as chamadas de par de bases/SNP feitas pelo software são consideradas aqui como os dados genéticos secundários. Em uma modalidade, os dados primários se referem aos dados de intensidade brutos que são a saída não processada de uma plataforma de genotipagem, em que a plataforma de genotipagem pode se referir a um arranjo de SNP ou a uma plataforma de sequenciamento. Os dados genéticos secundários se referem aos dados genéticos processados, em que uma chamada de alelo foi feita, ou os dados de sequência foram atribuídos a pares de bases e/ou as leituras de sequência foram mapeadas para o genoma.
[0415] Muitos aplicativos de nível superior tiram proveito dessas chamadas de alelos, chamadas de SNP e leituras de sequência, ou seja, os dados genéticos secundários, que o software de genotipagem produz. Por exemplo, DNA NEXUS, ELAND ou MAQ pegará as leituras de sequenciamento e as mapeará para o genoma. No contexto da determinação não invasiva do estado do transplante, pode ser possível tomar um conjunto de leituras de sequência que foram medidas no DNA presente no plasma do receptor de transplante e mapeá-las para o genoma. Pode-se, então, fazer uma contagem normalizada das leituras que são mapeadas para cada cromossomo, ou seção de um cromossomo, e usar esses dados para determinar o estado do transplante de um receptor de transplante.
[0416] No entanto, na realidade, a saída inicial dos instrumentos de medição é um sinal analógico. Quando um determinado par de bases é chamado pelo software que está associado ao software de sequenciamento, por exemplo, o software pode chamar o par de bases de T, na realidade a chamada é a chamada que o software acredita ser mais provável. Em alguns casos, no entanto, a chamada pode ser de baixa confiança, por exemplo, o sinal analógico pode indicar que o par de bases específico tem apenas 90% de probabilidade de ser um T e 10% de probabilidade de ser um A. Em outro exemplo, o software de chamada de genótipo que está associado a um leitor de arranjo de SNP pode fazer a chamada de que um determinado alelo é G. No entanto, na realidade, o sinal analógico subjacente pode indicar que é apenas 70% provável que o alelo seja G e 30% provável que o alelo seja T. Nesses casos, quando os aplicativos de nível superior usam as chamadas de genótipo e chamadas de sequência feitas pelo software de nível inferior, estão perdendo algumas informações. Ou seja, os dados genéticos primários, conforme medidos diretamente pela plataforma de genotipagem, podem ser mais confusos do que os dados genéticos secundários que são determinados pelos pacotes de software anexados, mas contêm mais informações. No mapeamento das sequências de dados genéticos secundários para o genoma, muitas leituras são descartadas porque algumas bases não são lidas com clareza suficiente e/ou o mapeamento não é claro. Quando as leituras de sequência de dados genéticos primários são usadas, todas ou muitas dessas leituras que podem ter sido descartadas quando convertidas pela primeira vez para leitura de sequência de dados genéticos secundários podem ser usadas tratando as leituras de maneira probabilística.
[0417] Em uma modalidade da presente divulgação, o software de nível superior não depende das chamadas de alelo, chamadas de SNP ou leituras de sequência que são determinadas pelo software de nível inferior. Em vez disso, o software de nível superior baseia seus cálculos nos sinais analógicos medidos diretamente da plataforma de genotipagem. Em uma modalidade da presente divulgação, todas as chamadas genéticas, chamadas de SNPs, leituras de sequência, mapeamento de sequência são tratados de maneira probabilística usando os dados de intensidade bruta medidos diretamente pela plataforma de genotipagem, em vez de converter os dados genéticos primários em chamadas genéticas secundárias. Em uma modalidade, as medições de DNA da amostra preparada usadas no cálculo das probabilidades de contagem de alelos e na determinação da probabilidade relativa de cada hipótese compreendem dados genéticos primários.
[0418] Em algumas modalidades, o método pode aumentar a precisão dos dados genéticos de um indivíduo-alvo que incorporam dados genéticos de pelo menos um indivíduo relacionado, o método compreendendo a obtenção de dados genéticos primários específicos para o genoma de um indivíduo-alvo e dados genéticos específicos para o genoma (ou genomas) do indivíduo (ou indivíduos) relacionado, criando um conjunto de uma ou mais hipóteses sobre possivelmente quais segmentos de quais cromossomos do indivíduo (ou indivíduos) relacionado correspondem a esses segmentos no genoma do indivíduo-alvo, determinando a probabilidade de cada uma das hipóteses considerando os dados genéticos primários do indivíduo-alvo e os dados genéticos do indivíduo (ou indivíduos) relacionado e usando as probabilidades associadas a cada hipótese para determinar o estado mais provável do material genético real do indivíduo-alvo. Em uma modalidade, um método da presente divulgação pode determinar um estado alélico em um conjunto de alelos, em um indivíduo-alvo e de um ou ambos os pais do indivíduo-alvo e, opcionalmente, de um ou mais indivíduos relacionados, em que o método compreende a obtenção de dados genéticos primários do indivíduo-alvo e de um ou ambos os pais e de quaisquer indivíduos relacionados, criando um conjunto de pelo menos uma hipótese alélica para o indivíduo-alvo e para um ou ambos os pais e, opcionalmente, para um ou mais indivíduos relacionados, em que as hipóteses descrevem possíveis estados alélicos no conjunto de alelos, a determinação de uma probabilidade estatística para cada hipótese alélica no conjunto de hipóteses a partir dos dados genéticos obtidos e a determinação do estado alélico para cada um dos alelos no conjunto de alelos para o indivíduo-alvo, e para um ou ambos os pais, e opcionalmente para um ou mais indivíduos relacionados, com base nas probabilidades estatísticas de cada uma das hipóteses alélicas.
[0419] Em algumas modalidades, os dados genéticos da amostra mista podem compreender dados de sequência em que os dados de sequência podem não ser mapeados exclusivamente para o genoma humano. Em algumas modalidades, os dados genéticos da amostra mista podem compreender dados de sequência em que os dados de sequência mapeiam para uma pluralidade de locais no genoma, em que cada mapeamento possível está associado a uma probabilidade de que o mapeamento dado está correto. Em algumas modalidades, não se presume que as leituras de sequência sejam associadas a uma posição particular no genoma. Em algumas modalidades, as leituras de sequência estão associadas a uma pluralidade de posições no genoma e a uma probabilidade associada pertencente a essa posição.
COMBINAÇÃO DE MÉTODOS DE DETERMINAÇÃO DO ESTADO DO TRANSPLANTE
[0420] É divulgado aqui um método para fazer previsões mais precisas sobre o estado genético de um transplante, que compreende combinar previsões do estado de transplante com outros métodos conhecidos para fazer tal determinação. Por exemplo, os níveis de creatinina sérica foram usados anteriormente para tentar determinar o estado de um transplante de rim. Consultar a Figura 7.
[0421] Existem muitas maneiras de combinar as previsões, por exemplo, pode-se converter as medições do hormônio em um múltiplo da mediana (MoM) e, em seguida, em razões de verossimilhança (LR). Da mesma forma, outras medições podem ser transformadas em LRs usando o modelo de mistura de distribuições de NT. As taxas de detecção (DRs) e as taxas de falsos positivos (FPRs) poderiam ser calculadas tomando as proporções com riscos acima de um determinado limite de risco.
[0422] Em uma modalidade, é possível evocar o teorema do limite central para presumir que a distribuição em g(y|a ou e) é gaussiana e medir a média e o desvio padrão observando várias amostras. Em outra modalidade, pode-se presumir que eles não são independentes dado o resultado e coletar amostras suficientes para estimar a distribuição conjunta p(x1, x2, x3, x4|a ou e).
[0423] Em uma modalidade, o estado do transplante é determinado como sendo o estado do transplante que está associado à hipótese cuja probabilidade é maior. Em alguns casos, uma hipótese terá uma probabilidade combinada normalizada superior a 90%. Cada hipótese está associada a um ou a um conjunto de estados de transplante, e o transplante associado à hipótese cuja probabilidade combinada normalizada é superior a 90% ou algum outro valor limite, como 50%, 80%, 95%, 98%, 99% ou 99,9%, pode ser escolhido como o limite necessário para que uma hipótese seja chamada como o determinado estado do transplante.
DETERMINAR O NÚMERO DE MOLÉCULAS DE DNA EM UMA AMOSTRA.
[0424] Um método é descrito neste documento para determinar o número de moléculas de DNA em uma amostra, gerando uma molécula identificada exclusivamente para cada molécula de DNA original na amostra durante a primeira rodada de amplificação de DNA. É descrito aqui um procedimento para alcançar o fim acima seguido por uma molécula única ou método de sequenciamento clonal.
[0425] A abordagem implica em alvejar um ou mais locais específicos e gerar uma cópia etiquetada das moléculas originais de tal maneira que a maioria ou todas as moléculas etiquetadas de cada local alvejado terão uma etiqueta exclusiva e podem ser distinguidas umas das outras mediante o sequenciamento deste código de barras usando sequenciamento clonal ou de molécula única. Cada código de barras sequenciado exclusivo representa uma molécula exclusiva na amostra original. Simultaneamente, os dados de sequenciamento são usados para determinar o local do qual a molécula se origina. Usando essas informações, pode-se determinar o número de moléculas exclusivas na amostra original para cada local.
[0426] Este método pode ser usado para qualquer aplicação em que a avaliação quantitativa do número de moléculas em uma amostra original seja necessária. Além disso, o número de moléculas exclusivas de um ou mais alvos pode ser relacionado ao número de moléculas únicas para um ou mais outros alvos para determinar o número relativo de cópias, distribuição de alelos ou razão de alelos. Alternativamente, o número de cópias detectadas de vários alvos pode ser modelado por uma distribuição a fim de identificar o número mais provável de cópias dos alvos originais. As aplicações incluem, mas não estão limitadas à detecção de inserções e deleções, como aquelas encontradas em portadores de Distrofia Muscular de Duchenne; quantificação de segmentos de deleções ou duplicações de cromossomos, como aqueles observados em variantes do número de cópias; número de cópias de cromossomos de amostras de indivíduos nascidos; número de cópias cromossômicas de amostras de indivíduos por nascer, como embriões ou fetos.
[0427] O método pode ser combinado com a avaliação simultânea das variações contidas na sequência-alvo. Isso pode ser usado para determinar o número de moléculas que representam cada alelo na amostra original.
[0428] Em uma modalidade, o método, visto que se refere a um local-alvo único, pode compreender uma ou mais das seguintes etapas: (1) Projetar um par padrão de oligômeros para amplificação por PCR de um local específico. (2) Adicionar, durante a síntese, uma sequência de bases especificadas com nenhuma complementaridade ou complementaridade mínima ao local ou genoma-alvo à extremidade 5’ daquele do oligômero alvo- específico. Esta sequência, denominada cauda, é uma sequência conhecida, a ser utilizada para amplificação subsequente, seguida por uma sequência de nucleótidos aleatórios. Esses nucleotídeos aleatórios compreendem a região aleatória. A região aleatória compreende uma sequência gerada aleatoriamente de ácidos nucleicos que difere probabilisticamente entre cada molécula de sonda. Consequentemente, após a síntese, o pool de oligômeros com cauda consistirá em uma coleção de oligômeros começando com uma sequência conhecida seguida por uma sequência desconhecida que difere entre as moléculas, seguida pela sequência alvo-específica. (3) Realizar uma rodada de amplificação (desnaturação, hibridização, extensão) usando apenas o oligômero de cauda. (4) Adicionar exonuclease à reação, parando efetivamente a reação de PCR, e incubar a reação na temperatura apropriada para remover os oligos de fita simples diretos que não se hibridizaram em têmpora e se estendem para formar um produto de fita dupla. (5) Incubar a reação a uma alta temperatura para desnaturar a exonuclease e eliminar sua atividade. (6) Adicionar à reação um novo oligonucleotídeo que é complementar à cauda do oligômero usado na primeira reação juntamente com o outro oligômero alvo- específico para permitir a amplificação por PCR do produto gerado na primeira rodada de PCR. (7) Continuar a amplificação para gerar produto suficiente para sequenciamento clonal a jusante. (8) Medir o produto de PCR amplificado por uma infinidade de métodos, por exemplo, sequenciamento clonal, a um número suficiente de bases para abranger a sequência.
[0429] Em uma modalidade, um método da presente divulgação envolve a segmentação de vários locais em paralelo ou de outra forma. Os iniciadores para diferentes locais-alvo podem ser gerados independentemente e misturados para criar pools de PCR multiplex. Em uma modalidade, as amostras originais podem ser divididas em subpools e diferentes locais podem ser alvejados em cada subpool antes de serem recombinados e sequenciados. Em uma modalidade, a etapa de etiqeutagem e uma série de ciclos de amplificação podem ser realizados antes que o pool seja subdividido para garantir o alvejamento eficiente de todos os alvos antes da divisão e melhorar a amplificação subsequente pela amplificação contínua usando conjuntos menores de iniciadores em pools subdivididos.
[0430] Em algumas circunstâncias, especialmente nos casos em que há uma quantidade muito pequena de DNA, por exemplo, menos de 5.000 cópias do genoma, menos de 1.000 cópias do genoma, menos de 500 cópias do genoma e menos de 100 cópias do genoma, pode-se encontrar um fenômeno chamado formação de gargalo. Isso é quando há um pequeno número de cópias de qualquer determinado alelo na amostra inicial e polarizações de amplificação podem resultar no pool amplificado de DNA com proporções significativamente diferentes desses alelos do que na mistura inicial de DNA. Ao aplicar um conjunto exclusivo ou quase exclusivo de códigos de barras a cada fita de DNA antes da amplificação por PCR padrão, é possível excluir n-1 cópias de DNA de um conjunto de n moléculas idênticas de DNA sequenciado que se originaram da mesma molécula original.
[0431] Por exemplo, imagina-se um SNP heterozigótico no genoma de um indivíduo e uma mistura de DNA do indivíduo em que dez moléculas de cada alelo estão presentes na amostra original de DNA. Após a amplificação, pode haver 100.000 moléculas de DNA correspondentes a esse local. Devido a processos estocásticos, a razão de DNA pode ser de 1:2 a 2:1, no entanto, uma vez que cada uma das moléculas originais foi etiquetada com uma etiqueta exclusiva, seria possível determinar que o DNA no pool amplificado se originou de exatamente 10 moléculas de DNA de cada alelo. Este método forneceria, portanto, uma medida mais precisa das quantidades relativas de cada alelo do que um método que não usa essa abordagem. Para métodos em que é desejável que a quantidade relativa de polarização do alelo seja minimizada, este método irá fornecer dados mais precisos.
[0432] A associação do fragmento sequenciado ao local-alvo pode ser conseguida de várias maneiras. Em uma modalidade, uma sequência de comprimento suficiente é obtida a partir do fragmento alvejado para abranger o código de barras da molécula, bem como um número suficiente de bases exclusivas correspondentes à sequência-alvo para permitir a identificação inequívoca do local-alvo. Em outra modalidade, o iniciador de código de barras molecular que contém o código de barras molecular gerado aleatoriamente também pode conter um código de barras específico do local (código de barras do local) que identifica o alvo ao qual deve ser associado. Este código de barras do local seria idêntico entre todos os iniciadores de código de barras moleculares para cada alvo individual e, portanto, todos os amplicons resultantes, mas diferente de todos os outros alvos. Em uma modalidade, o método de etiquetagem aqui descrito pode ser combinado com um protocolo de aninhamento unilateral.
[0433] Em uma modalidade, o projeto e a geração de iniciadores de código de barras molecular podem ser reduzidos à prática da seguinte forma: os iniciadores de código de barras molecular podem consistir em uma sequência que não é complementar à sequência-alvo seguida por região de código de barras molecular aleatória seguida por uma sequência alvo-específica. A sequência 5’ do código de barras molecular pode ser usada para a amplificação de PCR de subsequência e pode compreender sequências úteis na conversão do amplicon em uma biblioteca para sequenciamento. A sequência aleatória do código de barras molecular pode ser gerada de várias maneiras. O método preferido sintetiza o iniciador de etiquetagem de molécula de modo a incluir todas as quatro bases na reação durante a síntese da região do código de barras. Todas ou várias combinações de bases podem ser especificadas usando os códigos de ambiguidade de DNA da IUPAC. Desta forma, a coleção sintetizada de moléculas conterá uma mistura aleatória de sequências na região do código de barras molecular. O comprimento da região do código de barras determinará quantos iniciadores conterão códigos de barras exclusivos. O número de sequências exclusivas está relacionado ao comprimento da região do código de barras como N L, em que N é o número de bases, normalmente 4, e L é o comprimento do código de barras. Um código de barras de cinco bases pode produzir até 1.024 sequências exclusivas; um código de barras de oito bases pode produzir 65.536 códigos de barras exclusivos. Em uma modalidade, o DNA pode ser medido por um método de sequenciamento, em que os dados da sequência representam a sequência de uma única molécula. Isso pode incluir métodos em que moléculas únicas são sequenciadas diretamente ou métodos em que moléculas únicas são amplificadas para formar clones detectáveis pelo instrumento de sequência, mas que ainda representam moléculas únicas, aqui denominado sequenciamento clonal.
[0434] Em algumas modalidades, os códigos de barras moleculares descritos neste documento são Etiquetas de Índice Molecular ("MITs"), que são anexadas a uma população de moléculas de ácido nucleico de uma amostra para identificar moléculas de ácido nucleico de amostra individual da população de moléculas de ácido nucleico (ou seja, membros de população) após o processamento da amostra para uma reação de sequenciamento. MITs são descritas em detalhes na Patente nº U.S.
10.011.870 para Zimmermann et al., que se incorpora ao presente documento a título de referência em sua totalidade. Ao contrário dos métodos da técnica anterior que se referem a identificadores exclusivos e ensinam a ter uma diversidade de identificadores exclusivos que é maior do que o número de moléculas de ácido nucleico de amostra em uma amostra, a fim de etiquetar cada molécula de ácido nucleico de amostra com um identificador exclusivo, a presente divulgação normalmente envolve muito mais moléculas de ácido nucleico de amostra do que a diversidade de MITs em um conjunto de MITs. Na verdade, métodos e composições aqui podem incluir mais de 1.000, 1x10 6, 1x109, ou até mais moléculas de partida para cada MIT diferente em um conjunto de MITs. No entanto, os métodos ainda podem identificar moléculas de ácido nucleico de amostra individual que dão origem a uma molécula de ácido nucleico etiquetada após a amplificação.
[0435] Nos métodos e composições aqui, a diversidade do conjunto de MITs é vantajosamente menor do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo, mas a diversidade das combinações possíveis de MITs anexadas usando o conjunto de MITs é maior do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo. Normalmente, para melhorar a capacidade de identificação do conjunto de MITs, pelo menos duas MITs são ligadas a uma molécula de ácido nucleico de amostra para formar uma molécula de ácido nucleico etiquetada. As sequências de MITs anexadas determinadas a partir de leituras de sequenciamento podem ser usadas para identificar cópias idênticas amplificadas clonalmente da mesma molécula de ácido nucleico de amostra que são anexadas a diferentes suportes sólidos ou diferentes regiões de um suporte sólido durante a preparação da amostra para a reação de sequenciamento. As sequências de moléculas de ácido nucleico etiquetadas podem ser compiladas, comparadas e usadas para diferenciar mutações de nucleotídeos incorridas durante a amplificação de diferenças de nucleotídeos presentes nas moléculas de ácido nucleico da amostra inicial.
[0436] Conjuntos de MITs na presente divulgação normalmente têm uma diversidade menor do que o número total de moléculas de ácido nucleico de amostra, enquanto muitos métodos anteriores utilizavam conjuntos de "identificadores exclusivos", em que a diversidade dos identificadores exclusivos era maior do que o número total de moléculas de ácido nucleico de amostra. No entanto, as MITs da presente divulgação retêm poder de rastreamento suficiente incluindo uma diversidade de combinações possíveis de MITs anexadas usando o conjunto de MITs que é maior do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo. Esta diversidade inferior para um conjunto de MITs da presente divulgação reduz significativamente o custo e a complexidade de fabricação associada à geração e/ou obtenção de conjuntos de etiquetas de rastreamento. Embora o número total de moléculas de MIT em uma mistura de reação seja tipicamente maior que o número total de moléculas de ácido nucleico de amostra, a diversidade do conjunto de MITs é muito menor do que o número total de moléculas de ácido nucleico de amostra, o que reduz substancialmente o custo e simplifica a capacidade de fabricação em relação aos métodos da técnica anterior. Assim, um conjunto de MITs pode incluir uma diversidade de apenas 3, 4, 5, 10, 25, 50 ou 100 MITs diferentes na extremidade inferior da faixa e 10, 25, 50, 100, 200, 250, 500 ou 1.000 MITs na extremidade superior da faixa, por exemplo. Por conseguinte, na presente divulgação, esta diversidade relativamente baixa de MITs resulta em uma diversidade muito menor de MITs do que o número total de moléculas de ácido nucleico da amostra, que em combinação com um maior número total de MITs na mistura de reação do que o total de moléculas de ácido nucleico da amostra e uma maior diversidade nas combinações possíveis de quaisquer 2 MITs do conjunto de MITs do que o número de moléculas de ácido nucleico da amostra que abrangem um local-alvo, fornece uma modalidade particularmente vantajosa que é econômica e muito eficaz com amostras complexas isoladas da natureza.
[0437] Em algumas modalidades, a população de moléculas de ácido nucleico não foi amplificada in vitro antes de anexar as MITs e pode incluir entre 1x108 e 1x1013, ou em algumas modalidades, entre 1x109 e 1x1012 ou entre 1x1010 e 1x1012 moléculas de ácido nucleico de amostra. Em algumas modalidades, uma mistura de reação é formada incluindo a população de moléculas de ácido nucleico e um conjunto de MITs, em que o número total de moléculas de ácido nucleico na população de moléculas de ácido nucleico é maior do que a diversidade de MITs no conjunto de MITs e em que há pelo menos três MITs no conjunto. Em algumas modalidades, a diversidade das combinações possíveis de MITs anexadas usando o conjunto de MITs é maior do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo e menor do que o número total de moléculas de ácido nucleico de amostra na população. Em algumas modalidades, a diversidade do conjunto de MITs pode incluir entre 10 e 500 MITs com sequências diferentes. A razão do número total de moléculas de ácido nucleico na população de moléculas de ácido nucleico na amostra para a diversidade de MITs no conjunto, em certos métodos e composições no presente documento, pode estar entre 1.000:1 e 1.000.000.000:1. A razão da diversidade das combinações possíveis de MITs anexadas usando o conjunto de MITs para o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo pode estar entre 1,01:1 e 10:1. As MITs normalmente são compostas, pelo menos em parte, de um oligonucleotídeo entre 4 e 20 nucleotídeos de comprimento, conforme discutido em mais detalhes aqui. O conjunto de MITs pode ser projetado de modo que as sequências de todas as MITs no conjunto difiram umas das outras em pelo menos 2, 3, 4 ou 5 nucleotídeos.
[0438] Em algumas modalidades fornecidas aqui, pelo menos um (por exemplo, 2, 3, 5, 10, 20, 30, 50, 100) MIT do conjunto de MITs são anexadas a cada molécula de ácido nucleico ou a um segmento de cada molécula de ácido nucleico da população de moléculas de ácido nucleico para formar uma população de moléculas de ácido nucleico etiquetadas. As MITs podem ser ligadas a uma molécula de ácido nucleico de amostra em várias configurações, conforme discutido mais adiante neste documento. Por exemplo, após a fixação, uma MIT pode estar localizada no terminal 5’ das moléculas de ácido nucleico etiquetadas ou 5' em relação ao segmento de ácido nucleico da amostra de algumas, a maioria ou tipicamente cada uma das moléculas de ácido nucleico etiquetadas e/ou outra MIT pode estar localizada em 3’ em relação ao segmento de ácido nucleico da amostra de algumas, da maioria ou tipicamente cada uma das moléculas de ácido nucleico etiquetadas. Em outras modalidades, pelo menos duas MITs estão localizadas em 5’ e/ou 3' em relação ao núcleo da amostra segmentos de ácido das moléculas de ácido nucleico etiquetadas, ou a 5’ e/ou 3' em relação ao segmento de ácido nucleico da amostra de algumas, a maioria ou tipicamente cada uma das moléculas de ácido nucleico etiquetadas. Duas MITs podem ser adicionadas a 5’ ou 3' incluindo ambas no mesmo segmento polinucleotídico antes da anexação ou realizando reações separadas. Por exemplo, a PCR pode ser realizada com iniciadores que ligam a sequências específicas dentro das moléculas de ácido nucleico da amostra e incluem uma região 5’ à região específica da sequência que codifica duas MITs. Em algumas modalidades, pelo menos uma cópia de cada MIT do conjunto de MITs é anexada a uma molécula de ácido nucleico de amostra, duas cópias de pelo menos uma MIT são cada uma anexada a uma molécula de ácido nucleico de amostra diferente e/ou pelo menos duas moléculas de ácido nucleico de amostras com a mesma sequência ou substancialmente a mesma sequência têm pelo menos uma MIT diferente anexada. Um versado na técnica irá identificar métodos para ligar MITs a moléculas de ácido nucleico de uma população de moléculas de ácido nucleico. Por exemplo, as MITs podem ser anexadas por meio de ligação ou 5’ anexado a um sítio de ligação de sequência interna de um iniciador de PCR e anexadas durante uma reação de PCR, conforme discutido em mais detalhes no presente documento.
[0439] Após ou enquanto as MITs são anexadas aos ácidos nucleicos da amostra para formar moléculas de ácido nucleico etiquetadas, a população de moléculas de ácido nucleico etiquetadas é tipicamente amplificada para criar uma biblioteca de moléculas de ácido nucleico etiquetadas. Métodos para amplificação para gerar uma biblioteca, incluindo aqueles particularmente relevantes para um fluxo de trabalho de sequenciamento de alto rendimento, são conhecidos na técnica. Por exemplo, tal amplificação pode ser uma preparação de biblioteca baseada em PCR. Estes métodos podem incluir, ainda, a amplificação clonal da biblioteca de moléculas de ácido nucleico etiquetadas em um ou mais suportes sólidos usando PCR ou outro método de amplificação, como um método isotérmico. Métodos para gerar bibliotecas amplificadas por clonagem em suportes sólidos em fluxos de trabalho de preparação de amostra de sequenciamento de alto rendimento são conhecidos na técnica. Etapas de amplificação adicionais, como uma reação de amplificação multiplex na qual um subconjunto da população de moléculas de ácido nucleico de amostra é amplificado, podem ser incluídas em métodos para identificar ácidos nucleicos de amostra também fornecidos neste documento.
[0440] Em algumas modalidades, uma sequência de nucleotídeos das MITs e pelo menos uma porção dos segmentos da molécula de ácido nucleico da amostra de algumas, a maioria ou todas (por exemplo, pelo menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 25, 50, 75, 100, 150, 200, 250, 500,
1.000, 2.500, 5.000, 10.000, 15.000, 20.000, 25.000, 50.000, 100.000,
1.000.000, 5.000.000, 10.000.000, 25.000.000, 50.000.000, 100.000.000,
250.000.000, 500.000.000, 1x109, 1x1010, 1x1011, 1x1012 ou 1x1013 moléculas de ácido nucleico etiquetadas ou entre 10, 20, 25, 30, 40, 50, 60, 70, 80 ou 90% das moléculas de ácido nucleico etiquetadas na extremidade inferior da faixa e 20, 25, 30, 40, 50, 60, 70, 80 ou 90, 95, 96, 97, 98, 99 e 100% na extremidade superior da faixa) as moléculas de ácido nucleico etiquetadas na biblioteca de moléculas de ácido nucleico etiquetadas é, então, determinada. A sequência de uma primeira MIT e opcionalmente uma segunda MIT ou mais MITs em cópias amplificadas clonalmente de uma molécula de ácido nucleico etiquetada pode ser usada para identificar a molécula de ácido nucleico de amostra individual que deu origem à molécula de ácido nucleico etiquetada amplificada por clonagem na biblioteca.
[0441] Em algumas modalidades, as sequências determinadas a partir de moléculas de ácido nucleico etiquetadas que compartilham a mesma primeira e, opcionalmente, a mesma segunda MIT podem ser usadas para identificar erros de amplificação, diferenciando erros de amplificação de diferenças de sequência reais em locais-alvo nas moléculas de ácido nucleico de amostra. Por exemplo, em algumas modalidades, o conjunto de MITs consiste em MITs de fita dupla que, por exemplo, podem ser uma porção de um adaptador de fita dupla parcial ou totalmente, como um adaptador em Y. Nessas modalidades, para cada molécula de partida, uma preparação de adaptador em Y gera 2 tipos de moléculas filhas, uma em uma orientação + e uma em uma orientação -. Uma mutação verdadeira em uma molécula de amostra deve ter ambas as moléculas filhas emparelhadas com as mesmas 2 MITs nessas modalidades em que as MITs são um adaptador de fita dupla ou uma porção do mesmo. Além disso, quando as sequências para as moléculas de ácido nucleico etiquetadas são determinadas e agrupadas pelas MITs nas sequências em famílias de segmentos de ácido nucleico de MIT, considerando a sequência de MIT e opcionalmente seu complemento para MITs de fita dupla e, opcionalmente, considerando pelo menos uma porção do segmento de ácido nucleico, a maioria, e tipicamente pelo menos 75% em modalidades de MIT de fita dupla, dos segmentos de ácido nucleico em uma família de segmento de ácido nucleico de MIT incluirá a mutação se a molécula de partida que deu origem às moléculas de ácido nucleico etiquetadas tivesse a mutação. No caso de um erro de amplificação (por exemplo, PCR), a situação de pior caso é que o erro ocorra no ciclo 1 da 1ª PCR. Nessas modalidades, um erro de amplificação fará com que 25% do produto final contenha o erro (mais qualquer erro acumulado adicional, mas este deve ser <<1%). Portanto, em algumas modalidades, se uma família de segmento de ácido nucleico de MIT contiver pelo menos 75% das leituras para uma mutação particular ou alelo polimórfico, por exemplo, pode-se concluir que a mutação ou alelo polimórfico está realmente presente na molécula de ácido nucleico de amostra que deu origem à molécula de ácido nucleico etiquetada. Quanto mais tarde ocorrer um erro em um processo de preparação de amostra, menor será a proporção de leituras de sequência que incluem o erro em um conjunto de leituras de sequenciamento agrupadas (ou seja, agrupadas) por MITs em uma família de segmentos de ácido nucleico de MIT emparelhada. Por exemplo, um erro em uma amplificação de preparação de biblioteca resultará em uma maior porcentagem de sequências com o erro em uma família de segmentos de ácido nucleico de MIT emparelhada, do que um erro em uma etapa de amplificação subsequente no fluxo de trabalho, como uma amplificação multiplex alvejada. Um erro na amplificação clonal final em um fluxo de trabalho de sequenciamento cria a menor porcentagem de moléculas de ácido nucleico em uma família de segmentos de ácido nucleico de MIT emparelhada que inclui o erro.
[0442] Em algumas modalidades aqui divulgadas, a razão do número total das moléculas de ácido nucleico da amostra para a diversidade das MITs no conjunto de MITs ou a diversidade das combinações possíveis de MITs anexadas usando o conjunto de MITs pode estar entre 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 1.000:1, 2.000:1, 3.000:1, 4.000:1, 5.000:1, 6.000:1,
7.000:1, 8.000:1, 9.000:1, 10.000:1, 15.000:1, 20.000:1, 25.000:1, 30.000:1,
40.000:1, 50.000:1, 60.000:1, 70.000:1, 80.000:1, 90.000:1, 100.000:1,
200.000:1, 300.000:1, 400.000:1, 500.000:1, 600.000:1, 700.000:1, 800.000:1,
900.000:1 e 1.000.000:1 na extremidade inferior da faixa e 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 1.000:1, 2.000:1, 3.000:1, 4.000:1,
5.000:1, 6.000:1, 7.000:1, 8.000:1, 9.000:1, 10.000:1, 15.000:1, 20.000:1,
25.000:1, 30.000:1, 40.000:1, 50.000:1, 60.000:1, 70.000:1, 80.000:1, 90.000:1,
100.000:1, 200.000:1, 300.000:1, 400.000:1, 500.000:1, 600.000:1, 700.000:1,
800.000:1, 900.000:1, 1.000.000:1, 2.000.000:1, 3.000.000:1, 4.000.000:1,
5.000.000:1, 6.000.000:1, 7.000.000:1, 8.000.000:1, 9.000.000:1, 10.000.000:1,
50.000.000:1, 100.000.000:1 e 1.000.000.000:1 na extremidade superior da faixa.
[0443] Em algumas modalidades, a amostra é uma amostra de cfDNA humano. Em tal método, conforme divulgado neste documento, a diversidade está entre cerca de 20 milhões e cerca de 3 bilhões. Nessas modalidades, a razão do número total de moléculas de ácido nucleico de amostra para a diversidade do conjunto de MITs pode estar entre 100.000:1, 1x106:1, 1x107:1, 2x107:1 e 2,5x107:1 na extremidade inferior da faixa e 2x107:1, 2,5x107:1, 5x107:1, 1x108:1, 2,5 x108:1, 5 x108:1 e 1x109:1 na extremidade superior da faixa.
[0444] Em algumas modalidades, a diversidade de combinações possíveis de MITs anexadas usando o conjunto de MITs é preferencialmente maior do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo. Por exemplo, se houver 100 cópias do genoma humano que foram, todas, fragmentadas em fragmentos de 200 pb, de modo que haja aproximadamente 15.000.000 de fragmentos para cada genoma, então é preferível que a diversidade de combinações possíveis de MITs seja maior que 100 (número de cópias de cada local-alvo), porém, menos de 1.500.000.000 (número total de moléculas de ácido nucleico). Por exemplo, a diversidade de combinações possíveis de MITs pode ser maior que 100, porém, muito menor que 1.500.000.000, como 200, 300, 400, 500, 600, 700, 800, 900 ou 1.000 possíveis combinações de MITs anexadas. Embora a diversidade de MITs no conjunto de MITs seja menor do que o número total de moléculas de ácido nucleico, o número total de MITs na mistura de reação é superior ao número total de moléculas de ácido nucleico ou segmentos de molécula de ácido nucleico na mistura de reação. Por exemplo, se houver
1.500.000.000 de moléculas de ácido nucleico ou segmentos de moléculas de ácido nucleico no total, haverá mais de 1.500.000.000 de moléculas de MIT totais na mistura de reação. Em algumas modalidades, a razão da diversidade de MITs no conjunto de MITs pode ser menor do que o número de moléculas de ácido nucleico em uma amostra que abrange um local-alvo, enquanto a diversidade das combinações possíveis de MITs anexadas usando o conjunto de MITs pode ser maior do que o número de moléculas de ácido nucleico na amostra que abrange um local-alvo. Por exemplo, a razão do número de moléculas de ácido nucleico em uma amostra que abrange um local-alvo para a diversidade de MITs no conjunto de MITs pode ser de pelo menos 10:1, 25:1, 50:1, 100:1, 125:1, 150:1 ou 200:1 e a razão da diversidade das possíveis combinações de MITs anexadas usando o conjunto de MITs para o número de moléculas de ácido nucleico na amostra que abrange um local-alvo pode ser pelo menos 1,01:1, 1,1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 25:1, 50:1, 100:1, 250:1, 500:1 ou 1.000:1.
[0445] Normalmente, a diversidade de MITs no conjunto de MITs é menor do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo, enquanto a diversidade das combinações possíveis de MITs anexadas é maior do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo. Em modalidades em que 2 MITs estão ligadas a moléculas de ácido nucleico de amostra, a diversidade de MITs no conjunto de MITs é menor do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo, porém, maior do que a raiz quadrada do número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo. Em algumas modalidades, a diversidade de MITs é menor do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo, mas 1, 2, 3, 4 ou 5 a mais do que a raiz quadrada do número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo. Assim, embora a diversidade de MITs seja menor do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo, o número total de combinações de quaisquer 2 MITs é maior do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo. A diversidade de MITs no conjunto é normalmente menos da metade do número de moléculas de ácido nucleico de amostra do que abrangem um local-alvo em amostras com pelo menos 100 cópias de cada local-alvo. Em algumas modalidades, a diversidade de MITs no conjunto pode ser pelo menos 1, 2, 3, 4 ou 5 a mais do que a raiz quadrada do número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo, porém, menos de 1/5, 1/10, 1/20, 1/50 ou 1/100 do número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo. Para amostras com entre 2.000 e 1.000.000 de moléculas de ácido nucleico de amostra que abrangem um local-alvo, o número de MITs no conjunto não excede 1.000. Por exemplo, em uma amostra com 10.000 cópias do genoma em uma amostra de DNA genômico, como uma amostra de DNA livre de células de circulação, de modo que a amostra tenha 10.000 moléculas de ácido nucleico de amostra que abrangem um local-alvo, a diversidade de MITs pode estar entre 101 e 1.000, ou entre 101 e 500, ou entre 101 e 250. Em algumas modalidades, a diversidade de MITs no conjunto de MITs pode estar entre a raiz quadrada do número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo e 1, 10, 25, 50, 100, 125, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900 ou 1.000 a menos do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo. Em algumas modalidades, a diversidade de MITs no conjunto de MITs pode estar entre 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75% e 80% do número de moléculas de ácido nucleico de amostra que abrangem um local-alvo na extremidade inferior da faixa e 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% e 99% do número de moléculas de ácido nucleico de amostra que abrangem um local-alvo na extremidade superior da faixa.
[0446] Em algumas modalidades, a razão do número total de MITs na mistura de reação para o número total de moléculas de ácido nucleico de amostra na mistura de reação pode estar entre 1,01, 1,1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 25:1, 50:1, 100:1, 200:1, 300:1, 400:1, 500:1,
600:1, 700:1, 800:1, 900:1, 1.000:1, 2.000:1, 3.000:1, 4.000:1, 5.000:1, 6.000:1,
7.000:1, 8.000:1, 9.000:1 e 10.000:1 na extremidade inferior da faixa e 25:1, 50:1, 100:1, 200:1, 300:1, 400:1, 500:1, 600:1, 700:1, 800:1, 900:1, 1.000:1,
2.000:1, 3.000:1, 4.000:1, 5.000:1, 6.000:1, 7.000:1, 8.000:1, 9.000:1, 10.000:1,
15.000:1, 20.000:1, 25.000:1, 30.000:1, 40.000:1 e 50.000:1 na extremidade superior da faixa. Em algumas modalidades, o número total de MITs na mistura de reação é pelo menos 50%, 60%, 70 %, 80%, 90%, 95%, 96%, 97%, 98%, 99% ou 99,9% do número total de moléculas de ácido nucleico de amostra na mistura de reação. Em outras modalidades, a razão do número total de MITs na mistura de reação para o número total de moléculas de ácido nucleico de amostra na mistura de reação pode ser de pelo menos MITs suficientes para que cada molécula de ácido nucleico de amostra tenha o número apropriado de MITs anexadas, isto é, 2:1 para 2 MITs sendo anexadas, 3:1 para 3 MITs, 4:1 para 4 MITs, 5:1 para 5 MITs, 6:1 para 6 MITs, 7:1 para 7 MITs, 8:1 para 8 MITs, 9:1 para 0 MITs e 10:1 para 10 MITs.
[0447] Em algumas modalidades, a razão do número total de MITs com sequências idênticas na mistura de reação para o número total de segmentos de ácido nucleico na mistura de reação pode ser entre 0,1:1, 0,2:1, 0,3:1, 0,4:1, 0,5:1, 0,6:1, 0,7:1, 0,8:1, 0,9:1, 1:1, 1,1:1, 1,2:1, 1,3:1, 1,4:1, 1,5:1, 1,6:1, 1,7:1, 1,8:1, 1,9:1, 2:1, 2,25:1, 2,5:1, 2,75:1, 3:1, 3,5:1, 4:1, 4,5:1 e 5:1 na extremidade inferior da faixa e 0,5:1, 0,6:1, 0,7:1, 0,8:1, 0,9:1, 1:1, 1,1:1, 1,2:1, 1,3:1, 1,4:1, 1,5:1, 1,6:1, 1,7:1, 1,8:1, 1,9:1, 2:1, 2,25:1, 2,5:1, 2,75:1, 3:1, 3,5:1, 4:1, 4,5:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1 e 100:1 na extremidade superior da faixa.
[0448] O conjunto de MITs pode incluir, por exemplo, pelo menos três MITs ou entre 10 e 500 MITs. Conforme discutido aqui em algumas modalidades, as moléculas de ácido nucleico da amostra são adicionadas diretamente à mistura de reação de fixação sem amplificação. Estas moléculas de ácido nucleico de amostra podem ser purificadas a partir de uma fonte, como uma célula viva ou organismo vivo, conforme divulgado aqui e, então, as MITs podem ser anexadas sem amplificar as moléculas de ácido nucleico. Em algumas modalidades, as moléculas de ácido nucleico da amostra ou segmentos de ácido nucleico podem ser amplificados antes de anexar MITs. Conforme discutido aqui, em algumas modalidades, as moléculas de ácido nucleico da amostra podem ser fragmentadas para gerar segmentos de ácido nucleico de amostra. Em algumas modalidades, outras sequências de oligonucleotídeos podem ser anexadas (por exemplo, ligadas) às extremidades das moléculas de ácido nucleico da amostra antes que as MITs sejam anexadas.
[0449] Em algumas modalidades aqui divulgadas, a razão de moléculas de ácido nucleico, segmentos de ácido nucleico ou fragmentos de amostra que incluem um local-alvo para MITs na mistura de reação pode estar entre 1,01:1, 1,05:1, 1,1:1, 1,2:1, 1,3:1, 1,4:1, 1,5:1, 1,6:1, 1,7:1, 1,8:1, 1,9:1, 2:1, 2,5:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 15:1, 20:1, 25:1, 30:1, 35:1, 40:1, 45:1 e 50:1 na extremidade inferior e 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 15:1, 20:1, 25:1, 30:1, 35:1, 40:1, 45:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 125:1, 150:1, 175:1, 200:1, 300:1, 400:1 e 500:1 na extremidade superior. Por exemplo, em algumas modalidades, a razão de moléculas de ácido nucleico, segmentos de ácido nucleico ou fragmentos de amostra com um local-alvo específico para MITs na mistura de reação está entre 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 15:1, 20:1, 25:1, 30:1, 35:1, 40:1, 45:1 e 50:1 na extremidade inferior e 20:1, 25:1, 30:1, 35:1, 40:1, 45:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1 e 200:1 na extremidade superior. Em algumas modalidades, a razão de moléculas de ácido nucleico ou segmentos de ácido nucleico de amostra para MITs na mistura de reação pode estar entre 25:1, 30:1, 35:1, 40:1, 45:1, 50:1 na extremidade inferior e 50:1, 60:1, 70:1, 80:1, 90:1, 100:1 na extremidade superior. Em algumas modalidades, a diversidade das combinações possíveis de MITs anexadas pode ser maior do que o número de moléculas de ácido nucleico, segmentos de ácido nucleico ou fragmentos de amostra que abrangem um local-alvo. Por exemplo, em algumas modalidades,
a razão da diversidade das combinações possíveis de MITs anexadas para o número de moléculas de ácido nucleico, segmentos de ácido nucleico ou fragmentos de amostra que abrangem um local-alvo podem ser pelo menos 1,01, 1,1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 20:1, 25:1, 50:1, 100:1, 250:1, 500:1 ou 1.000:1.
[0450] As misturas de reação para moléculas de ácido nucleico de etiquetagem com MITs (ou seja, anexar moléculas de ácido nucleico a MITs), conforme fornecido neste documento, podem incluir reagentes adicionais, além de uma população de moléculas de ácido nucleico de amostra e um conjunto de MITs. Por exemplo, as misturas de reação para etiquetagem podem incluir uma ligase ou polimerase com tampões adequados em um pH apropriado, trifosfato de adenosina (ATP) para ligases dependentes de ATP ou dinucleotídeo de adenina nicotinamida para ligases dependentes de NAD, trifosfatos de desoxinucleosídeos (dNTPs) para polimerases, e opcionalmente reagentes de aglomeração molecular, tais como polietilenoglicol. Em certas modalidades, a mistura de reação pode incluir uma população de moléculas de ácido nucleico de amostra, um conjunto de MITs e uma polimerase ou ligase, em que a razão do número de moléculas de ácido nucleico, segmentos de ácido nucleico ou fragmentos de amostra com um local-alvo específico para o número de MITs na mistura de reação pode ser qualquer uma das razões aqui divulgadas, por exemplo, entre 2:1 e 100:1, ou entre 10:1 e 100:1 ou entre 25:1 e 75:1, ou está entre 40:1 e 60:1, ou entre 45:1 e 55:1, ou entre 49:1 e 51:1.
[0451] Em algumas modalidades aqui divulgadas, o número de MITs diferentes (isto é, diversidade) no conjunto de MITs pode estar entre 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1.000, 1.500, 2.000, 2.500 e 3.000 MITs com sequências diferentes na extremidade inferior e 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200,
250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1.000, 2.000, 3.000, 4.000 e
5.000 MITs com diferentes sequências na extremidade superior. Por exemplo, a diversidade de diferentes MITs no conjunto de MITs pode estar entre 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90 e 100 sequências de MIT diferentes na extremidade inferior e 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250 e 300 sequências de MIT diferentes na extremidade superior. Em algumas modalidades, a diversidade de diferentes MITs no conjunto de MITs pode estar entre 50, 60, 70, 80, 90, 100, 125 e 150 diferentes sequências de MIT na extremidade inferior e 100, 125, 150, 175, 200 e 250 sequências de MIT diferentes na extremidade superior. Em algumas modalidades, a diversidade de diferentes MITs no conjunto de MITs pode estar entre 3 e 1.000, ou 10 e 500, ou 50 e 250 diferentes sequências de MIT. Em algumas modalidades, a diversidade de possíveis combinações de MITs anexadas usando o conjunto de MITs pode estar entre 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500 e 1.000, 2.000, 3.000, 4.000, 5.000, 6.000, 7.000,
8.000, 9.000, 10.000, 20.000, 30.000, 40.000, 50.000, 60.000, 70.000, 80.000,
90.000, 100.000, 250.000, 500.000, 1.000.000 de combinações possíveis de MITs anexadas na extremidade inferior da faixa e 10, 15, 20, 25, 30, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 1.000, 2.000, 3.000, 4.000, 5.000, 6.000,
7.000, 8.000, 9.000, 10.000, 20.000, 30.000, 40.000, 50.000, 60.000, 70.000,
80.000, 90.000, 100.000, 250.000, 500.000, 1.000.000, 2.000.000, 3.000.000,
4.000.000, 5.000.000, 6.000.000, 7.000.000, 8.000.000, 9.000.000 e
10.000.000 combinações possíveis de MITs anexadas na extremidade superior da faixa.
[0452] As MITs no conjunto de MITs são normalmente todas do mesmo comprimento. Por exemplo, em algumas modalidades, as MITs podem ter qualquer comprimento entre 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 e 20 nucleotídeos na extremidade inferior e 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 e 30 nucleotídeos na extremidade superior. Em certas modalidades, as MITs têm qualquer comprimento entre 3, 4, 5, 6, 7 ou 8 nucleotídeos na extremidade inferior e 5, 6, 7, 8, 9, 10 ou 11 nucleotídeos na extremidade superior. Em algumas modalidades, os comprimentos das MITs podem ser qualquer comprimento entre 4, 5 ou 6, nucleotídeos na extremidade inferior e 5, 6 ou 7 nucleotídeos na extremidade superior. Em algumas modalidades, o comprimento das MITs é de 5, 6 ou 7 nucleotídeos.
[0453] Como será entendido, um conjunto de MITs normalmente inclui muitas cópias idênticas de cada membro de MIT do conjunto. Em algumas modalidades, um conjunto de MITs inclui entre 10, 20, 25, 30, 40, 50, 100, 500, 1.000, 10.000, 50.000 e 100.000 vezes mais cópias na extremidade inferior da faixa e 100, 500, 1.000, 10.000, 50.000, 100.000,
250.000, 500.000 e 1.000.000 de cópias a mais na extremidade superior da faixa, do que o número total de moléculas de ácido nucleico de amostra que abrangem um local-alvo. Por exemplo, em uma amostra de DNA livre de células circulantes humanos isolado do plasma, pode haver uma quantidade de fragmentos de DNA que inclui, por exemplo, 1.000 a 100.000 fragmentos circulantes que abrangem qualquer local-alvo do genoma. Em certas modalidades, não há mais do que 1/10, 1/4, 1/2 ou 3/4 das cópias de qualquer determinada MIT como MITs exclusivas totais em um conjunto de MITs. Entre os membros do conjunto, pode haver 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 diferenças entre qualquer sequência e o restante das sequências. Em algumas modalidades, a sequência de cada MIT no conjunto difere de todas as outras MITs por ao menos 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 nucleotídeos. Para reduzir a chance de identificação incorreta de uma MIT, o conjunto de MITs pode ser projetado usando métodos que um versado na técnica reconhecerá, como levar em consideração as distâncias de Hamming entre todas as MITs no conjunto de MITs. A distância de Hamming mede o número mínimo de substituições necessárias para mudar uma coluna, ou sequência de nucleotídeos em outra. Aqui, a distância de Hamming mede o número mínimo de erros de amplificação necessários para transformar uma sequência de MIT em um conjunto em outra sequência de MIT do mesmo conjunto. Em certas modalidades, diferentes MITs do conjunto de MITs têm uma distância de Hamming inferior a 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 entre si.
[0454] Em certas modalidades, um conjunto de MITs isoladas, conforme fornecido neste documento, é uma modalidade da presente divulgação. O conjunto de MITs isoladas pode ser um conjunto de moléculas de ácido nucleico de fita simples ou parcial ou totalmente de fita dupla, em que cada MIT é uma porção ou toda a molécula de ácido nucleico do conjunto. Em certos exemplos, é fornecido aqui um conjunto de ácidos nucleicos do adaptador em Y (isto é, de fita parcialmente dupla), cada um incluindo uma MIT diferente. O conjunto de ácidos nucléicos de adaptador em Y podem, cada um, ser idênticos, exceto para a porção de MIT. Várias cópias da mesma MIT de adaptador em Y podem ser incluídas no conjunto. O conjunto pode ter um número e diversidade de moléculas de ácido nucleico conforme divulgado neste documento para um conjunto de MITs. Como um exemplo não limitativo, o conjunto pode incluir 2, 5, 10 ou 100 cópias de entre 50 e 500 adaptadores em Y contendo MIT, com cada segmento de MIT entre 4 e 8 ácidos nucleicos de comprimento e cada segmento de MIT diferindo de os outros segmentos MIT em pelo menos 2 nucleotídeos, mas contêm sequências idênticas diferentes da sequência de MIT. Mais detalhes sobre a porção do adaptador em Y do conjunto de adaptadores em Y são fornecidos aqui.
[0455] Em outras modalidades, uma mistura de reação que inclui um conjunto de MITs e uma população de moléculas de ácido nucleico de amostra é uma modalidade da presente divulgação. Além disso, tal composição pode fazer parte de vários métodos e outras composições aqui fornecidas. Por exemplo, em outras modalidades, uma mistura de reação pode incluir uma polimerase ou ligase, tampões apropriados e componentes suplementares, conforme discutido em mais detalhes aqui. Para qualquer uma dessas modalidades, o conjunto de MITs pode incluir entre 25, 50, 100, 200, 250, 300, 400, 500 ou 1.000 MITs na extremidade inferior da faixa e 100, 200,
250, 300, 400, 500, 1.000, 1.500, 2.000, 2.500, 5.000, 10.000 ou 25.000 MITs na extremidade superior da faixa. Por exemplo, em algumas modalidades, uma mistura de reação inclui um conjunto de entre 10 e 500 MITs.
[0456] Etiquetas de índice molecular (MITs), conforme discutido em mais detalhes neste documento, podem ser anexadas a moléculas de ácido nucleico de amostra na mistura de reação usando métodos que um versado na técnica reconhecerá. Em algumas modalidades, as MITs podem ser anexadas sozinhas ou sem quaisquer sequências de oligonucleotídeos adicionais. Em algumas modalidades, as MITs podem ser parte de um oligonucleotídeo maior que pode incluir, ainda, outras sequências de nucleotídeos, conforme discutido em mais detalhes aqui. Por exemplo, o oligonucleotídeo também pode incluir iniciadores específicos para segmentos de ácido nucleico ou sítios de ligação de iniciador universal, adaptadores, tais como adaptadores de sequenciamento, como adaptadores em Y, etiquetas de biblioteca, etiquetas de adaptador de ligação e combinações dos mesmos. Um versado na técnica reconhecerá como incorporar várias etiquetas em oligonucleotídeos para gerar moléculas de ácido nucleico etiquetadas úteis para sequenciamento, especialmente sequenciamento de alto rendimento. As MITs da presente divulgação são vantajosas por serem mais prontamente usadas com sequências adicionais, como o adaptador em Y e/ou sequências universais porque a diversidade de moléculas de ácido nucleico é menor e, portanto, elas podem ser mais facilmente combinadas com sequências adicionais em um adaptador para produzir um conjunto menor e, portanto, mais econômico de adaptadores contendo MIT.
[0457] Em algumas modalidades, as MITs são anexadas de modo que uma MIT esteja em 5’ em relação ao segmento de ácido nucleico da amostra e uma MIT esteja em 3' em relação ao segmento de ácido nucleico da amostra na molécula de ácido nucleico etiquetada. Por exemplo, em algumas modalidades, as MITs podem ser ligadas diretamente às extremidades 5’ e 3' das moléculas de ácido nucleico da amostra usando ligação. Em algumas modalidades aqui divulgadas, a ligação envolve tipicamente a formação de uma mistura de reação com tampões apropriados, íons e um pH adequado, em que a população de moléculas de ácido nucleico da amostra, o conjunto de MITs, trifosfato de adenosina e uma ligase são combinados. Um versado na técnica entenderá como formar a mistura de reação e as várias ligases disponíveis para uso. Em algumas modalidades, as moléculas de ácido nucleico podem ter saliências de adenosina de 3’ e as MITs podem estar localizadas em oligonucleotídeos de fita dupla com saliências de timidina de 5', tais como diretamente adjacentes a uma timidina de 5'.
[0458] Em outras modalidades, as MITs fornecidas neste documento podem ser incluídas como parte dos adaptadores em Y antes de serem ligados às moléculas de ácido nucleico da amostra. Os adaptadores em Y são bem conhecidos na técnica e são usados, por exemplo, para fornecer mais eficientemente as sequências de ligação do iniciador às duas extremidades das moléculas de ácido nucleico antes do sequenciamento de alto rendimento. Os adaptadores em Y são formados por hibridização de um primeiro oligonucleotídeo e um segundo oligonucleotídeo em que um segmento de 5’ do primeiro oligonucleotídeo e um segmento 3' do segundo oligonucleotídeo são complementares e em que um segmento 3’ do primeiro oligonucleotídeo e um segmento 5' do segundo oligonucleotídeo não são complementares. Em algumas modalidades, os adaptadores em Y incluem um segmento de polinucleotídeo de fita dupla emparelhado com base e um segmento de polinucleotídeo de fita simples não emparelhado distal ao local da ligação. O segmento de polinucleotídeo de fita dupla pode ter entre 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 nucleotídeos de comprimento na extremidade inferior da faixa e 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 e 30 nucleotídeos de comprimento na extremidade superior da faixa. Os segmentos de polinucleotídeo de fita simples no primeiro e no segundo oligonucleotídeos podem ter entre 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 nucleotídeos de comprimento na extremidade inferior da faixa e 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 e 30 nucleotídeos de comprimento na extremidade superior da faixa. Nessas modalidades, as MITs são tipicamente sequências de fita dupla adicionadas às extremidades dos adaptadores em Y, que são ligados a segmentos de ácido nucleico de amostra a serem sequenciados. Em algumas modalidades, os segmentos não complementares do primeiro e do segundo oligonucleotídeos podem ser de comprimentos diferentes.
[0459] Em algumas modalidades, as MITs de fita dupla anexadas por ligação terão a mesma MIT em ambas as fitas da molécula de ácido nucleico da amostra. Em certos apectos, as moléculas de ácido nucleico etiquetadas derivadas dessas duas fitas serão identificadas e usadas para gerar famílias de MIT emparelhadas. Em reações de sequenciamento a jusante, em que os ácidos nucleicos de fita simples são tipicamente sequenciados, uma família de MIT pode ser identificada pela identificação de moléculas de ácido nucleico etiquetadas com sequências de MIT idênticas ou complementares. Nessas modalidades, as famílias de MIT emparelhadas podem ser usadas para verificar a presença de diferenças de sequência na molécula de ácido nucleico da amostra inicial, como aqui discutido.
[0460] Em algumas modalidades, as MITs podem ser anexadas ao segmento de ácido nucleico da amostra ao serem incorporadas em 5’ a iniciadores diretos e/ou reversos de PCR que se ligam às sequências no segmento de ácido nucleico da amostra. Em algumas modalidades, as MITs podem ser incorporadas em iniciadores de PCR diretos e/ou reversos universais que se ligam a sequências de ligação de iniciador universal previamente anexadas às moléculas de ácido nucleico da amostra. Em algumas modalidades, as MITs podem ser anexadas usando uma combinação de um iniciador direto ou reverso universal com uma sequência de MIT de 5’ e um iniciador de PCR direto ou reverso que se liga a sequências de ligação internas no segmento de ácido nucleico de amostra com uma sequência de
MIT de 5'. Após 2 ciclos de PCR, as moléculas de ácido nucleico da amostra que foram amplificadas usando ambos os iniciadores direto e reverso com sequências de MIT incorporadas terão MITs anexadas em 5’ em relação aos segmentos de ácido nucleico da amostra e em 3' em relação aos segmentos de ácido nucleico da amostra em cada uma das moléculas de ácido nucleico etiquetadas. Em algumas modalidades, a PCR é feita por 2, 3, 4, 5, 6, 7, 8, 9 ou 10 ciclos na etapa de anexação.
[0461] Em algumas modalidades aqui divulgadas, as duas MITs em cada molécula de ácido nucleico etiquetada podem ser anexadas usando técnicas semelhantes, de modo que ambas as MITs estejam em 5’ em relação aos segmentos de ácido nucleico da amostra ou ambas as MITs estejam em 3' em relação aos segmentos de ácido nucleico da amostra. Por exemplo, duas MITs podem ser incorporadas no mesmo oligonucleotídeo e ligadas em uma extremidade da molécula de ácido nucleico da amostra ou duas MITs podem estar presentes no iniciador direto ou reverso e o iniciador reverso ou direto emparelhado pode ter zero MITs. Em outras modalidades, mais de duas MITs podem ser anexadas com qualquer combinação de MITs anexadas aos locais 5’ e/ou 3' em relação aos segmentos de ácido nucleico.
[0462] Conforme discutido neste documento, outras sequências podem ser anexadas às moléculas de ácido nucleico da amostra antes, depois, durante ou com as MITs. Por exemplo, adaptadores de ligação, muitas vezes referidos como etiquetas de biblioteca ou etiquetas de adaptador de ligação (LTs), anexados, com ou sem uma sequência de ligação de iniciador universal para serem usados em uma etapa de amplificação universal subsequente. Em algumas modalidades, o comprimento do oligonucleotídeo contendo as MITs e outra sequências pode ter entre 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 29, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 e 100 nucleotídeos na extremidade inferior da faixa e 10, 11, 12, 13, 14, 15, 16, 17, 18, 29, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130,
140, 150, 160, 170, 180, 190 e 200 nucleotídeos na extremidade superior da faixa. Em certos aspectos, o número de nucleotídeos nas sequências de MIT pode ser uma porcentagem do número de nucleotídeos na sequência total dos oligonucleotídeos que incluem MITs. Por exemplo, em algumas modalidades, a MIT pode ter no máximo 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 100% dos nucleotídeos totais de um oligonucleotídeo que está ligado a uma molécula de ácido nucleico de amostra.
[0463] Depois de anexar as MITs às moléculas de ácido nucleico da amostra por meio de uma ligação ou reação de PCR, pode ser necessário limpar a mistura de reação para remover componentes indesejáveis que podem afetar as etapas subsequentes do método. Em algumas modalidades, as moléculas de ácido nucleico da amostra podem ser removidas por purificação dos iniciadores ou ligases. Em outras modalidades, as proteínas e iniciadores podem ser digeridos com proteases e exonucleases usando métodos conhecidos na técnica.
[0464] Depois de anexar MITs às moléculas de ácido nucleico da amostra, uma população de moléculas de ácido nucleico etiquetadas é gerada, formando, ela própria, modalidades da presente divulgação. Em algumas modalidades, as faixas de tamanho das moléculas de ácido nucleico etiquetadas podem estar entre 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 400 e 500 nucleotídeos na extremidade inferior da faixa e 100, 125, 150, 175, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1.000, 2.000, 3.000, 4.000 e 5.000 nucleotídeos na extremidade superior da faixa.
[0465] Tal população de moléculas de ácido nucleico etiquetadas pode incluir entre 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 225, 250, 300, 350, 400, 450, 500, 600, 700,
800, 900, 1.000, 2.000, 3.000, 4.000, 5.000, 6.000, 7.000, 8.000, 9.000, 10.000,
15.000, 20.000, 30.000, 40.000, 50.000, 100.000, 200.000, 300.000, 400.000,
500.000, 600.000, 700.000, 800.000, 900.000, 1.000.000, 1.250.000,
1.500.000, 2.000.000, 2.500.000, 3.000.000, 4.000.000, 5.000.000, 10.000.000,
20.000.000, 30.000.000, 40.000.000, 50.000.000, 50.000.000, 100.000.000,
200.000.000, 300.000.000, 400.000.000, 500.000.000, 600.000.000,
700.000.000, 800.000.000, 900.000.000 e 1.000.000.000 de moléculas de ácido nucleico etiquetadas na extremidade inferior da faixa e 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900,
1.000, 2.000, 3.000, 4.000, 5.000, 6.000, 7.000, 8.000, 9.000, 10.000, 15.000,
20.000, 30.000, 40.000, 50.000, 100.000, 200.000, 300.000, 400.000, 500.000,
600.000, 700.000, 800.000, 900.000, 1.000.000, 1.250.000, 1.500.000,
2.000.000, 2.500.000, 3.000.000, 4.000.000, 5.000.000, 6.000.000, 7.000.000,
8.000.000, 9.000.000, 10.000.000, 20.000.000, 30.000.000, 40.000.000,
50.000.000, 100.000.000, 200.000.000, 300.000.000, 400.000.000,
500.000.000, 600.000.000, 700.000.000, 800.000.000, 900.000.000,
1.000.000.000, 2.000.000.000, 3.000.000.000, 4.000.000.000, 5.000.000.000,
6.000.000.000, 7.000.000.000. 8.000.000.000, 9.000.000.000 e
10.000.000.000, moléculas de ácido nucleico etiquetadas na extremidade superior da faixa. Em algumas modalidades, a população de moléculas de ácido nucleico etiquetadas pode incluir entre 100.000.000, 200.000.000,
300.000.000, 400.000.000, 500.000.000, 600.000.000, 700.000.000,
800.000.000, 900.000.000 e 1.000.000.000 de moléculas de ácido nucleico etiquetadas na extremidade inferior da faixa e 500.000.000, 600.000.000,
700.000.000, 800.000.000, 900.000.000, 1.000.000.000, 2.000.000.000,
3.000.000.000, 4.000.000.000, 5.000.000.000 de moléculas de ácido nucleico etiquetadas na extremidade superior da faixa.
[0466] Em certos aspectos, uma porcentagem do total de moléculas de ácido nucleico da amostra na população de moléculas de ácido nucleico da amostra pode ser alvejada para ter MITs anexadas. Em algumas modalidades, pelo menos 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 99,9% das moléculas de ácido nucleico da amostra podem ser alvejadas para terem MITs anexadas. Em outros aspectos, uma porcentagem das moléculas de ácido nucleico da amostra na população pode ter MITs anexadas com sucesso. Em qualquer uma das modalidades aqui divulgadas, pelo menos 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 99,9% das moléculas de ácido nucleico da amostra podem ter MITs anexadas com sucesso para formar a população de moléculas de ácido nucleico etiquetadas. Em qualquer uma das modalidades aqui divulgadas, pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 200, 300, 500, 600, 700, 800, 900,
1.000, 2.000, 3.000, 4.000, 5.000, 6.000, 7.000, 8.000, 9.000, 10.000, 15.000,
20.000, 30.000, 40.000 ou 50.000 das moléculas de ácido nucleico da amostra podem ter MITs anexadas com sucesso para formar a população de moléculas de ácido nucleico etiquetadas.
[0467] Em algumas modalidades aqui divulgadas, as MITs podem ser sequências de oligonucleotídeos de ribonucleotídeos ou desoxirribonucleotídeos ligados por meio de ligações de fosfodiéster. Nucleotídeos como aqui divulgados podem se referir a ribonucleotídeos e desoxirribonucleotídeos e um versado na técnica reconhecerá quando uma das formas for relevante para uma aplicação particular. Em certas modalidades, os nucleotídeos podem ser selecionados do grupo de nucleotídeos de ocorrência natural que consiste em adenosina, citidina, guanosina, uridina, 5-metiluridina, desoxiadenosina, desoxicitidina, desoxiguanosina, desoxitimidina e desoxiuridina. Em algumas modalidades, as MITs podem ser nucleotídeos não naturais. Os nucleotídeos não naturais podem incluir: conjuntos de nucleotídeos que se ligam uns aos outros, como, por exemplo, d5SICS e dNaM; bases coordenadas com metal, tais como, por exemplo, 2,6-bis
(etiltiometil) piridina (SPy) com um íon prata e piridina mondentada (Py) com um íon cobre; bases universais que podem emparelhar com mais de uma ou qualquer outra base, como, por exemplo, derivados de 2’-desoxi-inosina, análogos de nitroazol e bases hidrofóbicas aromáticas sem ligação de hidrogênio; e nucleobases de xDNA com bases expandidas. Em certas modalidades, as sequências de oligonucleotídeos podem ser pré- determinadas, enquanto em outras modalidades, as sequências de oligonucleotídeos podem ser degeneradas.
[0468] Em algumas modalidades, as MITs incluem ligações de fosfodiéster entre os açúcares naturais ribose e/ou desoxirribose que estão ligados à nucleobase. Em algumas modalidades, ligações não naturais podem ser usadas. Estas ligações incluem, por exemplo, ligações de fosforotioato, boranofosfato, fosfonato e triazol. Em algumas modalidades, podem ser utilizadas combinações das ligações não naturais e/ou das ligações de fosfodiéster. Em algumas modalidades, os ácidos nucleicos de peptídeo podem ser usados em que a cadeia principal do açúcar, em vez disso, é feita de repetição de N-(2-aminoetil)-glicina ligadas por ligações peptídicas. Em qualquer uma das modalidades aqui divulgadas, açúcares não naturais podem ser usados no lugar do açúcar de ribose e/ou desoxirribose. Por exemplo, a terose pode ser usada para gerar ácidos α-(L)-treofuranosil-(3'-2') nucleicos (TNA). Outros tipos de ligação e açúcares serão evidentes para um versado na técnica e podem ser usados em qualquer uma das modalidades aqui divulgadas.
[0469] Em algumas modalidades, podem ser usados nucleotídeos com ligações extras entre átomos do açúcar. Por exemplo, ácidos nucleicos em ponte ou bloqueados podem ser usados nas MITs. Esses ácidos nucleicos incluem uma ligação entre a posição 2’ e a posição 4' de um açúcar ribose.
[0470] Em certas modalidades, os nucleotídeos incorporados na sequência da MIT podem ser anexados com ligantes reativos.
Mais tarde, os ligantes reativos podem ser misturados com uma molécula devidamente etiquetada em condições adequadas para que a reação ocorra. Por exemplo, podem ser anexados nucleotídeos de aminoalila que podem reagir com moléculas ligadas a um grupo de saída reativo, como éster de succinimidila, e nucleotídeos contendo tiol podem ser anexados, os quais podem reagir com moléculas ligadas a um grupo de saída reativo, como maleimida. Em outras modalidades, os nucleotídeos ligados à biotina podem ser usados na sequência da MIT que pode ligar moléculas etiquetadas com estreptavidina.
[0471] Várias combinações dos nucleotídeos naturais, nucleotídeos não naturais, ligações de fosfodiéster, ligações não naturais, açúcares naturais, açúcares não naturais, ácidos nucleicos peptídicos, ácidos nucleicos em ponte, ácidos nucleicos bloqueados e nucleotídeos com ligantes reativos anexados serão reconhecidas por um versado na técnica e podem ser usadas para formar MITs em qualquer uma das modalidades aqui divulgadas.
MODELAGEM DE ERRO
[0472] Com referência agora à Figura 8, uma ilustração de uma análise específica de base e uma análise específica de motivo de uma amostra são mostradas. A abordagem convencional inclui pelo menos quatro etapas: determinar um conjunto de alvos específicos para ensaio (BLOCO 110), executar um grande número de ensaios de teste nos alvos específicos para gerar estatísticas específicas do alvo (BLOCO 112), sequenciar uma amostra (BLOCO 114) e chamar mutações para os alvos específicos usando as estatísticas geradas (BLOCO 116).
[0473] No BLOCO 110, um conjunto de alvos específicos a serem submetidos a ensaio é determinado. Chamar mutações usando a abordagem convencional mostrada na Figura 8 é limitado a chamar mutações para os alvos específicos determinados no BLOCO 110. No BLOCO 112, dezenas ou centenas de ensaios de teste podem ser realizados para cada alvo de interesse (cada alvo determinado no BLOCO 110) para gerar dados de teste. Por exemplo, os ensaios de teste podem incluir a realização de um processo de PCR em segmentos genéticos extraídos de uma amostra de teste. O resultado amplificado do processo de PCR pode ser sequenciado exaustivamente para gerar estatísticas de erro de fundo. Por exemplo, erros ou mutações detectadas no resultado amplificado podem ser atribuídas a erros induzidos pelo processo de PCR, e uma taxa de erro de propagação de PCR pode ser estimada para as sequências genéticas sendo submetidas a ensaio. Um grande número de ensaios de teste pode ser realizado para cada alvo específico para melhorar a estimativa da taxa de erro de propagação de PCR.
[0474] No BLOCO 114, uma amostra genética pode ser sequenciada e, no BLOCO 116, as mutações podem ser chamadas usando a taxa de erro de propagação de PCR determinada para contabilizar pelo menos algum erro de fundo e/ou usando outras estatísticas geradas no BLOCO
112. As mutações só podem ser chamadas para os alvos específicos para os quais as estatísticas foram geradas no BLOCO 112. Assim, para chamar mutações para um grande número de alvos da amostra sequenciada, um número muito grande de ensaios de teste é realizado, o que pode ser caro e demorado.
[0475] A abordagem específica do motivo melhora a abordagem convencional ao fornecer a omissão de um grande número de ensaios de teste específicos do alvo. Em vez de gerar estatísticas específicas do alvo, um modelo de erro que fornece estatísticas específicas do motivo é usado, o que pode ser aplicado de uma maneira mais geral do que a abordagem específica do alvo (por exemplo, pode ser aplicada a qualquer alvo com um motivo igual ou similar a um motivo usado para gerar estatísticas de teste). No BLOCO 120, usando os métodos e sistemas descritos neste documento, estatísticas específicas do motivo podem ser geradas, as quais podem constituir, ou ser usadas como parte de, um modelo de erro específico do motivo. Uma vez que um modelo de erro específico do motivo tenha sido estabelecido, a abordagem específica do motivo pode ser implementada sequenciando uma amostra no BLOCO 122 e chamando mutações para alvos tendo um motivo específico usando o modelo de erro específico do motivo no BLOCO 124. O modelo de erro específico do motivo tem ampla aplicabilidade. Por exemplo, uma nova amostra pode diferir em pelo menos alguns aspectos de uma amostra de treinamento usada para gerar o modelo de erro específico do motivo, e pode ser desejável sequenciar alvos para os quais não existem estatísticas específicas de alvo (ou para os quais as estatísticas existentes têm um alto grau de incerteza inaceitável ou indesejável). Ao usar a abordagem específica do motivo que aproveita a tendência do erro de fundo de ser específico do motivo, o modelo de erro específico do motivo pode fornecer estimativas precisas de erro associado a bases-alvo em uma amostra que tem o mesmo motivo que foi analisado e incorporado no modelo de erro específico do motivo, mesmo que as bases-alvo possam estar em posições diferentes das bases incluídas nos dados de treinamento usados para gerar o modelo de erro específico do motivo. Assim, um grande número de ensaios de teste específicos do motivo não precisa ser realizado para cada sequenciamento e processo de chamada para uma amostra a ser sequenciada. A abordagem específica do motivo fornece estimativas precisas do erro de fundo esperado, que por sua vez pode fornecer uma chamada altamente precisa de mutações.
[0476] A presente divulgação descreve sistemas e métodos que podem ser usados para implementar a abordagem específica do motivo descrita acima. A presente divulgação descreve modelos estatísticos, algoritmos e sua implementação (por exemplo, para monitoramento de recorrência (RM)). O RM pode detectar mutações específicas do tumor (alvos) no plasma de um sujeito que são contribuídas pelo DNA circulante do tumor (ctDNA). Para esse fim, o sequenciamento alvejado da amostra de plasma de um sujeito pode ser empregado. Denotando o número de leituras para uma mutação em uma determinada posição por E e o número total de leituras nesta posição por X, e presumindo que E vem de uma distribuição Beta-Binomial com parâmetros X e p(α, β)
[0477] em que p vem da distribuição Beta com parâmetros α e β que são funções de eficiência de replicação e erro de fundo específico para preparação de amostra, esses parâmetros podem ser estimados a partir de um conjunto de amostras de treinamento sem mutações. Além disso, esses parâmetros são considerados dependentes da fração do ctDNA que apresenta a mutação, também chamada de erro real, em oposição ao erro de fundo do processo de PCR gerado na preparação da amostra. Uma vez que a fração de ctDNA presente na amostra de plasma pode ser desconhecida, α e β podem ser avaliados em uma grade de valores e uma fração de mutação que produz a maior probabilidade para os dados pode ser selecionada.
PREPARAÇÃO DE DADOS DE TREINAMENTO OU AMOSTRA
[0478] Em algumas aplicações de RM, as amostras são preparadas no laboratório durante duas reações de PCR separadas. Após cada reação, apenas uma porção do produto é passada para o próximo estágio. Isso pode ser chamado de subamostragem. Para simplificar as computações, a presente divulgação modela o processo por uma reação de PCR com subamostragem combinada, conforme ilustrado na Figura 9.
[0479] Algumas implementações exemplificativas consideram uma taxa de subamostragem total de 6 × 10 -5 para modelar o processo. O modelo presume que a) a taxa de replicação, ou eficiência, p é constante de ciclo para ciclo; b) a taxa de erro p e é pequena comparada à taxa de replicação; c) ocorre um erro apenas uma vez no processo de replicação, o que significa que, se uma base de nucleotídeo for substituída por outra, ela continuará se replicando inalterada pelo resto do processo.
NÚMERO DE CICLOS DE PCR
[0480] Um algoritmo de chamada de variante de RM estima SNV aleatório ou taxa de erro de indel durante a reação de PCR. A frequência resultante de mutações induzidas por PCR depende do número de ciclos de PCR pelos quais a amostra passa. O número de ciclos aumenta dinamicamente para amostras com baixas quantidades de DNA inicial, conforme a saturação é alcançada posteriormente. Apenas a reação de PCR de preparação da biblioteca é afetada por número variável de ciclos. A reação de starcoding (amplificação alvejada e codificação em barras) é considerada como tendo o mesmo número de ciclos. Portanto, o número total de ciclos é dado por ntotal = nlibprep + nstarcoding. Com base na quantidade de DNA de entrada para a etapa de preparação da biblioteca, o algoritmo estima o número total de ciclos para computar o erro de PCR esperado com mais precisão. O número de ciclos durante a preparação da biblioteca é computado presumindo o seguinte: inicial_copias * (1 + p)nlibprep * libprep_loss = libprep_output_copies, em que p é a eficiência de replicação considerada 0,9, libprep_loss é 0,75, libprep_output_copies = 3*106, e em que xentrada é a quantidade de DNA de entrada em nanogramas (ng). O n starcoding é calibrado a partir dos dados para 104 cópias geradas a partir de amostras com quantidade de entrada de 33 ng.
ESTIMANDO UMA DISTRIBUIÇÃO DE FRAÇÃO DE MUTAÇÃO E PARÂMETROS
[0481] A estimativa dos parâmetros α e β acima mencionados a partir da expectativa e variância da taxa de erro pode ser implementada como segue. Se μ é a expectativa da taxa de erro após o processo de PCR e var é sua variância como em
[0482] então, α e β da distribuição Beta correspondente são calculados como
[0483] A seguinte expansão pode ser usada para estimar μ e var
[0484] Aqui, conforme definido acima, X é o número total de leituras e E é o número de leituras para uma base de erro, ou seja, a base que é diferente da base de referência. Uma vez que existem três mudanças possíveis da referência (por exemplo, A pode mudar para T, C ou G), haverá três taxas de erro esperadas, uma para cada base mutante ou canal. As contagens totais de erros vêm de pelo menos duas fontes - mutação no DNA do tumor que está presente antes do processo de replicação e uma substituição errônea durante o processo de PCR usado na preparação da amostra. O primeiro é conhecido como erro real e o último como erro de fundo.
[0485] Para se determinar uma fração de mutação, ou uma distribuição de probabilidade da mesma, a eficiência de replicação e a probabilidade do erro de fundo por ciclo são estimadas a partir de um conjunto de amostras de treinamento que não se espera que tenham quaisquer mutações reais. Então, a contagem de partida (ou cópia de partida) é estimada com base na eficiência de PCR. Usando esta estimativa, a expectativa e a variância das contagens totais e de erro após o processo de PCR são computadas e podem ser conectadas às Equações 6 e 7. Então, usando-se as Equações 4 e 5, os parâmetros de distribuição da fração de mutação α e β podem ser determinados.
MODELAGEM DO PROCESSO DE PCR E FÓRMULAS ÚTEIS
[0486] Supondo que a cada ciclo de PCR n a) novas moléculas de DNA sejam geradas a partir das moléculas presentes no final do ciclo anterior n - 1, governadas por um processo aleatório binomial; b) as moléculas com erro de fundo vêm da replicação de erros do ciclo anterior e novos erros que ocorrem no ciclo atual de forma aleatória de acordo com o processo aleatório binomial com probabilidade de erro p e, tendo zero erros de fundo presentes no início do processo de PCR; c) o erro de replicação ocorre uma vez por molécula e não é reversível; d) erros reais são replicados com a mesma eficiência que moléculas normais e sua quantidade inicial é uma fração do total de moléculas (por exemplo, se a cópia de partida é denotada por X 0, então, há f X0 moléculas mutantes entre elas), então
[0487] Vários valores de f podem ser considerados para encontrar um que melhor se adapte aos dados.
1. EXPECTATIVA E VARIÂNCIA DE LEITURAS TOTAIS
[0488] A partir das Equações 9, a expectativa do número total de leituras condicionadas à eficiência de replicação é dada por
[0489] A variância desta variável é dada por
[0490] Aqui, a última igualdade em cada equação é produzida resolvendo a relação recursiva da primeira parte da equação.
2. EXPECTATIVA E VARIÂNCIA PARA LEITURAS DE
ERROS REAIS
[0491] Da mesma forma que o número total de leituras, para o erro real, as seguintes equações se aplicam:
3. EXPECTATIVA E VARIÂNCIA PARA ERRO DE
FUNDO
[0492] Para encurtar as notações, nesta seção a referência explícita ao condicionamento em p é omitida, mas as estatísticas são condicionais em p.
EXPECTATIVA DE LEITURAS DE ERRO DE FUNDO
[0493] A partir da Equação 9:
[0494] o que fornece
[0495] onde a Equação 10 foi usada. Resolver a relação recursiva fornece
[0496] Para derivações subsequentes, a aproximação desta expressão que vem da equação acima sob a suposição de que pe « p é usado
VARIÂNCIA DE LEITURAS DE ERRO DE FUNDO
[0497] Algumas expressões intermediárias que serão usadas na seguinte derivação são como a seguir:
[0498] Elas seguem diretamente da Equação 9. Ao derivar a última equação, o fato de que foi usado.
[0499] Com elas, o termo de variância para o erro de fundo pode ser escrito como
[0500] Na última equação, todos os termos, exceto os dois últimos, foram computados. O último termo é usado em uma relação recursiva que pode fornecer a solução para a variância. Portanto, o único termo que falta computar é a covariância.
[0501] O termo de covariância é computado separadamente, uma vez que vai ser útil por si só para a covariância do erro total com as leituras totais que entram nas Equações 6.
[0502] Aqui, B(...) representa uma variável aleatória distribuída de acordo com a distribuição binomial com os parâmetros correspondentes, conforme definido na Equação 9. Dois termos na equação acima estão indicados por T1 e T2 e são computados separadamente abaixo.
Para a próxima etapa da derivação, a expressão
[0503] é usada, que é válida se Xn-1 e são constantes em oposição a variáveis aleatórias. Isso é satisfeito porque essas expressões inserem estatísticas condicionais. Usando isso, para o primeiro termo:
[0504] em que os dois termos riscados somam zero devido a considerações para o processo físico que está sendo modelado. O primeiro termo riscado descreve a replicação de moléculas normais e de erro que, embora condicionadas em Xn-1 e não está correlacionado. O segundo termo riscado descreve replicação de moléculas de erro e criação de novas moléculas de erro que são independentes. Prosseguindo com a avaliação de T1:
[0505] Aqui, o primeiro termo segue da definição de variância para distribuição binomial. O segundo termo usa a seguinte propriedade: para duas variáveis binomiais aleatórias, Y e Z, distribuídas como Y ~ B (n, p) e Z ~ B (Y, q), então
[0506] No presente caso, Y representa o número de moléculas normais que se replicam no ciclo n - 1 e Z - número de moléculas de erro geradas a partir dessas moléculas, e p e representa a probabilidade de erro dada a probabilidade de replicação, então é efetivamente pq no exemplo acima.
[0507] O segundo termo, T2 para a expressão de covariância é bastante simples.
[0508] Juntando todos os termos para a expressão de covariância, uma relação recursiva é obtida:
[0509] Assim, uma solução para a relação recursiva na seguinte forma seria útil:
[0510] com
[0511] Depois de aplicar a fórmula recursiva n vezes, o seguinte padrão emerge:
[0512] em que a fórmula para a soma da progressão geométrica foi utilizada. Substituindo todos os coeficientes e simplificando a expressão fornece a resposta para a covariância entre as contagens de erros de fundo e o número total de leituras como
[0513] Substituindo-se a Equação 17 de volta à Equação 16 e agrupando termos semelhantes, a relação recursiva para a variância é
[0514] com coeficientes nesta expressão definidos como
[0515] em que apenas os termos até são mantidos. Passando por um processo semelhante ao de Cov para resolver essa relação recursiva, a solução para a variância do erro de fundo
[0516] é obtida, em que os coeficientes definidos acima e as notações
[0517] são utilizados.
VISÃO GERAL DE ALGUMAS IMPLEMENTAÇÕES
[0518] As derivações nas seções anteriores produzem quantidades condicionadas à eficiência de replicação por ciclo p e taxa de erro por ciclo pe. A fim de avaliar a quantidade absoluta Q, as seguintes equações podem ser usadas
[0519] em que f(p) representa a distribuição de p que deve ser estimada a partir dos dados. Para remover o condicionamento em p e, a média e a variância da taxa de erro são estimadas e usadas para avaliar expressões como pe = média(pe) e . Também é útil computar a partir de dados. Dados de sequenciamento, incluindo leituras em posições-alvo em um genoma, podem ser usados. A presente descrição distingue entre uma leitura de referência R r, contagens para a base especificada no genoma de referência, e leituras de erro R e, contagens para as bases diferentes da referência. As leituras totais, então, são definidas como R = Rr + ∑nonref Re. Com essas definições, o seguinte pode ser implementado.
4. ESTIMATIVA DE EFICIÊNCIA E ERRO A PARTIR DE
DADOS DE TREINAMENTO
[0520] Usando um conjunto de amostras normais que não se espera que tenham qualquer mutação relacionada ao câncer, a eficiência pode ser estimada a partir da relação R = (1 + p)nX0 em cada posição. Presumindo que a cópia de partida ou contagem X0 é igual para cada posição, e atribuindo alguma eficiência arbitrária (relativamente elevada) p* às posições com número de leituras R* em percentil elevado (por exemplo, 99º percentil),
[0521] Usando-se esta estimativa para eficiência, a taxa de erro por ciclo em cada posição pode ser estimada a partir da Equação 13 como
[0522] A média e o desvio padrão dessas quantidades são encontrados para cada posição, computando as estatísticas em relação a várias amostras normais fornecidas no conjunto de dados. Esses valores são posteriormente combinados em relação a bases que compartilham os mesmos motivos, conforme descrito em mais detalhes neste documento, e podem ser salvos para serem usados para chamar mutações em diferentes amostras.
5. ESTIMATIVA DE CÓPIA DE PARTIDA PARA UMA
AMOSTRA DE TESTE
[0523] Usando-se a média e o desvio padrão de eficiência para cada posição encontrada anteriormente a partir de amostras normais, a cópia de partida em cada posição para uma amostra de teste pode ser estimada como
[0524] em que f(p) = B(α, β) é a distribuição beta com os parâmetros α e β encontrados a partir da média e desvio padrão da eficiência. A média e o desvio padrão de X 0 em relação às posições pertencentes ao mesmo fragmento genético sequenciado podem ser calculados e atribuídos a cada posição no fragmento.
6. AJUSTE DE EFICIÊNCIA PARA UMA AMOSTRA DE
TESTE
[0525] Em algumas implementações, uma atualização ou correção dos valores de eficiência pode ser realizada com base na cópia de partida encontrada de acordo com
[0526] em que g(x0) = N(μ, σ) é a distribuição normal com média e desvio padrão encontrados para a cópia de partida em uma posição particular.
ALGORITMOS DE TREINAMENTO
[0527] Para se determinar a distribuição da fração de mutação, o treinamento apropriado pode ser usado para estimar os parâmetros de distribuição.
7. TREINAMENTO ESPECÍFICO DE BASE
[0528] Para treinamento específico de base, os parâmetros do modelo para cada base podem ser estimados separadamente no painel-alvo. Uma suposição básica deste processo de treinamento é que cada base no painel tenha uma certa taxa de amplificação e taxa de erro. Para que este método de treinamento funcione, amostras de controle de indivíduos normais podem ser usadas. Por exemplo, 20 a 30 amostras normais para estimar parâmetros de modelo usando treinamento específico de base podem ser usadas. O algoritmo a seguir descreve um fluxograma básico de um modelo de erro específico de base. ALGORITMO 1 ALGORITMO DE TREINAMENTO
ESPECÍFICO DE BASE
[0529] Treinamento: Di,k = (Ri,k, RefAllelei, Ai,k, Ci,k, Gi,k, Ti,k) em que i ∈ {1,2, ... , B} denota uma base e k ∈ {1,2, ... , n} denota uma amostra, RefAllelei é o alelo de referência/de tipo selvagem para a base i, Ri,k é a profundidade total de leituras, Ai,k, Ci,k, Gi,k, Ti,k são o número de leituras dos alelos A, C, G, T, respectivamente.
[0530] Teste: para i = 1,2, ... , B. As pontuações de confiança de chamada de mutação para alelos de não referência no conjunto de teste para todas as bases 1, 2, ..., B.
[0531] para i = 1, 2, ..., B fazer
[0532] 1. Estimar a eficiência e o erro a partir dos dados de treinamento conforme explicado acima para a base i, usando os dados Di,k.
[0533] 2. Estimar a cópia de partida da base i para dados de teste na base i, usando os métodos descritos acima.
[0534] 3. Ajustar o parâmetro de eficiência na base i usando os métodos descritos acima.
[0535] 4. Para uma grade de valores de θ ∈ [0, τmax] (em que τmax é idealmente 1, mas para fins práticos, é suficiente definir τ max ≈ 0,15) das frações de mutação candidatas, inserir os parâmetros de erro e eficiência estimados nas equações (6) e (7) para computar a verossimilhança L(θ) dos dados de teste usando o modelo beta-binomial em (1).
[0536] 5. Encontrar a estimativa de máxima verossimilhança de
[0537] 6. Computar a pontuação de confiança como
8. TREINAMENTO ESPECÍFICO DE MOTIVO
[0538] O treinamento específico de motivo é útil, em parte porque o contexto da sequência em torno da base de interesse contribui para a taxa de erro de PCR. Assim, um modelo de erro pode ser gerado a partir de dados de treinamento para cada motivo de 3 bases, de modo que uma base de interesse seja sempre a base do meio. Outros motivos podem ser usados alternativa ou adicionalmente. Por exemplo, um motivo pode incluir uma ou mais bases adjacentes em apenas um lado da base-alvo, ou pode incluir um número simétrico (igual) ou assimétrico (não igual) de bases nos dois lados da base-alvo. Qualquer número de bases adjacentes pode ser definido como um motivo. O modelo de erro específico do motivo estima os parâmetros de erro de base média para cada motivo, mantendo as bases de flanqueamento iguais (por exemplo, estima os parâmetros de erro para etc.). Por exemplo, em algumas implementações, o algoritmo estima o erro para
[0539] As bases de flanqueamento dinâmicas também podem ser implementadas e os motivos podem ser variáveis com base no contexto da sequência. Em algumas modalidades, o motivo compreende 1, 2, 3, 4 ou 5 bases adjacentes antes da base-alvo. Em algumas modalidades, o motivo compreende 1, 2, 3, 4 ou 5 bases adjacentes após a base-alvo.
ESTIMATIVA DE PARÂMETROS PARA MOTIVOS
[0540] Algumas implementações incluem realizar as seguintes etapas:
[0541] 1. Do conjunto de treinamento, remover (bases, canal) pares de dados para taxas de erro maiores ou iguais a α, em que α = min {um número predeterminado (por exemplo, 0,2), um percentil predeterminado das taxas de erro na amostra de treinamento (por exemplo, o 99º percentil)}.
[0542] 2. Computar taxa de erro por ciclo por base por canal.
[0543] 3. Computar a média e a variância por motivo usando uma fórmula agrupada ou em pool de média e variância. Por exemplo, se μ1, μ2, ..., μn forem as médias e forem as taxas de erro de variâncias de bases que compartilham o mesmo motivo, então, a média e a variância em pool podem ser calculadas como
[0544] 4. Se houver várias execuções de treinamento, então, a disposição em pool pode ser feita gradativamente, primeiro, disposição em pool das amostras em execuções individuais e, em seguida, disposição em pool de todas as execuções. Durante a execução da disposição em pool, as taxas de erro podem ser ponderadas pelo número de ocorrências do motivo na execução. Em outras implementações, as taxas de erro têm a média calculada sem ponderação.
[0545] 5. Uma vez que a eficiência não é necessariamente uma função de motivo, o parâmetro de eficiência para cada motivo não precisa ter a média calculada separadamente. Em vez disso, a média e as variâncias do parâmetro de eficiência têm as médias calculadas por todas as amostras para chegar a uma estimativa anterior para os parâmetros de eficiência. Esta estimativa anterior não é mais dependente da posição. Em outras implementações, o parâmetro de eficiência pode ser determinado em uma base específica do motivo, de forma semelhante à determinação das taxas de erro específicas do motivo.
[0546] Algumas implementações incluem o ajuste de um modelo de regressão dos valores de eficiência estimados usando o conteúdo de GC do amplicon, temperatura e assim por diante, como covariáveis e usando este modelo para estimar os parâmetros anteriores em vez de usar uma constante anterior. ALGORITMO 2 ALGORITMO DE TREINAMENTO
ESPECÍFICO DO MOTIVO
[0547] Dados de treinamento: Di,k = (Ri,k, RefAllelei, Ai,k, Ci,k, Gi,k, Ti,k) em que i ∈ {1,2, ..., Btreinamento] denota uma base e k ∈ {1,2, ..., n} denota uma amostra, RefAllelei é o alelo de referência/de tipo selvagem para a base I, Ri,k é a profundidade total de leituras, Ai,k, Ci,k, Gi,k, Ti,k são o número de leituras dos alelos A, C, G, T, respectivamente. Mi,k denota o motivo para a i- ésima base na amostra k, em que , tal que Xj ∈ {A, C, G, T}∀j
[0548] Dados de teste: para i = 1,2, ..., BDadosdeTeste.
[0549] Resultado: Pontuações de confiança de chamada de mutação para alelos de não referência no conjunto de teste para todas as bases 1,2, ..., B.
[0550] para Treinamento, fazer > Bloco de treinamento
[0551] 1: 1. Seja α = min{ um limite predeterminado, um percentil predeterminado de hetrates observados nos dados de treinamento.
[0552] 2. ∀i = 1, 2, · · ·, BTreinamento; ∀k = 1, 2, · · ·, n,
computar a eficiência por ciclo pi,k e a taxa de erro pe,i,k usando os dados Di,k. Se hetrate for ≥ α para alguma combinação (base, canal), pular a estimativa de erro para tal combinação.
[0553] 3. Agrupar as bases por motivos, de modo que as bases que compartilham o mesmo motivo sejam atribuídas ao mesmo grupo, formando M grupos.
[0554] 4. computar a média e a variância das taxas de erro para m usando os dados agrupados.
[0555] 5. Dispor em pool todas as bases para computar a média e a variância do parâmetro de eficiência.
[0556] para i = 1, 2, · · ·, BTeste, fazer > Bloco de Teste
[0557] 2: 1. Se o motivo para a base i for mi, usar os parâmetros universais de eficiência da última etapa e os parâmetros de erro para o motivo mi para as etapas subsequentes.
[0558] 2. Estimar a cópia de partida para a base i para dados de teste na base i.
[0559] 3. Ajuste o parâmetro de eficiência na base i.
[0560] 4. Para uma grade de valores de θ ∈ [0, τmax] (em que τmax é idealmente 1, mas, para fins práticos, é suficiente definir τ max ≈ 0,15) para frações de mutação candidatas, inserir os parâmetros de erro e eficiência estimados nas equações (6) e (7) para computar a verossimilhança L(θ) dos dados de teste usando o modelo beta-binomial em (1).
[0561] 5. Encontrar a estimativa de máxima verossimilhança de
[0562] 6. Computar a pontuação de confiança como
[0563] Com referência agora à Figura 10, a Figura 10 ilustra um diagrama de blocos mostrando uma modalidade de um sistema de análise de erro 300. O sistema de análise de erro 300 pode incluir um ou mais processadores 301 e uma memória 302. Os um ou mais processadores 301 podem incluir um ou mais microprocessadores, circuitos integrados específicos de aplicação (ASIC), arranjos de portas programáveis em campo (FPGA) etc., ou combinações dos mesmos. A memória 302 pode incluir, mas não está limitada a armazenamento eletrônico, magnético ou qualquer outro dispositivo de armazenamento ou transmissão capaz de fornecer ao processador as instruções do programa. A memória pode incluir disco magnético, chip de memória, memória somente de leitura (ROM), memória de acesso aleatório (RAM), memória somente de leitura programável apagável eletricamente (EEPROM), memória somente de leitura programável apagável (EPROM), memória flash ou qualquer outra memória adequada a partir da qual o processador possa ler instruções. A memória 302 pode incluir componentes, subsistemas, módulos, roteiros, aplicativos ou um ou mais conjuntos de instruções executáveis por processador para implementar processos de análise de erro, incluindo quaisquer processos descritos neste documento. Por exemplo, a memória 302 pode incluir dados de treinamento 304, um analisador de eficiência de replicação 306, um analisador de erro de replicação 312, um mecanismo de estatística 314, um estimador de contagem inicial 318, um determinante de distribuição 320 e um chamador de mutação 322.
[0564] Os dados de treinamento 304 podem incluir, por exemplo, dados do seguinte tipo: (Ri,k, RefAllelei, Ai,k, Ci,k, Gi,k, Ti,k) em que i ∈ {1,2, ..., BTreinamento} denota uma base e k ∈ (1,2, ..., n} denota uma amostra, RefAllelei é o alelo de referência/tipo selvagem para a base I, Ri,k é a profundidade total de leituras, Ai,k, Ci,k, Gi,k, Ti,k são o número de leituras dos alelos A, C, G, T, respectivamente. Mi,k denota o motivo para a i-ésima base na amostra k, em que tal que Xj ∈ {A, C, G, T}∀j. Os dados de treinamento podem ser derivados de uma ou mais amostras retiradas de um ou mais sujeitos. Os dados de treinamento podem incluir apenas material genético que não inclua mutações de interesse (por exemplo, mutações para as quais uma fração de mutação está sendo determinada).
[0565] O analisador de eficiência de replicação 306 pode incluir componentes, subsistemas, módulos, rótulos, aplicativos ou um ou mais conjuntos de instruções executáveis por processador para determinar uma eficiência de replicação de um processo de PCR, usando os dados de treinamento. O analisador de eficiência de replicação 306 pode incluir um estimador de eficiência inicial 308 que determina uma estimativa inicial da eficiência de replicação. Por exemplo, o analisador de eficiência de replicação 306 pode estimar a eficiência de replicação a partir da relação R = (1 + p) nX0 em cada posição. O analisador de eficiência de replicação 306 pode determinar a estimativa de eficiência de replicação inicial usando a Equação 20. O analisador de eficiência de replicação 306 pode incluir um atualizador de eficiência 310. O atualizador de eficiência 310 pode atualizar ou corrigir uma estimativa de eficiência inicial usando uma contagem inicial determinada pelo estimador de contagem inicial 318 (descrito em mais detalhes abaixo). O atualizador de eficiência 310 pode atualizar ou corrigir a estimativa de eficiência inicial usando a Equação 23.
[0566] O analisador de erro de replicação 312 pode incluir componentes, subsistemas, módulos, roteiros, aplicativos ou um ou mais conjuntos de instruções executáveis por processador para determinar uma taxa de erro de replicação. Por exemplo, o analisador de erro de replicação 312 pode determinar uma taxa de erro por ciclo em cada posição usando a equação 21. A taxa de erro determinada pode corresponder ao erro de fundo, incluindo o erro induzido pelo processo de PCR. O analisador de erro de replicação 312 pode determinar a taxa de erro por ciclo em cada posição usando os dados de treinamento (por exemplo, com base no número de leituras errôneas e no número total de leituras feitas).
[0567] O mecanismo de estatística 314 pode incluir componentes, subsistemas, módulos, roteiros, aplicativos ou um ou mais conjuntos de instruções executáveis por processador para determinar valores estatísticos para as eficiências de replicação determinadas pelo analisador de eficiência de replicação 306 e para as taxas de erro de replicação determinadas pelo analisador de erro de replicação 312. Por exemplo, o mecanismo de estatística 314 pode determinar uma eficiência de replicação média ou estimada com base nas eficiências de replicação determinadas pelo analisador de eficiência de replicação 306 e pode determinar uma variância do mesmo. Por exemplo, o mecanismo de estatística 314 pode determinar a média em relação a todas as amostras analisadas de uma maneira independente da posição.
[0568] O mecanismo de estatística 314 pode determinar uma taxa de erro de replicação média ou estimada e sua variância, com base nas taxas de erro de replicação determinadas pelo analisador de erro de replicação 312. A taxa de erro de replicação média ou estimada pode ser específica do motivo. Por exemplo, o mecanismo de estatística 314 pode incluir um agregador de motivo 316 que agrupa as bases-alvo a serem analisadas por motivo (isto é, em grupos em que todas as bases-alvo do grupo têm o mesmo motivo). Em algumas implementações, o agregador de motivo 316 faz referência a uma estrutura de dados que especifica parâmetros de motivo (por exemplo, um primeiro número de bases adjacentes sequencialmente antes da base-alvo e um segundo número de bases adjacentes sequencialmente seguindo a base-alvo) que definem os motivos. Por exemplo, se uma pluralidade de taxas médias de erro de replicação μ1, μ2, ..., μn e uma pluralidade de variâncias das mesmas forem determinadas pelo mecanismo de estatísticas 314 com base em dados determinados pelo analisador de erro de replicação 312, a média e a variância agrupadas específicas do motivo podem ser calculadas como
[0569] O agrupamento pode ser feito em etapas, primeiro agrupando amostras em execuções individuais e, em seguida, agrupando todas as execuções. Durante a execução do agrupamento, as taxas de erro podem ser ponderadas pelo número de ocorrências do motivo na execução. Em outras implementações, as taxas de erro têm a média calculada sem ponderação.
[0570] O mecanismo de estatísticas 314 pode implementar uma política de filtragem para higienizar os dados. Por exemplo, o mecanismo de estatística 314 pode remover do conjunto de treinamento (bases, canal) pares de dados para taxas de erro maiores ou iguais a a, em que a = min {um número predeterminado (por exemplo, 0,2), um percentil predeterminado das taxas de erro na amostra de formação (por exemplo, o 99º percentil)}.
[0571] O estimador de contagem inicial 318 pode incluir componentes, subsistemas, módulos, roteiros, aplicativos ou um ou mais conjuntos de instruções executáveis por processador para determinar uma contagem inicial de uma base-alvo para uma ou mais amostras. Por exemplo, o estimador de contagem inicial 318 pode usar a Equação 22 para determinar uma pluralidade de estimativas de contagem inicial para cada base sendo analisada. O estimador de contagem inicial 318 (ou, em algumas implementações, o mecanismo de estatística 314) pode determinar uma pluralidade de estimativas ou valores médios para a contagem inicial, e suas variâncias, em relação às posições pertencentes a um mesmo fragmento genético sequenciado e pode atribuir esses valores a cada posição no fragmento genético. Esses valores podem ser usados pelo atualizador de eficiência inicial 310 para atualizar uma estimativa de eficiência inicial, conforme descrito neste documento.
[0572] O determinante de distribuição 320 pode incluir componentes, subsistemas, módulos, roteiros, aplicativos ou um ou mais conjuntos de instruções executáveis por processador para determinar parâmetros para uma distribuição que representa uma fração de mutação de uma ou mais amostras analisadas. Por exemplo, o determinante de distribuição 320 pode determinar parâmetros para uma distribuição Beta Binomial da fração de mutação. O determinante de distribuição 320 pode, para uma grade de valores de θ ∈ [0, τmax] (em que. τmax é idealmente 1, mas para fins práticos, é suficiente definir τmax ≈ 0,15) para frações de mutação candidatas, inserir os parâmetros de erro e eficiência estimados nas equações (6) e (7) para computar a verossimilhança L(θ) dos dados de teste usando o modelo beta- binomial em (1). O determinante de distribuição 320 pode selecionar uma fração de mutação de maior verossimilhança como a fração de mutação determinada para a uma ou mais amostras analisadas.
[0573] O chamador de mutação 322 pode incluir componentes, subsistemas, módulos, roteiros, aplicativos ou um ou mais conjuntos de instruções executáveis por processador para determinar parâmetros para chamar mutações. O chamador de mutação 322 pode chamar mutações com base em um ou mais valores de parâmetros sendo iguais ou acima de um limite predeterminado. Por exemplo, os valores dos parâmetros podem incluir uma fração de mutação, um número absoluto de erros ou mutações detectadas ou uma série de desvios padrão pelos quais esses valores de parâmetro se desviam de um valor de referência ou médio. O chamador de mutação 322 também pode determinar uma confiança correspondente à mutação chamada (por exemplo, com base, pelo menos em parte, na diferença entre o valor do parâmetro e o limite).
[0574] Com referência agora à Figura 11, um método para chamar uma mutação usando um modelo de erro específico do motivo é mostrado. O método inclui do BLOCO 402 ao BLOCO 410. Em uma breve visão geral, no BLOCO 402, o sistema de análise de erro 300 determina, para cada base-alvo de uma pluralidade de bases-alvo, um respectivo valor para um parâmetro de erro de fundo com base em dados de treinamento. No BLOCO 404, o sistema de análise de erro 300 identifica um respectivo motivo para cada base-alvo. No BLOCO 406, o sistema de análise de erro 300 agrupa as bases- alvo em grupos, cada grupo correspondendo a um motivo particular. No BLOCO 408, o sistema de análise de erro 300 determina, para cada grupo, um respectivo valor de parâmetro específico do motivo para o erro de fundo. No BLOCO 410, o sistema de análise de erro 300 chama uma mutação usando o modelo de erro específico do motivo e informações de sequenciamento.
[0575] Em mais detalhes, no BLOCO 402, o sistema de análise de erro 300 determina, para cada base-alvo de uma pluralidade de bases-alvo, um respectivo valor para um parâmetro de erro de fundo com base em dados de treinamento. Por exemplo, o analisador de erro de replicação 312 pode determinar uma taxa de erro por ciclo para cada base-alvo de uma pluralidade de bases-alvo usando a equação 21. A taxa de erro determinada pode corresponder ao erro de fundo, incluindo o erro induzido pelo processo de PCR. O analisador de erro de replicação 312 pode determinar a taxa de erro por ciclo em cada posição usando os dados de treinamento (por exemplo, com base no número de leituras errôneas e no número total de leituras feitas).
[0576] No BLOCO 404, o sistema de análise de erro 300 identifica um respectivo motivo para cada base-alvo e, no BLOCO 406, o sistema de análise de erro 300 agrupa as bases-alvo em grupos, cada grupo correspondendo a um motivo particular. Por exemplo, o agregador de motivo 316 faz referência a uma estrutura de dados que especifica parâmetros de motivo (por exemplo, um primeiro número de bases adjacentes sequencialmente antes da base-alvo e um segundo número de bases adjacentes sequencialmente seguindo a base-alvo) que definem os motivos. Por exemplo, se uma pluralidade de taxas médias de erro de replicação μ1, μ2,
..., μn e uma pluralidade de variâncias das mesmas forem determinadas pelo mecanismo de estatísticas 314 com base em dados determinados pelo analisador de erro de replicação 312, a média e a variância agrupadas específicas do motivo podem ser calculadas como
[0577] O agrupamento pode ser feito em etapas, primeiro agrupando amostras em execuções individuais e, em seguida, agrupando todas as execuções. Durante a execução do agrupamento, as taxas de erro podem ser ponderadas pelo número de ocorrências do motivo na execução. Em outras implementações, as taxas de erro têm a média calculada sem ponderação.
[0578] No BLOCO 408, o sistema de análise de erro 300 determina, para cada grupo, um respectivo valor de parâmetro específico do motivo para o erro de fundo. Por exemplo, o mecanismo de estatística 314 pode determinar uma taxa de erro de replicação média ou estimada, e sua variância, para cada grupo determinado pelo agregador de motivo 316. Assim, a taxa de erro de replicação média ou estimada determinada pode ser específica do motivo.
[0579] No BLOCO 410, o sistema de análise de erro 300 chama uma mutação usando o modelo de erro específico do motivo e informações de sequenciamento. Por exemplo, o determinante de distribuição 320 pode determinar parâmetros para uma distribuição Beta Binomial da fração de mutação. O determinante de distribuição 320 pode, para uma grade de valores de θ E [0, τmax] (em que τmax é idealmente 1, mas para fins práticos, é suficiente definir τmax ≈ 0,15) para frações de mutação candidatas, inserir os parâmetros de erro e eficiência estimados nas equações (6) e (7) para computar a verossimilhança L(θ) dos dados de teste usando o modelo beta- binomial em (1). O determinante de distribuição 320 pode selecionar uma fração de mutação de maior verossimilhança como a fração de mutação determinada para a uma ou mais amostras analisadas. O chamador de mutação 322 pode chamar mutações com base em um ou mais valores de parâmetro sendo iguais ou acima de um limite predeterminado. Por exemplo, os valores dos parâmetros podem incluir a fração de mutação determinada pelo determinante de distribuição 320. O chamador de mutação 322 também pode determinar uma confiança correspondente à mutação chamada (por exemplo, com base, pelo menos em parte, na diferença entre o valor do parâmetro e o limite). Assim, uma mutação pode ser chamada com precisão usando uma abordagem específica do motivo.
[0580] Com referência agora à Figura 12, um método para determinar uma distribuição para uma fração de mutação é mostrado. O método inclui do BLOCO 502 ao BLOCO 512. Em uma breve visão geral, no BLOCO 502, o sistema de análise de erro 300 determina, para cada base-alvo de uma pluralidade de bases-alvo, uma respectiva eficiência de replicação com base nos dados de treinamento e uma média e variância correspondentes. No BLOCO 504, o sistema de análise de erro 300 determina para cada base-alvo da pluralidade de bases-alvo, uma respectiva taxa de erro de replicação e uma média e variância correspondentes. No BLOCO 506, o sistema de análise de erro 300 determina uma pluralidade de taxas de erro de replicação específicas do motivo e médias e variâncias correspondentes. No BLOCO 508, o sistema de análise de erro 300 determina uma contagem inicial para cada uma das bases-alvo com base na média e variância da eficiência de replicação correspondente. No BLOCO 510, o sistema de análise de erro 300 determina uma expectativa e uma variância de uma contagem total para cada uma das bases-alvo e uma expectativa e uma variância de uma contagem de erro. No BLOCO 512, o sistema de análise de erro 300 determina uma distribuição para a fração de mutação com base na expectativa e na variância da contagem total para cada uma das bases-alvo e a expectativa e a variância da contagem de erro.
[0581] Em mais detalhes, no BLOCO 502, o analisador de eficiência de replicação 306 pode determinar uma estimativa inicial da eficiência de replicação. Por exemplo, o analisador de eficiência de replicação 306 pode estimar a eficiência de replicação a partir da relação R = (1 + p)nX0 em cada posição. O analisador de eficiência de replicação 306 pode determinar a estimativa de eficiência de replicação inicial usando a Equação
20. O mecanismo de estatística 314 pode determinar valores médios e variâncias correspondentes.
[0582] No BLOCO 504, o analisador de erro de replicação 312 pode determinar uma taxa de erro por ciclo em cada posição usando a equação 21. A taxa de erro determinada pode corresponder ao erro de fundo, incluindo o erro induzido pelo processo de PCR. O analisador de erro de replicação 312 pode determinar a taxa de erro por ciclo em cada posição usando os dados de treinamento (por exemplo, com base no número de leituras errôneas e no número total de leituras feitas). O mecanismo de estatística 314 pode determinar valores médios e variâncias correspondentes.
[0583] No BLOCO 506, o agregador de motivo 316 pode agrupar as bases-alvo a serem analisadas por motivo (isto é, em grupos em que todas as bases-alvo do grupo têm o mesmo motivo). Em algumas implementações, o agregador de motivo 316 faz referência a uma estrutura de dados que especifica parâmetros de motivo (por exemplo, um primeiro número de bases adjacentes sequencialmente antes da base-alvo e um segundo número de bases adjacentes sequencialmente seguindo a base-alvo) que definem os motivos. O agrupamento pode ser feito em etapas, primeiro agrupando amostras em execuções individuais e, em seguida, agrupando todas as execuções. Durante a execução do agrupamento, as taxas de erro podem ser ponderadas pelo número de ocorrências do motivo na execução.
Em outras implementações, as taxas de erro têm a média calculada sem ponderação. O mecanismo de estatística 314 pode determinar as taxas de erro de replicação médias ou estimadas específicas de motivo e suas variâncias, com base nos grupos determinados.
[0584] No BLOCO 508, o estimador de contagem inicial 318 pode usar a Equação 22 para determinar uma pluralidade de estimativas de contagem inicial para cada base sendo analisada. O estimador de contagem inicial 318 (ou, em algumas implementações, o mecanismo de estatística 314) pode determinar uma pluralidade de estimativas ou valores médios para a contagem inicial, e suas variâncias, em relação às posições pertencentes a um mesmo fragmento genético sequenciado e pode atribuir esses valores a cada posição no fragmento genético. Esses valores podem ser usados pelo atualizador de eficiência inicial 310 para atualizar uma estimativa de eficiência inicial, conforme descrito neste documento.
[0585] No BLOCO 510, o sistema de análise de erro 300 determina uma expectativa e uma variância de uma contagem total para cada uma das bases-alvo e uma expectativa e uma variância de uma contagem de erro e, no BLOCO 512, o sistema de análise de erro 300 determina uma distribuição para a fração de mutação com base na expectativa e na variância da contagem total para cada uma das bases-alvo e na expectativa e na variância da contagem de erros. Isso pode incluir, para uma grade de valores de θ ∈ [0, τmax] (em que τmax é idealmente 1, mas para fins práticos, é suficiente definir τmax ≈ 0,15) para frações de mutação candidatas, inserir os parâmetros de erro e eficiência estimados nas equações (6) e (7) para computar a verossimilhança L(θ) dos dados de teste usando o modelo beta-binomial em (1). O processo pode incluir, ainda, encontrar uma estimativa máxima de verossimilhança de e computar a pontuação de confiança como . O determinante de distribuição 320 pode selecionar uma fração de mutação de maior verossimilhança e pode selecionar a distribuição de fração de mutação correspondente como uma distribuição da fração de mutação correspondente a uma amostra analisada. Assim, uma fração de mutação e uma distribuição da mesma podem ser determinadas usando uma abordagem específica do motivo.
[0586] As modalidades descritas acima podem ser implementadas de qualquer uma de várias maneiras. Por exemplo, as modalidades podem ser implementadas usando hardware, software ou uma combinação dos mesmos. Quando implementadas em software, o código de software pode ser executado em qualquer processador ou coleção de processadores adequada, seja fornecido em um único computador ou distribuído entre vários computadores. Por exemplo, o sistema de análise de erro 300 pode ser executado em um computador ou sistema de lógica especial que inclui um ou mais processadores.
[0587] Além disso, um computador pode ter um ou mais dispositivos de entrada e saída. Esses dispositivos podem ser usados, entre outras coisas, para apresentar uma interface de usuário. Exemplos de dispositivos de saída que podem ser usados para fornecer uma interface de usuário incluem impressoras ou telas de exibição para apresentação visual de saída e alto-falantes ou outros dispositivos de geração de som para apresentação audível de saída. Exemplos de dispositivos de entrada que podem ser usados para uma interface de usuário incluem teclados e dispositivos apontadores, como mouses, touchpads e tablets de digitalização. Como outro exemplo, um computador pode receber informações de entrada por meio de reconhecimento de voz ou em outro formato audível.
[0588] Esses computadores podem ser interconectados por uma ou mais redes em qualquer forma adequada, incluindo uma rede de área local ou uma rede de área ampla, como uma rede corporativa, uma rede inteligente (IN) ou a Internet. Essas redes podem ser baseadas em qualquer tecnologia adequada e podem operar de acordo com qualquer protocolo adequado e podem incluir redes sem fio, redes com fio ou redes de fibra óptica.
[0589] Um computador empregado para implementar pelo menos uma parte da funcionalidade descrita neste documento pode compreender uma memória, uma ou mais unidades de processamento (também referidas aqui simplesmente como "processadores"), uma ou mais interfaces de comunicação, uma ou mais unidades de exibição e um ou mais dispositivos de entrada do usuário. A memória pode compreender qualquer mídia legível por computador e pode armazenar instruções de computador (também referidas neste documento como "instruções executáveis por processador") para implementar as várias funcionalidades descritas neste documento. A unidade (ou unidades) de processamento pode ser usada para executar as instruções. A interface (ou interfaces) de comunicação pode ser acoplada a uma rede com fio ou sem fio, barramento ou outro meio de comunicação e pode, portanto, permitir que o computador transmita comunicações para e/ou receba comunicações de outros dispositivos. A unidade (ou unidades) de exibição pode ser fornecida, por exemplo, para permitir que um usuário visualize várias informações em conexão com a execução das instruções. O dispositivo (ou dispositivos) de entrada do usuário pode ser fornecido, por exemplo, para permitir que o usuário faça ajustes manuais, faça seleções, insira dados ou várias outras informações e/ou interaja de qualquer uma de uma variedade de maneiras com o processador durante a execução das instruções.
[0590] Os vários métodos ou processos descritos neste documento podem ser convertidos em códigos como software que é executável em um ou mais processadores que empregam qualquer um de uma variedade de sistemas operacionais ou plataformas. Além disso, esse software pode ser escrito usando qualquer uma de uma série de linguagens de programação adequadas e/ou ferramentas de programação ou roteiro, e também pode ser compilado como código de linguagem de máquina executável ou código intermediário que é executado em um framework ou máquina virtual.
[0591] A este respeito, vários conceitos inventivos podem ser incorporados como um meio de armazenamento legível por computador (ou múltiplos meios de armazenamento legíveis por computador) (por exemplo, uma memória de computador, um ou mais disquetes, discos compactos, discos ópticos, fitas magnéticas, memórias flash, configurações de circuito em arranjos de porta programáveis em campo ou outros dispositivos semicondutores, ou outro meio não transitório ou meio de armazenamento de computador tangível) codificado com um ou mais programas que, quando executados em um ou mais computadores ou outros processadores, executam métodos que implementam as várias modalidades da presente divulgação discutidas acima. A mídia ou mídias legíveis por computador podem ser transportáveis, de modo que o programa ou programas nelas armazenados possam ser carregados em um ou mais computadores diferentes ou outros processadores para implementar vários aspectos da presente divulgação, conforme discutido acima.
[0592] Os termos "aplicativo" ou “roteiro" são usados neste documento em um sentido genérico para se referir a qualquer tipo de código de computador ou conjunto de instruções executáveis por processador que possa ser empregado para programar um computador ou outro processador para implementar vários aspectos das modalidades, conforme discutido acima. Além disso, deve ser apreciado que, de acordo com um aspecto, um ou mais programas de computador que, quando executados, realizam métodos da presente divulgação, não precisam estar situados em um único computador ou processador, mas podem ser distribuídos de forma modular entre uma série de computadores ou processadores diferentes para implementar vários aspectos da presente divulgação.
[0593] As instruções executáveis por computador podem ser de muitas formas, tais como módulos de programa executados por um ou mais computadores ou outros dispositivos. Geralmente, os módulos de programa incluem rotinas, programas, objetos, componentes, estruturas de dados etc., que realizam tarefas específicas ou implementam tipos de dados abstratos específicos. Normalmente, a funcionalidade dos módulos de programa pode ser combinada ou distribuída conforme desejado em várias modalidades.
[0594] Além disso, as estruturas de dados podem ser armazenadas em mídias legíveis por computador em qualquer forma adequada. Para simplificar a ilustração, as estruturas de dados podem ser mostradas tendo campos que estão relacionados por meio da localização na estrutura de dados. Tais relações podem ser alcançadas, da mesma forma, atribuindo armazenamento para os campos com localizações em uma mídia legível por computador que transmite a relação entre os campos. No entanto, qualquer mecanismo adequado pode ser usado para estabelecer uma relação entre as informações nos campos de uma estrutura de dados, incluindo por meio do uso de ponteiros, etiquetas ou outros mecanismos que estabelecem relacionamento entre os elementos de dados.
[0595] Além disso, vários conceitos inventivos podem ser incorporados como um ou mais métodos, dos quais um exemplo foi fornecido. Os atos realizados como parte do método podem ser ordenados de qualquer forma adequada. Por conseguinte, podem ser construídas modalidades nas quais os atos são realizados em uma ordem diferente da ilustrada, o que pode incluir a realização de alguns atos simultaneamente, embora mostrado como atos sequenciais em modalidades ilustrativas.
[0596] Embora as operações sejam representadas nos desenhos em uma ordem particular, tais operações não precisam ser realizadas na ordem particular mostrada ou em ordem sequencial, e todas as operações ilustradas não precisam ser realizadas. Os métodos aqui descritos podem ser realizados em uma ordem diferente.
[0597] A separação de vários componentes do sistema não requer separação em todas as implementações e os componentes de programa descritos podem ser incluídos em um único produto de hardware ou software.
MÉTODO PARA DETECÇÃO DE MUTAÇÕES ASSOCIADAS AO CÂNCER
[0598] Em outro aspecto, a presente divulgação fornece um método para detectar uma mutação associada ao câncer, compreendendo: isolar DNA livre de células de uma amostra biológica de um sujeito; amplificar, a partir do DNA livre de células isolado, uma pluralidade de locais de variante de nucleotídeo único (SNV) que compreendem uma pluralidade de bases-alvo, em que os locais de SNV são conhecidos por estarem associados ao câncer; sequenciar os produtos de amplificação para obter leituras de sequência de uma pluralidade de motivos, em que cada motivo compreende uma da pluralidade de bases-alvo; e determinar uma distribuição de fração de mutação para cada uma da pluralidade de bases-alvo e identificar uma mutação associada ao câncer com base na distribuição de fração de mutação. Em algumas modalidades, a amostra biológica é selecionada a partir de sangue, soro, plasma e urina. Em algumas modalidades, pelo menos 10, ou pelo menos 20, ou pelo menos 50, ou pelo menos 100, ou pelo menos 200, ou pelo menos 500, ou pelo menos 1.000 locais de SNV conhecidos por estarem associados ao câncer são amplificados a partir do isolado DNA livre de células. Em algumas modalidades, os produtos de amplificação são sequenciados com uma profundidade de leitura de pelo menos 200, ou pelo menos 500, ou pelo menos 1.000, ou pelo menos 2.000, ou pelo menos 5.000, ou pelo menos 10.000, ou pelo menos 20.000, ou pelo menos 50.000 ou pelo menos 100.000. Em algumas modalidades, a pluralidade de locais de variância de nucleotídeo único é selecionada a partir de locais de SNV identificados nos conjuntos de dados TCGA e COSMIC para câncer.
[0599] Em um aspecto adicional, a presente divulgação fornece um método para detectar uma mutação associada com recidiva precoce ou metástase de câncer, compreendendo: isolar DNA livre de células de uma amostra biológica de um sujeito que recebeu tratamento para um câncer; realizar uma reação de amplificação multiplex para amplificar, a partir do DNA livre de células isolado, uma pluralidade de locais de variante de nucleotídeo único (SNV) que compreendem uma pluralidade de bases-alvo, em que os locais de SNV são locais de SNV específicos do paciente associados ao câncer para o qual o sujeito recebeu tratamento; sequenciar os produtos de amplificação para obter leituras de sequência de uma pluralidade de motivos, em que cada motivo compreende uma da pluralidade de bases-alvo; e determinar uma distribuição de fração de mutação para cada uma da pluralidade de bases-alvo e identificar uma mutação associada à recidiva precoce ou metástase de câncer com base na distribuição da fração de mutação. Em algumas modalidades, a amostra biológica é selecionada a partir de sangue, soro, plasma e urina. Em algumas modalidades, a reação de amplificação multiplex amplifica pelo menos 4, ou pelo menos 8, ou pelo menos 16, ou pelo menos 32, ou pelo menos 64, ou pelo menos 128 locais de SNV específicos do paciente associados ao câncer para o qual o sujeito recebeu tratamento. Em algumas modalidades, os produtos de amplificação são sequenciados com uma profundidade de leitura de pelo menos 200, ou pelo menos 500, ou pelo menos 1.000, ou pelo menos 2.000, ou pelo menos 5.000, ou pelo menos 10.000, ou pelo menos 20.000, ou pelo menos 50.000 ou pelo menos 100.000. Em algumas modalidades, o método compreende coletar e analisar uma pluralidade de amostras biológicas a partir do paciente longitudinalmente.
[0600] Os termos "câncer" e "canceroso" se referem a ou descrevem a condição fisiológica em animais que é tipicamente caracterizada por crescimento celular desregulado. Um tumor compreende uma ou mais células cancerosas. Há vários tipos principais de câncer. O carcinoma é um câncer que começa na pele ou nos tecidos que revestem ou cobrem os órgãos internos. Sarcoma é um câncer que começa no osso, cartilagem, gordura, músculo, vasos sanguíneos ou outro tecido conjuntivo ou de suporte.
A leucemia é um câncer que começa no tecido formador do sangue, como a medula óssea, e faz com que um grande número de células sanguíneas anormais seja produzido e entre no sangue. O linfoma e o mieloma múltiplo são cânceres que começam nas células do sistema imunológico. Os cânceres do sistema nervoso central são cânceres que começam nos tecidos do cérebro e da medula espinhal.
[0601] Em algumas modalidades, o câncer compreende uma leucemia linfoblástica aguda; leucemia mieloide aguda; carcinoma adrenocortical; cânceres relacionados à AIDS; linfoma relacionado à AIDS; câncer anal; câncer de apêndice; astrocitomas; tumor teratoide/rabdoide atípico; carcinoma basocelular; câncer de bexiga; glioma do tronco encefálico; tumor cerebral (incluindo glioma do tronco encefálico, tumor teratoide/rabdoide atípico do sistema nervoso central, tumores embrionários do sistema nervoso central, astrocitomas, craniofaringioma, ependimoblastoma, ependimoma, meduloblastoma, meduloepitelioma, tumores de parênquima pineal de diferenciação intermediária, tumores neuroectodérmicos primitivos supratentoriais e pineoblastoma); câncer de mama; tumores brônquicos; linfoma de Burkitt; câncer de sítio primário desconhecido; tumor carcinoide; carcinoma de sítio primário desconhecido; tumor teratoide/rabdoide atípico do sistema nervoso central; tumores embrionários do sistema nervoso central; câncer cervical; cânceres infantis; cordoma; leucemia linfocítica crônica; leucemia mieloide crônica; distúrbios mieloproliferativos crônicos; câncer de colo; câncer colorretal; craniofaringioma; linfoma cutâneo de células T; tumores de células de ilhotas pancreáticas; câncer de endométrio; ependimoblastoma; ependimoma; câncer de esôfago; estesioneuroblastoma; sarcoma de Ewing; tumor extracraniano de células germinativas; tumor extragonadal de células germinativas; câncer de via biliar extra-hepático; câncer de vesícula biliar; câncer de gástrico (estômago); tumor carcinoide gastrointestinal; tumor de célula estromal gastrointestinal; tumor estromal gastrointestinal (GIST); tumor trofoblástico gestacional; glioma; leucemia de células pilosas; câncer de cabeça e pescoço; câncer cardíaco; linfoma de Hodgkin; câncer hipofaríngeo; melanoma intraocular; tumores de células de ilhotas; sarcoma de Kaposi; câncer de rim; histiocitose celular de Langerhans; câncer de laringe; câncer de lábio; câncer de fígado; câncer ósseo de hitiocitoma fibroso maligno; meduloblastoma; meduloepitelioma; melanoma; carcinoma de célula de Merkel; carcinoma de pele de célula de Merkel; mesotelioma; câncer de pescoço escamoso primário oculto metastático; câncer de boca; múltiplas síndromes de neoplasia endócrina; mieloma múltiplo; mieloma múltiplo/neoplasmo celular de plasma; mycosis fungoides; síndromes mielodisplásicas, neoplasmos mieloproliferativos; câncer de cavidade nasal; câncer de nasofaringe; neuroblastoma; linfoma não Hodgkin; câncer de pele não melanoma; câncer de pulmão de células não pequenas; câncer oral; câncer de cavidade oral; câncer de orofaringe; osteossarcoma; outros tumores cerebrais e de cordão espinhal; câncer ovariano; câncer epitelial ovariano; tumor ovariano de células germinativas; tumor de ovário de baixo potencial maligno; câncer de pâncreas; papilomatose; câncer de seios paranasais; câncer de paratireoide, câncer pélvico; câncer de pênis; câncer de faringe; tumores de parênquima de pênis de diferenciação intermediária; pineoblastoma; tumor pituitário, neoplasma de célula de plasma/mieloma múltiplo; blastoma pleuropulmonar; linfoma primário do sistema nervoso central (CNS); câncer de fígado hepatocelular primário; câncer de próstata; câncer de reto; câncer renal; câncer de células renais (rim); câncer de célula renal; câncer de trato respiratório; retinoblastoma; rabdomiossarcoma; câncer de glândulas salivares; síndrome de Sezary; câncer de pulmão de células pequenas; câncer de intestino delgado; sarcoma de tecido mole; carcinoma de célula escamosa; câncer de pescoço escamoso; câncer (gástrico) de estômago; tumores neuroectodérmicos primitivos supratentoriais; linfoma de células T; câncer de testículo; câncer de garganta; timoma; câncer de tireoide; câncer de células transicionais; câncer de células transicionais da pelve renal e ureter; tumores trofoblásticos; câncer de ureter; câncer de uretra; câncer de útero; sarcoma de útero; câncer de vagina; câncer de vulva; macroglobulinemia de Waldenstrom; ou tumor de Wilms.
[0602] Em certos exemplos, os métodos incluem a identificação de um valor de confiança para cada determinação de alelo em cada um do conjunto de locais de variância de nucleotídeo único, que pode ser baseado, pelo menos em parte, em uma profundidade de leitura para os locais. O limite de confiança pode ser definido como pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 96%, 98% ou 99%. O limite de confiança pode ser definido em diferentes níveis para diferentes tipos de mutações.
[0603] Em qualquer um dos métodos para detectar SNVs neste documento que incluem um fluxo de trabalho de amplificação/sequenciamento de SNV de ctDNA, parâmetros de amplificação aprimorados para PCR multiplex podem ser empregados. Por exemplo, onde a reação de amplificação é uma reação de PCR e a temperatura de hibridização está entre 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 ºC maior do que a temperatura de fusão na extremidade inferior do faixa e 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ou 15° na extremidade superior da faixa por pelo menos 10, 20, 25, 30, 40, 50, 60, 70, 75, 80, 90, 95 ou 100% dos iniciadores do conjunto de iniciadores.
[0604] Em certas modalidades, em que a reação de amplificação é uma reação de PCR, o comprimento da etapa de hibridização na reação de PCR está entre 10, 15, 20, 30, 45 e 60 minutos na extremidade inferior da faixa e 15, 20, 30, 45, 60, 120, 180 ou 240 minutos na extremidade superior da faixa. Em certas modalidades, a concentração do iniciador na amplificação, como a reação de PCR, está entre 1 e 10 nM. Além disso, em modalidades exemplares, os iniciadores no conjunto de iniciadores são projetados para minimizar a formação de dímero de iniciador.
[0605] Por conseguinte, em um exemplo de qualquer um dos métodos aqui que incluem uma etapa de amplificação, a reação de amplificação é uma reação de PCR, a temperatura de hibridização está entre 1 e 10 ºC maior do que a temperatura de fusão de pelo menos 90% dos iniciadores do conjunto de iniciadores, a duração da etapa de hibridização na reação de PCR está entre 15 e 60 minutos, a concentração do iniciador na reação de amplificação está entre 1 e 10 nM e os iniciadores no conjunto de iniciadores são projetados para minimizar a formação de dímero de iniciador. Em um aspecto adicional deste exemplo, a reação de amplificação multiplex é realizada sob condições limitantes do iniciador.
[0606] Uma amostra analisada nos métodos da presente invenção, em certas modalidades ilustrativas, é uma amostra de sangue ou uma fração da mesma. Os métodos aqui fornecidos, em certas modalidades, são especialmente adaptados para amplificar fragmentos de DNA, especialmente fragmentos de DNA de tumor que são encontrados no DNA de tumor circulante (ctDNA). Esses fragmentos têm tipicamente cerca de 160 nucleotídeos de comprimento.
[0607] É conhecido na técnica que o ácido nucleico livre de células (por exemplo, cfDNA), pode ser liberado na circulação por meio de várias formas de morte celular, como apoptose, necrose, autofagia e necroptose. O cfDNA está fragmentado e a distribuição de tamanho dos fragmentos varia de 150 a 350 pb a > 10.000 pb. (ver Kalnina et al. World J Gastroenterol. 7 de Nov de 2015; 21(41): 11.636 a 11.653). Por exemplo, as distribuições de tamanho de fragmentos de DNA de plasma em pacientes com carcinoma hepatocelular (HCC) abrangeram uma faixa de 100 a 220 pb de comprimento com um pico na frequência de contagem em cerca de 166 pb e a maior concentração de DNA de tumor em fragmentos de 150 a 180 pb de comprimento (ver: Jiang et al. Proc Natl Acad Sci EUA 112:E1317 a E1325).
[0608] Em uma modalidade ilustrativa, o DNA do tumor circulante (ctDNA) é isolado do sangue usando tubo EDTA-2Na após a remoção de resíduos celulares e plaquetas por centrifugação. As amostras de plasma podem ser armazenadas a - 80 ºC até que o DNA seja extraído usando, por exemplo, QIAamp DNA Mini Kit (Qiagen, Hilden, Alemanha), (por exemplo, Hamakawa et al., Br J Cancer. 2015; 112:352 a 356). Hamakava et al. relataram uma concentração mediana de DNA livre de células extraído de todas as amostras, 43,1 ng por ml de plasma (faixa de 9,5 a 1.338 ng/ml) e uma faixa de fração mutante de 0,001 a 77,8%, com uma mediana de 0,90%.
[0609] Os métodos da presente invenção, em certas modalidades, tipicamente incluem uma etapa de geração e amplificação de uma biblioteca de ácido nucleico a partir da amostra (ou seja, preparação da biblioteca). Os ácidos nucleicos da amostra durante a etapa de preparação da biblioteca podem ter adaptadores de ligação, muitas vezes referidos como etiquetas de biblioteca ou etiquetas de adaptador de ligação (LTs), anexados, em que os adaptadores de ligação contêm uma sequência de iniciação universal, seguida por uma amplificação universal. Em uma modalidade, isso pode ser feito usando um protocolo padrão projetado para criar bibliotecas de sequenciamento após a fragmentação. Em uma modalidade, a amostra de DNA pode ter extremidade cega e, em seguida, um A pode ser adicionado na extremidade 3'. Um adaptador em Y com uma saliência em T pode ser adicionado e ligado. Em algumas modalidades, outras extremidades pegajosas podem ser usadas diferentes de uma saliência em T ou A. Em algumas modalidades, outros adaptadores podem ser adicionados, por exemplo, adaptadores de ligação em laço. Em algumas modalidades, os adaptadores podem ter etiqueta projetada para amplificação de PCR.
[0610] Uma série das modalidades fornecidas neste documento incluem a detecção de SNVs em uma amostra de ctDNA. Tais métodos em modalidades ilustrativas incluem uma etapa de amplificação e uma etapa de sequenciamento (às vezes referido aqui como um “fluxo de trabalho de amplificação/sequenciamento de SNV de ctDNA). Em um exemplo ilustrativo, um fluxo de trabalho de amplificação/sequenciamento de ctDNA pode incluir a geração de um conjunto de amplicons realizando uma reação de amplificação multiplex em ácidos nucleicos isolados de uma amostra de sangue, ou uma fração do mesmo, de um indivíduo, tal como um indivíduo suspeito de ter câncer, em que cada amplicon do conjunto de amplicons abrange pelo menos um local de variante de nucleotídeo único de um conjunto de locais de variante de nucleotídeo único, como um local de SNV conhecido por estar associado ao câncer; e determinar a sequência de pelo menos um segmento de cada amplicon do conjunto de amplicons, em que o segmento compreende um local de variante de nucleotídeo único. Desta forma, este método exemplar determina as variantes de nucleotídeo único presentes na amostra.
[0611] Fluxos de trabalho de amplificação/sequenciamento de SNV de ctDNA exemplificativos, em mais detalhes, podem incluir a formação de uma mistura de reação de amplificação combinando uma polimerase, trifosfatos de nucleotídeo, fragmentos de ácido nucleico de uma biblioteca de ácido nucleico gerada a partir da amostra e um conjunto de iniciadores, cada um dos quais se liga a uma distância eficaz de um local de variante de nucleotídeo único ou um conjunto de pares de iniciadores em que cada um abrange uma região eficaz que inclui um local de variante de nucleotídeo único. Os locais variantes de nucleotídeo único, em modalidades exemplificativas, são conhecidos por estarem associados ao câncer. Em seguida, submeter a mistura de reação de amplificação a condições de amplificação para gerar um conjunto de amplicons compreendendo pelo menos um local de variante de nucleotídeo único de um conjunto de locais de variante de um único nucleotídeo, preferencialmente conhecido por estar associado ao câncer; e determinar a sequência de pelo menos um segmento de cada amplicon do conjunto de amplicons, em que o segmento compreende um local de variante de nucleotídeo único.
[0612] A distância eficaz de ligação dos iniciadores pode ser de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 125 ou 150 pares de bases de um local de SNV. A faixa efetiva que um par de iniciadores abrange normalmente inclui um SNV e é normalmente de 160 pares de bases ou menos, e pode ser de 150, 140, 130, 125, 100, 75, 50 ou 25 pares de bases ou menos. Em outras modalidades, a faixa efetiva que um par de iniciadores abrange é de 20, 25, 30, 40, 50, 60, 70,
75, 100, 110, 120, 125, 130, 140 ou 150 nucleotídeos de um local de SNV na extremidade inferior da faixa e 25, 30, 40, 50, 60, 70, 75, 100, 110, 120, 125, 130, 140 ou 150, 160, 170, 175 ou 200 na extremidade superior da faixa.
[0613] Caudas de iniciador podem melhorar a detecção de DNA fragmentado de bibliotecas etiquetadas universalmente. Se a etiqueta da biblioteca e as caudas do iniciador contiverem uma sequência homóloga, a hibridização pode ser melhorada (por exemplo, a temperatura de fusão (Tm) é reduzida) e os iniciadores podem ser estendidos se apenas uma porção da sequência-alvo do iniciador estiver no fragmento de DNA da amostra. Em algumas modalidades, 13 ou mais pares de bases alvo- específicos podem ser usados. Em algumas modalidades, podem ser usados 10 a 12 pares de base específicos de alvo. Em algumas modalidades, podem ser usados 8 a 9 pares de bases específicas. Em algumas modalidades, podem ser usados 6 a 7 pares de bases específicas.
[0614] Em uma modalidade, as bibliotecas são geradas a partir das amostras acima ligando adaptadores às extremidades dos fragmentos de DNA nas amostras, ou às extremidades dos fragmentos de DNA gerados a partir do DNA isolado das amostras. Os fragmentos podem, então, ser amplificados usando PCR, por exemplo, de acordo com o seguinte protocolo exemplificativo: 95 ºC, 2 min; 15 x [95 ºC, 20 s, 55 ºC, 20 s, 68 ºC, 20 s], 68 ºC 2 min, 4 ºC retenção.
[0615] Muitos kits e métodos são conhecidos na técnica para geração de bibliotecas de ácidos nucleicos que incluem sítios de ligação do iniciador universal para amplificação subsequente, por exemplo, amplificação clonal e para sequenciamento subsequente. Para ajudar a facilitar a ligação de adaptadores, a preparação e amplificação da biblioteca pode incluir reparo de extremidade e adenilação (isto é, formação de cauda A). Os kits especialmente adaptados para a preparação de bibliotecas a partir de pequenos fragmentos de ácido nucleico, especialmente DNA livre circulante, podem ser úteis para a prática de métodos aqui fornecidos. Por exemplo, os kits NEXTflex Cell Free disponíveis na Bioo Scientific ou o Natera Library Prep Kit (disponível junto à Natera, Inc. San Carlos, CA). No entanto, esses kits seriam tipicamente modificados para incluir adaptadores que são personalizados para as etapas de amplificação e sequenciamento dos métodos fornecidos neste documento. A ligação do adaptador pode ser realizada usando kits disponíveis comercialmente, como o kit de ligação encontrado no kit AGILENT SURESELECT (Agilent, CA).
[0616] As regiões-alvo da biblioteca de ácido nucleico gerada a partir do DNA isolado da amostra, especialmente uma amostra de DNA livre circulante para os métodos da presente invenção, são, então, amplificadas. Para esta amplificação, uma série de iniciadores ou pares de iniciadores, que podem incluir entre 5, 10, 15, 20, 25, 50, 100, 125, 150, 250, 500, 1.000, 2.500, 5.000, 10.000, 20.000, 25.000 ou 50.000 na extremidade inferior da faixa e 15, 20, 25, 50, 100, 125, 150, 250, 500, 1.000,
2.500, 5.000, 10.000, 20.000, 25.000, 50.000, 60.000, 75.000 ou 100.000 iniciadores na extremidade superior da faixa, em que cada um se liga a um de uma série de locais de ligação do iniciador.
[0617] Projetos de iniciador podem ser gerados com Primer3 (Untergrasser A, Cutcutache I, Koressaar T, Ye J, Faircloth BC, Remm M, Rozen SG (2012) “Primer3 - new capabilities and interfaces”. Nucleic Acids Research 40(15):e115 e Koressaar T, Remm M (2007) “Enhancements and modifications of primer design program Primer3.” Bioinformatics 23 (10): 1.289 a 1.291) código-fonte disponível em primer3.sourceforge.net). A especificidade do iniciador pode ser avaliada por BLAST e adicionada aos critérios de pipeline de projeto de iniciador existentes:
[0618] As especificidades do iniciador podem ser determinadas usando o programa BLASTn do pacote ncbi-blast-2.2.29+. A opção de tarefa “blastn-short” pode ser usada para mapear os iniciadores contra o genoma humano hg19. Projetos de iniciador podem ser determinados como "específicos" se o iniciador tiver menos de 100 acertos no genoma e o acerto superior for a região de ligação do iniciador complementar-alvo do genoma e for pelo menos duas pontuações mais superior a outros acertos (a pontuação é definida pelo programa BLASTn). Isso pode ser feito para ter um acerto exclusivo no genoma e não ter muitos outros acertos em todo o genoma.
[0619] Os iniciadores finais selecionados podem ser visualizados em IGV (James T. Robinson, Helga Thorvaldsdottir, Wendy Winckler, Mitchell Guttman, Eric S. Lander, Gad Getz, Jill P. Mesirov. Visualizador de genômica integrativa. Nature Biotechnology 29, 24 a 26 (2011)) e navegador UCSC (Kent WJ, Sugnet CW, Furey TS, Roskin KM, Pringle TH, Zahler AM, Haussler D. The human genome browser em UCSC. Genome Res. junho de 2002;12(6):996 a 1.006) usando arquivos de leito e mapas de cobertura para validação.
[0620] Os métodos aqui descritos, em certas modalidades, incluem a formação de uma mistura de reação de amplificação. A mistura de reação normalmente é formada combinando uma polimerase, trifosfatos de nucleotídeo, fragmentos de ácido nucleico de uma biblioteca de ácido nucleico gerada a partir da amostra, um conjunto de iniciadores diretos e reversos específicos para regiões-alvo que contêm SNVs. As misturas de reação aqui fornecidas, elas próprias formando, em modalidades ilustrativas, um aspecto separado da invenção.
[0621] Uma mistura de reação de amplificação útil para a presente invenção inclui componentes conhecidos na técnica para amplificação de ácido nucleico, especialmente para amplificação por PCR. Por exemplo, a mistura de reação inclui tipicamente trifosfatos de nucleotídeos, uma polimerase e magnésio. As polimerases que são úteis para a presente invenção podem incluir qualquer polimerase que pode ser usada em uma reação de amplificação, especialmente aquelas que são úteis em reações de PCR. Em certas modalidades, as polimerases Taq de iniciação a quente são especialmente úteis. As misturas de reação de amplificação úteis para a prática dos métodos aqui fornecidos, como a mistura-mestre AmpliTaq Gold (Life
Technologies, Carlsbad, CA), estão disponíveis comercialmente.
[0622] As condições de amplificação (por exemplo, ciclagem de temperatura) para PCR são bem conhecidos na técnica. Os métodos fornecidos neste documento podem incluir quaisquer condições de ciclagem de PCR que resultem na amplificação de ácidos nucleicos-alvo, como ácidos nucleicos-alvo de uma biblioteca. As condições de ciclagem exemplificativas não limitantes são fornecidas na seção de Exemplos neste documento.
[0623] Existem muitos fluxos de trabalho possíveis durante a realização de PCR; alguns fluxos de trabalho típicos dos métodos divulgados neste documento são fornecidos aqui. As etapas descritas neste documento não se destinam a excluir outras etapas possíveis, nem implicam que qualquer uma das etapas descritas neste documento sejam necessárias para que o método funcione corretamente. Um grande número de variações de parâmetros ou outras modificações são conhecidas na literatura e podem ser feitas sem afetar a essência da invenção.
[0624] Em certas modalidades do método fornecido neste documento, pelo menos uma porção e, em exemplos ilustrativos, toda a sequência de um amplicon, tal como um amplicon-alvo de iniciador exterior, é determinado. Métodos para determinado a sequência de um amplicon são conhecidos na técnica. Qualquer um dos métodos de sequenciamento conhecidos na técnica, por exemplo, sequenciamento de Sanger, pode ser usado para tal determinação de sequência. Em modalidades ilustrativas, técnicas de sequenciamento de próxima geração de alto rendimento (também referidas neste documento como técnicas de sequenciamento maciçamente paralelas), tais como, mas sem limitações, aquelas empregadas em MYSEQ (ILLUMINA), HISEQ (ILLUMINA), ION TORRENT (LIFE TECHNOLOGIES), GENOME ANALYZER ILX (ILLUMINA), GS FLEX + (ROCHE 454), podem ser usadas para sequenciar os amplicons produzidos pelos métodos aqui fornecidos.
[0625] Sequenciadores genéticos de alto rendimento são passíveis de uso de conversão em código de barras (ou seja, etiquetagem de amostra com sequências de ácido nucleico distintas) de modo a identificar amostras específicas de indivíduos, permitindo, assim, a análise simultânea de várias amostras em uma única execução do sequenciador de DNA. O número de vezes que uma determinada região do genoma em uma preparação de biblioteca (ou outra preparação nucleica de interesse) é sequenciada (número de leituras) será proporcional ao número de cópias dessa sequência no genoma de interesse (ou nível de expressão em caso de preparações contendo cDNA). Polarizações na eficiência da amplificação podem ser levadas em consideração em tal determinação quantitativa.
[0626] Genes-alvo. Genes-alvo da presente invenção em modalidades exemplificativas, são genes relacionados ao câncer e, em muitas modalidades ilustrativas, genes relacionados ao câncer. Um gene relacionado ao câncer se refere a um gene associado a um risco alterado de um câncer ou a um prognóstico alterado para um câncer. Genes exemplificativos relacionados ao câncer que promovem o câncer incluem oncogenes; genes que aumentam a proliferação, invasão ou metástase celular; genes que inibem a apoptose; e genes pró-angiogênese. Os genes relacionados ao câncer que inibem o câncer incluem, mas não estão limitados a, genes supressores de tumor; genes que inibem a proliferação, invasão ou metástase celular; genes que promovem apoptose; e genes antiangiogênese.
[0627] Uma modalidade do método de detecção de mutação começa com a seleção da região do gene que se torna o alvo. A região com mutações conhecidas é usada para desenvolver iniciadores para mPCR-NGS para amplificar e detectar a mutação.
[0628] Os métodos fornecidos neste documento podem ser usados para detectar virtualmente qualquer tipo de mutação, especialmente mutações conhecidas por estarem associadas ao câncer e, mais particularmente, os métodos fornecidos neste documento são direcionados a mutações, especialmente SNVs, associadas ao câncer. SNVs exemplificativos podem estar em um ou mais dos seguintes genes: EGFR, FGFR1, FGFR2, ALK, MET, ROS1, NTRK1, RET, HER2, DDR2, PDGFRA, KRAS, NF1, BRAF, PIK3CA, MEK1, NOTCH1, MLL2, EZH2, TET2, DNMT3A, SOX2, MYC, KEAP1, CDKN2A, NRG1, TP53, LKB1 e PTEN, que foram identificados em várias amostras de câncer de pulmão como sendo mutados, tendo números de cópias aumentados ou sendo fusionados a outros genes e combinações dos mesmos (Non-small-cell lung cancers: a heterogeneous set of diseases. Chen et al. Nat. Rev. Cancer. 14 de agosto de 2014 (8): 535 a 551). Em outro exemplo, a lista de genes são aqueles listados acima, em que SNVs foram relatados, como na referência mencionada de Chen et al.
[0629] Outros polimorfismos ou mutações exemplificativas são em um ou mais dos seguintes genes: TP53, PTEN, PIK3CA, APC, EGFR, NRAS, NF2, FBXW7, ERBBs, ATAD5, KRAS, BRAF, VEGF, EGFR, HER2, ALK, p53, BRCA, BRCA1, BRCA2, SETD2, LRP1B, PBRM, SPTA1, DNMT3A, ARID 1 A, GRIN2A, TRRAP, STAG2, EPHA3/5/7, POLE, SYNE1, C20orf80, CSMD1, CTNNB1, ERBB2. FBXW7, KIT, MUC4, ATM, CDH1, DDX11, DDX12, DSPP, EPPK1, FAM186A, GNAS, HRNR, KRTAP4-11, MAP2K4, MLL3, NRAS, RB1, SMAD4, TTN, ABCC9, ACVR1B, ADAM29, AD AMTS 19, AGAP10, AKT1, AMBN, AMPD2, ANKRD30A, ANKRD40, APOBR, AR, BIRC6, BMP2, BRAT1, BTNL8, C12orf4, C1QTNF7, C20orfl86, CAPRIN2, CBWD1, CCDC30, CCDC93, CD5L, CDC27, CDC42BPA, CDH9, CDKN2A, CHD8, CHEK2, CHRNA9, CIZ1, CLSPN, CNTN6, COL14A1, CREBBP, CROCC, CTSF, CYP1A2, DCLK1, DHDDS, DHX32, DKK2, DLEC1, DNAH14, DNAH5, DNAH9, DNASE 1L3, DUSP16, DYNC2H1, ECT2, EFHB, RRN3P2, TRIM49B, TUBB8P5, EPHA7, ERBB3, ERCC6, FAM21A, FAM21C, FCGBP, FGFR2, FLG2, FLT1, FOLR2, FRYL, FSCB, GAB1, GABRA4, GABRP, GH2, GOLGA6L1, GPHB5, GPR32, GPX5, GTF3C3, HECW1, HIST1H3B, HLA-A, HRAS, HS3ST1, HS6ST1, HSPD1, IDH1, JAK2, KDM5B, KIAA0528, KRT15, KRT38, KRTAP21-1, KRTAP4-5,
KRTAP4-7, KRTAP5-4, KRTAP5-5, LAMA4, LATS1, LMF1, LPAR4, LPPR4, LRRFIP1, LUM, LYST, MAP2K1, MARCH 1, MARCO, MB21D2, MEGF10, MMP16, MORC1, MRE11A, MTMR3, MUC12, MUC17, MUC2, MUC20, NBPF10, NBPF20, NEK1, NFE2L2, NLRP4, NOTCH2, NRK, NUP93, OBSCN, OR11H1, OR2B11, OR2M4, OR4Q3, OR5D13, OR8I2, OXSM, PIK3R1, PPP2R5C, PRAME, PRF1, PRG4, PRPF19, PTH2, PTPRC, PTPRJ, RAC1, RAD50, RBM12, RGPD3, RGS22, ROR1, RP11-671M22.1, RP13-996F3.4, RP1L1, RSBN1L, RYR3, SAMD3, SCN3A, SEC31A, SF1, SF3B1, SLC25A2, SLC44A1, SLC4A11, SMAD2, SPTA1, ST6GAL2, STK11, SZT2, TAF1L, TAX1BP1, TBP, TGFBI, TIF1, TMEM14B, TMEM74, TPTE, TRAPPC8, TRPS1, TXNDC6, USP32, UTP20, VASN, VPS72, WASH3P, WWTR1, XPOl, ZFHX4, ZMIZ1, ZNF167, ZNF436, ZNF492, ZNF598, ZRSR2, ABL1, AKT2, AKT3, ARAF, ARFRP1, ARID2, ASXL1, ATR, ATRX, AURKA, AURKB, AXL, BAP1, BARD1, BCL2, BCL2L2, BCL6, BCOR, BCORL1, BLM, BRIP1, BTK, CARD11, CBFB, CBL, CCND1, CCND2, CCND3, CCNE1, CD79A, CD79B, CDC73, CDK12, CDK4, CDK6, CDK8, CDKN1B, CDKN2B, CDKN2C, CEBPA, CHEK1, CIC, CRKL, CRLF2, CSF1R, CTCF, CTNNA1, DAXX, DDR2, DOT1L, EMSY (C11orf30), EP300, EPHA3, EPHA5, EPHB1, ERBB4, ERG, ESR1, EZH2, FAM123B (WTX), FAM46C, FANCA, FANCC, FANCD2, FANCE, FANCF, FANCG, FANCL, FGF10, FGF14, FGF19, FGF23, FGF3, FGF4, FGF6, FGFR1, FGFR2, FGFR3, FGFR4, FLT3, FLT4, FOXL2, GATA1, GATA2, GATA3, GID4 (C17orf39), GNA11, GNA13, GNAQ, GNAS, GPR124, GSK3B, HGF, IDH1, IDH2, IGF1R, IKBKE, IKZF1, IL7R, INHBA, IRF4, IRS2, JAK1, JAK3, JUN, KAT6A (MYST3), KDM5A, KDM5C, KDM6A, KDR, KEAP1, KLHL6, MAP2K2, MAP2K4, MAP3K1, MCL1, MDM2, MDM4, MED 12, MEF2B, MEN1, MET, MITF, MLH1, MLL, MLL2, MPL, MSH2, MSH6, MTOR, MUTYH, MYC, MYCL1, MYCN, MYD88, NF1, NFKBIA, NKX2-1, NOTCH1, NPM1, NRAS, NTRK1, NTRK2, NTRK3, PAK3, PALB2, PAX5, PBRM1, PDGFRA, PDGFRB, PDK1, PIK3CG, PIK3R2, PPP2R1A, PRDM1, PRKAR1A, PRKDC, PTCH1, PTPN11, RAD51, RAF1, RARA, RET, RICTOR, RNF43, RPTOR, RUNX1,
SMARCA4, SMARCB1, SMO, SOCS1, SOX10, SOX2, SPEN, SPOP, SRC, STAT4, SUFU, TET2, TGFBR2, TNFAIP3, TNFRSF14, TOP1, TP53, TSC1, TSC2, TSHR, VHL, WISP3, WT1, ZNF217, ZNF703 e combinações dos mesmos (Su et al., J Mol Diagn 2011, 13:74 a 84; D01:10.1016/j.jmoldx.2010.11.010; e Abaan et al., "The Exomes of the NCI-60 Panel: A Genomic Resource for Cancer Biology and Systems Pharmacology", Cancer Research, 15 de julho de 2013, que são aqui incorporados por referência na sua totalidade). Polimorfismos ou mutações exemplificativas podem estar em um ou mais dos seguintes microRNAs: miR-15a, miR-16-1, miR-23a, miR-23b, miR-24-1, miR-24-2, miR-27a, miR-27b, miR-29b-2, miR- 29c, miR-146, miR-155, miR-221, miR-222 e miR-223 (Calin et al. “A microRNA signature associated with prognosis and progression in chronic lymphocytic leukemia”. N Engl J Med 353:1.793 a 1.801, 2005, que é aqui incorporado a título de referência em sua totalidade). MISTURAS DE REAÇÃO DE AMPLIFICAÇÃO (POR EXEMPLO, PCR)
[0630] Métodos da presente invenção, em certas modalidades, incluem formar uma mistura de reação de amplificação. A mistura de reação normalmente é formada pela combinação de uma polimerase, trifosfatos de nucleotídeo, fragmentos de ácido nucleico de uma biblioteca de ácido nucleico gerada a partir da amostra, uma série de iniciadores exteriores específicos do alvo diretos e um iniciador universal exterior reverso de primeira fita. Outra modalidade ilustrativa é uma mistura de reação que inclui iniciadores interiores alvo-específicos diretos em vez dos iniciadores exteriores alvo- específicos diretos e amplicons de uma primeira reação de PCR usando os iniciadores exteriores, em vez de fragmentos de ácido nucleico da biblioteca de ácido nucleico. As misturas de reação aqui fornecidas, elas próprias formando, em modalidades ilustrativas, um aspecto separado da invenção. Em modalidades ilustrativas, as misturas de reação são misturas de reação de PCR. As misturas de reação de PCR tipicamente incluem magnésio.
[0631] Em algumas modalidades, a mistura de reação inclui ácido etilenodiaminotetra-acético (EDTA), magnésio, cloreto de tetrametil amônio (TMAC) ou qualquer combinação dos mesmos. Em algumas modalidades, a concentração de TMAC é entre 20 e 70 mM, inclusive. Embora não se pretenda estar ligado a qualquer teoria particular, acredita-se que TMAC se liga ao DNA, estabiliza duplexes, aumenta a especificidade do iniciador e/ou equaliza as temperaturas de fusão de diferentes iniciadores. Em algumas modalidades, TMAC aumenta a uniformidade na quantidade de produtos amplificados para os diferentes alvos. Em algumas modalidades, a concentração de magnésio (como magnésio de cloreto de magnésio) é entre 1 e 8 mM.
[0632] O grande número de iniciadores usados para PCR multiplex de um grande número de alvos pode quelar uma grande parte do magnésio (2 fosfatos nos iniciadores quelam 1 magnésio). Por exemplo, se forem usados iniciadores suficientes, de modo que a concentração de fosfato dos iniciadores seja - 9 mM, então, os iniciadores podem reduzir a concentração efetiva de magnésio em ~ 4,5 mM. Em algumas modalidades, o EDTA é usado para diminuir a quantidade de magnésio disponível como um cofator para a polimerase, uma vez que altas concentrações de magnésio podem resultar em erros de PCR, como a amplificação de locais não alvo. Em algumas modalidades, a concentração de EDTA reduz a quantidade de magnésio disponível para entre 1 e 5 mM (tal como entre 3 e 5 mM).
[0633] Em algumas modalidades, o pH está entre 7,5 e 8,5, tal como entre 7,5 e 8, 8 e 8,3 ou 8,3 e 8,5, inclusive. Em algumas modalidades, o Tris é usado, por exemplo, em uma concentração entre 10 e 100 mM, tal como entre 10 e 25 mM, 25 e 50 mM, 50 e 75 mM ou 25 e 75 mM, inclusive. Em algumas modalidades, qualquer uma dessas concentrações de Tris é usada a um pH entre 7,5 e 8,5. Em algumas modalidades, uma combinação de KCl e (NH4)2SO4 é usada, tal como entre 50 e 150 mM de KCl e entre 10 e 90 mM de (NH4)2SO4, inclusive. Em algumas modalidades, a concentração de Kcl é entre 0 e 30 mM, entre 50 e 100 mM ou entre 100 e 150 mM, inclusive. Em algumas modalidades, a concentração de (NH 4)2SO4 é entre 10 e 50 mM, 50 e 90 mM, 10 e 20 mM, 20 e 40 mM, 40 e 60 mM ou 60 e 80 mM de (NH4)2SO4, inclusive. Em algumas modalidades, a concentração de amônio [NH4+] está entre 0 e 160 mM, tal como entre 0 a 50, 50 a 100 ou 100 a 160 mM, inclusive. Em algumas modalidades, a soma da concentração de potássio e amônio ([K+] + [NH4+]) está entre 0 e 160 mM, tal como entre 0 a 25, 25 a 50, 50 a 150, 50 a 75, 75 a 100, 100 a 125 ou 125 a 160 mM, inclusive. Um tampão exemplificativo com [K+] + [NH4+] = 120 mM é 20 mM de KCl e 50 mM de (NH4)2SO4. Em algumas modalidades, o tampão inclui 25 a 75 mM de Tris, pH 7,2 a 8, 0 a 50 mM de KCl, 10 a 80 mM de sulfato de amônio e 3 a 6 mM de magnésio, inclusive. Em algumas modalidades, o tampão inclui Tris a 25 a 75 mM, pH 7 a 8,5, MgCl 2 a 3 a 6 mM, KCl a 10 a 50 mM e (NH 4)2SO4 a 20 a 80 mM, inclusive. Em algumas modalidades, são utilizadas 100 a 200 unidades/ml de polimerase. Em algumas modalidades, KCl a 100 mM, (NH4)2SO4 a 50 mM, MgCl2 a 3 mM, 7,5 nM de cada iniciador na biblioteca, TMAC a 50 mM e 7 ul de molde de DNA em um volume final de 20 ul a pH 8,1 é usado.
[0634] Em algumas modalidades, um agente de aglomeração é usado, como polietilenoglicol (PEG, como PEG 8.000) ou glicerol. Em algumas modalidades, a quantidade de PEG (tal como PEG 8.000) está entre 0,1 a 20%, tal como entre 0,5 a 15%, 1 a 10%, 2 a 8% ou 4 a 8%, inclusive. Em algumas modalidades, a quantidade de glicerol está entre 0,1 a 20%, tal como entre 0,5 a 15%, 1 a 10%, 2 a 8% ou 4 a 8%, inclusive. Em algumas modalidades, um agente de aglomeração permite que uma baixa concentração de polimerase e/ou um tempo de hibridização mais curto seja usado. Em algumas modalidades, um agente de aglomeração melhora a uniformidade da DOR e/ou reduz os abandonos (alelos não detectados).
[0635] Em algumas modalidades, uma polimerase com atividade de revisão, uma polimerase sem (ou com insignificante)
atividade de revisão ou uma mistura de uma polimerase com atividade de revisão e uma polimerase sem (ou com insignificante) atividade de revisão é usada.
Em algumas modalidades, é usada uma polimerase de inicialização a quente, uma polimerase de inicialização não quente ou uma mistura de uma polimerase de inicialização a quente e uma polimerase de inicialização não quente.
Em algumas modalidades, uma DNA polimerase HotStarTaq é usada (ver, por exemplo, nº de catálogo QIAGEN 203203). Em algumas modalidades, é usada a DNA polimerase AmpliTaq Gold®. Em algumas modalidades, é usada uma DNA polimerase PrimeSTAR GXL, uma polimerase de alta fidelidade que fornece amplificação de PCR eficiente quando há molde em excesso na mistura de reação e ao amplificar produtos longos (Takara Clontech, Mountain View, CA). Em algumas modalidades, DNA Polimerase KAPA Taq ou DNA polimerase KAPA Taq HotStart é utilizada; elas são baseadas na DNA polimerase Taq de tipo selvagem de subunidade única da bactéria termofílica Thermus aquaticus.
As DNA polimerases KAPA Taq e KAPA Taq HotStart têm atividades de polimerase de 5’ a 3' e atividades de exonuclease de 5’ a 3’, mas nenhuma atividade de exonuclease de 3' a 5’ (revisão) (ver, por exemplo, nº de catálogo KAPA BIOSYSTEMS BK1000). Em algumas modalidades, é usada DNA polimerase Pfu; é uma DNA polimerase altamente termoestável do archaeum hipertermofílico Pyrococcus furiosus.
A enzima catalisa a polimerização dependente de molde de nucleotídeos em DNA duplex na direção 5'→ 3'. A DNA polimerase Pfu também exibe atividade de exonuclease 3'→ 5' (revisão) que permite à polimerase corrigir erros de incorporação de nucleotídeos.
Não tem atividade de exonuclease 5'→ 3' (ver, por exemplo, o nº de catálogo Thermo Scientific EP0501). Em algumas modalidades, Klentaq1 é usado; é um fragmento de Klenow análogo da DNA polimerase Taq, não tem atividade de exonuclease ou endonuclease (ver, por exemplo, DNA POLYMERASE TECHNOLOGY, Inc, St.
Louis, Missouri, nº de catálogo 100). Em algumas modalidades, a polimerase é uma DNA polimerase PHUSION, como a DNA polimerase de alta fidelidade PHUSION (M0530S,
New England BioLabs, Inc.) ou DNA polimerase PHUSION Hot Start Flex (M0535S, New England BioLabs, Inc.). Em algumas modalidades, a polimerase é uma DNA Polimerase Q5®, tal como DNA polimerase de alta fidelidade Q5® (M0491S, New England BioLabs, Inc.) ou DNA polimerase de alta fidelidade de inicialização a quente Q5® (M0493S, New England BioLabs, Inc.). Em algumas modalidades, a polimerase é uma DNA Polimerase T4 (M0203S, New England BioLabs, Inc.).
[0636] Em algumas modalidades, entre 5 e 600 unidades/ml (unidades por 1 ml de volume de reação) de polimerase são usadas, como entre 5 a 100, 100 a 200, 200 a 300, 300 a 400, 400 a 500 ou 500 a 600 unidades/ml, inclusive.
[0637] Métodos de PCR. Em algumas modalidades, a PCR de inicialização a quente é usada para reduzir ou prevenir a polimerização antes da termociclagem por PCR. Os métodos de PCR de início a quente exemplificativos incluem a inibição inicial da DNA polimerase ou a separação física da reação dos componentes da reação até que a mistura da reação atinja as temperaturas mais elevadas. Em algumas modalidades, a liberação lenta de magnésio é usada. A DNA polimerase exige íons de magnésio para sua atividade, então, o magnésio é quimicamente separado da reação pela ligação a um composto químico e é liberado na solução apenas em alta temperatura. Em algumas modalidades, a ligação não covalente de um inibidor é usada. Neste método, um peptídeo, anticorpo ou aptâmero são ligados não covalentemente à enzima em baixa temperatura e inibem sua atividade. Após a incubação em temperatura elevada, o inibidor é liberado e a reação começa. Em algumas modalidades, uma Taq polimerase sensível ao frio é usada, como uma DNA polimerase modificada com quase nenhuma atividade em baixa temperatura. Em algumas modalidades, a modificação química é usada. Neste método, uma molécula é covalentemente ligada à cadeia lateral de um aminoácido no sítio ativo da DNA polimerase. A molécula é liberada da enzima por incubação da mistura de reação em temperatura elevada. Assim que a molécula é liberada, a enzima é ativada.
[0638] Em algumas modalidades, a quantidade para moldar os ácidos nucleicos (como uma amostra de RNA ou DNA) está entre 20 e 5.000 ng, como entre 20 a 200, 200 a 400, 400 a 600, 600 a 1.000; 1.000 a
1.500; ou 2.000 a 3.000 ng, inclusive.
[0639] Em algumas modalidades, um Kit de PCR multiplex QIAGEN é usado (nº de catálogo QIAGEN 206143). Para reações de PCR multiplex de 100 x 50 μl, o kit inclui 2x mistura-mestre de PCR multiplex QIAGEN (fornecendo uma concentração final de 3 mM de MgCl2, 3 x 0,85 ml), 5x Q-Solution (1 x 2,0 ml) e Água livre de RNase (2 x 1,7 ml). A mistura-mestre de PCR multiplex QIAGEN (MM) contém uma combinação de KCl e (NH 4)2SO4, bem como o aditivo de PCR, Factor MP, que aumenta a concentração local de iniciadores no modelo. O Factor MP estabiliza os iniciadores especificamente ligados, permitindo a extensão eficiente do iniciador pela DNA polimerase HotStarTaq. A DNA polimerase HotStarTaq é uma forma modificada da DNA polimerase Taq e não tem atividade de polimerase em temperatura ambiente. Em algumas modalidades, DNA polimerase HotStarTaq é ativada por uma incubação de 15 minutos a 95 ºC, que pode ser incorporada em qualquer programa de termociclador existente.
[0640] Em algumas modalidades, é usada a concentração final de 1x MM QIAGEN (a concentração recomendada), 7,5 nM de cada iniciador na biblioteca, TMAC a 50 mM e 7 ul de molde de DNA em um volume final de 20 ul. Em algumas modalidades, as condições de termociclagem de PCR incluem 95 ºC por 10 minutos (inicialização a quente); 20 ciclos de 96 ºC por 30 segundos; 65 ºC por 15 minutos; e 72 ºC por 30 segundos; seguido de 72 ºC por 2 minutos (extensão final); e, então, uma retenção de 4 ºC.
[0641] Em algumas modalidades, é usada concentração final de 2x MM QIAGEN (duas vezes a concentração recomendada), 2 nM de cada iniciador na biblioteca, 70 mM de TMAC e 7 ul de modelo de DNA em um volume total de 20 ul. Em algumas modalidades, até 4 mM de EDTA também está incluído. Em algumas modalidades, as condições de termociclagem de PCR incluem 95 ºC por 10 minutos (inicialização a quente); 25 ciclos de 96 ºC por 30 segundos; 65 ºC por 20, 25, 30, 45, 60, 120 ou 180 minutos; e opcionalmente 72 ºC por 30 segundos; seguido de 72 ºC por 2 minutos (extensão final); e, então, uma retenção de 4 ºC.
[0642] Outro conjunto exemplificativo de condições inclui uma abordagem de PCR semianinhada. A primeira reação de PCR usa 20 µl de um volume de reação com concentração final de 2x QIAGEN MM, 1,875 nM de cada iniciador na biblioteca (iniciadores exteriores diretos e reversos) e modelo de DNA. Os parâmetros de termociclagem incluem 95 ºC por 10 minutos; 25 ciclos de 96 ºC por 30 segundos; 65 ºC por 1 minuto, 58 ºC por 6 minutos; 60 ºC por 8 minutos, 65 ºC por 4 minutos e 72 ºC por 30 segundos e, então, 72 ºC por 2 minutos e, então, uma retenção de 4 ºC. Em seguida, 2 µl do produto resultante, diluído a 1:200, é usado como entrada em uma segunda reação de PCR. Esta reação usa um volume de reação de 10 ul com concentração final de 1x QIAGEN MM, 20 nM de cada iniciador interior direto e 1 uM de etiqueta de iniciador reverso. Os parâmetros de termociclagem incluem 95 ºC por 10 minutos; 15 ciclos de 95 ºC por 30 segundos; 65 ºC por 1 minuto; e 60 ºC por 5 minutos, 65 ºC por 5 minutos; e 72 ºC por 30 segundos; e, então, 72 ºC por 2 minutos e, então, uma retenção de 4 ºC. A temperatura de hibridização pode ser opcionalmente mais alta do que as temperaturas de fusão de alguns ou todos os iniciadores, como aqui discutido (ver Pedido de Patente nº U.S. 14/918.544, depositado em 20 de outubro de 2015, que é aqui incorporado por referência em sua totalidade).
[0643] A temperatura de fusão (Tm) é a temperatura na qual metade (50%) de um duplex de DNA de um oligonucleotídeo (como um iniciador) e seu complemento perfeito se dissocia e se torna DNA de fita simples. A temperatura de hibridização (TA) é a uma temperatura em que se executa o protocolo de PCR. Para os métodos anteriores, é geralmente de 5 º
C abaixo da menor Tm dos iniciadores utilizados, portanto, perto de todos os possíveis duplexes são formados (de tal modo que, essencialmente, todas as moléculas de iniciadores se ligam ao ácido nucleico de modelo). Embora isso seja altamente eficiente, em temperaturas mais baixas, há mais reações inespecíficas propensas a ocorrer. Uma consequência de ter uma T A muito baixa é que os iniciadores podem hibridizar com sequências diferentes do alvo verdadeiro, pois incompatibilidades internas de base única ou hibridização parcial podem ser toleradas. Em algumas modalidades das presentes invenções, a TA é maior do que a Tm, em que em um determinado momento apenas uma pequena fração dos alvos tem um iniciador hibridizado (tal como apenas ~ 1 a 5%). Se estes forem estendidos, eles são removidos dos iniciadores de equilíbrio de hibridização e dissociação e alvo (conforme a extensão aumenta Tm rapidamente acima de 70 ºC), e um novo ~ 1 a 5% dos alvos têm iniciadores. Assim, dando à reação um longo tempo para hibridização, pode-se obter ~ 100% dos alvos copiados por ciclo.
[0644] Em várias modalidades, a temperatura de hibridização está entre 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 ºC e 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 ou 15 ºC na extremidade superior da faixa, maior do que a temperatura de fusão (tal como a Tm medida empiricamente ou calculada) de pelo menos 25, 50, 60, 70, 75, 80, 90, 95 100% dos iniciadores não idênticos. Em várias modalidades, a temperatura de hibridização está entre 1 e 15 ºC (tal como entre 1 a 10, 1 a 5, 1 a 3, 3 a 5, 5 a 10, 5 a 8, 8 a 10, 10 a 12 ou 12 a 15º C, inclusive) maior do que a temperatura de fusão (tal como a T m medida empiricamente ou calculada) de pelo menos 25; 50; 75; 100; 300; 500; 750;
1.000; 2.000; 5.000; 7.500; 10.000; 15.000; 19.000; 20.000; 25.000; 27.000;
28.000; 30.000; 40.000; 50.000; 75.000; 100.000; ou todos os iniciadores não idênticos. Em várias modalidades, a temperatura de hibridização está entre 1 e 15 ºC (tal como entre 1 a 10, 1 a 5, 1 a 3, 3 a 5, 3 a 8, 5 a 10, 5 a 8, 8 a 10, 10 a 12 ou 12 a 15 ºC, inclusive) maior do que a temperatura de fusão (tal como a Tm medida empiricamente ou calculada) de pelo menos 25%, 50%, 60%, 70%,
75%, 80%, 90%, 95% ou todos os iniciadores não idênticos, e a duração da etapa de hibridização (por ciclo de PCR) está entre 5 e 180 minutos, como 15 e 120 minutos, 15 e 60 minutos, 15 e 45 minutos ou 20 e 60 minutos, inclusive.
[0645] PCR multiplex exemplificativa. Em várias modalidades, longos tempos de hibridização (como aqui discutido e exemplificado no Exemplo 12) e/ou baixas concentrações de iniciador são usados. De fato, em certas modalidades, são utilizadas concentrações e/ou condições de iniciador limitantes. Em várias modalidades, o comprimento da etapa de hibridização está entre 15, 20, 25, 30, 35, 40, 45 ou 60 minutos na extremidade inferior da faixa e 20, 25, 30, 35, 40, 45, 60, 120 ou 180 minutos na extremidade superior da faixa. Em várias modalidades, a duração da etapa de hibridização (por ciclo de PCR) é entre 30 e 180 minutos. Por exemplo, a etapa de hibridização pode ser entre 30 e 60 minutos e a concentração de cada iniciador pode ser inferior a 20, 15, 10 ou 5 nM. Em várias modalidades, a concentração está entre 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 ou 25 nM na extremidade inferior da faixa e 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 e 50 na faixa superior da faixa.
[0646] Em alto nível de multiplexação, a solução pode se tornar viscosa devido à grande quantidade de iniciadores na solução. Se a solução for muito viscosa, pode-se reduzir a concentração do iniciador para uma quantidade que ainda seja suficiente para que os iniciadores se liguem ao modelo de DNA. Em várias modalidades, entre 1.000 e 100.000 diferentes iniciadores são usados e a concentração de cada iniciador é inferior a 20 nM, tal como inferior a 10 nM ou entre 1 e 10 nM, inclusive.
SEÇÃO EXPERIMENTAL
[0647] As modalidades aqui divulgadas são descritas nos seguintes Exemplos, que são apresentados para auxiliar na compreensão da divulgação e não devem ser interpretadas para limitar, de forma alguma, o escopo da divulgação conforme definido nas reivindicações posteriores. Os exemplos a seguir são apresentados de modo a fornecer às pessoas de habilidade comum na técnica uma divulgação e descrição completas de como usar as modalidades descritas, e não se destinam a limitar o escopo da divulgação nem se destinam a representar que os experimentos abaixo sejam todos ou os únicos experimentos realizados. Houve tentativas de garantir precisão em relação aos números usados (por exemplo, quantidades, temperatura etc.), porém, alguns erros e desvios experimentais devem ser considerados. Exceto se indicado de outro modo, partes são partes em volume, e a temperatura está em graus centígrados. Deve ser entendido que variações nos métodos descritos podem ser feitas sem alterar os aspectos fundamentais que os experimentos pretendem ilustrar. EXEMPLO 1
[0648] A análise retrospectiva de amostras de sangue de receptores de transplante renal (292 amostras de plasma de 187 pacientes exclusivos, com 8 amostras excluídas) foi realizada depois que os pacientes foram avaliados quanto à condição do enxerto por biópsia. As biópsias foram classificadas pela classificação de Banff para rejeição aguda mediada por células T e anticorpos (AR) ou não AR (limítrofe, estável ou outra lesão). As amostras analisadas por biópsia incluíram 52 amostras em rejeição aguda (AR) e 240 amostras em rejeição não aguda (não AR), incluindo rejeição limítrofe, outras lesões ou estabilidade.
[0649] O DNA livre circulante de 2 ml de plasma de cada amostra foi extraído pelo kit de cfDNA da Qiagen. A quantidade de cfDNA foi então quantificada, usando o LapChip. A preparação da biblioteca foi realizada usando o kit Natera Panorama Library Prep usando o protocolo padrão, exceto que a biblioteca foi amplificada por 18 ciclos de PCR (em oposição aos 9 ciclos padrão). A biblioteca amplificada foi, então, purificada usando microesferas Ampure (Agencourt). O produto da biblioteca amplificado foi, então, quantificado novamente usando LabChip e uma etapa de controle de qualidade foi realizada. Isso foi seguido pelo Panorama V2 OneSTAR, diluição e BC-PCR.
[0650] As amostras foram então dispostas em pool para sequenciamento, purificação (Kit Qiagen), quantificação (Qubit) e controle de qualidade (Bioanalyzer).
[0651] A porcentagem de DNA livre de células derivado de doador no plasma de receptor de transplante foi determinada usando PCR massivamente multiplexada, que teve como alvo 13.392 polimorfismos de nucleotídeo único (SNPs), seguida de sequenciamento de NGS em uma máquina HiSeq2500 (Illumina) por 50 ciclos (28 a 29 amostras/execução = 10 a 11 M de leituras/amostra).
[0652] Os níveis de dd-cfDNA foram, então, correlacionados com a rejeição e o estado de lesão do transplante e demonstraram alta capacidade de detecção de rejeição ao transplante renal. Especificamente, verificou-se que o dd-cfDNA em um nível acima de 1% (do total de DNA livre circulante) serve como um limite adequado para classificar um transplante de rim como passando por rejeição aguda (AR). Consultar a Figura 2. Para transplantes que não sofreram rejeição aguda, cada uma das categorias dos transplantes sendo estável, rejeitada no limite ou sofrendo outra lesão estavam sozinhas abaixo do nível de limite de dd-cfDNA de 1%. Consultar a Figura 3.
[0653] Além disso, ao classificar as amostras em que o dd-cfDNA era maior do que 1%, verificou-se que menos do que 1 em 20 eram estáveis.
Grupo Estável Rejeição Outra Rejeição Limítrofe Lesão Aguda > 1% de dd-cfDNA, n (%) 5 (4,4) 26 (23,0) 34 (30,1) 48 (42,5)
[0654] Nas 52 amostras submetidas à rejeição aguda, 19 foram classificadas por biópsia como submetidas à rejeição mediada por anticorpos (ABMR), 32 foram classificadas como submetidas à rejeição mediada por células T (TCMR) e 1 amostra foi classificada como submetida a ambos os tipos de rejeição. Verificou-se que a fração de dd-cfDNA não diferiu significativamente entre as coortes ABMR e TCMR ou entre as coortes ABMR e TCMR limítrofes. Consultar a Figura 4.
[0655] Além disso, quando os dias desde o transplante foram comparados com o nível percentual de dd-cfDNA e o estado de rejeição de transplantes renais, verificou-se que o nível de limite de dd- cfDNA de 1% serviu como um biomarcador clinicamente relevante imediatamente após a cirurgia. Consultar a Figura 5.
[0656] O valor também foi encontrado em medições repetidas em pacientes individuais, já que a mudança de um transplante estável para um transplante com lesão pôde ser monitorada ao longo do tempo. Consultar a Figura 6.
[0657] Quando as métricas de desempenho do presente estudo foram comparadas com um estudo anterior de Bloom, RD et al., Cell-Free DNA and Active Rejection in Kidney Allografts, J. Am. Soc. Nephrol., 2017; 287(7): 2.221 a 2.232, verificou-se que os presentes métodos resultaram em sensibilidade e especificidade significativamente maiores.
Estudo atual (292 Bloom et at. (107 amostras) amostras) Métrica de desempenho Sensibilidade 92% (n = 240) 59% (n = 27) Especificidade 73% (n = 240) 85% (n = 80) AUC 0,90 0,74 Presumindo 25% de prevalência NPV 97% 84% PPV 53% 61%
[0658] Como tal, o ensaio aqui divulgado oferece certas vantagens técnicas. Por exemplo, o ensaio aqui divulgado compreendeu o isolamento e a preparação avançados de cfDNA, com seleção de tamanho para eliminar o ruído de fundo e é capaz de filtrar erros de PCR e NGS por meio de modelagem de erro avançada. Além disso, o presente ensaio usou mais SNPS (13.392 versus 266 divulgado em Bloom et al.) com seleções de SNP avançadas. EXEMPLO 2. OTIMIZANDO A DETECÇÃO DE LESÃO
DE TRANSPLANTE RENAL POR AVALIAÇÃO DE DNA LIVRE DE CÉLULAS DERIVADO DE DOADOR POR PCR MASSIVAMENTE MULTIPLEX. INTRODUÇÃO
[0659] A medicina de precisão e a adaptação personalizada de regimes de fármacos imunossupressores podem melhorar o estado atual do gerenciamento de transplante de órgãos. Lesões de transplante são frequentemente detectadas tardiamente, uma vez que é melhor evitar biópsias invasivas, sempre que possível, para o bem da experiência do paciente. Embora os avanços em fármacos imunossupressores, métodos de obtenção de órgãos e tipagem de antígeno leucocitário humano tenham reduzido o número de episódios de rejeição aguda confirmados por biópsia e clínica, a rejeição aguda subclínica de enxertos renais continua sendo um risco significativo. O gerenciamento do transplante renal é particularmente desafiador devido à redundância do ensaio de creatinina sérica, que, além da detecção tardia das lesões do transplante, torna a dosagem e o ajuste da imunossupressão longe de personalizados. Portanto, a detecção rápida e não invasiva e a previsão de lesão/rejeição do aloenxerto são promissoras para uma melhora significativa do gerenciamento em pacientes de transplante renal.
[0660] O diagnóstico de rejeição aguda ao transplante renal geralmente depende de um aumento nos níveis de creatinina sérica ou de seu derivado algorítmico, eGFR, que indica funcionamento de filtração renal alterada. Uma vez que existem muitas causas para o desvio da linha de base na filtração renal alterada nesses pacientes, a biópsia é necessária para o diagnóstico definitivo. Os métodos de estimativa da rejeição renal em receptores de aloenxerto com base em CR ou eGFR carecem de precisão suficiente. No entanto, as biópsias são invasivas e podem ser procedimentos caros, o que limita seu uso na prática clínica. Além disso, os resultados da biópsia costumam ser prejudicados pela variância do leitor especialista e podem levar a um diagnóstico tardio de rejeição aguda, após o qual já ocorreu dano irreversível ao órgão. Portanto, existe uma necessidade atual não atendida de uma abordagem rápida, precisa e não invasiva para detectar rejeição e/ou lesão de aloenxerto - uma que possa exigir a integração das avaliações morfológicas padrão "ouro" atuais com ferramentas de diagnóstico molecular modernas.
[0661] O DNA livre de células derivado de doador (dd-cfDNA) detectado no sangue de receptores de transplante foi relatado como um marcador não invasivo para diagnosticar lesão/rejeição do aloenxerto e promete produzir resultados mais rápidos e quantitativos em comparação com as opções de tratamento atuais. Recentemente, foi demonstrado que os níveis plasmáticos de dd-cfDNA podem discriminar o estado de rejeição ativa da função de órgão estável em receptores de transplante renal, usando um corte de 1%. Anteriormente foi validada a aplicação clínica de um ensaio livre de células com base em polimorfismo de nucleotídeo único (SNP) alvejado que tem como alvo mais de 10.000 locais como uma ferramenta de triagem bem- sucedida para a detecção de anormalidades cromossômicas fetais e foi mostrado aqui que uma abordagem semelhante que tem como alvo 13.392 SNPs pode ser usada para avaliar diferenças na carga de cfDNA do doador em diferentes lesões de rejeição ao transplante ao longo do tempo. Este estudo usa uma metodologia inovadora de mmPCR-NGS baseada em SNP para medir dd-cfDNA em receptores de transplante renal para a detecção de rejeição/lesão de aloenxerto sem conhecimento prévio dos genótipos do doador.
MATERIAIS E MÉTODOS PROJETO DE ESTUDO
[0662] Este estudo foi uma análise retrospectiva de amostras de sangue de receptores de transplante de rim que passaram por cirurgias de transplante no Centro Médico da Universidade da Califórnia - São Francisco (USCF). O estudo foi aprovado pelo conselho de revisão institucional do Centro Médico de UCSF. Todos os pacientes forneceram consentimento informado por escrito para participar da pesquisa, em total adesão à Declaração de Helsinque. As atividades clínicas e de pesquisa relatadas são consistentes com os Princípios da Declaração de Istambul, conforme descrito na Declaração de Istambul sobre Tráfico de Órgãos e Turismo de Transplantes.
POPULAÇÃO DE ESTUDO E AMOSTRAS
[0663] Amostras de sangue foram coletadas de adultos do sexo masculino ou feminino ou adultos jovens receptores de transplantes renais em vários pontos no tempo após a cirurgia de transplante. A seleção das amostras do estudo foi baseada em (a) se há amostra de plasma adequada disponível, (b) se a amostra de sangue está associada a informações de biópsia que poderiam ser usadas na análise de dados. Os pacientes receberam um rim de doadores vivos relacionados ou não, ou de doadores falecidos não relacionados. As amostras de plasma foram obtidas de um biorrepositório existente, das quais 53% foram comparadas com uma biópsia coletada no momento da coleta de sangue. Os pacientes sem uma biópsia correspondente foram classificados como STA; todos os pacientes não STA foram compatibilizados por biópsia.
AMOSTRAS DE BIÓPSIA
[0664] Todas as biópsias renais foram analisadas de forma cega por um patologista da UCSF e foram classificadas pela classificação de Banff para rejeição aguda (AR); colorações C4d intraenxerto foram realizadas para avaliar a rejeição humoral aguda. A “lesão” do transplante foi definida como um aumento > 20% na creatinina sérica de seu valor de linha de base de estado estável anterior e uma biópsia associada que foi classificada como AR, BL ou OI (por exemplo, toxicidade por fármacos, infecção viral). AR foi definida, no mínimo, pelos seguintes critérios: 1) TCMR consistindo em uma pontuação de tubulite (t) > 2 acompanhada por uma pontuação de inflamação intersticial (i) > 2 ou pontuação de alterações vasculares (v) > 0; 2) ABMR C4d positivo consistindo em anticorpos específicos do doador (DSA) positivos com uma pontuação de glomerulite (g) > 0 / ou pontuação de capilarite peritubular (ptc) > 0 ou v > 0 com necrose tubular aguda/micro angiopatia trombótica (ATN/TMA) inexplicadas com C4d = 2; ou 3) ABMR C4d negativo consistindo em DSA positivo com ATN/TMA inexplicadas com g + ptc ≥ 2 e C4d é 0 ou 1. A alteração limítrofe (BL) foi definida por t1 + i0, ou t1 + i1, ou t2 + i0 sem causa explicada (por exemplo, nefropatia associada a poliomavírus [P VAN]/causa infecciosa/ATN). Outros critérios usados para alterações de BL foram g > 0 e/ou ptc > 0, ou v > 0 sem DSA, ou C4d ou DSA positivo, ou C4d positivo sem pontuações g ou ptc diferentes de zero. Aloenxertos normais (STA) foram definidos por uma ausência de patologia de lesão significativa, conforme definido pelos esquemas de Banff. As amostras foram estratificadas em grupos AR ou não AR (BL, STA ou OI) para análises. MEDIÇÃO DE dd-cfDNA EM AMOSTRAS DE SANGUE
[0665] O DNA livre de células foi extraído das amostras de plasma usando o kit de ácido nucleico circulante QIAamp (Qiagen) e quantificado no kit LabChip NGS 5k (Perkin Elmer) seguindo as instruções do fabricante. O cfDNA extraído foi usado como entrada na preparação da biblioteca usando o kit Natera Library Prep, com uma modificação de 18 ciclos de amplificação da biblioteca para estabilizar as bibliotecas. As bibliotecas purificadas foram quantificadas usando LabChip NGS 5k. O enriquecimento do alvo foi realizado usando PCR multiplexado em massa (mmPCR). Isso foi realizado usando uma versão modificada de um método descrito anteriormente, com 13.392 polimorfismos de nucleotídeo único (SNPs) alvejados. Os amplicons foram, então, sequenciados em uma execução rápida de Illumina HiSeq 2500, 50 ciclos de extremidade única, com 10 a 11 milhões de leituras por amostra. ANÁLISES ESTATÍSTICAS DE dd-cfDNA, CREATININA
E eGFR
[0666] Em cada amostra, os níveis de dd-cfDNA foram medidos e correlacionados com o estado de rejeição; os resultados das análises de dd-cfDNA foram comparados com os níveis de creatinina e eGFR. Onde aplicável, todos os testes são bilaterais. A significância foi sempre definida em P<0,05. Como a distribuição do nível de dd-cfDNA encontrada em pacientes foi gravemente distorcida entre os grupos de interesse, esses dados foram analisados usando um teste de soma de postos de Kruskal-Wallis seguido por testes de comparação múltipla de Dunn com correção de Holm. A eGFR (creatinina em mg/dl) foi calculada conforme descrito anteriormente. Resumidamente, eGFR = 186 * Creatinina sérica -1,154 * Idade- 0,203 * [1,210 se negro] * [0,742 se feminino].
[0667] Para avaliar o desempenho do nível de dd- cfDNA, pontuações de creatinina e eGFR (ml/min/1,73m2) como marcadores de rejeição, as amostras foram separadas em um grupo AR e um grupo não AR (BL + STA + OI). Usando essa categorização, a sensibilidade, especificidade, PPV e NPV de cada marcador foram determinados usando os seguintes cortes de classificação de AR: >1% para dd-cfDNA, > 1,8 mg/dl para creatinina e <40,0 para eGFR. AUC da curva de característica de operação do receptor (ROC) - uma medida adicional de discriminação entre AR e não AR - também foi calculada para cada marcador. Os intervalos de confiança para sensibilidade e especificidade foram calculados usando testes binomiais exatos (Clopper-Pearson). Os intervalos de confiança para PPV e NPV foram calculados com uma aproximação normal. O intervalo de confiança para AUC foi calculado usando o método DeLong.
[0668] As subanálises avaliaram os níveis de dd- cfDNA pela pontuação de Banff para características histológicas individuais (glomerulite, glomerulopatia do aloenxerto, aumento da matriz mesangial, fibrose intersticial, atrofia tubular, inflamação intersticial, inflamação intersticial total, tubulite, tubulite atrófica, capilarite peritubular, hialinose arteriolar,
hialinose arteriolar alternativa, espessamento vascular da íntima, arterite da íntima, coloração de c4d). Pontuações elevadas de glomerulite, inflamação intersticial, inflamação intersticial total, tubulite, capilarite peritubular e coloração de c4d se correlacionam com níveis elevados de dd-cfDNA usando um teste de soma de postos de Kruskal-Wallis seguido por testes de comparação múltipla de Dunn. As diferenças nos níveis de dd-cfDNA por tipo de doador (relacionado vivo, não relacionado vivo e não relacionado falecido) também foram avaliadas. A significância foi determinada usando o teste de soma de postos de Kruskal-Wallis, conforme descito acima. A intervariabilidade e intravariabilidade no dd-cfDNA ao longo do tempo foram avaliadas usando um modelo de efeitos mistos com uma transformação logarítmica no dd-cfDNA. Os intervalos de confiança de 95% para os desvios padrão intrapaciente e interpaciente foram calculados usando um método de perfil de verossimilhança.
[0669] Todas as análises foram feitas usando R 3.3.2 usando os pacotes FSA (para testes de Dunn), lme4 (para modelagem de efeito misto) e pROC (para cálculos de AUC).
RESULTADOS PACIENTES E AMOSTRAS DE SANGUE
[0670] Um total de 300 amostras de plasma foram coletadas de 193 receptores exclusivos de transplante renal; destas, 8 amostras de 6 pacientes não puderam ser sequenciadas e foram excluídas das análises. Entre as 292 amostras analisadas, 52 foram coletadas de pacientes com rejeição aguda comprovada por biópsia (AR), 82 eram de pacientes com rejeição limítrofe comprovada por biópsia (BL), 73 eram de pacientes com aloenxertos normais e estáveis (STA) e 85 eram de pacientes com biópsia indicando outra lesão (OI) (Figura 13). Como é desejável detectar a existência de AR em comparação com qualquer outra condição, não AR é definida como o grupo que inclui todos os espécimes que foram classificados como STA, BL ou OI. Um resumo das informações demográficas e das características da amostra é fornecido na Tabela A. Todas as amostras de patologia foram lidas na UCSF, verificadas na mesma instituição e foram classificadas por todos os observadores usando os critérios de Banff. dd-cfDNA NO PLASMA DE RECEPTORES DE
TRANSPLANTE RENAL
[0671] A quantidade de dd-cfDNA foi significativamente maior no plasma circulante do grupo AR (mediana = 2,76%) em comparação com o grupo não AR (mediana = 0,47%; P<0,0001) (Figura 14A). Além disso, o nível médio de dd-cfDNA foi significativamente maior no grupo AR em comparação com todos os 3 subgrupos individuais de não rejeição: Grupo BL (0,59%), grupo STA (0,19%) e OI (0,70%; todas as comparações, P<0,0001) (Tabela B). Os níveis de cfDNA derivados de doadores foram significativamente mais baixos no grupo STA do que nos grupos BL ou OI (P<0,0001). Não houve diferença significativa no nível de dd- cfDNA entre os grupos BL e OI (P = 0,496) (Tabela B). NÍVEIS DE CREATININA E eGFR
[0672] Em contraste com o dd-cfDNA, a avaliação dos níveis de creatinina não pareceu ter tanta capacidade discriminatória para diferenciar grupos AR e não AR (Figura 14B). O nível mediano de creatinina no grupo AR (1,4 mg/dl) foi significativamente maior do que o observado no grupo não AR (1,1 mg/dl; P = 0,0024). No entanto, ao contrário dos resultados do dd- cfDNA, não houve diferença nos níveis medianos de creatinina entre os grupos AR e BL (ambos 1,4 mg/dl; P = 0,8653) (Tabela B). Os níveis médios de creatinina foram significativamente menores no grupo 01 (1,1 mg/dl) versus grupo AR (1,4; P = 0,0078) e significativamente mais baixos no grupo STA (0,9 mg/dl) versus grupo BL (1,4 mg/dl; P<0,0001); o nível de creatinina foi numericamente menor no grupo STA em comparação com o grupo OI (1,1 mg/dl), embora a diferença não tenha sido estatisticamente significativa (P = 0,1887).
[0673] Para amostras com pontuações de eGFR disponíveis (AR, n = 52; não AR, n = 151 [BL, n = 79; OI, n = 65; STA, n = 7]) a eGFR mediana foi semelhante entre o grupo de AR (52,5) e o grupo não AR (54,7; P = 0,2379) (Figura 14C). Houve uma diferença significativa entre os níveis de eGFR no grupo AR versus o grupo STA (69,3; P = 0,0125), mas nenhuma diferença na pontuação de eGFR entre os grupos AR e BL (52,0 versus 51,8; P = 0,902) (Tabela B). Além disso, em comparação com o grupo STA, os níveis de eGFR foram significativamente maiores nos grupos BL (51,8; P = 0,0254) e OI (55,1; P = 0,0413).
ESTIMATIVAS DE DESEMPENHO PARA CAPACIDADE DISCRIMINATÓRIA DE TESTES
[0674] Com um corte > 1%, o método de mmPCR- NGS teve uma sensibilidade de 92,3% (intervalo de confiança [CI] de 95%, 81,5% a 97,9%) e especificidade de 72,9% (CI de 95%, 66,8% a 78,4%) para detecção de AR. Os valores de sensibilidade e especificidade são mostrados ao longo da faixa de cortes dd-cfDNA na Figura 15A. A area sob a curva (AUC) foi de 0,90 (95% de CI, 0,85 a 0,95). Com base em uma prevalência de rejeição de 25% em uma população de risco, o valor preditivo positivo (PPV) foi projetado para ser 53,2% (CI de 95%, 47,7% a 58,7%) e o valor preditivo negativo (NPV) foi projetado para ser 96,6% (CI de 95%, 69,8% a 100%).
[0675] A sensibilidade e a especificidade foram menores usando creatinina e eGFR como testes discriminatórios (Figuras 15B a 15C). Usando um corte de nível de creatinina de 1,8 mg/dl para AR, os valores de sensibilidade e especificidade foram 42,3% (CI de 95%, 28,7% a 56,8%) e 83,7% (78,3% a 88,1%), respectivamente, com uma AUC de 0,63 (0,54 a 0,71). Os valores projetados de PPV e NPV de creatinina foram 46,4% (35,7% a 57,0%) e 81,3% (50,5% a 100%), respectivamente. A sensibilidade para a análise de eGFR usando uma pontuação de corte de <40 foi de 38,8% (25,2% a 53,8%) e a especificidade foi de 78,8% (71,4% a 85,0%) com uma AUC de 0,56 (0,46 a 0,66).
[0676] Ao comparar AR para STA apenas, o ensaio de dd-cfDNA teve uma sensibilidade de 92,3% (intervalo de confiança de 95%
[CI], 81,5% a 97,9%) e especificidade de 93,2% (CI de 95%, 84,7% a 97,7%). Os valores de sensibilidade e especificidade são mostrados ao longo da faixa de cortes dd-cfDNA na Figura 16. A area sob a curva (AUC) foi de 0,951 (95% de CI, 0,91 a 1,0). dd-cfDNA > 1% POR ESTADO DE REJEIÇÃO
[0677] Das 292 amostras de pacientes, 113 (38,7%) apresentaram níveis de dd-cfDNA > 1%. Destas, menos de 1 em 20 eram STA (5 amostras [4,4%]); o restante foi AR (48 amostras [42,5%]), OI (34 amostras [30,1%]) ou BL (26 amostras [23,0%]). RELAÇÃO ENTRE dd-cfDNA E TIPO DE REJEIÇÃO
AGUDA
[0678] Dos 52 pacientes com AR comprovada por biópsia, 19 foram classificados como rejeição mediada por anticorpos (ABMR) e 32 foram classificados como rejeição mediada por células T (TCMR); 1 paciente teve uma combinação de ABMR e TCMR. Além disso, 18 pacientes tinham ABMR limítrofe (bAMBR) e 64 pacientes tinham TCMR limítrofe (bTCMR). A Figura 17 mostra a relação entre o nível de dd-cfDNA e o tipo de rejeição. O dd-cfDNA mediano não diferiu significativamente entre os grupos AMBR (3,1%) ou TCMR (2,4%; P = 0,520) ou entre os grupos bAMBR (0,64%) e bTCMR (0,58; P = 0,420). Diferenças significativas foram observadas entre ABMR e bABMR (P <0,001) e TCMR e bTCMR (P<0,001), em alinhamento com diferenças de AR versus BL observadas com dd-cfDNA. MODELAGEM DE dd-cfDNA COMO UMA FUNÇÃO DA
PONTUAÇÃO DE BANFF
[0679] A distribuição do nível de dd-cfDNA em diferentes pontuações de Banff foi avaliada para amostras com biópsia confirmada. De 15 características histológicas avaliadas, seis tiveram resultados significativos no nível de dd-cfDNA por pontuação: glomerulite (P = 0,0031), inflamação intersticial total (P = 0,0001), inflamação intersticial (P <0,0001), capilarite peritubular (P = 0,0001), tubulite (P = 0,0082) e coloração de c4d (P = 0,0049) (Figura 18). Para cada uma das seis características histológicas, os níveis de dd-cfDNA por estatísticas de pontuação e resumo para comparações de pontuação são mostrados nas Tabelas C e D, respectivamente. As pontuações de inflamação intersticial foram altamente significativas, em que o nível de dd-cfDNA no grupo 0 foi significativamente menor do que nos grupos 1, 2 e 3. (Figura 18). Em grupos com uma pontuação de 0, os níveis de dd-cfDNA de glomerulite e capilarite peritubular foram significativamente mais baixos do que aqueles encontrados em grupos com uma pontuação de 3 e 2, respectivamente (Figura 18; Tabela D). NÍVEIS DE dd-cfDNA POR TIPO DE DOADOR
[0680] Um teste de soma de postos de Kruskal- Wallis foi usado para avaliar a relação entre o nível de dd-cfDNA e o tipo de doador (relacionado vivo, não relacionado vivo e não relacionado falecido). Os pacientes foram agrupados de acordo com sua relação com doador e estado de rejeição (AR/não AR). Para pacientes com múltiplas amostras, foi obtido o dd-cfDNA médio. Olhando para cada grupo de estado de rejeição, não houve diferença significativa entre as medianas do nível de dd-cfDNA por tipo de doador no grupo AR (P = 0,677) ou não AR (P = 0,463; Figura 19). VARIABILIDADE dd-cfDNA AO LONGO DO TEMPO
[0681] Duas subanálises projetadas para avaliar a variabilidade natural no dd-cfDNA ao longo do tempo foram realizadas. A primeira foi uma análise em corte transversal de 60 amostras de plasma de 60 pacientes diferentes, coletadas imediatamente após a cirurgia (em 3 dias [“0 meses”]) ou em 1, 3, 6 ou 12 meses após a cirurgia. Entre esses pacientes de STA, os níveis de dd-cfDNA foram mais baixos no mês 0 do que nos pontos no tempo subsequentes; no entanto, para a maioria dessas amostras de STA, os níveis de dd-cfDNA foram <1% em todos os pontos no tempo (Figura 20A). Para pacientes com AR, BL ou OI, quase todos estavam acima do limite dd- cfDNA de 1% em todos os pontos no tempo avaliados. Para avaliar a variação normal intra-paciente na fração de doador, a segunda subanálise avaliou longitudinalmente 10 pacientes individuais em 4 pontos no tempo (variável para cada paciente). No geral, a lesão de órgão ocorreu em níveis de dd-cfDNA acima de 1% e os níveis de cfDNA em pacientes de STA e OI não flutuaram ao longo do tempo (Figura 20B).
[0682] Para se comparar a intervariabilidade e a intravariabilidade, um modelo linear misto foi construído para estabilizar a variância após a transformação logarítmica dos níveis de dd-cfDNA. Usando esta abordagem e ajustando para grupos de AR/não AR e tempo, um desvio padrão intraclasse de 0,25496 (CI de 95%, 0,1093 a 0,3481) e um desvio padrão interpaciente de 0,4296 (CI de 95%, 0,3751 a 0,4915) foi obtido. Isso resultou em um coeficiente de correlação intraclasse de 0,2523, indicando alta dissimilaridade entre os pacientes.
DISCUSSÃO
[0683] Neste estudo, a mediana do dd-cfDNA foi significativamente maior no grupo de AR (2,76%) em relação ao grupo não AR (0,47%; P<0,0001). A análise das estimativas de desempenho demonstrou que o método de mmPCR-NGS foi capaz de discriminar o estado de rejeição ativo do não ativo com uma AUC de 0,90 e alta sensibilidade (92,3%) e especificidade (72,9%) no corte de AR > 1% dd-cfDNA. Com base em uma prevalência de rejeição de 25%, o PPV e o NPV projetados foram de 96,6% e 53,2%, respectivamente. Em contraste, os níveis de creatinina sérica e eGFR foram geralmente menos discriminatórios, com sensibilidade de 42,3% e especificidade de 83,7%, e PPV e NPV projetados de 46,4% e 81,3%, respectivamente. Portanto, se as medições estáticas de creatinina sérica fossem usadas como o único ponto de decisão clínica, cerca de 1 em 5 pacientes não seria encaminhado para uma biópsia de indicação - isso é em comparação com o NPV projetado de dd-cfDNA, que sugere que apenas 3 a 4 em 100 pacientes não fariam uma biópsia de indicação onde poderia ser clinicamente necessário. Tomados em conjunto, o desempenho superior deste ensaio de dd-cfDNA baseado em SNP em relação ao padrão atual de atendimento para a avaliação do estado de rejeição do aloenxerto é uma promessa para permitir aos pacientes uma maior oportunidade de terapia oportuna no caso de lesão do aloenxerto.
[0684] Os níveis de dd-cfDNA também forneceram discriminação de AR de todos os três subgrupos não AR (STA, BL e OI); os níveis médios de dd-cfDNA foram significativamente maiores para amostras com AR comprovado por biópsia (2,8%) versus BL (0,6%), OI (0,7%) e STA (0,2%).
[0685] Em um estudo recente que amplificou centenas de SNPs-alvo em dd-cfDNA para detectar rejeição ativa em aloenxertos renais, esse método foi capaz de discriminar AR de não AR com uma AUC de 0,74 e sensibilidade de 59%, especificidade de 85%. Em comparação com esse estudo, o teste inovador dd-cfDNA descrito no presente estudo apresentou um valor de AUC superior (0,90) e também uma maior sensibilidade (92%). Por outro lado, a especificidade (73%) foi um pouco menor no presente estudo, indicando que pode ter havido mais falsos positivos neste estudo. Isto é suportado dado que a especificidade aumentou para 93,2% quando os grupos AR e STA foram comparados, o que sugere que os falsos positivos no grupo não AR foram provavelmente impulsionados pelos grupos BL e/ou OI.
[0686] Outro achado importante deste estudo foi que a fração dd-cfDNA não diferiu entre os grupos ABMR e TCMR, com níveis de dd-cfDNA de 3,1% e 2,4%, respectivamente. Esses resultados são interessantes, considerando que o estudo anterior encontrou níveis significativamente mais elevados de dd-cfDNA para rejeições baseadas em ABMR (2,9%) do que para rejeições baseadas em TCMR (<1,2%). Embora o ensaio usado nesse estudo também tenha medido dd-cfDNA, as metodologias entre os dois ensaios são de projeto diferente. Não está claro se aquele teste não conseguiu diferenciar AR de não AR nos casos de TCMR ou se o resultado foi devido ao menor tamanho da amostra daquele grupo naquele estudo (n =
11), visto que diferentes grupos de TCMR podem se comportar de forma diferente. Independentemente, no grupo TCMR maior avaliado neste estudo (n = 32), parece que os níveis de dd-cfDNA podem discriminar com precisão o AR do não AR em ambos os grupos ABMR e TCMR. Além disso, os níveis de dd- cfDNA foram de 0,6% em ambos os ABMR e TCMR limítrofes, sugerindo que o teste pode ser sensível o suficiente para discriminar casos limítrofes de casos mais graves em ambos os grupos.
[0687] Uma barreira para o uso clínico generalizado do dd-cfDNA como ferramenta de diagnóstico para monitorar o transplante de órgãos tem sido as limitações na medição do dd-cfDNA em certos casos, como quando o genótipo do doador é desconhecido ou quando o doador é um parente próximo. Dado o projeto do ensaio usado aqui, é possível quantificar o dd-cfDNA sem genotipagem prévia do receptor ou doador. Além disso, não há necessidade de um ajuste computacional com base na possibilidade de o doador ser parente do receptor. Neste estudo, a avaliação dos níveis de dd- cfDNA por tipo de doador revelou que, independentemente de tipo de doador (relacionado vivo, não relacionado vivo, não relacionado falecido), os níveis de dd-cfDNA foram semelhantes em todos os tipos de doador nas categorias AR e não AR.
[0688] Este estudo é uma análise retrospectiva de amostras arquivadas de um único centro. No entanto, a área geográfica central permite que todas as biópsias sejam realizadas por um único patologista, o que pode ter ajudado a minimizar a variabilidade na classificação das biópsias. Em geral, as amostras foram selecionadas com base na disponibilidade de informações de biópsia, o que levou à falta de informações de algumas amostras de pacientes e pode ter impactado as análises. Por exemplo, devido a informações demográficas limitadas para alguns pacientes, não foi possível calcular a eGFR para todas as amostras; isso levou a um número reduzido de amostras de STA no grupo não AR para este marcador, o que pode ter contribuído para a falta de diferença significativa observada entre os grupos AR e não AR. É importante ressaltar que todos os experimentadores foram mantidos cegos durante o processo de geração de dados. Finalmente, o projeto do estudo retrospectivo pode ter levado a diferenças nas características dos pacientes nos grupos de rejeição; embora o grupo STA tenha sido enriquecido com pacientes mais jovens em comparação com os outros grupos, isso não é surpreendente, pois os pacientes mais jovens são mais adequados imunologicamente para tolerar órgãos transplantados em comparação com pacientes mais velhos; além disso, as diferenças de idade provavelmente não afetaram a viabilidade dos objetivos do estudo.
[0689] Os pontos fortes deste estudo incluem a variedade de amostras de pacientes incluídas no grupo não AR, que compreendia não apenas amostras de STA, mas também amostras de BL e OI. Isso permitiu análises adicionais neste estudo, que descobriu que o dd-cfDNA era significativamente diferente no grupo AR em relação aos grupos BL e OI. Subanálises adicionais por tipo de AR (ABMR e TCMR), bem como por tipo de doador, demonstraram que os níveis de dd-cfDNA foram capazes de discriminar AR versus não AR em uma variedade de tipos de pacientes. Além disso, a metodologia de mmPCR baseada em SNP usada foi validada com mais de um milhão de amostras em determinações de cfDNA fetal; evidências indicam que é altamente sensível e específico para detectar frações de ácido nucleico raras ou menores em uma mistura de plasma in vivo. Finalmente, a inclusão de dados longitudinais permitiu uma avaliação única da variabilidade natural do dd-cfDNA em pacientes transplantados ao longo do tempo. Os dados de variabilidade interpaciente demonstraram que entre 0 e 12 meses após a cirurgia, a maioria dos pacientes com biópsias de STA tinha níveis de dd-cfDNA abaixo de 1%. Isso sugere que o teste de dd-cfDNA pode ser usado imediatamente após a cirurgia para diferenciar se um paciente está estável ou apresentando sinais de AR, BL ou OI. Os dados de variabilidade intrapaciente demonstraram que os resultados do ensaio são geralmente consistentes ao longo do tempo. Juntos, estes dados sugerem que este teste pode, não apenas oferecer monitoramento de rotina dos mesmos pacientes, mas também oferecer a uma variedade de pacientes um teste confiável para determinar o estado de rejeição a qualquer momento após a cirurgia.
[0690] Em conclusão, este estudo valida o uso de dd-cfDNA no sangue como um marcador preciso de lesão/rejeição renal. Esta tecnologia rápida, precisa e não invasiva pode oferecer detecção de lesão renal significativa em pacientes selecionados melhor do que o padrão atual de tratamento e, portanto, oferecer o potencial para melhor gerenciamento e sobrevivência de aloenxertos renais e função renal do receptor. TABELA A. DADOS DEMOGRÁFICOS E CARACTERÍSTICASa Característica de Fenótipo Rejeição Rejeição não aguda Aguda (52 Estável AR limítrofe Outra amostras) (81 (82 lesão (85 amostras)b amostras) amostras)c Idade de receptor, anos Média ± SD 42,94 ± 19,41 ± 46,51 ± 45,81 ± 15,39 11,42 14,20 20,85 Faixa 4 a 69 2 a 70 5 a 74 3 a 80 Homem/mulher/NA Homem 24 (46,2) 46 (56,8) 40 (48,8) 33 (38,8) Mulher 28 (53,8) 34 (42,0) 42 (51,2) 52 (61,2) Desconhecido 0 (0) 1 (1,2) 0 (0) 0 (0) Etnia Hispânico ou Latino 18 (34,5) 3 (3,7) 29 (35,4) 23 (27,1) Não Hispânico ou Latino 31 (59,6) 4 (4,9) 50 (61) 42 (49,4) Desconhecido 3 (3,7) 74 (91,4) 3 (3,7) 20 (23,5) Grupos de étnicos, nº (%) Branco ou Caucasiano 15 (28,8) 1 (1,2) 14 (17,1) 22 (25,9) Negro ou Afroamericano 6 (11,5) 1 (1,2) 15 ( 18,3) 7 (8,2)
Asiático ou das Ilhas do 8 (15,4) 1 (1,2) 18 (22) 4 (4,7) Pacífico Outro/Não relatado 23 (44,2) 78 (96,3) 35 (42,7) 52 (61,2) Peso do receptor, kg Média ± SD 82,0 ± 64,8 ± 78,6 ± 18,3 81,2 ± 19,9 11,2 18,9 Faixa 45 a 119 50 a 76 46 a 134 47 a 125 Desconhecido 10 75 9 23 DAS positivo, nº (%) Sim 18 (34,6) 0 (0) 19 (23,2) 4 (4,7) Não 18 (34,6) 1 (1,2) 53 (64,6) 20 (23,5) Não registrado 16 (30,8) 80 (98,8) 10 (12,2) 61 (71,8) Indicação para transplante renal, nº (%) Glomerulonefrite 1 (1,9) 4 (4,9) 2 (2,4) 3 (3,5) Glomeruloesclerose 6 (11,5) 4 (4,9) 10 12,2) 2 (12,2) segmentada focal Diabetes mielito 1 (1,9) 1 1,2) 16 (19,5) 22 (25,9) Nefropatia de membrana de 4 (7,7) 0 (0) 2 (2,4) 3 (3,5) base fina Doença do rim policístico 5 (9,6) 3 (3,7) 7 (8,5) 7 (8,2) Rim solitário 0 (0) 0 (0) 3 (3,7) 0 (0) Hipertensão 5 (9,6) 1 (1,2) 13 15,9) 5 (5,9) Nefropatia de IgA 7 (13,5) 0 (0) 8 (9,8) 0 (0) Nefrite lúpica 2 (3,8) 0 (0) 1 (1,2) 3 3,5) ANCA – vasculite 1 (1,9) 0 (0) 2 (2,4) 0 (0) Outra/Desconhecida 19 (38,5) 68 (84,0) 18 (22,0) 40 (47,1) Fonte de doador, nº (%) Relacionado vivo 2 (3,8) 2 (2,5) 9 (11) 6 (7,1) Não relacionado vivo 4 (7,7) 44 (54,3) 19 (23,2) 31 (36,5) Não relacionado falecido 46 (88,5) 35 (43,2) 54 (64,9) 48 (56,5) aCaracterísticas e informações demográficas são baseadas em todas as amostras; dados refletem múltiplas amostras para alguns pacientes. bDas 81 amostras ligadas a biópsia estável, 8 não puderam ser sequenciadas e foram excluídas da análise. cPacientes de outras lesões tinham outras causas de disfunção de enxerto: nefropatia de aloenxerto crônica (57 amostras), toxicidade de fármaco (18 amostras), nefrite de BK (4 amostras), necrose tubular aguda (3 amostras) e glomerulopatia de transplante (3 amostras). DAS, anticorpos específicos de doador; SD, desvio padrão.
TABELA B. ESTATÍSTICAS DE RESUMO PARA TESTES DE dd-cfDNA, CREATININA E eGFR Rejeição não aguda Parâmetro Rejeição aguda Estável Limítrofe Outra Lesão dd-cfDNA Número de amostras 52 73 82 85 Média (SD), % 3,08 (2,14) 0,43 (0,85) 0,83 (0,77) 1,05 (1,11) Mediana, (Faixa), % 2,76 (0,1 a 0,19 (0,0 a 0,59 (0,03 0,70 (0,03 a 12,6) 5,4) a 3,9) 6,8) Creatinina Número de amostras 52 72 82 85 Média (SD), mg/dl 1, 76 (1,11) 1,81 (2,66) 1,62 (0,98) 1,33 (1,06) Mediana, (Faixa), mg/dl 1,41 (0,1 a 0,91 (0,1 a 1,40 (0,3 a 1,10 (0,1 a 6,8) 14,1) 7,0) 7,8) eGFR Número de amostras 49 7 79 65 Média (SD), pontuação 50,5 (22,6) 16,52 53,1 (20,7) 54,4 (19,5) (23,3) Mediana, (Faixa), 51,99 (8 a 69,25 (47 a 51,82 (6 a 55,07 (7 a pontuação 100) 109) 109) 106) dd-cfDNA, DNA livre de células derivado de doador; taxa de filtração glomerular estimada TABELA C. NÍVEIS DE cfDNA DERIVADO DE DOADOR
EM SEIS CARACTERÍSTICAS HISTOLÓGICAS COM DIFERENÇAS
SIGNIFICATIVAS NO dd-cfDNA POR PONTUAÇÃO DE BANFF dd-cfDNA (%) dd-cfDNA Pontu Contag dd-cfDNA de Variável de Desvio mediano ação em média (%) Padrão (%) Glomerulite 0 177 1,048542373 1,602791733 0,415 Glomerulite 1 32 1,153 1,067370359 0,6345 Glomerulite 2 9 2,089888889 1,169621674 2,592 Glomerulite 3 7 3,719714286 2,630592057 3,666 Glomerulite N/A 67 1,217925373 1,097807678 0,703 Intersticial Inflamação 0 86 0,758093023 0,895235265 0,3495 Intersticial Inflamação 1 26 1,631115385 1,329326997 1,13 Intersticial Inflamação 2 16 1,6524375 0,794761681 1,7085 Intersticial Inflamação 10 3,6249 2,989179205 2,8375 Intersticial 3 Inflamação N/A 154 3,6249 2,989179205 2,83757 Intersticial Inflamação 0 67 0,752522388 0,965722172 0,32 Intersticial Total Inflamação 1 33 1,225666667 1,048161684 0,843 Intersticial Total Inflamação 2 24 1,4803333333 1,171649809 1,2485 Intersticial Total Inflamação 3 15 3,084 2,541016866 2,009 Intersticial Total Inflamação N/A 153 1,152169935 1,1596842599 0,544 Intersticial Total Tubulite 0 118 0,899567797 1,066300911 0,544 Tubulite 1 17 1,936117647 1,73272967 1,562 Tubulite 2 9 3,523111111 2,162920505 3,775 Tubulite 3 3 2,033666667 0,742930234 1,809
Tubulite N/A 145 1,186648276 1,635198975 0,544 Peritubular Capilarite 0 124 0,811048387 1,235469167 0,346 Peritubular Capilarite 1 78 1,499705128 1,841726957 0,954 Peritubular Capilarite 2 13 2,134153846 1,80764155 2,016 Peritubular Capilarite 3 7 2,865 2,936932093 1,809 Peritubular Capilarite N/A 70 1,194142857 1,068454149 0,703 Corante c4d 0 184 1,104027174 1,592462534 0,551 Corante c4d 1 12 2,905666667 2,066374442 2,9775 Corante c4d 2 7 0,554142857 0,540281849 0,204 Corante c4d 3 6 1,9865 1,587761538 1,56 Corante c4d N/A 83 1,4613253 1,138562549 0,637 TABELA D. CARACTERÍSTICAS HISTOLÓGICAS COM DIFERENÇAS SIGNIFICATIVAS EM DD-CFDNA, POR PONTUAÇÃO DE
BANFF Comparação Estatística Valor de Valor de de Z P não adj. P adj. Glomerulite 0 vs 1 - 1,52 0,1279 1,0000 Glomerulite 0 vs 2 - 2,69 0,0072 0,1740 Glomerulite 0 vs 3 - 3,59 0,0003 0,0107 Glomerulite 1 vs 2 - 1,64 0,1006 1,0000 Glomerulite 1 vs 3 - 2,61 0,0092 0,2062 Glomerulite 2 vs 3 - 0,93 0,3524 1,0000 Capilarite Peritubular 0 vs 1 - 3,02 0,0025 0,0686 Capilarite Peritubular 0 vs 2 - 4,15 0,0000 0,0011 Capilarite Peritubular 0 vs 3 - 1,52 0,1290 1,0000
Capilarite Peritubular 1 vs 2 - 1,99 0,0468 0,8894 Capilarite Peritubular 1 vs 3 - 0,56 0,5722 1,0000 Capilarite Peritubular 2 vs 3 0,42 0,6776 1,0000 Inflamação Intersticial 0 vs 1 - 3,41 0,0007 0,0198 Inflamação Intersticial 0 vs 2 - 3,91 0,0001 0,0031 Inflamação Intersticial 0 vs 3 - 3,64 0,0004 0,0123 Inflamação Intersticial 1 vs 2 - 0,91 0,3625 1,0000 Inflamação Intersticial a vs 3 - 1,09 0,2736 1,0000 Inflamação Intersticial 2 vs 3 - 0,29 0,7696 1,0000 Inflamação Intersticial Total 0 vs 1 - 2,87 0,0041 0,1019 Inflamação Intersticial Total 0 vs 2 - 3,14 0,0017 0,047 Inflamação Intersticial Total 0 vs 3 - 4,52 0,0000 0,0002 Inflamação Intersticial Total 1 vs 2 - 0,52 0,6053 1,0000 Inflamação Intersticial Total 1 vs 3 - 2,15 0,0312 0,6243 Inflamação Intersticial Total 2 vs 3 - 1,61 0,1084 1,0000 Tubulite 0 vs 1 - 3,00 0,0027 0,0698 Tubulite 0 vs 2 - 3,19 0,0014 0,0410 Tubulite 0 vs 3 - 1,44 0,1488 1,000 Tubulite 1 vs 2 - 2,61 0,0090 0,2062 Tubulite 1 vs 3 - 1,24 0,2150 1,0000 Tubulite 2 vs 3 - 0,12 0,9050 1,0000 Corante c4d 0 vs 1 - ,085 0,0001 0,0038 Corante c4d 0 vs 2 0,21 08299 1,0000 Corante c4d 0 vs 3 - 1,95 0,0517 0,9309 Corante c4d 1 vs 2 2,27 0,0233 0,4883 Corante c4d 1 vs 3 0,79 0,4292 1,0000 Corante c4d 2 vs 3 - 1,43 0,1524 1,0000
[0691] Todas as referências a patentes, pedidos de patente e publicações citadas no presente documento encontram-se aqui incorporados a título de referência em sua totalidade. Embora os métodos da presente divulgação tenham sido descritos em conexão com modalidades específicas dos mesmos, será entendido que são possíveis modificações adicionais. Além disso, o presente pedido destina-se a cobrir quaisquer variações, usos ou adaptações dos métodos da presente divulgação, incluindo tais afastamentos da presente divulgação como sendo conhecidos ou costumeiros na prática da técnica à qual os métodos da presente divulgação se referem e abrangidos pelo escopo das reivindicações anexas. EXEMPLO 3. VALIDAÇÃO DA DETECÇÃO DE LESÃO
DO TRANSPLANTE RENAL POR AVALIAÇÃO DE DNA LIVRE DE CÉLULAS DERIVADO DE DOADOR POR PCR MASSIVAMENTE MULTIPLEX E SEQUENCIAMENTO DE PRÓXIMA GERAÇÃO. INTRODUÇÃO
[0692] O transplante renal é a melhor opção para pacientes com doença renal em estágio terminal. De acordo com a United Network for Organ Sharing, mais de 19.000 rins foram transplantados nos Estados Unidos em 2016 (cen.acs.org) e aproximadamente, 200.000 pacientes estão vivendo com um transplante renal funcional (NIH Medline plus). Apesar dos regimes de manutenção imunossupressores ao longo da vida projetados para otimizar o resultado terapêutico, aproximadamente, 20 a 30% dos pacientes apresentaram insuficiência renal geral do enxerto nos primeiros 5 anos, e apenas 55% dos rins transplantados sobrevivem até 10 anos (cen.acs.org). Assim, existe uma necessidade imperiosa de estratégias de intervenção precoce para evitar ou minimizar episódios de rejeição aguda/subclínica, nefrotoxicidade e ser capaz de gerenciar e monitorar comorbidades para melhores resultados terapêuticos.
[0693] As opções clínicas de padrão de tratamento atuais para monitorar a saúde renal em receptores de transplante incluem biópsias de protocolo e avaliação de mudanças dinâmicas na creatinina sérica e outros parâmetros, como proteinúria e níveis de fármacos imunossupressores. Embora as biópsias de protocolo sejam consideradas o
“padrão ouro”, sua utilidade clínica é significativamente limitada devido à invasividade, custo, amostragem inadequada e reprodutibilidade insatisfatória. A creatinina sérica, o atual marcador padrão de tratamento para rastrear a disfunção do aloenxerto renal e indicar quando a biópsia e a avaliação histológica do tecido renal são necessárias, é um marcador insatisfatório, devido à sua baixa sensibilidade e especificidade. (Sigdel et al., Optimizing detection of kidney transplant injury by assessment of donor-derived cell-free DNA by massively multiplex PCR, PLoS One, Manuscript in preparation 2018). Além disso, a creatinina é um indicador latente de lesão renal; no momento em que os níveis de creatinina sérica aumentam, o aloenxerto já sofreu danos graves e irreversíveis. Assim, existe uma necessidade médica não atendida de detectar de forma não invasiva o início precoce da rejeição ao transplante e ajudar os médicos a tomarem decisões pró-ativas com relação ao gerenciamento da terapia imunossupressora e prevenir lesão e perda do enxerto.
[0694] O DNA livre de células derivado de doador (dd-cfDNA) pode ser detectado de forma não invasiva no plasma de pacientes transplantados e é um biomarcador não invasivo comprovado para rejeição ao transplante renal. A presente divulgação fornece um ensaio que pode estimar a fração dd-cfDNA em receptores de transplante renal medindo a frequência de alelos em 13.962 SNPs. Um estudo de validação clínica recente demonstrou a capacidade deste método para discriminar rejeição ativa de não rejeição com uma sensibilidade de 88,7%, especificidade de 73,2% e AUC de 0,87 usando um limite de dd-cfDNA de 1% (Sigdel et al. 2018). Sigdel et al. 2018 mostrou uma diferença significativa nos níveis de dd-cfDNA em casos de rejeição mediada por anticorpos (ABMR) e rejeição mediada por células T (TCMR) do que casos de não rejeição, incluindo aqueles com aloenxertos estáveis, rejeição limítrofe e outras lesões. A presente divulgação validou analiticamente o presente teste de NGS de grau clínico, determinando o limite de branco (LoB), limite inferior de detecção (LoD) e limite inferior de quantificação (LoQ),
linearidade, precisão (reprodutibilidade e repetibilidade) e exatidão na medição da fração de dd-cfDNA em receptores de transplante renal.
MATERIAIS E MÉTODOS
[0695] O fluxo de trabalho geral deste estudo é mostrado na Figura 22.
AMOSTRAS DE PLASMA
[0696] Amostras de sangue total (20 ml) foram coletadas de voluntários saudáveis (n = 15) e pacientes transplantados (n = 6) em tubos de Cell-Free DNA BCT (Streck, Omaha, NE). O plasma (5 a 10 ml) foi isolado do sangue após centrifugação a 3220 xg durante 30 minutos a 22 ºC e armazenado a - 80 ºC. O DNA livre de células foi extraído usando a química interna do requerente para extração (NICE) (San Carlos, CA) ou o kit de ácido nucléico circulante QIAamp® (Qiagen, Germatown, MD). AMOSTRAS DE REFERÊNCIA (DERIVADAS DE LINHAGEM CELULAR)
[0697] As amostras de referência foram adquiridas junto à SeraCare Lifesciences (Milford, MA) e foram desenvolvidas misturando DNA genômico (gDNA) de 5 linhagens celulares diferentes para desenvolver 3 misturas binárias de indivíduo do sexo feminino (receptor) / indivíduo do sexo masculino (doador); 1 relacionado e 2 não relacionado, em porcentagens específicas (0, 0,1, 0,3, 0,6, 1,2, 2,4, 5, 10 e 15%) da fração de doador. A porcentagem da fração de doador em cada mistura foi verificada por PCR de gotícula digital (ddPCR) da SeraCare. As misturas de gDNA foram cortadas por sonicação e o tamanho selecionado para imitar os fragmentos de cfDNA esperados de 160 pares de bases. A concentração das amostras de referência foi quantificada usando os kits de alta sensibilidade Quant-iT® ou Qubit® (ThermoFisher, Carlsbad, CA). AMOSTRAS DE MISTURA DE cfDNA (DERIVADAS DE PLASMA)
[0698] O cfDNA extraído do plasma de voluntários saudáveis (n = 16) foi usado para desenvolver 3 misturas binárias de cfDNA não parentes e 6 relacionadas. As 3 misturas não relacionadas foram preparadas em 7 níveis de dd-cfDNA-alvo diferentes (0,1, 0,3, 0,6, 1,2, 2,4, 5, 10%). Das 6 misturas de cfDNA relacionadas, 4 foram desenvolvidas em frações de doador: 0,1, 0,3, 0,6, 1,2%, e as 2 amostras de mistura restantes foram desenvolvidas em frações de doador de 0,3 e 0,6%. A concentração das amostras da mistura de cfDNA foi quantificada usando os kits de alta sensibilidade Quant-iT® ou Qubit® (ThermoFisher, City and State). AMPLIFICAÇÃO ALVEJADA, SELEÇÃO DE SNP,
ANÁLISE DE DADOS DE SEQUENCIAMENTO E CONTROLE DE QUALIDADE
[0699] As amostras de referência e as amostras de mistura de cfDNA extraídas foram utilizadas como entrada para a preparação da biblioteca seguida de amplificação por PCR. Posteriormente, a amplificação alvejada foi alcançada realizando mmPCR conforme descrito anteriormente em Ryan et al., Validation of an Enhanced Version of a Single-Nucleotide Polymorphism-Based Noninvasive Prenatal Test for Detection of Fetal Aneuploidies, Fetal diagnosis and therapy, 40 (3): 219 a 223 (2016), mas com um pool de iniciador diferente alvejando 13.926 posições de SNP. Os SNPs foram projetados para alta frequência de alelo variante em etnias diferentes. SNPs bialélicos foram selecionados nos cromossomos 2, 13, 18, 21, 22 e X, mas apenas os cromossomos 2, 13, 18 e 21 foram incluídos na análise da fração de doador. Para garantir a estimativa precisa da fração do doador, independentemente da etnia do paciente, os SNPs foram obrigados a ter alta frequência de alelos menores nos principais grupos étnicos definidos no projeto
1.000 Genomes (genoma 1.000). Especificamente, pelo menos 75% dos SNPs eram obrigados a ter frequência de alelo menor maior que 25% em grupos étnicos europeus, africanos, asiáticos e americanos.
[0700] Os amplicons de PCR obtidos após a amplificação alvejada foram convertidos em código de barras e combinados para gerar pools de 32-plex, que foram sequenciados usando a tecnologia NGS (instrumento Illumina NextSeq 500, 50 ciclos, leituras de extremidade única). As leituras sequenciadas foram demultiplexadas e mapeadas para o genoma de referência hg19 usando Novoalign versão 2.3.4 (Website novocraft). As bases com pontuação de qualidade Phred <30 e leituras com pontuação de qualidade de mapeamento <30 foram filtradas. Múltiplas verificações de qualidade (QCs) (densidade de agrupamento, taxa de mapeamento, etc.) foram aplicadas à execução de sequenciamento e cada amostra foi confirmada como tendo o número desejado de leituras (8 milhões) após a filtragem. Todos os QCs de execução de sequenciamento com falha do pool foram sequenciados novamente. Qualquer amostra que falhou em produzir o número necessário de leituras foi removida da análise. CÁLCULO DO PERCENTUAL DE dd-cfDNA
[0701] Para cada amostra, a fração do cfDNA derivado do doador (fração do doador) foi estimada com base nas frequências de alelos menores medidas para todos os SNPs em que o receptor era homozigótico. O cálculo da fração do doador foi baseado em uma estimativa de máxima verossimilhança em um intervalo de pesquisa de 0,0001 a 0,25 em incrementos de 0,0001. A presente abordagem não incluiu uma amostra separada do doador, e os genótipos do doador foram representados por um modelo de probabilidade que incorporou as probabilidades anteriores baseadas na população (genoma 1.000) e as razões de alelos observadas. Nenhum ajuste heurístico foi necessário para doadores relacionados devido à falta de suposições embutidas em relação à fração de concordância do genótipo entre o receptor e o doador. Em vez disso, as restrições de herança de genótipo correspondentes foram incorporadas ao modelo de probabilidade de genótipo do doador. Este modo de estimativa foi referido como "estimativa relacionada" e a estimativa irrestrita foi referida como "estimativa padrão".
PLANO EXPERIMENTAL E ANÁLISE ESTATÍSTICA
[0702] Para avaliar o desempenho analítico do teste,
LoB, LoD, LoQ, linearidade, precisão e exatidão foram medidos com base nas diretrizes de CLSI (EP-17A2, EP05-A3) conforme descrito abaixo.
As tabelas 1A a 1B abaixo mostram o projeto experimental.
Tabela 1A: Projeto experimentaç para determinar LoB, LoD, LoQ e linearidade Parâm LoB LoD LoQ, Linearidade etros Amost Amo Doad Amostr Doadores de sangue Doadores de sangue ra stras ores as de saudáveis (n = 16) Amostr saudáveis (n = 14) de de ref. as de ref. sang Ref. (n = ue branc saud os) áveis (n = 15) Massa 15, 15, 30, 15 15 15, 30, 15 15 de 30, Variá 45 Variáv 45 Variáv entrad 45 vel el el a (ng) Mistur N/A N/A 3: 2 3: 3: 3: 3: 2 3: 3: 3: as de Não Mistur mistur mistura Não Não mistura mistur amost relacio as de as de s de relacio relaci s de as de ra nadas, cfDNA cfDNA bibliote nadas, onad cfDNA bibliot 1 não relacio ca 1 as relacio eca Relacio relacio nado relacio relacio nado relacio nada nado nada nada nadas Fraçõ N/A N/A 0,1, 0,1, 0,1, 0,3, 0,1, 0,1, 0,1, 0,3, es de 0,3, 0,6 0,3, 0,3, 0,6 0,3, 0,3, 0,3, 0,6 doado 0,6 0,6 0,6, 0,6, 0,6, r (%) 1,2, 1,2, 1,2 2,4, 5, 2,4, 10, 15 5, 10 Númer 68 60 274 60 27 28 638 96 36 28 o de mediç ões Mediç 128 389 798 ões Totais
Tabela 1B: Projeto experimental para determinar exatidão, reprodutibilidade e repetibilidade Exatidão Reprodutibilidade Repetibili dade Amostra Amostras de ref. Amostras de Amostras de Amostras ref. transplante de ref. (n = 6) Massa de 15, 30, 45 15, 30, 45 Variável 30 entrada (ng) Misturas de 3: 2 Não 3: 2 Não N/A 1: amostra relacionadas, 1 relacionadas, relacionad relacionada 1 relacionada a Frações de 0,1, 0,3, 0,6, 1,2, 0,1, 0,3, 0,6, Variável 0,6, 2,4 doador (%) 2,4, 5, 10, 15 1,2, 2,4, 5, 10 Número de 632 504 12 128 Medições Medições Totais 638 516 128
LIMITE DE BRANCO
[0703] Limite de branco (LoB) foi estabelecido usando 1) amostras de referência (brancos ou genoma único), desenvolvido a partir de gDNA cortado de 5 diferentes linhagens de células puras, obtidas junto à SeraCare, e 2) amostras de cfDNA derivadas de plasma (n = 15) coletadas de doadores de sangue saudáveis que nunca fizeram um transplante ou transfusão de sangue recente. Para amostras de referência, cada uma das linhagens celulares puras foi testada em 3 quantidades de entrada de biblioteca diferentes (15, 30 e 45 ng) para imitar o rendimento de cfDNA esperado obtido a partir de coletas de sangue de 20 ml. No entanto, para as amostras de cfDNA derivadas de plasma, as quantidades de entrada foram mantidas variáveis para a preparação da biblioteca para simular a variação de entrada em amostras reais. Em conformidade com as diretrizes de CLSI, as amostras foram testadas em triplicatas em 3 dias diferentes com 2 lotes de reagentes de sequenciamento diferentes que consistiam em pelo menos 60 medições por lote para um total de 128 medições em branco.
[0704] LoB é definido como o valor empírico do percentil 95 medido a partir de um conjunto de amostras em branco (sem analito). O cálculo foi realizado duas vezes para as amostras de referência derivadas da linhagem celular (uma para cada lote de reagente) e novamente para o cfDNA derivado do plasma. As amostras de cfDNA derivadas de plasma incluíram menos réplicas do que o recomendado pelas diretrizes do CLSI e foram usadas apenas para verificação de consistência. O LoB final é o máximo do LoB de lote 1 e do LoB de lote 2. Todos os cálculos foram realizados uma vez usando a estimativa da fração do doador padrão e uma vez usando a estimativa da fração do doador relacionado a fim de medir os LoBs correspondentes para os dois métodos de estimativa.
LIMITE DE DETECÇÃO E LIMITE DE QUANTIFICAÇÃO
[0705] O Limite de Detecção (LoD) e o Limite de Quantificação (LoQ) foram medidos usando amostras de referência derivadas de linhagem celular de SeraCare e misturas de cfDNA derivadas de plasma de voluntários saudáveis. As amostras de referência foram testadas em 3 quantidades de entrada de cfDNA diferentes (15, 30 e 45 ng). LoD foi medido nos três níveis mais baixos de fração de doador (0,1, 0,3, 0,6%), em 6 repetições por 2 operadores em dias diferentes usando diferentes lotes de reagentes e instrumentos de sequenciamento. As misturas de cfDNA derivadas de plasma foram testadas com 15 ng de entrada, para misturas não relacionadas e relacionadas. As três misturas de cfDNA não relacionadas foram testadas em 3 níveis mais baixos de fração de doador (0,1, 0,3, 0,6%) em 6 repetições. Entre 6 misturas de cfDNA relacionadas, três foram testadas nos 3 níveis de fração de doador mais baixos (0,1, 0,3, 0,6%) em triplicata e os três restantes (mãe-filho) foram testados em 2 níveis de fração de doador (0,3, 0,6%), processados em duplicatas. A análise de LoQ incluiu todas as amostras utilizadas para LoD, bem como um conjunto correspondente de réplicas em frações de doador superiores (1,2, 2,4, 5, 10, 15% para linhagens celulares e
1,2, 2,4, 5, 10% para cfDNA derivado de plasma).
[0706] LoD é calculado seguindo o método de estimativa paramétrica especificado em EP-17A2, que computa LoD adicionando um termo de desvio padrão ao LoB. O termo de desvio padrão consiste no desvio padrão disposto em pool (estimado a partir do conjunto de réplicas descrito no LoD), multiplicado por um fator de correção especificado com base no número de amostras. O LoD é calculado para cada massa de entrada e método de estimativa da fração de doador, combinando o LoB correspondente com a medição do desvio padrão correspondente.
[0707] Uma avaliação de LoQ apropriada foi selecionada com base nos requisitos de quantificação do processo de teste. LoQ é definido como o valor mais baixo da fração de doador no qual a precisão relativa de medição suficiente é alcançada, limitada pelo LoD. A precisão relativa da medição suficiente foi definida como coeficiente de variação (CV) de 20%, e o CV foi definido como o desvio padrão de medição dividido pela média. Observou-se que o CV da fração de doador depende da fração de doador (d) com a relação CV = a + b*exp(-c*d), em que os parâmetros do modelo a, b e c são estimados a partir dos dados usando um procedimento de quadrados mínimos não linear. O modelo CV (descrito pelos parâmetros a, b, c) foi estimado para cada massa de entrada e método de estimativa da fração de doador, e o LoQ correspondente foi o valor mais baixo para o qual o modelo satisfez o requisito de CV com LoD como o LoQ mais baixo possível. Esta abordagem baseada em modelo requer a inclusão de medições de fração de doador mais alta para a avaliação de LoQ, a fim de garantir a convergência para um valor constante apropriado na fração de doador alta.
LINEARIDADE E PRECISÃO
[0708] A linearidade foi medida usando amostras de referência derivadas de linhagem celular em quantidades de entrada de cfDNA (15, 30, 45 ng) em todos os níveis de frações de doador fabricados (0,1, 0,3, 0,6, 1,2, 2,4, 5, 10, 15%) por 2 operadores em dias diferentes usando diferentes lotes de reagentes e instrumentos de sequenciamento. Todas as sete frações de doador (0,1, 0,3, 0,6, 1,2, 2,4, 5, 10%) de amostras de mistura de cfDNA derivadas de plasma não relacionadas a 15 ng de entrada foram usadas para comparar a linearidade com os dados derivados da linhagem celular. Para as misturas de cfDNA derivadas de plasma, foram testadas 6 réplicas das 3 frações de doador mais baixas (0,1, 0,3, 0,6%) e triplicatas de 4 frações de doador altas (1,2, 2,4, 5, 10%). A fim de avaliar a precisão ou exatidão do teste de transplante, as misturas de referência de SeraCare em 8 frações de doador até 15% foram usadas com 15, 30 e 45 ng de entrada.
[0709] A linearidade foi avaliada com base no valor de R2 produzido por uma análise de regressão linear padrão da relação entre a fração de doador medida e as frações da mistura alvejadas. A precisão foi avaliada com base na análise de regressão linear da relação entre a fração de doador medida e a medição de ddPCR ortogonal.
PRECISÃO
[0710] A precisão foi medida testando a reprodutibilidade (interexecução) e repetibilidade (intraexecução) em 632 amostras de referência. Para avaliar a reprodutibilidade interexecuções, 3 misturas de doador-receptor de SeraCare (0,1, 0,3, 0,6, 1,2, 2,4, 5, 10%) foram testadas com réplicas a 15, 30, 45 ng de entrada. A repetibilidade foi determinada medindo a variabilidade entre réplicas técnicas de amostras medidas em condições semelhantes. Uma mistura de referência de SeraCare relacionada (mãe-filho) em frações de doador de 0,6 e 2,4% foi testada por um único operador, lote de reagente e instrumento por um total de 128 medições. Além das misturas de cfDNA, as coletas de sangue correspondentes (4 tubos/paciente) de receptores de transplante foram executadas em duplicatas e avaliadas quanto à reprodutibilidade em amostras clínicas. As amostras foram processadas por 2 operadores diferentes em 8 dias diferentes (24 execuções em 23 dias) com 3 lotes de reagentes e 17 instrumentos de sequenciamento.
[0711] A repetibilidade foi definida como o coeficiente de variação (CV) medido em todo o conjunto de repetições em uma única fração do doador-alvo, sob condições correspondentes. Assim, o CV foi calculado uma vez com fração de doador de 0,6% e uma vez com 2,4%. A reprodutibilidade também foi medida usando CV, calculado separadamente para cada combinação de quantidade de entrada de DNA e fração de mistura.
RESULTADOS
[0712] O LoB foi calculado usando 64 medições para cada um dos dois lotes de reagentes. O LoB foi de 0,11% usando a estimativa de doador não relacionado e 0,23% usando o método de doador relacionado. A avaliação de medições de cfDNA derivadas de plasma apenas (combinadas em ambos os lotes) resultou em LoB de 0,04% (não relacionado) e 0,08% (relacionado), sugerindo que o LoB nas amostras de pacientes pode ser equivalente ou superior ao medido usando amostras de referência, embora o tamanho da amostra seja limitado (60 medições). Não houve diferença significativa entre quantidades de entrada de DNA. A Figura 23 mostra histogramas das medições da fração do doador relevantes decompostas por método e lote.
[0713] O LoD foi calculado a partir de 168 medições não relacionadas e 220 relacionadas, resultando em LoD de 0,15% (não relacionadas) e 0,29% (não relacionadas). Esses números excluem uma amostra que falhou em QC devido ao número insuficiente de leituras. Observa- se que a diferença no LoD para doadores relacionados versus não relacionados foi aproximadamente igual à diferença no LoB correspondente, o que significa que a variância da medição perto do LoD foi aproximadamente a mesma nos dois métodos. Não houve impacto significativo devido à quantidade de entrada de DNA. Seguindo uma abordagem semelhante à adotada para a análise de LoB, a restrição às medições de cfDNA derivado de plasma resultou em um LoD estimado inferior: 0,05% (não relacionadas) e 0,11% (relacionadas), embora o número de medições tenha sido inferior ao ideal (54 relacionadas, 60 não relacionadas).
[0714] O LoQ foi calculado a partir de 381 medições não relacionadas e 412 relacionadas, após exclusão de 5 amostras devido ao número insuficiente de leituras. Os CVs empíricos foram calculados no conjunto de réplicas de amostra em cada fração de doador-alvo e eram todos inferiores a 20%, incluindo cfDNA derivado de linhagem celular e derivado de plasma. Modelos paramétricos foram ajustados para cada lote de reagente, uma vez para misturas relacionadas e uma vez para não relacionadas. Os Cvs e os modelos paramétricos resultantes são mostrados na Figura 24. Os CVs modelados também foram menores que 20% para todas as frações de doador maiores ou iguais ao LoD. Assim, o LoQ foi igual ao LoD para todos os cenários.
[0715] Análise de LoB: As tabelas 2 a 4 abaixo resumem os valores de média, mediana e desvio padrão das frações de doador medidas para cada lote e modo do teste.
Tabela 2: Valores médios de frações de doador medidas para casos relacionados e não relacionados para os Lotes 1 e 2 Fração de doador média Lote 1 Lote 2 Relacionados 0,03% 0,06% Não relacionados 0,02% 0,03% Tabela 3: Valores medianos de frações de doador medidas para casos relacionados e não relacionados para os Lotes 1 e 2 Fração de doador mediana Lote 1 Lote 2 Relacionados 0,01% 0,03 Não relacionados 0,01% 0,01% Tabela 4: Valores de desvio padrão de frações de doador medidas para casos relacionados e não relacionados para os Lotes 1 e 2 Fração de doador de desvio padrão Lote 1 Lote 2 Relacionados 0,05% 0,1% Não relacionados 0,02% 0,05%
[0716] Para demonstrar o desempenho do teste para amostras de gDNA e cfDNA separadamente, computou-se LoB para cada caso usando 60 (resp. 68) medições provenientes de amostras de cfDNA (resp. gDNA). Para aumentar o tamanho da amostra, não foi feita distinção entre os lotes. Histogramas mostrando (resp. Valores de LoB) para cada tipo de DNA e modo do teste são representados na Figura 29 (resp. Tabela 5).
Tabela 5: Valores de LoB para modos relacionados e não relacionados das amostras de gDNA e cfDNA de teste LoB gDNA cfDNA Relacionados 0,23% 0,08% Não relacionados 0,11% 0,04%
[0717] Análise de LoD: O método de computação de LoD paramétrico exigia que: (i) as medições de amostras de baixo nível (aproximadamente) seguissem uma distribuição gaussiana, e (ii) os desvios padrão empíricos das ditas amostras (aproximadamente) permanecessem constantes com uma função da média empírica. Histogramas de frações de doador medidas e centralizadas para cada lote e cada modo de teste são mostrados na Figura 30. O desvio padrão empírico como uma função da média empírica para ambos os lotes e modos de teste é mostrado na Figura 31. Os dados divulgados nas Figuras 30 e 31 demonstraram que essas duas condições são satisfeitas tanto para amostras de baixo nível relacionadas quanto não relacionadas.
[0718] Para demonstrar LoD para amostras de gDNA e cfDNA separadamente, bem como para ver o efeito da quantidade de entrada para amostras de gDNA, a análise de LoD delineada acima foi realizada para esses conjuntos de amostras separadamente, usando os valores de LoB correspondentes para cada caso. Especificamente, 54 medições relacionadas e 60 não relacionadas foram usadas para o caso de cfDNA. Além disso, para o caso de gDNA, 18 medidas relacionadas, 36 medidas não relacionadas foram usadas para entradas de 15 ng e 45 ng; e 130 medições relacionadas, 36 medições não relacionadas foram usadas para entrada de 30 ng. Os valores de LoD computados em relação ao modo de teste e quantidade de entrada para amostras de gDNA são mostrados na Tabela 6 abaixo, enquanto os valores de LoD para dois modos de teste diferentes para amostras de cfDNA são mostrados na Tabela 7 abaixo.
Tabela 6: Valores de LoD para modos relacionados e não relacionados das entradas de 15, 30, 45 ng para amostras de gDNA gDNA-LoD 15 ng 30 ng 45 ng Relacionados 0,28% 0,26% 0,25% Não relacionados 0,13% 0,13% 0,12% Tabela 7: Valores de LoD para modos relacionados e não relacionados do teste para amostras de cfDNA cfDNA LoD Relacionados 0,11% Não relacionados 0,5%
[0719] Análise de LoQ: Semelhante à análise de LoD, foram avaliados os números de LoQ para amostras de gDNA, que foram posteriormente particionadas em relação às suas quantidades de entrada. Conforme ilustra a Figura 32, todos os valores de CV medidos para todos os níveis de pico testados estavam abaixo de 20% de corte para amostras relacionadas em todos os níveis de entrada, bem como amostras relacionadas em níveis de entrada de 15 e 45 ng. Assim, para todos esses casos, o LoQ inferior era igual a LoD, por definição. Para amostras relacionadas com nível de entrada de 30 ng, a curva ajustada cruzou com nível de 20% de CV em aprox. 0,174%, que foi inferior ao LoD correspondente, isto é, 0,26%, para este caso. Assim, o LoQ inferior era novamente igual a LoD, por definição. Além disso,
também foram computados os valores LoQ para amostras de cfDNA, conforme representado na Figura 33. Claramente, para ambos os casos, obteve-se LoQ inferior igual ao LoD correspondente. Os parâmetros estimados do ajuste não linear para CV para cada cenário que se relatou valores de LoQ são mostrados na Tabela 8 abaixo.
Tabela 8: Parâmetros estimados do modelo de decaimento exponencial do CV para cada situação em que são relatados valores de LoQ Conjunto de dados a b c cfDNA + gDNA, Relacionado, Lote 1 0,950216 16,4685 1,88562 cfDNA + gDNA, Relacionado, Lote 2 1,82651 24,2948 6,82745 cfDNA + gDNA, Não relacionado, Lote 1 0,557873 6,16417 1,53284 cfDNA + gDNA, Não relacionado, Lote 2 0,75364 7,00144 1,00344 gDNA, Relacionado, 15 ng 0,907757 18,3994 1,97114 gDNA, Relacionado, 30 ng 0,798892 45,2805 4,943 gDNA, Relacionado, 45 ng 0,7446606 7,69009 2,62489 gDNA, Não relacionado, 15 ng 1,06298 14,2357 60,4647 gDNA, Não relacionado, 30 ng 1,4362 17,0526 7,3715 gDNA, Não relacionado, 45 ng 0,801393 12,0185 5,69333 cfDNA, Relacionado 1,88546 13275,4 53,5112 cfDNA, Não relacionado 0,654995 10,1971 6,67823 LINEARIDADE, EXATIDÃO E PRECISÃO
[0720] A linearidade foi medida a partir de 381 amostras não relacionadas e 412 relacionadas, após a remoção de 5 amostras que falharam em QC devido ao número insuficiente de leituras. A exatidão foi medida a partir do subconjunto destes (as amostras de referência derivadas da linhagem celular) para o qual a fração do doador de ddPCR estava disponível como uma referência: 285 não relacionadas e 349 relacionadas, após a exclusão de 4 amostras devido ao número insuficiente de leituras. As medições individuais e as linhas de regressão linear são mostradas na Figura 25
(linearidade) e na Figura 26 (exatidão). A linearidade foi medida por regressão linear contra a fração de doador alvejada, e a exatudão foi medida por regressão linear contra a fração de doador medida com ddPCR. Os resultados de regressão linear são mostrados nas Tabelas 9 e 10 abaixo. A medição da fração de doador mostrou ser altamente linear (R 2 maior que 0,99 em todos os modelos) e exata (coeficiente angular de aproximadamente 1, interceptação de aproximadamente zero). Não houve diferença significativa entre doadores relacionados e não relacionados, conforme determinado pela regressão combinada.
Tabela 9: Resultados de regressão linear para linearidade e exatidão, incluindo 95% de intervalo de confiança Coeficiente angular interceptação R2 Exatidão, 1,0591 (0,9763, 0,0001 ( - 0,00045, 0,9988 (0,9987, combinados 1,1418) 0,0047) 0,9990) Exatidão, 1,0333 (0,9241, - 0,0001 (- 0,0047, 0,9989 (0,9986, relacionado 1,1425) 0,0045) 0,9990) Exatidão, não 1,0664 (0,9416, 0,0008 (-0,0076, 0,9997 (0,9997, relacionado 1,1912) 0,0092) 0,9998) Linearidade, 1,0516 (0,9781, 0,0004 (- 0,0033, 0,9968 (0,9946, combinados 1,1251) 0,0042) 0,9972) Linearidade, 0,9852 (0,8895, 0,0008 (- 0,0031, 0,9991 (0,9989, relacionado 1,0809) 0,0047) 0,9992) Linearidade, não 1,0813 (0,9721, 0,0006 (- 0,0006, 0,9995 (0,9994, relacionado 1,1906) 0,0071) 0,9996) Tabela 10: Resultados de regressão linear para linearidade, incluindo 95% de intervalos de confiança, para amostras clínicas Coeficiente angular interceptação R2 1,0125 (- 0,3932, 2,4183) - 0,002 (- 0,0121, 0,0117) 0,9998 (0,9984, 1,0000)
[0721] A precisão dos métodos aqui divulgados foi avaliada medindo a repetibilidade dentro de um único experimento executado e um conjunto de condições e reprodutibilidade através de um conjunto variado de condições. A repetibilidade foi medida usando CV em duas frações de doador alvejadas (0,6% e 2,4%), cada uma usando 64 medições de amostras derivadas de linhagem celular sem amostras removidas devido à falha de QC. O CV foi de 1,85% (CI de 95%: 1,34% a 2,73%) na fração de doador alvejada de 0,6%, e o CV foi de 1,22% (CI de 95%: 0,88% a 1,80%) na fração de doador alvejada de 2,4%. A reprodutibilidade por entrada foi calculada usando 498 medições, após a remoção de 6 amostras que falharam em QC devido ao número insuficiente de leituras. Para entrada de 15 ng, o CV foi de 3,10% (CI de 95%: 1,58% a 4,37%); para entrada de 30ng, o CV foi de 3,07% (CI de 95%: 1,42% a 4,50%); para 45 ng, o CV foi de 1,99% (CI de 95%: 1,10% a 2,75%). A reprodutibilidade por lote foi calculada a partir de um subconjunto das amostras citadas anteriormente, cuja cardinalidade é 374, o que exclui 4 amostras que falharam em QC devido ao número insuficiente de amostras. O CV para o Lote 1 foi de 3,99% (CI de 95%: 2,42% a 5,41%) e o CV para o Lote 2 foi de 4,44% (CI de 95%: 2,69% a 6,02%).
[0722] Foram avaliadas também a linearidade e a precisão do teste para amostras clínicas de transplante, em consonância com a análise citada anteriormente. Para tal, foram utilizadas 12 medições, nenhuma das quais falhou devido ao QC. A linearidade foi medida realizando regressão linear da fração de doador medida do Lote 2 contra o Lote 1. As medições e linhas de regressão linear são mostradas na Figura 27, e os resultados de regressão linear correspondentes são fornecidos. A precisão estimada do testado foi determinada como tendo um CV de 4,29% (CI de 95%: 0,65% a 6,86%). Por fim, observamos 100% de concordância (CI de 95%: 54,07% a 100%) entre as repetições.
[0723] Análise de exatidão: Para demonstrar a exatidão das amostras de cfDNA, foi usada a fração do doador estimada usando SNPs de HNR em vez de ddPCR para gDNA. A justificativa de usar este método como uma alternativa mais precisa para a estimativa de fração de doador convencional usando SNP não HNR foi devido ao seguinte: uma vez que HNR eram não recombinantes, e as amostras de cfDNA foram projetadas para ter um fundo feminino com pico masculino, as medições do alelo do cromossomo Y foram diretamente atribuíveis ao sinal do doador. A análise de precisão foi realizada usando 63 medições de cfDNA relacionadas e 96 não relacionadas, que excluiu uma amostra que falhou no QC devido ao número insuficiente de leituras. As medições individuais e as linhas de regressão linear são mostradas na Figura 34, e os resultados de regressão linear correspondentes são fornecidos na Tabela 11 abaixo. Deve-se notar que os intervalos de confiança relativamente maiores para estimativas de cfDNA em comparação com suas contrapartes de gDNA provavelmente resultam do tamanho de amostra relativamente menor do primeiro em comparação com o último.
Tabela 11: Resultados de regressão linear para exatidão de amostras de cfDNA, incluindo intervalos de confiança de 95% Exatidão de coeficiente interceptação R2 cfDNA angular Não relacionadas 1,0108 (0,8038, 0,0002 (- 0,0076, 0,9996 (0,9994, 1,2179) 0,0080) 0,9997) Relacionadas 1,0440 (0,7727, 0,0007 (- 0,0012, 0,9706 (0,9517, 1,3153) 0,0027) 0,9993) Combinados 1,0073 (0,8484, 0,0007 (- 0,0042, 0,9991 (0,9987, 1,1662) 0,0053) 0,9993)
[0724] Análise de linearidade: Semelhante às métricas de desempenho anteriores, decompôs-se a análise de linearidade para amostras de gDNA e cfDNA separadamente. Especificamente, para análise de gDNA, 349 medições relacionadas e 285 não relacionadas foram usadas, e para análise de cfDNA, 63 medições relacionadas e 96 não relacionadas foram usadas. As medições individuais e as linhas de regressão linear (resp. medições individuais em uma escala log-log) para amostras de gDNA são mostradas na Figura 35 (resp. Figura 36). Da mesma forma, as medições individuais e as linhas de regressão linear (resp. medições individuais em uma escala log-log) para amostras de cfDNA são mostradas na Figura 37 (resp. Figura 38) descrevem as Tabelas 12 e 13 contendo os resultados de regressão linear correspondentes para gDNA e cfDNA, respectivamente.
Tabela 12: Resultados de regressão linear para exatidão de amostras de gDNA, incluindo intervalos de confiança de 95%. Linearidade de coeficiente interceptação R2 gDNA angular Não relacionadas 1,0804 (0,9540, 0,0007 (- 0,0077, 0,99989 (0,99986, 1,2069) 0,0091) 0,99992) Relacionadas 0,9876 (0,8833, 0,0005 (-0,0041, 0,9994 (0,9974, 1,0920) 0,0052) 09995) Combinadas 1,0515 (0,9693, 0,0003 (- 0,0043, 0,9969 (0,9964, 1,1338) 0,0049) 09974) Tabela 13: Reg. Linear Linearidade de coeficiente interceptação R2 cfDNA angular Não relacionadas 1,0787 (0,8574, 0,0002 (- 0,0076, 0,9962 (0,9943, 1,300) 0,0080) 0,9975) Relacionadas 1,3368 (0,9895, 0,0001 (- 0,0020, 0,9713 (0,9528, 1,6841) 0,0022) 0,9965) Combinadas 1,0734 (0,9038, 0,0008 (- 0,0039, 0,9953 (0,9935, 1,2430) 0,0055) 0,9965)
[0725] Análise de repetibilidade e reprodutibilidade: Para computar os intervalos de confiança nos Cvs estimados para análise de repetibilidade, foram usados os limites clássicos, conforme descrito em McKay, “Distribution of the coefficient of variation and the extended t distribution”, Journal of the Royal Statistics Society, 95(4): 695 a 698 (1932), com base em uma aproximação de qui-quadrado. A derivação desses limites presume que as medidas subjacentes a partir das quais o CV é estimado são realizações de distribuições gaussianas. Histogramas na Figura 39 verificaram que tal suposição se justifica no presente caso.
[0726] Deve-se notar que limites baseados em aproximação de qui-quadrado usados na análise de repetibilidade não são adequados para computar os intervalos de confiança dos CVs estimados para análise de reprodutibilidade porque as medições subjacentes a partir das quais o valor de CV é estimado não seguem uma distribuição gaussiana, devido à ampla faixa de frações de doador subjacentes. Assim, computa-se os intervalos de confiança por uma técnica de bootstrap padrão. Por causa da estocasticidade inerente da abordagem, os valores particulares podem variar ligeiramente para cada tentativa do método. Os intervalos de confiança da concordância estimada entre as amostras clínicas foram computados através do método de Clopper-Pearson para proporções binomiais. Especificamente, foi usada a expressão de forma fechada do referido método para 100% de taxa de sucesso observada.
DISCUSSÃO
[0727] O transplante de rim, iniciado em 1954 no hospital Brigham, resultou em uma melhora drástica na qualidade de vida de pacientes com insuficiência renal. A introdução de várias gerações de tratamentos imunossupressores reduziu a taxa de rejeição; no entanto, ela permanece inaceitavelmente alta em cerca de 5% por ano, com mais da metade dos aloenxertos falhando no ano dez. A detecção precoce da rejeição em receptores de transplante renal promete melhorar isso ainda mais, mas permanece uma necessidade não atendida devido à indisponibilidade de kits de diagnóstico sensíveis e não invasivos. Para diagnosticar a rejeição aguda ao transplante renal, a medição da função de filtração renal é mais comumente recomendada por meio de um teste de creatinina sérica. Embora o teste de creatinina sérica seja um teste barato para rejeição ao transplante, detectar a rejeição ao transplante por meio da medição da creatinina sérica tem limitações fisiológicas e é altamente impreciso. O diagnóstico mais definitivo de disfunção do aloenxerto renal, portanto, depende da avaliação histopatológica de uma biópsia guiada por ultrassonografia percutânea, que é invasiva e pode levar a complicações maiores/menores, como sangramento. Além disso, a variabilidade interobservador impede a confiabilidade das biópsias. Dadas as limitações existentes com os métodos atuais, permanece uma necessidade médica de métodos aprimorados para detectar a rejeição ao transplante que sejam não invasivos, baratos, sensíveis, específicos e tenham um retorno rápido. A presente divulgação forneceu um forte caso para dd-cfDNA, como um biomarcador para monitorar a saúde do transplante renal que atendeu a essa necessidade.
[0728] A presente divulgação abordou a validade analítica do método de quantificação da fração do doador usado em Sigdel et al. 2018. A interpretação clínica descrita em Sigdel et al. 2018 classificou um paciente com risco aumentado de rejeição de órgão quando a fração de doador é maior que 1%. Assim, o desempenho analítico aqui descrito deve ser interpretado no contexto de classificar com precisão uma amostra em relação a esse limite. A partir dessa perspectiva, observa-se que o LoD e o LoQ são 0,15% para doadores não relacionados e 0,29% para doadores relacionados com base em uma definição de LoQ de 20% de CV, implicando na capacidade de quantificar com exatidão a fração do doador em um nível significativamente inferior ao limite de classificação. Essas medições foram baseadas em amostras de referência derivadas de linhagem celular e o desempenho foi estimado como equivalente ou superior usando um número menor de amostras de cfDNA derivadas de plasma. Da mesma forma, o método foi confirmado como tendo alta exatidão com base na regressão linear em relação a uma medição ortogonal, com intervalos de confiança de parâmetro de regressão linear incluindo coeficiente angular igual a um e interceptação igual a zero, com base em 349 medições relacionadas e 285 não relacionadas. O desempenho foi avaliado em relação a uma faixa de massa de entrada de DNA, que não gerou nenhuma diferença de desempenho detectável de forma consistente na faixa testada de 15 ng a 45 ng. Os estudos de precisão mostraram que a medição da fração do doador era estável em réplicas in-run e cross-run, em vários lotes de reagentes críticos e entre coletas de sangue repetidas (simultâneas) do mesmo paciente. Assim, este estudo indicou que o teste era adequado para implementação clínica.
[0729] O presente estudo foi projetado para avaliar o desempenho de forma independente em doadores relacionados versus independentes devido à preocupação de que a maior taxa de concordância de genótipos (implicando em menor taxa de genótipos informativos) em um cenário de doador relacionado pode limitar a precisão da estimativa da fração de doador. Isso foi testado usando um grande número de réplicas de um par de doadores derivado de linhagem celular mãe-filho, juntamente com um número menor de réplicas de DNA derivado de plasma de outros pares de sujeitos com relacionamentos incluindo irmãos e menor grau de parentesco. Observamos que o LoB era maior em pares de doadores relacionados, o que levou a um LoD correspondentemente maior. No entanto, todas as outras métricas, incluindo linearidade e as várias métricas de precisão foram equivalentes entre pares de doadores relacionados e não relacionados, mostrando que o desempenho quantitativo do teste não foi significativamente afetado pelo número reduzido de genótipos informativos, com base na confirmação de uma variedade de amostras elaboradas. Esta abordagem estatística também foi superior a uma abordagem baseada em probabilidade para modelar genótipos de doadores, porque a abordagem estatística não tem que fazer quaisquer suposições sobre a fração de SNPs em que o doador tem um alelo versus dois alelos diferentes do receptor.
[0730] Espera-se que vários estudos de registro em andamento demonstrem utilidade clínica para o ensaio de dd-cfDNA, por exemplo, espera-se que leve a um uso mais eficaz da biópsia. Como o dd- cfDNA é um marcador que indica lesão contínua do aloenxerto, ao contrário da creatinina, que é um indicador de latência mostrando funcionamento diminuído,
espera-se que leve à detecção precoce de rejeição renal. A detecção precoce permite uma intervenção mais rápida no caso de rejeição, possivelmente levando a níveis mais baixos de DSA de novo, menos danos ao aloenxerto e taxas de sobrevivência do enxerto melhoradas. Além disso, pode fornecer aos nefrologistas uma ferramenta que lhes permita mais bem otimizar os regimes imunossupressores, com o objetivo de minimizar a toxicidade relacionada aos imunossupressores sem um aumento na taxa de rejeição. EXEMPLO 4. KIDNEYSCAN.
INTRODUÇÃO
[0731] Com 20 a 30% dos rins transplantados falhando em cinco anos e apenas 55% sobrevivendo até dez anos, as limitações do tratamento padrão atual para monitorar a rejeição ao aloenxerto renal são graves e caras. O custo associado a um paciente com transplante renal com falha pode ser 500% maior do que um paciente com um transplante funcional. Como tal, há uma necessidade clara de ferramentas de diagnóstico oportunas, sensíveis, específicas e não invasivas para melhorar o gerenciamento do transplante renal. O requerente criou um ensaio, KidneyScan, que ajuda os médicos a detectar eventos de rejeição mais cedo, evitando biópsias desnecessárias e otimizando com mais segurança os níveis de imunossupressão para aumentar as taxas de sobrevivência do enxerto renal.
[0732] O KidneyScan é um teste de sangue não invasivo validado para receptores de aloenxerto de rim pela primeira vez > 18 anos de idade no mínimo duas semanas após o transplante em várias etnias. O ensaio deve ser usado após o pré-teste avaliado pelo médico para avaliar a probabilidade de rejeição ativa do aloenxerto renal. Uma etapa antes de uma nova biópsia, o KidneyScan pode ajudar a determinar adequadamente a rejeição quando o paciente parece estável e a suspeita não é clara; ou descartar rejeição apropriadamente quando o paciente apresentar risco clínico de rejeição.
[0733] O ensaio de PCR massivamente multiplexada (mmPCR) baseado em polimorfismo de nucleotídeo único (SNP) tem como alvo 13.926 SNPs para detectar com precisão a rejeição/lesão do aloenxerto sem a necessidade de genótipos doadores. Aproveitando um biomarcador comprovado e uma metodologia estabelecida, o ensaio de dd-cfDNA baseado em SNP identifica a rejeição ativa medindo a fração de DNA livre de células derivado de doador (dd-cfDNA) no sangue do paciente, uma mistura de DNA livre de células de doador e receptor. Como as células liberam dd-cfDNA após lesão do enxerto ou morte, uma fração maior de dd-cfDNA indica uma maior probabilidade de rejeição ativa.
[0734] Em um recente estudo prospectivo cego de grande escala de 217 amostras de aloenxerto renal compatível com biópsia, uma análise retrospectiva do ensaio de dd-cfDNA baseado em SNP demonstrou precisão superior na detecção de rejeição ativa em relação ao padrão atual de tratamento (eGFR e creatinina sérica) com alta sensibilidade (88,7% versus 67,7% versus 51,6%), especificidade (72,6% versus 65,3% versus 67,5%) e AUC (0,87 versus 0,74 versus 0,68). Além disso, o ensaio de dd-cfDNA baseado em SNP distinguiu a rejeição aguda de cada não rejeição (lesão limítrofe, outra lesão e estável) significativamente melhor do que eGFR (P<0,0001 para cada). Estas constatações estabeleceram o dd-cfDNA como um biomarcador anterior e mais preciso para a rejeição ativa do que o padrão de tratamento que pode ser usado antes da deterioração da função renal. Reconhecido pelas diretrizes de KDIGO, “detectar a disfunção do aloenxerto renal o mais rápido possível permitirá um diagnóstico e tratamento oportunos”.
[0735] Além disso, o ensaio de dd-cfDNA baseado em SNP identificou com precisão uma ampla distribuição de tipos de rejeição (rejeição mediada por anticorpos, rejeição mediada por células T e combinação) de não rejeição no corte predefinido de > 1%. Essa distribuição abrange as principais causas de falha do aloenxerto que ocorrem em 20 a 25% dos pacientes nos primeiros 12 a 24 meses e são perdidas por ferramentas de tratamento padrão atuais. Incorporar o ensaio de dd-cfDNA baseado em SNP em protocolos de avaliação de transplante pode levar à detecção oportuna de rejeição e tratamentos de imunossupressão personalizados antecipadamente. O KidneyScan oferece aos médicos a vantagem clínica de identificar a rejeição ativa (incluindo subclínica) mais cedo, de forma abrangente e não invasiva para, por fim, melhorar o atendimento aos pacientes de transplante renal.
ANTECEDENTES
[0736] A doença renal crônica (DRC), um problema de saúde mundial, afeta 10% da população global e resulta em resultados adversos, como insuficiência renal, doença cardiovascular e morte prematura. Estima-se que cerca de 15% (30 milhões) dos adultos nos Estados Unidos tenham DRC, com cerca de 1 milhão de pessoas com doença renal em estágio terminal (ESRD). Doenças do estilo de vida, como diabetes, aterosclerose e hipertensão relacionadas ao envelhecimento da sociedade, levaram a um aumento da prevalência de ESRD.
TRANSPLANTE RENAL
[0737] O transplante renal é o tratamento preferencial para ESRD e está associada à menor morbidade, mortalidade, melhora da qualidade de vida e é econômica quando comparada à terapia de substituição renal. No entanto, de acordo com o relatório anual de 2018 publicado pelo United States of Renal System, em 2016, 70,1% dos pacientes com ESRD estavam sendo tratados com diálise, e apenas 29,6% tiveram um transplante renal funcional. Os gastos anuais de US Medicare combinados para DRC e ESRD ultrapassaram US$ 114 bilhões, com um custo anual por paciente de aproximadamente US$ 90.971 para hemodiálise e US$ 34.780 para transplante renal em 2016. Atualmente, mais de 19.000 transplantes renais são realizados nos EUA anualmente, resultando em aproximadamente
200.000 pacientes que vivem com um rim funcional.
DESAFIOS E NECESSIDADES NÃO ATENDIDAS
[0738] Embora o transplante renal seja um tratamento de escolha em relação à diálise, ele apresenta um conjunto exclusivo de desafios, em que o paciente é mantido em regimes imunossupressores para toda a vida. Aproximadamente 20 a 30% dos pacientes, pós-transplante, experimentam insuficiência renal geral do enxerto nos primeiros 5 anos e apenas 55% dos rins transplantados sobrevivem até 10 anos. A rejeição de aloenxerto renal diagnosticada patologicamente é categorizada em rejeição mediada por células T e anticorpos (TCMR/ABMR), com base nos esquemas de 2013 de Banff. As estratégias terapêuticas com foco na melhoria dos resultados de sobrevivência do enxerto relacionam-se principalmente à redução na incidência e consequência de TCMR, mas não ABMR. Apesar dos avanços nas terapias de imunossupressão e técnicas de dessensibilização, a sobrevivência do enxerto a longo prazo depende da compatibilidade de ABO ou antígenos leucocitários humanos (HLA), sendo este último identificado como um fator de risco significativo para o desenvolvimento de ABMR, levando à perda do aloenxerto. A ABMR é um processo contínuo que pode ocorrer em diferentes pontos no tempo, levando a danos agudos e crônicos. Com os avanços nas estratégias terapêuticas, a disfunção renal aguda pode ser revertida, mas não pode eliminar os anticorpos anti-HLA específicos do doador sendo secretados de células plasmáticas, originadas do baço e da medula óssea que levam a uma forma lentamente progressiva de ABMR, referida como ABMR subclínica que pode ser diagnosticada apenas por meio de biópsias de protocolo. Outro fator importante que impacta a saúde do aloenxerto em longo prazo dos receptores de transplante é uma variedade de infecções virais, como citomegalovírus, vírus Epstein Barr ou vírus BK, que são causadas por imunossupressão crônica. Com os desafios clínicos mencionados acima, é evidente que existe uma necessidade de um padrão de tratamento padrão pós-transplante eficiente que possa trazer a medicina de precisão com ajuste personalizado de regimes de fármacos imunossupressores a fim de melhorar o gerenciamento do transplante renal.
PADRÃO DE TRATAMENTO E LIMITAÇÕES ATUAIS
[0739] As opções de tratamento padrão atuais para monitorar a saúde renal em receptores de transplante incluem biópsias de protocolo (ou vigilância), bem como avaliação de alterações dinâmicas na creatinina sérica e outros parâmetros, como proteinúria e níveis de fármacos imunossupressores. Embora as biópsias de protocolo sejam consideradas o “padrão ouro”, sua utilidade clínica é significativamente limitada devido à invasividade, custo, amostragem inadequada e reprodutibilidade insatisfatória. Além disso, as biópsias de protocolo podem ser contraindicadas em pacientes com hipertensão não controlada, anomalias vasculares renais, uso de anticoagulante e pielonefrite aguda. Para diagnosticar a rejeição aguda do transplante renal, a medição da função de filtração renal é mais comumente recomendada por meio de um teste de creatinina sérica ou seu derivado algorítmico: taxa de filtração glomerular estimada (eGFR). Embora barata, a creatinina sérica é altamente imprecisa devido à sua baixa sensibilidade e especificidade e tem limitações fisiológicas (é influenciada pela dieta, massa muscular, medicamentos como trimetoprima e cimetidina e nova/recorrência de uma doença). Além disso, a creatinina é um indicador latente de lesão renal; no momento em que os níveis de creatinina sérica aumentam, o aloenxerto já sofreu danos graves e irreversíveis.
[0740] As limitações do padrão de tratamento atual expõem uma necessidade não atendida de uma abordagem rápida, precisa e não invasiva para detectar rejeição e/ou lesão de aloenxerto, o que pode exigir a integração das avaliações morfológicas padrão "ouro" atuais com ferramentas de diagnóstico molecular modernas. DNA LIVRE DE CÉLULAS DERIVADO DE DOADOR (dd- cfDNA) - BIOMARCADOR NÃO INVASIVO
[0741] O DNA livre de células derivado de doador (dd-cfDNA), detectável de forma não invasiva no plasma de pacientes transplantados, é um biomarcador não invasivo comprovado para rejeição ao transplante renal e promete produzir resultados mais rápidos e mais quantitativos em comparação com as opções de tratamento atuais. Com uma meia-vida curta do cfDNA (<1 hora) no sangue, ele oferece uma oportunidade para uma avaliação rápida e dinâmica e um diagnóstico potencialmente precoce da saúde do aloenxerto. Especificamente, tem o potencial de melhorar o uso de biópsias de protocolo, isto é, reduzir biópsias desnecessárias. Além disso, propõe uma possível necessidade de uma biópsia em pacientes com rejeição subclínica que parecem estar clinicamente estáveis, facilitando a personalização dos regimes de tratamento para um resultado ideal.
[0742] O requerente tem experiência comprovada e de longa data no domínio dd-cfDNA que varia de saúde reprodutiva a oncologia e espera aplicar esta tecnologia para ajudar nefrologistas a cuidar melhor de seus pacientes de transplante renal. As seções a seguir apresentam uma visão geral detalhada do KidneyScan, a tecnologia de dd-cfDNA baseada em SNP do requerente, seguida por uma descrição de nossa validação analítica e clínica do ensaio.
PROCESSAMENTO E SEQUENCIAMENTO DE AMOSTRA
[0743] O teste de transplante do requerente mede a fração de DNA livre de células derivado de doador (ddcfDNA) em DNA livre de células total (cfDNA) derivado de plasma sanguíneo de pacientes transplantados. O método é descrito e, desde então, incluiu pequenas atualizações para compatibilidade com o laboratório CLIA do requerente, como a mudança de sequenciador HiSeq para NextSeq. O fluxo de trabalho de plasma inclui extração de cfDNA usando química proprietária interna do requerente, amplificação de biblioteca e amplificação de um conjunto de locais de polimorfismo de nucleotídeo único (SNP) usando PCR massivamente multiplex alvejada. A fração de doador é estimada usando milhares de SNPs localizados nos cromossomos 2, 13, 18 e 21. Os SNPs foram selecionados para alta frequência de alelo menor em várias etnias com base em um grande conjunto de dados de referência. O sequenciamento de alto rendimento é realizado em NextSeq da Illumina, seguido pela demultiplexação e mapeamento para o genoma de referência humano. A estimativa da fração de doador é baseada nas proporções de alelos observadas nos locais de SNP- alvo.
CÁLCULO DE FRAÇÃO DE DOADOR
[0744] A fração do doador é calculada a partir do conjunto de SNPs em que o receptor é homozigótico, com genótipo RR (alelo de referência homozigótico) ou MM (alelo mutante homozigótico). O princípio geral é que, quando o receptor tem o genótipo RR e o doador tem o genótipo RM, a fração observada do alelo M corresponde à metade da fração do doador. Quando o receptor tem o genótipo RR e o doador tem o genótipo MM, a fração observada do alelo M corresponde à fração do doador completa. Quando o receptor e o hospedeiro têm genótipo RR, o SNP não informa a estimativa. O conjunto de combinações de genótipos em que o receptor é MM é interpretado da mesma forma.
[0745] A abordagem matemática é uma estimativa de máxima verossimilhança em um intervalo de pesquisa fixo, combinando dados de SNPs homozigóticos do receptor. A verossimilhança dos dados é calculada para cada fração do doador candidato e a estimativa da fração do doador é o valor candidato que produz a verossimilhança máxima dos dados. Isso pode ser interpretado como a escolha do valor candidato que mais bem explica os dados de sequenciamento observados de acordo com um modelo matemático. As estimativas do genótipo do doador são incorporadas ao cálculo da verossimilhança dos dados com base em suas probabilidades anteriores (com base na população) e nos dados observados. Este método não requer nenhum fator de ajuste heurístico para graus variáveis de relação receptor-doador. No entanto, quando há um relacionamento (indicado no formulário de requisição de teste), restringem-se as probabilidades anteriores do genótipo para refletir a concordância do genótipo necessária.
SUMÁRIO DE DESEMPENHO ANALÍTICO
[0746] O desempenho analítico foi avaliado de acordo com as diretrizes do CLSI. Todos os resultados de desempenho analítico, incluindo exatidão, limite de quantificação e precisão foram satisfatórios no contexto do uso clínico proposto. São destacadas duas constatações importantes dos estudos de desempenho analítico: (1) Desempenho do ensaio em pares relacionados e não relacionados de doador/receptor, uma vez que 10 a 15% dos aloenxertos renais envolvem indivíduos altamente relacionados; (2) Comparação de desempenho com outro ensaio de dd-cfDNA disponível comercialmente que recebeu uma decisão de cobertura limitada positiva (LCD) da MolDx
DESEMPENHO ANALÍTICO EM AMOSTRAS RELACIONADAS VERSUS NÃO RELACIONADAS
[0747] As estimativas de fração de doador baseadas em SNP dependem das diferenças entre os genótipos do receptor e do hospedeiro. Variações das taxas esperadas de diferentes pares de genótipos hospedeiro versus doador podem afetar a exatidão da estimativa e os métodos que usam um número insuficiente de medições de SNP são especialmente suscetíveis a esses riscos. O uso de modelagem probabilística de genótipos pelo KidneyScan combinado com milhares de medições de SNP permite um desempenho equivalente em cenários de doadores relacionados e não relacionados, confirmados por testes em amostras de mistura criadas a partir de indivíduos relacionados. KidneyScan alcança exatidão e precisão equivalentes para doadores relacionados e não relacionados; a única diferença no desempenho está no LoB, levando a uma diferença (mínima) correspondente em LoD e LoQ, que permanecem longe do limite de classificação.
COMPARAÇÃO DO DESEMPENHO ANALÍTICO DO KIDNEYSCAN COM OUTROS ENSAIOS DE dd-cfDNA
[0748] O desempenho analítico do KidneyScan foi comparado a um ensaio de dd-cfDNA disponível comercialmente com o desempenho analítico descrito em Grskovic et al, 2016. A Figura 40 mostra dados de avaliação de exatidão de alta qualidade semelhantes para os dois ensaios, tanto comparando com a PCR de gotícula digital quanto com a medição de referência ortogonal. O KidneyScan é exato em relação à medição de referência, indicada por um ajuste linear com coeficiente angular de aproximadamente 1, interceptação de aproximadamente zero e R ao quadrado de aproximadamente um.
[0749] KidneyScan tem limites analíticos (LoB, LoD, LoQ) semelhantes ao ensaio publicado anteriormente. Além disso, nenhum dos limites relevantes está próximo do limite de classificação a 1%, o que implica que eles não limitarão a precisão clínica. Além disso, o KidneyScan tem melhor repetibilidade (5 vezes) e precisão entre execuções (2,3 vezes) conforme medido pelo CV próximo ao limite de classificação. A Tabela 14 mostra o desempenho para doadores não relacionados porque o estudo de Grskovic não avaliou diretamente o desempenho no caso de doadores relacionados, mas sim, abordou este cenário usando ajuste in silico de medições de doadores não relacionados.
Tabela 14: Comparação de métricas de desempenho-chave de ensaio de dd-cfDNA de KidneyScan e Grskovic. KidneyScan Bloom et al. [Grskovic et al, 2016] Limite de brancos (%) 0,11 0,10 Limite de detecção (%) 0,15 0,15 Limite de quantificação (%) 0,15 0,20 Repetibilidade (na execução) em fração 1,85 9,2 de doador a 0,6% (CV) Precisão interexecução (CV) 1,99 4,5
VALIDADE CLÍNICA
[0750] O presente ensaio demonstrou identificar todos os tipos de rejeição ativa (AR) com maior sensibilidade e especificidade do que a creatinina sérica ou a taxa de filtração glomerular estimada (eGFR), o padrão atual de tratamento. Esta validação de desempenho ressalta o uso potencial do ensaio como (1) uma ferramenta melhor para a identificação precoce e não invasiva de AR; (2) prevenção de biópsia quando for desnecessária (nenhuma constatação acionável) ou contraindicada; e (3) personalização da terapia de imunossupressão. Em resumo, esta seção inclui uma breve descrição da validação clínica que foi conduzida, bem como a discussão de cinco aspectos de desempenho pelos quais este teste foi avaliado clinicamente:
[0751] • 89% de sensibilidade e 73% de especificidade para deteção de AR
[0752] • Alta precisão na detecção de rejeição subclínica com sensibilidade de 92%
[0753] • Mais confiável do que SCr e eGFR para detecção de AR
[0754] • Desempenho de teste independente do tipo de rejeição, incluindo ABMR e TCMR
[0755] • Desempenho de teste independente do tipo de doador, incluindo vivo/falecido e relacionado/não relacionado
[0756] O desempenho do teste foi validado em uma população com ampla diversidade de idade e etnia. Esta é uma vantagem clinicamente significativa do presente estudo em comparação com Bloom et al, 2017, cuja população de pacientes era menos diversificada. Sabe-se que a sobrevivência do enxerto e o gerenciamento do paciente variam de acordo com a etnia, por exemplo, a métrica de eGFR é calculada com base na creatinina sérica (SCr), com ajuste para idade, sexo e etnia. 89% DE SENSIBILIDADE E 73% DE ESPECIFICIDADE
PARA DETEÇÃO DE AR
[0757] Uma comparação do teste de dd-cfDNA do Requerente, o teste de dd-cfDNA descrito em Bloom et al, 2017 e eGFR mostra a superioridade do dd-cfDNA em comparação com o padrão atual (Tabela 15). Também mostra maior sensibilidade, AUC e NPV do ensaio de dd-cfDNA do Requerente em comparação com Bloom, indicando desempenho dos métodos do Requerente que é tão bom ou melhor do que o descrito em Bloom.
Tabela 15: Comparação de desempenho de teste de dd-cfDNA com rGFR Teste de dd-cfDNA Bloom et al, eGFR do Requerente 2017 Nível de corte para > 1% > 1% < 60 identificar AR Desempenho geral Sensibilidade 88,7% (intervalo de 59% (95% de 67,8% (95 de CI, confiança [CI], CI, 44% a 74%) 51,3% a 84,2%) 77,7% a 99,8%) Especificidade 72,6% (95% de CI, 85% (95% de 65,3% (95% de CI, 65,4% a 79,8%) CI, 79% a 91%) 57,6% a 73,0%) AUC 0,87 (95% de CI, 0,74 (95% de 0,74 (95% de CI, 0,80 a 0,95) CI, 0,61 a 0,86) 0,66 a 0,83) PPV* 52,0% (95% de CI, 57% 39,4% (95% de CI, 44,7% a 59,2%) 31,6% a 47,3%) NPV* 95,1% (95% de CI, 86% 85,9% (95% de CI, 90,5% a 99,7%) 75,9% a 92,2%) PPV+ 36,4% (95% de CI, 41 25,6% (95% de CI, 29,6% a 43,1%) 19,4% a 31,9%) NPV+ 97,3% (95% de CI, 92% 92,0% (95% de CI, 94,8% a 99,9%) 88,1% a 95,8%) *Presume uma prevalência de 25% de rejeição (população de risco) +Presume uma prevalência de 15% de rejeição (população de risco inferior)
ALTA PRECISÃO NA DETECÇÃO DE REJEIÇÃO SUBCLÍNICA COM SENSIBILIDADE DE 92%
[0758] A Figura 41 mostra o desempenho do ensaio para o subconjunto de amostras retiradas no momento de uma biópsia de causa e biópsia de protocolo; o desempenho mostrado nas biópsias de protocolo deve refletir o desempenho quando o ensaio é usado na vigilância de rotina, ou seja, quando não há sinais de lesão renal. Esta coorte de 114 amostras mostrou detecção de AR com:
[0759] • sensibilidade de 92,3% (CI de 95%, 64,0% a 99,8%)
[0760] • 75,2% de especificidade (95% CI, 65,7% a 83,3%)
[0761] • 0,89 de área sob a curva (AUC) (95% de CI, 0,76 a 0,99)
[0762] Com base em uma prevalência de rejeição de 25% em uma população de risco, as seguintes projeções de valor podem ser feitas:
[0763] • Valor preditivo positivo (PPV) de 55,4% (CI de 95%, 46,2% a 64,7%)
[0764] • Valor preditivo negativo (NPV) de 96,7% (CI de 95%, 90,6% a 99,9%) MAIS CONFIÁVEL DO QUE SCR E eGFR PARA
DETECÇÃO DE AR
[0765] Os dados mostraram que o ensaio dos Requerentes distingue com precisão entre enxertos AR versus não AR, com a fração de dd-cfDNA significativamente maior no plasma circulante do grupo AR (mediana = 2,32%) do que do grupo sem rejeição (mediana = 0,47%; P<0,0001) (Figura 42). Em contraste com o dd-cfDNA, as pontuações de eGFR não tiveram tanta capacidade discriminatória para diferenciar AR e grupos de não rejeição individuais.
Tabela 16: Estatística de sumário para testes de dd-cfDNA e eGFR Parâmetro Rejeição ativa Não rejeição dd-cfDNA Número de amostras 38 179 (82,5) Média (SD), % 4,64 (5,45) 0,92 (1,28) Mediana, (Faixa), % 2,32 (0,1 a 23,9) 0,47 (0,04 a 6,78) eGFR Número de amostras 38 179 (82,5) Média (SD), pontuação 49,0 (22,3) 77,0 (8,45) Mediana, (Faixa), pontuação 45,67 (8,0 a 100,4) 76,06 (6,4 a 131,1) *Uma amostra tinha informações de ponderação faltantes para calcular eGFR.
DESEMPENHO DE TESTE INDEPENDENTE DO TIPO DE REJEIÇÃO, INCLUINDO ABMR E TCMR
[0766] A Figura 43 mostra a relação entre o nível de dd-cfDNA e o tipo de rejeição. O dd-cfDNA mediano não diferiu significativamente entre os grupos AMBR (2,2%), ABMR/TCMR (2,6%) ou TCMR (2,7%) (P = 0,855). O estudo continha uma faixa de patologias e os dados indicam que este ensaio é robusto a todos os diferentes tipos de rejeição ativa.
[0767] Esses resultados são inovadores, considerando que um estudo conduzido anteriormente por Bloom, et al., 2017, que usou um ensaio diferente, demonstrou uma incapacidade de diferenciar TCMR de STA. Esse estudo encontrou níveis de dd-cfDNA significativamente mais baixos para TCMR (≤ 1,2%) do que para ABMR (2,9%). Esta é uma descoberta clinicamente significativa que diferencia o ensaio do Requerente e apóia a utilidade clínica expandida em relação aos testes atualmente disponíveis no mercado.
DESEMPENHO DO TESTE INDEPENDENTE DO TIPO DE DOADOR, INCLUINDO VIVO/FALECIDO E RELACIONADO/NÃO RELACIONADO
[0768] Dado o projeto do ensaio usado aqui, é possível quantificar o dd-cfDNA sem genotipagem prévia do receptor ou doador. Não houve diferença significativa entre as medianas dos níveis de dd- cfDNA entre qualquer um dos grupos de doadores sem rejeição; embora os grupos de AR parecessem semelhantes entre os grupos de doadores, não havia amostras suficientes para fazer uma comparação estatística (Figura 44). A avaliação dos níveis de dd-cfDNA por tipo de doador revelou que, independentemente do tipo de doador (relacionado vivo, não relacionado vivo, falecido não relacionado), os níveis de dd-cfDNA foram semelhantes em todos os tipos de doador nas categorias de AR e não rejeição.
[0769] Em conclusão, esta tecnologia rápida, precisa e não invasiva permite a detecção de lesão renal clinicamente impactante em pacientes melhor do que o padrão atual de tratamento, com potencial para melhor gerenciamento do paciente, biópsias mais alvejadas e melhora da função e sobrevivência do aloenxerto renal. EXEMPLO 5. UTILIDADE CLÍNICA
[0770] A utilidade clínica da detecção precoce e do tratamento da rejeição ativa do aloenxerto está bem estabelecida. Foram anteriormente descritas as limitações das ferramentas de diagnóstico existentes para detectar rejeição ativa e a necessidade de um teste que seja sensível e não invasivo. O presente ensaio de dd-cfDNA atende a essa necessidade, com utilidade para ser medido em termos de:
[0771] • Menos biópsias desnecessárias (onde não há diagnóstico de AR)
[0772] • Detecção mais frequente de AR subclínica
[0773] • Uso mais direcionado e personalizado da terapia de imunossupressão. Essa mudança provavelmente levará mais tempo para ser observada do que a mudança no uso da biópsia, uma vez que os médicos podem demorar mais para ajustar seus padrões de tratamento de imunossupressão do que suas decisões de biópsia.
COMO O TESTE SERÁ USADO NA PRÁTICA
[0774] É recomendado o uso clínico do teste por médicos sempre que houver suspeita de rejeição, para ajudar a determinar e descartar a rejeição ativa, para informar a necessidade de uma biópsia diagnóstica e para informar as decisões de tratamento quando uma biópsia for contraindicada. A incidência de AR é mais alta nos primeiros 12 meses após o transplante, portanto, é previsto um uso mais frequente nesse período e, em seguida, um uso menos frequente 12 meses após o transplante.
[0775] O tempo de resposta dos resultados do teste será de até 3 dias corridos a partir do recebimento do espécime no laboratório. Estamos altamente confiantes na capacidade de nosso laboratório de processar esses espécimes com velocidade e qualidade, uma vez que já processamos > 1.000 testes de cfDNA diariamente para médicos obstetras ginecologistas para dar suporte ao tratamento de suas pacientes grávidas.
[0776] Os resultados do teste incluirão o nível observado dd-cfDNA (também conhecido como "Fração de doador"), uma comunicação clara da possibilidade de cair acima ou abaixo do corte predeterminado de 1%, uma declaração resumida indicando alto ou baixo risco de rejeição e o risco pós-teste de rejeição estimado usando uma prevalência de AR de fundo de 25%.
COMO O TESTE MUDARÁ A TOMADA DE DECISÃO DO MÉDICO
[0777] Há muitos casos em que os médicos suspeitam de rejeição ativa, mas estão incertos, levando a diagnósticos errôneos, bem como biópsias desnecessárias.
[0778] • Em casos de SCr estável e fração do doador > 1%, acreditamos que os médicos mudarão sua decisão de observação para biópsia, para detectar rejeição subclínica e iniciar o tratamento.
[0779] • Em casos de SCr moderadamente elevada e fração de doador <<1%, acreditamos que os médicos frequentemente mudarão sua decisão da biópsia para a observação e buscarão outras explicações para a função renal diminuída além da rejeição ativa. Está bem estabelecido que a SCr frequentemente retornará aos níveis normais sem qualquer tratamento adicional.
[0780] • Em casos de SCr gravemente elevada (como SCr > 2,5), acreditamos que os médicos farão uma biópsia diagnóstica sem esperar pelo resultado do dd-cfDNA.
[0781] No estudo de Sigdel et al. de 2017, 76% das biópsias clinicamente indicadas (por causa) e 89% das biópsias de vigilância/protocolo não resultaram em diagnóstico de rejeição ativa, implicando que as biópsias eram desnecessárias. Com especificidade geral do teste de 73%, se os médicos tomassem decisões baseadas apenas no resultado do teste de dd-cfDNA, então 73% das biópsias desnecessárias poderiam ter sido evitadas. No entanto, é previsto que os médicos incorporem o resultado de dd- cfDNA como um entre vários fatores na decisão da biópsia, não o único fator. Portanto, hipoteticamente uma parte significativa dessas biópsias desnecessárias será evitada, talvez 40 a 50%. Essa hipótese será avaliada em estudos prospectivos de desfechos, conforme descrito a seguir.
[0782] Os receptores de transplante renal são fundamentalmente uma população de alto risco com ESRD, a necessidade não atendida é alta e o desempenho do teste é forte. O estudo de resultados foi elaborado para responder à questão de quanto a prática clínica mudará, não se mudará. VANTAGEM CLÍNICA: IDENTIFICAÇÃO DE REJEIÇÃO
ATIVA E REJEIÇÃO SUBCLÍNICA
[0783] Os processos imunológicos que levam à rejeição do aloenxerto renal são heterogêneos, causados por respostas imunes humoral e celular. Além de ABMR e TCMR, que são a principal causa de falha do aloenxerto, a rejeição subclínica também está associada à nefropatia crônica do aloenxerto. A rejeição subclínica, definida como rejeição aguda comprovada histologicamente, é considerada a causa mais comum de falência tardia do aloenxerto renal, ocorrendo em 20 a 25% dos pacientes nos primeiros 12 a 24 meses. A probabilidade de rejeição subclínica depende do tempo após o transplante, rejeição aguda anterior, incompatibilidade de HLA e imunossupressão. Um estudo mostrou que pacientes com rejeição subclínica tiveram taxas de sobrevivência do enxerto mais baixas do que pacientes com alterações normais ou limítrofes em 1, 5 e 10 anos.
[0784] O tratamento oportuno da rejeição subclínica tem potencial para alterar o resultado terapêutico a longo prazo da saúde do transplante renal, conforme evidenciado por um estudo que mostrou que o tratamento da rejeição subclínica levou à redução nas rejeições clínicas precoces (meses 2 e 3) e tardias (> 6 meses), uma pontuação tubulointersticial crônica mais baixa em 6 meses e melhor função do enxerto em 2 anos. A principal limitação com o tratamento da rejeição subclínica é que a alta proporção de casos permanece não reconhecida devido à sensibilidade limitada do padrão de tratamento atual, que, por sua vez, requer biópsia de vigilância para um diagnóstico definitivo. Assim, as técnicas de detecção precoce, como o teste de dd-cfDNA, têm potencial para detectar de forma não invasiva a possibilidade de rejeição subclínica, facilitando, assim, melhores resultados de tratamento e aumentando as taxas de sobrevivência do enxerto.
ESTRATIFICAÇÃO DE RISCO DO PACIENTE E UTILIDADE DO dd-cfDNA
[0785] Os receptores de transplante renal representam uma população heterogênea com risco variável de rejeição e infecção com base em subgrupos de pacientes. Abaixo estão alguns dos fatores que influenciam coletivamente a classificação de paciente de risco de rejeição por um médico
[0786] • Formação de novo de anticorpo específico do doador (dnDSA)
[0787] • Fibrose intersticial e atrofia tubular (IF/TA)
[0788] • Função retardada do aloenxerto
[0789] • Anticorpo reativo do painel (PRA) > 30%
[0790] • Terapia imunossupressora inadequada
[0791] • Nefrotoxicidade do inibidor de calcineurina
[0792] • Doença subjacente
[0793] • Doador falecido
[0794] • Idade do receptor mais jovem
[0795] • Idade do doador mais velho
[0796] • Etnia afroamericana
[0797] • Tempo de isquemia fria > 24 horas
[0798] • Incompatibilidade de HLA
[0799] • Incompatibilidade de ABO
[0800] O regime de tratamento para cada paciente é altamente variável e depende da categoria de risco. No momento, não existem diretrizes claras que possam estratificar os pacientes em diferentes grupos de risco. Em geral, os pacientes com maior risco de rejeição são monitorados mais de perto e seu grenciamento é feito exclusivamente a critério do médico. Isso leva a uma alta variabilidade com resultados não ideais em muitas situações. Os métodos do requerente podem ser altamente eficazes para atender a essa necessidade não atendida, em que o dd-cfDNA pode otimizar e permitir que os médicos tomem uma decisão bem informada ao estratificar os pacientes em grupos de risco, melhorar a variabilidade do tratamento e evitar biópsias desnecessárias.
[0801] Além de aumentar a probabilidade de sobrevivência a longo prazo do enxerto, a detecção precoce de lesão ativa pelo dd-cfDNA tem outros benefícios potenciais. Um ensaio de dd-cfDNA preciso pode ajudar os médicos a gerenciar a saúde do aloenxerto renal, mantendo uma dose minimamente eficaz de imunossupressores para prevenir a rejeição, enquanto evita suas complicações associadas, como:
[0802] • Viremia BK
[0803] • Maior suscetibilidade a outras infecções
[0804] • Nefrotoxicidade do inibidor de calcineurina
[0805] • Incidência aumentada de câncer
[0806] Estudos que examinam a morbidade e mortalidade em receptores de aloenxerto de longo prazo demonstram que as doenças cardiovasculares e o câncer são as duas causas mais comuns de morte. Modelos de estratificação de risco foram propostos para implementar perfis de risco individuais para adequar os tratamentos imunossupressores e antibacterianos. Acredita-se que o teste irá apoiar a redução acelerada da imunossupressão, para pacientes com níveis de dd-cfDNA consistentemente <1%.
ESTUDOS DE APOIO ATUALMENTE EM ANDAMENTO
[0807] A fim de fornecer evidências adicionais da utilidade clínica do teste de dd-cfDNA do Requerente, dois estudos estão atualmente em andamento, cujos resultados serão encaminhados para publicação revisada por pares.
1. ENSAIO RANDOMIZADO CONTROLADO DE UTILIDADE CLÍNICA DE dd-cfDNA
[0808] a. Linha de tempo: Resultados preliminares esperados no início de 2019
[0809] b. Projeto: Pré-pós, ensaio controlado de duas rodadas de práticas de tratamento em uma amostra nacionalmente representativa de nefrologistas praticantes. Os nefrologistas gerenciam casos virtuais de pacientes antes e depois de receberem informações sobre o ensaio de dd-cfDNA e os resultados dos testes.
[0810] c. Objetivo(s):
[0811] i. Determinar os protocolos de gerenciamento atuais e as variações no gerenciamento pós-transplante entre nefrologistas praticantes
[0812] ii. Avaliar o impacto do biomarcador dd-cfDNA inovador no gerenciamento do paciente
[0813] d. Resultado(s) esperado(s):
[0814] i. Os nefrologistas são altamente variáveis em sua capacidade e abordagem para avaliar a saúde renal e o estado de rejeição ao transplante
[0815] ii. O teste de rejeição ao transplante do requerente melhorará o gerenciamento do paciente em casos de uso importantes, permitindo que os nefrologistas monitorem melhor a saúde dos pacientes pós-transplante renal e otimizem o uso de biópsia e regimes imunossupressores.
2. ESTUDO DE REGISTRO DE dd-cfDNA
[0816] a. Linha de tempo: Cinco anos para conclusão de leitura de estudo, com leitura anual.
[0817] b. Projeto: 1.500 pacientes testaram em 1, 2, 3, 4, 6, 9 e 12 meses pós-transplante e trimestralmente em seguida. O sangue também foi coletado no momento e um mês após as biópsias causais. Os pacientes foram acompanhados por três anos.
[0818] c. Objetivo: mostrar mudança na prática clínica e melhores resultados
[0819] d. Pontos finais do estudo primário:
[0820] i. Uso de biópsia de precisão (% de biópsias resultando em diagnóstico de rejeição ativa)
[0821] ii. Tomada de decisão do médico (com e sem resultado de cfDNA)
SUMÁRIO
[0822] As limitações do padrão de tratamento atual para monitorar lesão ativa/precoce em pacientes pós-transplante renal afetam o resultado de sobrevivência do enxerto a longo prazo. Os avanços médicos que melhoraram a taxa de sobrevivência do enxerto renal em curto prazo não afetaram as taxas de sobrevivência do enxerto a longo prazo. Além disso, a literatura atual apóia a evidência de que a rejeição subclínica é uma causa subjacente para resultados clínicos adversos que levam à rejeição do enxerto a longo prazo.
[0823] dd-cfDNA é um biomarcador ideal para adicionar ao gerenciamento pós-transplante de rejeição ativa, pois pode detectar de forma não invasiva rejeição ativa precoce e rejeição subclínica com sensibilidade e especificidade superiores em comparação com creatinina sérica e eGFR. Isso permite a adaptação oportuna do regime imunossupressor com base no estado inflamatório do enxerto, fornecendo uma abordagem mais personalizada para minimizar a incidência de rejeição e os efeitos colaterais indesejados. A análise frequente, combinada com a detecção precoce, pode melhorar a função do aloenxerto a longo prazo e diminuir o número de biópsias desnecessárias em pacientes estáveis. EXEMPLO 6. TESTE DE DNA LIVRE DE CÉLULAS DERIVADO DE DOADOR DE KIDNEYSCAN®
SUMÁRIO DA EVIDÊNCIA
[0824] Em 2016, foram realizados mais de 20.000 transplantes renais nos Estados Unidos. Além disso, mais de 80.000 candidatos à cirurgia estavam em diálise enquanto esperavam por um rim disponível. Após o transplante, os pacientes são colocados em terapia com fármacos imunossupressores e monitorados rotineiramente para prolongar a sobrevivência do rim do doador. Apesar dos protocolos estabelecidos, as taxas de sobrevivência do aloenxerto dez anos após o transplante são estimadas em 48% para doadores falecidos e 65% para doadores vivos.
[0825] Os avanços no transplante renal e nos cuidados pós-transplante continuaram a melhorar o funcionamento dos órgãos e as taxas de sobrevivência ao longo do tempo. Embora isso tenha sido mais evidente no tratamento bem-sucedido da rejeição renal aguda no primeiro ano após o transplante, o sucesso após este período de tempo permaneceu relativamente inalterado por décadas (taxas de falha de 3 a 5% ao ano para doador falecido e 2 a 3% ao ano para rins de doadores vivos). Lesão renal, levando a danos irreversíveis e eventual perda do enxerto, costuma ser assintomática por semanas ou meses e pode ser desafiador detectar o padrão atual de cuidado de medição dos níveis de creatinina sérica (SCr) ou seu derivado algorítmico, taxa de filtração glomerular estimada (eGFR). Ambos têm limitações significativas para a detecção precoce de lesões.
[0826] O teste KidneyScan detecta DNA livre de células derivado de doador (dd-cfDNA) no sangue de um receptor, que é elevado durante a rejeição ativa devido ao aumento da morte celular no órgão. KidneyScan é um método eficaz e não invasivo de avaliação do estado do aloenxerto renal com melhor desempenho do que o padrão atual de tratamento.
DESCRIÇÃO E DESEMPENHO DO TESTE DE DNA LIVRE DE CÉLULAS DERIVADO DE DOADOR DE KIDNEYSCAN
[0827] O ensaio KidneyScan é um ensaio de sequenciamento de última geração baseado em DNA livre de células que analisa mais de 13.000 polimorfismos de nucleotídeo único (SNPs) para quantificar com precisão a fração de dd-cfDNA no sangue do receptor de transplante, mesmo em pares relacionados de receptor/doador, sem genotipagem separada de doador ou receptor. A fração de dd-cfDNA em cfDNA pode ser medida com um tempo de resposta de 5 dias ou menos; esse tempo de resposta é necessário para o gerenciamento adequado dos receptores de transplantes.
[0828] O desempenho clínico do KidneyScan foi avaliado em uma análise retrospectiva de 217 amostras de 178 receptores exclusivos de transplante cujo transplante de rim foi realizado no Centro Médico da Universidade da Califórnia em São Francisco (UCSF). Os dados mostraram que os níveis de dd-cfDNA em pacientes com rejeição ativa (AR) foram significativamente maiores do que em pacientes com aloenxerto estável
(STA), limítrofe (BL) ou outra lesão (OI). É importante ressaltar que a tendência foi clara independentemente do tipo de rejeição - rejeição mediada por anticorpos (ABMR) ou rejeição mediada por células T (TCMR). Acredita-se que os níveis elevados de dd-cfDNA sejam indicativos de lesão em curso no órgão transplantado. Portanto, foi analisada a capacidade do ensaio de detectar AR versus não rejeição, em que a não rejeição é definida como todas os espécimes classificados como STA, BL ou OI.
[0829] A quantidade de dd-cfDNA foi significativamente maior no plasma circulante do grupo de AR (mediana = 2,32%) em comparação com o grupo de não rejeição (mediana = 0,47%; P<0,0001).
[0830] Usando-se um corte de dd-cfDNA predeterminado de 1%, os dados mostraram que o ensaio de KidneyScan tinha uma sensibilidade de 88,7% (intervalo de confiança [CI] de 95%, 77,7% a 99,8%) e especificidade de 72,6% (CI de 95%, 65,4% a 79,8%) para detecção de AR. A área sob a curva (AUC) foi de 0,87 (CI de 95%, 0,80 a 0,95). Com base em uma prevalência de rejeição de 25% em uma população de risco, o valor preditivo positivo (PPV) foi projetado como sendo 52,0% (CI de 95%, 44,7% a 59,2%) e o valor preditivo negativo (NPV) foi projetado como sendo 95,1% (CI de 95%, 90,5% a 99,7%).
[0831] Além disso, o desempenho do ensaio de KidneyScan para o subconjunto de 114 amostras coletadas no momento de uma biópsia de protocolo, que se espera que reflita o desempenho quando o ensaio é usado na vigilância de rotina, mostrou detecção de AR com sensibilidade de 92,3% (CI de 95%, 64,0% a 99,8%), especificidade de 75,2% (CI de 95%, 65,7% a 83,3%) e uma área sob a curva de 0,89 (AUC) (CI de 95%, 0,76 a 0,99). Com base em uma prevalência de rejeição de 25% em uma população de risco, o PPV foi projetado em 55,4% (CI de 95%, 46,2% a 64,7%) e o NPV foi projetado em 96,7% (CI de 95%, 90,6% a 99,9%). Esses dados sugerem que a aplicação do ensaio de KidneyScan em um ambiente clínico pode reduzir potencialmente a necessidade de biópsias de protocolo. Também pode ser apropriado para uso pós-rejeição para determinar se a dosagem de imunossupressor levou à eliminação do episódio de rejeição, no lugar da biópsia.
[0832] O dd-cfDNA mediano não diferiu significativamente entre os diferentes tipos de rejeição: Grupos AMBR (2,2%), ABMR/TCMR (2,6%) ou TCMR (2,7%) (P = 0,855). Esses resultados são inovadores, considerando que um estudo anterior, usando um ensaio diferente, encontrou níveis de dd-cfDNA significativamente mais elevados para ABMR (2,9%) do que para TCMR (≤ 1,2%), indicando uma incapacidade de detectar rejeições mediadas por células T. Embora o ensaio usado nesse estudo também tenha medido dd-cfDNA, os métodos usados pelos dois ensaios diferem significativamente. Não está claro se aquele teste não conseguiu diferenciar a AR da não rejeição nos casos de TCMR ou se o resultado foi devido ao menor tamanho da amostra daquele grupo naquele estudo (n = 11). Independentemente disso, o ensaio de KidneyScan pode discriminar com precisão a AR da não rejeição em uma variedade de patologias, incluindo constatações agudas e crônicas, nos grupos ABMR e TCMR.
[0833] O desempenho analítico e clínico do ensaio de KidneyScan é resumido abaixo.
GENERALIDADES
[0834] Uso pretendido. O teste de KidneyScan destina-se a complementar a avaliação e o gerenciamento de lesão e rejeição ativa renais em pacientes submetidos a transplante renal. Ele pode informar a tomada de decisão junto com avaliações clínicas padrão
[0835] Tipo de espécime. Plasma coletado em tubos Streck Cell-Free DNA BCT®
RESULTADOS DE DESCRIÇÃO
[0836] Exatidão.
[0837] Doador não relacionado:
[0838] Coeficiente angular = 1,0664 (CI de 95% 0,9416, 1,1912)
[0839] Interceptação = 0,0008 (CI de 95% - 0,0076, 0,0092)
[0840] R ao quadrado = 0,9997 (CI de 95% 0,9997, 0,9998)
[0841] Doador relacionado:
[0842] Coeficiente angular = 1,0333 (CI de 95% 0,9241, 1,1425)
[0843] Interceptação = - 0,0001 (95% CI - 0,0047, 0,0046)
[0844] R ao quadrado = 0,9989 (CI de 95% 0,9986, 0,9990)
[0845] A precisão foi avaliada usando-se regressão linear em relação à PCR digital de gotículas (ddPCR) (para CNV2 usando sondas específicas para o cromossomo 1 como referência e cromossomo Y como desconhecido) como método de referência. Três misturas de referência de linhagem celular (1 doador relacionado, 2 doadores não relacionados) em frações de mistura de 0,1% a 15% foram executadas em triplicatas mínimas a 15, 30, 45 ng de massa de DNA de entrada. O número total de medições foi de 285 não relacionadas e 349 relacionadas. PRECISÃO INTERMEDIÁRIA (VARIABILIDADE TOTAL INTERENSAIO)
[0846] Quantitativo:
[0847] CV médio com entrada de 15 ng = 3,10% (CI de 95% - 1,58%, 4,37%)
[0848] CV médio com entrada de 30 ng = 3,07% (CI de 95% - 1,42%, 4,50%)
[0849] CV médio com entrada de 45 ng = 1,99% (CI de 95% - 1,10%, 2,75%)
[0850] Qualitativo: 100% de concordância (95% de CI - 54,07%, 100%) entre réplicas de 6 amostras de pacientes transplantados.
[0851] Para avaliar quantitativamente a precisão entre execuções, foram usados 3 painéis de referência (2 não relacionados, 1 relacionado) com 15, 30, 45 ng de massa de DNA de entrada a 0,1, 0,3, 0,6, 1,2, 2,4, 5, 10% de frações de doador. Um total de 24 execuções (em 23 dias) em 17 instrumentos por diferentes operadores usando diferentes lotes de reagentes foram realizadas. Amostras de entrada de 15 ng foram executadas com 12 réplicas, enquanto amostras de entrada de 30 e 45 ng foram executadas com 6 réplicas, resultando em 248, 124, 126 medições para 15 ng, 30 ng, 45 ng de massa de DNA de entrada, respectivamente. Para avaliar qualitativamente a precisão entre execuções, 6 amostras de pacientes de transplante foram analisadas com entrada variável (20 ml de sangue, cada) em duplicatas, resultando em 12 medições.
ENTRADA DE SENSIBILIDADE MÍNIMA
[0852] 15 ng de entrada mínima testada em amostras em que a concentração de entrada de cfDNA foi medida.
LIMITE DE DETECÇÃO
[0853] 0,15% de doador não relacionado
[0854] 0,29% de doador relacionado
[0855] O limite de detecção foi avaliado a partir de 3 painéis de referência de linhagem celular (2 não relacionados, 1 relacionado) em 15, 30, 45 ng de massa de DNA de entrada e 16 misturas de cfDNA derivado de plasma em massa de entrada variável, em frações de mistura de 0,1, 0,3, 0,6%. As amostras foram executadas em triplicatas mínimas por dois operadores usando dois lotes de reagentes, para um total de 168 (94 do Lote 1, 74 do Lote 2) e 220 (115 do Lote 1, 105 do Lote 2) medições para doadores não relacionados e relacionados, respectivamente. As amostras de cada lote de reagente foram avaliadas usando cada um dos dois métodos de dfe, doador não relacionado e doador relacionado. Os valores de LoD para cada lote e cada método de dfe são calculados usando os valores de LoB do método correspondente. Para cada método, o LoD final é o máximo dos valores de LoD dos lotes 1 e 2 calculados com o método correspondente. Os cálculos seguiram o método paramétrico descrito em EP17A2.
LIMITE INFERIOR DE QUANTIFICAÇÃO
[0856] Limites inferiores:
[0857] 0,15% de doador não relacionado
[0858] 0,29% de doador relacionado
[0859] O limite inferior é avaliado no mesmo conjunto de amostra usado para LoD, com uma gama mais ampla de frações de mistura. Especificamente, as amostras de referência foram testadas em frações de mistura 0,1, 0,3, 0,6, 1,2, 2,4, 5, 10, 15% e as misturas de cfDNA derivadas de plasma foram testadas em frações de mistura de 0,1, 0,3, 0,6, 1,2, 2,4, 5, 10%. As amostras foram executadas em triplicatas mínimas por dois operadores usando dois lotes de reagentes, para um total de 381 (207 do Lote 1, 174 do Lote 2) e 412 (239 do Lote 1, 173 do Lote 2) medições para doadores não relacionados e relacionados, respectivamente. O limite inferior é definido como o valor mais baixo da fração de doador em que o CV de medição (definido como o desvio padrão de medição dividido pela média) é inferior a 20%. O requisito é satisfeito em toda a faixa testada, para cada lote de reagente e método de dfe, de modo que o LoQ inferior seja igual ao LoD pela restrição de que não pode ser menor.
LIMITE SUPERIOR DE QUANTIFICAÇÃO
[0860] Limite superior de quantificação = 15% para doadores não relacionados e relacionados com base no valor mais alto testado.
FAIXA DE REFERÊNCIA
[0861] A faixa de referência definida como 0 a 1% com base em tecnologia previamente publicada e aprovada usando o mesmo analito com a população de pacientes correspondente [Bromberg et al, 2017].
SUBSTÂNCIA DE INTERFERÊNCIA
[0862] A interferência do transporte de etanol em excesso e de EDTA em excesso na reação de PCR multiplex foi avaliada usando o protocolo de cfDNA do requerente. O efeito inibidor na reação de mmPCR foi observado na concentração de etanol de 5% e superior e concentração de EDTA de 10 mM e superior. As amostras visualmente hemolisadas são excluídas do processamento. VIDA ÚTIL CRÍTICA DO REAGENTE E (CONFORME APLICÁVEL) ESTABILIDADE ABERTA
[0863] Estudos de estabilidade em tempo real foram usados para estabelecer a vida útil do pool de iniciador de mmPCR. O prazo de validade recomendado pelo fabricante é usado para reagentes adquiridos de fornecedores terceirizados (mistura-mestre de PCR, enzimas e tampões de preparação de biblioteca, iniciadores e reagentes de NGS padrão para sequenciamento). A estabilidade do reagente é monitorada adicionalmente por métricas de controle de qualidade em linha em cada execução. Os procedimentos de qualificação de reagentes de entrada foram estabelecidos para todos os reagentes críticos (pool de iniciadores, enzimas de PCR, enzimas de preparação de biblioteca, iniciadores e reagentes de NGS padrão para sequenciamento) no fluxo de trabalho e apenas reagentes pré- qualificados, dentro das datas de validade estabelecidas, são usados no processamento de amostras. ESTABILIDADE DE ESPÉCIME: AMOSTRA PRIMÁRIA
[0864] A estabilidade da amostra primária foi estabelecida usando análise retrospectiva de dados derivados do protocolo de cfDNA do Requerente usando 227.450 amostras processadas entre 1 e 8 dias após a coleta. Os dados foram categorizados com base na idade após a coleta da amostra e o desempenho foi comparado em diferentes pontos no tempo após a coleta. A idade máxima aceitável da amostra para sangue coletado usando tubos Streck BCT foi estabelecida em 8 dias com base na análise acima.
ESTABILIDADE DE ESPÉCIME: INTERMEDIÁRIA
[0865] A estabilidade intermediária da amostra para plasma armazenado a - 80 ºC e bibliotecas de cfDNA armazenadas a - 20 ºC foram estabelecidas usando análise de dados retrospectiva e resultados concordantes do protocolo de cfDNA do Requerente com o ponto no tempo original. A estabilidade do plasma a - 80 ºC é de 25 a 27 meses; a estabilidade da biblioteca de cfDNA a - 20 ºC é de 26 a 30 meses DESEMPENHO CLÍNICO: VALIDADE Descrição Resultados (com intervalos de confiança de 95%, se aplicável)* Rejeição ativa Em coorte de biópsia de protocolo vs sem rejeição Sensibilidade 88,7% (77,7% a 99,8%) 92,3% (64,0% a 99,8%) Especificidade 72,6% (65,4% a 79,8%) 75,2% (65,7% a 83,3%) NPV 95,1% (90,5% a 99,7%) 96,7% (90,6% a 99,9%) PPV 52,0% (44,7% a 59,2%) 55,4% (46,2% a 64,7%%)
[0866] A quantidade de dd-cfDNA foi significativamente maior no plasma circulante do grupo de AR (mediana = 2,32%) em comparação com o grupo de não rejeição (mediana = 0,47%; P<0,0001). O dd-cfDNA mediano não diferiu significativamente entre os diferentes tipos de rejeição: Grupos AMBR (2,2%), ABMR/TCMR (2,6%) ou TCMR (2,7%) (P = 0,855). Os dados demonstram que o ensaio de KidneyScan pode discriminar com precisão a AR da não rejeição em uma faixa de patologias, incluindo constatações agudas e crônicas, nos grupos ABMR e TCMR.
[0867] Pelo menos 2 semanas após o transplante para permitir que qualquer lesão renal ocorrida imediatamente na cirurgia ou como resultado de origem cadavérica se resolva antes do teste. Os dados do KidneyScan são atualmente ambíguos neste período. Por esse motivo, e para ser consistente com outros testes dd-cfDNA disponíveis comercialmente, são adotados esse critério para fins de segurança do paciente e integridade de dados. EXEMPLO 7. DESCRIÇÃO ADICIONAL DE
TECNOLOGIA PROCESSAMENTO E SEQUENCIAMENTO DE AMOSTRA
[0868] O sangue total é coletado em Streck Cell-Free DNA BCT (tubos de coleta de sangue) e enviado ao laboratório CAP/CLIA do Requerente, em que é processado usando as seguintes etapas.
[0869] • As amostras de sangue do paciente são centrifugadas para separar o plasma das células sanguíneas
[0870] • A química de extração proprietária interna do requerente é usada para extração de cfDNA de plasma
[0871] • O cfDNA extraído é subsequentemente transformado em uma biblioteca por ligação de adaptadores seguida de amplificação por PCR para aumentar o cfDNA disponível total
[0872] • O conjunto selecionado de milhares de locais de SNP é amplificado por PCR multiplex massivamente alvejada (mmPCR)
[0873] • As amostras amplificadas são convertidas em código de barras, multiplexadas e sequenciadas usando a tecnologia de NGS (Illumina NextSeq, leituras de SE de 50 ciclos)
[0874] O protocolo de mmPCR usa a química proprietária do Requerente e as condições de amplificação para obter amplificação uniforme em todo o conjunto-alvo e, ao mesmo tempo, manter uma taxa de erro introduzida de PCR extremamente baixa. A aplicação de uma abordagem de mmPCR semelhante para testes pré-natais não invasivos foi publicada em vários estudos e resultou em mais de um milhão de resultados de testes de pacientes. Os SNPs foram selecionados por alta frequência de alelo variante em diferentes etnias (Figura 45). Os amplicons de PCR são convertidos em código de barras para permitir a multiplexação no nível da amostra e as amostras convertidas em códigos de barras são dispostas em pool e, em seguida, sequenciadas usando o instrumento Illumina NextSeq, 50 ciclos, leituras de extremidade única. A Figura 45 mostra distribuições cumulativas de frequência de alelo menor de SNP de acordo com a etnia.
ANÁLISE DE SEQUENCIAMENTO
[0875] As leituras sequenciadas são demultiplexadas e mapeadas para o genoma de referência humano padronizado (hg19) usando Novoalign versão 2.3.4. As bases são filtradas com base na pontuação de qualidade de Phred e as leituras são filtradas com base na pontuação de qualidade do mapeamento. Múltiplas verificações de qualidade em métricas, como densidade de agrupamento e taxa de mapeamento, são aplicadas à execução de sequenciamento e cada amostra é confirmada como tendo obtido o número mínimo necessário de leituras após a filtragem.
[0876] De cada sequência lida, é extraído apenas o alelo observado na posição de SNP-alvo. O alelo é etiquetado como referência ou mutante seguindo as definições no genoma de referência hg19 e todos os cálculos a seguir são baseados no conjunto de contagens de alelo de referência e mutantes. Em cada SNP, a fração das contagens de referência em comparação com o total é definida como a razão de alelos do SNP.
CÁLCULO DE FRAÇÃO DE DOADOR
[0877] O cálculo da fração do doador começa estimando os genótipos do receptor e eliminando SNPs em que o receptor é heterozigótico (razão de alelos entre 30% e 70% (Figura 46)). Define-se o genótipo de referência homozigótico como RR, o genótipo mutante homozigótico como MM e o genótipo heterozigótico como RM. A fração do doador é calculada a partir do conjunto de SNPs em que o receptor é homozigótico, por um método baseado na consideração de todos os possíveis genótipos do doador.
[0878] Quando a fração do doador é aproximadamente zero, as razões de alelos observados simplesmente refletem os genótipos do receptor e, portanto, todos os SNPs em que o receptor é homozigótico têm razão de alelo de aproximadamente zero ou 1 (Figura 47).
[0879] A probabilidade de uma fração de doador candidata é definida como a probabilidade de produzir os dados de sequenciamento observados de acordo com um modelo matemático de como os dados dependem da fração de doador. Presume-se que os dados de cada SNP sejam independentes, condicionados à fração de doador, o que implica que a probabilidade combinada é o produto das probabilidades calculadas em cada SNP.
[0880] O cálculo da probabilidade em um único SNP incorpora duas fontes de incerteza: os genótipos doadores e os dados de sequenciamento. Os genótipos doadores são modelados probabilisticamente pela soma do conjunto de genótipos possíveis e ponderação de acordo com a probabilidade anterior, definido pelas frequências de alelos menores da população. Os dados de sequenciamento são modelados usando uma distribuição binomial com uma função da razão alélica esperada e do número medido de leituras, dado um genótipo de doador presumido e taxas de erro estimadas devido ao sequenciamento mais PCR.
MATERIAIS E EQUIPAMENTO
[0881] Os principais equipamentos e reagentes usados na execução deste ensaio são detalhados na Tabela 17.
Tabela 17: Equipamento e reagentes críticos Item Fabricante Uso NextSeq Instruments Illumina Sequenciamento de próxima geração Termociclador GeneAmp PCR Thermo Preparação de biblioteca e System 9700 Fisher amplificação de PCR Cartucho de alta saída NextSeq Illumina Sequenciamento de próxima geração v2, 75 ciclos Cartucho de tampão NextSeq Illumina Sequenciamento de próxima geração 500/500 v2 Célula de fluxo NextSeq Illumina Sequenciamento de próxima geração Kit de preparação de biblioteca Natera Preparação de biblioteca a partir de Natera cfDNA Kit de extração de cfDNA Natera Natera Extração de cfDNA de plasma Pool de iniciador de mmPCR Natera Amplificação alvejada de locais de
SNP EXEMPLO 8. DETERMINAÇÃO APRIMORADA DE
REJEIÇÃO AO TRANSPLANTE USANDO UMA MÉTRICA DE LIMITE QUE LEVA EM CONSIDERAÇÃO A MASSA CORPORAL DO PACIENTE.
[0882] Os dados adquiridos no Exemplo 6 foram avaliados usando um limite baseado em cópias de doador/ml e um limite adicional que leva em consideração adicionalmente a massa corporal do paciente. Os dados do Exemplo 6 foram derivados de 217 amostras de biópsia compatibilizadas (193 pacientes), das quais 38 amostras apresentaram rejeição ativa ou aguda (AR) e 179 mostraram não rejeição (Não AR). O cfDNA foi quantificado para 215 das amostras e a massa do paciente foi medida para 123 das amostras (excluindo pediátrica). Os dados destas 123 amostras são mostrados na Tabela 18 abaixo.
Tabela 18. Reanálise de dados de 123 pacientes dos quais a massa corporal foi medida. Conjunto Original Conjunto novo Amostra % de conjunto Amostras % de conjunto AR 38 18% 31 25% NÃO AR 179 82% 92 75% BL 72 33% 64 52% OI 25 12% 18 15% STA 82 38% 10 8% Total 217 83,9% Sensibilidade 86,8%* 83,9% Especificidade 70,9% 75,0% AR de protocolo 12 de 13 90 de 10 *Recalculado de dados brutos sem considerar múltiplas amostras do mesmo paciente
[0883] Os dados foram primeiro analisados usando cópias derivadas de doadores/ml, que foram calculadas da seguinte forma: (ng de cfDNA) / (3,3 pg / genoma haploide) * (% de dd-cfDNA) / (ml de plasma).
[0884] Para levar em consideração a massa corporal do paciente, os dados foram analisados usando cópias derivadas do doador / ml * Massa do Paciente (abreviado como “cópias do doador/ml * kg”), que foi calculado da seguinte forma: (ng de cfDNA) / (3,3 pg / genoma haploide) * (% de dd-cfDNA) / (ml de plasma) * (kg de paciente). Esta análise considera o volume de sangue do hospedeiro (aproximado usando a massa do paciente) diluindo um sinal de uma massa de transplante fixa.
[0885] Conforme mostrado na Tabela 19 abaixo, um limite de 976 cópias do doador/ml * kg e um limite de 13,4 cópias do doador/ml corresponde a um limite de 1,00% de dd-cfDNA.
Tabela 19 Mediana Mín. Máx. Limite Ng de cfDNA/ml 4,0 0,2 353 N/A % de dd-cfDNA 0,62% 0,02% 23,90% 1,00% Cópias de doador/ml 9,9 0,6 857 13,4 Cópias de doador/ml*kg 727 40 68,544 976
[0886] A análise dos dados do Exemplo 6 usando a métrica de cópias do doador/ml e a métrica de cópias do doador/ml * kg como o limite fixo em vez de % de dd-cfDNA resultou na sensibilidade e especificidade como mostrado na Figura 48. O uso de % de dd-cfDNA como a métrica de limite resultou em uma sensibilidade de 83,9% e uma especificidade de 75,0%, e as rejeições ativas de protocolo foram corretamente chamadas de 9 de 10. O uso de cópias de doador/ml como a métrica de limite resultou em uma sensibilidade de 83,9% e uma especificidade de 75,0%, e as rejeições ativas de protocolo foram corretamente chamadas de 9 de 10. O uso de cópias de doador/ml * kg como a métrica de limite resultou em uma sensibilidade de 77,4% e uma especificidade de 72,8%, e as rejeições ativas do protocolo foram corretamente chamadas de 9 de 10. Analisar os dados usando cópias de doador/ml ou cópias de doador/ml * kg como a métrica de limite chamou corretamente uma rejeição ativa de protocolo e uma rejeição mediada por células T perdida por % de dd-cfDNA (mostrado com setas pretas na Figura 48). EXEMPLO 9. DESENVOLVIMENTO DE UM LIMITE
ESCALONADO PARA MELHORAR O DESEMPENHO NO MONITORAMENTO DE TRANSPLANTES, QUANTIFICANDO cfDNA DERIVADO DE DOADOR.
[0887] O objetivo deste Exemplo é desenvolver um limite escalonado ou dinâmico dependendo de ng de cfDNA/ml nas amostras de sangue obtidas dos pacientes. Observou-se que a baixa entrada de % de dd-cfDNA influenciou na % de dd-cfDNA estimada. Em particular, a análise da relação entre % de dd-cfDNA estimada e entrada de % de dd-cfDNA revelou que abaixo de 9 ng de entrada de cfDNA, o pipeline estimado de % de dd- cfDNA aumentou.
[0888] Além disso, parecia haver uma relação linear entre % de dd-cfDNA, cópias do doador/ml ou cópias do doador/ml*kg e a quantidade de cfDNA (ng de cfDNA/ml) nas amostras de sangue, como mostrado na Figura 49. Para testar ainda mais se o valor limite varia dependendo de ng de cfDNA/ml de plasma, os dados da amostra foram estratificados de acordo com os quartis de ng de cfDNA/ml de plasma como mostrado na Figura 50. A estratificação dos dados com base em ng de cfDNA/ml de plasma mostrou claramente que o desempenho poderia ser melhorado escalonando o valor limite para os diferentes quartis de quantidade de cfDNA. A Figura 52, mostrou que o efeito da estratificação dos dados é semelhante para a rejeição mediada por anticorpos (ABMR) e a rejeição mediada por células T (TCMR). Conforme ilustra a Figura 51, as amostras de rejeição ativa ou aguda (AR) e de não rejeição (NÃO AR) foram distribuídas entre os quartis ou octeis da quantidade de cfDNA.
[0889] Quando a métrica de limite de % de dd-cfDNA é usada, os resultados apresentados na Figura 50 mostraram que à medida que o ng de cfDNA/ml aumenta, a especificidade aumenta e a sensibilidade diminui. A análise usando a métrica de limite de % de dd-cfDNA perdeu uma rejeição ativa de protocolo em Q4. A Tabela 20 abaixo mostra resultados mais detalhados da comparação do uso de limite fixo versus dinâmico para o limite de % de dd-cfDNA.
TABELA 20: COMPARAÇÃO DE LIMITE FIXO E LIMITE ESCALONADO PARA A MÉTRICA DE LIMITE DE % DE DD-CFDNA.
Limite Fixo Limite Escalonado Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Geral Limite 1,00% 1,33 1,00% 0,66 Fixo Escal % % onado Sensibil 100% 100% 90% 43% 86% 100 90% 71% Sensibilid 83,9 87,1% idade % ade % Especifi 70% 64% 85% 83% 83% 64% 85% 75% Especifici 75,0 76,1% cidade dade % ARs de 9/10 9/10 protocolo
[0890] Para a métrica de limite de cópias do doador/ml, a análise apresentada na Figura 50 mostrou que tanto a sensibilidade quanto a especificidade aumentaram com o aumento de ng de cfDNA/ml de plasma. A análise usando métrica de limite de cópias de doador/ml perdeu uma rejeição ativa de protocolo em Q1. A Tabela 21 abaixo mostra resultados mais detalhados da comparação do uso de limite fixo versus dinâmico para a métrica de limite de cópias de doador/ml.
TABELA 21: COMPARAÇÃO DE LIMITE FIXO E LIMITE ESCALONADO PARA A MÉTRICA DE LIMITE DE CÓPIAS DO DOADOR/ML. Limite Fixo Limite Escalonado Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Geral Limite 13,4% 5,0 13,4 25,0 Fixo Escalo nado Sensibil 29 100 100 100 71 100 100 86% Sensibilid 83,9 90,3% idade % % % % % % % ade % Especifi 96 80% 75% 50% 83 80% 75% 71% Especifici 75,0 77,2% cidade % % dade % ARs de 9/10 10/10 protocolo
[0891] Para a métrica de limite de cópias de doador/ml*kg, a análise apresentada na Figura 50 mostrou que tanto a sensibilidade quanto a especificidade aumentaram com o aumento de ng de cfDNA/ml de plasma. A análise usando métrica de limite de cópias de doador/ml*kg perdeu uma rejeição ativa de protocolo em Q1. A Tabela 22 abaixo mostra resultados mais detalhados da comparação do uso de limite fixo versus dinâmico para a métrica de limite de cópias de doador/ml*kg. TABELA 22: COMPARAÇÃO DE LIMITE FIXO E LIMITE
ESCALONADO PARA A MÉTRICA DE LIMITE DE CÓPIAS DE DOADOR/ML*KG. Limite Fixo Limite Escalonado Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Geral Limite 13,4% 324 976 1.952 Fixo Escalo nado Sensibil 0% 100 100 100 71 100 100 86% Sensibilid 77,4 90,3% idade % % % % % % ade % Especifi 91 76 85 42 78 76 85 83% Especifici 72,8 80,4% cidade % % % % % % % dade % ARs de 9/10 10/10 protocolo
[0892] Também foi verificado que o desempenho da análise pode ser melhorado ainda mais dividindo os dados em agrupamentos menores de ng/ml, conforme mostrado na Tabela 23 abaixo. TABELA 23: COMPARAÇÃO DE LIMITE FIXO E LIMITE
ESCALONADO PARA A MÉTRICA DE LIMITE DE CÓPIAS DO DOADOR/ML*KG QUANDO OS DADOS SÃO ESTRATIFICADOS EM ÓCTIS COM BASE EM NG DE cfDNA/ML DE PLASMA.
[0893] Desempenho inicial a 1% fixo: Fixo Sensibilidade 83,9% Especificidade 75,0%
Octil 1 Octil Octil Octil Octil Octil Octil Octil Geral 2 3 4 5 6 7 8 Cópi limite 5,0 8,0 13,4 17,0 22,0 Escalon as de ado doad or/ml Sensibili 60% 100 100 100 100 100 100 100 Sensibil 93,5% dade % % % % % % % idade Especifi 90% 92% 85% 75% 80% 90% 69% 73% Especifi 81,5% cidade cidade Cópias limite 500 976 1.600 1.800 Escalon de ado doador /ml * Sensibili 60% 100 100 100 100 83% 100 100 Sensibil 90,3% kg dade % % % % % % idade Especific 90% 92% 85% 83% 80% 90% 69% 64% Especifi 81,5% idade cidade Cópias limite 100 500 1.000 1.825 Escalon de ado doador /ml * Sensibili 100 100 100 100 100 100 100 100 Sensibil 100,0% kg dade % % % % % % % % idade Especific 40% 92% 85% 67% 80% 90% 77% 64% Especifi 75,0% idade cidade
[0894] Em resumo, este exemplo mostrou que o desempenho do método de monitoramento de transplante divulgado neste documento pode ser melhorado usando uma métrica de limite escalonada ou dinâmica que leva em conta o ng de cfDNA/ml de plasma obtido das amostras, incluindo sensibilidade e especificidade melhoradas. 100% dos casos de rejeição ativa de biópsia de protocolo foram chamados corretamente ao usar os limites escalonados com as novas métricas.
MODALIDADES ADICIONAIS
[0895] Modalidade 1. Um método para quantificar a quantidade de DNA livre de células derivado de doador (dd-cfDNA) em uma amostra de sangue de um receptor de transplante compreendendo:
[0896] a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado do receptor;
[0897] b) realizar a amplificação alvejada em 500 a
50.000 locais-alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos, e em que cada par de iniciadores é projetado para amplificar uma sequência-alvo de não mais de 100 pb; e
[0898] c) quantificar a quantidade de DNA livre de células derivado de doador nos produtos de amplificação.
[0899] Modalidade 2. Um método para quantificar a quantidade de DNA livre de células derivado de doador (dd-cfDNA) em uma amostra de sangue de um receptor de transplante compreendendo:
[0900] a) extrair o DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado do receptor, e em que a etapa de extração compreende a seleção de tamanho para enriquecer o DNA livre de células derivado de doador e reduzir a quantidade de DNA livre de células derivado do receptor eliminado a partir de leucócitos em erupção;
[0901] b) realizar a amplificação alvejada em 500 a
50.000 locais-alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos; e
[0902] c) quantificar a quantidade de DNA livre de células derivado de doador nos produtos de amplificação. Modalidade
[0903] 3. Um método de detecção de DNA livre de células derivado de doador (dd-cfDNA) em uma amostra de sangue de um receptor de transplante compreendendo:
[0904] a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado do receptor;
[0905] b) realizar a amplificação alvejada em 500 a
50.000 locais-alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos;
[0906] c) sequenciar os produtos de amplificação por meio de sequenciamento de alto rendimento; e
[0907] d) quantificar a quantidade de DNA livre de células derivado de doador.
[0908] Modalidade 4. O método, de qualquer uma das Modalidades anteriores, compreendendo, ainda, a realização de uma amplificação universal do DNA extraído.
[0909] Modalidade 5. O método, de qualquer uma das Modalidades anteriores, em que o receptor de transplante é um mamífero.
[0910] Modalidade 6. O método, de qualquer uma das Modalidades anteriores, em que o receptor de transplante é um ser humano.
[0911] Modalidade 7. O método, de qualquer uma das Modalidades anteriores, em que o receptor de transplante recebeu um transplante selecionado a partir de transplante de órgão, transplante de tecido, transplante de células e transplante de fluido.
[0912] Modalidade 8. O método, de qualquer uma das Modalidades anteriores, em que o receptor de transplante recebeu um transplante selecionado a partir de transplante de rim, transplante de fígado, transplante de pâncreas, transplante intestinal, transplante cardíaco, transplante pulmonar, transplante de coração/pulmão, transplante de estômago, transplante de testículo, transplante de pênis, transplante de ovário, transplante de útero, transplante de timo, transplante de face, transplante de mão, transplante de perna, transplante de osso, transplante de medula óssea, transplante de córnea, transplante de pele, transplante de células de ilhotas pancreáticas, transplante de válvula cardíaca, transplante de vaso sanguíneo e transfusão de sangue.
[0913] Modalidade 9. O método, de qualquer uma das Modalidades anteriores, em que o receptor de transplante recebeu um transplante de rim.
[0914] Modalidade 10. O método de qualquer uma das Modalidades anteriores, em que a etapa de quantificação compreende determinar a porcentagem de DNA livre de células derivado de doador em relação ao total de DNA livre de células derivado de doador e DNA livre de células derivado de receptor na amostra de sangue.
[0915] Modalidade 11. O método de qualquer uma das Modalidades anteriores, em que a etapa de quantificação compreende determinar o número de cópias de DNA livre de células derivado de doador por unidade de volume da amostra de sangue.
[0916] Modalidade 12. O método de qualquer uma das Modalidades anteriores, em que o método compreende, ainda, detectar a ocorrência ou provável ocorrência de rejeição ativa ao transplante com o uso da quantidade quantificada de DNA livre de células derivado de doador.
[0917] Modalidade 13. O método de qualquer uma das Modalidades anteriores, em que o método é realizado sem conhecimento prévio dos genótipos do doador.
[0918] Modalidade 14. O método de qualquer uma das Modalidades anteriores, em que cada par de iniciadores é projetado para amplificar uma sequência-alvo de cerca de 50 a 100 pb.
[0919] Modalidade 15. O método de qualquer uma das Modalidades anteriores, em que cada par de iniciadores é projetado para amplificar uma sequência-alvo de cerca de 60 a 75 pb.
[0920] Modalidade 16. O método de qualquer uma das Modalidades anteriores, em que cada par de iniciadores é projetado para amplificar uma sequência-alvo de cerca de 65 pb.
[0921] Modalidade 17. O método de qualquer uma das Modalidades anteriores, em que a amplificação alvejada compreende amplificar pelo menos 1.000 locais polimórficos em um único volume de reação.
[0922] Modalidade 18. O método de qualquer uma das Modalidades anteriores, em que a amplificação alvejada compreende amplificar pelo menos 2.000 locais polimórficos em um único volume de reação.
[0923] Modalidade 19. O método de qualquer uma das Modalidades anteriores, em que a amplificação alvejada compreende amplificar pelo menos 5.000 locais polimórficos em um único volume de reação.
[0924] Modalidade 20. O método de qualquer uma das Modalidades anteriores, em que o método compreende, ainda, medir uma quantidade de um ou mais alelos nos locais-alvo que sejam locais polimórficos.
[0925] Modalidade 21. O método de qualquer uma das Modalidades anteriores, em que a etapa de quantificação compreende detectar os locais-alvo amplificados com o uso de um microarranjo.
[0926] Modalidade 22. O método de qualquer uma das Modalidades anteriores, em que a etapa de quantificação não compreende o uso de um microarranjo.
[0927] Modalidade 23. O método de qualquer uma das Modalidades anteriores, em que os locais polimórficos e os locais não polimórficos são amplificados em uma única reação.
[0928] Modalidade 24. O método de qualquer uma das Modalidades anteriores, em que a amplificação alvejada compreende amplificar, simultaneamente, 500 a 50.000 locais-alvo em um único volume de reação com o uso de (i) pelo menos 500 a 50.000 pares de iniciadores diferentes, ou (ii) pelo menos 500 a 50.000 iniciadores alvo-específicos e um iniciador universal ou etiqueta-específico de 500 a 50.000 pares de iniciadores.
[0929] Modalidade 25. Um método para determinar a possibilidade de rejeição ao transplante em um receptor de transplante, em que o método compreende:
[0930] a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado do receptor;
[0931] b) realizar a amplificação universal do DNA extraído;
[0932] c) realizar a amplificação alvejada em 500 a
50.000 locais-alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos;
[0933] d) sequenciar os produtos de amplificação por sequenciamento de alto rendimento; e
[0934] e) quantificar a quantidade de DNA livre de células derivado de doador na amostra de sangue, em que uma maior quantidade de dd-cfDNA indica uma maior probabilidade de rejeição ao transplante.
[0935] Modalidade 26. Um método para diagnosticar um transplante dentro de um receptor de transplante que está passando por rejeição aguda, em que o método compreende:
[0936] a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado do receptor;
[0937] b) realizar a amplificação universal do DNA extraído;
[0938] c) realizar a amplificação alvejada em 500 a
50.000 locais-alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos;
[0939] d) sequenciar os produtos de amplificação por sequenciamento de alto rendimento; e
[0940] e) quantificar a quantidade de DNA livre de células derivado de doador na amostra de sangue, em que uma quantidade de dd-cfDNA superior a 1% indica que o transplante está passando por rejeição aguda.
[0941] Modalidade 27. O método das Modalidades 25 ou 26, em que a rejeição ao transplante é uma rejeição ao transplante mediada por anticorpos.
[0942] Modalidade 28. O método das Modalidades 25 ou 26, em que a rejeição ao transplante é uma rejeição ao transplante mediada por células T.
[0943] Modalidade 29. O método de qualquer uma das Modalidades 25 a 28, em que uma quantidade de dd-cfDNA de menos de 1% indica que o transplante está passando por rejeição limítrofe, sofrendo outra lesão ou estável.
[0944] Modalidade 30. Um método de monitoramento de terapia imunossupressora em um sujeito, sendo que o método compreende
[0945] a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado do receptor;
[0946] b) realizar a amplificação universal do DNA extraído;
[0947] c) realizar a amplificação alvejada em 500 a
50.000 locais-alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos;
[0948] d) sequenciar os produtos de amplificação por sequenciamento de alto rendimento; e
[0949] e) quantificar a quantidade de DNA livre de células derivado de doador na amostra de sangue, em que uma mudança nos níveis de dd-cfDNA ao longo de um intervalo de tempo é indicativa do estado do transplante.
[0950] Modalidade 31. O método da Modalidade 30, que compreende, ainda, o ajuste de terapia imunossupressora com base nos níveis de dd-cfDNA ao longo de um intervalo de tempo.
[0951] Modalidade 32. O método da Modalidade 31, em que um aumento nos níveis de dd-cfDNA é indicativo de rejeição ao transplante e de uma necessidade de ajuste da terapia imunossupressora.
[0952] Modalidade 33. O método de Modalidade 31, em que nenhuma mudança ou diminuição nos níveis de dd-cfDNA indica tolerância ou estabilidade ao transplante e uma necessidade de ajuste da terapia imunossupressora.
[0953] Modalidade 34. O método de qualquer uma das Modalidades 30 a 33, em que uma quantidade de dd-cfDNA superior a 1% indica que o transplante está passando por rejeição aguda.
[0954] Modalidade 35. O método da Modalidade 34, em que a rejeição ao transplante é uma rejeição ao transplante mediada por anticorpos.
[0955] Modalidade 36. O método da Modalidade 34, em que a rejeição ao transplante é uma rejeição ao transplante mediada por células T.
[0956] Modalidade 37. O método de qualquer uma das Modalidades 30 a 33, em que uma quantidade de dd-cfDNA de menos de 1% indica que o transplante está passando por rejeição limítrofe, sofrendo outra lesão ou estável.
[0957] Modalidade 38. O método de qualquer uma das Modalidades 25 a 37, em que o método não compreende a genotipagem do doador de transplante e/ou do receptor de transplante.
[0958] Modalidade 39. O método de qulquer uma das Modalidades 25 a 38, em que o método compreende, ainda, medir uma quantidade de um ou mais alelos nos locais-alvo que sejam locais polimórficos.
[0959] Modalidade 40. O método de qualquer uma das Modalidades 25 a 39, em que os locais-alvo compreendem pelo menos
1.000 locais polimórficos, ou pelo menos 2.000 locais polimórficos, ou pelo menos 5.000 locais polimórficos, ou pelo menos 10.000 locais polimórficos.
[0960] Modalidade 41. O método de qualquer uma das Modalidades 25 a 40, em que os locais-alvo que são amplificados em amplicons de cerca de 50 a 100 pb de comprimento, ou cerca de 50 a 90 pb de comprimento, ou cerca de 60 a 80 pb de comprimento, ou cerca de 60 a 75 pb de comprimento.
[0961] Modalidade 42. O método da modalidade 41, em que os amplicons têm cerca de 65 pb de comprimento.
[0962] Modalidade 43. O método de qualquer uma das Modalidades 25 a 42, em que o receptor de transplante é um ser humano.
[0963] Modalidade 44. O método de qualquer uma das Modalidades 25 a 43, em que o receptor de transplante recebeu um transplante selecionado a partir de transplante de rim, transplante de fígado, transplante de pâncreas, transplante intestinal, transplante cardíaco, transplante pulmonar, transplante de coração/pulmão, transplante de estômago, transplante de testículo, transplante de pênis, transplante de ovário, transplante de útero, transplante de timo, transplante de face, transplante de mão, transplante de perna, transplante de osso, transplante de medula óssea, transplante de córnea, transplante de pele, transplante de células de ilhotas pancreáticas, transplante de válvula cardíaca, transplante de vaso sanguíneo e transfusão de sangue.
[0964] Modalidade 45. O método da Modalidade 44, em que o receptor de transplante recebeu um transplante de rim.
[0965] Modalidade 46. O método de qualquer uma das Modalidades 25 a 45, em que a etapa de extração compreende a seleção de tamanho para enriquecer o DNA livre de células derivado de doador e reduzir a quantidade de DNA livre de células derivado de receptor eliminado a partir de leucócitos em erupção.
[0966] Modalidade 47. O método de qualquer uma das Modalidades 25 a 45, em que a etapa de amplificação universal, preferencialmente, amplifica o DNA livre de células derivado de doador em relação ao DNA livre de células derivado de receptor que é eliminado a partir de leucócitos em erupção.
[0967] Modalidade 48. O método de qualquer uma das Modalidades 25 a 47 compreendendo, ainda, coletar longitudinalmente uma pluralidade de amostras de sangue do receptor de transplante após o transplante e repetir as etapas (a) a (e) para cada amostra de sangue coletada.
[0968] Modalidade 49. O método de qualquer uma das Modalidades 1 a 48, em que o método tem uma sensibilidade de pelo menos 80% na identificação de rejeição aguda (AR) em relação a não AR com um limite de corte de 1% de dd-cfDNA e um intervalo de confiança de 95%.
[0969] Modalidade 50. O método de qualquer uma das Modalidades 1 a 48, em que o método tem uma especificidade de pelo menos 70% na identificação de AR em relação a não AR com um limite de corte de 1% de dd-cfDNA e um intervalo de confiança de 95%.
[0970] Modalidade 51. O método de qualquer uma das Modalidades 1 a 48, em que o método tem uma área sob a curva (AUC) de pelo menos 0,85 na identificação de AR em relação a não AR com um limite de corte de 1% de dd-cfDNA e um intervalo de confiança de 95%.
[0971] Modalidade 52. O método de qualquer uma das Modalidades 1 a 48, em que o método tem uma sensibilidade de pelo menos 80% na identificação de AR em relação a aloenxertos normais e estáveis (STA) com um limite de corte de 1% de dd-cfDNA e um intervalo de confiança de 95%.
[0972] Modalidade 53. O método de qualquer uma das Modalidades 1 a 48, em que o método tem uma especificidade de pelo menos 80% na identificação de AR em relação a STA com um limite de corte de 1% de dd-cfDNA e um intervalo de confiança de 95%.
[0973] Modalidade 54. O método de qualquer uma das Modalidades 1 a 48, em que o método tem uma AUC de pelo menos 0,9 na identificação de AR em relação a STA com um limite de corte de 1% de dd- cfDNA e um intervalo de confiança de 95%.
[0974] Modalidade 55. O método de qualquer uma das Modalidades 49 a 54, em que a AR é uma rejeição mediada por anticorpos (ABMR).
[0975] Modalidade 56. O método de qualquer uma das Modalidades 49 a 54, em que a AR é uma rejeição mediada por células T (TCMR).
[0976] Modalidade 57. O método de qualquer uma das Modalidades anteriores, em que o método tem uma sensibilidade conforme determinado por um limite de brancos (LoB) de cerca de 0,5% ou menos e um limite de detecção (LoD) de cerca de 0,5% ou menos.
[0977] Modalidade 58. O método da Modalidade 57, em que o LoB é de cerca de 0,23% ou menos e o LoD é de cerca de 0,29% ou menos.
[0978] Modalidade 59. O método da Modalidade 57, em que a sensibilidade é ainda determinada por um limite de quantificação (LoQ), em que o LoQ é aproximadamente igual ou superior ao LoD.
[0979] Modalidade 60. O método da Modalidade 59, em que o LoB é cerca de 0,04% ou menos, e o LoD é cerca de 0,05% ou menos, e o LoQ é aproximadamente igual ao LoD.
[0980] Modalidade 61. O método de qualquer uma das Modalidades anteriores, em que o método tem uma precisão conforme determinado pela avaliação de um valor de linearidade obtido a partir da análise de regressão linear de frações de doador medidas como uma função dos níveis de pico tentados correspondentes, em que o valor de linearidade é um valor de R2, em que o valor de R2 é de cerca de 0,98 a cerca de 1,0.
[0981] Modalidade 62. O método da modalidade 61, em que o valor de R2 é de cerca de 0,999.
[0982] Modalidade 63. O método de qualquer uma das Modalidades anteriores, em que o método tem uma precisão conforme determinado pelo uso de regressão linear em frações de doador medidas como uma função dos níveis de pico tentados correspondentes para calcular um valor de coeficiente angular e um valor de interceptação, em que o valor de coeficiente angular é de cerca de 0,9 a cerca de 1,2 e o valor de interceptação é de cerca de - 0,0001 a cerca de 0,01.
[0983] Modalidade 64. O método da Modalidade 63, em que o valor do coeficiente angular é cerca de 1 e o valor de interceptação é cerca de 0.
[0984] Modalidade 65. O método de qualquer uma das Modalidades anteriores, em que o método tem uma precisão conforme determinado pelo cálculo de um coeficiente de variação (CV), em que o CV é menor que cerca de 10,0%.

Claims (38)

REIVINDICAÇÕES
1. Método para quantificar a quantidade de DNA livre de células derivado de doador (dd-cfDNA) em uma amostra de sangue de um receptor de transplante caracterizado pelo fato de que compreende: a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado de receptor; b) realizar a amplificação alvejada em 500 a 50.000 locais- alvo em um único volume de reação com uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos, e em que cada par de iniciadores é projetado para amplificar uma sequência-alvo de não mais de 100 pb; e c) quantificar a quantidade de DNA livre de células derivado de doador nos produtos de amplificação.
2. Método para quantificar a quantidade de DNA livre de células derivado de doador (dd-cfDNA) em uma amostra de sangue de um receptor de transplante caracterizado pelo fato de que compreende: a) extrair o DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado de receptor, e em que a etapa de extração compreende a seleção de tamanho para enriquecer o DNA livre de células derivado de doador e reduzir a quantidade de DNA livre de células derivado de receptor eliminado a partir de leucócitos em erupção; b) realizar a amplificação alvejada em 500 a 50.000 locais- alvo em um único volume de reação com uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos; e c) quantificar a quantidade de DNA livre de células derivado de doador nos produtos de amplificação.
3. Método de detecção de DNA livre de células derivado de doador (dd-cfDNA) em uma amostra de sangue de um receptor de transplante caracterizado pelo fato de que compreende: a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado de receptor; b) realizar a amplificação alvejada em 500 a 50.000 locais- alvo em um único volume de reação com uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos; c) sequenciar os produtos de amplificação por meio do sequenciamento de alto rendimento; e d) quantificar a quantidade de DNA livre de células derivado de doador.
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende, ainda, a realização de uma amplificação universal do DNA extraído.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o receptor de transplante é um ser humano.
6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o receptor de transplante recebeu um transplante selecionado a partir de transplante de órgão, transplante de tecido, transplante de células e transplante de fluido.
7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o receptor de transplante recebeu um transplante selecionado a partir de transplante de rim, transplante de fígado, transplante de pâncreas, transplante intestinal, transplante cardíaco, transplante pulmonar, transplante de coração/pulmão, transplante de estômago, transplante de testículo, transplante de pênis, transplante de ovário, transplante de útero, transplante de timo, transplante de face, transplante de mão, transplante de perna, transplante de osso, transplante de medula óssea, transplante de córnea, transplante de pele, transplante de células de ilhotas pancreáticas, transplante de válvula cardíaca, transplante de vaso sanguíneo e transfusão de sangue.
8. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o receptor de transplante recebeu um transplante de rim.
9. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de quantificação compreende determinar a porcentagem de DNA livre de células derivado de doador em relação ao total de DNA livre de células derivado de doador e DNA livre de células derivado de receptor na amostra de sangue.
10. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de quantificação compreende determinar o número de cópias de DNA livre de células derivado de doador por unidade de volume da amostra de sangue.
11. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de quantificação é responsável pela massa corporal ou volume de sangue do receptor de transplante.
12. Método, de acordo com a reivindicação 1, sendo que o método é caracterizado pelo fato de que compreende, ainda, detectar a ocorrência ou a provável ocorrência de rejeição ativa ao transplante com o uso da quantidade quantificada de DNA livre de células derivado de doador.
13. Método, de acordo com a reivindicação 1, sendo que o método é caracterizado pelo fato de que é realizado sem conhecimento prévio dos genótipos do doador.
14. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que cada par de iniciadores é projetado para amplificar uma sequência-alvo de cerca de 50 a 100 pb.
15. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a amplificação alvejada compreende amplificar pelo menos
1.000 locais polimórficos e um único volume de reação.
16. Método, de acordo com a reivindicação 1, sendo que o método é caracterizado pelo fato de que compreende, ainda, medir uma quantidade de um ou mais alelos nos locais-alvo que sejam locais polimórficos.
17. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de quantificação compreende detectar os locais-alvo amplificados com uso de um microarranjo.
18. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de quantificação não compreende o uso de um microarranjo.
19. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que os locais polimórficos e os locais não polimórficos são amplificados em uma única reação.
20. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a amplificação alvejada compreende amplificar, simultaneamente, 500 a 50.000 locais-alvo em um único volume de reação com o uso de (i) pelo menos 500 a 50.000 pares de iniciadores diferentes, ou (ii) pelo menos 500 a 50.000 iniciadores alvo-específicos e um iniciador universal ou alvo-específico de 500 a 50.000 pares de iniciadores.
21. Método para determinar a possibilidade de rejeição ao transplante em um receptor de transplante, sendo que o método é caracterizado pelo fato de que compreende: a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado de receptor; b) realizar a amplificação universal do DNA extraído; c) realizar a amplificação alvejada em 500 a 50.000 locais- alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos;
d) sequenciar os produtos de amplificação por sequenciamento de alto rendimento; e e) quantificar a quantidade de DNA livre de células derivado de doador na amostra de sangue, em que uma maior quantidade de dd-cfDNA indica uma maior probabilidade de rejeição ao transplante.
22. Método para diagnosticar um transplante dentro de um receptor de transplante que está passando por rejeição aguda, sendo que o método é caracterizado pelo fato de que compreende: a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado de receptor; b) realizar a amplificação universal do DNA extraído; c) realizar a amplificação alvejada em 500 a 50.000 locais- alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos; d) sequenciar os produtos de amplificação por meio do sequenciamento de alto rendimento; e e) quantificar a quantidade de DNA livre de células derivado de doador na amostra de sangue, em que uma quantidade de dd-cfDNA superior a 1% indica que o transplante está passando por rejeição aguda.
23. Método, de acordo com a reivindicação 21, caracterizado pelo fato de que a rejeição ao transplante é uma rejeição ao transplante mediada por anticorpos.
24. Método, de acordo com a reivindicação 21, caracterizado pelo fato de que a rejeição ao transplante é uma rejeição ao transplante mediada por células T.
25. Método, de acordo com a reivindicação 21, caracterizado pelo fato de que uma quantidade de dd-cfDNA superior a 1% indica que o transplante está passando por rejeição aguda, e em que uma quantidade de dd-cfDNA de menos de 1% indica que o transplante está passando por rejeição limítrofe, sofrendo outra lesão ou que está estável.
26. Método de monitoramento de terapia imunossupressora em um sujeito, sendo que o método é caracterizado pelo fato de que compreende a) extrair DNA da amostra de sangue do receptor de transplante, em que o DNA compreende DNA livre de células derivado de doador e DNA livre de células derivado de receptor; b) realizar a amplificação universal do DNA extraído; c) realizar a amplificação alvejada em 500 a 50.000 locais- alvo em um único volume de reação com o uso de 500 a 50.000 pares de iniciadores, em que os locais-alvo compreendem locais polimórficos e não polimórficos; d) sequenciar os produtos de amplificação por meio do sequenciamento de alto rendimento; e e) quantificar a quantidade de DNA livre de células derivado de doador na amostra de sangue, em que uma mudança nos níveis de dd-cfDNA ao longo de um intervalo de tempo é indicativa do estado do transplante.
27. Método, de acordo com a reivindicação 26, caracterizado pelo fato de que compreende, ainda, o ajuste de terapia imunossupressora com base nos níveis de dd-cfDNA ao longo de um intervalo de tempo.
28. Método, de acordo com a reivindicação 27, caracterizado pelo fato de que um aumento nos níveis de dd-cfDNA são indicativos de rejeição ao transplante e de uma necessidade de ajuste da terapia imunossupressora
29. Método, de acordo com a reivindicação 27, caracterizado pelo fato de que nenhuma mudança ou diminuição nos níveis de dd-cfDNA indica tolerância ou estabilidade do transplante e a necessidade de ajuste da terapia imunossupressora.
30. Método, de acordo com a reivindicação 21, sendo que o método é caracterizado pelo fato de que não compreende a genotipagem do doador do transplante e/ou do receptor de transplante.
31. Método, de acordo com a reivindicação 21, caracterizado pelo fato de que a etapa de extração compreende a seleção de tamanho para enriquecer o DNA livre de células derivado de doador e reduzir a quantidade de DNA livre de células derivado de receptor eliminado a partir de leucócitos em erupção.
32. Método, de acordo com a reivindicação 21, caracterizado pelo fato de que a etapa de amplificação universal, preferencialmente, amplifica o DNA livre de células derivado de doador em relação ao DNA livre de células derivado de receptor que é eliminado a partir de leucócitos em erupção.
33. Método, de acordo com a reivindicação 21, caracterizado pelo fato de que compreende, ainda, coletar longitudinalmente uma pluralidade de amostras de sangue do receptor de transplante após o transplante e repetir as etapas (a) a (e) para cada amostra de sangue coletada.
34. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a determinação da quantidade de dd-cfDNA acima de um limite de corte é indicativa de rejeição aguda ao transplante.
35. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o valor limite de corte é expresso como uma porcentagem de dd-cfDNA na amostra de sangue, ou como um número de cópias de dd-cfDNA por unidade de volume da amostra de sangue, ou como um número de cópias de dd-cfDNA por unidade de volume da amostra de sangue multiplicado pela massa corporal ou volume de sangue do receptor de transplante.
36. Método, de acordo com a reivindicação 35, caracterizado pelo fato de que o valor limite de corte é escalonado de acordo com a quantidade de cfDNA total na amostra de sangue.
37. Método, de acordo com a reivindicação 36, sendo que o método é caracterizado pelo fato de que tem uma sensibilidade de pelo menos 80% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue.
38. Método, de acordo com a reivindicação 36, sendo que o método é caracterizado pelo fato de que tem uma especificidade de pelo menos 70% na identificação de rejeição aguda (AR) em relação a não AR quando a quantidade de dd-cfDNA está acima do valor limite de corte escalonado de acordo com a quantidade de cfDNA total na amostra de sangue.
BR112020027023-7A 2018-07-03 2019-07-03 Métodos para detecção de dna livre de células derivado de doador BR112020027023A2 (pt)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201862693833P 2018-07-03 2018-07-03
US62/693,833 2018-07-03
US201862715178P 2018-08-06 2018-08-06
US62/715,178 2018-08-06
US201862781882P 2018-12-19 2018-12-19
US62/781,882 2018-12-19
US201962834315P 2019-04-15 2019-04-15
US62/834,315 2019-04-15
PCT/US2019/040603 WO2020010255A1 (en) 2018-07-03 2019-07-03 Methods for detection of donor-derived cell-free dna

Publications (1)

Publication Number Publication Date
BR112020027023A2 true BR112020027023A2 (pt) 2021-04-06

Family

ID=67441687

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020027023-7A BR112020027023A2 (pt) 2018-07-03 2019-07-03 Métodos para detecção de dna livre de células derivado de doador

Country Status (5)

Country Link
US (1) US20230287497A1 (pt)
EP (1) EP3818177A1 (pt)
CN (1) CN112752852A (pt)
BR (1) BR112020027023A2 (pt)
WO (1) WO2020010255A1 (pt)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
WO2011146632A1 (en) 2010-05-18 2011-11-24 Gene Security Network Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
JP6328934B2 (ja) 2010-12-22 2018-05-23 ナテラ, インコーポレイテッド 非侵襲性出生前親子鑑定法
CN113774132A (zh) 2014-04-21 2021-12-10 纳特拉公司 检测染色体片段中的突变和倍性
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
WO2018067517A1 (en) 2016-10-04 2018-04-12 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
AU2021280311A1 (en) 2020-05-29 2022-11-24 Natera, Inc. Methods for detection of donor-derived cell-free DNA
CN116490621A (zh) * 2020-06-05 2023-07-25 西罗纳基因组有限公司 鉴定移植物排斥的标志物的方法
CN111696655B (zh) * 2020-06-12 2023-04-28 上海市血液中心 一种基于互联网的实时共享的血液筛查室内质控系统和方法
CN116964223A (zh) 2021-02-25 2023-10-27 纳特拉公司 用于检测多个器官的移植受体中的供体源性游离dna的方法
AU2022237538A1 (en) 2021-03-18 2023-09-21 Natera, Inc. Methods for determination of transplant rejection
CA3228583A1 (en) * 2021-09-16 2023-03-23 Northwestern University Methods of using donor-derived cell-free dna to distinguish acute rejection and other conditions in liver transplant recipients
CN116042848A (zh) * 2021-10-28 2023-05-02 北京干细胞与再生医学研究院 一种通过血样检测判断动物体内存在移植物的方法
WO2023244735A2 (en) * 2022-06-15 2023-12-21 Natera, Inc. Methods for determination and monitoring of transplant rejection by measuring rna
WO2024076469A1 (en) 2022-10-06 2024-04-11 Natera, Inc. Non-invasive methods of assessing transplant rejection in pregnant transplant recipients

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6977162B2 (en) 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
US7634808B1 (en) 2004-08-20 2009-12-15 Symantec Corporation Method and apparatus to block fast-spreading computer worms that use DNS MX record queries
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
US8515679B2 (en) 2005-12-06 2013-08-20 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US7888017B2 (en) 2006-02-02 2011-02-15 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive fetal genetic screening by digital analysis
CA2731991C (en) 2008-08-04 2021-06-08 Gene Security Network, Inc. Methods for allele calling and ploidy calling
EP2473638B1 (en) 2009-09-30 2017-08-09 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10316362B2 (en) * 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
AU2011358564B9 (en) 2011-02-09 2017-07-13 Natera, Inc Methods for non-invasive prenatal ploidy calling
KR101850437B1 (ko) * 2015-04-14 2018-04-20 이원다이애그노믹스(주) 차세대 염기서열 분석기법을 이용한 장기 이식 거부 반응 예측 방법
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules

Also Published As

Publication number Publication date
CN112752852A (zh) 2021-05-04
EP3818177A1 (en) 2021-05-12
US20230287497A1 (en) 2023-09-14
WO2020010255A1 (en) 2020-01-09

Similar Documents

Publication Publication Date Title
US11525159B2 (en) Methods for detection of donor-derived cell-free DNA
BR112020027023A2 (pt) Métodos para detecção de dna livre de células derivado de doador
JP7348330B2 (ja) 高度多重pcr法および組成物
US11390916B2 (en) Methods for simultaneous amplification of target loci
KR102210852B1 (ko) 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
JP7123975B2 (ja) 無細胞dnaについての体細胞起源または生殖系列起源の識別
US20170051355A1 (en) Highly multiplex pcr methods and compositions
US20130196862A1 (en) Informatics Enhanced Analysis of Fetal Samples Subject to Maternal Contamination
CA3207599A1 (en) Methods for non-invasive prenatal ploidy calling
WO2013130848A1 (en) Informatics enhanced analysis of fetal samples subject to maternal contamination
EP2847347A1 (en) Highly multiplex pcr methods and compositions