BR122021021820B1 - Método para determinar um perfil de metilação de uma amostra biológica de um organismo e meio de armazenamento legível por computador - Google Patents

Método para determinar um perfil de metilação de uma amostra biológica de um organismo e meio de armazenamento legível por computador Download PDF

Info

Publication number
BR122021021820B1
BR122021021820B1 BR122021021820-0A BR122021021820A BR122021021820B1 BR 122021021820 B1 BR122021021820 B1 BR 122021021820B1 BR 122021021820 A BR122021021820 A BR 122021021820A BR 122021021820 B1 BR122021021820 B1 BR 122021021820B1
Authority
BR
Brazil
Prior art keywords
methylation
dna
plasma
cancer
tissue
Prior art date
Application number
BR122021021820-0A
Other languages
English (en)
Inventor
Rossa Wai Kwun Chiu
Kwan Chee Chan
Yuk-Ming Dennis Lo
Miu Fan Lun
Peiyong Jiang
Wai Man Chan
Original Assignee
The Chinese University Of Hong Kong
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by The Chinese University Of Hong Kong filed Critical The Chinese University Of Hong Kong
Publication of BR122021021820B1 publication Critical patent/BR122021021820B1/pt

Links

Images

Abstract

Sistemas, métodos e aparelhos podem determinar e usar perfis de metilação de vários tecidos e amostras. São apresentados exemplos. Um perfil de metilação pode ser deduzido do tecido fetal/tumor com base em uma comparação de metilação de plasma (ou outra amostra com DNA sem célula) para um perfil de metilação do paciente/mãe. Um perfil de metilação pode ser determinado por tecido fetal/tumoral usando alelos específicos ao tecido para identificar o DNA do feto/tumor quando a amostra tiver uma mistura de DNA. Um perfil de metilação pode ser usado para determinar variações do número de cópia no genoma de um feto/tumor. Marcadores de metilação para um feto foram identificados por meio de várias técnicas. O perfil de metilação pode ser determinado pela determinação de um parâmetro de tamanho de uma distribuição de tamanho de fragmentos de DNA, onde os valores de referência para o parâmetro de tamanho podem ser usados para determinar os níveis de metilação. Além disso, um nível de metilação pode ser usado para determinar um nível de câncer.

Description

REFERÊNCIAS CRUZADAS A PEDIDOS RELACIONADOS
[001] Este pedido é um pedido PCT que reivindica prioridade ao Pedido de Patente Provisório US N° 61/830.571 intitulado "Detecção de Tumor no Plasma Usando Status de Metilação e Número de Cópia" depositado em 3 de junho de 2013; e Pedido US N° 13/842.209 intitulado "Determinação Não Invasiva de Metiloma do Feto ou Tumor do Plasma" depositado em 15 de março de 2013 que é não provisório e reivindica o benefício do Pedido de Patente Provisório US N° 61/703.512, intitulado "Método de Determinação do Status de Metilação do DNA do Genoma Completo da Placenta por Sequenciamento Massivamente Paralelo do Plasma Materno" depositado em 20 de setembro de 2012, os quais são incorporados a este instrumento por referência em sua totalidade para todos os efeitos.
CAMPO DA INVENÇÃO
[002] A presente divulgação refere-se geralmente a uma determinação de um padrão de metilação (metiloma) do DNA e, mais especificamente, à análise de uma amostra biológica (por exemplo, plasma) que inclui uma mistura de DNA de genomas diferentes (por exemplo, do feto e da mãe, ou do tumor e das células normais) para determinar o padrão de metilação (metiloma) do genoma da minoria. Também estão descritos os usos do metiloma determinado.
FUNDAMENTOS
[003] O desenvolvimento embrionário e fetal é um processo complexo e envolve uma série de eventos genéticos e epigenéticos altamente orquestrados. O desenvolvimento do câncer também é um processo complexo que envolve normalmente várias etapas genéticas e epigenéticas. Anormalidades no controle epigenético dos processos de desenvolvimento implicam na infertilidade, aborto espontâneo, anormalidades do crescimento intrauterino e consequências posteriores ao nascimento. A metilação do DNA é um dos mecanismos epigenéticos mais frequentemente estudados. A metilação do DNA ocorre, principalmente, no contexto da adição de um grupo metila ao carbono 5' dos resíduos de citosina entre dinucleotídeos CpG. A metilação da citosina acrescenta uma camada de controle à transcrição do gene e à função do DNA. Por exemplo, a hipérmetilação dos promotores de genes enriquecidos com dinucleotídeos CpG, denominados ilhas de CpG, está normalmente associada à repressão da função do gene.
[004] Apesar do papel importante dos mecanismos epigenéticos na mediação de processos de desenvolvimento, os tecidos embrionários e fetais humanos não são facilmente acessíveis para análise (da mesma forma, os tumores podem não ser acessíveis). Os estudos das mudanças dinâmicas desses processos epigenéticos na saúde e na doença durante o período pré- natal em humanos são praticamente impossíveis. Os tecidos extraembrionários, especificamente a placenta, que podem ser obtido como parte dos procedimentos de diagnóstico pré-natal ou após o nascimento, apresentaram uma das principais abordagens para essas investigações. No entanto, esses tecidos requerem procedimentos invasivos.
[005] O perfil de metilação do DNA da placenta humana intrigou os pesquisadores durante décadas. A placenta humana apresenta uma infinidade de características fisiológicas peculiares que envolvem a metilação do DNA. Em um nível global, os tecidos placentários são hipometilados se comparados aos tecidos mais somáticos. No nível do gene, o status da metilação dos loci genômicos selecionados é uma assinatura específica dos tecidos placentários. Os perfis de metilação globais e específicos do locus mostram alterações dependentes da idade gestacional. Genes impressos, ou seja, genes em relação aos quais a expressão é dependente da origem parental dos alelos, possuem funções importantes na placenta. A placenta foi descrita como pseudomaligna e foi observada a hipermetilação de vários genes supressores de tumor.
[006] Os estudos do perfil de metilação do DNA dos tecidos placentários apresentaram percepções sobre a fisiopatologia das doenças associadas a gravidez ou ao desenvolvimento, como pré-eclâmpsia e restrição do crescimento intrauterino. Distúrbios na impressão genômica estão associados a distúrbios do desenvolvimento, como síndrome de Prader-Willi e síndrome de Angelman. Os perfis alterados de impressão genômica e metilação do DNA global em tecidos placentários e fetais foram observados em gestações resultantes de técnicas de reprodução assistidas (H Hiura et al. 2012 Hum Reprod; 27: 2541-2548). Vários fatores ambientais como tabagismo materno (KE Haworth et al. 2013 Epigenomics; 5: 37-49), fatores dietéticos maternos (X Jiang et al. 2012 FASEB J; 26: 3563-3574) e status metabólico materno como diabetes (N Hajj et al, Diabetes. doi: 10.2337/DB12-0289) estão associados a anomalias epigenéticas dos descendentes.
[007] Apesar de décadas de esforços, não houve nenhum meio prático disponível para estudar o metiloma fetal ou do tumor e monitorar as alterações dinâmicas durante a gravidez ou durante os processos da doença, como tumores malignidades. Portanto, é desejável prover métodos para analisar tudo ou partes de um metiloma fetal e um metiloma tumoral de forma não invasiva.
SUMÁRIO
[008] As modalidades proveem sistemas, métodos e aparelhos para a determinação e uso dos perfis de metilação de vários tecidos e amostras. São apresentados exemplos. Um perfil de metilação pode ser deduzido de tecido fetal/tumoral com base em uma comparação da metilação do plasma (ou outra amostra com DNA sem célula, por exemplo, urina, saliva, lavagens genitais) para um perfil de metilação da mãe/paciente. Um perfil de metilação pode ser determinado por tecido fetal/tumoral usando alelos específicos ao tecido para identificar o DNA do feto/tumor quando a amostra tiver uma mistura de DNA. Um perfil de metilação pode ser usado para determinar variações do número de cópia no genoma de um feto/tumor. Marcadores de metilação para um feto foram identificados por meio de várias técnicas. O perfil de metilação pode ser determinado pela determinação de um parâmetro de tamanho de uma distribuição de tamanho de fragmentos de DNA, onde os valores de referência para o parâmetro de tamanho podem ser usados para determinar os níveis de metilação.
[009] Além disso, um nível de metilação pode ser usado para determinar um nível de câncer. No contexto do câncer, a medição das alterações metilômicas no plasma pode possibilitar a detecção do câncer (por exemplo, para fins de triagem), para monitoramento (por exemplo, detectar a resposta após o tratamento anti-câncer; e detectar reincidências de câncer) e para o prognóstico (por exemplo, para medir a carga das células cancerosas no corpo ou para estadiamento ou avaliação das chances de morte pela doença ou progresso da doença ou processos metastáticos).
[0010] Uma melhor compreensão da natureza e das vantagens das modalidades da presente invenção podem ser adquiridas com referência à seguinte descrição detalhada e aos desenhos que acompanham.
BREVE DESCRIÇÃO DAS FIGURAS
[0011] A FIG. 1a mostra uma tabela 100 dos resultados do sequenciamento do sangue materno, da placenta e do plasma materno de acordo com as modalidades da presente invenção.
[0012] A FIG. 1B mostra a densidade de metilação nas janelas 1-Mb das amostras sequenciadas de acordo com as modalidades da presente invenção.
[0013] As FIGS. 2A-2C mostram gráficos de valores beta em relação aos índices de metilação: (A) Células do sangue materno, (B) Amostra do vilo corial, (C) Tecido placentário a termo.
[0014] As FIGS. 3A e 3B mostram gráficos de barras da porcentagem dos sítios de CpG metilados nas células do plasma e do sangue coletadas de um macho adulto e uma fêmea adulta não grávida: (A) Autossomos, (B) Cromossomo X.
[0015] As FIGS. 4A e 4B mostram gráficos das densidades de metilação dos loci correspondentes no DNA das células do sangue e no DNA do plasma: (A) Mulher adulta não grávida, (B) Homem adulto.
[0016] As FIGS. 5A e 5B mostram gráficos de barras de porcentagem de sítios de CpG metilados entre amostras coletadas na gravidez: (A). (A) Autossomos, (B) Cromossomo X.
[0017] A FIG. 6 mostra um gráfico de barras do nível de metilação das diferentes classes de repetição do genoma humano para o sangue materno, placenta e plasma materno.
[0018] A FIG. 7A mostra um gráfico Circos 700 para amostras do primeiro trimestre. A FIG. 7B mostra um gráfico Circos 750 para amostras do terceiro trimestre.
[0019] As FIGS 8A-8D mostram gráficos comparativos das densidades de metilação do DNA do tecido genômico em relação ao DNA do plasma materno para sítios de CpG que cercam polimorfismos do nucleotídeo único informativo.
[0020] A FIG. 9 é um fluxograma que ilustra um método 900 para determinar um primeiro perfil de metilação de uma amostra biológica de um organismo de acordo com as modalidades da presente invenção.
[0021] A FIG. 10 é um fluxograma que ilustra um método 1000 para determinar um primeiro perfil de metilação de uma amostra biológica de um organismo de acordo com as modalidades da presente invenção.
[0022] As FIGS. 11A e 11B mostra gráficos do desempenho do algoritmo de previsão usando dados do plasma materno e da concentração fracionária do DNA fetal de acordo com modalidades da presente invenção.
[0023] A FIG. 12A é uma tabela 1200 que mostra detalhes dos loci genômicos selecionados para previsão de metilação de acordo com as modalidades da presente invenção. A FIG. 12B é um gráfico 1250 que mostra as categorias deduzidas de 15 loci genômicos selecionado e seus níveis de metilação correspondentes na placenta.
[0024] A FIG. 13 é um fluxograma de um método 1300 para detecção de uma anomalia cromossômica fetal de uma amostra biológica de uma mulher grávida com pelo menos um feto.
[0025] A FIG. 14 é um fluxograma de um método 1400 para identificação dos marcadores de metilação pela comparação de um perfil de metilação placentária para um perfil de metilação materna de acordo com as modalidades da presente invenção.
[0026] A FIG. 15A é uma tabela 1500 que mostra um desempenho da do algoritmo de identificação DMR usando dados do primeiro trimestre, com referência aos marcadores de primeiro trimestre mencionados anteriormente. A FIG. 15B é uma tabela 1550 que mostra o desempenho do algoritmo de identificação DMR usando dados do terceiro trimestre em comparação com a amostra de placenta obtida no parto.
[0027] A FIG. 16 é uma tabela 1600 que mostra os números dos loci previstos para serem hipermetilados ou hipometilados com base na análise direta dos dados do sequenciamento de bissulfito do plasma materno.
[0028] A FIG. 17A é uma representação gráfica 1700 da distribuição de tamanho do plasma materno, plasma de controle de mulher não grávida e DNA de sangue placentário e periférico. A FIG. 17B é uma representação gráfica 1750 da distribuição de tamanho e do perfil de metilação do plasma materno, plasma de controle de mulher adulta, tecido placentário e sangue de controle de mulher adulta.
[0029] As FIGS. 18A e 18B são representações gráficas das densidades de metilação e do tamanho das moléculas de DNA do plasma de acordo com as modalidades da presente invenção.
[0030] A FIG. 19A mostra uma representação gráfica 1900 de densidades de metilação e os tamanhos de leituras sequenciais para uma mulher adulta não grávida. A FIG. 19B é uma representação gráfica 1950 que mostra a distribuição de tamanho e o perfil de metilação de moléculas de DNA específicas da mãe e moléculas de DNA específicas do feto no plasma materno.
[0031] A FIG. 20 é um fluxograma de um método 1000 para estumar o nível de metilação de DNA em uma amostra biológica de um organismo de acordo com as modalidades da presente invenção.
[0032] A FIG. 21A é uma tabela 2100 que mostra as densidades de metilação do plasma pré-operatório e as amostras de tecido de um paciente com carcinoma hepatocelular (HCC). A FIG. 21B é uma tabela 2150 que mostra o número de leituras de sequência e a profundidade de sequenciamento alcançado por amostra.
[0033] A FIG. 22 é uma tabela 220 que mostra as densidades de metilação em autossomos, variando de 71,2% para 72,5%, nas amostras de plasma dos controles saudáveis.
[0034] As FIGS. 23A e 23B mostram a densidade de metilação do creme leucocitário, tecido do tumor, tecido não-tumoral do fígado, plasma pré-operatório e plasma pós-operatório do paciente com HCC.
[0035] As FIGS. 24A são uma representação gráfica 2400 que mostra as densidades de metilação do plasma pré-operatório do paciente com HCC. As FIGS. 24B são uma representação gráfica 2450 que mostra as densidades de metilação do plasma pós-operatório do paciente com HCC.
[0036] As FIGS. 25A e 25B mostram pontuações z das densidades de metilação do DNA do plasma para amostras de plasma pré-operatório (representação gráfica 2500) e pós-operatório (representação gráfica 2550) do paciente com HCC usando dados do metiloma do plasma dos quatro sujeitos de controle saudáveis como referência para o cromossomo 1.
[0037] A FIG. 26A é uma tabela 2600 que mostra dados para pontuações z para plasma pré-operatório e pós-operatório. A FIG. 26B é uma representação gráfica Circos 2620 que mostra pontuações z das densidades de metilação do DNA do plasma para amostras de plasma pré-operatório e pós- operatório do paciente com HCC usando quatro sujeitos de controle saudáveis como referência para bins de 1Mb de todos os autossomos. A FIG. 26C é uma tabela 2640 que mostra a distribuição de pontuações z de recipientes de 1Mb para o genoma inteiro em amostras do plasma pré-operatório e pós-operatório do paciente com HCC. A FIG. 26D é uma tabela 2660 que mostra os níveis de metilação do tecido tumoral e amostra do plasma pré-operatório sobreposta a algumas amostras do plasma de controle ao usar contextos de CHH e CHG.
[0038] A FIG. 27A-H mostra gráficos Circos da densidade de metilação de 8 pacientes com câncer, de acordo com as modalidades da presente invenção. A FIG. 21I é uma tabela 1780 que mostra o número de leituras de sequência e a profundidade de sequenciamento alcançado por amostra. A FIG. 27J é uma tabela 2790 que mostra a distribuição de pontuações z dos recipientes de 1MB para o genoma inteiro no plasma de pacientes com malignidades diferentes. CL = adenocarcinoma do pulmão; NPC = carcinoma nasofaríngeo; CRC = carcinoma colorretal; NE = carcinoma neuroendócrino; SMS = sarcoma de músculo liso.
[0039] A FIG. 28 é um fluxograma do método 2800 para analisar uma amostra biológica de um organismo para determinar a classificação do nível de câncer, de acordo com as modalidades da presente invenção.
[0040] A FIG. 29A é uma representação gráfica 2900 que mostra a distribuição das densidades de metilação nos sujeitos de referência, presumindo que esta distribuição segue uma distribuição normal. A Fig. 29B é uma representação gráfica 2950 que mostra a distribuição das densidades de metilação em sujeitos com câncer, presumindo que esta distribuição segue uma distribuição normal e que o nível médio de metilação é de 2 desvios padrão abaixo do corte.
[0041] A FIG. 30 é uma representação gráfica 3000 que mostra a distribuição das densidades de metilação do DNA do plasma de indivíduos saudáveis e pacientes com câncer.
[0042] A FIG. 31 é um gráfico 3100 que mostra a distribuição das diferenças nas densidades de metilação entre a média do DNA do plasma de indivíduos saudáveis e o tecido tumoral do paciente com HCC.
[0043] A FIG. 32A é uma tabela 3200 que mostra o efeito da redução da profundidade de sequenciamento quando a amostra de plasma continha 5% ou 2% de DNA tumoral.
[0044] A FIG. 32B é um gráfico 3250 que mostra as densidades de metilação de elementos de repetição e de regiões de não-repetição no plasma de quatro sujeitos de controle saudáveis, amostras de creme leucocitário, tecido normal do fígado, tecido tumoral, plasma pré-operatório e plasma pós- operatório de paciente com HCC.
[0045] A FIG. 33 mostra um diagrama de blocos de um sistema de computador exemplar 3300 utilizável com sistema e métodos de acordo com modalidades da presente invenção.
[0046] A FIG. 34a mostra uma distribuição de tamanho de DNA de plasma no SLE04 de um paciente com lúpus eritematoso sistêmico (SLE). As FIGS. 34B e 34C mostram análise de metilação para DNA do plasma de SLE04 de paciente com SLE (FIG. 34B) e de TBR36 de paciente com HCC (FIG. 34C).
[0047] A FIG. 35 é um fluxograma de um método 3500 que determina a classificação de nível de câncer baseado na hipermetilação de ilhas de CpG, de acordo com as modalidades da presente invenção.
[0048] A FIG. 36 é um fluxograma de um método 3600 que analisa uma amostra biológica de um organismo que usa várias regiões cromossômicas de acordo com as modalidades da presente invenção.
[0049] A FIG. 37A mostra análise CNA para tecidos tumorais, DNA do plasma tratado por (BS) não-bissulfito e DNA do plasma tratado por bissulfito (de dentro para fora) para TBR36 de paciente. A FIG. 37B é um gráfico de dispersão que mostra a relação entre as pontuações z para a detecção de CNA usando plasma tratado por bissulfito e por não-bissulfito de bins de 1Mb para TBR36 do paciente.
[0050] A FIG. 38A mostra análise CNA para tecidos tumorais, DNA do plasma tratado por (BS) por não-bissulfito e DNA do plasma tratado por bissulfito (de dentro para fora) para TBR34 de paciente. A FIG. 38B é um gráfico de dispersão que mostra a relação entre as pontuações z para a detecção de CNA usando plasma tratado por bissulfito e tratado por não- bissulfito de bins de 1Mb para TBR34 do paciente.
[0051] A FIG. 39A é um gráfico Circos que mostra CNA (anel interno) e análise de metilação (anel externo) para o plasma tratado por bissulfito para TBR240 de paciente com HCC. A FIG. 39B é um gráfico Circos que mostra CNA (anel interno) e análise de metilação (anel externo) para o plasma tratado por bissulfito para TBR164 de paciente com HCC.
[0052] A FIG. 40A mostra a análise de CNA para TBR36 de paciente para a amostra de pré-tratamento e amostra de pós-tratamento. A FIG. 40B mostra a análise de metilação para TBR36 de paciente para a amostra de pré- tratamento e amostra de pós-tratamento. A FIG. 41A mostra a análise de CNA para TBR34 de paciente para a amostra de pré-tratamento e amostra de pós- tratamento. A FIG. 41B mostra a análise de metilação para TBR34 de paciente para a amostra de pré-tratamento e amostra de pós-tratamento.
[0053] A FIG. 42 mostra um diagrama do desempenho do diagnóstico da análise de hipometilação em todo o genoma com número diferente de leituras sequenciais.
[0054] A FIG. 43 é um diagrama que mostra as curvas ROC para a detecção de câncer com base na análise de hipometilação em todo o genoma tamanhos diferentes de recipientes (50 kb, 100 kb, 200 kb e 1 Mb).
[0055] A FIG. 44A mostra um desempenho de diagnóstico para probabilidade cumulativa (CP) e porcentagem de recipientes com anormalidades. A FIG. 44B mostra performances de diagnósticos para a análise de plasma quanto à hipometilação global, hipermetilação das ilhas de CpG e CNA.
[0056] A FIG. 45 mostra uma tabela com os resultados para hipometilação global, hipermetilação de ilhas de CpG e CNA em pacientes com carcinoma hepatocelular.
[0057] A FIG. 46 mostra uma tabela com os resultados para hipometilação global, hipermetilação de ilhas de CpG e CNA em pacientes sofrem de outros cânceres diferentes do carcinoma hepatocelular.
[0058] A FIG. 47 mostra uma análise serial para metilação de plasma para o TBR34 do caso.
[0059] A FIG. 48A mostra um gráfico Circos que demonstra CNA (anel interno) e alterações de metilação (anel externo) no DNA do plasma tratado por bissulfito para TBR36 de paciente com HCC. A FIG. 48B é uma representação gráfica de pontuações z de metilação para regiões com ganhos e perdas cromossômicas e regiões sem alteração do número de cópia para TBR36 de paciente com HCC.
[0060] A FIG. 49A mostra um gráfico Circos que demonstra CNA (anel interno) e alterações de metilação (anel externo) no DNA do plasma tratado por bissulfito para TBR34 de paciente com HCC. A FIG. 49B é uma representação gráfica de pontuações z de metilação para regiões com ganhos e perdas cromossômicas e regiões sem alteração do número de cópia para TBR34 de paciente com HCC.
[0061] As FIGs. 50A e 50B mostram resultados da análise de hipometilação e CNA para pacientes SLE04 e SLE10 de pacientes com SLE.
[0062] As FIGS. 51A e 51B mostram análise de met Z para regiões com e sem CNA para o plasma de dois pacientes com HCC (TBR34 e TBR36). As FIGS. 51C e 51D mostram análise de met Z para regiões com e sem CNA para o plasma de dois pacientes com com SLE (SLE04 e SLE10).
[0063] A FIG. 52A mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando recursos do grupo A para a CNA, metilação global e metilação da ilha de CpG. A FIG. 52B mostra o agrupamento hierárquico usando recursos do grupo B para a CNA, metilação global e metilação da ilha de CpG.
[0064] A FIG. 53A mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando recursos de metilação das ilhas de CpG do grupo A. A FIG. 53B mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando densidades de metilação global do grupo A.
[0065] A FIG. 54A mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando CNAs globais do grupo A. A FIG. 54B mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando densidades de metilação das ilhas de CpG do grupo B.
[0066] A FIG. 55A mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando densidades de metilação global do grupo B. A FIG. 55B mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando densidades de metilação global do grupo B.
[0067] A FIG. 56 mostra a densidade de metilação média de bins de 1 Mb (pontos vermelhos) entre 32 sujeitos saudáveis.
DEFINIÇÕES
[0068] Um "metiloma" provê uma medida de uma quantidade de metilação de DNA em vários sítios ou loci no genoma. O metiloma pode corresponder a todo o genoma, a uma parte substancial do genoma, ou a partes relativamente pequenas do genoma. Um "metiloma fetal" corresponde ao metiloma de um feto de uma fêmea grávida. O metiloma fetal pode ser determinado usando uma variedade de tecidos fetais ou fontes de DNA fetal, incluindo tecidos placentários e DNA sem célula fetal no plasma materno. Um "metiloma tumoral" corresponde ao metiloma de um tumor de um organismo (por exemplo, um humano). O metiloma tumoral pode ser determinado usando o tecido tumoral ou DNA tumoral sem célula no plasma materno. Metiloma fetal e metiloma tumoral são exemplos de um metiloma de interesse. Outros exemplos de metilomas de interesse são os metilomas de órgãos (por exemplo, metilomas de células do cérebro, ossos, pulmões, coração, músculos e rins, etc.) que podem contribuir com o DNA em um fluido corporal (por exemplo, plasma, soro, suor, saliva, urina, secreções genitais, sêmen, fluido de fezes, fluido de diarreia, líquido cefalorraquidiano, secreções do trato gastrointestinal, secreções pancreáticas, secreções intestinais, escarro, lágrimas, fluidos de aspiração da mama e da tireoide, etc.). Os órgãos podem ser órgãos transplantados.
[0069] Um "metiloma plasmático" é o metiloma determinado a partir do plasma ou soro de um animal (por exemplo, ser humano). O metiloma plasmático é um exemplo de um metiloma sem célula já que o plasma e soro incluem DNA sem célula. O metiloma plasmático também é um exemplo de um metiloma misto, uma vez que é uma mistura de metiloma fetal/maternal ou de metiloma tumoral/do paciente. O "metiloma placentário" pode ser determinado a partir de uma amostra de vilo corial (CVS) ou uma amostra de tecido placentário (por exemplo, obtidas após o parto). O "metiloma celular" corresponde ao metiloma determinado a partir de células (por exemplo, células do sangue) do paciente. O metiloma das células do sangue é chamado de metiloma das células do sangue (ou metiloma sanguíneo).
[0070] Um "sítio" corresponde a um único sítio, que pode ser uma posição de base única ou um grupo de posições de base correlacionadas, por exemplo, um sítio de CpG. Um "locus" pode corresponder a uma região que inclui vários sítios. Um locus pode incluir apenas um sítio, o que tornaria o locus equivalente a um sítio nesse contexto.
[0071] O "índice de metilação" para cada sítio genômico (por exemplo, um sítio de CpG) se refere à proporção de leituras de sequencia que mostram metilação no sítio sobre o número total de leituras que abrangem esse sítio. A "densidade de metilação" de uma região é o número de leituras em locais dentro da região mostrando a metilação dividida pelo número total de leituras cobrindo os locais na região. Os sítios podem ter características específicas, por exemplo, sendo sítios de CpG. Assim, a "densidade de metilação de CpG" de uma região é o número de leituras que mostram a metilação de CpG dividida pelo número total de leituras que abrangem sítios de CpG na região (por exemplo, sítio de CpG específico, sítios de CpG dentro de uma ilha de CpG, ou uma região maior). Por exemplo, a densidade de metilação para cada bin de 100 kb no genoma humano pode ser determinado a partir do número total de citosinas não convertidas depois do tratamento de bissulfito (o que corresponde à citosina metilada) em sítios de CpG como uma proporção de todos os sítios de CpG abrangidos pelas leituras de sequência mapeadas para a região de 100 kb. Esta análise também pode ser realizada para outros tamanhos de bin, por exemplo, 50 kb ou 1 Mb, etc. Uma região pode ser o genoma inteiro ou um cromossomo ou parte de um cromossomo (por exemplo, um braço cromossômico). O índice de metilação de um sítio de CpG é o mesmo que a densidade de metilação para uma região quando a região inclui somente esse sítio de CpG. A "proporção de citosinas metiladas" refere-se ao número de sítios de citosina, "Cs", que são mostrados como sendo metilados (por exemplo não convertidos após a conversão de bissulfito) sobre o número total de resíduos de citosina analisadas, ou seja, incluindo citosinas fora do contexto de CpG na região. O índice de metilação, a densidade de metilação e a proporção de citosinas metiladas são exemplos de "níveis de metilação".
[0072] Um "perfil de metilação" (também chamado de status de metilação) inclui informações relacionadas à metilação do DNA para uma região. Informações relacionadas à metilação do DNA podem incluir, entre outros, um índice de metilação de um sítio de CpG, uma densidade de metilação de sítios de CpG em uma região, uma distribuição de sítios de CpG sobre uma região contígua, um padrão ou nível de metilação para cada sítio de CpG individual dentro de uma região que contém mais de um sítio de CpG e metilação de não-CpG. Um perfil de metilação de uma parte substancial do genoma pode ser considerado equivalente ao metiloma. "Metilação do DNA" em genomas de mamíferos se refere, normalmente, à adição de um grupo metil ao carbono 5' dos resíduos de citosina (ou seja, 5-metilcitosinas) entre os dinucleotídeos de CpG. A metilação do DNA pode ocorrer em citosinas em outros contextos, por exemplo, CHG e CHH, onde H é adenina, citosina ou timina. A metilação da citosina também pode ser na forma de 5- Hidroximetilcitosina. A metilação de não-citosina, tais como N6-metiladenina também foi relatada.
[0073] Um "tecido" corresponde a qualquer quaisquer células. Tipos de tecido diferentes podem corresponder a diferentes tipos de células (por exemplo, fígado, pulmão ou sangue), mas também podem corresponder a tecido de organismos diferentes (mãe vs. feto) ou a células saudáveis vs. células tumorais. Uma "amostra biológica" se refere a qualquer amostra que é retirada de um sujeito (por exemplo,, um ser humano, como uma mulher grávida, uma pessoa com câncer ou uma pessoa com suspeita de câncer, um receptor de transplante de órgãos ou um sujeito com suspeita de ter um processo de doença que envolve um órgão (por exemplo, coração no infarto do miocárdio, ou o cérebro no acidente vascular cerebral) e contém uma ou mais moléculas de ácido nucleico de interesse. A amostra biológica pode ser um líquido corporal, como sangue, plasma, soro, urina, fluido vaginal, corrimentos uterinos ou vaginais, fluido plural, líquido ascítico, líquido cefalorraquidiano, saliva, suor, lágrimas, escarro, etc. fluido, lavagem broncoalveolar, etc. Amostras de fezes também podem ser usadas.
[0074] O termo "nível de câncer" pode se referir à existência do câncer, ao estágio do câncer, ao tamanho do tumor, se há metástase, à carga total do tumor do corpo, e/ou à outra medida relacionada à gravidade do câncer. O nível de câncer poderia ser um número ou outros caracteres. O nível poderia ser zero. O nível de câncer também inclui pré-malignidades ou condições pré-cancerosas (estados) associadas às mutações ou ao número de mutações. O nível de câncer pode ser usado de várias maneiras. Por exemplo, a triagem pode verificar se o câncer está presente em alguém que não tem ciência prévia da existência do câncer. A avaliação pode investigar alguém que foi diagnosticado com câncer para monitorar o progresso do câncer com o tempo, estudar a eficácia das terapias ou determinar o prognóstico. Em uma modalidade, o prognóstico pode ser expresso como a chance de um paciente morrer de câncer, ou a chance do câncer progredir após um determinado período ou tempo ou a chance de haver metástase do câncer. A detecção pode significar 'triagem' ou pode significar verificação se alguém, com características sugestivas de câncer (por exemplo, sintomas ou outros testes positivos), tiver câncer.
DESCRIÇÃO DETALHADA
[0075] Os mecanismos epigenéticos desempenham um papel importante no desenvolvimento embrionário e fetal. No entanto, os tecidos embrionários e fetais humanos (incluindo os tecidos placentários) não estão facilmente acessíveis (patente US N° 6.927.028). Determinadas modalidades abordaram este problema pela análise de uma amostra que tem moléculas de DNA sem células presentes na circulação materna. O metiloma fetal pode ser deduzido de várias maneiras. Por exemplo, o metiloma do plasma materno pode ser comparado a um metiloma celular (a partir de células do sangue da mãe) e a diferença é mostrada como estando correlacionada ao metiloma fetal. Como outro exemplo, alelos específicos do feto podem ser usados para determinar a metilação do metiloma fetal em loci específicos. Além disso, o tamanho de um fragmento pode ser usado como um indicador de uma porcentagem de metilação, como indicado na correlação entre a porcentagem de tamanho e metilação.
[0076] Em uma modalidade, o sequenciamento por bissulfito do todo o genoma é usado para analisar o perfil de metilação (parte ou a totalidade de um metiloma) do DNA do plasma materno em uma resolução única de nucleotídeo. Explorando as diferenças polimórficas entre a mãe e o feto, o metiloma fetal poderia ser montado a partir de amostras de sangue materno. Em outra implementação, as diferenças polimórficas não foram usadas, mas um diferencial entre o metiloma plasmático e o metiloma da célula do sangue pode ser usado.
[0077] Em outra modalidade, explorando variações de nucleotídeo único e/ou anomalias do número de cópia entre um genoma de tumor e um genoma de não-tumor e dados de sequenciamento do plasma (ou outra amostra), o perfil de metilação de um tumor pode ser realizado na amostra de um paciente com suspeita de câncer. Uma diferença em um nível de metilação em uma amostra de plasma de um indivíduo de teste em comparação com o nível de metilação do plasma de um controle saudável ou um grupo de controles saudáveis pode permitir a identificação do indivíduo teste como possuindo câncer. Além disso, o perfil de metilação pode atuar como uma assinatura que revela o tipo de câncer, por exemplo, em qual órgão que a pessoa desenvolveu e se ocorreu metástase.
[0078] Devido à natureza não invasiva desta abordagem, fomos capazes de avaliar em série os metilomas do plasma fetal e materno de amostras de sangue materno coletadas no primeiro trimestre, terceiro trimestre e após o parto. Foram observadas alterações relacionadas à gestação. A abordagem também pode ser aplicada a amostras obtidas durante o segundo trimestre. O metiloma fetal deduzido do plasma materno durante a gravidez se assemelhava ao metiloma placentário. Os genes impressos e regiões diferencialmente metiladas foram identificadas a partir dos dados do plasma materno.
[0079] Portanto, desenvolvemos uma abordagem para estudar o metiloma fatal de maneira não invasiva, em série e de forma abrangente, oferecendo, assim, a possibilidade de identificação de biomarcadores ou de teste direto das patologias relacionadas com a gravidez. As modalidades também podem ser usadas para estudar o metiloma tuomoral de maneira não invasiva, em série e de forma abrangente, para triagem ou detecção se um sujeito estiver sofrendo de câncer, para monitoramento de doenças malignas em um paciente com câncer e para prognóstico. As modalidades podem ser aplicadas a qualquer tipo de câncer, incluindo, entre outros, câncer de pulmão, câncer de mama, câncer colorretal, câncer de próstata, câncer de nasofaringe, câncer gástrico, câncer testicular, câncer de pele (por exemplo, melanoma), câncer que afeta o sistema nervoso, câncer ósseo, câncer de ovário, câncer de fígado (por exemplo, carcinoma hepatocelular), malignidades hematológicas, câncer pancreático, endometriocarcinoma, câncer de rim, câncer de colo do útero, câncer de bexiga, etc.
[0080] A descrição de como determinar um perfil metiloma ou de metilação é primeiramente discutido e, então, diferentes metilomas são descritos (como metilomas fetais, metiloma tumoral, metilomas da mãe ou de um paciente e metiloma misto, por exemplo, do plasma). A determinação de um perfil de metilação fetal é então descrito usando marcadores específicos do feto ou comparando um perfil de metilação misturado a um perfil de metilação celular. Os marcadores de metilação fetal são determinados pela comparação dos perfis de metilação. É discutida a relação entre tamanho e metilação. Também são providos usos dos perfis de metilação para detectar câncer.
I. DETERMINAÇÃO DE UM METILOMA
[0081] Inúmeras abordagens foram usadas para investigar o metiloma placentário, mas cada abordagem tem suas limitações. Por exemplo, bissulfito de sódio, uma substância química que modifica resíduos de citosina não metilada para uracila e mantém a citosina metilada inalterada, converte as diferenças na metilação de citosina em uma diferença de sequência genética para mais interrogatórios. O método padrão ouro de estudo da metilação de citosina se baseia no tratamento do DNA do tecido por bissulfito de sódio, seguido do sequenciamento direto de clones individuais de moléculas de DNA convertidas por bissulfito. Após a análise de vários clones de moléculas de DNA, o padrão de metilação de citosina e o perfil quantitativo por sítio de CpG pode ser obtido. No entanto, o sequenciamento de bissulfito clonado é um procedimento de baixo rendimento e de trabalho intenso que não pode ser facilmente aplicado a todo o genoma.
[0082] As enzimas sensíveis à metilação que normalmente digerem DNA não metilado proveem uma abordagem de baixo custo para o estudo da metilação do DNA. No entanto, dados gerados a partir desses estudos são limitados aos loci com motivos de reconhecimento da enzima e os resultados não são quantitativos. A imunoprecipitação do DNA ligado pelos anticorpos de citosina antimetilados pode ser usada para o levantamento de grandes segmentos do genoma, mas tende aos loci com metilação densa devido a maior força de ligação do anticorpo a essas regiões. Abordagens baseadas em micromatrizes dependem de um projeto de sondas de interrogatório a priori e de eficiências de hibridação entre as sondas e o DNA alvo.
[0083] Para interrogar um metiloma de forma abrangente, algumas modalidades usam sequenciamento massivamente paralelo (MPS) para prover informações de todo o genoma e avaliação quantitativa do nível de metilação por nucleotídeo e por base de alelo. Recentemente, a conversão de bissulfito, seguida da MPS em todo o genoma, tornou-se viável (R Lister et al 2008 Cell; 133: 523-536).
[0084] Entre o pequeno número de estudos publicados (R Lister et al. 2009 Nature; 462: 315-322; L Laurent et al. 2010 Genome Res; 20: 320-331; Y Li et al. 2010 PLoS Biol; 8: e1000533; e M Kulis et al. 2012 Nat Genet; 44: 1236-1242) que aplicou o sequenciamento por bissulfito de todo o genoma para a investigação de metilomas humanos, dois estudos focaram nas células- tronco embrionárias e fibroblastos fetais (R Lister et al. 2009 Nature; 462: 315-322; L Laurent et al. 2010 Genome Res; 20: 320-331). Os dois estudos analisaram o DNA derivado da linhagem celular. A. Sequenciamento por bissulfito de todo o genoma
[0085] Determinadas modalidades podem superar os desafios supracitados e possibilitar o interrogatório de um metiloma fetal de maneira abrangente, não invasiva e em série. Em uma modalidade, o sequenciamento de bissulfito de todo o genoma foi usado para analisar moléculas de DNA fetal livre de células que são encontradas na circulação das gestantes. Apesar da baixa abundância e da natureza fragmentada das moléculas de DNA do plasma, fomos capazes de montar um metiloma fetal de alta resolução a partir do plasma materno e observar em série as mudanças com a progressão da gravidez. Dado o interesse intenso em teste pré-natal não-invasivo (NIPT), as modalidades podem prover uma nova ferramenta poderosa para a descoberta de um biomarcador fetal ou servir como uma plataforma direta para alcançar o NIPT de doenças fetais ou associadas à gravidez. Dados do sequenciamento de bissulfito de todo o genoma de várias amostras, das quais o metiloma fetal pode ser derivado, agora são providos. Em uma modalidade, esta tecnologia pode ser aplicada para o perfil de metilação em gestações complicadas com pré-eclâmpsia, retardo de crescimento intra-uterino ou parto prematuro. Para essas gravidezes complicadas, esta tecnologia pode ser usada em série devido à sua natureza não-invasiva, para permitir o monitoramento e/ou o prognóstico e/ou a resposta ao tratamento.
[0086] A FIG. 1A mostra uma tabela 100 dos resultados do sequenciamento do sangue materno, da placenta e do plasma materno de acordo com as modalidades da presente invenção. Em uma modalidade, o sequenciamento do genoma inteiro foi realizado em bibliotecas de DNA convertido por bissulfito, preparadas usando adaptadores de biblioteca de DNA metilado (Illumina) (R Lister et al. 2008 Cell; 133: 523-536), de células do sangue da amostra de sangue coletada no primeiro trimestre, o CVS, o tecido placentário coletado no prazo, amostras de plasma materno coletados durante o primeiro e o terceiro trimestres e no período pós-parto. Amostras de célula do sangue e de DNA da placenta obtidas a partir de um macho adulto e de uma mulher adulta não grávida também foram analisadas. Um total de 9,5 bilhões de pares de leituras de sequência brutas foram gerados neste estudo. A cobertura de sequenciamento de cada amostra é mostrada na tabela 100.
[0087] As leituras de sequência que foram excepcionalmente mapeáveis ao genoma humano de referência alcançaram coberturas genômicas haploides médias de 50 dobras, 34 dobras e 28 dobras, respectivamente, para o primeiro trimestre, terceiro trimestre e amostras de plasma materno pós-parto. A cobertura dos sítios de CpG no genoma variou de 81% a 92% para as amostras obtidas na gravidez. As leituras de sequência que estenderam os sítios de CpG representaram coberturas haploides médias de 33 dobras por filamento, 23 dobras por filamento e 19 dobras por filamento, respectivamente, para amostras de plasma do primeiro trimestre, do terceiros trimestre e pós-parto. As eficiências de conversão de bissulfito para todas as amostras foram > 99,9% (tabela 100).
[0088] Na tabela 100, a taxa ambíguo ("a" marcado" se refere à proporção de leituras mapeadas em filamentos Watson e Crick do genoma humano de referência. A taxa de conversão lambda se refere à proporção de citosinas não metiladas no controle de DNA lambda interno sendo convertido em resíduos de "timina" pela modificação do bissulfito. H equivale genericamente a A, C, ou T. "a" se refere às leituras que poderiam ser mapeadas para um locus genômico específico, mas que não podem ser atribuídas ao filamento Watson ou Crick. "b" se refere às leituras emparelhadas com coordenadas de início e final idênticas. Para "c", o DNA lambda foi cravado em cada amostra antes da conversão de bissulfito. A taxa de conversão lambda se refere à proporção de nucleotídeos de citosina que permanecem como citosina após a conversão de bissulfito e é usada como uma indicação da taxa de conversão de bissulfito bem-sucedida. "d" se refere ao número de nucleotídeos de citosina presentes no genoma humano de referência e continuando como uma sequência de citosina após a conversão de bissulfito.
[0089] Durante a modificação de bissulfito, citosinas não metiladas são convertidas em uracilas e, posteriormente, em timinas após amplificações do PCR enquanto as citosinas metiladas permaneceriam intactas (M Frommer et al. 1992 Proc Natl Acad Sci USA;89:1827-31). Após o sequenciamento e alinhamento, o status de metilação de um sítio de CpG individual poderia, assim, ser inferido da contagem das leituras de sequência metilada "M" (metiladas) e da contagem das leituras de sequência "U" (não metiladas) no resíduo de citosina no contexto de CpG. Usando os dados de sequenciamento de bissulfito, os metilomas inteiros do sangue materno, placenta e plasma materno foram construídos. A densidade média de CpG metilado (também chamada de densidade de metilação MD) dos loci específicos no plasma materno pode ser calculada usando a equação:
Figure img0001
onde M é a contagem de leituras misturadas e U é a contagem de leituras não metiladas em sítios de CpG dentro do locus genético. Se houver mais de um sítio de CpG dentro de um locus, então M e U correspondem às contagens através dos sítios. B. Várias técnicas
[0090] Como descrito acima, o perfil de metilação pode ser realizado usando o sequenciamento massivamente paralelo (MPS) do DNA do plasma convertido por bissulfito. MPS do DNA de plasma convertido por bissulfito pode ser realizado de maneira aleatória ou shotgun. A profundidade do sequenciamento pode ser alterada de acordo com o tamanho da região de interesse.
[0091] Em outra modalidade, as regiões de interesse no DNA de plasma convertido por bissulfito pode ser primeiramente capturado usando um processo baseado em hibridização de solução-fase ou fase sólida, seguido de MPS. O sequenciamento massivamente paralelo pode ser realizado usando uma plataforma de sequenciamento por síntese como Illumina, plataforma de sequenciamento por ligação como a plataforma SOLiD da Life Technologies, um sistema de sequenciamento baseado em semicondutores como as plataformas Ion Torrent ou Ion Proton da Life Technologies, ou sistema de sequenciamento de molécula única como o sistema Helicos ou Pacific Biosciences ou um sistema de sequenciamento baseado em nanoporo. O sequenciamento baseado em nanopore incluindo nanoporos que são construídos usando, por exemplo, camadas duplas de lipídio e nanoporo de proteína e nanoporos de estado sólido (como aqueles à base de grafeno). Já que as plataformas de sequenciamento de molécula única selecionadas permitiriam que o status de metilação das moléculas de DNA (incluindo N6- metiladenina, 5-metilcitosina e 5-hidroximetilcitosina) fosse elucidado diretamente sem conversão de bissulfito (BA Flusberg et al. 2010 Nat Methods; 7: 461-465; J Shim et al. 2013 Sci Rep; 3:1389. doi: 10.1038/srep01389), o uso dessas plataformas permitiria que o status de metilação do DNA da amostra convertida por não-bissulfito (por exemplo, DNA dp plasma) fosse analisado.
[0092] Além do sequenciamento, outras técnicas podem ser usadas. Em uma modalidade, o perfil de metilação pode ser efetuado por PCR específica da metilação ou digestão de enzima de restrição sensível à metilação seguida por PCR ou reação em cadeia da ligase seguida da PCR. Ainda em outras modalidades, a PCR é uma forma de molécula única ou PCR digital (B Vogelstein et al. 1999 Proc Natl Acad Sci USA; 96: 9236-9241). Ainda em outras modalidades, a PCR pode ser uma PCR em tempo real. Em outras modalidades, a PCR pode ser PCR multiplex.
II. ANÁLISE DE METILOMAS
[0093] Algumas modalidades podem determinar o perfil de metilação do DNA de plasma utilizando o sequenciamento por bissulfito de todo o genoma. O perfil de metilação de um feto pode ser determinado pelo sequenciamento das amostras de DNA de plasma materno, conforme descrito abaixo. Assim, as moléculas de DNA fetal (e metiloma fetal) foram acessados de forma não invasiva durante a gravidez e as alterações foram monitoradas em série com o progresso da gravidez. Devido à abrangência dos dados de sequenciamento, fomos capazes de estudar os metilomas do plasma materno em todo o genoma na resolução de um nucleotídeo único.
[0094] Já que as coordenadas genômicas das leituras sequenciadas eram conhecidas, esses dados permitiram o estudo de níveis de metilação globais do metiloma ou de qualquer região de interesse no genoma e a comparação entre elementos genéticos diferentes. Além disso, várias leituras de sequência abrangeram cada tipo de sítio ou de locus do CpG. Uma descrição de algumas métricas utilizadas para medir o metiloma é provida agora. A. Metilação das Moléculas de DNA do Plasma
[0095] As moléculas de DNA estão presentes no plasma humano em baixas concentrações e de forma fragmentada, normalmente, em comprimentos que se assemelham a unidades de mononucleossomais (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91; e YW Zheng at al. 2012 Clin Chem; 58: 549-558). Apesar dessas limitações, um pipeline de sequenciamento por bissulfito em todo o genoma foi capaz de analisar a metilação das moléculas de DNA do plasma. Ainda em outras modalidades, já que as plataformas de sequenciamento de molécula única selecionadas permitiriam que o status de metilação das moléculas de DNA fosse elucidado diretamente sem conversão de bissulfito (BA Flusberg et al. 2010 Nat Methods; 7: 461-465; J Shim et al. 2013 Sci Rep; 3:1389. doi: 10.1038/srep01389), o uso dessas plataformas permitiria que o DNA de plasma convertido por não-bissulfito fosse usado para determinar os níveis de metilação do DNA de plasma ou para determinar o metiloma do plasma. Essas plataformas podem detectar N6-metiladenina, 5- metilcitosina e 5-hidroximetilcitosina, que pode prover melhores resultados (por exemplo, melhor sensibilidade ou especificidade) relacionados com as funções biológicas das diferentes formas de metilação. Esses resultados aprimorados podem ser úteis na aplicação de modalidades para a detecção ou monitoramento de distúrbios específicos, por exemplo, pré-eclâmpsia ou um tipo específico de câncer.
[0096] O sequenciamento por bissulfito também pode discriminar diferentes formas de metilação. Em uma modalidade, pode-se incluir etapas adicionais que podem distinguir a 5-metilcitosina da 5-hidroximetilcitosina. Essa abordagem é o sequenciamento por bissulfito oxidativo (oxBS-seq), que pode elucidar a localização da 5-metilcitosina e da 5-hidroximetilcitosina em uma resolução de base única (MJ Booth et al. 2012 Science; 336: 934-937; MJ Booth et al. 2013 Nature Protocols; 8: 1841-1851). No sequenciamento de bissulfito, a 5-metilcitosina da 5-hidroximetilcitosina são lidas como citosinas e, portanto, não podem ser discriminadas. Por outro lado, em oxBS- seq, a oxidação específica da 5-hidroximetilcitosina em 5-formilcitosina pelo tratamento com perrutenato de potássio (KRuO4), seguido da conversão da 5- formilcitosina recém-formada em uracila usando a conversão por bissulfito permitiria que a 5-hidroximetilcitosina fosse distinguida da 5-metilcitosina. Portanto, uma leitura da 5-metilcitosina pode ser obtida de uma execução única de oxBS-seq, e os níveis de 5-hidroximetilcitosina são deduzidos em comparação com os resultados do sequenciamento por bissulfito. Em outra modalidade, a 5-metilcitosina pode ser distinguida da 5-hidroximetilcitosina usando o sequenciamento por bissulfito assistido por Tet (TAB-seq) (M Yu et al . 2012 Nat Protoc; 7: 2159-2170). O TAB-seq pode identificar a 5- hidroximetilcitosina em uma resolução de base única, bem como determinar sua abundância em cada sítio de modificação. Este método envolve proteção mediada por β-glicosiltransferase de 5-hidroximetilcitosina (glicosilação) e a oxidação mediada do camundongo recombinante Tet1 (mTet1) da 5- metilcitosina em 5-carboxilcitosina. Após o tratamento por bissulfito subsequente e a amplificação por PCR, tanto a citosina quanto a 5- carboxilcitosina (derivada da 5-metilcitosina) são convertidas em timina (T), enquanto que a 5-hidroximetilcitosina será lida como C.
[0097] A FIG. 1B mostra a densidade de metilação nas janelas 1-Mb das amostras sequenciadas de acordo com as modalidades da presente invenção. A representação gráfica 150 é um gráfico Circos que retrata a densidade de metilação no plasma materno e no DNA genômico em janelas de 1 Mb através do genoma. De fora para dentro: ideogramas do cromossomo podem ser orientados por pter-qter no sentido horário (os centrômeros são mostrados em vermelho), sangue materno (vermelho), placenta (amarelo), plasma materno (verde), leituras compartilhadas no plasma materno (azul) e leituras específicas do feto no plasma materno (roxo). Os níveis de metilação de CpG globais (ou seja, níveis de densidade) de células do sangue materno, placenta e plasma materno podem ser encontrados na tabela 100. O nível de metilação das células do sangue materno é, em geral, maior do que o da placenta no genoma inteiro. B. Comparação do Sequenciamento por Bissulfito com Outras Técnicas
[0098] Estudamos o metiloma placentário usando o sequenciamento por bissulfito massivamente paralelo. Além disso, estudamos o metiloma placentário usando uma plataforma da matriz do oligonucleotídeo que abrangeu cerca de 480.000 sítios de CpG no genoma humano (Illumina) (M Kulis et al. 2012 Nat Genet; 44: 1236-1242; e C Clark et al. 2012 PLoS One; 7: e50233). Em uma modalidade que usa a genotipagem baseada em beadchip e a análise de metilação, a genotipagem foi realizada usando a matriz de genotipagem Illumina HumanOmni2.5-8 de acordo com o protocolo do fabricante. Os genótipos foram chamados usando o algoritmo de GenCall do Genome Studio Software (Illumina). As taxas de chamada foram mais superiores a 99%. Para a análise de metilação baseada em microarranjo, o DNA genômico (500-800 ng) foi tratado por bissulfito de sódio usando o Kit de Metilação Zymo EZ DNA (Zymo Research, Orange, CA, USA) de acordo com as recomendações do fabricante para o Ensaio de Metilação Infinium Illumina.
[0099] O ensaio de metilação foi realizado em 4 μl de DNA genômico convertido por bissulfito a 50 ng/μl de acordo com o protocolo do Ensaio de Metilação Infinium HD. O beadchip hibridizado foi digitalizado em um instrumento Illumina iScan. Dados de metilação do DNA foram analisados pelo software GenomeStudio (v2011.1) Methylation Module (v1.9.0), com normalização dos controles internos e subtração de fundo. O índice de metilação para sítios de de CpG individuais foi representado por um valor beta (□), que foi calculado usando a razão das intensidades fluorescentes entre alelos metilados e não metilados:
Figure img0002
[00100] Para sítios de CpG que foram representados na matriz e sequenciados para cobertura de pelo menos 10 dobras, comparamos o valor de beta obtido pela matriz para o índice de metilação, determinado pelo sequenciamento do mesmo sítio. Os valores de beta representaram a intensidade das sondas metiladas como uma proporção da intensidade combinada das sondas metiladas e não metiladas que abrangem o mesmo sítio de CpG. O índice de metilação para cada sítio de CpG se refere à proporção de leituras metiladas sobre o número total de leituras que abrangem esse CpG.
[00101] As FIGS. 2A-2C mostram representações gráficas de valores beta determinados pela matriz de beadchip Illumina Infinium HumanMethylation 450K em relação aos índices de metilação determinados pelo sequenciamento por bissulfito em todo o genoma dos sítios de CpG correspondentes que foram interrogados pelas duas plataformas: (A) Células do sangue materno, (B) Amostra do vilo corial, (C) Tecido placentário a termo. Os dados de ambas as plataformas foram altamente compatíveis e os coeficientes da correlação de Pearson foram 0,972, 0.939 e os valores de 0,954 e R2 eram 0,945, 0,882 e 0,910 para as células do sangue materno, CVS e tecido placentário a termo, respectivamente.
[00102] Comparamos ainda nossos dados de sequenciamento com aqueles relatados por Chu et al, que investigou os perfis de metilação de 12 pares de CVS e amostras do DNA das células do sangue materno usando uma matriz de oligonucleotídeo que abrangeu cerca de 27.000 sítios de CpG (T Chu et al. 2011 PLoS One; 6: e14723). Os dados de correlação entre os resultados de sequenciamento do CVS e do DNA da célula do sangue materno e cada um dos 12 pares de amostras no estudo anterior resultaram em um coeficiente de Pearson médio (0,967) e R2 (0,935) para o sangue materno e um coeficiente de Pearson médio (0,943) e R2 (0,888) para CVS. Entre os sítios de CpG representados em ambas as matrizes, nossos dados se correlacionaram com os dados publicados. As taxas de metilação de não-CpG foram < 1% para as células do sangue materno, CVS e tecidos placentários (tabela 100). Esses resultados foram consistentes com a crença atual de que quantidades substanciais de metilação de não-CpG foram restringidas às células pluripotentes (R Lister et al. 2009 Nature; 462: 315-322; L Laurent et al. 2010 Genome Res; 20: 320-331). C. Comparação dos Metilomas Plasmático e Sanguíneo para Sujeitos Não- Gestantes
[00103] As FIGS. 3A e 3B mostram gráficos de barras da porcentagem dos sítios de CpG metilados nas células do plasma e do sangue coletadas de um macho adulto e uma fêmea adulta não grávida: (A) Autossomos, (B) Cromossomo X. Os gráficos mostram uma similaridade entre os metilomas plasmático e sanguíneo de um macho e de uma fêmea não-grávida. As proporções gerais dos sítios de CpG que foram metilados nas amostras de plasma masculino e feminino de não-gestante foram quase as mesmas correspondentes ao DNA da célula do sangue (tabela 100 e FIGS. 2A e 2B).
[00104] Em seguida, estudamos a correlação dos perfis de metilação das amostras de plasma e de célula do sangue de uma maneira específica ao locus. Determinamos a densidade de metilação de cada bin de 100 kb no genoma humano, determinando o número total de citosinas não convertidas nos sítios de CpG como uma proporção de todos os sítios de CpG abrangidos pelas leituras da sequência mapeadas para a região de 100 kb. As densidades de metilação foram altamente compatíveis entre a amostra de plasma e o DNA da célula de sangue correspondente das amostras do macho e da fêmea.
[00105] As FIGS. 4A e 4B mostram gráficos das densidades de metilação dos loci correspondentes no DNA das células do sangue e no DNA do plasma: (A) Mulher adulta não grávida, (B) Homem adulto. O coeficiente da correlação de Pearson e o valor de R2 para as amostras de fêmeas não- grávidas foi respectivamente 0,963 e 0,927 e, para as amostras masculinas, foi respectivamente 0,953 e 0,908. Estes dados são consistentes com as conclusões anteriores com base na avaliação de genótipos das moléculas de DNA do plasma de receptores de transplante alogênico de células-tronco hematopoéticas que mostrou que as células hematopoiéticas são a fonte predominante de DNA do plasma humano (YW Zheng et al. 2012 Clin Chem; 58: 549-558). D. Níveis de Metilação por meio de Metilomas
[00106] Em seguida, estudamos os níveis de metilação do DNA do DNA do plasma materno, das células do sangue materno e do tecido placentário para determinar os níveis de metilação. Os níveis foram determinados para regiões de repetição, regiões de não-repetição e globais.
[00107] As FIGS. 5A e 5B mostram gráficos de barras de porcentagem de sítios de CpG metilados entre amostras coletadas na gravidez: (A). Autossomos, (B) Cromossomo X. As proporções gerais de CpGs metilados eram de 67,0% e 68,2% para as amostras de plasma materno do primeiro e do terceiro trimestres, respectivamente. Ao contrário dos resultados obtidos a partir de indivíduos não-gestantes, essas proporções eram inferiores às da amostra de célula do sangue materno do primeira trimestre, mas superiores às das amostras de CVS e do tecido placentário a termo (tabela 100). De nota, a porcentagem de CpGs metilados para amostra de plasma materno pós-parto era de 73,1%, similar aos dados da célula do sangue (tabela 100). Estas tendências foram observadas em CpGs distribuídos por todos os autossomos, bem como pelo cromossomo X e se expandiram em regiões de não-repetição e várias classes de elementos de repetição do genoma humano.
[00108] Os elementos de repetição e de não-repetição na placenta foram encontrados como sendo hipometilados em relação às células do sangue materno. Os resultados foram consistentes com as conclusões contidas na literatura de que a placenta é hipometilada em relação a outros tecidos, incluindo células do sangue periférico.
[00109] Entre 71% a 72% dos sítios de CpG sequenciados foram metilados no DNA da células do sangue da mulher grávida, da mulher não- grávida e do homem adulto (tabela 100 da FIG. 1). Esses dados são comparáveis com o relatório de 68,4% de sítios de CpG das células mononucleares do sangue relatados por Y Li et al. 2010 PLoS Biol; 8: e1000533. Consistentes com os relatórios anteriores sobre a natureza hipometilada dos tecidos placentários, 55% e 59% dos sítios de CpG foram metilados em CVS e no tecido placentário a termo, respectivamente (tabela 100).
[00110] A FIG. 6 mostra um gráfico de barras do nível de metilação das diferentes classes de repetição do genoma humano para o sangue materno, placenta e plasma materno. As classes de repetição são definidas pelo navegador UCSC genome. Os dados apresentados são das amostras de primeiro trimestre. Ao contrário dos dados anteriores que sugerem a natureza hipometilada dos tecidos placentários foram principalmente observados em determinadas classes de repetição no genoma (B Novakovic et al. 2012 Placenta; 33: 959-970), aqui nós mostramos que a placenta era, na verdade, hipometilada na maioria das classes de elementos genômicos com referência às células do sangue. E. Similaridade de Metilomas
[00111] As modalidades podem determinar os metilomas dos tecidos placentários, das células de sangue e do plasma usando a mesma plataforma. Portanto, foram possíveis comparações diretas dos metilomas desses tipos de amostra biológica. O alto nível de semelhança entre os metilomas das células do sangue e o plasma para macho e fêmea não-grávida, bem como entre as amostras de células do sangue materno e do plasma materno pós-parto afirmou ainda que as células hematopoiéticas eram as principais fontes de DNA no plasma humano (YW Zheng em al. 2012 Clin Chem; 58: 549-558).
[00112] As semelhanças são evidentes, tanto em termos de proporção global dos CpGs metilados no genoma, quanto da alta correlação das densidades de metilação entre loci correspondentes no DNA da célula do sangue e no DNA do plasma. No entanto, as proporções globais dos CpGs metilados nas amostras do plasma materno do primeiro trimestre e do terceiro trimestre reduziram em comparação com os dados da célula de sangue materno ou da amostra de plasma materno pós-parto. Os níveis reduzidos de metilação durante a gravidez eram em virtude da natureza hipometilada das moléculas de DNA fetal presentes no plasma materno.
[00113] A inversão do perfil de metilação da amostra de plasma materno pós-parto para que se torne mais similar ao da células do sangue materno sugere que as moléculas de DNA fetais foram removidas da circulação materna. O cálculo das concentrações de DNA fetal baseado em marcadores do SNP do feto mostrou, de fato, que a concentração mudou de 33,9% antes do parto para apenas 4,5% na amostra do pós-parto. F. Outras Aplicações
[00114] As modalidades montaram com êxito os metilomas do DNA por meio da análise de MPS do DNA do plasma. A capacidade de determinar o metiloma placentário ou fetal do plasma materno provê um método não- invasivo para determinar, detectar e monitorar perfis de metilação referentes às condições associadas à gravidez como pré-eclâmpsia, restrição de crescimento intrauterino, parto prematuro e outros. Por exemplo, a detecção de uma assinatura de metilação anormal específica da doença permite a triagem, o diagnóstico e o monitoramento dessas condições associadas à gravidez. A medição do nível de metilação do plasma materno permite o rastreio, diagnóstico e monitoramento dessas condições associadas à gravidez. Além das aplicações diretas na investigação das condições associadas à gravidez, a abordagem poderia ser aplicada a outras áreas da medicina em que a análise de DNA do plasma é de interesse. Por exemplo, os metilomas dos cânceres poderiam ser determinados a partir do DNA do plasma de pacientes com câncer. A análise metilômica do câncer a partir do plasma, conforme descrito neste documento, é potencialmente uma tecnologia sinérgica para a análise genômica do plasma (KCA Chan at al. 2013 Clin Chem; 59: 211-224 e RJ Leary et al. 2012 Sci Transl Med; 4:162ra154).
[00115] Por exemplo, a determinação de um nível de metilação de uma amostra de plasma poderia ser utilizada para uma triagem do câncer. Quando o nível de metilação da amostra plasma mostra níveis anormais em comparação com controles saudáveis, pode haver suspeita de câncer. Assim, uma confirmação e avaliação adicionais do tipo de câncer ou da origem do tecido com câncer podem ser realizadas, determinando o perfil do plasma da metilação em diferentes loci genômicos ou pela análise genômica do plasma para detectar anomalias do números de cópia associadas ao tumor, translocações cromossômicas e variantes de nucleotídeo único. De fato, em uma modalidade desta invenção, o perfil genômico e metilômico do câncer de plasma podem ser realizado simultaneamente. Alternativamente, as investigações radiológicas e de imagem (por exemplo, tomografia computadorizada, ressonância magnética, tomografia por emissão de pósitrons) ou endoscopia (por exemplo, endoscopia gastrointestinal ou colonoscopia) poderiam ser usadas para investigar indivíduos com suspeita de câncer com base na análise do nível de metilação do plasma.
[00116] Para triagem e detecção do câncer, a determinação da amostra de um nível de metilação de um plasma (ou outra biológica) pode ser usada em conjunto com outras modalidades para triagem ou detecção do câncer como medição do antígeno específico da próstata (por exemplo, para câncer de próstata), antígeno carcinoembriônico (por exemplo, para carcinoma colorretal, carcinoma gástrico, carcinoma do pâncreas, carcinoma de pulmão, carcinoma da mama, carcinoma medular da tireoide), alfa fetoproteína (por exemplo, para câncer no fígado ou tumores de células germinativas), CA125 (por exemplo, câncer de ovário e de mama) e CA19-9 (por exemplo, para carcinoma do pâncreas).
[00117] Além disso, outros tecidos podem ser sequenciados para obter um metiloma celular. Por exemplo, o tecido do fígado pode ser analisado para determinar um padrão de metilação específico do fígado, que pode ser usado para identificar patologias hepáticas. Outros tecidos que também podem ser analisados incluem células do cérebro, ossos, pulmões, coração, músculos e rins, etc. Os perfis de metilação de vários tecidos podem mudar ao longo do tempo, por exemplo, em decorrência do desenvolvimento, envelhecimento, processos da doença (por exemplo, inflamação ou cirrose ou processos autoimunes (como lúpus eritematoso sistêmico)) ou do tratamento (por exemplo, o tratamento com agentes desmetilantes como 5-azacitadina e 5- azadeoxicitadina). A natureza dinâmica da metilação do DNA faz com que essa análise seja potencialmente muito valiosa para o monitoramento dos processos fisiológicos e patológicos. Por exemplo, se há a detecção de uma alteração no metiloma do plasma de um indivíduo em comparação com um valor de referência obtido quando ele estava saudável, é possível, então, detectar processos da doença em órgãos que contribuem com DNA do plasma.
[00118] Além disso, os metilomas de órgãos transplantados poderiam ser determinados a partir do DNA do plasma de receptores de transplante de órgãos. A análise metilômica do transplante a partir do plasma, descrita nesta invenção, é potencialmente uma tecnologia sinérgica para a análise genômica do transplante a partir do plasma (YW Zheng et al, 2012; YMD Lo at al. 1998 Lancet; 351: 1329-1330; e TM Snyder et al. 2011 Proc Natl Acad Sci USA; 108: 6229-6234). Como o DNA do plasma é geralmente considerado um marcador de morte celular, o aumento do nível plasmático do DNA liberado de um órgão transplantado poderia ser usado como marcador para o aumento da morte celular a partir daquele órgão, como um episódio de rejeição ou outros processos patológicos que envolvem esse órgão (por exemplo, infecção ou abscesso). Caso a terapia antirrejeição seja instituída com êxito, espera-se que o nível plasmático do DNA liberado pelo órgão transplantado reduza.
III. DETERMINAÇÃO DE METILOMA FETAL OU TUMORAL USANDO SNPs
[00119] Como descrito acima, o metiloma de plasma corresponde ao metiloma sanguíneo para uma pessoa normal não-grávida. No entanto, para uma fêmea grávida, os metilomas diferem. As moléculas de DNA fetal circulam no plasma materno entre a maior parte dos fundamentos do DNA materno (YMD Lo et al. 1998 Am J Hum Genet; 62: 768-775). Assim, para uma fêmea grávida, o metiloma de plasma é, em grande parte, um compósito do metiloma placentário e do metiloma sanguíneo. Nesse sentido, é possível extrair o metiloma placentário do plasma.
[00120] Em uma modalidade, as diferenças do polimorfismo do nucleotídeo único (SNP) entre a mãe e o feto são usadas para identificar as moléculas de DNA fetal no plasma materno. O objetivo foi identificar os loci de SNP, em que a mãe é homozigota, mas o feto é heterozigoto; o alelo específico do feto pode ser usado para determinar quais fragmentos de DNA são do feto. O DNA genômico das células do sangue materno foi analisado usando uma matriz de genotipagem do SNP, Illumina HumanOmni2.5-8. Por outro lado, para loci de SNP em que a mãe é heterozigota e o feto é homozigoto, o alelo de SNP que é específico para a mãe pode ser usado para determinar quais fragmentos de DNA de plasma são da mãe. O nível de metilação desses fragmentos de DNA seria reflexivo do nível de metilação para as regiões genômicas relacionadas na mãe. A. Correlação de metilação entre as leituras específicas do feto e o metiloma placentário
[00121] Os loci com dois alelos diferentes, onde a quantidade de um alelo (B) foi significativamente inferior a do outro alelo (A), foram identificados a partir dos resultados do sequenciamento de uma amostra biológica. As leituras que abrangem os alelos B foram consideradas como específicas do feto (leituras específicas do feto). A mãe é determinada como sendo homozigota para A e o feto heterozigoto para A/B e, portanto, leituras que abrangem o alelo A foram compartilhadas pela mãe e pelo feto (leituras compartilhadas).
[00122] Em um caso de gravidez analisado que foi usado para ilustrar vários conceitos nesta invenção, foi constatado que a a gestante era homozigota em 1.945.516 loci em relação aos autossomos. As leituras de sequenciamento do DNA do plasma materno que abrangeram esses SNPs foram inspecionadas. Leituras que portam um alelo não-materno foram detectadas em 107.750 loci e estes foram considerados loci informativos. Em cada SNP informativo, o alelo que não era da mãe foi denominado alelo específico do feto, enquanto que o outro foi denominado alelo compartilhado.
[00123] A concentração de DNA fetal/tumoral fracionária (também chamada de porcentagem do DNA fetal) no plasma materno pode ser determinada. Em uma modalidade, a concentração fracionária do DNA fetal no plasma materno, f, é determinada pela equação:
Figure img0003
onde p é o número de leituras sequenciadas com alelo específico do feto q é o número de leituras sequenciadas com o alelo compartilhado entre a mãe e o feto (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91). Foi constatado que as proporções de DNA fetais nas amostras do plasma materno no primeiro trimestre, no terceiro trimestre e no pós-parto são 14,4%, 33,9% e 4,5%, respectivamente. As proporções de DNA fetal também foram calculadas usando os números de leituras que estavam alinhados ao cromossomo Y. Com base nos dados do cromossomo Y, os resultados foram 14,2%, 34,9% e 3,7%, respectivamente, nas amostras do plasma materno no primeiro trimestre, no terceiro trimestre e pós-parto.
[00124] Analisando separadamente as leituras de sequência específicas do feto ou compartilhadas, as modalidades demonstram que as moléculas circulantes de DNA fetal eram muito mais hipometiladas do que as moléculas de DNA de base. As comparações das densidades de metilação dos loci correspondentes nas leituras do plasma materno específicas do feto e dos dados do tecido placentário para os primeiro e terceiro trimestres revelou altos níveis de correlação. Estes dados proveram comprovação do nível do genoma de que a placenta é a fonte predominante de moléculas de DNA derivadas do feto no plasma materno e representou um importante passo a frente em comparação com provas anteriores com base em informações provenientes dos loci selecionados.
[00125] Determinamos a densidade de metilação de cada região de 1 Mb no genoma usando tanto leituras específicas do feto ou compartilhado que abrangeram sítios de CpG adjacentes aos SNPs informativos. Os metilomas específicos do feto e do não-feto montados a partir das leituras de sequência do plasma podem ser exibidos, por exemplo, gráfico Circos (M Krzywinski et al. 2009 Genome Res; 19: 1639-1645). As densidades de metilação por bin de 1 Mb também foram determinadas para amostras de células do sangue materno e do tecido placentário.
[00126] A FIG. 7A mostra um gráfico Circos 700 para amostras do primeiro trimestre. A FIG. 7B mostra um gráfico Circos 750 para amostras do terceiro trimestre. As representações gráficas 700 e 750 mostram a densidade de metilação por bin de 1 Mb. Os ideogramas do cromossomo (anel mais externo) são orientados pter-qter no sentido horário (os centrômeros são mostrados em vermelho). A segunda faixa ultraperiférica mostra o número de sítios de CpG nas regiões de 1 Mb correspondentes. A escala das barras vermelhas mostrada é de até 20.000 sítios por bin de 1 Mb. As densidades de metilação das regiões de 1 Mb correspondentes são mostradas em outras faixas com base no esquema de cores mostrado no centro.
[00127] Para amostras do primeiro trimestre (FIG. 7A), de dentro para fora, as faixas são: amostra do vilo corial, leituras específicas do feto no plasma materno, leituras específicas da mãe no plasma materno, leituras fetais e não-fetais combinadas no plasma materno e células do sangue materno. Para amostras do terceiro trimestre (FIG. 7B), as faixas são: tecido placentário a termo, leituras específicas do feto no plasma materno, leituras específicas da mãe no plasma materno, leituras fetais e não-fetais combinadas no plasma materno, plasma materno pós-parto e células do sangue materno (da amostra de sangue do primeiro trimestre). Pode ser apreciado que para as amostras de plasma do primeiro e do terceiro trimestres, os metilomas fetais eram mais hipometilados do que os metilomas específicos não-fetais.
[00128] O perfil de metilação global dos metilomas fetais se assemelhavam muito à CVS ou às amostras de tecido placentário. Pelo contrário, o perfil de metilação do DNA das leituras compartilhadas no plasma, que eram predominantemente DNA materno, se assemelhavam muito ao das células do sangue materno. Em seguida, realizamos uma comparação sistemática de locus por locus das densidades de metilação das leituras do DNA do plasma materno e dos tecidos materno ou fetal. Determinamos as densidades de metilação dos sítios de CpG que estavam presentes nas mesmas leituras de sequência como SNPs informativos e cobriram pelo menos 5 leituras de sequência do DNA do plasma materno.
[00129] As FIGS 8A-8D mostram gráficos comparativos das densidades de metilação do DNA do tecido genômico em relação ao DNA do plasma materno para sítios de CpG que cercam polimorfismos do nucleotídeo único informativo. A FIG. 8A mostra densidades de metilação para leituras específicas do feto na amostra do plasma materno do primeiro trimestre em relação às densidades de metilação para leituras em uma amostra CVS. Como pode ser visto, os valores específicos do feto correspondem aos valores da CVS.
[00130] A FIG. 8B mostra densidades de metilação para leituras específicas do feto na amostra do plasma materno do terceiro trimestre em relação às densidades de metilação para leituras em um tecido placentário a termo. Novamente, os conjuntos de densidades correspondem bem, indicando que o perfil de metilação fetal pode ser obtido pela análise das leituras com alelos específicos do feto.
[00131] A FIG. 8C mostra densidades de metilação para leituras compartilhadas na amostra do plasma materno do primeiro trimestre em relação às densidades de metilação para leituras em células do sangue materno. Considerando que a maioria das leituras compartilhadas são da mãe, os dois conjuntos de valores têm uma boa correspondência. A FIG. 8D mostra densidades de metilação para leituras compartilhadas na amostra do plasma materno do terceiro trimestre em relação às densidades de metilação para leituras em células do sangue materno.
[00132] Para as leituras específicas do feto no plasma materno, o coeficiente de correlação de Spearman entre o plasma materno do primeiro trimestre e a CVS foi de 0,705 (P < 2,2*e-16); e entre o plasma materno do terceiro trimestre e o tecido placentário a termo foi de 0,796 (P < 2.2*e-16) (FIGS. 8A e 8B). Uma comparação semelhante foi realizada para as leituras compartilhadas no plasma materno com os dados das células do sangue materno. O coeficiente de correlação de Pearson foi de 0,653 (P < 2,2*e-16) para a amostra do plasma do primeiro trimestre e foi de 0,638 (P < 2,2*e-16) para a amostra do plasma de terceiro trimestre (FIGS. 8C e 8D). B. Metiloma Fetal
[00133] Em uma modalidade, para montar um metiloma fetal a partir do plasma materno, classificamos leituras de sequência que estendem pelo menos um sítio informativo de SNP fetal e continham pelo menos um sítio de CpG na mesma leitura. As leituras que mostraram os alelos específicos ao feto foram incluídas na montagem do metiloma fetal. As leituras que mostraram o alelo compartilhado, ou seja, alelo específico não-fetal, foram incluídos na montagem do metiloma específico não-fetal que era composto, predominantemente, de moléculas de DNA derivadas da mãe.
[00134] As leituras específicas fetais cobriram 218.010 sítios de CpG nos autossomos para amostras do plasma materno do primeiro trimestre. Os números correspondentes às amostras do plasma materno do terceiro trimestre e pós-parto foram 263.611 e 74.020, respectivamente. Em média, as leituras compartilhadas abrangeram aqueles sítios de CpG em uma média de 33,3, 21,7 e 26,3 vezes, respectivamente. As leituras específicas fetais abrangeram aqueles sítios de CpG 3,0, 4,4 e 1,8 vezes, respectivamente, para amostras do plasma materno do primeiro trimestre, terceiro trimestre e pós-parto.
[00135] O DNA fetal representa uma população menor no plasma materno e, portanto, a abrangência desses sítios de CpG pelas leituras específicas fetais foi proporcional à porcentagem de DNA fetal da amostra. Para amostra do plasma materno do primeiro trimestre, a porcentagem total de CpG metilado entre as leituras fetais foi de 47,0%, enquanto que para as leituras compartilhadas foi de 68,1%. Para a amostra de plasma materno do terceira trimestre, a porcentagem de CpG metilado das leituras fetais foi de 53,3%, enquanto que para as leituras compartilhadas foi de 68,8%. Estes dados mostraram que as leituras específicas fetais no plasma materno foram mais hipometiladas do que as leituras compartilhadas no plasma materno C. Método
[00136] As técnicas descritas acima também podem ser usadas para determinar um perfil de metilação do tumor. Os métodos para a determinação dos perfis de metilação fetal e tumoral são descritos agora.
[00137] A FIG. 9 é um fluxograma que ilustra um método 900 para determinar um primeiro perfil de metilação de uma amostra biológica de um organismo de acordo com as modalidades da presente invenção. O método 900 pode construir um mapa epigenético do feto a partir do perfil de metilação do plasma materno. A amostra biológica inclui DNA sem célula compreendendo uma mistura de DNA sem célula originária de um primeiro tecido e de um segundo tecido. Como exemplos, o primeiro tecido pode ser de um feto, de um tumor ou de um órgão transplantado.
[00138] No bloco 910, várias moléculas de DNA são analisadas a partir da amostra biológica. A análise de uma molécula de DNA pode incluir a determinação da localização da molécula de DNA no genoma de um organismo, determinação do genótipo da molécula de DNA e determinação se a molécula de DNA é metilada em um ou mais sítios.
[00139] Em uma modalidade, as moléculas de DNA são analisadas usando leituras de sequência das moléculas de DNA, onde o sequenciamento está ciente da metilação. Assim, as leituras de sequência incluem status de metilação das moléculas de DNA da amostra biológica. O status de metilação pode incluir se um resíduo de citosina específico é 5-metilcitosina ou 5- hidroximetilcitosina. As leituras de sequência podem ser obtidas a partir de várias técnicas de sequenciamento, técnicas de PCR, matrizes e outras técnicas adequadas para a identificação das sequências de fragmentos. O status de metilação dos sítios da leitura de sequência podem ser obtidos conforme descrito neste documento.
[00140] No bloco 920, vários primeiros loci são identificados nos quais um primeiro genoma do primeiro tecido é heterozigoto para um primeiro alelo respectivo e um segundo alelo respectivo e um segundo genoma do tecido segundo é homozigoto para o primeiro alelo respectivo. Por exemplo, leituras específicas fetais podem ser identificadas em vários primeiros loci. Ou, leituras específicas tumorais podem ser identificadas em vários primeiros loci. As leituras específicas do tecido podem ser identificadas a partir das leituras do sequenciamento onde a porcentagem das leituras de sequência de um segundo alelo se enquadram na variação específica, por exemplo, cerca de 3%-25%, indicando, assim, uma minoria da população de fragmentos de DNA de um genoma heterozigoto no locus e uma maioria da população de um genoma homozigoto no locus.
[00141] No bloco 930, as moléculas de DNA localizadas em um ou mais sítios do primeiro locus são analisadas. São determinadas várias moléculas de DNA que são metiladas em um sítio e correspondem ao segundo alelo respectivo do locus. Pode haver mais de um sítio por locus. Por exemplo, um SNP pode indicar que um fragmento é específico fetal e que o fragmento pode ter vários sítios cujo status de metilação é determinado. Pode ser determinado o número de leituras em cada sítio que são metiladas, e o número total de leituras metiladas para o locus pode ser determinado.
[00142] O locus podem ser definido por um número específico de sítios, um conjunto de sítios ou um tamanho específico para uma região em torno de uma variação que compreende o alelo específico do tecido. Um locus pode ter apenas um sítio. Os sítios podem ter propriedades específicas, por exemplo, sendo sítios de CpG. A determinação de um número de leituras que não são metiladas é equivalente e é englobada pela determinação do status de metilação.
[00143] No bloco 940, para cada um dos primeiros loci, uma densidade de metilação é calculada com base nos números de moléculas de DNA metiladas em um ou mais sítios do locus e correspondentes ao segundo alelo respectivo do locus. Por exemplo, uma densidade de metilação pode ser determinada para sítios de CpG correspondentes a um locus.
[00144] No bloco 950, o primeiro perfil de metilação do primeiro tecido é criado a partir as densidades de metilação para os primeiros loci. O primeiro perfil de metilação pode corresponder a sítios específicos, por exemplo, sítios de CpG. O perfil de metilação pode ser para todos os loci com um alelo específico fetal ou apenas para alguns desses loci.
IV. USO DA DIFERENÇA DE METILOMAS PLASMÁTICO E SANGUÍNEO
[00145] Acima, foi demonstrado que das leituras específicas fetais do plasma se correlacionam ao metiloma placentário. Como o componente materno do metiloma plasmático materno é contribuído principalmente pelas células de sangue, a diferença entre o metiloma plasmático e o metiloma sanguíneo pode ser usada para determinar o metiloma placentário para todos os loci e não apenas para locais de alelos específicos fetais. A diferença entre o metiloma plasmático e o metiloma sanguíneo também pode ser usada para determinar o metiloma de um tumor. A. Método
[00146] A FIG. 10 é um fluxograma que ilustra um método 1000 para determinar um primeiro perfil de metilação de uma amostra biológica de um organismo de acordo com as modalidades da presente invenção. A amostra biológica (por exemplo, plasma) inclui DNA sem célula compreendendo uma mistura de DNA sem célula originária de um primeiro tecido e de um segundo tecido. O primeiro perfil de metilação corresponde a um perfil de metilação do primeiro tecido (por exemplo, tecido fetal ou tecido tumoral). O método 1200 pode prover uma dedução de regiões diferencialmente metiladas a partir do plasma materno.
[00147] No bloco 1010, uma amostra biológica é recebida. A amostra biológica poderia ser recebida simplesmente em uma máquina (por exemplo, uma máquina de sequenciamento). A amostra biológica pode estar na forma retirada do organismo ou pode estar em uma forma processada, por exemplo, a amostra pode ser o plasma que é extraído de uma amostra de sangue.
[00148] No bloco 1020, um segundo perfil de metilação correspondente ao DNA do segundo tecido é obtido. O segundo perfil de metilação poderia ser lido a partir da memória, já que pode ter sido determinado anteriormente. O segundo perfil de metilação pode ser determinado a partir o segundo tecido, por exemplo, uma amostra diferente que contém apenas ou predominantemente células do segundo tecido. O segundo perfil de metilação pode corresponder a um perfil de metilação celular e ser obtido a partir do DNA celular. Como outro exemplo, o segundo o perfil pode ser determinado a partir de uma amostra de plasma coletada antes da gravidez, ou antes do desenvolvimento do câncer porque o metiloma plasmático de uma pessoa não-grávida sem câncer é muito parecido ao metiloma das células do sangue.
[00149] O segundo perfil de metilação pode prover uma densidade de metilação em vários loci no genoma de um organismo. A densidade de metilação em um determinado locus corresponde a uma proporção de DNA do segundo tecido que é metilado. Em uma modalidade, a densidade de metilação é uma densidade de metilação de CpG, onde os sítios de CpG associados ao locus são usados para determinar a densidade de metilação. Se houver um sítio para um locus, a densidade de metilação pode ser equivalente ao índice de metilação. A densidade de metilação também corresponde a uma densidade de não metilação já que os dois valores são complementares.
[00150] Em uma modalidade, o segundo perfil de metilação é obtido pela realização do sequenciamento de reconhecimento de metilação do DNA celular de uma amostra de um organismo. Um exemplo do sequenciamento de reconhecimento de metilação inclui o tratamento do DNA por bissulfito de sódio e, em seguida, a realização do sequenciamento de DNA. Em outro exemplo, o sequenciamento de reconhecimento de metilação pode ser realizado sem usar o bissulfito de sódio, usando uma plataforma de sequenciamento de molécula única que permitiria que o status de metilação das moléculas de DNA (incluindo N6-metiladenina, 5-metilcitosina e 5- hidroximetilcitosina) fosse diretamente elucidado sem conversão de bissulfito (AB Flusberg et al. 2010 Nat Methods; 7: 461-465; J Shim et al. 2013 Sci Rep; 3:1389. doi: 10.1038/srep01389); ou através da imunoprecipitação da citosina metilada (por exemplo, usando um anticorpo contra metilcitosina ou usando uma proteína ou peptídeo de ligação do DNA metilado (LG Acevedo et al. 2011 Epigenomics; 3: 93-101) seguido do sequenciamento; ou pelo uso de enzimas de restrição sensíveis à metilação seguido da sequenciação. Em outra modalidade, as técnicas de não sequenciamento são utilizadas, como matrizes, PCR digital e espectrometria de massa.
[00151] Em outra modalidade, a segunda densidade de metilação do segundo tecido poderia ser obtida anteriormente a partir de amostras de controle do sujeito ou de outros sujeitos. A densidade de metilação de outro sujeito pode atuar como um perfil de metilação de referência com densidades de metilação de referência. As densidades de metilação de referência podem ser determinadas a partir de várias amostras, onde um nível médio (ou outro valor estatístico) de densidades de metilação diferentes em um locus podem ser usadas como a densidade de metilação de referência no locus.
[00152] No bloco 1030, um perfil de metilação sem célula é determinado a partir do DNA sem célula da mistura. O perfil de metilação sem célula provê uma densidade de metilação em cada um dos vários loci. O perfil de metilação sem célula pode ser determinado pelo recebimento das leituras de sequência de um sequenciamento do DNA sem célula, onde as informações de metilação são obtidas com as leituras de sequência. O perfil de metilação sem célula pode ser determinado da mesma forma que o metiloma celular.
[00153] No bloco 1040, é determinada a porcentagem do DNA sem célula do primeiro tecido na amostra biológica. Em uma modalidade, o primeiro tecido é o tecido fetal, e o DNA correspondente é o DNA fetal. Em outra modalidade, o primeiro tecido é o tecido tumoral e o DNA correspondente é o DNA do tumor. A porcentagem pode ser determinada de diversas maneiras, por exemplo, usando um alelo específico fetal ou um alelo específico tumoral. O número de cópia também pode ser usado para determinar a porcentagem, por exemplo, descrita no pedido de patente US N° 13/801.748 intitulado "Análise Mutacional do DNA do Plasma para a Detecção de Câncer" depositado em 13 de março de 3013, que é incorporado por referência.
[00154] No bloco 1050, são identificados vários loci para determinar o primeiro metiloma. Estes loci podem corresponder a cada um dos loci usados para determinar o perfil de metilação sem célula e o segundo perfil de metilação. Assim, podem corresponder a vários loci. É possível que mais loci possam ser usados para determinar o perfil de metilação sem célula e o segundo perfil de metilação.
[00155] Em algumas modalidades, os loci que eram hipermetilados ou hipometilados no segundo perfil de metilação podem ser identificados, por exemplo, usando células do sangue materno. Para identificar os loci que foram hipermetilados nas células do sangue materno, é possível fazer uma varredura de uma extremidade de um cromossomo para um sítio de CpG com um índice de metilação > X% (por exemplo, 80%). Em seguida, é possível buscar o próximo sítio de CpG na região a jusante (por exemplo, 200 bp a jusante). Se sítio de CpG imediatamente a jusante também teve um índice de metilação > X % (ou outro valor especificado), o primeiro e o segundo sítios de CpG podem ser agrupados. O agrupamento pode continuar até que não haja nenhum outro sítio de CpG na próxima região a jusante; ou até que sítio de CpG imediatamente a jusante tenha um índice de metilação < X %. A região de sítios de CpG agrupados pode ser relatada como hipermetilada em células do sangue materno se a região continha pelo menos cinco sítios de CpG hipermetilados imediatamente adjacentes. Uma análise semelhante pode ser realizada para buscar loci que foram hipometilados em células do sangue materno para sítios de CpG com índices de metilação < 20%. As densidades de metilação para o segundo perfil de metilação podem ser calculadas para os loci pré-selecionados e usados para deduzir o primeiro perfil de metilação (por exemplo, densidade de metilação de tecido placentário) dos loci correspondentes, por exemplo, a partir de dados de sequenciamento por bissulfito do plasma materno.
[00156] No bloco 1060, o primeiro perfil de metilação do primeiro tecido é determinado pelo cálculo de um parâmetro diferencial que inclui uma diferença entre a densidade de metilação do segundo perfil de metilação e a densidade de metilação do perfil de metilação sem célula para cada um dos vários loci. A diferença é dimensionada pela porcentagem.
[00157] Em uma modalidade, a primeira densidade de metilação de um locus no primeiro tecido (por exemplo, placentário) (D) foi deduzido através da equação:
Figure img0004
onde mbc denota a densidade de metilação do segundo perfil de metilação em um locus (por exemplo, um locus pré-selecionado determinado nos dados de sequenciamento por bissulfito da célula do sangue materno); mp denota a densidade de metilação do locus correspondente nos dados de sequenciamento por bissulfito da célula do sangue materno; f representa a porcentagem de DNA sem célula do primeiro tecido (por exemplo, concentração de DNA fetal fracional), e CN representa o número de cópia no locus (por exemplo, um valor mais alto para amplificações ou um número inferior para exclusões em relação ao normal). Se não há nenhuma amplificação ou exclusão no primeiro tecido, então o CN pode ser um. Para trissomia (ou uma duplicação da região em um tumor ou um feto), CN seria 1,5 (já que o aumento é de 2 cópias para 3 cópias) e para monossomia seria 0,5. Amplificação mais elevada pode aumentar em incrementos de 0,5. Neste exemplo, D pode corresponder ao parâmetro diferencial.
[00158] No bloco 1070, a primeira densidade de metilação é transformada para obter uma primeira densidade de metilação corrigida do primeiro tecido. A transformação pode levar em conta diferenças fixas entre os parâmetros diferenciais e o perfil de metilação real do primeiro tecido. Por exemplo, os valores podem diferir por uma constante fixa ou por uma inclinação. A transformação pode ser linear ou não linear.
[00159] Em uma modalidade, a distribuição dos valores deduzidos, foi constatado que D é inferior ao nível de metilação real do tecido placentário. Por exemplo, os valores deduzidos podem ser transformados linearmente usando dados das ilhas de CpG, que eram segmentos genômicos que tinham uma super-representação de sítios de CpG. As posições genômicas das ilhas de CpG usadas neste estudo foram obtidas a partir do banco de dados do UCSC Genome Browser (NCBI construi 36/hg18) (PA Fujita et al. 2011 Nucleic Acids Res; 39: D876-882). Por exemplo, uma ilha de CpG pode ser definida como um segmento genômico com teor de GC > 50%, comprimento genômico >200 bp e razão do número de CpG observado/esperado >0,6 (M Gardiner-Garden et al 1987 J Mol Biol; 196: 261-282).
[00160] Em uma implementação, para derivar a equação de transformação linear, podem ser incluídas ilhas de CpG com pelo menos 4 sítios de CpG e uma profundidade de leitura média >5 por sítio de CpG nas amostras sequenciais. Depois de determinar as relações lineares entre as densidades de metilação das Ilhas de CpG na CVS ou na placenta a termo e nos valores deduzidos, D, as equações seguintes foram usadas para determinar os valores previstos: Valores previstos para o primeiro trimestre = D x 1,6 + 0,2 Valores previstos para terceiro trimestre = D x 1,2 + 0,05 B. Exemplo Fetal
[00161] Como mencionado acima, o método 1000 pode ser usado para deduzir um cenário de metilação da placenta do plasma materno. O DNA circulante no plasma é predominantemente originado de células hematopoiéticas. Além disso, há uma percentagem desconhecida de DNA sem célula contribuído de outros órgãos internos. Além disso, o DNA sem célula derivado da placenta é responsável por cerca de 5-40% do DNA total no plasma materno, com uma média de aproximadamente 15%. Assim, é possível fazer uma suposição de que o nível de metilação no plasma materno é equivalente a uma metilação de base existente mais a contribuição placentária durante a gravidez, como descrito acima.
[00162] O nível de metilação do plasma materno, MP, pode ser determinado utilizando a seguinte equação:
Figure img0005
onde BKG é o nível de metilação do DNA de base no plasma derivado de células do sangue e órgãos internos, PLN é o nível de metilação da placenta e f é a concentração fracionária de DNA fetal no plasma materno.
[00163] Em uma modalidade, o nível de metilação da placenta pode ser deduzido teoricamente:
Figure img0006
pelas Equações (1) e (2) são equivalentes quando o CN é igual a um, D é igual ao PLN e BKG é igual a mbc. Em outra modalidade, é possível presumir uma concentração fracionária de DNA fetal ou definir um valor específico, por exemplo, como parte da presunção de umfmínimo estar presente.
[00164] O nível de metilação do sangue materno foi tomado para representar a metilação de base do plasma materno. Além dos loci que foram hipermetilados ou hipometilados nas células do sangue materno, exploramos ainda a abordagem de dedução, focando nas regiões definidas com relevância clínica, por exemplo, ilhas de CpG no genoma humano.
[00165] A densidade de metilação média de um total de 27.458 ilhas de CpG (NCBI Build36/hg18) nos autossomos e chrX é derivado dos dados de sequenciamento do plasma materno e da placenta. Apenas aqueles com > 10 CpG sítios de CpG abrangidos e uma profundidade de leitura média > 5 por sítios de CpG abrangidos em todas as amostras analisadas, incluindo placenta, sangue materno e plasma materno, foram selecionados. Como resultado, 26.698 ilhas de CpG (97,2%) mantiveram-se como válidas e seu nível de metilação foi deduzido usando os dados de metilação de plasma e a concentração fracionária de DNA fetal de acordo com a equação acima.
[00166] Percebeu-se que a distribuição dos valores de PLN deduzidos era menor do que o nível de metilação real das Ilhas de CpG no tecido placentário. Assim, em uma modalidade, os valores de PLN deduzidos, ou simplesmente valores (D) deduzidos foram usados como uma unidade arbitrária para estimar o nível de metilação das Ilhas de CpG na placenta. Depois de uma transformação, os valores linearmente deduzidos e sua distribuição tornaram-se mais parecidos com o conjunto de dados real. Os valores deduzidos transformados foram chamados de valores preditivos de metilação (MPV) e, posteriormente, foram usados para prever o nível de metilação dos loci genéticos na placenta.
[00167] Neste exemplo, as ilhas de CpG foram classificadas em 3 categorias com base em suas densidades de metilação na placenta: Baixa (<0,4), Intermediária (> 0,4-< 0,8) e Alta (>0,8). Usando a equação de dedução, calculamos o MPV do mesmo conjunto de ilhas de CpG e, em seguida, usamos os valores para classificá-los em 3 categorias, com os mesmos pontos de corte. Comparando os conjuntos de dados reais e os deduzidos, constatamos que 75,1% das Ilhas de CpG pré-selecionadas poderiam ser corretamente compatíveis com as mesmas categorias nos dados de tecido de acordo com seu MPV. Cerca de 22% das Ilhas de CpG foram atribuídas a grupos com diferença de nível 1 (alta versus intermediário ou intermediário versus baixo) e menos de 3% seriam classificados de maneira totalmente equivocada (alto versus baixo) (FIG. 12A). A realização da classificação geral também foi determinada: 86,1%, 31,4% e 68,8% das ilhas de CpG com densidades de metilação <0,4, >0,4-<0,8 e >0,8 na placenta foi deduzida como "Baixa", "Intermediária" e "Alta" corretamente (FIG. 12B).
[00168] As FIGS. 11A e 11B mostram gráficos da realização do algoritmo de previsão usando dados do plasma materno e da concentração fracionária do DNA fetal de acordo com modalidades da presente invenção. A FIG. 11A é um gráfico 1100 que mostra a precisão da classificação da ilha de CpG usando a classificação de correção de MPV (a categoria deduzida corresponde exatamente ao conjunto de dados real); diferença de nível 1 (a categoria deduzida é diferente em 1 nível do conjunto de dados real); e classificação equivocada (a categoria deduzida é oposta ao conjunto de dados real). A FIG. 11B é um gráfico 1150 que mostra a proporção de ilhas de CpG classificadas em cada categoria deduzida.
[00169] Desde que a metilação de base materna seja baixa nas respectivas regiões genômicas, a presença de DNA derivado da placenta hipermetilado na circulação aumentaria o nível de metilação do plasma global para um grau, dependendo da concentração fracionária de DNA fetal. Uma mudança acentuada poderia ser observada quando o DNA fetal liberado estivesse totalmente metilado. Pelo contrário, quando a metilação de base materna for elevada, o grau de alteração do nível de metilação do plasma se tornaria mais significativa se o DNA fetal hipometilado fosse liberado. Portanto, o esquema de dedução pode ser mais prático quando o nível de metilação foi deduzido para loci genéticos que são conhecidos por serem distintos entre a base materna e a placenta, especialmente para os marcadores hipermetilados e hipometilados na placenta.
[00170] A FIG. 12A é uma tabela 1200 que mostra detalhes de 15 loci genômicos selecionados para previsão de metilação de acordo com as modalidades da presente invenção. Para confirmar as técnicas, selecionamos 15 loci genômicos diferencialmente metilados que foram estudados anteriormente. Os níveis de metilação das regiões selecionadas foram deduzidos e comparados aos 15 loci genéticos diferencialmente metilados estudados anteriormente (RWK Chiu et al. 2007 Am J Pathol; 170: 941-950; S.S.C. Chim et al. 2008 Clin Chem; 54: 500-511; SSC Chim et al. 2005 Proc Natl Acad Sci EUA; 102: 14753-14758; DWY Tsui et al. 2010 PLoS One; 5: e15069).
[00171] A FIG. 12B é um gráfico 1250 que mostra as categorias deduzidas de 15 loci genômicos selecionado e seus níveis de metilação correspondentes na placenta. As categorias de metilação deduzida são: Baixa (<0,4), Intermediária (> 0,4-< 0,8) e Alta (>0,8). A tabela 1200 e o gráfico 1300 mostram que seus níveis de metilação na placenta poderiam ser deduzidos corretamente com várias exceções: RASSF1A, CGI009, CGI137 e VAPA. Fora estes 4 marcadores, apenas o CGI009 mostrou uma discrepância marcada em relação ao conjunto de dados real. Os outros foram apenas classificados marginalmente de maneira equivocada.
[00172] Na tabela 1200, "1" se refere aos valores deduzidos (D) que estão sendo calculados pela equação:
Figure img0007
onde f é a concentração fracionária de DNA fetal. O rótulo "2" se refere aos valores preditivos da metilação (MPV) que se relacionam aos valores deduzidos linearmente transformados usando a equação: MPV = D x 1,6 + 0,25. O rótulo "3" se refere ao ponto de corte da classificação para os valores deduzidos: Baixa (<0,4), Intermediária (> 0,4-< 0,8) e Alta (>0,8). O rótulo "4" se refere ao ponto de corte da classificação para o conjunto de dados placentários reais: Baixa (<0,4), Intermediária (> 0,4-< 0,8) e Alta (>0,8). O rótulo "5" denota que o status placentário se refere ao status de metilação da placenta em relação ao das células do sangue materno. C. Cálculo das concentrações fracionárias de DNA fetal
[00173] Em uma modalidade, a porcentagem de DNA fetal do primeiro tecido pode usar um cromossomo Y para um feto masculino. A proporção de sequências do cromossomo Y (% chrY) em uma amostra de plasma materno era um compósito das leituras do cromossomo Y derivadas do feto masculino e o número de leituras maternas (femininas) que estavam desalinhadas em relação ao cromossomo Y (RWK Chiu et al. 2011 BMJ; 342: c7401). Assim, a relação entre %chrY e a concentração fracionária de DNA fetal (f) na amostra pode ser dada por:
Figure img0008
onde %chrYmasculino se refere a uma proporção de leituras alinhadas ao cromossomo Y em uma amostra de plasma contendo 100% de DNA masculino; e %chrYfeminino se refere à proporção de leituras alinhadas ao cromossomo Y em uma amostra de plasma contendo 100% de DNA feminino.
[00174] % chrY pode ser determinado a partir de leituras que estavam alinhadas ao cromossomo Y sem incompatibilidades para uma amostra de uma grávida fêmea de um feto masculino, por exemplo, onde as leituras são a partir de amostras convertidas por bissulfito. O valor de %chrYmasculino pode ser obtido a partir do sequenciamento por bissulfito de duas amostras de plasma masculino adulto. O valor de %chrYfeminino pode ser obtido a partir do sequenciamento por bissulfito de duas amostras de plasma feminino adulto não-gestantes.
[00175] Em outras modalidades, a porcentagem de DNA fetal pode ser determinada a partir de alelos específicos fetais em um autossomo. Como outro exemplo, os marcadores epigenéticos podem ser usados para determinar a porcentagem de DNA fetal. Outras maneiras de determinar a porcentagem de DNA fetal também podem ser usadas. D. Método do uso de metilação para determinar o número de cópia
[00176] O genoma placentário é mais hipometilado do que o genoma materno. Como discutido acima, a metilação do plasma de uma mulher grávida depende da concentração fracionária do DNA fetal derivado da placenta no plasma materno. Portanto, através da análise da densidade de metilação de uma região cromossômica, é possível detectar a diferença na contribuição de tecidos fetais em relação ao plasma materno. Por exemplo, em uma mulher grávida que carrega um feto trissômico (por exemplo, que sofre de trissomia 21, trissomia 18 ou trissomia 13), o feto contribuiria com uma quantidade adicional de DNA do cromossomo trissômico para o plasma materno em comparação com os cromossomos dissômicos. Nesta situação, a densidade de metilação do plasma para o cromossomo trissômico (ou qualquer região cromossômica que tem uma amplificação) seria menor do que aquela para os cromossomos dissômicos. O grau de diferença pode ser previsto pelo cálculo matemático, levando em conta a concentração fracionária de DNA fetal na amostra de plasma. Quanto maior a concentração fracionária de DNA fetal na amostra de plasma maior seria a diferença na densidade de metilação entre os cromossomos de trissômicos e dissômicos. Para regiões com exclusão, a densidade de metilação seria maior.
[00177] Um exemplo de exclusão é a síndrome de Turner, quando um feto feminino tem somente uma cópia do cromossomo X. Nesta situação, para uma mulher grávida que carrega um feto que sofre de síndrome de Turner, a densidade de metilação do cromossomo X no seu DNA de plasma seria maior do que a situação da mesma mulher grávida que carrega um feto feminino com o número normal de cromossomo X. Em uma modalidade desta estratégia, é possível analisar primeiro o plasma materno quanto à presença ou ausência de sequências de cromossomo Y (por exemplo, utilizando MPS ou uma técnica baseada em PCR). Se as sequências do cromossomo Y estiverem presentes, então o feto pode ser classificado como macho e a análise posterior não seria necessária. Por outro lado, se as sequências do cromossomo Y estiverem ausentes no plasma materno, então o feto pode ser classificado como fêmea. Nesta situação, é possível então analisar a densidade de metilação do cromossomo X no plasma materno. Uma densidade de metilação do cromossomo X maior que a normal indica que o feto tem um alto risco de ter Síndrome de Turner. Esta abordagem também pode ser aplicada para outras aneuploidias do cromossomo sexual. Por exemplo, para um feto afetado por XYY, a densidade de metilação para o cromossomo Y no plasma materno seria menor do que do feto XY normal, tendo um nível semelhante do DNA fetal no plasma materno. Como outro exemplo, para um feto que sofre da síndrome de Klinefelter (XXY), as sequências do cromossomo Y estão presentes no plasma materno, mas a densidade de metilação do cromossomo X no plasma materno será menor do que a de um feto XY normal com um nível semelhante de DNA fetal no plasma materno.
[00178] A partir da discussão anterior, a densidade de metilação do plasma para um cromossomo dissômico (MPNão-aneu) pode ser calculada como:
Figure img0009
onde BKG é o nível de metilação do DNA de base no plasma derivado de células do sangue e órgãos internos, PLN é o nível de metilação da placenta e f é a concentração fracionária de DNA fetal no plasma materno.
[00179] A densidade de metilação do plasma para um cromossomo trissômico (MPAneu) pode ser calculada como:
Figure img0010
onde 1,5 corresponde ao número de CN e a adição de mais um cromossomo é um aumento de 50%. A diferença entre cromossomos dissômico e trissômico (MPDif) seria
Figure img0011
[00180] Em uma modalidade, uma comparação da densidade de metilação do cromossoma potencialmente potencialmente aneuploide (ou região cromossômica) para um ou mais outros cromossomos não-aneuploides supostos ou a densidade de metilação global do genoma pode ser usada para normalizar efetivamente a concentração de DNA fetal na amostra de plasma. A comparação pode ser por meio de um cálculo de um parâmetro (por exemplo, envolvendo uma relação ou uma diferença) entre as densidades de metilação de duas regiões para obter uma densidade de metilação normalizada. A comparação pode remover uma dependência do nível resultante de metilação (por exemplo, determinado como um parâmetro de duas densidades metilação).
[00181] Se a densidade de metilação do cromossomo potencialmente aneuploide não for normalizada em relação à densidade de metilação de um ou mais cromossomos, ou a outros parâmetros que refletem a concentração fracionária do DNA fetal, a concentração fracionária seria um dos principais fatores que afetam a densidade de metilação no plasma. Por exemplo, a densidade de metilação do plasma do cromossomo 21 de uma mulher grávida que carrega um feto com trissomia 21 com concentração fracionária de DNA fetal de 10% seria a mesma que de uma mulher grávida carregando um feto euploide e a concentração fracionária de DNA fetal é 15%, enquanto que a densidade de metilação normalizado mostraria uma diferença.
[00182] Em outra modalidade, a densidade de metilação do cromossomo potencialmente aneuploide pode ser normalizada em relação à concentração fracionária de DNA fetal. Por exemplo, a seguinte equação pode ser aplicada para normalizar a densidade de metilação:
Figure img0012
onde MPNormalizado é a densidade de metilação normalizada com a concentração fracionária de DNA fetal no plasma, MPnão-normalizado é a densidade de metilação medida, BKG é a densidade de metilação de base das células de sangue ou tecidos maternos, PLN é a densidade de metilação nos tecidos placentários, e f é a concentração fracionária de DNA fetal. As densidades de metilação de BKG e PLN poderiam se basear em valores de referência previamente estabelecidos da partir de células de sangue materno e tecidos placentários obtidos de gestações saudáveis. Métodos genéticos e epigenéticos diferentes podem ser usados para a determinação da concentração fracionária de DNA fetal na amostra de plasma, por exemplo, pela medição da porcentagem das leituras de sequência do cromossomo Y usando sequenciamento massivamente paralelo ou PCR ou DNA convertido por não-bissulfito.
[00183] Em uma implementação, a densidade de metilação normalizada para um cromossomo potencialmente aneuploide pode ser comparada a um grupo de referência que consiste em uma mulher grávida que carrega fetos euploides. A média e o SD da densidade de metilação normalizada do grupo de referência pode ser determinada. Então a densidade de metilação normalizada do caso testado pode ser expressa como uma pontuação z que indica o número de SDs da média do grupo de referência por:
Figure img0013
onde MPNormalizado é a densidade de metilação normalizada para o caso de testado, Média é a média da densidade de metilação normalizada dos casos de referência e SD é o desvio-padrão da densidade de metilação normalizada dos casos de referência. Um ponto de corte, por exemplo, pontuação z <-3, pode ser utilizado para classificar se um cromossomo for significativamente hipometilado e, por conseguinte, para determinar o status de aneuploidia da amostra.
[00184] Em outra modalidade, o MPDif pode ser usado como a densidade de metilação normalizada. Nessa modalidade, o PLN pode ser deduzido, por exemplo, usando o método 1000. Em algumas modalidades, uma densidade de metilação de referência (que pode ser normalizada usando f) pode ser determinada a partir de um nível de metilação de uma região não- aneuploide. Por exemplo, a Média poderia ser determinada a partir de uma ou mais regiões cromossômicas da mesma amostra. O ponto de corte poderia ser dimensionado por f, ou apenas definido para um nível suficiente, contanto que exista uma concentração mínima.
[00185] Da mesma forma, uma comparação de um nível de metilação para uma região com um ponto de corte pode ser realizada de várias formas. A comparação pode envolver uma normalização (por exemplo, como descrito acima), que pode ser realizada de forma equivalente em relação ao nível de metilação ou ao valor do ponto de corte, dependendo de como os valores são definidos. Assim, se o nível de metilação determinado de uma região for estatisticamente diferente de um nível de referência (determinado a partir da mesma amostra ou de outras amostras) ele pode ser determinado de diversas maneiras.
[00186] A análise acima pode ser aplicada à análise de regiões cromossômicas, que pode incluir um cromossomo inteiro ou partes do cromossomo, incluindo sub-regiões contíguas ou disjuntas de um cromossomo. Em uma modalidade, o cromossomo potencialmente aneuploide pode ser dividido em várias bins. As bins podem ter tamanhos iguais ou diferentes. A densidade de metilação de cada bin pode ser normalizada em relação à concentração fracionária da amostra ou à densidade de metilação de um ou mais cromossomos não-aneuploides presumidos ou à densidade de metilação total do genoma. A densidade de metilação normalizada de cada bin pode, então, ser comparada a um grupo de referência para determinar se é significativamente hipometilada. Então, é possível determinar a porcentagem de bins que estão sendo significativamente hipometiladas. Um ponto de corte, para exemplos superiores a 5%, 10%, 15%, 20% ou 30% de bins que estão sendo significativamente hipometiladas, pode ser utilizado para classificar o status de aneuploidia do caso.
[00187] Quando um teste é feito quanto à ampliação ou exclusão, é possível comparar a densidade de metilação com uma densidade de metilação de referência, que pode ser específica de uma determinada região que está sendo testada. Cada região pode ter uma densidade de metilação de referência diferente já que a metilação pode variar de região para região dependendo, especificamente, do tamanho das regiões (por exemplo, regiões menores vão apresentar mais variação).
[00188] Como mencionado acima, uma ou mais mulheres grávidas, cada uma carregando um feto euploide, podem ser usadas para definir o intervalo normal da densidade de metilação para uma região de interesse ou uma diferença de densidade de metilação entre duas regiões cromossômicas. Um intervalo normal também pode ser determinado para PLN (por exemplo, pela medição direta ou conforme deduzido pelo método 1000). Em outras modalidades, uma razão entre duas densidades de metilação pode ser usada, por exemplo, a partir de um cromossomo potencialmente aneuploide e um cromossomo não-aneuploide pode ser usado para a análise em vez de sua diferença. Esta abordagem da análise de metilação pode ser combinada com a abordagem da contagem da leitura de sequência (RWK Chiu et al. 2008 Proc Natl Acad Sci USA;105:20458-20463) e as abordagens que envolvem análise de tamanho do DNA do plasma (patente US N° 2011/0276277) para determinar ou confirmar uma aneuploidia. A abordagem da contagem da leitura de sequência que é usada em combinação com a análise de metilação pode ser realizada também usando um sequenciamento aleatório (RWK Chiu et al. 2008 Proc Natl Acad Sci EUA;105:20458-20463; DW Bianchi DW et al. 2012 Obstet Gynecol 119:890-901) sequenciamento alvo (AB Sparks et al. 2012 Am J Obstet Gynecol 206:319.e1-9; B Zimmermann et al. 2012 Prenat Diagn 32:1233-1241; GJ Liao et al. 2012 PLoS One; 7:e38154).
[00189] O uso de BKG pode ser responsável pelas variações na base entre as amostras. Por exemplo, uma fêmea pode ter diferentes níveis de metilação de BKG do que outra fêmea, mas a diferença entre o BKG e PLN pode ser usada pelas amostras nessas situações. O ponto de corte para diferentes regiões cromossômicas pode ser diferente, por exemplo, quando uma densidade de metilação de uma região do genoma é diferente de outra região do genoma.
[00190] Esta abordagem pode ser generalizada para detectar quaisquer anomalias cromossômicas, incluindo exclusão e amplificação no genoma fetal. Além disso, a resolução desta análise pode ser ajustada para o nível desejado, por exemplo, o genoma pode ser dividido em bins de 10 Mb, 5 Mb, 2 Mb, 1 Mb, 500 kb, 100 kb. Portanto, essa tecnologia também pode ser usada para detectar duplicação subcromossômica ou exclusão subcromossômica. Assim, esta tecnologia permitiria que um cariótipo molecular fetal pré-natal fosse obtido de forma não invasiva. Quando usada desta maneira, esta tecnologia pode ser usada em combinação com os métodos de testes pré- natais não-invasivos que se baseiam na contagem de moléculas (A Srinivasan et al. 2013 Am J Hum Genet;92:167-176; SCY Yu et al. 2013 PLoS One 8: e60968). Em outras modalidades, o tamanho de bins não precisa ser idêntico. Por exemplo, o tamanho de bins pode ser ajustado para que cada bin contenha um número idêntico de dinucleotídeos de CpG. Neste caso, o tamanho físico das bins seria diferente.
[00191] A equação pode ser reescrita para aplicar a diferentes tipos de anomalias cromossômicas como
Figure img0014
Aqui CN representa o número de alteração do número de cópia na região afetada. CN é igual a 1 para o ganho de 1 cópia de um cromossomo, 2 para o ganho de 2 cópias de um cromossomo e -1 para a perda de um dos dois cromossomos homólogos (por exemplo, detectar síndrome de Turner fetal em que um feto feminino perdeu um dos cromossomos X, resultando em um cariótipo XO). Esta equação não precisa ser alterada quando o tamanho das bins forem alterados. No entanto, a sensibilidade e a especificidade podem reduzir quando o menor tamanho de bin for usado porque um número menor de dinucleotídeos de CpG (ou outras combinações de nucleótidos que apresentam metilação diferencial entre DNA fetal e DNA materno) estaria presentes em bins menores, resultando em uma maior variação estocástica na medição das densidades de metilação. Em uma modalidade, o número necessário de leituras pode ser determinado pela análise do coeficiente de variação da densidade de metilação e o nível de sensibilidade desejado.
[00192] Para demonstrar a viabilidade desta abordagem, analisamos as amostras de plasma de 9 mulheres grávidas. Das cinco gestantes, uma carregava um feto euploide e as outras quatro carregavam um feto com trissomia 21 (T21). Três das cinco gestações euploides foram selecionados aleatoriamente para formar um grupo de referência. Os outros dois casos de gestação euploide (Eu1 e Eu2) e os quatro casos de T21 (T21-1, T21-2, T21-3 e 4-T21) foram analisados usando esta abordagem para testar um status potencial de T21. O DNA do plasma foi convertido por bissulfito e sequenciado usando a plataforma Illumina HiSeq2000. Em uma modalidade, a densidade de metilação de cromossomos individuais foi calculada. A diferença na densidade de metilação entre cromossomo 21 e a média dos outros 21 autossomos foi, então, determinada para obter uma densidade de metilação normalizada (Tabela 1). A média e SD do grupo de referência foi usada para o cálculo da pontuação z a seis casos de teste.
Figure img0015
Tabela 1: Usando um ponto de corte de <-3 para pontuação z para classificar uma amostra como T21, a classificação de todos os casos euploides e de T21 estava correta.
[00193] Em outra modalidade, o genoma foi dividido em bins de 1 Mb e a densidade de metilação para cada bin de 1Mb foi determinada. A densidade de metilação de todas as bins no cromossomo potencialmente aneuploide pode ser normalizada com a densidade de metilação mediana de todas as bins localizadas em cromossomos não-aneuploides presumidos. Em uma implementação, para cada bin, a diferença na densidade de metilação da mediana das bins aneuploides não pode ser calculada. A pontuação z pode ser calculada para esses valores usando a média e os valores do SD do grupo de referência. A porcentagem de bins que apresentam hipometilação (Tabela 2) pode ser determinada e comparada a uma porcentagem de corte.
Figure img0016
Tabela 2: Uso de 5% como ponto de corte para bins significativamente mais hipotemtiladas no cromossomo 21, todos os casos foram classificados corretamente quanto ao status da T21.
[00194] Esta abordagem baseada na metilação do DNA para detecção de anomalias cromossômicas ou subcromossômicas fetais pode ser usada em conjunto com aqueles baseadas na contagem de moléculas como pelo sequenciamento (RWK Chiu et al. 2008 Proc Natl Acad Sci EUA; 105: 20458-20463) ou PCR digital (YMD Lo et al. 2007 Proc Natl Acad Sci EUA; 104: 13116-13121), ou o dimensionamento das moléculas de DNA (Publicação de Patente US N° 2011/0276277). Essa combinação (por exemplo, metilação de DNA mais contagem molecular, ou metilação do DNA mais dimensionamento, ou metilação de DNA mais contagem molecular mais dimensionamento) teria um efeito sinérgico que seria vantajoso em uma configuração clínica, por exemplo, aprimorando a sensibilidade e/ou especificidade. Por exemplo, o número de moléculas de DNA que precisaria ser analisado, por exemplo, pelo sequenciamento, pode ser reduzido sem afetar negativamente a precisão do diagnóstico. Esse recurso permitiria que tais testes fossem feitos de maneira mais econômica. Como outro exemplo, para um determinado número de moléculas de DNA analisado, uma abordagem combinada permitiria que anomalias cromossômicas ou subcromossômicas fetais fossem detectadas em uma menor concentração fracionária do DNA fetal.
[00195] A FIG. 13 é um fluxograma de um método 1300 para detecção de uma anomalia cromossômica fetal de uma amostra biológica de um organismo. A amostra biológica inclui DNA sem célula compreendendo uma mistura de DNA sem célula originária de um primeiro tecido e de um segundo tecido. O primeiro tecido pode ser de um feto ou de um tumor e o segundo tecido pode ser de uma fêmea grávida ou um paciente.
[00196] No bloco 1310, várias moléculas de DNA são analisadas a partir da amostra biológica. A análise de uma molécula de DNA pode incluir a determinação de uma localização da molécula de DNA no genoma do organismo e determinar se a molécula de DNA é metilada em um ou mais sítios. A análise pode ser realizada ao receber as leituras da sequência de um sequenciamento de reconhecimento de metilação, e, portanto, a análise pode ser realizada apenas em dados anteriormente obtidos a partir do DNA. Em outras modalidades, a análise pode incluir o sequenciamento real ou outras medidas ativas de obtenção dos dados.
[00197] A determinação de um local pode incluir o mapeamento das moléculas de DNA (por exemplo, por meio das leituras de sequência) para as respectivas partes do genoma humano, por exemplo, para regiões específicas. Em uma implementação, se a leitura não mapear uma região de interesse, então a leitura pode ser ignorada.
[00198] No bloco 1320, um número respectivo de moléculas de DNA que são metiladas no sítio é determinado para vários sítios. Em uma modalidade, os sítios são sítios de CpG, e podem ser apenas determinados sítio de CpG, como selecionado usando um ou mais critérios mencionados neste documento. O número de DNA que é metilado é equivalente à determinação do número do que não é metilado uma vez que a normalização é executada usando um número total de moléculas de DNA analisadas em um sítio específico, por exemplo, um número total de leituras de sequência.
[00199] No bloco 1330, um primeiro nível de metilação de uma primeira região cromossômica é calculado com base nos respectivos números de moléculas de DNA metiladas em locais na primeira região cromossômica. A primeira região cromossômica pode ser de qualquer tamanho, por exemplo, tamanhos supracitados. O nível de metilação pode ser responsável por um número total de moléculas de DNA alinhadas à primeira região cromossômica, por exemplo, como parte de um procedimento de normalização.
[00200] A primeira região cromossômica pode ser de qualquer tamanho (por exemplo, um cromossomo inteiro) e pode ser composta de sub- regiões desarticuladas, ou seja, as sub-regiões são separadas umas das outras. Os níveis de metilação de cada sub-região podem ser determinados e o combinado, por exemplo, como uma média ou mediana, para determinar um nível de metilação para a primeira região cromossômica.
[00201] No bloco 1340, o primeiro nível de metilação é comparado a um valor de corte. O valor de corte pode ser de um nível de metilação da referência ou estar relacionado a um nível de metilação de referência (por exemplo, uma distância especificada a partir de um nível normal). O valor de corte pode ser determinado a partir de outras fêmeas grávidas que carregam fetos sem uma anormalidade cromossômica para a primeira região cromossômica, a partir de amostras de indivíduos sem câncer ou de loci do organismo que são conhecidos por não estarem associados a uma aneuploidia (ou seja, regiões que são dissômicas).
[00202] Em uma modalidade, o valor de corte pode ser definido como tendo uma diferença de um nível de metilação de referência de
Figure img0017
, onde BKG é base da fêmea (ou uma média ou mediana de outros sujeitos), f é a concentração fracionária do DNA sem célula originário do primeiro tecido e CN é um número de cópia que está sendo testado. CN é um exemplo de um fator de escala correspondente a um tipo de anormalidade (exclusão ou duplicação). Um ponto de corte para um CN de 1 pode ser usado para testar todas as amplificações iniciais e, então, outros pontos de corte podem ser usados para determinar o grau de amplificação. O valor de corte pode se basear em uma concentração fracionária do DNA sem célula originária do primeiro tecido para determinar o nível esperado de metilação para um locus, por exemplo, se nenhuma anomalia do número de cópia estiver presente.
[00203] No bloco 1350, uma classificação de uma anormalidade da primeira região cromossômica é determinada com base na comparação. Diferença estatisticamente significativa em níveis pode indicar aumento do risco do feto com uma anomalia cromossômica. Em várias modalidades, a anormalidade cromossômica pode ser trissomia 21, trissomia 18, trissomia 13, síndrome de Turner ou síndrome de Klinefelter. Outros exemplos são uma exclusão subcromossômica, duplicação subcromossômica ou síndrome de DiGeorge.
V. DETERMINAÇÃO DE MARCADORES
[00204] Como indicado acima, certas partes do genoma fetal são metiladas de forma diferente do genoma materno. Estas diferenças podem ser comuns em todas as gestações. As regiões de metilação diferente podem ser usadas para identificar fragmentos de DNA que são do feto. A. Método para determinar DMRs do tecido placentário e do tecido materno
[00205] A placenta tem assinaturas de metilação específicas do tecido. Os marcadores de metilação do DNA específico fetal foram desenvolvidos para a detecção de plasma materno e para aplicações de diagnósticos pré- natais não invasivos com base nos loci que são diferencialmente metilados entre os tecidos placentários e as células do sangue materno (SSC Chim et al. 2008 Clin Chem; 54: 500-511; EA Papageorgiou et al 2009 Am J Pathol; 174: 1609-1618; and T Chu et al. 2011 PLoS One; 6: e14723). São providas modalidades para mineração dessas regiões diferencialmente metiladas (DMRs) em todo o genoma.
[00206] FIG. 14 é um fluxograma de um método 1400 para identificação dos marcadores de metilação pela comparação de um perfil de metilação placentária para um perfil de metilação materna (por exemplo, determinado a partir das células do sangue) de acordo com as modalidades da presente invenção. O método 1400 também pode ser usado para determinar marcadores para um tumor pela comparação de um perfil de metilação tumoral correspondente ao tecido saudável.
[00207] No bloco de 1410, um metiloma placentário e um metiloma sanguíneo são obtidos. O metiloma placentário pode ser determinado a partir de uma amostra placentária, por exemplo, CVS ou uma placenta a termo. O metiloma deve ser entendido como possível de incluir densidades de metilação de apenas parte de um genoma.
[00208] No bloco 1420, uma região é identificada que inclui um número específico de sítios (por exemplo, 5 sítios de CpG) e para a qual um número suficiente de leituras foi obtido. Em uma modalidade, a identificação começou de uma extremidade de cada cromossomo para localizar a primeira região de 500 bp que continha pelo menos cinco sítios de CpG qualificados. Um sítio de CpG pode ser considerado qualificado se o sítio foi abrangido por pelo menos cinco leituras de sequência.
[00209] No bloco 1430, um índice de metilação placentária e um índice de metilação sanguínea são calculados para cada sítio. Por exemplo, o índice de metilação foi calculado individualmente para todos os sítios de CpG qualificados em cada região de 500 bp.
[00210] No bloco 1440, os índices de metilação foram comparados entre as células do sangue materno e a amostra placentária para determinar se os conjuntos de índices eram diferentes entre si. Por exemplo, os índices de metilação foram comparados entre as células do sangue materno e a CVS ou da placenta a termo usando, por exemplo, o teste de Mann-Whitney. Um valor de P de, por exemplo, < 0,01 foi considerado como estatística e significativamente diferente, embora outros valores possam ser usados, onde um número menor reduziria regiões positivas falsas.
[00211] Em uma modalidade, se o número de sítios de CpG qualificados fosse inferior a cinco ou o teste de Mann-Whitney não fosse significativo, a região de 500 bp deslocaria a jusante para 100 bp. A região continuou a ser deslocada a jusante, até que o teste de Mann-Whitney tornou- se significativo para uma região de 500 bp. A próxima região de 500 bp seria então considerada. Se foi constatado que a próxima região apresenta significância estatística pelo teste de Mann-Whitney, ela seria adicionada à região atual, desde que a região contígua combinada não seja maior que a de 1.000 bp.
[00212] No bloco 1450, as regiões adjacentes que foram estatística e significativamente diferentes (por exemplo, pelo teste de Mann-Whitney) podem ser mescladas. Observe a diferença entre os índices de metilação para as duas amostras. Em uma modalidade, se as regiões adjacentes estão a uma distância especificada (por exemplo, 1.000 bp) uma da outra e se apresentaram um perfil de metilação similar, então elas seriam fundidas. Em uma implementação, a semelhança do perfil de metilação entre regiões adjacentes pode ser definida usando qualquer um dos seguintes procedimentos: (1) apresentando a mesma tendência no tecido placentário com referência às células do sangue materno, por exemplo, as duas regiões foram mais metilado nos tecidos placentários do que nas células do sangue; (2) com diferenças de densidades de metilação inferiores a 10% para regiões adjacentes no tecido placentário; e (3) com diferenças de densidades de metilação inferiores a 10% para as regiões adjacentes nas células de sangue materno.
[00213] No bloco 1460, as densidades de metilação do metiloma sanguíneo do DNA da célula do sangue materno e da amostra placentária (por exemplo, CVS ou tecido placentário a termo) nas regiões foram calculadas. As densidades de metilação podem ser determinadas conforme descrito neste documento.
[00214] No bloco 1470, são determinados os DMRs putativos onde a densidade de metilação placentária total e a densidade de metilação sanguínea total para todos os sítios na região são estatística e significativamente diferentes. Em uma modalidade, todos os sítios de CpG qualificados em uma região fundida são submetidos a um teste dex2. O teste x2 avaliou se o número de citosinas metiladas como proporção das citosinas metiladas e não metiladas entre todos os sítios de CpG qualificados dentro da região fundida era estatística e significativamente diferente entre as células do sangue materno e o tecido placentário. Em uma implementação, para o teste x22, um valor P de < 0.01 pode ser considerado estatística e significativamente diferente. Os segmentos fundidos que mostraram significância pelo teste X2 foram considerados DMRs putativos.
[00215] No bloco 1480, foram identificados loci em que as densidades de metilação do DNA das células de sangue materno estavam acima de um ponto de corte alto ou baixo. Em uma modalidade, os loci foram identificados em que as densidades de metilação do DNA da célula do sangue materno eram < 20% ou > 80%. Em outras modalidades, os fluidos corporais diferentes do sangue materno podem ser usados, incluindo, entre outros, saliva, líquido de lavagem do útero ou do colo do útero do trato genital feminino, lágrimas, suor, saliva e urina.
[00216] Uma chave para o desenvolvimento bem-sucedido de marcadores de metilação de DNA que são específicos fetais no plasma materno pode ser que o status de metilação das células do sangue materno são altamente metiladas ou não metiladas como possível. Isto pode reduzir (por exemplo, minimizar) a chance de ter moléculas de DNA materno interferindo na análise de moléculas de DNA fetal derivadas da placenta que apresentam um perfil de metilação oposto. Assim, em uma modalidade, os DMRs candidatos foram selecionados pela filtragem adicional. Os loci hipometilados candidatos foram aqueles que apresentaram densidades de metilação < 20% nas células de sangue materno e com densidades de metilação pelo menos 20% maiores nos tecidos placentários. Os loci hipermetilados candidatos foram aqueles que mostraram densidades de metilação > 80% nas células de sangue materno e com densidades de metilação pelo menos inferiores em 20% nos tecidos placentários. Outras porcentagens podem ser utilizadas.
[00217] No bloco 1490, DMRs foram, então, identificados entre o subconjunto dos loci onde as densidades de metilação placentárias são significativamente diferentes de densidades de metilação do sangue, comparando a diferença de um limite. Em uma modalidade, o limite é de 20%, então as densidades de metilação diferiram em pelo menos 20% das densidades de metilação das células do sangue materno. Por conseguinte, a diferença entre as densidades de metilação placentárias e as densidades de metilação do sangue nos loci identificados pode ser calculada. A diferença pode ser uma simples subtração. Em outras modalidades, fatores de dimensionamento e outras funções podem ser usados para determinar a diferença (por exemplo, a diferença pode ser o resultado de uma função aplicada à subtração simples).
[00218] Em uma modalidade, usando esse método, 11.729 loci hipermetilados e 239.747 hipometilados foram identificados do exemplo da amostra placentária de primeiro trimestre. O 100 primeiros loci hipermetilados estão listados na tabela S2A do apêndice. Os 100 primeiros loci hipometilados estão listados na tabela S2B do apêndice. As tabelas S2A e S2B listam o cromossomo, a localização de início e término, o tamanho da região, a densidade de metilação no sangue materno, a densidade de metilação na amostra da placenta, os valores de P (que são todos muito pequenos) e a diferença de metilação. As localizações correspondem ao genoma de referência a hg18, que pode ser encontrado em hgdownload.soe.ucsc.edu/goldenPath/hg18/chromosomes.
[00219] Em uma modalidade, 11.920 loci hipermetilados e 204.768 hipometilados foram identificados da amostra placentária de terceiro trimestre. Os primeiros 100 loci hipermetilados para o 3° trimestre listados na tabela S2C, e os primeiros 100 loci hipometilados estão listados na tabela S2D. Trinta e três loci que foram anteriormente relatados como sendo metilados de maneira diferente entre as células do sangue materno e os tecidos placentários de primeiro trimestre foram usados para validar nossa lista de candidatos do primeiro trimestre. 79% dos 33 loci foram identificados como DMRs usando nosso algoritmo.
[00220] A FIG. 15A é uma tabela 1500 que mostra um desempenho da do algoritmo de identificação DMR usando dados do primeiro trimestre, com referência aos marcadores de primeiro trimestre mencionados anteriormente. Na tabela, "a" indica que os loci 1 a 15 foram previamente descritos em (RWK Chiu et al. 2007 Am J Pathol; 170:941-950 e SSC Chim et al. 2008 Clin Chem; 54:500-511); loci 16 a 23 foram previamente descritos em (KC Yuen, thesis 2007, The Chinese University of Hong Kong, Hong Kong); e loci 24 a 33 foram previamente descritos em (EA Papageorgiou et al. 2009 Am J Pathol; 174:1609-1618). "b" indica que estes dados derivaram das publicações acima. "c" indica que as densidades de metilação das células do sangue materno e da amostra do vilo coriônico e suas diferenças foram observadas a partir dos dados de sequenciamento gerados no presente estudo, mas baseados nas coordenadas apresentadas pelos estudos originais. "d" indica que os dados nos loci identificados usando modalidades do método 1400 nos dados de sequenciamento de bissulfito sem tomar referência das publicações citadas acima por Chiu et al (2007), Chim et al (2008), Yuen (2007) ePapageorgiou et al (2009). A extensão dos loci incluíram as regiões genômicas anteriormente relatadas, mas em geral, se expandiram em regiões maiores. "e" indica que um candidato DMR foi classificado como verdadeiro- positivo (TP) ou falso-negativo (FN) com base na necessidade de observar a diferença de > 0,20 entre as densidades de metilação das coordenadas correspondentes do genoma dos DMRs em células do sangue materno e da amostra do vilo coriônico.
[00221] A FIG. 15B é uma tabela 1550 que mostra o desempenho do algoritmo de identificação DMR usando dados do terceiro trimestre em comparação com a amostra de placenta obtida no parto. "a" indica que a mesma lista de 33 loci descrita na FIG. 17A foi usada. "b" indica que os 33 loci foram identificados anteriormente a partir de amostras de gravidez precoce, eles podem não ser aplicáveis aos dados do terceiros trimestre. Portanto, os dados de sequenciamento por bissulfito gerados no presente estudo no tecido placentário a termo com base nas coordenadas genômicas providos por estudos originais foram revistos. Uma diferença de > 0,20 nas densidades de metilação entre as células do sangue materno e o tecido placentário a termo foi usada para determinar se os loci eram DMRs verdadeiros no terceiro trimestre. "c" indica que os dados nos loci foram identificados usando o método 1400 nos dados de sequenciamento por bissulfito sem tomar referência das publicações citadas anteriormente por Chiu et al (2007), Chim et al (2008), Yuen (2007) ePapageorgiou et al (2009). A extensão dos loci incluíram as regiões genômicas anteriormente relatadas, mas em geral, se expandiram em regiões maiores. "d" indica que os DMRs candidatos que continham loci que se qualificaram como metilados de maneira diferente no terceiro trimestre foram classificados como verdadeiro- positivo (TP) ou falso-negativo (FN), baseada na necessidade de observar a diferença de > 0,20 entre as densidades de metilação das coordenadas correspondentes do genoma dos DMRs em células do sangue materno e do tecido placentário a termo. Para loci que não se qualificaram como diferencialmente metilados no terceiro trimestre, sua ausência na lista de DMR ou a presença de um DMR contendo os loci, mas não apresentando a diferença de metilação de < 0,20 foi considerada como DMRs verdadeiros negativos (TN). B. DMRs dos dados de sequenciamento do plasma materno
[00222] Deve ser possível identificar os DMRs do tecido placentário diretamente dos dados do sequenciamento por bissulfito do DNA do plasma materno, desde que a concentração fracionária de DNA fetal da amostra também fosse conhecida. Isso é possível porque a placenta é a fonte predominante de DNA fetal no plasma materno (SSC Chim et al. 2005 Proc Natl Acad Sci USA 102, 14753-14758) e nós mostramos neste estudo que o status de metilação do DNA específico fetal no plasma materno estava correlacionado ao metiloma da placenta.
[00223] Portanto, aspectos do método 1400 podem ser implementados usando um metiloma plasmático para determinar um metiloma placentária deduzido em vez de usar uma amostra placentária. Assim, o método 1000 e 1400 podem ser combinados para determinar os DMRs. O método 1000 pode ser usado para determinar os valores previstos para o perfil de metilação placentário e usá-los no método 1400. Para esta análise, o exemplo concentra- se também nos loci que eram < 20% ou > 80% metilados nas células de sangue materno.
[00224] Em uma implementação, para deduzir os loci que eram hipermetilados nos tecidos da placenta em relação às células do sangue materno, classificamos os loci que mostraram metilação de < 20% em células do sangue materno e metilação de > 60% de acordo com o valor previsto com uma diferença de pelo menos 50% entre a densidade de metilação das células do sangue e o valor previsto. Para deduzir os loci que foram hipometilados nos tecidos placentários em relação às células do sangue materno, classificamos loci que mostraram metilação de > 80% em células do sangue materno e metilação de < 40% de acordo com o valor previsto com uma diferença pelo menos 50% entre a densidade de metilação das células do sangue e o valor previsto.
[00225] A FIG. 16 é uma tabela 1600 que mostra os números dos loci previstos para serem hipermetilados ou hipometilados com base na análise direta dos dados do sequenciamento de bissulfito do plasma materno. "N/A" significa não aplicável. "a" indica que a busca por loci hipermetilados começou na lista dos loci que apresentam densidades de metilação de < 20% nas células de sangue materno. "b" indica que a busca por loci hipometilados começou na lista dos loci que apresentam densidades de metilação de > 80% nas células de sangue materno. "c" indica que dados de sequenciamento por bissulfito da amostra de vilo coriônico foram usados para verificar dados do plasma materno no primeiro trimestre e o tecido placentário a termo foi usado para verificar os dados do plasma materno no terceiros trimestre.
[00226] Conforme mostrado na tabela 1600, a maioria dos loci deduzidos de maneira não invasiva apresentaram padrão de metilação esperado nos tecidos e se sobrepuseram aos DMRs extraídos dos dados de tecido e apresentados na seção anterior. O apêndice lista DMRs identificados do plasma. A tabela S3A lista os primeiros 100 loci deduzidos para serem hipermetilados a partir dos dados de sequenciamento por bissulfito do plasma materno no primeiro trimestre. A tabela S3B lista os primeiros 100 loci deduzidos para serem hipometilados a partir dos dados de sequenciamento por bissulfito do plasma materno no primeiro trimestre. A tabela S3C lista os primeiros 100 loci deduzidos para serem hipermetilados a partir dos dados de sequenciamento por bissulfito do plasma materno no terceiro trimestre. A tabela S3D lista os primeiros 100 loci deduzidos para serem hipometilados a partir dos dados de sequenciamento por bissulfito do plasma materno no terceiro trimestre. C. Variação gestacional em metilomas placentário e fetal
[00227] A proporção geral de CpGs metilados no CVS foi 55% enquanto que era de 59% para a placenta do termo (tabela 100 da Fig. 1). Mais DMRs hipermetilados puderam ser identificados do CVS que a placenta de termo enquanto o número de DMRs hipermetilados foi semelhantes para os dois tecidos. Assim, ficou evidente que o CVS era mais hipometilado do que a placenta de termo. Esta tendência gestacional também era aparente nos dados do plasma materno. A proporção de CpGs metilados entre as leituras fetal específicas foi de 47,0% no plasma materno do primeiro trimestre mas 53,3% no plasma materno do terceiro trimestre. Os números dos loci hiperrmetilados validados foram similares no primeiro (1.457 loci) e terceiro trimestre das amostras de plasma materno (1.279 loci), mas foram substancialmente mais loci hipometilados no primeiro (21.812 loci) do que no terceiro trimestre (loci 12.677) das amostras (1600 a tabela da FIG. 16). D. Uso de Marcadores
[00228] Os marcadores diferencialmente metilados, ou DMRs, são úteis em vários aspectos. A presença de tais marcadores no plasma materno indica e confirma a presença ou o DNA fetal ou placentário. Essa confirmação pode ser usada como um controle de qualidade para testes de pré-natal não invasivo. DMRs podem servir como genéricos marcadores de DNA fetal no plasma materno e ter vantagens sobre os marcadores que dependem de diferenças genotípicas entre a mãe e o feto, tais como polimorfismo com base em marcadores ou aqueles que se baseiam no cromossomo Y. DMRs são marcadores fetais genéricos que são úteis para todas as gestações. Os marcadores baseado no polimorfismo são somente aplicáveis para o subconjunto de gestações onde o feto herdou o marcador do seu pai e onde a mãe não possui esse marcador em seu genoma. Além disso, um poderia medir a concentração de DNA fetal em uma amostra de plasma materno através da quantificação das moléculas de DNA provenientes desses DMRs. Conhecendo o perfil de DMRs esperado para gestações normais, complicações associadas a gravidez, particularmente aquelas que envolvem alterações de tecido placentário, poderiam ser detectadas pela observação de um desvio no perfil DMR do plasma materno ou perfil de metilação do que esperado para gestações normais. Complicações associadas a gravidez que envolvem alterações de tecido placentário incluem mas não estão limitadas a aneuploidias cromossômicas fetais. Exemplos inclui Trissomia 21, pré- eclâmpsia, retardo do crescimento intrauterino e parto prematuro. E. Kits usando Marcadores
[00229] Modalidades podem fornecer kits e composições para praticar os métodos descritos neste documento e outros métodos aplicáveis. Kits podem ser usados para carregar os ensaios para a análise de DNA fetal, por exemplo, célula livre de DNA fetal no plasma materno. Em uma modalidade, um kit pode compreender pelo menos um do oligonucleotídeo útil para a hibridação específica com um ou mais loci identificados neste documento. Um kit também pode compreender pelo menos um do oligonucleotídeo útil para a hibridação específica com um ou mais loci de referência. Em uma modalidade, medem-se marcadores hipermetilados placentária. O locus de teste pode ser o DNA metilado no plasma materno e o locus de referência podem ser o DNA metilado no plasma materno. Um kit semelhante poderia ser composto de análise de DNA do tumor no plasma.
[00230] Em alguns casos, os kits podem incluir pelo menos duas primeiros iniciadores do oligonucleotídeo que podem ser usados na amplificação de pelo menos uma seção de um locus alvo (por exemplo, um locus no apêndice) e um locus de referência. Em vez de ou além dos iniciadores, um kit pode incluir sondas marcadas para detectar um fragmento de DNA correspondente a um locus alvo e um locus de referência. Em várias modalidades, um ou mais oligonucleotídeos do kit correspondem a um locus nas tabelas do apêndice. Normalmente, os kits também fornecem manuais de instruções para orientar os usuários na análise das amostras de teste e avaliar o estado da fisiologia ou patologia em uma cobaia.
[00231] Em várias modalidades, um kit para análise de DNA fetal em uma amostra biológica contendo uma mistura de DNA fetal e o DNA de um sujeito feminino grávida de um feto é fornecido. O kit pode compreender um ou mais oligonucleotídeos para hibridização especificamente para pelo menos uma seção de uma região genômica listados nas tabelas S2A, S2B, S2C, S2D, S3A, S3B, S3C e S3D. Assim, qualquer número de oligonucleotídeos de entre as tabelas são apenas de uma tabela que pode ser utilizada. Os oligonucleotídeos podem agir como iniciadores e podem ser organizados como pares de iniciadores, onde um par corresponde a uma região específica das tabelas.
VI. RELAÇÃO DE TAMANHO E DENSIDADE DE METILAÇÃO
[00232] Moléculas de DNA do plasma são conhecidas para existir em circulação sob a forma de moléculas curtas, com a maioria das moléculas de 160 bp no comprimento (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91, YW Zheng at al. 2012 Clin Chem; 58: 549-558). Curiosamente, nossos dados revelaram uma relação entre o estado de metilação e o tamanho das moléculas de DNA do plasma. Assim, o comprimento do fragmento de DNA do plasma está ligado ao nível de metilação do DNA. Os perfis de tamanho característico das moléculas de DNA de plasma sugerem que a maioria é associada com mononucleossomos, possivelmente derivado de degradação enzimática durante o apoptose.
[00233] DNA circulante é fragmentado na natureza. Em particular, o DNA circular fetal é menor que maternalmente derivados do DNA nas amostras de plasma materno (KCA Chan et al. 2004 Clin Chem; 50: 88-92). Tal como alinhamento da extremidade emparelhado permite a análise de tamanho de DNA tratado com bissulfito, um pode apreciar diretamente que exista alguma correlação entre o tamanho das moléculas de DNA de plasma e seus níveis de metilação respectivos. Nós exploramos isso no plasma materno, bem como uma amostra de plasma do controle feminino adulto não gestante.
[00234] Sequenciamento das extremidades emparelhadas (que inclui uma molécula inteira de sequenciamento) para ambas as extremidades de cada molécula de DNA foi usada para analisar cada amostra neste estudo. Alinhando o par de sequências da extremidade de cada molécula de DNA ao genoma humano de referência e observando as coordenadas do genoma das extremidades extremas das leituras sequenciais, pode-se determinar os comprimentos das moléculas de DNA sequenciados. Moléculas de DNA de plasma são naturalmente fragmentadas em pequenas moléculas e as bibliotecas de sequenciamento de DNA são tipicamente preparadas sem quaisquer etapas de fragmentação de plasma. Portanto, os comprimentos deduzidos pelo sequenciamento representaram os tamanhos das moléculas do DNA original do plasma.
[00235] Em estudo anterior, determinamos os perfis de tamanho das moléculas de DNA maternos e fetais no plasma materno (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91). Nós mostramos que as moléculas de DNA de plasma tinham tamanhos que se assemelhassem a mononucleossomos e moléculas de DNA fetais eram mais curtas do que os maternos. Neste estudo, determinamos a relação entre o estado de metilação de moléculas de DNA do plasma para seus tamanhos. A. Resultados
[00236] A FIG. 17A é uma representação gráfica 1700 da distribuição de tamanho do plasma materno, plasma de controle de mulher não grávida e DNA de sangue placentário e periférico. Para a amostra materna e o plasma de controle feminino não grávidas, as duas amostras de plasma tratados com bissulfito exibiu a mesma distribuição de tamanho característico como anteriormente relatada (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91) com as sequências totais mais abundantes de 166-167 bp no comprimento e uma periodicidade de 10-bp de moléculas de DNA menores que 143 bp.
[00237] A FIG. 17B é uma representação gráfica 1750 da distribuição de tamanho e do perfil de metilação do plasma materno, plasma de controle de mulher adulta, tecido placentário e sangue de controle de mulher adulta. Para moléculas de DNA do mesmo tamanho e contendo pelo menos um sítio de CpG, calculou-se a sua densidade média de metilação. Então, nós traçamos a relação entre os tamanhos das moléculas de DNA e suas densidades de metilação. Especificamente, a densidade média de metilação foi determinada para cada comprimento de fragmento que variam de 50 bp até 180 bp para leituras sequenciais cobrindo pelo menos 1 sítio de CpG. Curiosamente, a densidade de metilação aumentou com o tamanho do DNA de plasma e atingiu um pico ao redor de 166-167 bp. Este padrão, no entanto, não foi observado no sangue da placenta e controle das amostras de DNA que estavam fragmentadas usando um sistema de ultrassonicador.
[00238] A FIG. 18 mostra parcelas de densidades de metilação e tamanho de plasma das moléculas de DNA. A FIG. 18A é um gráfico 1800 para plasma materno no primeiro trimestre. A FIG. 18B é um gráfico 1850 para plasma materno no terceiro trimestre. Dados para todas as leituras sequenciadas coberto pelo menos num sítio de CpG são representados pela curva azul 1805. Dados para leituras que também continham um alelo SNP fetal específico são representados pela curva vermelha 1810. Dados para leituras que também continham um alelo SNP maternos específicos são representados pela curva verde 1815.
[00239] Leituras que continha um alelo SNP fetal específica foram consideradas derivadas das moléculas de DNA fetal. Leituras que continha um alelo SNP maternos específicos foram consideradas derivada das moléculas de DNA maternas. Em geral, as moléculas de DNA com densidades de metilação alta foram maiores em tamanho. Esta tendência estava presente nas moléculas de DNA fetal e maternas em ambos o primeiro e terceiro trimestres. Os tamanhos totais das moléculas de DNA fetal foram mais curtos do que o materno como anteriormente relatados.
[00240] A FIG. 19A mostra uma representação gráfica 1900 de densidades de metilação e os tamanhos de leituras sequenciais para uma mulher adulta não grávida. Amostra de DNA do plasma adulto feminino não gestante também mostrou a mesma relação entre os tamanhos e o estado de metilação das moléculas de DNA. Por outro lado, as amostras de DNA genômicas foram fragmentadas por uma etapa de ultrassonicação antes da análise MPS. Como mostrado no gráfico 1900, os dados da célula de sangue e amostras de tecido placentário não revelou a mesma tendência. Uma vez que a fragmentação das células é artificial, seria de esperar que não tenha nenhuma relação de tamanho e densidade. Desde que as moléculas de DNA naturalmente fragmentadas em plasma mostram uma dependência do tamanho, pode-se presumir que as menores densidades de metilação tornaram mais provável para moléculas quebrarem em fragmentos menores.
[00241] A FIG. 19B é uma representação gráfica 1950 que mostra a distribuição de tamanho e o perfil de metilação de moléculas de DNA específicas da mãe e moléculas de DNA específicas do feto no plasma materno. Moléculas de DNA de plasma específico fetal e específico maternal também exibiram a mesma correlação entre níveis de tamanho e metilação do fragmento. Ambos o comprimento de fragmento derivado da placenta e circulante materno sem célula de DNA aumentou com o nível de metilação. Além disso, a distribuição de seu status de metilação não se sobrepõe uns com os outros, sugerindo que o fenômeno exista independentemente do comprimento de fragmento original das fontes circulantes das moléculas de DNA. B. Método
[00242] Da mesma forma, uma distribuição de tamanho pode ser usada para estimar um percentual de metilação total de uma amostra de plasma. Esta medição de metilação pode então ser rastreada durante a gravidez, durante o acompanhamento de câncer ou durante o tratamento em série medindo as distribuições de tamanho de plasma DNA de acordo com a relação mostrada nas FIGS. 18A e 18B. A medição de metilação também pode ser usada para procurar o aumento ou diminuição da liberação de DNA de um órgão ou de um tecido de interesse. Por exemplo, um pode olhar especificamente para assinaturas de metilação de DNA específicas para um órgão específico (por exemplo, o fígado) e a medição das concentrações destas assinaturas no plasma. Como o DNA é liberado no plasma, quando as células morrem, um aumento em níveis pode significar um aumento na morte celular ou dano naquele determinado órgão ou tecido. Uma diminuição no nível de um determinado órgão pode significar que o tratamento contra danos ou processos patológicos em que órgão está sob controle.
[00243] A FIG. 20 é um fluxograma de um método 2000 para estumar o nível de metilação de DNA em uma amostra biológica de um organismo de acordo com as modalidades da presente invenção. O nível de metilação pode ser estimado para uma determinada região de um genoma ou o genoma inteiro. Se uma região específica é desejada, fragmentos de DNA, somente a partir dessa região específica podem ser utilizados.
[00244] No bloco 2010, quantidades de fragmentos de DNA correspondente a vários tamanhos são medidos. Para cada tamanho de uma pluralidade de tamanhos, uma quantidade de uma pluralidade de fragmentos de DNA da amostra biológica correspondente ao tamanho pode ser medida. Por exemplo, o número de fragmentos de DNA com um comprimento de 140 bases pode ser medido. As quantidades podem ser salvas como um histograma. Em uma modalidade, um tamanho de cada um da pluralidade dos ácidos nucleicos da amostra biológica é medido, que pode ser feito em uma base individual (por exemplo, por sequenciamento da molécula única de uma molécula inteira ou apenas extremidades da molécula) ou em uma base de grupo (por exemplo, através de eletroforese). Os tamanhos podem corresponder a um intervalo. Assim, uma quantidade pode ser por fragmentos de DNA que têm um tamanho dentro de um intervalo específico. Quando o sequenciamento da extremidade emparelhada é executado, os fragmentos de DNA (conforme determinado pela leitura da sequência emparelhada) mapeamento (alinhando) para uma determinada região pode ser usado para determinar o nível de metilação da região.
[00245] No bloco 2020, um primeiro valor de um primeiro parâmetro é calculado com base nas quantidades de fragmentos de DNA em vários tamanhos. Em um aspecto, o primeiro parâmetro fornece uma medida estatística de um perfil de tamanho (por exemplo, um histograma) de fragmentos de DNA na amostra biológica. O parâmetro pode ser referido como um parâmetro de tamanho, desde que ele é determinado entre os tamanhos da pluralidade dos fragmentos de DNA.
[00246] O primeiro parâmetro pode ser de várias formas. Um parâmetro é a porcentagem do fragmento de DNA de um determinado tamanho ou escala dos tamanhos relativos de todos os fragmentos de DNA ou em relação aos fragmentos de DNA de outro tamanho ou escala. Tal parâmetro é um número de fragmentos de DNA em um tamanho específico, dividido pelo número total de fragmentos, que podem ser obtidos a partir de um histograma (qualquer estrutura de dados fornecendo contagens absolutas ou relativas de fragmentos em tamanhos específicos). Como outro exemplo, um parâmetro pode ser um número de fragmentos em um determinado tamanho ou dentro de um intervalo específico, dividido por um número de fragmentos de outro tamanho ou escala. A divisão pode atuar como uma normalização para contabilizar um número diferente de fragmentos de DNA, sendo analisado para amostras diferentes. Uma normalização pode ser realizada através da análise de um mesmo número de fragmentos de DNA para cada amostra, que efetivamente fornece um resultado mesmo que dividindo por um total de número de fragmentos analisados. Exemplos adicionais de parâmetros e sobre análise de tamanho podem ser encontrados na Aplicação de Patente US 13/789.553, que é incorporada por referência, para todos os efeitos.
[00247] No bloco 2030, o primeiro valor é comparado com um valor de tamanho de referência. O valor de tamanho de referência pode ser calculado a partir de fragmentos de DNA de uma amostra de referência. Para determinar os valores do tamanho de referência, o perfil de metilação pode ser calculado e quantificado para uma amostra de referência, bem como um valor do primeiro parâmetro de tamanho. Assim, quando o primeiro valor é comparado com o valor de tamanho da referência, um nível de metilação pode ser determinado.
[00248] No bloco 2040, o nível de metilação é estimado com base na comparação. Em uma modalidade, uma pode determinar se o primeiro valor do primeiro parâmetro está acima ou abaixo do valor de tamanho da referência e, assim, determinar se o nível de metilação da amostra instantânea está acima ou abaixo do nível de metilação para o valor de tamanho da referência. Em outra modalidade, a comparação é realizada inserindo-se no primeiro valor em uma função de calibração. A função de calibração efetivamente pode comparar o primeiro valor para valores de calibração (um conjunto de valores de tamanho da referência), identificando o ponto em uma curva correspondente ao primeiro valor. O nível estimado de metilação é fornecido como o valor de saída da função de calibração.
[00249] Da mesma forma, um pode calibrar um parâmetro de tamanho para um nível de metilação. Por exemplo, um nível de metilação pode ser medido e associado a um parâmetro de tamanho específico para aquela amostra. Em seguida, os pontos de dados de várias amostras podem caber numa função de calibração. Em uma implementação, as calibrações de diferentes funções podem ser usadas para diferentes subconjuntos de DNA. Assim, pode existir alguma forma de calibração com base no conhecimento prévio sobre a relação entre a metilação e tamanho para um subconjunto específico de DNA. Por exemplo, a calibração para DNA fetal e maternal poderia ser diferente.
[00250] Como mostrado acima, a placenta é mais hipometilada quando comparado com o sangue materno, e, portanto, o DNA fetal é menor devido a menor metilação. Por conseguinte, um tamanho médio dos fragmentos de uma amostra (ou outro valor estatístico) pode ser usado para estimar a densidade de metilação. Como os tamanhos de fragmento podem ser medidos usando sequenciamento da extremidade emparelhada, ao invés do sequenciamento potencialmente tecnicamente mais complexo de reconhecimento de metilação, esta abordagem seria potencialmente mais rentável, e se usada clinicamente. Esta abordagem pode ser usada para monitorar as alterações de metilação associadas com o progresso da gravidez, ou com distúrbios associados a gravidez como pré-eclâmpsia, parto prematuro e distúrbios fetais (tais como aquelas causadas por anormalidades cromossômicas ou genéticas ou retardo de crescimento intrauterino).
[00251] Em outra modalidade, esta abordagem pode ser usada para a detecção e monitoramento de câncer. Por exemplo, com o sucesso do tratamento de câncer, o perfil de metilação no plasma ou outros fluidos corporais como medido usando esta abordagem baseada no tamanho mudaria para o de indivíduos saudáveis sem câncer. Por outro lado, no caso em que o câncer está progredindo, em seguida do perfil de metilação no plasma ou outro fluido corporal que divergem dos indivíduos saudáveis sem câncer.
[00252] Em resumo, as moléculas hipometiladas foram mais curtas do que um hipermetilado no plasma. A mesma tendência foi observada nas moléculas DNA fetais e maternas. Desde que a metilação do DNA é conhecida por influenciar a embalagem nucleossoma, nossos dados sugerem que talvez as moléculas de DNA hipometiladas fossem menos densamente embaladas com histonas e foram, portanto, mais suscetíveis à degradação enzimática. Por outro lado, os dados apresentados nas FIGS. 18A e 18B também mostraram que apesar do DNA fetal, sendo muito mais hipometilado do que a leitura materna, a distribuição de tamanho de DNA fetal e maternal não se separam um do outro completamente. Na FIG. 19B, um pode ver que até mesmo para a mesma categoria de tamanho, o nível metilação das leituras fetal e maternal específicas difere uma da outra. Esta observação sugere que o estado hipometilado de DNA fetal não é o único fator que representou a sua falta relativa tendo como referência o DNA materno.
VII. STATUS DE IMPRESSÃO DE GENE LOCI
[00253] Moléculas de DNA fetal derivadas podem ser detectadas as quais compartilham o mesmo genótipo, mas com diferentes assinaturas epigenéticas como a mãe no plasma materno (LLM Poon et al. 2002 Clin Chem; 48: 35-41). Para demonstrar que a abordagem de sequenciamento é sensível em buscar moléculas de DNA fetal derivadas no plasma materno, aplicamos a mesma estratégia para detectar os alelos fetais impressos em amostra de plasma materno. Identificaram-se duas regiões genômicas impressas: H19 (chr11:1,977,419-1,977,821, NCBI Build36/hg18) e MEST (chr7:129,917,976-129,920,347, NCBI Build36/hg18). Ambas contêm informativos SNPs para diferenciação entre as sequências maternas e fetais. Para H19, um gene maternalmente expresso, a mãe era homozigota (A/A) e o feto heterozigoto (A/C) para o SNP rs2071094 (chr11:1, 977, 740) na região. Um dos alelos A maternos era totalmente metilado e o outro é não metilado. Na placenta, no entanto, o alelo A era não metilado enquanto o alelo C paterno herdado foi totalmente metilado. Detectamos duas leituras metiladas com o genótipo C, correspondentes aos impressos alelos paternos derivados da placenta, no plasma materno.
[00254] MEST, também conhecido como PEG1, é um gene paternalmente expresso. Tanto a mãe quanto o feto foram heterozigoto (A/G) para o SNP rs2301335 (chr7:129, 920, 062) dentro do locus impresso. O alelo G foi misturado enquanto o alelo A era não metilado no sangue materno. O padrão de metilação inverteu-se na placenta com o alelo A maternal sendo metilado e o alelo G paterno não metilado. Três alelos G não metilados, que foram derivados paternalmente, foram detectáveis no plasma materno. Em contraste, VAV1, um locus de gene não impresso no cromossoma 19 (chr19:6, 723, 621-6.724.121), não exibe qualquer padrão de metilação alélico no tecido, bem como as amostras de DNA de plasma.
[00255] Assim, o status de metilação pode ser usado para determinar quais fragmentos de DNA são do feto. Por exemplo, apenas detectando o alelo A no plasma materno não pode ser usada como um marcador fetal quando a mãe é heterozigota GA. Mas se um distingue o estado de metilação das moléculas A no plasma, as moléculas A metiladas são específicas do feto enquanto as moléculas A não metiladas são maternas específicas, ou vice versa.
[00256] Em seguida enfocamos no loci que foram relatados para demonstrar impressão genômica nos tecidos placentários. Com base na lista dos loci relatados por Woodfine et al. (2011 Epigenetics Chromatin; 4: 1), somos ainda classificados para aqueles que SNPs contidos dentro da região de controle da impressão. Quatro loci preencheram os critérios e foram H19, KCNQ10T1, MEST e NESP.
[00257] Sobre as leituras da amostra das células do sangue materno para H19 e KCNQ10T1, as leituras maternas foram homozigotas para o SNP e tinha proporções aproximadamente iguais de leituras metiladas e não metiladas. O CVS e o termo amostra de tecido placentário revelou que o feto era heterozigoto para os dois loci e cada alelo ou era exclusivamente metilado ou não metilado, ou seja, apresentando metilação de monoalélica. Nas amostras de plasma materno, as moléculas de DNA fetais paternalmente herdadas foram detectadas para os dois loci. Para H19, as moléculas paternalmente herdadas foram representadas pelas leituras sequenciais que continham o alelo específico fetal e foram metiladas. Para KCNQ10T1, as moléculas paternalmente herdadas foram representadas pelas leituras sequenciais que continham o alelo específico fetal e eram não metiladas.
[00258] Por outro lado, a mãe foi heterozigota para ambos MEST e NESP. Para MEST, a mãe e o feto eram heterozigotos GA para o SNP. No entanto, como é evidente a partir dos dados para a vertente de Watson para as células do sangue materno e tecido placentário, o estado de metilação para as CpGs adjacente para o SNP foi oposto na mãe e feto. O alelo A foi não metilado no DNA da mãe, mas metilado no DNA do feto. Para MEST, o alelo materno foi misturado. Daí, um poderia identificar que o feto tinha herdado o alelo A de sua mãe (metilado no CVS) e a mãe tinha herdado o alelo A de seu pai (não metilado nas células do sangue materno). Curiosamente, em amostras de plasma materno, todos os quatro grupos de moléculas poderiam ser facilmente distinguidos, incluindo cada um dos dois alelos da mãe e cada um dos dois alelos do feto. Assim, combinando as informações do genótipo com o status de metilação nos loci impresso, poderiamos facilmente distinguir as moléculas de DNA fetais herdadas maternalmente das moléculas de DNA maternas do fundamento (LLM Poon et al. 2002 Clin Chem; 48: 35-41).
[00259] Esta abordagem poderia ser usada para detectar dissomia uniparental. Por exemplo, se o pai deste feto é conhecido por ser homozigoto para o alelo G, o fracasso para detectar o alelo G não metilado no plasma materno significa a falta de contribuição do alelo paterno. Além disso, sob tais circunstâncias, quando ambos alelo G metilado e alelo A metilado foram detectados no plasma de gravidez, é sugerido que o feto tem heterodissomia da mãe, ou seja, herdando dois alelos diferentes da mãe com nenhuma herança do pai. Como alternativa, se ambos alelo A metilados (alelo fetal herdado da mãe) e alelo A não metilado (alelo materno herdado do avô materno) foram detectados no plasma materno sem o alelo G não metilado (alelo paterno que deve ter sido herdado pelo feto), sugeriria que o feto tem isodossomia da mãe, ou seja, herdam dois alelos idênticos a mãe com nenhuma herança do pai.
[00260] Para NESP, a mãe era um heterozigoto GA no SNP enquanto o feto era homozigoto para o alelo G. O alelo paterno foi metilado por NESP. Nas amostras de plasma materno, os alelos G fetais herdados paternalmente que eram metilados podem ser facilmente distinguidos de fundamento do alelo G maternos que foram não metilados.
VIII. CÂNCER/DOADORES
[00261] Algumas modalidades podem ser usadas para a detecção, triagem, monitoramento (por exemplo, para a recaída, remissão ou resposta (por exemplo, a presença ou a ausência) ao tratamento), estadiamento, classificação (por exemplo, para auxílio na hora de escolher a modalidade de tratamento mais adequada) e prognóstico de câncer usando análise de metilação de DNA do plasma/soro em circulação.
[00262] DNA do câncer é conhecido para demonstrar a metilação do DNA aberrante (JG Herman et al. 2003 N Engl J Med; 349: 2042-2054). Por exemplo, os promotores da ilha de CpG dos genes, por exemplo, genes supressor do tumor, são hipermetilados enquanto os sítios de CpG no corpo do gene são hipometilados quando comparado com as células não cancerosas. Desde que o perfil de metilação das células de câncer poderia ser refletido pelo perfil de metilação das moléculas de DNA do tumor derivado do plasma usando os métodos descritos neste documento, esperamos que o perfil geral de metilação no plasma fosse diferente entre os indivíduos com câncer, quando comparados com indivíduos saudáveis sem câncer ou quando comparado com aqueles cujo câncer tinha sido curado. Os tipos de diferenças no perfil de metilação podem ser em termos de diferenças quantitativas das densidades de metilação do genoma e/ou densidades de metilação de segmentos dos genomas. Por exemplo, devido à natureza hipometilada geral de DNA dos tecidos de câncer (Gama-Sosa MA et al. 1983 Nucleic Acids Res; 11: 6883-6894), redução na densidade de metilação no plasma metiloma ou segmentos do genoma seria observada no plasma de pacientes com câncer.
[00263] Mudanças qualitativas no perfil de metilação devem também refletir-se entre os dados de metiloma do plasma. Por exemplo, as moléculas de DNA do plasma proveniente dos genes que são hipermetilados apenas nas células cancerosas mostrariam hipermetilação no plasma de um paciente com câncer, quando comparado com as moléculas de DNA do plasma proveniente dos mesmos genes, mas em uma amostra de um controle saudável. Porque a metilação aberrante ocorre na maioria dos cânceres, os métodos descritos neste documento poderiam ser aplicados para a detecção de todas as formas de neoplasias malignas com metilação aberrante, por exemplo, neoplasias malignas, mas não se limitando ao pulmão, mama, colorretal, próstata, nasofaringe, estômago, testículos, pele, sistema nervoso, osso, ovário, fígado, tecidos hematológicos, pâncreas, útero, rim, bexiga, tecido linfóide, etc. A malignidade pode ser de uma variedade de subtipos histológicos, por exemplo, adenocarcinomas, carcinomas, sarcomas, fibroadenocarcinoma, neuroendócrina e indiferenciada, etc.
[00264] Por outro lado, esperamos que as moléculas de DNA derivado do tumor podem ser distinguidas das moléculas de DNA não derivada de tumor do fundamento porque o perfil geral de curto tamanho do tumor derivado do DNA é acentuado por moléculas de DNA proveniente de loci com hipometilação aberrante associada a tumores que teria um efeito adicional sobre o tamanho da molécula de DNA. Também, as moléculas de DNA do plasma do tumor derivado podem ser distinguidas do fundamento das moléculas do DNA do plasma derivados do não tumor usando vários traços característicos que são associado com tumor DNA, incluindo mas não se limitando a variantes de nucleotídeos únicos, perdas e ganhos do número de copias, translocações, inversões, hiper- ou hipo-metilação aberrante e tamanho de perfil. Como todas essas mudanças podem ocorrer de forma independente, o uso combinado desses recursos podem proporcionar vantagens aditivas para detecção sensível e específica do DNA de câncer no plasma. A. Tamanho e câncer
[00265] O tamanho das moléculas de DNA derivadas do tumor no plasma também lembram os tamanhos das unidades de mononucleossomal e são mais curtas do que o fundamento das moléculas de DNA não derivadas de tumor, que coexistem no plasma de pacientes com câncer. Parâmetros de dimensionamento foram mostrados para serem correlacionados com o câncer, conforme descrito no Pedido de Patente US 13/789.553, que é incorporada por referência, para todos os efeitos.
[00266] Desde ambos DNA derivados da mãe e derivados do feto no plasma mostraram uma relação entre o status de tamanho e metilação da molécula, tumor derivado das moléculas de DNA são esperadas para expor a mesma tendência. Por exemplo, as moléculas hipometiladas seriam mais curtas do que as moléculas de hipermetiladas no plasma de pacientes com câncer ou em indivíduos selecionados para câncer. B. Densidades de metilação dos diferentes tecidos em um paciente com câncer
[00267] Neste exemplo, analisamos as amostras do plasma e tecido do paciente com carcinoma hepatocelular (HCC). Foram colhidas amostras de sangue do paciente HCC antes e em 1 semana após a resseção cirúrgica do tumor. Plasma e creme leucocitário foram colhidos após centrifugação das amostras de sangue. O tumor ressecado e o tecido do fígado não tumoral adjacente foram coletados. As amostras de DNA extraídas das amostras do plasma e tecido foram analisadas usando sequenciamento massivamente paralelo com e sem tratamento prévio de bissulfito. O DNA do plasma de quatro indivíduos saudáveis sem câncer também foi analisado como controles. O tratamento de bissulfito de uma amostra de DNA seria converter os resíduos de citosina não metilados a uracil. Na reação em cadeia da polimerase a jusante e sequenciamento, estes resíduos uracil comportaria como timidina. Por outro lado, o tratamento de bissulfito não seria converter os resíduos de citosina metilados a uracila. Após o sequenciamento massivamente paralelo, as leituras de sequenciamento foram analisadas pelo Methy-Pipe (P Jiang, et al. Methy-Pipe: An integrated bioinformatics data analysis pipeline for wholegenome methylome analysis, paper presented at the IEEEInternational Conference on Bioinformatics and BiomedicineWorkshops, Hong Kong, 18 to 21 December 2010), para determinar o status de metilação dos resíduos de cotosina em todas as posições de dinucleotídeo CG, ou seja CpG sítios.
[00268] A FIG. 21A é uma tabela 2100 mostrando as densidades de metilação do plasma pré-operatório e as amostras de tecido de uma paciente HCC. A densidade de metilação de CpG para as regiões de interesse (por exemplo, sítios CpG, promotor ou regiões de repetição etc.) refere-se a proporção de leituras mostrando metilação de CpG sobre o número total de leituras cobrindo dinucleotídeos CpG genômicos. As densidades de metilação do creme leucocitário e o tecido não tumoral do fígado são semelhantes. A densidade total de metilação do tecido do tumor, baseado em dados de todos os autossomos, foi 25% inferiores do creme leucocitário e o tecido não tumoral do fígado. A hipometilação foi consistente em cada cromossomo individual. A densidade de metilação do plasma foi entre os valores dos tecidos não malignos e os tecidos de câncer. Esta observação é consistente com o fato de que tanto o câncer e tecidos não cancerosos contribuiria para o DNA de circulação de um paciente com câncer. Tem sido demonstrado que o sistema hematopoiético é a principal fonte de DNA circulante em indivíduos sem uma condição maligna ativa (YYN Lui, et al. 2002 Clin Chem; 48: 4217). Por conseguinte, analisamos também amostras de plasma obtidas de quatro controles saudáveis. O número de leituras da sequência e a profundidade de sequenciamento alcançado pela amostra são mostrados na tabela 2150 da FIG. 21B.
[00269] A FIG. 22 é uma tabela 220 que mostra as densidades de metilação em autossomos, variado de 71,2% para 72,5%, nas amostras de plasma dos controles saudáveis. Estes dados mostraram o nível esperado de metilação do DNA em amostras do plasma obtidas de indivíduos sem uma fonte de DNA do tumor. Em um paciente com câncer, o tecido do tumor liberaria também DNA na circulação (KCA Chan et al. 2013 Clin Chem; 59: 211-224); RJ Leary et al. 2012 Sci Transl Med; 4: 162ra154). Devido à natureza hipometilada do tumor HCC, a presença de ambos DNA derivados de tumor e não tumor no plasma pré-operatório do paciente resultou em uma redução da densidade de metilação, quando comparado com os níveis plasmáticos de controles saudáveis. Na verdade, a densidade de metilação da amostra plasma pré-operatório foi entre as densidades de metilação do tecido do tumor e o plasma dos controles saudáveis. A razão é porque o nível de metilação dos níveis de DNA no plasma de pacientes com câncer seria influenciado pelo grau de metilação aberrante, hipometilação neste caso, o tecido do tumor e a concentração fracionária do DNA derivado de tumor na circulação. Uma menor densidade de metilação do tecido do tumor e uma maior concentração fracionária de DNA derivado de tumor na circulação conduziriam a uma menor densidade de metilação do DNA do plasma em um paciente com câncer. A maioria dos tumores é relatada para mostrar hipometilação global (JG Herman et al. 2003 N Engl J Med; 349: 2042-2054; MA Gama-Sosa et al. 1983 Nucleic Acids Res; 11: 6883-6894). Assim, as observações atuais vistas nas amostras de HCC também devem ser aplicáveis a outros tipos de tumores.
[00270] Em uma modalidade, a densidade de metilação do DNA pode ser usada para determinar a concentração fracionária do DNA derivado do tumor em uma amostra de soro/plasma quando o nível de metilação do tecido do tumor é conhecido. O nível de metilação, por exemplo, densidade de metilação, o tecido do tumor pode ser obtido se a amostra de tumor está disponível ou uma biópsia do tumor está disponível. Em outra modalidade, as informações sobre o nível de metilação do tecido do tumor podem ser obtidas do levantamento do nível em um grupo de tumores de um tipo semelhante de metilação e essa informação (por exemplo, um nível médio ou um nível mediano) é aplicada ao paciente para ser analisados utilizando a tecnologia descrita nesta invenção. O nível de metilação do tecido do tumor pode ser determinado pela análise do tecido do tumor do paciente ou inferido a partir da análise dos tecidos de tumor de outros pacientes com o mesmo ou um tipo similar de câncer. A metilação dos tecidos do tumor pode ser determinada usando uma variedade de plataformas de reconhecimento de metilação, incluindo mas não incluindo mas não se limitando a sequenciação massivamente paralela, sequenciação molecular única, microarranjo (por exemplo, do oligonucleotídeo) ou espectrometria de massa (como a análise de Epityper, Sequenom, Inc.,). Em algumas modalidades, tais análises podem ser precedidas por procedimentos que sejam sensíveis para o estado de metilação de moléculas de DNA, incluindo, mas não limitado a, imunoprecipitação de citosina e digestão de metilação que reconhece digestão enzimática. Quando o nível de metilação de um tumor é conhecido, a concentração fracionária do DNA do tumor no plasma de pacientes com câncer poderia ser calculada após a análise de metiloma do plasma.
[00271] A relação entre o nível de metilação de plasma, P, com a concentração de DNA do tumor fracionário, fe nível de metilação de tecido do tumor, TUM, pode ser descrito como: P=BKG x(1-f)+TUM xf, BKG é o fundamento do nível de metilação do DNA no plasma derivado das células de sangue e outros órgãos internos. Por exemplo, a densidade total de metilação de autossomos todos foi mostrada para ser 42,9% do tecido de biópsia do tumor obtidos a partir deste paciente HCC, ou seja, o valor TUM para este caso. A densidade média de metilação das amostras de plasma de quatro controles saudáveis foi 71,6%, ou seja, o valor BKG deste caso. A densidade de metilação de plasma para o plasma pré-operatório foi de 59,7%. Usando estes valores, f é estimada em 41,5%.
[00272] Em outra modalidade, o nível de metilação do tecido do tumor pode ser estimado de forma não invasiva com base nos dados de metiloma do plasma quando a concentração fracionária do DNA derivado do tumor da amostra de plasma é conhecida. A concentração fracionária do DNA derivado do tumor da amostra de plasma pode ser determinada por outra análise genética, por exemplo, a análise de doenças de perda alélica (GAAL) e a análise das únicas mutações nucleotídicas conforme descritas anteriormente (Pedido de Patente US 13/308.473; KCA Chan et al. 2013 Clin Chem; 59: 211-24). O cálculo baseia-se na mesma relação descrita acima, exceto que nesta modalidade, o valor de f é conhecido e o valor de TUM torna-se o desconhecido. A dedução pode ser executada para o genoma inteiro ou por partes do genoma, semelhante aos observados para o contexto de determinação do nível de metilação de tecido placentário de dados do plasma materno.
[00273] Em outra modalidade, um pode usar a variação de perfil ou inter-bin nas densidades de metilação para diferenciar indivíduos com câncer e aqueles sem câncer. A resolução da análise de metilação pode ser aumentada, dividindo o genoma em bins de um determinado tamanho, por exemplo, de 1 Mb. Em tal uma modalidade, a densidade de metilação de cada 1MB bin foi calculada para as amostras coletadas, por exemplo, creme leucocitário, o tecido ressecado do HCC, o tecido não tumoral do fígado adjacente para o tumor e o plasma coletados antes e após a resseção do tumor. Em outra modalidade, os tamanhos de bin não precisam ser mantidos constantes. Em uma implementação, o número de sítios de CpG é mantido constante dentro de cada bin enquanto o bin em si pode variar de tamanho.
[00274] As FIGS. 23A e 23B mostram a densidade de metilação do creme leucocitário, tecido do tumor, tecido não-tumoral do fígado, plasma pré-operatório e plasma pós-operatório do paciente com HCC. As FIGS. 23A é um gráfico 2300 de resultados para o cromossomo 1. As FIGS. 23B é um gráfico 2350 dos resultados para o cromossomo 2.
[00275] Para a maioria das janelas de 1 Mb, as densidades de metilação para o creme leucocitário e o tecido não tumoral do fígado adjacente ao tumor foram semelhantes, considerando que aqueles dos tecidos do tumor foram menores. As densidades de metilação do plasma pré-operatório situam-se entre aqueles do tumor e os tecidos não malignos. As densidades de metilação das regiões genômicas interrogadas nos tecidos do tumor poderiam ser deduzidas usando os dados de metilação do plasma pré-operatório e a concentração de DNA do tumor fracionário. O método é o mesmo como descrito acima usando os valores de densidade de metilação de todos os autossomos. A dedução da metilação de tumor descrita também pode ser realizada usando esses dados de metilação de resolução mais elevados do DNA do plasma. Outros tamanhos de bin, como 300 kb, 500 kb, 2 Mb, 3 Mb, 5 Mb ou mais de 5 Mb também pode ser usados. Em uma modalidade, os tamanhos de bin não precisam ser mantidos constante. Em uma implementação, o número de sítios de CpG é mantido constante dentro de cada bin enquanto o bin em si pode variar de tamanho. C. Comparação da densidade de metilação do plasma entre o câncer de indivíduos saudáveis e pacientes
[00276] Como mostrado em 2100, as densidades de metilação do DNA do plasma pré-operatório foram inferiores dos tecidos não malignos no paciente com câncer. É provável que resultam da presença do DNA do tecido do tumor que foi hipometilado. Esta menor densidade de metilação do DNA do plasma pode ser potencialmente usado como um biomarcador para a detecção e monitoramento do câncer. Para monitoramento de câncer, se um câncer está progredindo, então haverá um aumento da quantidade de DNA derivado de câncer no plasma com o tempo. Neste exemplo, um aumento da quantidade de DNA derivado de câncer circulante no plasma conduzirá a uma redução da densidade de metilação do DNA do plasma em um nível de genoma.
[00277] Por outro lado, se um câncer responde ao tratamento e, em seguida, a quantidade de DNA derivado de câncer no plasma irá diminuir com o tempo. Neste exemplo, uma diminuição na quantidade de DNA derivado de câncer no plasma conduzirá a um aumento da densidade de metilação do DNA do plasma. Por exemplo, se um paciente de câncer de pulmão com mutação do receptor de fator de crescimento epidérmico tem sido tratado com uma terapia-alvo, por exemplo, inibição de quinase de tirosina, um aumento na densidade de metilação de DNA de plasma poderia significar uma resposta. Posteriormente, o surgimento de um tumor clone resistente à inibição de tirosina quinase deve ser associado com uma diminuição na densidade de metilação do DNA do plasma que indicaria uma recaída.
[00278] Medições de densidade da metilação do plasma podem ser executadas em série e a taxa de alteração de tais medições pode ser calculadas e usadas para prever ou correlacionar com progressão clínica ou remissão ou prognóstico. Para loci genômicos selecionados que são hipermetilados em tecidos de câncer, mas hipometilados em tecidos normais, por exemplo, as regiões do promotor de um número de genes supressores de tumor, a relação entre a progressão do câncer e resposta favorável ao tratamento será oposta sos padrões descritos acima.
[00279] Para demonstrar a viabilidade desta abordagem, comparamos as densidades de metilação de DNA das amostras do plasma coletadas do paciente com câncer antes e após a remoção cirúrgica do tumor com o DNA do plasma obtidos de quatro indivíduos controle saudáveis.
[00280] A Tabela 2200 mostra as densidades de metilação do DNA de cada autossomo e os valores combinados de todos os autossomos das amostras de plasma pré-operatório e pós-operatório do paciente com câncer e aqueles quatro indivíduos de controle saudáveis. Para todos os cromossomos, as densidades de metilação da amostra de DNA do plasma pré-operatório foram inferiores a da amostra no pós-operatório e das amostras do plasma dos quatro indivíduos saudáveis. A diferença de densidades de metilação do DNA do plasma entre as amostras do pré-operatório e pós-operatório forneceu as evidências de suporte que as densidades de metilação inferiores da amostra do plasma pré-operatório foram devido à presença de DNA do tumor HCC.
[00281] A reversão das densidades de metilação do DNA da amostra de plasma no pós-operatório a níveis semelhantes para as amostras de plasma dos controles saudáveis sugeriu que grande parte do DNA derivado do tumor tinha desaparecido devido a remoção cirúrgica da fonte, ou seja, o tumor. Estes dados sugerem que a densidade de metilação do plasma pré-operatório conforme determinado usando dados disponíveis de grandes regiões genômicas, como todos os autossomos ou cromossomos individuais eram de um nível inferior de metilação do que os controles saudáveis para permitir a identificação, ou seja, o diagnóstico ou triagem, do caso de teste como tendo câncer.
[00282] Os dados do plasma pré-operatório também mostrou nível de metilação muito mais baixo do que o plasma pós-operatório, indicando que o nível de metilação do plasma também pode ser usado para monitorar a carga do tumor, daí para prognosticar e monitorar o progresso do câncer no paciente. Valores de referência podem ser determinados a partir do plasma de controles saudáveis ou pessoas em situação de risco para o câncer, mas atualmente sem câncer. Pessoas em risco de HCC incluem aqueles com infecção crônica de hepatite B ou hepatite C, aqueles com hemocromatose e aqueles com cirrose hepática.
[00283] Valores de densidade da metilação de plasma além, por exemplo inferiores, um limite definido com base nos valores de referência pode ser usado para avaliar se o plasma da pessoa tem o DNA do tumor ou não. Para detectar a presença de DNA de tumor circulantes hipometilado, o corte pode ser definido como inferior a 5o ou 1o percentis dos valores da população de controle, ou com base em um número de desvios-padrão, por exemplo, 2 ou 3 desvios padrão (SDs), abaixo dos valores de densidade média de metilação dos controles ou com base na determinação de um múltiplo da mediana (MoM). Para o DNA do tumor hipermetilados, o corte pode ser definido como superior a 95o ou 99o de percentil de valores da população de controle, ou com base em um número de desvios-padrão, por exemplo, 2 ou 3 SDs, acima dos valores de densidade de metilação média dos controles ou com base na determinação de um múltiplo da mediana (MoM). Em uma modalidade, a população de controle é correspondida em idade para a cobaia. A correspondência de idade não precisa ser exata e pode ser realizado em faixas etárias (por exemplo, 30 a 40 anos, para uma cobaia, de 35 anos).
[00284] Em seguida comparamos as densidades de metilação de 1MB bins entre as amostras de plasma do paciente de câncer e os 4 sujeitos de controle. Para efeito de ilustração, são mostrados os resultados do cromossomo 1.
[00285] As FIGS. 24A são uma representação gráfica 2400 que mostra as densidades de metilação do plasma pré-operatório do paciente com HCC. As FIGS. 24B são uma representação gráfica 2450 que mostra as densidades de metilação do plasma pós-operatório do paciente com HCC. Os pontos azuis representam os resultados dos sujeitos de controle, os pontos vermelhos representam os resultados da amostra do plasma do paciente de HCC.
[00286] Como mostrado na Figura 24A, as densidades de metilação do plasma pré-operatório o paciente HCC eram inferiores dos sujeitos de controle para a maioria dos bins. Padrões semelhantes foram observados por outros cromossomos. Como mostrado na Figura 24B, as densidades de metilação do plasma no pós-operatório o paciente de HCC foram semelhantes dos sujeitos de controle para a maioria dos bins. Padrões semelhantes foram observados por outros cromossomos.
[00287] Para avaliar se uma cobaia é ter câncer, o resultado da cobaia seria comparado aos valores de um grupo de referência. Em uma modalidade, o grupo de referência pode compreender um número de indivíduos saudáveis. Em outra modalidade, o grupo de referência pode compreender indivíduos com condições não malignas, por exemplo, infecção crônica da hepatite B ou cirrose. A diferença nas densidades de metilação entre o sujeito testado e o grupo de referência, então pode ser quantificada.
[00288] Em uma modalidade, uma gama de referência pode ser derivada dos valores do grupo controle. Em seguida, desvios no resultado do sujeito testado dos limites superiores ou inferiores do grupo de referência podem ser usados para determinar se o sujeito tem um tumor. Esta quantidade seria afetada pela concentração fracionária de tumor derivado de DNA no plasma e a diferença no nível de metilação entre tecidos não malignos e malignos. Maior concentração fracionária do DNA derivado de tumor no plasma implicaria maiores diferenças de densidade de metilação entre a amostra de plasma e os controles. Um maior grau de diferença no nível de metilação dos tecidos não malignos e malignos também está associado com maiores diferenças de densidades de metilação entre a amostra de plasma e os controles. Em outra modalidade, grupos de referência diferente são escolhidos para cobaias de faixas etárias diferentes.
[00289] Em outra modalidade, a média e o SD das densidades de metilação dos quatro sujeitos de controle foram calculados para cada 1MB de bin. Então para bins correspondentes, calculou-se a diferença entre as densidades de metilação do paciente HCC e o valor médio dos sujeitos de controle. Em uma modalidade, essa diferença foi então dividida pelo SD do bin correspondente para determinar a pontuação z. Em outras palavras, a pontuação z representa a diferença de densidades de metilação entre as amostras do plasma de teste e controle expresso como um número de SDs da média dos sujeitos de controle. Uma pontuação z >3 de um bin indica que o DNA do paciente HCC plasma é mais hipermetilado do que os sujeitos de controle por mais de 3 SDs em que o bin considerando uma pontuação z de <3 num bin indica que o DNA do plasma do paciente HCC é mais hipometilado do que os sujeitos de controle por mais de 3 SDs naquele bin.
[00290] As FIGS. 25A e 25B mostram pontuações z das densidades de metilação do DNA do plasma para amostras de plasma pré-operatório (representação gráfica 2500) e pós-operatório (representação gráfica 2550) do paciente com HCC usando dados do metiloma do plasma dos quatro sujeitos de controle saudáveis como referência para o cromossomo 1. Cada ponto representa o resultado de um bin de 1 Mb. Os pontos pretos representam os bins com uma pontuação z entre -3 e 3. Pontos vermelhos representam bins com pontuação z <-3.
[00291] A FIG. 26A é uma tabela 2600 que mostra dados para pontuações z para plasma pré-operatório e pós-operatório. A maioria dos bins no cromossoma 1 (80,9%) da amostra de plasma pré-operatório tinha uma pontuação z de <-3 indicando que o DNA do plasma pré-operatório do paciente HCC foi significativamente mais hipometilado do que os sujeitos de controle. Pelo contrário, o número de pontos vermelhos diminuiu substancialmente na amostra do plasma pós-operatório (8,3% dos bins no cromossomo 1) sugerindo que a maior parte do DNA do tumor tinha sido removida da circulação devido a resseção cirúrgica da fonte de DNA do tumor em circulação.
[00292] A FIG. 26B é uma representação gráfica Circos 2620 que mostra pontuações z das densidades de metilação do DNA do plasma para amostras de plasma pré-operatório e pós-operatório do paciente com HCC usando quatro sujeitos de controle saudáveis como referência para bins de 1Mb de todos os autossomos. O anel mais externo mostra os ideogramas dos autossomos humanos. O anel médio mostra os dados para a amostra do plasma pré-operatório. O anel mais interno mostra que os dados para a amostra do plasma no pós-operatório. Cada ponto representa o resultado de um bin de 1 Mb. Os pontos pretos representam os bins com pontuações z entre -3 e 3. Os pontos vermelhos representam bins com pontuações z < -3. Os pontos verdes representam bins com pontuações z >3.
[00293] A FIG. 26C é uma tabela 2640 que mostra a distribuição de pontuações z de recipientes de 1Mb para o genoma inteiro em amostras do plasma pré-operatório e pós-operatório do paciente com HCC. Os resultados indicam que o DNA do plasma pré-operatório do paciente HCC era mais hipometilado do que os controles para a maioria das regiões (85,2% dos bins 1MB) no genoma inteiro. Pelo contrário, a maioria das regiões (93,5% dos bins 1MB) da amostra do plasma no pós-operatório não mostrou significante a hipermetilação ou hipometilação comparada com controles. Estes dados indicam que grande parte do DNA de tumor, hipometilado principalmente na natureza para este HCC, já não estava presente na amostra de plasma no pós- operatório.
[00294] Em uma modalidade, o número, porcentagem ou proporção de bins com as pontuações z < -3 podem ser usados para indicar se um câncer está presente. Por exemplo, como mostrado na tabela 2640, 2330 dos 2734 bins analisados (85,2%) mostraram pontuações z < -3 no plasma pré- operatório enquanto somente 171 dos 2734 bins analisados (6,3%) mostraram pontuações z < -3 no plasma pós-operatório. Os dados indicaram que o DNA do tumor carrega no plasma pré-operatório era muito maior do que no plasma no pós-operatório.
[00295] Os valores limites do número de bins podem ser determinados utilizando métodos estatísticos. Por exemplo, cerca de 0,15% dos bins esperariam ter uma pontuação z de < -3 baseado em uma distribuição normal. Portanto, o número limite de compartimentos pode ser 0,15% do número total de caixas sendo analisados. Em outras palavras, se uma amostra do plasma de um indivíduo não gestante mostra mais de 0.15% de bins com uma pontuação z < -3, existe uma fonte de hipometilada de DNA no plasma, ou seja câncer. Por exemplo, 0,15% dos escaninhos 2734 1mb que analisamos neste exemplo é cerca de 4 escaninhos. Usando este valor como um corte, ambas as amostras do plasma pré-operatório e pós-operatório continham DNA do tumor derivado do hipometilado, embora a quantidade seja muito mais na amostra do plasma pré-operatório que a amostra de plasma no pós-operatório. Para os quatro sujeitos de controle saudáveis, nenhuns dos bins mostraram significantes a hipermetilação ou hipometilação. Outros valores de corte (por exemplo, 1.1%) podem ser usados e podem variar dependendo da exigência do ensaio a ser usado. Como outros exemplos, o percentual de corte pode variar de acordo com a distribuição estatística, bem como a sensibilidade desejada e uma especificidade aceitável.
[00296] Em outra modalidade, o número de corte pode ser determinado por análise de curva do receptor operador característico (ROC), analisando um número de pacientes com câncer e indivíduos sem câncer. Para validar ainda a especificidade desta abordagem, foi analisada uma amostra de plasma de um paciente que procura consulta médica para uma condição não maligna (C06). 1.1% dos bins tinha uma pontuação z de <-3. Em uma modalidade, limites diferentes podem ser usados para classificar os diferentes níveis de status da doença. Um limite de porcentagem mais baixo pode ser usado para diferenciar o estado saudável das condições benignas e um maior limite da porcentagem para diferenciar condições benignas das malignidades.
[00297] O desempenho diagnóstico para análise de hipometilação do plasma utilizando sequenciamento massivamente paralelo parece ser superior do que o obtido usando a reação em cadeia da polimerase (PCR) baseada na amplificação das classes específicas de elementos repetitivos, por exemplo, tempo do elemento nuclear intercalado 1 (linha-1) (P Tangkijvanich et al. 2007 Clin Chim Acta; 379:127-133). Uma possível explicação para essa observação é que enquanto a hipometilação é generalizada no genoma de tumor, tem algum grau de heterogeneidade de uma região genômica para a próxima.
[00298] Na verdade, observamos que as densidades de metilação de plasma médio dos sujeitos de referência variaram em todo o genoma (Fig. 56). Cada ponto vermelho na Fig. 56 mostra a densidade média de metilação de um 1mb bin entre 32 indivíduos saudáveis. O gráfico mostra todos os bins de 1MB analisados através do genoma. O número dentro de cada caixa representa o número de cromossomos. Observamos que as densidades de metilação média variaram de bin para bin.
[00299] Um ensaio simples baseados em PCR não seria capaz de ter em conta essa heterogeneidade de região para região em seu algoritmo de diagnóstico. Tal heterogeneidade seria ampliar a gama de densidades de metilação observada entre os indivíduos saudáveis. Uma maior amplitude da redução da densidade de metilação então seria necessária para obter um exemplo a ser considerado como apresentando hipometilação. Isso resultaria em uma redução da sensibilidade do teste.
[00300] Em contraste, uma abordagem baseada no sequenciamento massivamente paralelo divide o genoma em bins 1 Mb (ou outro tamanho bin) e mede as densidades de metilação para tais caixas individualmente. Esta abordagem reduz o impacto das variações de densidades de metilação de linha de base através de diferentes regiões genômicas como cada região é comparada entre uma amostra de ensaio e os controles. Com efeito, dentro do mesmo bin, a variação inter-individual entre os 32 controles saudáveis foi relativamente pequena. 95% dos bins tinha um coeficiente de variação (CV) entre os 32 controles saudáveis de < 1,8%. Ainda, para aumentar ainda a sensibilidade para a detecção de câncer associado por hipometilação, a comparação pode ser realizada através de várias regiões genômicas. A sensibilidade será reforçada através do teste de múltiplas regiões genômicas porque seria proteger contra o efeito da variação biológica quando a amostra de câncer acontece para não demonstrar hipometilação para uma determinada região quando uma região é testada.
[00301] A abordagem de comparar as densidades de metilação das regiões genômicas equivalentes entre amostras de controles e testes (por exemplo, testando cada região genômica separadamente e então possivelmente penteando tais resultados) e realizar esta comparação para várias regiões genômicas tem uma maior taxa de sinal-ruído para a detecção de hipometilação associada com câncer. Esta abordagem de sequenciamento massivamente paralela é mostrada por meio de ilustração. Outras metodologias que poderiam determinar as densidades de metilação das várias regiões genômicas e permitir a comparação das densidades de metilação das regiões correspondentes entre as amostras de controles e de testes poderiam ser previstas para obter efeito semelhante. Por exemplo, hibridização de sondas ou sondas moleculares de inversão que podem direcionar as moléculas de DNA do plasma proveniente das regiões específicas do genoma, bem como determinar um nível de metilação da região poderiam ser projetadas para obter o efeito desejado.
[00302] Em outra modalidade, a soma das pontuações z para todos os bins podem ser usados para determinar se o câncer está presente ou usado para o acompanhamento das alterações das séries do nível de metilação do DNA de plasma. Devido ao DNA do tumor de natureza hipometilada geral, a soma das pontuações z seria menor no plasma coletado de um indivíduo com câncer do que os controles saudáveis. A soma das pontuações z para a amostra do plasma pré e pós-operatório do paciente HCC foram -49843.8 e - 3132.13, respectivamente.
[00303] Em outras modalidades, outros métodos podem ser usados para o levantamento do nível de metilação de DNA do plasma. Por exemplo, a proporção dos resíduos de citosina metilada todo o conteúdo total de resíduos de citosina pode ser determinado usando espectrometria de massa (ML Chen et al. 2013 Clin Chem; 59: 824-832) ou sequenciamento massivamente paralelo. No entanto, como a maioria dos resíduos de citosina não estão no contexto do dinucleotídeo CpG, a proporção de citosina metilada entre resíduos de citosina total seria relativamente pequena em comparação com os níveis de metilação estimados no contexto de dinucleotídeos CpG. Determinamos o nível de metilação das amostras de tecido e plasma obtidas a partir do paciente HCC, bem como as quatro amostras de plasma obtidas dos controles saudáveis. Os níveis de metilação foram medidos no contexto das CpGs, quaisquer citosinas, em CHG e contextos CHH usando os dados de sequenciamento massivamente paralelo de todo o genoma. H refere-se os resíduos de adenina, timina ou citosina.
[00304] A FIG. 26D é uma tabela 2660 que mostra os níveis de metilação do tecido tumoral e amostra do plasma pré-operatório sobreposta a algumas amostras do plasma de controle ao usar contextos de CHH e CHG. Os níveis de metilação da amostra do plasma de tecidos e pré-operatórios do tumor foram consistentemente mais baixos quando comparada com o creme leucocitário, tecido não tumoral do fígado, amostra de plasma no pós- operatório e amostras do plasma de controle saudável em ambos entre os CpGs e citosinas não especificados. No entanto, os dados que baseiam os CpGs metilados, ou seja, densidades de metilação, mostraram uma gama dinâmica maior do que os dados baseados nas citosinas metiladas.
[00305] Em outras modalidades, o estado de metilação do DNA do plasma pode ser determinado por métodos utilizando anticorpos contra citosina metilada, por exemplo, imunoprecipitação de DNA metilado (MeDIP). No entanto, a precisão desses métodos são esperados para ser inferior aos métodos baseados no sequenciamento devido a variabilidade na ligação do anticorpo. Em outra modalidade, o nível de 5-hidroximetilcitosina no DNA do plasma pode ser determinado. A este respeito, uma redução no nível de 5-hidroximetilcitosina foi encontrada para ser uma característica epigenética de determinado câncer, por exemplo, melanoma (CG Lian, et al. 2012 Cell; 150: 1135-1146).
[00306] Além do HCC, também investigamos se esta abordagem poderia ser aplicada a outros tipos de cânceres. Analisamos as amostras de plasma de 2 pacientes com adenocarcinoma do pulmão (CL1 e CL2), 2 pacientes com carcinoma de nasofaringe (NPC1 e NPC2), 2 pacientes com câncer colorretal (CRC1 e CRC2), 1 paciente com tumor neuroendócrino metastático (NE1) e 1 paciente com sarcoma metastático músculo liso (SMS1). O DNA do plasma destes sujeitos foi convertido por bissulfito e sequenciado usando a plataforma Illumina HiSeq2000 para 50 bp em uma extremidade. Os quatro temas de controle saudáveis acima mencionados foram usados como um grupo de referência para a análise destes 8 pacientes. 50 bp das leituras de sequência em uma extremidade foram usados. O genoma inteiro foi dividido em bins de 1 Mb. A média e o SD de densidade de metilação foram calculadas para cada bin usando os dados do grupo de referência. Então os resultados dos 8 pacientes com câncer foram expressos como pontuações z, que representam o número de SDs da média do grupo de referência. Um valor positivo indica que a densidade de metilação do caso teste é menor do que a média do grupo de referência e vice-versa. O número de leituras da sequência e a profundidade de sequenciamento alcançado pela amostra são mostrados na tabela 2780 da FIG. 271.
[00307] A FIG. 27A-H mostra gráficos Circos da densidade de metilação de 8 pacientes com câncer, de acordo com as modalidades da presente invenção. Cada ponto representa o resultado de um bin de 1 Mb. Os pontos pretos representam os bins com pontuações z entre -3 e 3. Os pontos vermelhos representam bins com pontuações z < -3. Os pontos verdes representam bins com pontuações z >3. O intervalo entre duas linhas consecutivas representa uma diferença de pontuação z de 20.
[00308] A hipometilação significativa foi observada em várias regiões entre os genomas para pacientes com a maioria dos tipos de câncer, incluindo câncer de pulmão, carcinoma de nasofaringe, câncer colorretal e tumor neuroendócrino metastático. Curiosamente, além da hipometilação, hipermetilação significativa foi observada em várias regiões através do genoma no caso com sarcoma metastático do músculo liso. A origem embrionária do sarcoma do músculo liso é a mesoderme, considerando a origem embrionária dos outros tipos de cânceres nos 7 pacientes restantes é a ectoderme. Portanto, é possível que o padrão de metilação do DNA de sarcoma pode ser diferente do carcinoma.
[00309] Como pode ser visto a partir deste caso, o padrão de metilação do plasma de DNA também podem ser úteis para diferenciar os diferentes tipos de câncer, que neste exemplo é uma diferenciação de carcinoma e sarcoma. Esses dados também sugerem que a abordagem poderia ser usada para detectar uma hipermetilação aberrante associada com a malignidade. Para todos estes 8 casos, amostras do plasma só estavam disponíveis e não foi analisado o tecido do tumor . Isto mostrou que, mesmo sem o perfil de metilação prévia ou níveis de metilação do tecido do tumor, DNA derivado do tumor pode ser facilmente detectado no plasma usando os métodos descritos.
[00310] A FIG. 27J é uma tabela 2790 é uma tabela que mostra a distribuição de pontuações z dos recipientes de 1MB para o genoma inteiro no plasma de pacientes com malignidades diferentes. As porcentagens de bins com pontuação z <-3, -3 a 3 e >3 são mostradas para cada caso. Mais de 5% dos bins tinham uma pontuação z de <-3 para todos os casos. Portanto, se usarmos um corte de 5% dos bins sendo significativamente hipometilados para classificar uma amostra sendo positivo para câncer, então todos esses casos seriam classificados como positivos para câncer. Nossos resultados mostram que a hipometilação é provável que seja um fenômeno geral para diferentes tipos de cânceres e a análise de metiloma do plasma poderia ser útil para detectar diferentes tipos de cânceres. D. Método
[00311] A FIG. 28 é um fluxograma do método 2800 para analisar uma amostra biológica de um organismo para determinar a classificação do nível de câncer, de acordo com as modalidades da presente invenção. A amostra biológica inclui o DNA proveniente das células normais e potencialmente pode incluir o DNA das células associadas com câncer. Pelo menos um pouco do DNA pode ser livre das células na amostra biológica.
[00312] No bloco 2810, várias moléculas de DNA são analisadas a partir da amostra biológica. A análise de uma molécula de DNA pode incluir a determinação de uma localização da molécula de DNA no genoma do organismo e determinar se a molécula de DNA é metilada em um ou mais sítios. A análise pode ser realizada ao receber as leituras da sequência de um sequenciamento de reconhecimento de metilação, e, portanto, a análise pode ser realizada apenas em dados anteriormente obtidos a partir do DNA. Em outras modalidades, a análise pode incluir o sequenciamento real ou outras medidas ativas de obtenção dos dados.
[00313] No bloco 2820, um respectivo número de moléculas de DNA que são metilados no sítio é determinado para cada uma de uma pluralidade dos sítios. Em uma modalidade, os sítios são sítios de CpG, e podem ser apenas determinados sítio de CpG, como selecionado usando um ou mais critérios mencionados neste documento. O número de moléculas de DNA que são metilados é equivalente a determinar o número que são não metilados, uma vez que a normalização é executada usando um número total das moléculas de DNA analisadas em um sítio específico, por exemplo, um número total de leituras de sequência. Por exemplo, um aumento da densidade de metilação de CpG de uma região é equivalente a uma diminuição da densidade de CpGs não metilado da mesma região.
[00314] No bloco 2830, um primeiro nível de metilação é calculado com base nos respectivos números de moléculas de DNA metilados na pluralidade dos sítios. O primeiro nível de metilação pode corresponder a uma densidade de metilação que é determinada com base no número das moléculas de DNA correspondente a pluralidade de sítios. Os sítios podem corresponder a uma pluralidade de loci ou apenas um locus.
[00315] No bloco 2840, o primeiro nível de metilação é comparado com um primeiro valor de corte. O primeiro valor de corte pode ser de um nível de metilação da referência ou estar relacionado a um nível de metilação de referência (por exemplo, uma distância especificada a partir de um nível normal). O nível de metilação de referência pode ser determinado das amostras dos indivíduos sem câncer ou de loci ou o organismo que são conhecidos por não estarem associados a um câncer do organismo. O primeiro valor de corte pode ser estabelecido a partir de um nível de metilação da referência determinada a partir de uma amostra biológica anterior do organismo obtida antes da amostra biológica sendo testada.
[00316] Em uma modalidade, o primeiro valor de corte é uma distância especificada (por exemplo, um determinado número de desvios-padrão) de um nível de metilação da referência estabelecida a partir de uma amostra biológica obtida a partir de um organismo saudável. A comparação pode ser realizada pela determinação da diferença entre o primeiro nível de metilação e um nível de metilação da referência, e então comparando a diferença para um limite correspondente ao valor de primeiro corte (por exemplo, para determinar se o nível de metilação é estatisticamente diferente do que o nível de metilação da referência).
[00317] No bloco 2850, a classificação de um nível de câncer é determinada com base na comparação. Exemplos de um nível de câncer inclui o sujeito que tem câncer ou uma condição pré-maligna ou um aumento da probabilidade de desenvolver câncer. Em uma modalidade, o primeiro valor de corte pode ser determinado a partir de uma amostra anteriormente obtida do sujeito (por exemplo, um nível de metilação de referência pode ser determinado a partir da amostra anterior).
[00318] Em algumas modalidades, o primeiro nível de metilação pode corresponder a um número de regiões cujos níveis de metilação excederem um valor limite. Por exemplo, uma pluralidade das regiões do genoma do organismo pode ser identificada. As regiões podem ser identificadas usando critérios mencionados neste documento, por exemplo, de certos comprimentos ou certo número de sítios. Um ou mais sítios (por exemplo, sítes de CpG) podem ser identificados dentro de cada uma das regiões. Um nível de metilação da região pode ser calculado para cada região. O primeiro nível de metilação é para uma primeira região. Cada um dos níveis de metilação da região é comparado com um valor de corte respectivos da região, que pode ser o mesmo ou variar entre regiões. O valor de corte da região para a primeira região é o primeiro valor de corte. Os valores de corte da região respectivos podem ser uma quantidade especificada (por exemplo, 0,5) do nível de metilação da referência, assim, contando apenas as regiões que têm uma diferença significativa de uma referência, que pode ser determinada dos indivíduos não cancerosos.
[00319] O primeiro número de regiões cujo nível de metilação da região excede o valor de corte da região respectivo pode ser determinado e em comparação com um valor limite para determinar a classificação. Em uma implementação, o valor limite é uma porcentagem. Comparando o primeiro número para um valor limite pode incluir a divisão do primeiro número das regiões, por um segundo número de regiões (por exemplo, todas as regiões) antes de comparar o valor limite, por exemplo, como parte de um processo de normalização.
[00320] Como descrito acima, uma concentração fracionária do DNA do tumor na amostra biológica pode ser usado para calcular o primeiro valor de corte. A concentração fracionária pode simplesmente ser estimada para ser superior um valor mínimo, considerando que uma amostra com uma concentração fracional inferior ao valor mínimo pode ser sinalizada, por exemplo, como não sendo adequada para análise. O valor mínimo pode ser determinado com base em uma diferença esperada em níveis de metilação para um tumor em relação a um nível de metilação de referência. Por exemplo, se a diferença for 0,5 (por exemplo, como usado como um valor de corte), em seguida, uma certa concentração de tumor seria necessária para ser alta o suficiente para ver essa diferença.
[00321] As técnicas específicas do método 1300 podem ser aplicadas para o método 2800. No método 1300, as variações do número de cópia podem ser determinadas por um tumor (por exemplo, onde a primeira região cromossômica de um tumor pode ser testada para ter uma mudança de número de cópia em relação a uma segunda região cromossômica do tumor). Assim, o método 1300 pode presumir que um tumor existe. No método 2800, uma amostra pode ser testada para saber se existe uma indicação de qualquer tumor existente, independentemente de quaisquer características de número de cópia. Algumas técnicas dos dois métodos podem ser similares. No entanto, os valores de corte e parâmetros de metilação (por exemplo, níveis de metilação normalizados) para o método 2800 podem detectar uma diferença estatística de um nível de metilação de referência para o DNA não canceroso em oposição a uma diferença de um nível de metilação de referência para uma mistura do DNA canceroso e DNA não canceroso com algumas regiões, possivelmente tendo variações de número de cópia. Assim, os valores de referência para o método 2800 podem ser determinados a partir de amostras sem câncer, tais como dos organismos sem câncer ou de tecido não canceroso do mesmo paciente (por exemplo, plasma colhido anteriormente ou amostras adquiridas simultaneamente que são conhecidas por não ter câncer, que podem ser determinadas do DNA celular). E. Previsão da mínima concentração fracionária do DNA do tumor para ser detectado utilizando análise de metilação do DNA do plasma
[00322] Uma maneira de medir a sensibilidade da abordagem para detectar o câncer usando o nível de metilação do DNA do plasma está relacionada com o tumor fracionário mínimo derivado da concentração do DNA que é necessária para revelar uma mudança no nível de metilação do DNA do plasma quando comparados com os controles. A sensibilidade do teste também é dependente da extensão da diferença da metilação do DNA entre o tecido do tumor e nível de metilação do DNA plasmático da linha de base no DNA de controles saudáveis ou células sanguíneas. As células do sangue são a fonte predominante de DNA no plasma de indivíduos saudáveis. Quanto maior a diferença, mais fácil os pacientes com câncer podem ser objetos de discriminação de indivíduos não cancerosos e seria refletido como um limite inferior de detecção de tumor derivado do plasma e uma maior sensibilidade clínica na detecção de pacientes com câncer. Além disso, as variações na metilação do DNA plasmático nos indivíduos saudáveis ou em indivíduos com diferentes idades (G Hannum et al. 2013 Mol Cell; 49: 359-367) afetaria também a sensibilidade de detectar as alterações de metilação associadas com a presença de um câncer. Uma variação menor na metilação do DNA plasmático nos indivíduos saudáveis faria a detecção da mudança causada pela presença de uma pequena quantidade de DNA derivado de câncer mais fácil.
[00323] A FIG. 29A é uma representação gráfica 2900 que mostra a distribuição das densidades de metilação nos sujeitos de referência, presumindo que esta distribuição segue uma distribuição normal. Esta análise baseia-se em cada amostra de plasma, fornecendo apenas um valor de densidade de metilação, por exemplo, a densidade de metilação de autossomos de todos ou de um determinado cromossomo. Ele ilustra como a especificidade da análise seria afetada. Em uma modalidade, um corte de 3 SDs abaixo da média da densidade de metilação do DNA dos indivíduos de referência é usada para determinar se uma amostra testada é significativamente mais hipometilada do que amostras dos sujeitos de referência. Quando esse limite é usado, espera-se que aproximadamente 0,15% dos sujeitos não cancerosos teria resultados falso-positivos de ser classificado como tendo câncer, resultando em uma especificidade de 99,85%.
[00324] A FIG. 29B é um gráfico 2950 mostrando a distribuição das densidades de metilação em sujeitos de referência e pacientes com câncer. O valor limite é de 3 SDs abaixo da média das densidades de metilação dos indivíduos de referência. Se a média das densidades de metilação dos pacientes com câncer é 2 SDs abaixo do valor de corte (ou seja, 5 SDs abaixo da média dos sujeitos de referência), 97,5% dos sujeitos com câncer seria de esperar para ter uma densidade de metilação abaixo do valor de corte. Em outras palavras, a sensibilidade esperada seria 97,5% se um valor de densidade de metilação é fornecido para cada sujeito, por exemplo, quando a densidade total de metilação do genoma inteiro, de todos os autossomos ou um cromossomo particular é analisada. A diferença entre as densidades de metilação média das duas populações é afetada por dois fatores, ou seja, o grau de diferença no nível de metilação entre os tecidos cancerosos e não cancerosos e a concentração fracionária de DNA derivado do tumor da amostra de plasma. Quanto maior os valores desses dois parâmetros, maior a diferença no valor das densidades de metilação seriam destas duas populações. Além disso, o baixo é o SD das distribuições das densidades de metilação das duas populações, o menor é a sobreposição das distribuições das densidades de metilação das duas populações.
[00325] Aqui usamos um exemplo hipotético para ilustrar este conceito. Vamos supor que a densidade de metilação do tecido do tumor é aproximadamente 0,45 e que o DNA do plasma dos indivíduos saudáveis é aproximadamente 0,7. Estas assumiram valores que são semelhantes aos obtidos de nosso paciente HCC, onde a densidade total de metilação dos autossomos é 42,9% e a densidade média de metilação de autossomos para as amostras de plasma de controles saudáveis foi 71,6%. Supondo que o CV de medir a densidade de metilação do DNA de plasma para o genoma inteiro é 1%, o valor de corte seria 0,7 x (100%-% 3 x 1) = 0.679. Para atingir uma sensibilidade de 97,5%, a densidade média de metilação do DNA do plasma para pacientes com câncer precisa ser aproximadamente 0.679 - 0,7 x (2 x 1%) = 0.665. Considere que f represente a concentração fracionária de DNA derivado do tumor da amostra de plasma. Em seguida, f pode ser calculado como (0.7 - 0,45) x f = 0,7 - 0.665. Portanto, f é aproximadamente 14%. Este cálculo estima-se que a concentração fracionária mínima que pode ser detectada no plasma é de 14% a fim de alcançar uma sensibilidade diagnóstica de 97,5% se a densidade de metilação total do genoma inteiro é usada como o parâmetro de diagnóstico.
[00326] Em seguida realizamos esta análise sobre os dados obtidos do paciente HCC. Para esta ilustração, somente uma medição da densidade de metilação com base no valor estimado de todos os autossomos foi feita para cada amostra. A densidade média de metilação foi 71,6% entre as amostras de plasma obtidas a partir de indivíduos saudáveis. O SD de densidades de metilação destas quatro amostras foi 0.631%. Portanto, o valor de corte para a densidade de metilação de plasma precisa ser 71,6% - 3 x 0.631% = 69,7% para atingir uma pontuação z < -3 e uma especificidade de 99,85%. Para atingir uma sensibilidade de 97,5%, a densidade de metilação do plasma média dos pacientes com câncer precisa ser 2 SDs abaixo do corte, ou seja, 68,4%. Desde que a densidade de metilação do tecido do tumor foi de 42,9% e usando a fórmula: P=BKG x(1-f)+TUM xf, f precisaria ser pelo menos 11.1%.
[00327] Em outra modalidade, as densidades de metilação das diferentes regiões genômicas podem ser analisadas separadamente, por exemplo, como mostrado nas FIGS. 25A ou 26B. Em outras palavras, várias medições do nível de metilação foram feitas para cada amostra. Como mostrado abaixo, a hipometilação significativa poderia ser detectada em muito menor concentração de DNA do tumor fracionária no plasma e, portanto, o desempenho diagnóstico da análise de metilação de DNA do plasma para detecção de câncer seria reforçada. O número de regiões genômicas mostrando um desvio significativo em densidades de metilação da população de referência pode ser contado. Então o número das regiões genômicas podem ser comparados com um valor de corte para determinar se existe uma hipometilação global significativa do DNA do plasma em toda a população das regiões genômicas pesquisadas, por exemplo, os bins de 1 Mb do genoma inteiro. O valor limite pode ser estabelecido pela análise de um grupo de sujeitos da referência sem um câncer ou matematicamente derivado, por exemplo, de acordo com a função de distribuição normal.
[00328] A FIG. 30 é uma representação gráfica 3000 que mostra a distribuição das densidades de metilação do DNA do plasma de indivíduos saudáveis e pacientes com câncer. A densidade de metilação de cada bin de 1MB é comparada com os valores correspondentes do grupo de referência. A porcentagem de bins mostrando hipometilação significativa (3 SDs abaixo da média do grupo de referência) foi determinada. Um corte de 10%, sendo significativamente hipometilado foi usado para determinar se o tumor derivado do DNA está presente na amostra de plasma. Outros valores de corte como 5%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80% ou 90% também podem ser usados de acordo com a sensibilidade desejada e especificidade do teste.
[00329] Por exemplo, para classificar uma amostra como contendo DNA derivado de tumor, podemos usar 10% dos bind e 1Mb mostrando hipometilação significativa (pontuação z < -3) como um limite. Se existir mais de 10% dos bins sendo significativamente mais hipometilados do que o grupo de referência, em seguida, a amostra é classificada como positivo para o teste de câncer. Para cada bin de 1 Mb, um corte de 3 SDs abaixo da densidade média de metilação do grupo de referência é usado para definir uma amostra como significativamente mais hipometilada. Para cada um dos bins de 1Mb, se a densidade de metilação do DNA do plasma média dos pacientes com câncer é 1,72 SDs menor do que as densidades de metilação de DNA do plasma média dos indivíduos de referência, então existe uma chance de 10% que o valor de densidade de metilação de qualquer bin particular de um paciente com câncer seria menor do que o corte (ou seja, pontuação z < - 3) e fornece um resultado positivo. Então, se olharmos para todos os bins de 1 Mb para o genoma inteiro, então aproximadamente 10% dos bins esperariam para mostrar resultados positivos de ter densidades de metilação significativamente mais baixas (ou seja, pontuação z < -3). Supondo que a densidade de metilação total do DNA plasma dos indivíduos saudáveis é aproximadamente 0,7 e o coeficiente de variação (CV) de medir a densidade de metilação do DNA do plasma para cada bin de 1MB é 1%, a densidade média de metilação do DNA do plasma dos pacientes com câncer precisa ser 0,7 x (100% - % 1,72 x 1) = 0.68796. Considere f seja a concentração fracionária do DNA derivado do tumor no plasma a fim de alcançar esta densidade média de metilação do DNA de plasma. Supondo que a densidade de metilação do tecido do tumor é 0.45, então f pode ser calculado usando a equação.
Figure img0018
onde Mpref representa a densidade média de metilação do DNA do plasma em indivíduos de referência; M tumor representa a densidade de metilação do tecido do tumor no paciente com câncer; e M pcancer representa a densidade média de metilação do DNA do plasma em pacientes com câncer.
[00330] Usando esta equação, (0,7-0,45) x f = 0,7 - 0.68796. Assim, a concentração fracionária mínima pode ser detectada usando esta abordagem poderia ser deduzida como 4,8%. A sensibilidade pode ser reforçada, diminuindo o percentual de corte dos bins, sendo significativamente mais hipometilados, por exemplo, de 10% para 5%.
[00331] Conforme mostrado no exemplo acima, a sensibilidade deste método é determinada pelo grau de diferença no nível de metilação entre os tecidos cancerosos e não cancerosos, por exemplo, as células do sangue. Em uma modalidade, são selecionadas somente as regiões cromossômicas que mostram uma grande diferença em densidades de metilação entre o DNA do plasma dos indivíduos não cancerosos e o tecido do tumor. Em uma modalidade, as regiões apenas com uma diferença de densidade de metilação > 0,5 são selecionadas. Em outras modalidades, uma diferença de 0.4, 0.6, 0.7, 0.8 ou 0,9 podem ser usadas para selecionar as regiões adequadas. Em outras modalidades, o tamanho físico das regiões genômicas não é fixo. Em vez disso, as regiões genômicas são definidas, por exemplo, com base em uma profundidade de leitura fixa ou um número fixo de sítios CpG. Os níveis de metilação em múltiplo destas regiões genômicas são avaliados para cada amostra.
[00332] A FIG. 31 é um gráfico 3100 que mostra a distribuição das diferenças nas densidades de metilação entre a média do DNA do plasma de indivíduos saudáveis e o tecido tumoral do paciente com HCC. Um valor positivo significa que a densidade de metilação é mais elevada no DNA do plasma dos indivíduos saudáveis e um valor negativo significa que a densidade de metilação é maior no tecido do tumor.
[00333] Em uma modalidade, os bins com a maior diferença entre a densidade de metilação dos tecidos não cancerosos e cancerosos podem ser selecionados, por exemplo, aqueles com uma diferença de >0.5, independentemente se o tumor é hipometilado ou hipermetilado para esses bins. O limite de detecção da concentração fracionária do DNA derivado de tumor no plasma pode ser diminuído pela incidência sobre essas posições por causa das maiores diferenças entre as distribuições dos níveis de metilação do DNA no plasma entre os sujeitos cancerosos e não cancerosos dados a mesma concentração fracionária do DNA derivado do tumor do plasma. Por exemplo, se apenas os bins com diferenças > 0,5 são usados e um corte de 10% dos bins sendo significativamente mais hipometilados é adotado para determinar se um indivíduo testado tem um câncer, a concentração fracionária mínima (f) do DNA derivado do tumor detectado pode ser calculada usando a seguinte equação:
Figure img0019
onde Ma representa a densidade média de metilação do DNA do plasma em indivíduos da referência; M tumor representa a densidade de metilação do tecido do tumor no paciente com câncer; e MP representa a densidade média de metilação do DNA do plasma em pacientes com câncer.
[00334] Enquanto a diferença de densidade de metilação entre o plasma dos sujeitos da referência e dos tecidos de tumor é de pelo menos 0,5. Então, temos 0,5 x f = 0,7 - 0.68796 e f = 2,4%. Portanto, concentrando-se nos bins com uma maior diferença na densidade de metilação entre os tecidos cancerosos e não cancerosos, o limite inferior do DNA derivado do tumor fracionário pode ser reduzido de 4,8% para 2,4%. As informações sobre quais os bins mostrariam maiores graus de metilação das diferenças entre os tecidos cancerosos e não cancerosos, por exemplo, as células do sangue, podem ser determinadas a partir de tecidos de tumor do mesmo órgão ou mesmo tipo histológico, provenientes de outros indivíduos.
[00335] Em outra modalidade, um parâmetro pode ser derivado da densidade de metilação do DNA do plasma de todos os bins e tendo em conta a diferença de densidades de metilação entre os tecidos cancerosos e nãoa cancerosos. Os bins com maiores diferenças podem ser dado um peso mais pesado. Em uma modalidade, a diferença de densidade de metilação entre os tecidos cancerosos e não cancerosos de cada bin pode ser usada diretamente como o peso se o bin particular estiver no cálculo do parâmetro final.
[00336] Em outra modalidade, diferentes tipos de cânceres podem ter diferentes padrões de metilação do tecido do tumor. Um perfil de peso específico do câncer pode ser derivado do grau de metilação do tipo específico de câncer.
[00337] Em outra modalidade, a relação do inter-bin da densidade de metilação pode ser determinada em indivíduos com e sem câncer. Na Figura 8, podemos observar que, em um pequeno número de bins, os tecidos de tumor foram mais metilados do que o DNA do plasma nos indivíduos de referência. Assim, os bins com valores mais extremos de diferença, por exemplo, diferença >0.5 e diferença <0, podem ser selecionadas. A relação entre a densidade de metilação desses bins então pode ser usada para indicar se o indivíduo testado tem câncer. Em outras modalidades, a diferença e quociente da densidade de metilação de diferentes bins podem ser utilizados como parâmetros para indicar a relação de inter-bin.
[00338] Foi avaliada ainda a sensibilidade de detecção da aproximação para detectar ou avaliar o tumor utilizando as densidades de metilação das múltiplas regiões genômicas como ilustrado pelos dados obtidos a partir do paciente HCC. Primeiro, misturamos as leituras do plasma pré-operatório com aqueles obtidos a partir das amostras do plasma dos controles saudáveis para simular as amostras do plasma que continha a concentração de DNA do tumor fracionária que variou entre 20% e 0,5%. Então marcamos a porcentagem dos bins de 1 Mb (de 2.734 bins no genoma inteiro) com densidades de metilação equivalentes a pontuação z < -3. Quando a concentração de DNA do tumor fracionária no plasma foi de 20%, 80,0% dos bins mostrou hipometilação significativa. Os dados correspondentes para a concentração de DNA do tumor fracionária no plasma de 10%, 5%, 2%, 1% e 0,5% foram 67,6%, 49,7%, 18,9%, 3,8% e 0,77% dos bins mostrando hipometilação, respectivamente. Desde que o limite teórico do número de bins mostrando pontuação z < -3 nas amostras de controle é de 0,15%, nossos dados mostram que existiam ainda mais bins (0,77%) além do limite teórico de corte mesmo quando a concentração fracionária do tumor foi de apenas 0,5%.
[00339] A FIG. 32A é uma tabela 3200 que mostra o efeito da redução da profundidade de sequenciamento quando a amostra de plasma continha 5% ou 2% de DNA tumoral. Uma alta proporção de bins (> 0,15%) mostra hipometilação significativa podia ainda ser detectada quando a profundidade média do sequenciamento era apenas 0.022 vezes o genoma haploide.
[00340] A FIG. 32B é um gráfico 3250 que mostra as densidades de metilação de elementos de repetição e de regiões de não repetição no plasma de quatro sujeitos de controle saudáveis, amostras de creme leucocitário, tecido normal do fígado, tecido tumoral, plasma pré-operatório e plasma pós- operatório de paciente com HCC. Pode-se observar que os elementos de repetição foram mais metilados (densidade de metilação mais elevada) do que as regiões não repetidas nos tecidos não cancerosos e cancerosos. No entanto, a diferença de metilação entre os elementos de repetição e as regiões não repetidas era maior nos tecidos não cancerosos e o DNA do plasma dos indivíduos saudáveis quando comparados com os tecidos de tumor.
[00341] Como resultado, o DNA do plasma do paciente com câncer tinha uma maior redução na densidade de metilação nos elementos de repetição do que nas regiões não repetisdas. A diferença da densidade de metilação do DNA do plasma entre a média dos quatro controles saudáveis e o paciente HCC foi 0.163 e 0.088 para os elementos de repetição e as regiões de não repetição, respectivamente. Os dados sobre as amostras do plasma pré- operatório e pós-operatório também mostram que a faixa dinâmica na mudança na densidade de metilação foi maior na repetição do que as regiões não repetidas. Em uma modalidade, a densidade de metilação do DNA do plasma dos elementos de repetição pode ser usada para determinar se um paciente é afetado pelo câncer ou para o acompanhamento da progressão da doença.
[00342] Como discutido acima, a variação das densidades de metilação no plasma dos indivíduos da referência afetaria também a precisão de diferenciar pacientes com câncer de indivíduos não cancerosos. Quanto mais apertado a distribuição das densidades de metilação (ou seja, menor desvio padrão), o mais exato seria diferenciar sujeitos cancerosos e não cancerosos. Em outra modalidade, o coeficiente de variação (CV) das densidades de metilação dos bins 1 Mb podem ser usados como um critério para selecionar os bins com baixa variabilidade de densidades de metilação do DNA do plasma no grupo de referência. Por exemplo, somente os binscom CV < 1% são selecionados. Outros valores, por exemplo, 0,5%, 0,75%, 1,25% e 1,5% também podem ser usados como critério para selecionar os bins com baixa variabilidade na densidade de metilação. Em outra modalidade, os critérios de seleção podem incluir tanto o CV do bin e a diferença de densidade de metilação entre os tecidos cancerosos e não cancerosos.
[00343] A densidade de metilação também pode ser usada para estimar a concentração fracionária do DNA derivado de tumor em uma amostra de plasma quando a densidade de metilação do tecido do tumor é conhecida. Esta informação pode ser obtida pela análise do tumor do paciente ou do a partir dos estudos dos tumores de um número de pacientes, tendo o mesmo tipo de câncer. Como discutido acima, a densidade de metilação de plasma (P) pode ser expressa através da seguinte equação: P = BKG X (1 - f) + TUM X f onde BKG é a densidade de metilação de fundamento das células de sangue e outros órgãos, TUM é a densidade de metilação do tecido do tumor, e f é a concentração fracionária do DNA derivado do tumor da amostra de plasma. Isto pode ser reescrito como:
Figure img0020
[00344] Os valores de BKG podem ser determinados através da análise do plasma do paciente da amostra em um ponto de tempo que o câncer não está presente ou da pesquisa de um grupo de referência de indivíduos sem câncer. Portanto, depois de medir a densidade de metilação do plasma, f pode ser determinado. F. Combinação com outros métodos
[00345] Abordagens de análise de metilação aqui descritas podem ser usadas em combinação com outros métodos que se baseiam as alterações genéticas do DNA derivado de tumor no plasma. Exemplos de tais métodos incluem a análise de aberrações cromossômicas associadas a câncer (KCA Chan et al. 2013 Clin Chem; 59:211-224; RJ Leary et al. 2012 Sci Transl Med; 4:162ra154) e as variações do câncer associado de nucleotídeo único no plasma (KCA Chan et al. 2013 Clin Chem; 59:211-224). Existem vantagens da abordagem da análise de metilação sobre essas abordagens genéticas.
[00346] Como mostrado na FIG. 21A, a hipometilação do DNA do tumor é um fenômeno global, envolvendo regiões distribuídas em quase todo o genoma. Portanto, os fragmentos do DNA de todas as regiões cromossômicas seriam informativos sobre a contribuição potencial dos derivados do DNA do tumor hipometilado ao DNA do plasma/soro no paciente. Em contraste, as aberrações cromossômicas (amplificação ou supressão de uma região cromossômica) só estão presentes em algumas regiões cromossômicas e os fragmentos de DNA das regiões sem uma aberração de cromossomos no tecido do tumor não seriam informativos na análise (KCA Chan et al. 2013 Clin Chem; 59: 211-224). Da mesma forma apenas algumas milhares de alterações de nucleotídeo único são observadas em cada genoma de câncer (KCA Chan et al. 2013 Clin Chem; 59: 211-224). Fragmentos de DNA que não se sobrepõem com estas mudanças do nucleotídeo único não seriam informativos em determinar se o DNA derivado do tumor está presente no plasma. Portanto, esta abordagem de análise de metilação é potencialmente mais rentável do que as abordagens genéticas para detecção de câncer associado a alterações na circulação.
[00347] Em uma modalidade, a relação custo-eficácia da análise de metilação do DNA do plasma pode ainda ser reforçada pelo enriquecimento dos fragmentos de DNA das regiões mais informativas, por exemplo, regiões com maior diferença de metilação diferencial entre os tecidos cancerosos e não cancerosos. Exemplos para os métodos de enriquecimento para estas regiões incluem o uso de sondas de hibridação (por exemplo, Nimblegen SeqCap system andAgilent SureSelect Target Enrichmentsystem), amplificação por PCR e hibridização da fase sólida. G. Análise Específica do Tecido/Doadores
[00348] Células derivadas do tumor invadem e metastatizam para órgãos adjacentes ou distantes. Os tecidos invadidos ou focos metastáticos de DNA contribuem no plasma em consequência da morte celular. Ao analisar o perfil de metilação do DNA no plasma de pacientes com câncer e detectar a presença de assinaturas de metilação específica do tecido, um pode detectar os tipos de tecidos que estão envolvidos no processo de doença. Essa abordagem fornece uma varredura anatômica não invasiva dos tecidos envolvidos no processo canceroso para auxiliar na identificação dos órgãos envolvidos como os sítios primários e metastáticos. As concentrações relativas das assinaturas de metilação dos órgãos envolvidos no plasma de monitoramento também permitiria um para avaliar a carga de tumor desses órgãos e determinar se o processo de câncer no órgão está a deteriorando ou melhorando ou teria sido curado. Por exemplo, se um gene X especificamente é metilado no fígado. Em seguida, o envolvimento metastático do fígado por um câncer (por exemplo, o câncer colorretal) deverá aumentar a concentração das sequências metiladas do gene X no plasma. Também existiria outra sequência ou grupos de sequências com características semelhantes de metilação como gene X. Um pode então combinar os resultados de tais sequências. Considerações similares são aplicáveis a outros tecidos, por exemplo, o cérebro, ossos, pulmões e rins, etc.
[00349] Por outro lado, DNA de diferentes órgãos é conhecido por exibir assinaturas de metilação específica do tecido (BW Futscher et al. 2002 Nat Genet; 31:175-179; SSC Chim et al. 2008 Clin Chem; 54: 500-511). Assim, a metilação de criação de perfil no plasma pode ser usada para elucidar a contribuição dos tecidos de vários órgãos no plasma. A elucidação de tal contribuição pode ser usada para avaliar a lesão do órgão, como o DNA do plasma acredita-se que seja liberado quando as células morrem. Por exemplo, uma patologia do fígado como hepatite (por exemplo, vírus, processos autoimunes, etc) ou hepatotoxicidade (por exemplo, overdose de drogas (tais como por paracetamol) ou toxinas (como álcool) causadas por drogas está associada a danos nas células do fígado e deverão ser associadas com o aumento do nível de DNA derivado de fígado no plasma. Por exemplo, se um gene X especificamente é metilado no fígado. Em seguida, a patologia hepática deverá aumentar a concentração das sequências metiladas do gene X no plasma. Inversamente, se um gene Y é especificamente hipometilado no fígado. Em seguida, a patologia hepática deverá diminuir a concentração das sequências metiladas do gene Y no plasma. Ainda outra modalidade, o gene X ou Y pode ser substituído por quaisquer sequências genômicas que pode não ser um gene e que apresentam metilação diferencial em vários tecidos dentro do corpo.
[00350] Técnicas descritas neste documento também podem ser aplicadas para a avaliação do DNA derivado do doador no plasma dos receptores de transplante de órgão (YMD Lo et al. 1998 Lancet; 351:13291330). Diferenças polimórficas entre o doador e o receptor tinham sido usadas para distinguir o DNA derivado do doador do DNA derivado do receptor no plasma (YW Zheng et al. 2012 Clin Chem; 58: 549-558). Propomos que as assinaturas de metilação específica do tecido do órgão transplantado também poderiam ser usadas como um método para detectar o DNA do doador no plasma do receptor.
[00351] Pelo monitoramento da concentração de DNA do doador, uma forma não invasiva, poderia avaliar o estado do órgão transplantado. Por exemplo, a rejeição de transplante está associada com maior taxa da morte celular e, consequentemente, a concentração de DNA do doador no plasma do receptor (ou soro), como refletido pela assinatura de metilação do órgão transplantado, seria aumentada quando comparado com o tempo, quando o paciente está em condição estável ou quando comparado com outros receptores de transplante estáveis ou controles saudáveis, sem o transplante. Semelhante ao que foi descrito para o câncer, o DNA derivado do doador pôde ser identificado no plasma dos receptores de transplante, detectando para todas ou algumas das suas características, incluindo diferenças polimórficas, DNA de tamanho menor para os órgãos transplantados sólidos (YW Zheng et al. 2012 Clin Chem; 58: 549-558) e perfil de metilação específico do tecido. H. Normalizando a Metilação com Base no Tamanho
[00352] Conforme descrito acima e por Lun et al. (FMF Lun et al. Clin. Chem. 2013; doi:10.1373/clinchem.2013.212274), a densidade de metilação (por exemplo, DNA do plasma) está correlacionada com o tamanho dos fragmentos do DNA. A distribuição das densidades de metilação dos fragmentos de DNA do plasma mais curtos foi significativamente menor do que para mais fragmentos. Propomos que algumas condições não cancerosas (por exemplo, Lúpus eritematoso sistêmico (SLE)) com padrões anormais de fragmentação de DNA do plasma possam apresentar uma aparente hipometilação de DNA do plasma devido à presença de fragmentos de DNA do plasma curto mais abundante, que são menos metilados. Em outras palavras, a distribuição de tamanho de DNA do plasma pode ser um fator de confundimento para a densidade de metilação de DNA do plasma.
[00353] A FIG. 34A mostra uma distribuição do tamanho do DNA do plasma no paciente SLE SLE04. As distribuições de tamanho de nove indivíduos de controle saudáveis são mostradas como linhas pontilhadas cinzas e que para SLE04 é mostrado como uma linha sólida negra. Fragmentos de DNA do plasma curto foram mais abundantes em SLE04 do que nos nove indivíduos de controle saudáveis. Como fragmentos de DNA mais curtos são geralmente menos metilados, esse padrão de distribuição de tamanho pode confundir a análise de metilação do DNA do plasma e levar à hipometilação mais aparente.
[00354] Em algumas modalidades, um nível medido de metilação pode ser normalizado para reduzir o efeito de confundimento da distribuição do tamanho na análise de metilação do DNA do plasma. Por exemplo, um tamanho das moléculas de DNA na pluralidade dos sítios pode ser medido. Em várias implementações, a medição pode fornecer um tamanho específico (por exemplo, comprimento) de uma molécula de DNA ou simplesmente determinar que o tamanho cai dentro de um intervalo específico, que também pode corresponder a um tamanho. O nível de metilação normalizado então pode ser comparado a um valor de corte. Existem várias maneiras de realizar a normalização para reduzir o efeito de confundimento da distribuição de tamanho na análise de metilação do DNA do plasma.
[00355] Em uma modalidade, fracionamento do tamanho do DNA (por exemplo, DNA do plasma) pode ser executado. O fracionamento do tamanho pode assegurar que os fragmentos de DNA de um tamanho similar são usados para determinar o nível de metilação de maneira consistente com o valor de corte. Como parte do fracionamento de tamanho, tendo um tamanho do fragmento de DNA um primeiro tamanho (por exemplo, um primeiro intervalo de comprimento) pode ser selecionado, onde o primeiro valor de corte corresponde ao primeiro tamanho. A normalização pode ser conseguida calculando o nível de metilação usando apenas os fragmentos de DNA selecionados.
[00356] O fracionamento do tamanho pode ser conseguido de várias maneiras, por exemplo, através da separação física dos diferentes tamanhos das moléculas de DNA (por exemplo, por electroforese ou tecnologias baseadas em microfluídica ou tecnologias baseadas em centrifugação) ou pela análise de silício. Para análise de silício, em uma modalidade, pode-se executar sequenciamento paraleli massivamente emparelhado na extremidade das moléculas de DNA do plasma. Então se pode deduzir o tamanho das moléculas sequenciadas por comparação com a localização de cada uma das duas extremidades de uma molécula de DNA do plasma de um genoma humano de referência. Então, um pode executar análise subsequente, pela seleção das moléculas de DNA sequenciadas que correspondem a um ou mais critérios de seleção de tamanho (por exemplo, o critério do ser do tamanho dentro de um intervalo especificado). Assim, em uma modalidade, a densidade de metilação pode ser analisada por fragmentos com um tamanho similar (por exemplo, dentro de um intervalo especificado). O valor de corte (por exemplo, no bloco 2840 do método 2800) pode ser determinado com base nos fragmentos dentro da mesma faixa de tamanho. Por exemplo, níveis de metilação podem ser determinados a partir das amostras que são conhecidas por terem câncer ou não terem câncer e os valores de corte podem ser determinados a partir desses níveis de metilação.
[00357] Em outra modalidade, uma relação funcional entre a densidade de metilação e o tamanho do DNA em circulação pode ser determinada. A relação funcional pode ser definida por ponto dos dados ou coeficientes de uma função. A relação funcional pode fornecer valores de escala correspondentes aos respectivos tamanhos (por exemplo, tamanhos mais curtos podem ter aumentos correspondentes para a metilação). Em várias implementações, o valor de escala pode ser entre 0 e 1 ou maior que 1.
[00358] A normalização pode ser feita com base em um tamanho médio. Por exemplo, um tamanho médio correspondente a moléculas de DNA, usado para calcular o primeiro nível de metilação pode ser calculado, e o primeiro nível de metilação pode ser multiplicado pelo valor da escala correspondente (ou seja, correspondente ao tamanho médio). Como outro exemplo, a densidade de metilação de cada molécula de DNA pode ser normalizada de acordo com o tamanho da molécula de DNA e relação entre tamanho de DNA e metilação.
[00359] Em outra implementação, a normalização pode ser feita em uma base por molécula. Por exemplo, um respectivo tamanho de uma molécula de DNA em um determinado sítio pode ser obtido (por exemplo, como descrito acima), e um valor de escala correspondente ao respectivo tamanho pode ser identificado na relação funcional. Para um cálculo normalizado, cada molécula poderia ser contada igualmente na determinação de um índice de metilação no sítio. Para o cálculo normalizado, a contribuição de uma molécula para o índice de metilação pode ser ponderada mediante o fator da escala que corresponde ao tamanho da molécula.
[00360] As FIGS. 34B e 34C mostram análise de metilação para DNA do plasma de SLE04 de paciente com SLE (FIG. 34B) e de TBR36 de paciente com HCC (FIG. 34C). Os círculos exteriores mostram os resultados de Zmet para o DNA do plasma sem fracionamento de tamanho em silício. Os círculos mostram os resultados de Z met para o DNA do plasma de 130 bp ou mais. Para o paciente SLE SLE04, 84% dos bins apresentaram hipometilação sem fracionamento de tamanhoem silício. A porcentagem dos bins mostrando hipometilação foi reduzida para 15% quando apenas os fragmentos de 130 bp ou já foram analisados. Para o paciente HCC TBR36, 98,5% e 98,6% dos bins mostraram hipometilação para o DNA do plasma com e sem em silício fracionamento de tamanho, respectivamente. Estes resultados sugerem que o fracionamento do tamanho no silício pode efetivamente reduzir os resultados de hipometilação de falso positivo relacionados à fragmentação crescente do DNA do plasma, por exemplo, em pacientes com SLE ou em outras condições inflamatórias.
[00361] Em uma modalidade, os resultados para as análises com e sem fracionamento de tamanho podem ser comparados para indicar se existe qualquer efeito de confundimento de tamanho sobre os resultados de metilação. Assim, na adição ou ao invés de normalização, o cálculo de um nível de metilação em um tamanho particular pode ser usado para determinar se existe uma probabilidade de um falso positivo, quando o percentual de bins acima de um valor de corte diferente com e sem fracionamento de tamanho, ou se apenas um nível específico de metilação é diferente. Por exemplo, a presença de uma diferença significativa entre os resultados das amostras com e sem fracionamento de tamanho pode ser usada para indicar a possibilidade de um resultado falso-positivo devido a um padrão de fragmentação anormal. O limite para determinar se a diferença for significativa pode ser estabelecido através da análise de uma coorte de pacientes com câncer e um controle de coorte dos indivíduos não cancerosos. I. Análise para os genomas de hipermetilação em ilhas de CpG no plasma
[00362] Além da hipometilação geral, hipermetilação das ilhas de CpG é também comumente observado em cânceres (SB Baylin et al. 2011 Nat Rev Cancer; 11: 726-734; PA Jones et al. 2007, Cell; 128: 683-692; M Esteller et al. 2007 Nat Rev Genet 2007; 8: 286-298; M Ehrlich et al. 2002 Oncogene 2002; 21: 5400-5413). Nesta seção, descrevemos a utilização da análise de genomas de hipermetilação na ilha de CpG para a detecção e monitoramento de cânceres.
[00363] A FIG. 35 é um fluxograma de um método 3500 que determina a classificação de nível de câncer baseado na hipermetilação de ilhas de CpG, de acordo com as modalidades da presente invenção. A pluralidade dos sítios do método 2800 pode incluir sítios de CpG, em que os sítios de CpG são organizados em uma pluralidade de ilhas de CpG, cada ilha de CpG, inclui um ou mais sítios CpG. Níveis de metilação para cada ilha de CpG podem ser usados para determinar a classificação do nível de câncer.
[00364] No bloco 3510, as ilhas de CpG a serem analisadas são identificadas. Nesta análise, por exemplo, primeiro definimos um conjunto de ilhas de CpG para serem analisadas, que se caracterizam com densidades de metilação relativamente baixas no plasma dos indivíduos saudáveis de referência. Em um aspecto, a variação das densidades metilação do grupo de referência pode ser relativamente pequena, a fim de permitir a detecção da hipermetilação associada ao câncer mais facilmente. Em uma modalidade, as ilhas de CpG tem uma densidade média de metilação menor que um primeiro percentual em um grupo de referência, e um coeficiente de variação para a densidade de metilação do grupo de referência é menor do que uma segunda porcentagem.
[00365] Por exemplo, para fins de ilustração, os seguintes critérios são utilizados para a identificação das Ilhas de CpG úteis: i. A densidade média de metilação para a ilha de CpG no grupo de referência (por exemplo, saudáveis) <5% ii. O coeficiente de variação para a análise da densidade de metilação no plasma para o grupo de referência (por exemplo, indivíduos saudáveis) <30%. Esses parâmetros podem ser ajustados para um pedido específico. Do nosso conjunto de dados 454 ilhas de CpG no genoma cumpriu esses critérios.
[00366] No bloco 3520, a densidade de metilação é calculada para cada ilha de CpG. As densidades de metilação podem ser determinadas conforme descritas neste documento.
[00367] No bloco 3530, é determinado que cada uma das ilhas de CpG é hipermetilada. Por exemplo, para a análise da hipermetilação na ilha de CpG de um caso testado, a densidade de metilação de cada ilha de CpG foi comparada com dados correspondentes de um grupo de referência. A densidade de metilação (um exemplo de um nível de metilação) pode ser comparada a um ou mais valores de corte para determinar se uma ilha particular é hipermetilada.
[00368] Em uma modalidade, um primeiro valor de corte pode corresponder a uma média das densidades de metilação para o grupo de referência mais uma porcentagem especificada. Outro valor de corte pode corresponder à média das densidades de metilação para o grupo de referência mais um determinado número de desvios padrão. Em uma implementação, uma pontuação z (Zmet) foi calculada e comparada com valores de corte. Como exemplo, uma ilha de CpG em um sujeito de teste (por exemplo, um sujeito sendo selecionado para câncer) foi considerado como significativamente hipermetilado se satisfazia as condições seguintes: i. sua densidade de metilação foi maior do que a média do grupo de referência em 2%, e ii. Zmet >3 Estes parâmetros também podem ser ajustados para um pedido específico.
[00369] No bloco 3540, as densidades de metilação (por exemplo, como pontuações z) das ilhas de CpG hipermetiladas são usadas para determinar uma pontuação cumulativa. Por exemplo, após a identificação de todas as significativamente ilhas de CpG hipermetiladas, uma pontuação que envolve uma soma de pontuações z ou funções de pontuações z de todas as ilhas de CpG hipermetiladas podem ser calculadas. Um exemplo de uma pontuação é uma probabilidade cumulativa (CP), conforme é descrito em outra seção. A pontuação de probabilidade cumulativa usa Zmet para determinar a probabilidade de ter uma tal observação por acaso de acordo com uma distribuição de probabilidade (por exemplo, a probabilidade de distribuição tdo estudante com 3 graus de liberdade).
[00370] No bloco 3550, a pontuação cumulativa é comparada com um limite cumulativo para determinar uma classificação de nível de câncer. Por exemplo, se a hipermetilação total nas ilhas de CpG identificadas é grande o suficiente, o organismo pode ser identificado como tendo câncer. Em uma modalidade, o limite cumulativo corresponde uma maior pontuação cumulativa do grupo de referência. IX. METILAÇÃO E CNA
[00371] Como mencionado acima, abordagens de análise de metilação aqui descritas podem ser usadas em combinação com outros métodos que se baseiam as alterações genéticas do DNA derivado de tumor no plasma. Exemplos de tais métodos incluem a análise de aberrações cromossômicas associadas a câncer (KCA Chan et al. 2013 Clin Chem; 59: 211-224; RJ Leary et al. 2012 Sci Transl Med; 4: 162ra154). Aspectos de aberrações números de cópia (CNA) são descritos no Pedido de Patente US No. 13/308, 473. A. CNA
[00372] Aberrações dos números de cópia podem ser detectadas por contagem de fragmentos de DNA que se alinham a uma parte específica do genoma, normalizando a contagem e comparando a contagem para um valor de corte. Em várias modalidades, a normalização pode ser executada por uma contagem de fragmentos de DNA alinhadas para outro haplótipo da mesma parte do genoma (dosagem de haplótipo relativo (RHDO)) ou uma contagem dos fragmentos de DNA alinhadas para outra parte do genoma.
[00373] Método RHDO depende do uso de loci heterozigotos. As modalidades descritas nesta seção também podem ser usadas para loci que é homozigoto comparando duas regiões e não dois haplótipos da mesma região e assim é não haplótipo específico. Em um método de dosagem da região cromossômica relativa, o número de fragmentos de uma região cromossômica (por exemplo, conforme determinado pela contagem das leituras de sequência alinhadas a essa região) é comparado com um valor esperado (que pode ser de uma região do cromossoma de referência ou de uma mesma região em outra amostra que é conhecida por ser saudável). Dessa maneira, um fragmento poderia ser contado para uma região cromossômica independentemente de qual haplótipo da marca sequenciada é de. Assim, as leituras de sequência que não contêm nenhum loci heterozigoto ainda poderiam ser usadas. Para executar a comparação, uma modalidade pode normalizar a contagem da marca antes da comparação. Cada região é definida pelo menos por dois loci (que são separadas umas das outras), e os fragmentos nestes loci podem ser usados para obter um valor coletivo sobre a região.
[00374] Um valor normalizado para as leituras sequenciais (marcas) para uma determinada região pode ser calculado dividindo o número de leituras sequenciais alinhadas para aquela região pelo número total de leituras sequenciais ajustáveis para o genoma inteiro. Esta contagem de marcação normalizada permite que os resultados a partir de uma amostra seja comparada com os resultados de uma outra amostra. Por exemplo, o valor normalizado pode ser a porcentagem (por exemplo, porcentagem ou fração) das leituras sequenciais esperadas para ser a região específica, como é dito acima. Em outras modalidades, outros métodos de normalização são possíveis. Por exemplo, um pode normalizar pela divisão do número de contagens para uma região pelo número de contagens para uma região de referência (no caso acima, a região de referência é apenas o genoma inteiro). Esta contagem da marca normalizada pode então ser comparada com um valor limite, que pode ser determinado a partir de uma ou mais amostras de referência, não exibindo o câncer.
[00375] A contagem da marca normalizada do caso testado seria então comparada com a contagem da marca normalizada de um ou mais sujeitos de referência, por exemplo, aqueles sem câncer. Em uma modalidade, a comparação é feita calculando a pontuação z do caso para a região cromossômica particular. A pontuação z pode ser calculada usando a seguinte equação: pontuação z = (contagem da marca normalizada do caso - média) / SD, onde "média" é a média da contagem da marca normalizada alinhada à região cromossômica particular para as amostras de referência; e SD é o desvio-padrão do número da contagem da marca normalizada alinhada à região determinada para as amostras de referência. Portanto, a pontuação z é o número de desvio-padrão que a contagem da marca normalizada de uma região cromossômica para o caso testado está longe da média da contagem da marca normalizada para a mesma região cromossômica a um ou mais sujeitos de referência.
[00376] Na situação quando o organismo testado tem câncer, as regiões cromossômicas que são amplificadas nos tecidos do tumor seriam super- representados no DNA do plasma. Isso resultaria em um valor positivo da pontuação z. Por outro lado, as regiões cromossômicas que são excluídas nos tecidos de tumor seriam sub-representadas no DNA do plasma. Isso resultaria em um valor negativo da pontuação z. A magnitude da pontuação z é determinada por vários fatores.
[00377] Um fator é a concentração fracionária do DNA derivado do tumor na amostra biológica (por exemplo, plasma). Quanto maior a concentração fracionária de DNA derivado do tumor na amostra (por exemplo, plasma), maior a diferença entre a contagem da marca normalizada do caso testado e os casos de referência seriam. Portanto, uma maior magnitude resultaria na pontuação z.
[00378] Outro fator é a variação da contagem da marca normalizada a um ou mais casos de referência. Com o mesmo grau da super-representação da região cromossômica na amostra biológica (por exemplo, plasma) do caso testado, uma variação menor (ou seja, um desvio padrão menor) da contagem da marca normalizada do grupo de referência resultaria em uma maior pontuação z. Da mesma forma, com o mesmo grau de sub-representação da região cromossômica na amostra biológica (por exemplo, plasma) do caso testado, um menor desvio-padrão da contagem da marca normalizada do grupo de referência resultaria em uma pontuação z mais negativa.
[00379] Outro fator é a magnitude da aberração cromossômica nos tecidos do tumor. A magnitude da aberração cromossômica refere-se à cópia das mudanças numéricas para a região cromossômica particular (ganho ou perda). Quanto maior as mudanças das cópias numéricas nos tecidos de tumor, maior o grau de super ou sub- representação da região cromossômica particular no DNA do plasma. Por exemplo, a perda de ambas as cópias do cromossomo resultaria em maior sub-representação da região cromossômica no DNA do plasma do que a perda de uma das duas cópias do cromossomo e, daí, resultou em uma pontuação z mais negativa. Normalmente, existem várias aberrações cromossômicas nos cânceres. As aberrações cromossômicas em cada câncer podem variar ainda pela sua natureza (ou seja, amplificação ou supressão), seu grau (ganho ou perda das cópias simples ou múltiplas) e sua extensão (tamanho da aberração nos termos de comprimento cromossômico).
[00380] A precisão da medição da contagem da marca normalizada é afetada pelo número de moléculas analisadas. Esperamos que as moléculas 15.000, 60.000 e 240.000 precisariam ser analisadas para detectar aberrações cromossômicas com a mudança da cópia (ganho ou perda) quando a concentração fracionária é aproximadamente 12,5%, 6,3% e 3,2%, respectivamente. Mais detalhes sobre a contagem da marca para detecção do câncer para diferentes regiões cromossômicas é descrita na Publicação de Patente US No. 2009/0029377 intitulada "Diagnosing Fetal Chromosomal Aneuploidy UsingMassively Parallel Genomic Sequencing" por Lo et al., , todo o conteúdo aqui incorporado por referência para todos os fins.
[00381] Modalidades também podem usar a análise de tamanho, em vez da marca contando com método. Análise de tamanho pode também ser utilizada, em vez de uma contagem da marca normalizada. A análise de tamanho pode usar vários parâmetros, como mencionado neste documento e no Pedido de Patente No. 12/940, 992. Por exemplo, os valores de Q ou F acima podem ser usados. Tais valores de tamanho não precisam de uma normalização por contagens de outras regiões como esses valores não escalam com o número de leituras. Técnicas dos métodos haplótipos específicos, tais como o método RHDO descrito acima e em mais detalhe no Pedido de Patente No. 13/308.473 pode ser usado para os métodos não específicos também. Por exemplo, podem ser utilizadas técnicas que envolvam a profundidade e o refinamento de uma região. Em algumas modalidades, uma inclinação GC para uma região particular pode ser tomada em conta ao comparar duas regiões. Desde que o método RHDO usa a mesma região, tal correção não é necessária.
[00382] Apesar de certos tipos de câncer podem normalmente apresentar aberrações em especial as regiões cromossômicas, tais cânceres não apresentam sempre exclusivamente com aberrações nessas regiões. Por exemplo, as regiões cromossômicas adicionais poderiam mostrar as aberrações, e a localização destas regiões adicionais podem ser desconhecidas. Além disso, quando a triagem de pacientes para identificar os estágios iniciais de câncer, um pode querer identificar uma ampla gama de tipos de câncer, que poderia mostrar as aberrações presentes em todo o genoma. Para lidar com estas situações, modalidades podem analisar uma pluralidade das regiões de forma sistemática para determinar quais regiões mostram as aberrações. O número de aberrações e sua localização (por exemplo, se elas são contíguas) podem ser usados, por exemplo, para confirmar as aberrações, determinar um estágio do câncer, fornecer um diagnóstico de câncer (por exemplo, se o número for maior que um valor limite) e fornecer um prognóstico baseado no número e localização de várias regiões, exibindo uma aberração.
[00383] Em conformidade, modalidades podem identificar se um organismo tem câncer baseado no número de regiões que mostram uma aberração. Assim, um pode testar uma pluralidade de regiões (por exemplo, 3.000) para identificar uma série de regiões que apresentam uma aberração. As regiões podem cobrir o genoma inteiro ou apenas partes do genoma, por exemplo, região de não repetição.
[00384] A FIG. 36 é um fluxograma de um método 3600 que analisa uma amostra biológica de um organismo que usa várias regiões cromossômicas de acordo com as modalidades da presente invenção. A amostra biológica inclui moléculas de ácido nucleico (também chamadas de fragmentos).
[00385] No bloco 3610, uma pluralidade de regiões (por exemplo, não se sobrepõem) do genoma do organismo é identificada. Cada região cromossômica inclui uma pluralidade de loci. Uma região pode ser 1 Mb de tamanho, ou algum outro tamanho igual. Para a situação de uma região, sendo 1 Mb de tamanho, o genoma inteiro então pode incluir cerca de 3.000 regiões, cada uma localização e tamanho predeterminados. Tais regiões predeterminadas podem variar para acomodar um comprimento de um cromossomo específico ou um determinado número de regiões a serem usados, e quaisquer outros critérios mencionados neste documento. Se as regiões têm comprimentos diferentes, tais comprimentos podem ser usados para normalizar os resultados, por exemplo, conforme descrito neste documento. As regiões podem ser especificamente selecionadas com base em determinados critérios do organismo específico e/ou com base no conhecimento do câncer a ser testado. As regiões também podem ser escolhidas arbitrariamente.
[00386] No bloco 3620, uma localização da molécula de ácido nucleico em um genoma de referência do organismo é identificada para cada uma de uma pluralidade das moléculas de ácido nucleico. A localização pode ser determinada em qualquer das formas aqui mencionadas, por exemplo, pelo sequenciamento dos fragmentos para obter marcas sequenciadas e alinhamento das marcas sequenciadas para o genoma de referência. Um determinado haplótipo de uma molécula também pode ser determinado por métodos específicos do haplótipo.
[00387] Nos blocos 3630-3650 são executados para cada uma das regiões cromossômicas. No bloco 3630, um grupo de moléculas de ácido nucleico é identificado como sendo da região cromossômica baseada os locais identificados. O grupo respectivo pode incluir pelo menos uma molécula de ácido nucleico localizada em cada uma da pluralidade dos loci da região cromossômica. Em uma modalidade, o grupo pode ter fragmentos que se alinham para um determinado haplótipo da região cromossômica, por exemplo, como no método RHDO acima. Em outra modalidade, o grupo pode ser de qualquer fragmento que se alinham à região cromossômica.
[00388] No bloco 3640, um sistema de computador calcula um valor respectivo do respectivo grupo das moléculas de ácido nucleico. O respectivo valor define uma propriedade das moléculas de ácido nucleico do respectivo grupo. O respectivo valor pode ser qualquer um dos valores mencionados neste documento. Por exemplo, o valor pode ser o número de fragmentos no grupo ou um valor estatístico de uma distribuição de tamanho dos fragmentos no grupo. O respectivo valor também pode ser um valor normalizado, por exemplo, uma contagem da marca da região dividida pelo número total da contagem da marca para a amostra, ou o número de contagens da marca para uma região de referência. O respectivo valor também pode ser uma diferença ou relação de outro valor (por exemplo, em RHDO), proporcionando assim a propriedade de uma diferença para a região.
[00389] No bloco 3650, o respectivo valor é comparado com um valor de referência para determinar uma classificação se a primeira região cromossômica exibe uma exclusão ou uma amplificação. Este valor de referência pode ser qualquer valor limite ou referência aqui descrita. Por exemplo, o valor de referência pode ser um valor limite determinado para amostras normais. Para RHDO, o respectivo valor pode ser a diferença ou relação das contagens da marca para os dois haplótipos, e o valor de referência pode ser um limite para a determinação de que um desvio significativo estatisticamente existe. Como outro exemplo, o valor de referência pode ser o valor da contagem da marca ou valor do tamanho para outro haplótipo ou região, e a comparação podem incluir tomar uma diferença ou relação (ou a função de tal) e então determinar se a diferença ou relação é maior que um valor limite.
[00390] O valor de referência pode variar baseado nos resultados de outras regiões. Por exemplo, se as regiões vizinhas também mostram um desvio (embora pequenos comparados a um limite, por exemplo, uma pontuação z de 3), então um limite mais baixo pode ser usado. Por exemplo, se três regiões consecutivas são todas acima de um primeiro limite, então o câncer pode ser mais provável. Assim, este primeiro limite pode ser menor do que o outro limite que é necessário para identificar o câncer das regiões não consecutivas. Ter três regiões (ou mais de três), tendo até mesmo um pequeno desvio pode ter uma probabilidade bastante baixa de um efeito de mudança que a sensibilidade e especificidade podem ser preservadas.
[00391] No bloco 3660, uma quantidade de regiões genômicas classificadas como exibindo uma exclusão ou amplificação é determinada. As regiões cromossômicas são contadas podendo ter restrições. Por exemplo, podem ser contadas apenas regiões que são contíguas pelo menos outras regiões (ou regiões contíguas podem ser necessárias para ser de um determinado tamanho, por exemplo, regiões de 4 ou mais). Para modalidades onde as regiões não são iguais, o número pode também contar para os respectivos comprimentos (por exemplo, o número pode ser um comprimento total das regiões aberrantes).
[00392] No bloco 3670, a quantidade é comparada com um valor limite da quantidade para determinar uma classificação da amostra. Como exemplos, a classificação pode ser se o organismo tem câncer, um estágio do câncer e um prognóstico do câncer. Em uma modalidade, contam-se todas as regiões aberrantes e um valor limite único é usado independentemente de onde aparecem as regiões. Em outra modalidade, um valor limite pode variar com base nos tamanhos e locais das regiões que são contadas. Por exemplo, a quantidade das regiões em um cromossomo particular ou o braço de um cromossomo pode ser comparada a um limite para aquele cromossomo particular (ou braço). Vários limites podem ser utilizados. Por exemplo, a quantidade das regiões aberrantes em um cromossomo particular (ou braço) deve ser maior que um primeiro valor limite, e a quantidade total das regiões aberrantes no genoma deve ser maior que um segundo valor limite. O valor limite pode ser uma porcentagem das regiões que estão determinadas a exibirem uma exclusão ou uma amplificação.
[00393] Este valor limite para a quantidade das regiões também podem depender de quão forte o desequilíbrio é para as regiões contadas. Por exemplo, a quantidade das regiões que são usadas como limite para determinar uma classificação de câncer pode depender a especificidade e a sensibilidade (limite aberrante) usadas para detectar uma aberração em cada região. Por exemplo, se o limite aberrante é baixo (por exemplo, pontuação z de 2) e, em seguida, o limite da quantidade pode ser selecionado para ser elevado (por exemplo, 150). Mas, se o limite aberrante é alto (por exemplo, uma pontuação z de 3) e, em seguida, o limite da quantidade pode ser menor (por exemplo, 50). A quantidade das regiões mostra uma aberração podendo ser também um valor ponderado, por exemplo, uma região que mostra um alto desequilíbrio pode ser ponderada superior a uma região que mostra apenas um pequeno desequilíbrio (ou seja, existem classificações mais do que positivas e negativas para a aberração). Como exemplo, uma soma das pontuações z pode ser usada, assim, usando os valores ponderados.
[00394] Nesse sentido, a quantidade (o que pode incluir o tamanho e/ou número) das regiões cromossômicas, mostrando significativa super ou sub-representação de uma contagem da marca normalizada (ou outro valor respectivo para a propriedade do grupo) pode ser usada para refletir a severidade da doença. A quantidade das regiões cromossômicas com uma contagem da marca normalizada aberrante pode ser determinada por dois fatores, nomeadamente o número (ou tamanho) das aberrações cromossômicas nos tecidos do tumor e a concentração fracionária do DNA derivado do tumor na amostra biológica (por exemplo, plasma). Cânceres mais avançados tendem a expor mais (e maiores) aberrações cromossômicas. Assim, mais aberrações cromossômicas associadas ao câncer potencialmente seriam detectáveis na amostra (por exemplo, plasma). Em pacientes com câncer mais avançado, a maior carga de tumor conduziria a uma maior concentração fracionária do DNA derivado do tumor no plasma. Como resultado, as aberrações cromossômicas associadas ao tumor seriam mais facilmente detectadas na amostra de plasma.
[00395] Uma abordagem possível para melhorar a sensibilidade sem sacrificar a especificidade é de ter em conta o resultado do segmento cromossômico adjacente. Em uma modalidade, o corte para a pontuação z continua a ser >2 e <-2. No entanto, uma região cromossômica poderia ser classificada como potencialmente aberrante somente quando dois segmentos consecutivos mostrariam o mesmo tipo de aberrações, por exemplo, ambos os segmentos tem uma pontuação z de >2. Em outras modalidades, a pontuação z dos segmentos vizinhos pode ser adicionada usando um valor de corte superior. Por exemplo, podem resumir-se a pontuações z de três segmentos consecutivos e um valor de corte de 5 pode ser usado. Este conceito pode ser estendido para mais de três segmentos consecutivos.
[00396] A combinação da quantidade e limites aberrantes também pode depender da finalidade da análise e qualquer conhecimento prévio do organismo (ou falta dela). Por exemplo, se a triagem de uma população normal e saudável para o câncer, então normalmente usaria alta especificidade, potencialmente em ambas as quantidades das regiões (ou seja, limite alto para o número das regiões) e um limite aberrante para quando uma região é identificada como tendo uma aberração. Mas, em um paciente com maior risco (por exemplo, um paciente queixando-se de um caroço ou história familiar, fumante, portador crônico de papilomavírus humano (HPV), transportador do vírus da hepatite ou outro transportador de vírus), em seguida, os limites podem ser inferiores ao fim de ter mais sensibilidades (menos falsos negativos).
[00397] Em uma modalidade, se alguém usa uma resolução de 1 Mb e um limite inferior da detecção de 6,3% do DNA derivado do tumor para a detecção de uma aberração cromossômica, o número das moléculas em cada segmento de 1 Mb precisaria ser 60.000. Isso seria traduzido para aproximadamente 180 milhões (60.000 leituras/Mb x 3.000 Mb) ajustável nas leituras para o genoma inteiro.
[00398] Um tamanho menor de segmento resultaria em uma resolução mais alta para a detecção das pequenas aberrações cromossômicas. No entanto, isso aumentaria a exigência do número de moléculas a serem analisadas no total. Um tamanho maior do segmento reduziria o número de moléculas necessárias para a análise em detrimento da resolução. Portanto, podem ser detectadas apenas maiores aberrações. Em uma implementação, regiões maiores podem ser usadas, segmentos mostrando uma aberração podem subdividir-se e estas sub-regiões analisadas para obter melhor resolução (por exemplo, como é descrito acima). Se alguém tem uma estimativa para um tamanho de exclusão ou de amplificação para ser detectado (ou concentração mínima para detectar), pode ser determinado o número de moléculas para analisar. B. CNA baseado em Sequenciamento de DNA de Plasma Tratado com Bissulfito
[00399] Hipometilação de todo o genoma e CNA podem ser frequentemente observados em tecidos tumorais. Aqui, podemos demonstrar que as informações do CNA e alterações associadas de metilação associadas com câncer podem ser simultaneamente obtidas a partir do sequenciamento de bissulfito do DNA de plasma. Como os dois tipos de análises podem ser realizados no mesmo conjunto de dados, praticamente não há nenhum custo adicional para a análise do CNA. Outras modalidades podem usar diferentes procedimentos para obter as informações de metilação e a informação genética. Em outras modalidades, um pode realizar uma análise semelhante para hipermetilação associada com câncer, em conjunto com a análise do CNA.
[00400] A FIG. 37A mostra análise CNA para tecidos tumorais, DNA do plasma tratado por (BS) não-bissulfito e DNA do plasma tratado por bissulfito (de dentro para fora) para TBR36 de paciente. A FIG. 37A mostra análise CNA para tecidos tumorais, DNA do plasma tratado por (BS) não- bissulfito e DNA do plasma tratado por bissulfito (de dentro para fora) para TBR36 de paciente. O anel mais externo mostra o ideograma de um cromossomo. Cada ponto representa o resultado de uma região de 1-Mb. Os pontos verde, vermelho e cinzento representam regiões com ganho de número de cópias, perda de número de cópias e alteração do número de cópias, respectivamente. Para a análise de plasma, são mostrados as pontuações z. Uma diferença de 5 está presente entre duas linhas concêntricas. Para a análise de tecido do tumor, o número de cópias é mostrado. Uma diferença de uma cópia está presente entre duas linhas concêntricas. A FIG. 38A mostra análise CNA para tecidos tumorais, DNA do plasma tratado por (BS) por não- bissulfito e DNA do plasma tratado por bissulfito (de dentro para fora) para TBR34 de paciente. Os padrões da CNA detectados nas amostras de plasma tratado por bissulfito e não-bissulfito foram concordantes.
[00401] Os padrões da CNA detectados nos tecidos do tumor, no plasma tratado com não-bissulfito e tratado com bissulfito foram concordantes. Para avaliar adicionalmente a concordância entre os resultados do plasma tratado com bissulfito e não-bissulfito foi construído um gráfico de dispersão. A FIG. 37B é um gráfico de dispersão que mostra a relação entre as pontuações z para a detecção de CNA usando plasma tratado por bissulfito e por não-bissulfito de bins de 1Mb para TBR36 do paciente. Observou-se uma correlação positiva entre as pontuações z das duas análises (r = 0,89, p < 0,001, correlação de Pearson). A FIG. 38B é um gráfico de dispersão que mostra a relação entre as pontuações z para a detecção de CNA usando plasma tratado por bissulfito e tratado por não-bissulfito de bins de 1Mb para TBR34 do paciente. Observou-se uma correlação positiva entre as pontuações z das duas análises (r = 0,81, p < 0,001, correlação de Pearson). C. Análise Sinérgica do CNA Associado ao Câncer e Alterações de Metilação
[00402] Conforme descrito acima, a análise para CNA pode envolver a contagem do número de leituras de sequência em cada região de 1 Mb, considerando que a análise de densidade de metilação pode envolver a detecção da proporção de resíduos de citosina em dinucleotídeos CpG sendo metilados. A combinação destas duas análises pode dar informações sinérgicas para a detecção de câncer. Por exemplo, a classificação de metilação e a classificação do CNA podem ser usadas para determinar uma terceira classificação de um nível de câncer.
[00403] Em uma modalidade, a presença de um CNA associado com câncer ou alteração de metilação pode ser usada para indicar a presença potencial de um câncer. Em tal modalidade, a sensibilidade de detecção de câncer pode ser aumentada quando alterações de CNA ou metilação estão presentes no plasma de um sujeito testado. Em outra modalidade, a presença de ambas as alterações pode ser usada para indicar a presença de um câncer. Em tal modalidade, a especificidade do teste pode ser melhorada porque qualquer um dos dois tipos de alterações pode potencialmente ser detectado em alguns sujeitos não-cancerosos. Assim, a terceira classificação pode ser positiva para câncer somente quando a primeira classificação e a segunda classificação indicam câncer.
[00404] 26 Pacientes HCC e 22 indivíduos saudáveis foram recrutados. Uma amostra de sangue foi coletada de cada indivíduo e o DNA de plasma foi sequenciado após tratamento de bissulfito. Para os pacientes HCC, as amostras de sangue foram coletadas no momento do diagnóstico. A presença de quantidades significativas de CNA foi, por exemplo, definida como tendo > 5% das bins mostrando uma pontuação z de < -3 ou > 3. A presença de quantidades significativas de hipometilação associada com câncer foi definida como tendo > 3% das bins mostrando uma pontuação z de < -3. Como exemplos, a quantidade de regiões (bins) pode ser expressa como uma contagem bruta de bins, uma porcentagem e um comprimento de bins.
[00405] A tabela 3 mostra a detecção de quantidades significativas de CNA e alterações de metilação no plasma de 26 pacientes HCC usando maciçamente sequenciamento paralelo no DNA de plasma tratado com bissulfito.
Figure img0021
[00406] As taxas de detecção de alteração de metilação associada com câncer e CNA foram de 69% e 50%, respectivamente. A taxa de detecção (ou seja, sensibilidade diagnóstica) melhorou para 73%, se a presença de qualquer critério foi usada para indicar a presença potencial de um câncer.
[00407] Os resultados de dois pacientes apresentando também a presença de CNA (FIG. 39A) ou alterações de metilação (FIG. 39B) são mostrados. A FIG. 39A é um gráfico Circos que mostra CNA (anel interno) e análise de metilação (anel externo) para o plasma tratado por bissulfito para TBR240 de paciente com HCC. Para a análise de CNA, pontos verde, vermelho e cinza representam regiões com ganho cromossomal, perda e sem alteração do número de cópias, respectivamente. Para a análise de metilação, pontos verde, vermelho e cinza representam as regiões com hipermetilação, hipometilação e metilação normal, respectivamente. Neste paciente, o CNA associado ao câncer foi detectado no plasma, considerando que a análise de metilação não revelou uma quantidade significativa de hipometilação associada ao câncer. A FIG. 39B é um gráfico Circos que mostra CNA (anel interno) e análise de metilação (anel externo) para o plasma tratado por bissulfito para TBR164 de paciente com HCC. Neste paciente, hipometilação associada ao câncer foi detectada no plasma. No entanto, nenhuma quantidade significativa do CNA pode ser observada. Os resultados de dois pacientes apresentando a presença de ambos CNA e alterações de metilação são mostrados nas FIGS. 48A (TBR36) e 49A (TBR34).
[00408] A tabela 4 mostra a detecção de quantidades significativas de CNA e alterações de metilação no plasma de 22 sujeitos de controle usando maciçamente o sequenciamento paralelo no DNA de plasma tratado com bissulfito. Uma abordagem de bootstrapping (ou seja, leave-one-out) foi usada para a avaliação de cada um dos sujeitos de controle. Assim, quando um determinado sujeito foi avaliado, os outros 21 sujeitos foram utilizados para o cálculo da média e SD do grupo de controle.
Figure img0022
[00409] A especificidade da detecção de quantidades significativas de alteração de metilação e CNA foram de 86% e 91%, respectivamente. A especificidade melhora 95%, se a presença de ambos os critérios for necessária para indicar a presença potencial de um câncer.
[00410] Em uma modalidade, amostras positivas para CNA e/ou hipometilação são consideradas positivas para o câncer, e amostras de quando ambos são indetectáveis são consideradas negativas. Usando a lógica "ou" oferece maior sensibilidade. Em outra modalidade, somente as amostras que são positivas para CNA e hipometilação são consideradas positivas para câncer, proporcionando assim maior especificidade. Em uma outra modalidade, três níveis de classificação podem ser usados. Os sujeitos são classificados em i. ambos normais; II. um anormal; III. ambos anormais.
[00411] Diferentes estratégias de acompanhamento podem ser usadas para essas três classificações. Por exemplo, sujeitos para (iii) podem ser submetidos ao protocolo de acompanhamento mais intensivo, por exemplo, envolvendo a captura de imagens do corpo inteiro; sujeitos para (ii) podem ser submetidos a um protocolo de acompanhamento menos intensivo, por exemplo, repetir o sequenciamento de DNA do plasma após um intervalo de tempo relativamente curto de várias semanas; e sujeitos para (i) podem ser submetidos ao protocolo de acompanhamento menos intensivo como refazer o teste após um número de anos. Em outras modalidades, as medições de metilação e CNA podem ser usadas em conjunto com outros parâmetros clínicos (por exemplo, resultados de imagem ou bioquímica do soro) para refinar ainda mais a classificação. D. Valor prognóstico da análise de DNA de plasma após tratamento com propósitos curativos
[00412] A presença de CNA associado com câncer e/ou alterações de metilação no plasma indicaria a presença de DNA derivado de tumor na circulação do paciente com câncer. Uma redução ou ausência destas alterações associadas ao câncer seria de esperada após o tratamento (por exemplo, cirurgia). Por outro lado, a persistência dessas alterações no plasma após o tratamento poderia indicar a remoção incompleta de todas as células do tumor do corpo e pode ser um prognosticador útil para recorrência de doença.
[00413] Foram colhidas amostras de sangue dos dois pacientes HCC TBR34 e TBR36 em uma semana após a ressecção cirúrgica com propósito curativo dos tumores. As análises de CNA e metilação foram realizadas nas amostras de plasma tratado por bissulfito pós-tratamento.
[00414] A FIG. 40A mostra a análise CNA em DNA de plasma tratado por bissulfito coletado antes (anel interno) e após (anel externo) a ressecção cirúrgica do tumor do paciente HCC TBR36 . Cada ponto representa o resultado de uma região de 1-Mb. Os pontos verde, vermelho e cinza representam regiões com ganho de número de cópias, perda de número de cópias e alteração do número de cópias, respectivamente. A maioria dos observados antes do tratamento o CNA desapareceu após a ressecção do tumor. A proporção de bins mostrando uma pontuação z < -3 ou > 3 diminuiu de 25% para 6,6%.
[00415] A FIG. 40B mostra a análise de metilação em DNA de plasma tratado por bissulfito coletado antes (anel interno) e após (anel externo) à ressecção cirúrgica do tumor do paciente HCC TBR36. Os pontos verde, vermelho e cinza representam as regiões com hipermetilação, hipometilação e metilação normal, respectivamente. Houve uma acentuada redução na proporção de bins mostrando hipometilação significativa de 90% para 7,9% e o grau de hipometilação também mostrou uma redução acentuada. Este paciente teve uma remissão clínica completa 22 meses após a ressecção do tumor.
[00416] A FIG. 41A mostra a análise CNA em DNA de plasma tratado por bissulfito coletado antes (anel interno) e após (anel externo) à ressecção cirúrgica do tumor do paciente HCC TBR34. Embora não haja uma redução em ambas as bins com números mostrando CNA e a magnitude do CNA nas bins afetadas após a ressecção cirúrgica do tumor, CNA residual pode ser observado na amostra de plasma no pós-operatório. O círculo vermelho destaca a região em que os CNAs residuais foram mais evidentes. A proporção de bins mostrando uma pontuação z < -3 ou > 3 diminuiu de 57% para 12%.
[00417] A FIG. 41B mostra a análise de metilação em DNA de plasma tratado por bissulfito coletado antes (anel interno) e após (anel externo) à ressecção cirúrgica do tumor do paciente HCC TBR34. A magnitude da hipometilação diminuiu após a ressecção do tumor com o a pontuação z média para as bins de hipometilação sendo reduzida de -7,9 para -4,0. No entanto, a proporção de bins tendo uma pontuação z < -3 mostrou uma mudança oposta, com um aumento de 41% para 85%. Esta observação indica, potencialmente, a presença de células cancerosas residuais após o tratamento. Clinicamente, vários focos de nódulos de tumor foram detectados no fígado não-ressecado restante 3 meses após a ressecção do tumor. Metástases pulmonares foram observados a partir do 4° mês após a cirurgia. O paciente morreu de recidiva local e metástase 8 meses após a operação.
[00418] As observações nesses dois pacientes (TBR34 e TBR36) sugerem que a presença das alterações residuais associadas com câncer do CNA e hipometilação podem ser usadas para monitoramento e prognóstico de pacientes com câncer após tratamentos com propósitos de cura. Os dados também mostraram que o grau da alteração na quantidade de plasma que CNA detectado pode ser usado em sinergia com a avaliação do grau da alteração na extensão da hipometilação de DNA de plasma para prognóstico e monitoramento da eficácia do tratamento.
[00419] Da mesma forma, em algumas modalidades, uma amostra biológica é obtida antes do tratamento, e uma segunda amostra biológica é obtida após o tratamento (por exemplo, cirurgia). Os primeiros valores são obtidos para a primeira amostra, tais como as pontuações z das regiões (por exemplo, os níveis de metilação da região e os valores normalizados para CNA) e o número de regiões apresentando hipometilação e CNA (por exemplo, amplificação ou deleção). Os segundos valores podem ser obtidos para a segunda amostra. Em outra modalidade, uma terceira, ou mesmo amostras adicionais, podem ser obtidas após o tratamento. O número de regiões apresentando hipometilação e CNA (por exemplo, amplificação ou deleção) pode ser obtido a partir da terceira amostra ou mesmo das amostras adicionais.
[00420] Conforme descrito acima para as FIGS. 40A e 41A, o primeiro número de regiões apresentando hipometilação para a primeira amostra pode ser comparado com a segunda quantidade de regiões apresentando hipometilação para a segunda amostra. Conforme descrito acima para as FIGS. 40B e 41B, a primeira quantidade de regiões apresentando hipometilação para a primeira amostra pode ser comparado com a segunda quantidade de regiões apresentando hipometilação para a segunda amostra. A comparação da primeira quantidade à segunda quantidade e do primeiro número ao segundo número pode ser usada para determinar um prognóstico do tratamento. Em várias modalidades, apenas uma das comparações pode ser determinante de prognóstico ou ambas as comparações podem ser usadas. Em modalidades em que as terceiras, ou mesmo amostras adicionais, são obtidas, uma ou mais dessas amostras podem ser usada para determinar um prognóstico do tratamento, por conta própria, ou em conjunto com a segunda amostra.
[00421] Em uma implementação, o prognóstico é previsto como pior quando uma primeira diferença entre a primeira quantidade e a segunda quantidade está abaixo de um primeiro limite de diferença. Em outra implementação, o prognóstico é previsto como pior quando uma segunda diferença entre o primeiro número e o segundo número é inferior a um segundo limite de diferença. O limite pode ser o mesmo ou diferente. Em uma modalidade, o primeiro limite de diferença e o segundo limite de diferença são zero. Assim, no exemplo acima, a diferença entre os valores para metilação indicaria um pior prognóstico para o paciente TBR34.
[00422] Um prognóstico pode ser melhor se a primeira diferença e/ou a segunda diferença estiver acima de um mesmo limite ou respectivos limites. A classificação para o prognóstico pode depender de quanto muito acima ou abaixo do limite estão as diferenças. Vários limites podem ser usados para fornecer várias classificações. Diferenças maiores podem prever melhores resultados e menores diferenças (e mesmo valores negativos) podem prever resultados piores.
[00423] Em algumas modalidades, os pontos de tempo no qual as diversas amostras são coletadas também são observados. Com tais parâmetros temporais, se poderia determinar a cinética ou a taxa de variação da quantidade. Em uma modalidade, uma rápida diminuição da hipometilação associada com tumor no plasma e/ou uma diminuição rápida da CNA associado com tumor no plasma será preditiva de bom prognóstico. Por outro lado, uma hipometilação associada com tumor estática ou com um rápido aumento no plasma e/ou um CNA associado com tumor estático ou com um rápido aumento será preditivo de mau prognóstico. A metilação e medições de CNA podem ser usadas em conjunto com outros parâmetros clínicos (por exemplo, resultados de imagem ou bioquímica do soro ou marcadores de proteína) para a predição de resultados clínicos.
[00424] Modalidades podem usar outras amostras além de plasma. Por exemplo, as aberrações de metilação associada ao tumor (por exemplo, hipometilação) e/ou CNAs associados ao tumor, podem ser medidos a partir de células tumorais circulantes no sangue de pacientes com câncer, a partir de DNA sem célula ou células tumorais na urina, fezes, saliva, catarro, líquido biliar, fluido pancreático, esfregaço cervical, secreções do trato reprodutivo (por exemplo, vaginal), líquido ascítico, líquido pleural, sêmen, suor e lágrimas.
[00425] Em várias modalidades, aberrações de metilação associada ao tumor (por exemplo, hipometilação) e/ou CNAs associados ao tumor pode ser detectadas a partir do sangue ou do plasma de pacientes com câncer de mama, câncer de pulmão, câncer colorretal, câncer pancreático, câncer de ovário, carcinoma nasofaríngeo, câncer cervical, melanoma, tumores cerebrais, etc. De fato, conforme as alterações de metilação e genéticas como CNAs são fenômenos universais em câncer, as abordagens descritas podem ser usadas para todos os tipos de câncer. As medições de metilação e CNA podem ser usadas em conjunto com outros parâmetros clínicos (por exemplo, resultados de imagem) para a predição de resultados clínicos. As modalidades também podem ser usadas para varredura e monitoramento de pacientes com lesões pré-neoplásicas, por exemplo, adenomas.
[00426] Da mesma forma, em uma modalidade, a amostra biológica é coletada antes do tratamento, e as medições do CNA e de metilação são repetidas após o tratamento. As medições podem render uma primeira quantidade subsequente de regiões que são determinadas para exibir uma deleção ou uma amplificação e podem render uma segunda quantidade subsequente de regiões que são determinadas para ter um nível de metilação na região que exceda o valor de corte da respectiva região. A primeira quantidade pode ser comparada à primeira quantidade subsequente, e a segunda quantidade pode ser comparada à segunda quantidade subsequente para determinar um prognóstico do organismo.
[00427] A comparação para determinar o prognóstico do organismo pode incluir a determinação de uma primeira diferença entre a primeira quantidade e a primeira quantidade subsequente, e a primeira diferença pode ser comparada a um ou mais primeiro limite de diferença para determinar um prognóstico. A comparação para determinar o prognóstico do organismo também pode incluir a determinação de uma segunda diferença entre a segunda quantidade e a segunda quantidade subsequente, e a segunda diferença pode ser comparada a um ou mais segundo limite de diferença. Os limites podem ser zero ou um outro número.
[00428] O prognóstico pode ser previsto como sendo pior quando a primeira diferença estiver abaixo de um primeiro limite de diferença do que quando a primeira diferença estiver acima do primeiro limite de diferença. O prognóstico pode ser previsto como sendo pior quando a segunda diferença estiver abaixo de um segundo limite de diferença do que quando a segunda diferença estiver acima do segundo limite de diferença. Imunoterapia, cirurgia, radioterapia, quimioterapia, terapia baseada em anticorpos, terapia genética, terapia epigenética ou terapia-alvo são exemplos de tratamentos. E. Desempenho
[00429] O desempenho de diagnóstico para diferentes números de leituras de sequência e de tamanho de bin é descrito para análise de CNA e de metilação. 1. Número de Leituras de Sequência
[00430] De acordo com uma modalidade, analisou-se o DNA do plasma de 32 indivíduos saudáveis de controle, 26 pacientes com carcinoma hepatocelular e 20 pacientes que sofrem de outros tipos de cânceres, incluindo o carcinoma nasofaríngeo, câncer de mama, câncer de pulmão, câncer neuroendócrino e sarcoma de músculo liso. Vinte e dois dos 32 sujeitos saudáveis foram selecionados aleatoriamente como grupo de referência. A média e o desvio padrão (SD) desses 22 indivíduos de referência foram utilizados para determinar o intervalo normal de densidade de metilação e representação genômica. O DNA extraído da amostra de plasma de cada indivíduo foi usado para construção de biblioteca de sequenciamento usando o kit de sequenciamento Illumina Paired-end. As bibliotecas de sequenciamento em seguida foram submetidas a tratamento com bissulfito que converteu resíduos de citosina não-metilada em uracil. A biblioteca de sequenciamento convertido por bissulfito para cada amostra de plasma foi sequenciada usando uma faixa de um sequenciador Illumina HiSeq2000.
[00431] Depois de chamado de base, sequências de adaptador e bases de baixa qualidade (ou seja, pontuação de qualidade < 5) nos terminais do fragmento foram removidas. As leituras aparadas no formato FASTQ foram processadas por um pipeline de análise de dados de metilação chamado Methy-Pipe (P Jiang et al. 2010, IEEE International Conference on Bioinformatics and Biomedicine, doi:10.1109/BIBMW.2010.5703866). A fim de alinhar as leituras de sequenciamento de bissulfito convertido, realizamos primeiro conversão em silico de todos os resíduos de citosina em timinas nos padrões Watson e Crick separadamente usando o genoma humano de referência (NCBI construído 36/hg19). Em seguida, realizamos conversão em silico de cada citosina em timina em todas as leituras processadas e mantivemos as informações de posição de cada resíduo convertido. SOAP2 foi usado para alinhar as leituras convertidas para os dois genomas humanos de referência pré-convertidos (R Li et al. 2009 Bioinformatics 25:1966-1967), com um máximo de duas incompatibilidades permitidas para cada leitura alinhada. Somente leituras mapeadas para um único local genômico foram utilizadas para análise a jusante. Leituras ambíguas mapeadas para os padrões Watson e Crick e leituras (clonais) duplicadas foram removidas. Resíduos de citosina no contexto de dinucleotídeo CpG foram utilizados para análise de metilação a jusante. Após o alinhamento, as citosinas originalmente presentes nas leituras sequenciais foram recuperadas com base nas informações posicionais mantidas durante a conversão em silico. As citosinas recuperadas entre os dinucleotídeos CpG foram marcadas como metiladas. As timinas entre os dinucleotídeos CpG foram marcadas como não-metiladas.
[00432] Para análise de metilação, o genoma foi dividido em bins de tamanhos iguais. O tamanho dos bins testados incluem 50 kb, 100 kb, 200 kb e 1 Mb. A densidade de metilação para cada bin foi calculada conforme o número de citosinas metiladas no contexto de dinucleotídeo CpG, dividido pelo número total de citosinas em posições CpG. Em outras modalidades, o tamanho de bin pode ser não-igual em todo o genoma. Em uma modalidade, cada bin entre tais bins de tamanhos não-iguais não é comparado através de múltiplos sujeitos.
[00433] Para determinar que se a densidade de metilação do plasma de um caso testado foi normal, a densidade de metilação foi comparada com os resultados do grupo de referência. Vinte e dois dos 32 sujeitos saudáveis foram selecionados aleatoriamente como o grupo de referência para o cálculo da pontuação z de metilação z (Zmet).
Figure img0023
onde MDteste era a densidade de metilação do caso testado para um determinado bin de 1-Mb; MDref era a densidade média de metilação do grupo de referência para o bin correspondente; e MDSD era o SD da densidade metilação do grupo de referência para o bin correspondente.
[00434] Para a análise de CNA, o número de leituras de sequencias mapeando cada bin de 1 Mb foi determinado (KCA Chan el al. 2013 Clin Chem 59:211-24). Densidade de leitura sequenciada foi determinada para cada bin após correção do desvio de GC usando regressão de Locally Weighted Scatter Plot Smoothing como previamente descrito (EZ Chen et al. 2011 PLoS One 6: e21791). Para a análise de plasma, a densidade de leitura sequenciada do caso testado foi comparada com o grupo de referência para calcular a pontuação z do CNA ( ZCNA ):
Figure img0024
onde RDteste era a densidade de leitura sequenciada do caso testado para um determinado bin de 1-Mb; RDref era a densidade média da leitura sequenciada do grupo de referência para o bin correspondente; e RDSD era o SD da densidade de leitura sequenciada do grupo de referência para o bin correspondente. Um bin foi definido para exibir o CNA se o ZCNA do bin for < -3 ou > 3.
[00435] A média de 93 milhões de leituras alinhadas (intervalo: 39 milhões a 142 milhões) foram obtidas pelo caso. Para avaliar o efeito da redução do número de leituras sequenciais sobre o desempenho do diagnóstico, nós selecionamos aleatoriamente 10 milhões de leituras alinhadas de cada caso. Utilizou-se o mesmo conjunto de indivíduos de referência para o estabelecimento do intervalo de referência de cada bin de 1 Mb para o conjunto de dados com leituras sequenciadas reduzidas. A porcentagem de bins apresentando hipometilação significativa, ou seja, Zmet < -3 e a porcentagem de bins com CNA, ou seja, ZCNA < -3 ou > 3, foram determinadas para cada caso. Receptor operando as curvas de características (ROC) foram usados para ilustrar o desempenho do diagnóstico de hipometilação de todo o genoma e análises de CNA para os conjuntos de dados com todas as leituras sequenciadas de 1 faixa e 10 milhões de leituras por caso. Na análise ROC, todos os 32 indivíduos saudáveis foram usados para a análise.
[00436] A FIG. 42 mostra um diagrama do desempenho do diagnóstico da análise de hipometilação em todo o genoma com número diferente de leituras sequenciais. Para análise de hipometilação, a áreas sob a curva para as curvas ROC não foram significativamente diferente entre os dois conjuntos de dados que analisou todas as leituras sequenciadas de uma faixa e 10 milhões de leituras por caso (P = 0.761). Para a análise do CNA, o desempenho de diagnóstico deteriorou-se com uma redução significativa na áreas-sob-curva quando o número de leituras sequenciadas reduziu a partir do uso dos dados de uma faixa para 10 milhões (P < 0,001). 2. Efeito do uso de diferentes tamanhos de bin
[00437] Além de dividir o genoma em bins de 1 Mb, exploramos também se bin menores podem ser usados. Teoricamente, o uso de bins menores pode potencialmente reduzir a variabilidade na densidade de metilação dentro de um bin. Isso ocorre porque a densidade de metilação entre diferentes regiões genômicas pode variar amplamente. Quando um bin é maior, a chance de incluir regiões com densidades diferentes de metilação aumentaria e, portanto, levaria a um aumento global na variabilidade na densidade de metilação dos bins.
[00438] Embora o uso de um bin de menor tamanho possa potencialmente reduzir a variabilidade na densidade de metilação relacionada às diferenças inter-regionais, isto por outro lado iria reduzir o número de leituras sequenciadas mapeadas para um determinado bin. A redução nas leituras mapeando para bins individuais aumentaria a variabilidade devido à variação de amostragem. O tamanho ideal de bin que pode dar origem a menor variabilidade global na densidade de metilação pode ser determinado experimentalmente para os requisitos de um aplicativo de diagnóstico específico, por exemplo, o número total de leituras sequenciadas por amostra e o tipo de sequenciador de DNA usado.
[00439] A FIG. 43 é um diagrama que mostra as curvas ROC para a detecção de câncer com base na análise de hipometilação em todo o genoma tamanhos diferentes de recipientes (50 kb, 100 kb, 200 kb e 1 Mb). Os valores de P mostrados são para a área sob a curva em comparação com um tamanho de bin de 1 Mb. Uma tendência de melhoria pode ser vista quando o tamanho de bin foi reduzido de 1 Mb para 200 kb. F. Pontuação de Probabilidade Cumulativa
[00440] A quantidade de regiões para metilação e CNA pode ser de vários valores. Exemplos acima descreveram um número de regiões superiores a um valor de corte ou uma porcentagem de tais regiões que mostrou hipometilação significante ou CNA como um parâmetro para classificar se uma amostra foi associada com câncer. Tais abordagens não leva em conta a magnitude da aberração para bins individuais. Por exemplo, um bin com um Zmet de -3.5 seria o mesmo que um bin com um Zmet de -30 conforme ambos são classificados como tendo hipometilação significativo. No entanto, o grau de alterações de hipometilação no plasma, ou seja, a magnitude do valor de Zmet, é afetado pela quantidade de DNA associado ao câncer na amostra e, dessa forma, pode complementar as informações da porcentagem de bins mostrando aberrações para refletir a carga do tumor. Uma maior concentração fracionária do DNA tumoral da amostra de plasma levaria a uma menor densidade de metilação e isso se traduziria em um valor baixo de Zmet. 1. Pontuação de Probabilidade Cumulativa como um Parâmetro Diagnóstico
[00441] Para utilizara as informações a partir da magnitude de aberrações, desenvolvemos uma abordagem denominada Pontuação de probabilidade cumulativa (CP). Com base na função de probabilidade da distribuição normal, cada valor de Zmet foi traduzido para uma probabilidade de ter uma observação por acaso.
[00442] A pontuação de CP foi calculada como:
Figure img0025
para bin(i) com Zmet<-3 onde Probi é a probabilidade de Zmet do bin(i) de acordo com a distribuição det de Student com 3 graus de liberdade, e o log é a função de logaritmo natural. Em outra modalidade, pode ser usado um logaritmo com base 10 (ou outro número). Em outras modalidades, outras distribuições, por exemplo, mas não se limitando à distribuição normal e à distribuição gama, podem ser aplicadas para transformar a pontuação z para CP.
[00443] A maior pontuação do CP indica uma baixa probabilidade de ter como uma densidade de metilação de desvio em uma população normal por acaso. Portanto, uma alta pontuação de CP indicaria uma maior chance de ter DNA anormalmente hipometilado na amostra, por exemplo, a presença de DNA associado ao câncer.
[00444] Comparado com a porcentagem de bins mostrando a aberração, a medição de Pontuação do CP tem um maior intervalo dinâmica. Enquanto a carga de tumor entre diferentes pacientes podem variar amplamente, os maiores intervalos de valores de CP seriam útieis para refletir as cargas do tumor dos pacientes com cargas de tumor relativamente altas e relativamente baixas. Além disso, o uso de pontuações CP pode potencialmente ser mais sensível para detectar as alterações na concentração de DNA associado ao tumor no plasma. Isto é vantajoso para o monitoramento da resposta do tratamento e prognóstico. Portanto, uma redução da pontuação de CP durante o tratamento é indicativa de uma boa resposta ao tratamento. A falta de redução ou até mesmo aumento na pontuação de CP durante o tratamento indicaria falta de resposta ou resposta fraca. Para prognóstico, uma alta pontuação de CP é indicativa da carga do tumor elevado e sugestiva de mau prognóstico (por exemplo, maior chance de morte ou progressão do tumor).
[00445] A FIG. 44A mostra um desempenho de diagnóstico para probabilidade cumulativa (CP) e porcentagem de recipientes com anormalidades. Não houve diferença significativa entre a áreas sob curva para os dois tipos de algoritmo diagnóstico (P = 0.791).
[00446] A FIG. 44B mostra desempenhos de diagnósticos para a análise de plasma quanto à hipometilação global, hipermetilação das ilhas de CpG e CNA. Com uma faixa de sequenciamento por amostra (tamanho de bin de 200KB para análise de hipometilação e tamanho de bin de 1 Mb para a CNA ,e ilhas de CpG, definidos de acordo com o banco de dados hospedado pela Universidade da Califórnia, Santa Cruz (UCSC)), a áreas sob-curva para todos os três tipos de análises foram acima de 0,90.
[00447] Nas análises posteriores, a maior pontuação de CP em indivíduos de controle foi usada como o ponto de decisão para cada um dos três tipos de análises. A seleção destes cortes deu uma especificidade de diagnóstico de 100%. A sensibilidade diagnóstica para hipometilação geral, hipermetilação de ilha de CpG e análises do CNA foram 78%, 89% e 52%, respectivamente. Em 43 dos 46 pacientes com câncer, pelo menos um dos três tipos de aberrações foi detectado, assim, dando origem a uma sensibilidade de 93,4% e uma especificidade de 100%. Nossos resultados indicam que os três tipos de análises podem ser usados em sinergia para a detecção de câncer.
[00448] A FIG. 45 mostra uma tabela com os resultados para hipometilação global, hipermetilação de ilhas de CpG e CNA em pacientes com carcinoma hepatocelular. Os valores de corte de Pontuação CP para os três tipos de análise foram 960, 2,9 e 211, respectivamente. Resultados Positivos de Pontuação CP estão em negrito e sublinhados.
[00449] A FIG. 46 mostra uma tabela com os resultados para hipometilação global, hipermetilação de ilhas de CpG e CNA em pacientes que sofrem de outros cânceres diferentes do carcinoma hepatocelular. Os valores de corte de Pontuação CP para os três tipos de análise foram 960, 2,9 e 211, respectivamente. Resultados Positivos de Pontuação CP estão em negrito e sublinhados. 2. Aplicação da pontuação CP para monitoramento de câncer
[00450] As amostras serais foram coletadas a partir de um paciente HCC TBR34 antes e após o tratamento. As amostras foram analisadas por hipometilação global.
[00451] A FIG. 47 mostra uma análise serial para metilação de plasma para o TBR34 do caso. O anel mais interno mostra a densidade de metilação do buffy coat (preto) e tecidos de tumor (roxo). Para as amostras de plasma, o Zmet é mostrado para cada bin de 1MB. A diferença entre duas linhas representa uma diferença deZmet de 5. Pontos vermelhos e cinza representam bins com hipometilação e nenhuma alteração na densidade de metilação em comparação com o grupo de referência. Do 2o anel interno em direção às amostras de plasma coletadas antes do tratamento, em 3 dias e 2 meses após a ressecção do tumor, respectivamente. Antes do tratamento, pode ser observado um elevado grau de hipometilação no plasma e mais de 18,5% dos bins tiveram um Zmet de < - 10. 3 dias após a ressecção do tumor, foi observado que o grau de hipometilação foi reduzido no plasma com nenhum dos bins com Zmet < - 10. Caso N°. Ponto do tempo Análise de Metilação Percentagem de bins mostrando hipometilação significativa Pontuação de Probabilidade Cumulativa (CP) Pontuação Z sumativa
Figure img0026
[00452] A tabela 5 mostra que, embora a magnitude das alterações de hipometilação reduziram em 3 dias após a ressecção cirúrgica do tumor, a percentagem de bins exibindo aberração mostrou um aumento paradoxal. Por outro lado, a pontuação de CP revelou com mais precisão a diminuição do grau de hipometilação no plasma e pode ser mais reflexiva das alterações na carga do tumor.
[00453] 2 meses após OT, ainda havia uma percentagem significativa dos bins apresentando alterações de hipometilação. A pontuação de CP também permaneceu em aproximadamente 15.000. Este paciente foi diagnosticado posteriormente como tendo depósitos de tumor multi focal (anteriormente desconhecidos no momento da cirurgia) no fígado remanescente não ressecado com 3 meses e foi observado que tinha múltiplas metástases pulmonares a 4 meses após a operação. O paciente morreu de metástase 8 meses após a operação. Estes resultados sugeriram que a Pontuação do CP pode ser mais poderosa do que a porcentagem dos bins com aberração para refletir a carga do tumor.
[00454] Em geral, o CP pode ser útil para aplicações que exigem a medição da quantidade de DNA de tumor no plasma. Exemplos de tais aplicações incluem: prognóstico e monitoramento de pacientes com câncer (por exemplo, para observar a resposta ao tratamento, ou para observar a progressão do tumor).
[00455] A pontuação z sumativa é uma soma direta das pontuações z, ou seja, sem ter que converter para uma probabilidade. Neste exemplo, a pontuação z sumativa mostra o mesmo comportamento que a pontuação CP. Em outros casos, CP pode ser mais sensível do que a pontuação z somatória para monitoramento de doença residual devido ao maior intervalo dinâmico para a pontuação de CP.
X. IMPACTO DO CNA NA METILAÇÃO
[00456] O uso do CNA e da metilação para determinar as respectivas classificações para um nível de câncer, onde as classificações são combinadas para fornecer uma terceira classificação, foi descrito acima. Além de tal combinação, CNA pode ser usado para alterar os valores de corte para a análise de metilação e para identificar falsos-positivos, comparando os níveis de metilação para grupos de regiões com características diferentes do CNA. Por exemplo, o nível de metilação para superabundância (por exemplo, ZCNA > 3) pode ser comparado ao nível de metilação para abundância normal (por exemplo, -3 < ZCNA < 3). Em primeiro lugar, o impacto da CNA em níveis de metilação é descrito. A. Alteração na densidade de metilação em regiões com perdas e ganhos cromossômicos
[00457] Conforme os tecidos do tumor geralmente mostram uma hipometilação global, a presença de DNA derivado de tumor no plasma de pacientes com câncer conduziria à redução da densidade de metilação quando comparado com indivíduos não-cancerosos. O grau de hipometilação no plasma de pacientes com câncer é teoricamente proporcional à concentração fracionária do DNA derivado de tumor da amostra de plasma.
[00458] Para as regiões apresentando um ganho cromossomal em tecidos do tumor, que uma dose adicional de DNA do tumor seria liberada dos segmentos de DNA amplificados para o plasma. Esta contribuição maior do DNA tumoral ao plasma teoricamente levaria a um grau mais elevado de hipometilação no DNA do plasma para a região afetada. Um fator adicional é que seria esperados que as regiões genômicas apresentando amplificação conferissem vantagem de crescimento para as células do tumor e, portanto, seria esperado que fosse expressa. Tais regiões são geralmente hipometiladas.
[00459] Em contraste, para regiões que mostram perda cromossomal no tecido do tumor, a contribuição reduzida de DNA tumoral de plasma levaria a um grau inferior de hipometilação em comparação com regiões com nenhuma mudança do número de cópias. Um fator adicional é que regiões genômicas que são excluídas em células de tumor podem conter genes supressores de tumor e pode ser vantajoso para as células do tumor ter tais regiões silenciadas. Assim, tais regiões deverão ter uma maior chance de ser hipermetiladas.
[00460] Neste documento, nós usamos os resultados de dois pacientes HCC (TBR34 e TBR36) para ilustrar este efeito. As FIGS. 48A (TBR36) e 49A (TBR34) tem círculos destacando as regiões com ganhos ou perdas cromossomais e a análise de metilação correspondente. As FIGS. 48B e 49B mostram representações gráficas de pontuações z de metilação para perdas, normais e ganhos para os pacientes TBR36 e TBR34, respectivamente.
[00461] A FIG. 48A mostra um gráfico Circos que demonstra CNA (anel interno) e alterações de metilação (anel externo) no DNA do plasma tratado por bissulfito para TBR36 de paciente com HCC. Os círculos vermelhos destacam as regiões com ganhos ou perdas cromossomais. As regiões mostrando ganhos cromossomais foram mais hipometiladas do que as regiões sem alterações de número de cópias. As regiões apresentando perdas cromossomais foram menos hipometiladas do que as regiões sem alterações de número de cópia. A FIG. 48B é uma representação gráfica de pontuações z de metilação para regiões com ganhos e perdas cromossômicas e regiões sem alteração do número de cópia para TBR36 de paciente com HCC. Em comparação com regiões sem alterações de cópia, regiões com ganhos cromossomais tinham pontuações z mais negativas (mais hipometilação) e regiões com perdas cromossômicas tinham menos pontuações z negativas (menos hipometiladas).
[00462] A FIG. 49A mostra um gráfico Circos que demonstra CNA (anel interno) e alterações de metilação (anel externo) no DNA do plasma tratado por bissulfito para TBR34 de paciente com HCC. A FIG. 49B é uma representação gráfica de pontuações z de metilação para regiões com ganhos e perdas cromossômicas e regiões sem alteração do número de cópia para TBR34 de paciente com HCC. A diferença de densidades de metilação entre regiões com ganhos e perdas cromossomais foi maior em pacientes TBR36 do que no paciente TBR34 porque a concentração fracionária de DNA derivado de tumor no paciente antigo foi maior.
[00463] Neste exemplo, as regiões utilizadas para determinar o CNA são as mesmas que as regiões utilizadas para determinar a metilação. Em uma modalidade, os valores de corte da região respectiva dependem se a respectiva região exibe uma deleção ou uma amplificação. Em uma implementação, um valor de corte da respectiva região (por exemplo, o corte de pontuação z usado para determinar a hipometilação) tem uma maior magnitude, quando a respectiva região exibe uma amplificação do que quando nenhuma amplificação é exibida (por exemplo, a magnitude pode ser superior a 3, e um limite inferior a 3 pode ser usado). Assim, para testar a hipometilação, um valor de corte da respectiva região pode ter um valor negativo maior quando a respectiva região exibe uma amplificação do que quando nenhuma amplificação é exibida. Tal implementação deverá melhorar a especificidade do teste para a detecção de câncer.
[00464] Em outra implementação, um valor de corte da respectiva região tem uma magnitude menor (por exemplo, inferior a 3) do que quando a respectiva região exibe uma deleção do que quando a deleção não é exibida. Assim, para testar a hipometilação, um valor de corte da respectiva região pode ter um valor negativo menor quando a respectiva região exibe uma deleção do que quando nenhuma deleção é exibida. Espera-se que tal implementação melhore a sensibilidade do teste para a detecção de câncer. O ajuste dos valores de corte nas implementações acima pode ser alterado dependendo da sensibilidade desejada e especificidade para um cenário particularmente de diagnóstico. Em outras modalidades, as medições de metilação e CNA podem ser usadas em conjunto com outros parâmetros clínicos (por exemplo, resultados de imagem ou bioquímica do soro) para prognóstico de câncer. B. Usando o CNA para Selecionar Regiões
[00465] Como descrito acima, mostramos que a densidade de metilação de plasma seria alterada em regiões tendo aberrações de números de cópias em tecidos do tumor. Em regiões com ganho de número de cópia no tecido do tumor, o aumento da contribuição de DNA tumoral hipometilado ao plasma conduziria a um maior grau de hipometilação do DNA do plasma em comparação com regiões sem uma aberração no número de cópias. Por outro lado, em regiões com perda do número de cópias no tecido do tumor, a contribuição reduzida de DNA derivado de câncer hipometilação para o plasma levaria a um menor grau de hipometilação do DNA de plasma. Esta relação entre a densidade de metilação do DNA de plasma e a representação relativa potencialmente pode ser usada para diferenciar os resultados de hipometilação associado com a presença de DNA associado a câncer e outras causas não-cancerosas (por exemplo, SLE) de hipometilação do DNA de plasma.
[00466] Para ilustrar esta abordagem, analisamos as amostras de plasma de dois pacientes com carcinoma hepatocelular (HCC) e dois pacientes com SLE sem câncer. Estes dois pacientes de SLE (SLE04 e SLE10) mostraram a presença aparente de hipometilação e CNAs no plasma. Para o paciente SLE04, 84% de bins mostraram hipometilação e 11,2% dos bins mostrou CNA. Para o paciente SLE10, 10,3% de bins mostraram hipometilação e 5,7% de bins mostraram CNA.
[00467] A FIG. 50A e 50B mostram resultados da análise de hipometilação e CNA para pacientes SLE04 e SLE10 de pacientes com SLE. O círculo externo mostra a pontuação z de metilação (Zmet) com resolução de 1 Mb. Os bins com metilação Zmet < -3 estava em vermelho e aqueles com Zmet > -3 estavam em cinza. O círculo interno mostra as pontuações z de CNA (ZCNA). Os pontos verde, vermelhos e cinza representam bins com ZCNA > 3, < 3 e entre -3 a 3, respectivamente. Nesses dois pacientes de SLE, as alterações de hipometilação e CNA foram observadas no plasma.
[00468] Para determinar se as mudanças na metilação e CNA foram consistentes com a presença de DNA derivado de câncer no plasma, comparamos o Zmet para regiões com ZCNA > 3, <-3 e entre -3 a 3. Para alterações de metilação e CNA contribuídas pelo DNA derivado de câncer no plasma, seria esperado que as regiões com ZCNA < -3 seriam menos hipometiladas e com menos Zmetnegativo. Em contraste, seria esperado que as regiões com ZCNA > 3 fosse mais hipometiladas e com mais Zmet negativo. Para efeito de ilustração, foi aplicado teste de soma de classificação unilateral para comparar o Zmet para regiões com CNA (ou seja, regiões com ZCNA < -3 ou > 3) com regiões sem CNA (ou seja, regiões com ZCNA entre -3 e 3). Em outras modalidades, outros testes estatísticos, por exemplo, mas não limitados ao teste t de Student, teste de análise de variância (ANOVA) e teste de Kruskal-Wallis, podem ser usados.
[00469] As FIGS. 51A e 51B mostram análise de met Z para regiões com e sem CNA para o plasma de dois pacientes com HCC (TBR34 e TBR36). Regiões com ZCNA < -3 e > 3 representam regiões com sob- e sub- representação no plasma, respectivamente. Em ambos TBR34 e TBR36, as regiões que eram sub-representadas no plasma (ou seja, regiões com ZCNA < -3) tinham significativamente maior Zmet (P-valor < 10-5, teste de soma de classificação unilateral) do que as regiões com representação normal no plasma (ou seja, regiões com ZCNA entre -3 e 3). Uma representação normal corresponde ao que se espera um genoma euploide. Para regiões com sob- representação no plasma (ou seja, regiões com ZCNA > 3), eles tinham Zmet significativamente menor do que regiões com representação normal no plasma (P-valor < 10-5, teste de soma de classificação unilateral). Todas essas mudanças foram consistentes com a presença de DNA tumoral hipometilado em amostras de plasma.
[00470] As FIGS. 51C e 51D mostram análise de met Z para regiões com e sem CNA para o plasma de dois pacientes com com SLE (SLE04 e SLE10). Regiões com ZCNA < -3 e > 3 representam regiões com sob- e sub- representação no plasma, respectivamente. Para SLE04, as regiões que eram sub-representadas no plasma (ou seja, regiões com ZCNA <-3) não teve Zmet significativamente maior (P-valor = 0,99, teste de soma de classificação unilateral) do que regiões com representação normal no plasma (ou seja, regiões com ZCNA entre -3 e 3) e regiões com super-representação no plasma (ou seja, regiões com ZCNA > 3) não tinha significativamente menor Z de metanfetamina que regiões com representação normal no plasma (P-valor = 0,68, teste de soma de classificação unilateral). Estes resultados foram diferentes das esperadas alterações devido à presença de DNA derivado de tumor hipometilado no plasma. Da mesma forma, para SLE10, regiões com ZCNA < -3 não tem significativamente maior Zmet que regiões com ZCNA entre -3 e 3 (P-valor = 0,99, teste de soma de classificação unilateral).
[00471] A razão de não ter o padrão típico de câncer associadas entre Zmet e ZCNA nos pacientes com SLE é que, nos pacientes com SLE, a CNA não está presente em um tipo de célula específica que também exibe hipometilação. Em vez disso, a presença aparente observada da CNA e hipometilação é devido a distribuição de tamanho alterada de DNA circulante em pacientes com Les. A distribuição de tamanho alterado potencialmente poderia alterar as densidades de leitura sequenciadas para diferentes regiões genômicas levando a CNAs aparentes como as referências foram derivadas de indivíduos saudáveis. Conforme descrito nas seções anteriores, há uma correlação entre o tamanho de um fragmento de DNA a circulação e a sua densidade de metilação. Portanto, a distribuição de tamanho alterado também pode levar a uma metilação aberrante.
[00472] Embora as regiões com ZCNA > 3 apresente níveis de metilação ligeiramente menores do que as regiões com ZCNA entre -3 e 3, o p-valor de comparação era muito maior do que aqueles observados em dois pacientes com câncer. Em uma modalidade, o p-valor pode ser usado como um parâmetro para determinar a probabilidade de um caso testado por ter um câncer. Em outra modalidade, a diferença entre regiões com representação normal e aberrante Zmet pode ser usada como um parâmetro para indicar a probabilidade da presença de câncer. Em uma modalidade, um grupo de pacientes com câncer pode ser usado para estabelecer a correlação entre Zmet e ZCNA e determinar os limiares para os diferentes parâmetros a fim de indicar as alterações são consistentes com a presença de DNA derivado de câncer hipometilado da amostra de plasma testado.
[00473] Da mesma forma, em uma modalidade, uma análise do CNA pode ser realizada para determinar um primeiro conjunto de regiões que todos exibem um dentre: uma deleção, uma amplificação ou uma representação normal. Por exemplo, o primeiro conjunto de regiões pode exibir uma exclusão, todos exibem uma amplificação ou todos exibem uma representação normal (por exemplo, têm uma quantidade normal de primeira das regiões, tais como um Zmet normal). Um nível de metilação pode ser determinado por este primeiro conjunto de regiões (por exemplo, o primeiro nível de metilação do método 2800 pode corresponder ao primeiro conjunto de regiões).
[00474] A análise do CNA pode determinar um segundo conjunto de regiões que todos exibem um segundo dentre: uma deleção, uma amplificação ou uma representação normal. O segundo conjunto de regiões apresentaria de forma diferente do que o primeiro conjunto. Por exemplo, se o primeiro conjunto de regiões foram normais, em seguida, o segundo conjunto de regiões pode exibir uma exclusão ou uma amplificação. Um segundo nível de metilação pode ser calculado com base nos respectivos números das moléculas de DNA metiladas nos sítios no segundo conjunto das regiões.
[00475] Um parâmetro pode ser calculado entre do primeiro nível de metilação e a segunda metilação; e, por exemplo, uma diferença ou relação pode ser calculada e comparada com um valor de corte. A diferença ou relação pode também ser submetida a uma distribuição de probabilidade (por exemplo, como parte de um teste estatístico) para determinar a probabilidade de se obter o valor, e esta probabilidade pode ser comparada a um valor de corte para determinar um nível de câncer com base nos níveis de metilação. Tal uma interrupção pode ser escolhida para diferenciar amostras ter câncer e aqueles que não têm câncer (por exemplo, SLE).
[00476] Em uma modalidade, um nível de metilação pode ser determinado para o primeiro conjunto de região ou de uma mistura de regiões (i.e., mistura de regiões mostrando amplificação, deleção e normal). Este nível de metilação em seguida pode ser comparado a um primeiro corte como parte de uma primeira fase de análise. Se o limite for excedido, indicando, assim, uma possibilidade de câncer, então a análise acima pode ser realizada para determinar se a indicação foi um falso positivo. A classificação final para o nível de câncer, portanto, pode incluir a comparação do parâmetro para os dois níveis de metilação para um segundo corte.
[00477] O primeiro nível de metilação pode ser um valor estatístico (por exemplo, a média ou a mediana) de níveis de metilação região calculados para cada região do primeiro conjunto de regiões. O segundo nível de metilação também pode ser um valor estatístico da região metilação níveis calculados para cada região do segundo conjunto de regiões. Como exemplos, os valores estatísticos podem ser determinados usando o teste de soma de classificação unilateral, teste t de Student, teste de análise de variância (ANOVA) ou teste de Kruskal-Wallis.
XI. CLASSIFICAÇÃO DO TIPO DE CÂNCER
[00478] Além de determinar se um organismo tem câncer ou não, as modalidades podem identificar um tipo de câncer associado com a amostra. Esta identificação do tipo de câncer pode usar padrões de hipometilação global, hipermetilação de ilha de CpG, e/ou CNA. Os padrões podem envolver o agrupamento de pacientes com diagnóstico conhecido usando os níveis medidos na região de metilação, respectivos valores CNA para regiões e nível de metilação das Ilhas de CpG. Os resultados abaixo mostram que os organismos com um tipo similar de câncer têm valores semelhantes para as regiões e consoles de CpG, bem como pacientes com câncer-não ter valores semelhantes. O agrupamento, cada um dos valores para uma região ou a ilha pode ser uma dimensão separada no processo de clusterização.
[00479] Sabe-se que o mesmo tipo de câncer compartilharia alterações genéticas e epigenéticas semelhantes (E Gebhart et al. 2004 Cytogenet Genome Res; 104: 352-358; PA Jones et al. 2007 Cell; 128: 683-692). Abaixo, descrevemos como os padrões de alterações do CNA e metilação detectadas no plasma são úteis para inferir a origem ou o tipo do câncer. As amostras de DNA de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando CNAs globais do grupo A. A análise foi realizada utilizando-se, por exemplo, a função heatmap.2 no pacote de script R (cran.r project.org/web/packages/gplots/gplots.pdf).
[00480] Para ilustrar o potencial desta abordagem, usamos dois conjuntos de critérios (grupo A e grupo B) como exemplos para identificar recursos úteis para a classificação das amostras de plasma (ver quadro 6). Em outras modalidades, outros critérios podem ser usados para identificar as características. Os recursos utilizados incluíam CNA global, com resolução de 1 Mb, densidade de metilação global com resolução de 1 Mb e metilação de ilha de CpG.
Figure img0027
Tabela 6
[00481] Nos dois primeiros exemplos, usamos todo o CNA, metilação global em 1 Mb, resolução e características de metilação de ilha de CpG para a classificação. Em outras modalidades, outros critérios como, por exemplo, mas não se limitando a precisão da medição da característica no plasma do grupo de referência, pode ser usado.
[00482] A FIG. 52A mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando os 1,130 recursos do Grupo A incluindo 355 CNAs, 584 recursos de metilação global a 1 Mb e status de metilação de 110 ilhas de CpG. A barra de cores lateral superior representa os grupos de amostra: verde, azul e vermelho representam indivíduos saudáveis, pacientes com câncer HCC e não-HCC , respectivamente. Em geral, os três grupos de sujeitos tendem a agrupar juntos. O eixo vertical representa as características classificadoras. Características com padrões semelhantes em diferentes sujeitos foram agrupadas. Estes resultados sugerem que os padrões de alterações por metilação de ilha de CpG, alterações por metilação em todo o genoma em resolução de 1 Mb e CNAs no plasma, podem potencialmente ser usados para determinar a origem do câncer em pacientes com primárias desconhecidas.
[00483] A FIG. 52B mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando os 2,780 recursos do Grupo B incluindo 759 CNAs, 1,911 recursos de metilação global a 1 Mb e status de metilação de 191 ilhas de CpG. A barra de cores superior lado representa os grupos de amostra: verde, azul e vermelho representam indivíduos saudáveis, pacientes de câncerHCC e não-HCC , respectivamente. Em geral, os três grupos de sujeitos tenderam a agrupar juntos. O eixo vertical representa as características classificadora. Características com padrões semelhantes em diferentes temas foram agrupadas. Estes resultados sugerem que os padrões de diferentes conjuntos de ilha de CpG, alterações de metilação de todo o genoma em resolução de 1 Mb e CNAs no plasma pode ser usados para determinar a origem do câncer em pacientes com desconhecido primárias. A seleção das características de classificação pode ser ajustada para aplicações específicas. Além disso, o peso pode ser dado para a previsão do tipo de câncer de acordo com as probabilidades prévias dos temas para diferentes tipos de cânceres. Por exemplo, pacientes com hepatite viral crônica são propensos ao desenvolvimento de carcinoma hepatocelular e crônicos fumantes são propensos ao desenvolvimento de câncer de pulmão. Assim, uma probabilidade ponderada do tipo de câncer pode ser calculada usando-se, por exemplo, mas não se limitando a, logística, múltiplo, ou regressão de agrupamento.
[00484] Em outras modalidades, um único tipo de recursos pode ser usado para a análise de classificação. Por exemplo, nos exemplos a seguir, apenas a metilação global com resolução de 1 Mb, a hipermetilação de ilha de CpG ou o CNAs em resolução de 1 Mb foram utilizado para a análise de agrupamento hierárquica. O poder de diferenciação pode ser diferente quando são utilizados diferentes recursos. Aperfeiçoamento adicional das características de classificação pode melhorar potencialmente a precisão de classificação.
[00485] A FIG. 53A mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando recursos de metilação das ilhas de CpG do grupo A. Geralmente, os pacientes de câncer agrupados e os sujeitos não- cancerosos estão em outro agrupamento. No entanto, os pacientes HCC e non- HCC foram os menos separados em comparação com o uso de todos os três tipos de recursos.
[00486] A FIG. 53B mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando densidades de metilação global do grupo A em resolução de 1 Mb como recursos de classificação. Agrupamento preferencial de pacientes do HCC e não-HCC foi observado.
[00487] A FIG. 54A mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando CNAs globais do grupo A em 1 Mb de resolução como recursos de classificação. Agrupamento preferencial de pacientes HCC e não-HCC foi observado.
[00488] A FIG. 54B mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando densidades de metilação das ilhas de CpG do grupo B como recursos de classificação. Agrupamento preferencial de pacientes com câncer HCC e não-HCC pode ser observado.
[00489] A FIG. 55B mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando densidades de metilação global do grupo B em resolução de 1 Mb como recursos de classificação. Agrupamento preferencial de pacientes com câncer HCC e não-HCC pode ser observado.
[00490] A FIG. 55B mostra a análise do agrupamento hierárquico para amostras de plasma de pacientes com HCC, pacientes com câncer não-HCC e sujeitos de controle saudáveis usando CNAs globais do grupo B em 1 Mb de resolução como recursos de classificação. Agrupamento preferencial de pacientes com câncer HCC e não-HCC pode ser observado.
[00491] Estes resultados do agrupamento hierárquico para amostras de plasma sugerem que a combinação de diferentes características potencialmente pode ser usada para a identificação dos tipos de câncer primário. Refinamento adicional da seleção de critérios pode potencialmente melhorar ainda mais a precisão da classificação.
[00492] Da mesma forma, em uma modalidade, quando uma classificação de metilação indica que existe um câncer para o organismo, um tipo de câncer associado com o organismo pode ser identificado, comparando a um nível de metilação (por exemplo, a primeira metilação do método 2800 ou qualquer nível de metilação de região) para um valor correspondente, determinado a partir de outros organismos (isto é, outros organismos do mesmo tipo, tais como os seres humanos). O valor correspondente pode ser para uma mesma região ou conjunto de sítios para o qual foi calculado o nível de metilação. Pelo menos dois dos outros organismos são identificado como tendo diferentes tipos de câncer. Por exemplo, os valores correspondentes podem ser organizados em agrupamentos, onde dois agrupamentos estão associados com diferentes tipos de câncer.
[00493] Adicionalmente, quando CNA e metilação são usados juntos para obter uma terceira classificação do nível de câncer, as características de CNA e metilação podem ser comparadas aos valores correspondentes de outros organismos. Por exemplo, a primeira quantidade de regiões (por exemplo, da FIG. 36) exibindo uma deleção ou amplificação pode ser comparado aos valores correspondentes determinados a partir de outros organismos para identificar o tipo de câncer associado com o organismo.
[00494] Em algumas modalidades, as características de metilação são os níveis de metilação da região de uma pluralidade de regiões do genoma. As regiões que são determinadas como tendo um nível de metilação da região excedendo o valor de corte da respectiva região podem ser usadas, por exemplo, os níveis de metilação da região do organismo podem ser comparados ao níveis de metilação da região de outros organismos para as mesmas regiões do genoma. A comparação pode permitem diferenciar os tipos de câncer, ou apenas fornecer um filtro adicional para confirmar o câncer (por exemplo, para identificar falsos positivos). Assim, pode ser determinado se o organismo tem o primeiro tipo de câncer, ausência de câncer ou o segundo tipo de câncer com base na comparação.
[00495] Os outros organismos, (juntamente com aquele que está sendo testado) podem ser agrupados usando os níveis de metilação da região. Assim, uma comparação entre os níveis de metilação da região podem ser usada para determinar a qual agrupamento o organismo pertence. O agrupamento também pode usar valores normalizados de CNA para as regiões que são determinadas para exibir uma deleção ou uma amplificação, conforme é descrito acima. E, o agrupamento pode usar densidades respectivas de metilação das ilhas de CpG hipermetiladas.
[00496] Para ilustrar o princípio desse método, mostramos um exemplo do uso de regressão logística para a classificação de duas amostras desconhecidas. O objetivo desta classificação foi determinar se estas duas amostras foram cânceres HCCs ou cânceres não-HCC. Um conjunto de amostras de treinamento foram compiladas que incluía 23 amostras do plasma coletadas de pacientes HCC e 18 amostras de pacientes que sofrem de câncer diferente de HCC. Assim, havia um total de 41 casos no conjunto de treinamento. Neste exemplo, 13 recursos foram selecionados, incluindo cinco características sobre a metilação das Ilhas de CpG (X1-X5), seis características sobre a metilação das regiões 1-Mb (X6-X11) e 2 características sobre o CNA das regiões 1-Mb (X12-X13). As características de metilação de CpG foram selecionadas com base no critério pelo menos 15 casos no conjunto de treinamento, tendo uma pontuação z de > 3 ou < -3. As características de metilação de 1 Mb foram selecionadas com base no critério de pelo menos 39 casos no conjunto de treinamento, tendo uma pontuação z de > 3 ou < -3. As características de CNA foram selecionadas com base no critério pelo menos 20 casos tendo uma pontuação z de > 3 ou < -3. Regressão logística foi realizada em amostras deste conjunto de treinamento a fim de determinar o coeficiente de regressão para cada um dos recursos (X1X13). Características com coeficientes de regressão das magnitudes maiores (independentemente se é em um sentido positivo ou negativo) para oferecer melhor discriminação entre as amostras HCC e não-HCC. As pontuações z de cada caso para as respectivas características foram usadas como os valores de entrada das variáveis independentes. Em seguida, duas amostras de plasma, um de um paciente HCC (TBR36) e outro de um paciente que sofre de câncer de pulmão (TBR177) foram analisados para os 13 recursos.
[00497] Nesta análise de classificação do tipo de câncer, estas duas amostras foram supostas para ser coletado de pacientes que sofrem de câncer de origem desconhecida. Para cada amostra, as pontuações z para o respectivo recurso foram colocados na equação de regressão logística para determinar o logaritmo natural da razão de chances (ln(odds ratio)) onde a razão de chances representada a relação de probabilidades de ter HCC e não tendo HCC (HCC/não-HCC).
[00498] A tabela 7 mostra os coeficientes de regressão para as 13 características da equação de regressão logística. As pontuações z para as respectivas características dos dois casos testados (TBR36 e TBR177) também são mostradas. O In(odds ratio) de HCC para TBR36 e TBR177 foram 37.03 e -4.37, respectivamente. Estas relações de probabilidades, a probabilidade das amostras de plasma sendo coletados de pacientes do HCC foram calculadas como > 99,9% e 1%, respectivamente. Em suma, a TBR36 tinha uma alta probabilidade de ser uma amostra de um paciente HCC, enquanto TBR177 teve uma baixa probabilidade de ser um exemplo de um paciente HCC.
Figure img0028
[00499] Em outras modalidades, regressão de agrupamento hierárquico, análise de árvore de classificação e outros modelos de regressão podem ser usados para determinar a provável origem primária do câncer.
XII. MATERIAIS E MÉTODOS A. Preparação de bibliotecas de DNA tratado com bissulfito e sequenciamento
[00500] O DNA genômico (5 μg) adicionado com 0,5% (w/w) de lambda não metilado DNA (Promega) foi fragmentado por um sistema S220 Covaris (Covaris) para aproximadamente 200 bp em comprimento. Bibliotecas de DNA foram preparadas usando Paired-End Sequencing Sample Preparation Kit (Illumina) de acordo com as instruções do fabricante, exceto que adaptadores metilados (Illumina) foram ligados aos fragmentos de DNA. Após duas rodadas de purificação usando AMPure XP grânulos magnéticos (Beckman Coulter), os produtos da ligadura foram divididos em 2 porções, uma das quais foi submetida a 2 rodadas de modificação por bissulfito, com um Kit de Bissulfito da EpiTect (Qiagen). Citosinas não-metiladas em CpG locais nas inserções foram convertidos para uracils enquanto as citosinas metiladas permaneceram inalteradas. As moléculas de DNA ligadas por adaptador, ou tratadas ou não com bissulfito de sódio, foram enriquecidas por 10 ciclos de PCR usando a seguinte receita: 2.5U PfuTurboCx hotstart DNA polimerase (Agilent Technologies), 1X PfuTurboCx tampão de reação, 25 μM dNTPs, 1 μl PCR Primer PE 1.0 e 1 μl PCR Primer PE 2.0 (Illumina) em uma reação de 50 μl. O perfil de termociclagem era: 95oC por 2 min, 98oC por 30 s, depois 10 ciclos de 98oC durante 15 s, 60oC por 30 s e 72oC por 4 min, com uma etapa final de 72oC por 10 min (R Lister, et al. 2009 Nature; 462: 315-322). Os produtos PCR foram purificados usando grânulos magnéticos AMPure XP .
[00501] O DNA de plasma extraído de 3.2 - 4 ml de amostras de plasma materno foi enriquecido com DNA de lambda fragmentado (25 pg por ml de plasma) e sujeitos a construção da biblioteca, como descrito acima (RWK Chiu et al. 2011 BMJ; 342: c7401). Depois de ligar aos adaptadores metilados, os produtos de ligadura foram divididos em 2 metades e uma porção foi submetida a 2 rodadas de modificação por bissulfito. Os produtos de ligadura tratados ou não tratados com bissulfito foram depois enriquecidos por 10 ciclos de PCR conforme descrito acima.
[00502] As bibliotecas de DNA tratadas ou não tratadas com bissulfito foram sequenciadas por 75 bp em um formato final emparelhados em instrumentos HiSeq2000 (Illumina). Aglomerados de DNA foram gerados com uma Paired-End Cluster Generation Kit v3 em um instrumento cBot (Illumina). Análise de imagem em tempo real e a base foram realizados usando o Software de Controle HiSeq (HCS) v 1.4 e Software de Análise em Tempo Real (RTA) v1.13 (Illumina), pelo qual a matriz automatizada e eliminação de cálculos foram baseados no controle enriquecido PhiX v3 sequenciado com as bibliotecas de DNA. B. Alinhamento de sequências e identificação de citosinas metiladas
[00503] Depois de chamado de base, sequências de adaptador e bases de baixa qualidade (ou seja, pontuação de qualidade < 20) nos terminais do fragmento foram removidas. As leituras aparadas no formato FASTQ foram processadas por um pipeline de análise de dados de metilação chamado Methy-Pipe (P Jiang et al. Methy-Pipe: Um pipeline de análise de dados de bioinformática integrado para a análise de todo o genoma de metiloma, documento apresentado na Conferência Internacional IEEE sobre Workshops de Bioinformática e Biomedicina, Hong Kong, de 18 a 21 de dezembro de 2010 A fim de alinhar as leituras de sequenciamento de bissulfito convertido, realizamos primeiro conversão em silico de todos os resíduos de citosina em timinas nos padrões Watson e Crick separadamente usando o genoma humano de referência (NCBI construído 36/hg18). Em seguida, realizamos conversão em silico de cada citosina em timina em todas as leituras processadas e mantivemos as informações de posição de cada resíduo convertido. SOAP2 (R Li, et al. 2009 Bioinformatics; 25: 1966-1967) foi usada para alinhar a leitura convertida para os dois genomas humanos de referência previamente convertido, com um máximo de duas incompatibilidades permitidas para cada leitura alinhada. Somente leituras mapeada para um único local genômico foram selecionados. Leituras ambíguas que mapearam para ambas Watson e Crick e leituras duplicado (clonais), que tinham as mesmas posições genômicas de inicio e fim foram removidas. Leituras sequenciais com inserção de tamanho <600 bp foram retidas para a análise de metilação e tamanho.
[00504] Resíduos de citosina no contexto de dinucleótido CpG eram os alvos principais para os estudos de metilação de DNA a jusante. Após o alinhamento, as citosinas originalmente presentes nas leituras sequenciais foram recuperadas com base nas informações posicionais mantidas durante a conversão em silico. As citosinas recuperadas entre os dinucleotídeos CpG foram marcadas como metiladas. As timinas entre os dinucleotídeos CpG foram marcadas como não-metiladas. O DNA com lambda não-metilado incluído durante a preparação da biblioteca serve como um controle interno para estimar a eficiência de modificação por bissulfito de sódio. Todos as citosinas no DNA lambda devem ser convertidas para timinas se a eficiência de conversão de bissulfito for de 100%.
XIII. SUMÁRIO
[00505] Com o uso das modalidades aqui descritas, um poderia varrer, detectar, monitorar ou prognosticar câncer de forma não invasiva usando, por exemplo, o plasma de um sujeito. Um pode também realizar varredura pré- natal, diagnóstico, investigação ou controle de um feto deduzindo o perfil de metilação do DNA fetal a partir do plasma materno. Para ilustrar o poder da abordagem, nós mostramos que a informação que foi convencionalmente obtida através do estudo dos tecidos placentários podia ser avaliada diretamente do plasma materno. Por exemplo, o status de impressão dos loci de gene, identificação dos loci com metilação diferencial entre o DNA fetal e materno e a variação gestacional no perfil de metilação do loci do gene foram alcançados através da análise direta de DNA do plasma materno. A vantagem principal de nossa abordagem é que a metiloma fetal podia ser avaliada de forma abrangente durante a gravidez sem interrupções para a gravidez ou a necessidade de amostragem invasiva dos tecidos fetais. Dada a conhecida associação entre o estado de metilação de DNA alterado e as muitas condições associadas a gravidez, a abordagem descrita neste estudo pode servir como uma ferramenta importante para investigar a fisiopatologia e a identificação de biomarcadores para essas condições. Ao enfocar os loci imprimidos, mostramos que tanto os perfis de metilação fetal paternalmente transmissíveis, bem como os maternalmente transmissíveis poderiam ser avaliados do plasma materno. Esta abordagem pode ser potencialmente útil para a investigação de doenças de imprinting. Modalidades também podem ser aplicadas diretamente para a avaliação pré-natal de doenças fetais ou associada à gravidez.
[00506] Demonstramos que sequenciamento de genoma-largo por bissulfito pode ser aplicado para investigar o perfil de metilação do DNA dos tecidos placentários. Há aproximadamente 28M CpG sítios no genoma humano (C Clark et al. 2012 PLoS One; 7: e50233). Nossos dados de sequenciamento de bissulfito da amostra de CVS e de tecido placentário termo cobriam mais de 80% das CpGs. Isso representa uma cobertura substancialmente mais ampla do que aqueles alcançáveis usando outras plataformas de alta produtividade. Por exemplo, a matriz beadchip Illumina Infinium HumanMethylation 27K que foi usada em um estudo anterior sobre os tecidos placentários (T Chu et al. 2011 PLoS One; 6: e14723) somente cobriu 0,1% das CpGs no genoma. A matriz de beadchip Illumina Infinium HumanMethylation 450K que estava disponível mais recentemente cobria apenas 1,7% das CpGs (C Clark et al. 2012 PLoS One; 7: e50233). Devido a abordagem MPS estar livre de restrições relacionadas com o design da sonda, eficiência de hibridação ou força de captura de anticorpos, puderam ser avaliadas CpGs dentro ou além das ilhas de CpG e na maioria dos contextos de sequência.
XIV. SISTEMA DE COMPUTADOR
[00507] Qualquer um dos sistemas de computador mencionados neste documento podem utilizar qualquer número adequado de subsistemas. Exemplos de tais subsistemas são mostrados na FIG. 33 no aparelho de computador 3300. Em algumas modalidades, um sistema de computador inclui um aparelho de computador único, onde os subsistemas podem ser os componentes do aparato de computador. Em outras modalidades, um sistema de computador inclui vários aparelhos de computador, cada um sendo um subsistema, com componentes internos.
[00508] Os subsistemas indicados na FIG. 33 são interligados através de um barramento de sistema 3375. Subsistemas adicionais tais como uma impressora 3374, teclado 3378, dispositivos de armazenamento 3379, monitor 3376, que são acoplados para exibir adaptador 3382, e outros são mostrados. Periféricos e dispositivos de entrada/saída (I/O), que se acoplam ao controlador I/O 3371, podem ser conectados ao sistema do computador por qualquer número de meios conhecidos na técnica, como uma porta serial 3377. Por exemplo, a porta serial 3377 ou interface externa 3381 (por exemplo, Ethernet, Wi-Fi, etc.) pode ser usado para conectar o sistema de computador 3300 a uma rede como a Internet, um dispositivo de entrada do mouse ou um scanner. A interligação através do barramento de sistema 3375 permite que o processador central 3373 se comunique com cada subsistema e controle a execução de instruções da memória do sistema 3372 ou os dispositivos de armazenamento 3379 (por exemplo, um disco fixo), bem como o intercâmbio de informações entre subsistemas. A memória de sistema 3372 e/ou os dispositivos de armazenamento 3379 pode compor um meio legível do computador. Qualquer um dos valores mencionados neste documento podem ser a saída de um componente para outro componente e pode ser a saída para o usuário.
[00509] Um sistema de computador pode incluir uma pluralidade dos mesmos componentes ou subsistemas, por exemplo, ligados entre si por interface externa 3381 ou por uma interface interna. Em algumas modalidades, sistemas de computador, subsistema ou aparelhos podem se comunicar através de uma rede. Em tais casos, um computador pode ser considerado um cliente e um outro o servidor, onde cada um pode ser parte de um mesmo sistema de computador. Um cliente e um servidor podem cada um incluir vários sistemas, subsistemas ou componentes.
[00510] Deve ser entendido que qualquer uma das modalidades da presente invenção pode ser implementada sob a forma de lógica de controle utilizando hardware (por exemplo, um circuito integrado de aplicação específica ou arranjo de portas programável em campo) e/ou usando o software de computador com um processador programável em geral de forma integrada ou modular. Como usuário, neste documento, um processador inclui um processador de vários núcleos em um mesmo chip integrado, ou várias unidades de processamento em uma única placa de circuito ou em rede. Com base na divulgação e nos ensinamentos aqui previstos, uma pessoa versada na técnica vai saber e apreciar outras formas e/ou métodos para implementar modalidades da presente invenção usando hardware e uma combinação de hardware e software.
[00511] Qualquer um dos componentes de software ou funções descritas nesta aplicação pode ser implementado como código de software a ser executado por um processador usando qualquer linguagem de computador adequado, tais como, por exemplo, Java, C++ ou Perl usando, por exemplo, técnicas convencionais ou orientada para o objeto. O código do software pode ser armazenado como uma série de instruções ou comandos num meio legível do computador para armazenamento e/ou transmissão, meios adequados incluem memória de acesso aleatório (RAM), uma memória somente leitura (ROM), um meio magnético como um disco rígido ou um disquete ou um meio óptico, tais como um disco compacto (CD) ou DVD (disco versátil digital), flash de memória e similares. Meio legível de computador pode ser qualquer combinação de tais dispositivos de armazenamento ou transmissão.
[00512] Tais programas também podem ser codificados e transmitidos por meio de sinais adaptados para transmissão através de redes com fios, ópticas, e/ou sem fio, em conformidade com uma variedade de protocolos, incluindo a Internet. Como tal, um meio legível de computador, de acordo com uma modalidade da presente invenção pode ser criado usando um sinal de dados codificado com tais programas. A mídia legível de computador codificada com o código do programa pode ser empacotada com um dispositivo compatível ou fornecidas separadamente de outros dispositivos (por exemplo, através de transferência de Internet). Qualquer mídia legível de computador pode residir em ou estar dentro de um único produto de programa de computador (por exemplo, um disco rígido, um CD ou um sistema de computador inteiro) e pode estar presente ou dentro produtos de programa de computador diferentes dentro de um sistema ou rede. Um sistema de computador pode incluir um monitor, impressora ou outra tela adequada para a prestação de qualquer um dos resultados mencionados neste documento para um usuário.
[00513] Qualquer um dos métodos descritos neste documento podem ser totalmente ou parcialmente executado com um sistema de computador, incluindo um ou mais processadores, que podem ser configurados para executar as etapas. Assim, as modalidades podem ser direcionadas aos sistemas de computador configurados para executar as etapas de qualquer um dos métodos descritos neste documento, potencialmente com diferentes componentes, realizando um respectivas etapas ou um respectivo grupo de etapas. Embora apresentado como etapas numeradas, etapas de métodos neste documento podem ser executadas em um mesmo momento ou em uma ordem diferente. Além disso, porções dessas etapas podem ser usadas com porções de outras etapas de outros métodos. Além disso, todas ou porções de uma etapa podem ser opcionais. Além disso, qualquer uma das etapas de qualquer um dos métodos pode ser executada com módulos, circuitos ou outros meios para executar essas etapas.
[00514] Os detalhes específicos de modalidades particulares podem ser combinados de forma adequada sem se afastar do espírito e do escopo das modalidades da invenção. No entanto, outras modalidades da invenção podem ser direcionadas para modalidades específicas relativas a cada aspecto individual, ou combinações específicas destes aspectos individuais.
[00515] A descrição acima das modalidades exemplares da invenção foram apresentadas para fins de ilustração e descrição. Não se destina a ser abrangente ou limitar a invenção a uma forma exata descrita, e muitas variações e modificações são possíveis considerando o ensinamento acima. As modalidades são escolhidas e descritas para prover as melhores explicações dos princípios da invenção e suas aplicações práticas para, dessa forma, possibilitar que alguém ordinariamente versado na técnica utilize a invenção da melhor forma em várias modalidades e com várias modificações como são adequadas ao uso particular contemplado.
[00516] Uma recitação do "um", "uns" ou "o/a" destina-se a significar "um ou mais", a menos que especificamente indicado em contrário.
[00517] Todas as patentes, pedidos de patentes, publicações e descrições mencionadas neste documento estão incorporadas para referência em suas totalidades para todos os fins. Não se admite nada anterior como sendo estado da técnica. Tabela S2A. Lista de 100 regiões mais hipermetiladas identificadas na amostra do vilo coriônico do primeiro trimeste e nas células do sangue materno.
Figure img0029
Figure img0030
Tabela S2B. Lista de 100 regiões mais hipometiladas identificadas na amostra do vilo coriônico do primeiro trimeste e nas células do sangue materno.
Figure img0031
Figure img0032
Tabela S2C. Lista de 100 regiões mais hipermetiladas identificadas no tecido placentário do terceiro trimeste e nas células do sangue materno.
Figure img0033
Figure img0034
Tabela S2D. Lista de 100 regiões mais hipometiladas identificadas no tecido placentário do terceiro trimeste e nas células do sangue materno.
Figure img0035
Figure img0036
Tabela S3A. Lista dos 100 melhores loci deduzidos como hipermetilados a partir dos dados de sequenciamento por bissulfito do plasma materno no primeiro trimeste.
Figure img0037
Figure img0038
Tabela S3B. Lista dos 100 melhores loci deduzidos como hipometilados a partir dos dados de sequenciamento por bissulfito do plasma materno no primeiro trimeste.
Figure img0039
Figure img0040
Tabela S3C. Lista dos 100 melhores loci deduzidos como hipermetilados a partir dos dados de sequenciamento por bissulfito do plasma materno no terceiro trimeste.
Figure img0041
Figure img0042
Tabela S3D. Lista dos 100 melhores loci deduzidos como hipometilados a partir dos
Figure img0043
Figure img0044

Claims (18)

1. Método para determinar um perfil de metilação de uma amostra biológica de um organismo que é um animal, a amostra biológica incluindo DNA sem célula compreendendo uma mistura de DNA sem célula originária de um primeiro tecido e de um segundo tecido, o método caracterizado pelo fato de compreender: analisar uma pluralidade das moléculas de DNA da amostra biológica, em que analisar uma molécula de DNA inclui: determinar uma localização da molécula de DNA no genoma do organismo; determinar um genótipo da molécula de DNA; determinar se a molécula de DNA é metilada em um ou mais sítios; identificar uma pluralidade do loci em que um primeiro genoma do primeiro tecido é heterozigoto para um primeiro alelo respectivo e um segundo alelo respectivo e um segundo genoma do segundo tecido é homozigoto para o primeiro alelo respectivo; para cada um dos loci: para cada um de um ou mais sítios associados com o locus: determinar um número das moléculas de DNA que são metilados no sítio e correspondem ao respectivo segundo alelo do locus; calcular uma densidade de metilação baseada no número das moléculas de DNA metiladas em um ou mais sítios do locus e correspondente para o respectivo segundo alelo do locus; criar o perfil de metilação do primeiro tecido de densidades de metilação para os loci.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda: determinar um primeiro nível de metilação a partir do perfil de metilação; e comparar o primeiro nível de metilação a um primeiro valor de corte para determinar uma classificação de um nível de câncer com base na comparação.
3. Método de acordo com a reivindicação 1, caracterizado pleo fato de que compreende ainda: identificar a pluralidade de loci selecionando os loci que têm qualquer um ou mais dos seguintes critérios: um conteúdo de GC superior a 50%; e um mínimo de cinco sítios de CpG em uma região definida pelo locus.
4. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a amostra biológica é de indivíduo fêmea grávida com um feto, e em que o primeiro tecido é do feto ou de uma placenta e o segundo tecido corresponde ao indivíduo fêmea.
5. Método de acordo com a reivindicação 4, caracterizado pelo fato de que compreende ainda: determinar um primeiro nível de metilação a partir do perfil de metilação; e comparar o primeiro nível de metilação com um primeiro valor de corte para determinar uma classificação de uma condição médica, em que a condição médica é pré-eclâmpsia, uma anormalidade cromossômica no primeiro tecido ou câncer, e em que o primeiro valor de corte é determinado com base em indivíduos conhecidos por não apresentarem a condição médica.
6. Método de acordo com a reivindicação 5, caracterizado pelo fato de que a condição médica é câncer ou uma anormalidade cromossômica no primeiro tecido.
7. Método de acordo com a reivindicação 1, caracterizado pelo fato de que o primeiro tecido é de um tumor dentro do organismo e o segundo tecido é de um tecido não maligno do organismo.
8. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a determinação do perfil de metilação inclui: tratar a pluralidade de moléculas de DNA com bissulfito de sódio; e realizar o sequenciamento das moléculas de DNA tratadas.
9. Método de acordo com a reivindicação 8, caracterizado pelo fato de que o tratamento da pluralidade de moléculas de DNA é parte da conversão de bissulfito assistida por Tet ou inclui o tratamento da pluralidade de moléculas de DNA com perrutenato de potássio (KRuO4).
10. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a determinação do perfil de metilação inclui: realizar sequenciamento de molécula única do DNA, em que o sequenciamento de uma molécula única inclui determinar se pelo menos um local de uma molécula de DNA é metilado.
11. Método de acordo com a reivindicação 1, caracterizado pelo fato de que determinar o perfil de metilação a partir do DNA da mistura inclui: receber leituras de sequência a partir do sequenciamento da pluralidade de moléculas de DNA; e analisar as leituras de sequência para determinar as localizações das leituras de sequência e os status de metilação nos locais das leituras de sequência.
12. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a determinação do perfil de metilação das moléculas de DNA da mistura compreende sequenciamento massivo em paralelo das moléculas de DNA.
13. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a determinação do perfil de metilação das moléculas de DNA da mistura compreende PCR digital.
14. Método de acordo com a reivindicação 1, caracterizado pelo fato de que o perfil de metilação é determinado em uma resolução de nucleotídeo único.
15. Método de acordo com a reivindicação 1, caracterizado pelo fato de que os locais correspondem aos sítios de CpG.
16. Método de acordo com a reivindicação 1, caracterizado pelo fato de que cada locus inclui pelo menos um sítio de CpG.
17. Método de acordo com a reivindicação 1, caracterizado pelo fato de que cada locus é adjacente a pelo menos um sítio de CpG.
18. Meio de armazenamento legível por computador, caracterizado pelo fato de que são gravadas instruções que, quando executadas por um computador, realizam qualquer um dos métodos como definidos em qualquer uma das reivindicações 1 a 17.
BR122021021820-0A 2012-09-20 2013-09-20 Método para determinar um perfil de metilação de uma amostra biológica de um organismo e meio de armazenamento legível por computador BR122021021820B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US61/703,512 2012-09-20
US13/842,209 2013-03-15
US61/830,571 2013-06-03

Publications (1)

Publication Number Publication Date
BR122021021820B1 true BR122021021820B1 (pt) 2023-05-23

Family

ID=

Similar Documents

Publication Publication Date Title
AU2017251832B2 (en) Non-invasive determination of methylome of fetus or tumor from plasma
BR122021021820B1 (pt) Método para determinar um perfil de metilação de uma amostra biológica de um organismo e meio de armazenamento legível por computador