BRPI0806565A2 - Captura de conformação de cromossomo circular - Google Patents

Captura de conformação de cromossomo circular Download PDF

Info

Publication number
BRPI0806565A2
BRPI0806565A2 BRPI0806565-9A BRPI0806565A BRPI0806565A2 BR PI0806565 A2 BRPI0806565 A2 BR PI0806565A2 BR PI0806565 A BRPI0806565 A BR PI0806565A BR PI0806565 A2 BRPI0806565 A2 BR PI0806565A2
Authority
BR
Brazil
Prior art keywords
dna
sequences
restriction enzyme
sequence
target
Prior art date
Application number
BRPI0806565-9A
Other languages
English (en)
Inventor
De Laat Wouter
Grosveld Frank
Original Assignee
Erasmus University Medical Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Erasmus University Medical Center filed Critical Erasmus University Medical Center
Publication of BRPI0806565A2 publication Critical patent/BRPI0806565A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6823Release of bound markers

Description

“CAPTURA DE CONFORMAÇÃO DE CROMOSSOMO CIRCULAR” Campo da invenção
A presente invenção diz respeito à análise da frequência de interação de duas ou mais seqüências de nucleotídeos no espaço nuclear. Mudanças nas interações são usadas como uma ferramenta para detectar rearranjos do genoma para diagnósticos e prognósticos.
Antecedentes da invenção
Estudos na arquitetura nuclear de mamífero objetivam entender como 2 metros de DNA são dobrados em um núcleo de 10 μνη de diâmetro, permitindo ao mesmo tempo a expressão correta dos genes que especificam o tipo celular, e como esta é fielmente propa- gada durante cada ciclo celular. O progresso neste campo veio basicamente de estudos microscópicos, que revelaram que os genomas são arranjados não aleatoriamente no espa- ço nuclear. Por exemplo, a heterocromatina densamente condensada é separada da eucro- matina mais aberta e os cromossomos ocupam territórios distintos no espaço nuclear 2. E- xiste um relacionamento intricado entre o posicionamento nuclear e a atividade transcricio- nal. Embora a transcrição ocorra em todo o interior nuclear, os genes ativos que aglomeram- se nos cromossomos localizam-se preferivelmente na borda ou fora de seu território cro- mossômico. Genes individuais podem migrar mediante mudanças em seu estado de trans- crição, medidos contra pontos de referência nuclear relativamente grandes, tais como territó- rios cromossômicos, centrômeros ou a periferia nuclear. Além disso, dezenas de genes ati- vamente transcritos de megabases separados no cromossomo podem ficar juntos no nú- cleo, demonstrado recentemente por hibridização in situ por fluorescência (FISH) para o Iocus de /S-globina e alguns outros genes selecionados. Além da transcrição, a organização genômica está associada com a coordenação de replicação, recombinação e a probabilida- de de os Ioci translocarem (o que pode levar a malignidades) e o ajuste e reajuste de pro- gramas epigenéticos. Com base nestas observações, acredita-se que a organização arquite- tônica de DNA no núcleo celular seja uma contribuinte chave para a função genômica.
Diferentes ensaios foram desenvolvidos para permitir uma compreensão da organi- zação espacial dos Ioci genômicos in vivo. Foi desenvolvido um ensaio, denominado RNA- TRAP (Carter et al. (2002) Nat. Genet. 32, 623), que envolve o alvejamento de peroxidase de raiz forte (HRP) para transcrições de RNA nascente, seguido por quantificação de depo- sição de biotina catalisada por HRP na cromatina ao redor.
Um outro ensaio que foi desenvolvido é denominado tecnologia de captura de con- formação de cromossomo (3C), que fornece uma ferramenta para estudar a organização estrutural de uma região genômica. A tecnologia 3C envolve análise por PCR quantitativa de frequências de reticulação entre dois dados fragmentos de restrição de DNA, que fornece uma medida de sua proximidade no espaço nuclear (ver figura 1). Originalmente desenvol- vida para analisar a conformação de cromossomos em levedura (Dekker et al., 2002), esta tecnologia foi adaptada para investigar o relacionamento entre expressão de gene e dobra- mento de cromatina em agrupamentos de gene de mamífero intricados (ver, por exemplo, Tolhuis et al., 2002; Paistra et al., 2003; e Drissen et al., 2004). Resumidamente, a tecnolo- gia 3C envolve in vivo reticulação de formaldeído de células e digestão nuclear de cromatina 5 com uma enzima de restrição, seguida por ligação de fragmentos de DNA que foram reticu- Iados em um complexo. Os produtos de ligação são a seguir quantificados por PCR. A etapa de amplificação por PCR exige o conhecimento da informação da seqüência para cada um dos fragmentos de DNA que devem ser amplificados. Assim, a tecnologia 3C fornece uma medida de frequências de interação entre os fragmentos de DNA selecionados.
A tecnologia 3C foi desenvolvida para identificar elementos de interação entre par-
tes selecionadas do genoma e ambas as técnicas exigem o desenho de iniciadores para todos os fragmentos de restrição analisados. Recentemente, foram desenvolvidas novas estratégias que permitem triar o genoma total de uma maneira não tendenciosa para seg- mentos de DNA que interagem fisicamente com um fragmento de DNA de escolha. Elas são 15 baseadas na tecnologia 3C e são coletivamente referidas como “tecnologia 4C”. A tecnolo- gia 4C permite a triagem do genoma total de uma maneira não tendenciosa para segmentos de DNA que interagem fisicamente com um fragmento de DNA de escolha. A tecnologia 4C depende da ligação seletiva de fragmentos de DNA reticulado em um fragmento de restrição de escolha (a “isca”). Na tecnologia 4C, todos os fragmentos de DNA capturados pela isca 20 na população de células são simultaneamente amplificados por meio de PCR inversa, usan- do dois iniciadores específicos de isca que amplificam a partir de produtos de ligação circu- lares.
Essencialmente, duas estratégias podem ser adotadas para obter estes círculos de DNA. Uma estratégia baseia-se na formação de círculos durante a etapa de ligação 3C pa- drão, isto é, enquanto o DNA ainda é reticulado (Zhao et al. (2006) Nat Genet 38, 1341-7). Aqui, a formação de círculo exige que ambas as extremidades do fragmento isca sejam li- gadas em ambas as extremidades de um fragmento de restrição capturado. Se múltiplos fragmentos de restrição forem reticulados um no outro, os círculos ainda podem ser forma- dos, mas eles podem conter mais que um fragmento capturado e, portanto, serão maiores. Após a desreticulação, os fragmentos de DNA capturados são amplificados diretamente por PCR inversa, usando iniciadores específicos de isca voltados para fora. Enzimas de restri- ção que reconhecem quatro ou seis pares de bases podem ser usadas nesta configuração. Cortadores quatro são preferidos neste método, embora, uma vez que eles produzem frag- mentos de restrição menores (tamanho médio 256 bp, versus ~4 kb para cortadores seis) e a amplificação por PCR linear dos fragmentos de DNA capturados exige que o tamanho médio do produto seja pequeno. Essencialmente, este método compreende, portanto, as etapas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado com uma enzima de restrição primária, tal como um cortador de 4 bp ou um de 5 bp; (c) ligar as seqüências de nucleotídeos reticulados; (d) inverter a reticulação e (e) amplificar uma ou mais seqüências de nucleotídeos de interesse usando pelo menos dois oligonucleotídeos iniciadores, em que cada iniciador hibridiza nas seqüências de DNA que flanqueiam as se- qüências de nucleotídeos de interesse. A(s) sequência(s) amplificada(s) pode(m) ser hibridi- zada(s) em um arranjo afim de auxiliar na determinação da frequência de interação entre as seqüências de DNA.
A segunda estratégia baseia-se vantajosamente na formação de círculos de DNA após a cromatina ter sido desreticulada da maneira aqui descrita e em nosso pedido co- pendente W02007/004057. Da maneira aqui descrita, a tecnologia 4C permite uma pesqui- sa genômica não tendenciosa de fragmentos de DNA que interagem com um Iocus de esco- lha. Resumidamente, a análise 3C é realizada de maneira usual, mas omitindo a etapa de PCR. O molde de 3C contém uma seqüência alvo ou “isca” (por exemplo, um fragmento de restrição de escolha que inclui um gene selecionado) ligada a muitas diferentes seqüências de nucleotídeos de interesse (representando este ambiente genômico do gene). O molde é clivado por uma outra enzima de restrição secundária e, subsequentemente, religado para formar círculos de DNA pequenos. Vantajosamente, uma ou mais seqüências de nucleotí- deos de interesse que estão ligadas à seqüência de nucleotídeos alvo são amplificadas u- sando pelo menos dois oligonucleotídeos iniciadores, em que pelo menos um iniciador hibri- diza na seqüência alvo. Preferivelmente, o segundo iniciador também hibridiza na seqüência alvo, de maneira tal que ambos os iniciadores flanqueiam o nucleotídeo de interesse. Alter- nativamente, o segundo iniciador hibridiza em uma seqüência adaptadora que está ligada ao sítio de restrição secundária, de maneira tal que os dois iniciadores flanqueiam o nucleotí- deo de interesse. Tipicamente, isto produz um padrão de fragmentos de PCR que é alta- mente reprodutível entre reações de amplificação independentes e específico para um dado tecido. Hindlll e Dpnll podem ser usados como enzimas de restrição primária e secundária. A seguir, os fragmentos amplificados podem ser marcados e, opcionalmente, hibridizados em um arranjo, tipicamente contra uma amostra controle contendo DNA genômico digerido com a mesma combinação de enzimas de restrição. Portanto, a tecnologia 3C foi modificada de maneira tal que todas as seqüências de nucleotídeos de interesse que interagem com uma seqüência de nucleotídeos alvo sejam amplificadas. Praticamente, isto significa que em vez de realizar uma reação de amplificação com iniciadores que são específicos para os fragmentos que deseja-se analisar, uma amplificação é realizada usando oligonucleotídeo(s) iniciador(s) que hibridiza(m) em uma seqüência de DNA que flanqueia as seqüências de nucleotídeos de interesse. Vantajosamente, 4C não é tendenciosa para o desenho de inicia- dores de PCR que estão incluídos na etapa de amplificação por PCR e, portanto, podem ser usados para pesquisar os elementos de DNA interagentes no genoma completo. Existe uma importante necessidade da tecnologia de alto desempenho que possa triar sistematicamente todo o genoma de uma maneira não tendenciosa para os Ioci de DNA que fazem contato um com o outro no espaço nuclear.
Além disso, existe uma necessidade de melhorias em tais tecnologias que permi- tem a análise simultânea de múltiplas interações que ocorrem com múltiplas seqüências no genoma, e de analisar o genoma para inserções, deleções, translocações, inversões e rear- ranjos que ocorrem em locais desconhecidos e que podem estar associados a uma doença.
A presente invenção busca fornecer melhorias na tecnologia 3C e 4C e técnicas re- lacionadas a isto.
Sumário da invenção
A tecnologia 3C aplicada atualmente permite apenas análise de um número limitado de interações DNA-DNA selecionadas em virtude das limitações da etapa de amplificação por PCR1 que exige conhecimento de informação da seqüência específica para cada frag- mento a ser analisado. Além disso, a seleção de fragmentos de restrição como candidatos 15 para interações de DNA de longo alcance exige uma quantidade substancial de conheci- mento anterior (por exemplo, a localização de sítios hipersensíveis) dos Iocus de interesse, que normalmente não é disponível. Dada a relevância funcional de muitas interações DNA- DNA de longo alcance descritas até agora, a capacidade de triar aleatoriamente elementos de DNA que laçam uma seqüência de interesse, tal como um promotor, melhorador, isolan- 20 te, silenciador, origem de replicação ou MAR/SAR de gene, ou uma região genômica de interesse, tal como uma região densa em gene ou pobre em gene ou elemento repetitivo, pode facilitar bastante o mapeamento de seqüências envolvidas em uma rede regulatória.
A presente invenção diz respeito a tecnologia 4C (isto é, captura e caracteriza cro- matina co-localisada) e melhorias nessa, que permitem a análise de alto desempenho da 25 frequência de interação de duas ou mais seqüências de nucleotídeos no espaço nuclear. A tecnologia 4C pode ser usada para identificar interações DNA-DNA de longo alcance (por exemplo, estudar dobramento de cromossomo), mas também para identificar rearranjos ge- nômicos equilibrados e desequilibrados, tais como translocações, inversões, deleções, am- plificações, etc., que podem fundamentar um traço ou doença em sujeitos humanos.
Rotineiramente, a tecnologia 4C envolve o uso de microarranjos para analisar os
fragmentos de DNA capturados por uma única seqüência alvo selecionada (“isca”) (Simonis et al., Nature Genetics 2006). Os microarranjos têm a desvantagem que eles oferecem uma faixa dinâmica limitada, uma vez que sondas presentes nos arranjos podem ser saturadas, o que torna uma análise quantitativa de intensidades de sinal mais difícil. O sequenciamento 35 de alto desempenho evita este problema, já que ele oferece uma faixa dinâmica ilimitada. É também quantitativo, uma vez que ele fornece números absolutos de seqüências.
Além do mais, é preferível analisar interações de DNA com múltiplas seqüências al- vos simultaneamente. Isto é válido para todas as aplicações a base de 4C e, em particular, para a análise a base de 4C de rearranjos genômicos. A tecnologia 4C pode ser usada co- mo uma ferramenta de diagnóstico para permitir a varredura do genoma total de uma manei- ra não tendenciosa a procura da presença de rearranjos genômicos. Uma série de seqüên- cias alvos ao longo de cada cromossomo que captura ao mesmo tempo todas as seqüên- cias (isto é, fragmentos de restrição) pode ser usada. Subsequentemente, afim de identificar o rearranjo genômico, é identificada a seqüência que foi capturada por qual “isca”.
Os fragmentos capturados podem ser sequenciados para cada seqüência alvo (“is- ca”) separadamente. Embora, preferivelmente, todos os produtos de ligação formados com todas as seqüências alvos sejam analisados simultaneamente. Para isto, cada leitura preci- sa ser direcionada à junção de ligação e fornece informação da seqüência suficiente para identificar inambiguamente tanto a seqüência alvo quanto a seqüência capturada.
Aspectos sumários da presente invenção
Os aspectos da presente invenção são apresentados nas reivindicações em anexo.
Em um primeiro aspecto, é fornecido um método para analisar a frequência de inte- ração de uma seqüência de nucleotídeos alvo com uma ou mais seqüências de nucleotí- deos de interesse (por exemplo, um ou mais Ioci genômicos) compreendendo as etapas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências de nucleotídeos reticulados; (d) inverter a reti- culação; (e) digerir opcionalmente as seqüências de nucleotídeos com uma enzima de res- trição secundária; (f) ligar opcionalmente uma ou mais seqüências de DNA de composição de nucleotídeo conhecida ao(s) sítio(s) de digestão de enzima de restrição secundária dis- poníveis) que flanqueia(m) uma ou mais seqüências de nucleotídeos de interesse; (g) am- plificar uma ou mais seqüências de nucleotídeos de interesse usando pelo menos dois oli- gonucleotídeos iniciadores, em que cada iniciador hibridiza as seqüências de DNA que flan- queiam as seqüências de nucleotídeos de interesse; (h) hibridizar na(s) sequência(s) ampli- ficada^) em um arranjo; e (i) determinar a frequência de interação entre as seqüências de DNA.
Em um segundo aspecto, é fornecido um método para analisar a frequência de inte- ração de uma seqüência de nucleotídeos alvo com uma ou mais seqüências de nucleotí- deos (por exemplo, um ou mais Ioci genômicos) compreendendo as etapas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências de nucleotídeos reticulados; (d) inverter a reticulação; (e) digerir opcionalmente as seqüências de nucleotídeos com uma enzima de restrição secun- dária; (f) circular as seqüências de nucleotídeos; (g) amplificar uma ou mais seqüências de nucleotídeos que estão ligadas à seqüência de nucleotídeos alvo; (h) hibridizar opcional- mente nas seqüências amplificadas em um arranjo ou analisar as seqüências amplificadas pelo sequenciamento de alto desempenho; e (i) determinar a frequência de interação entre as seqüências de DNA.
Em um terceiro aspecto, é fornecido um método para identificar uma ou mais inte- rações DNA-DNA que são indicativas de uma condição de doença particular compreenden- 5 do a etapa de realizar as etapas (a)-(i) do método de acordo com o primeiro aspecto, em que na etapa (a) uma amostra de DNA reticulado é fornecida a partir de uma célula doente e uma não doente, e em que uma diferença entre a frequência de interação entre as seqüên- cias de DNA das células doentes e não doentes indica uma diferença na organização linear dos moldes do cromossomo (por exemplo, um rearranjo genômico), que é indicativa de um 10 traço particular ou condição de doença.
Em um quarto aspecto, é fornecido um método de diagnose ou prognose de uma doença ou síndrome causada ou associada a uma mudança em uma interação DNA-DNA, compreendendo a etapa de realizar as etapas (a)-(i) do método de acordo com o primeiro aspecto, em que a etapa (a) compreende fornecer uma amostra de DNA reticulado de um 15 sujeito; e em que a etapa (i) compreende comparar a frequência de interação entre as se- qüências de DNA com aquelas de um controle não afetado; em que uma diferença entre o valor obtido do controle e o valor obtido do sujeito é indicativa que o sujeito está sofrendo da doença ou síndrome ou é indicativa que o sujeito sofrerá da doença ou síndrome.
Em um quinto aspecto, é fornecido um método de diagnose ou prognose de uma 20 doença ou síndrome causada ou associada a uma mudança em uma interação DNA-DNA compreendendo a etapa de: realizar as etapas (a)-(i) do método de acordo com o primeiro aspecto, em que a etapa (a) compreende fornecer uma amostra de DNA reticulado de um sujeito; e em que o dito método compreende a etapa adicional de: (j) identificar um ou mais Ioci que foram submetidos a um rearranjo genômico que está associado com uma doença.
Em um sexto aspecto, é fornecido um método de ensaio para identificar um ou mais
agentes que modulam uma interação DNA-DNA compreendendo as etapas de: (a) colocar uma amostra em contato com um ou mais agentes; e (b) realizar as etapas (a) a (i) do mé- todo de acordo com o primeiro aspecto, em que a etapa (a) compreende fornecer DNA reti- culado da amostra; em que uma diferença entre (i) a frequência de interação entre as se- 30 quências de DNA na presença do agente e (ii) a frequência de interação entre as seqüên- cias de DNA na ausência do agente é indicativa de um agente que modula a interação DNA- DNA.
Em um sétimo aspecto, é fornecido um método para detectar o local de um rearran- jo equilibrado e/ou desequilibrado (por exemplo, uma translocação) compreendendo a etapa de: (a) realizar as etapas (a) a (i) do método de acordo com o primeiro aspecto; e (b) compa- rar a frequência de interação entre as seqüências de DNA com aquelas de um controle; em que uma transição de baixa ou alta frequência de interação DNA-DNA na amostra compara- da ao controle é indicativa do local de um ponto de quebra.
Em um oitavo aspecto, é fornecido um método para detectar o local de uma inver- são equilibrada e/ou desequilibrada compreendendo as etapas de: (a) realizar as etapas (a) a (i) do método de acordo com o primeiro aspecto; e (b) comparar a frequência de interação 5 entre as seqüências de DNA com aquelas de um controle; em que um padrão inverso de frequências de interação DNA-DNA para a amostra comparada ao controle é indicativo de uma inversão.
Em um nono aspecto, é fornecido um método para detectar o local de uma deleção compreendendo as etapas de: (a) realizar as etapas (a) a (i) do método de acordo com o primeiro aspecto; e (b) comparar a frequência de interação entre as seqüências de DNA com aquelas de um controle; em que uma redução na frequência de interação DNA-DNA para a amostra comparada ao controle é indicativa de deleção.
Em um décimo aspecto, é fornecido um método para detectar o local de uma dupli- cação compreendendo as etapas de: (a) realizar as etapas (a) a (i) do método de acordo 15 com o primeiro aspecto; e (b) comparar a frequência de interação entre as seqüências de DNA com aquelas de um controle; em que um aumento ou uma diminuição na frequência de interação DNA-DNA para a amostra em questão comparada ao controle é indicativo de uma duplicação ou inserção.
Em um décimo primeiro aspecto, é fornecido um agente obtido ou obtenível pelo método de ensaio aqui descrito.
Em um décimo segundo aspecto, é fornecido um método para analisar a frequência de interação de uma ou mais seqüências alvos de nucleotídeos com uma ou mais seqüên- cias de nucleotídeos de interesse (por exemplo, um ou mais Ioci genômicos) compreenden- do as etapas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado 25 com uma enzima de restrição primária; (c) ligar as seqüências de nucleotídeos reticulados; (d) inverter a reticulação; e (e) sequenciar as seqüências de nucleotídeos ligadas.
Em um décimo terceiro aspecto, é fornecido um método para determinar a presen- ça de um rearranjo genômico em uma amostra compreendendo as etapas de: (a) fornecer uma amostra de ácido nucléico (por exemplo, DNA genômico), em que o dito ácido nucléico 30 compreende uma seqüência de nucleotídeos de seqüência conhecida adjacente ao local do rearranjo genômico suspeito; (b) digerir o DNA com uma enzima de restrição primária para formar uma pluralidade de fragmentos de restrição; (c) purificar opcionalmente os fragmen- tos de restrição; (d) ligar os fragmentos de restrição para formar DNA circular; (e) purificar opcionalmente o DNA circular; (f) digerir o DNA circular com uma enzima de restrição se- 35 cundária para formar uma pluralidade de fragmentos de restrição; (g) ligar os fragmentos de restrição para formar DNA circular; (h) amplificar o rearranjo genômico suspeito usando um ou mais iniciadores que hibridizam na seqüência de nucleotídeos de seqüência conhecida; e (i) sequenciar o rearranjo genômico suspeito.
Em um décimo quarto aspecto, é fornecida uma base de dados de seqüência de á- cidos nucléicos de cerca de 6-50 pares de bases que flanqueiam diretamente e, opcional- mente, incluem o sítio de reconhecimento de enzima de restrição primária ou o sítio de re- conhecimento de enzima de restrição secundária de cada seqüência alvo.
Em um décimo quinto aspecto, é fornecida uma base de dados de seqüência de á- cidos nucléicos de cerca de 12- 50 pares de bases que flanqueiam diretamente todos os sítios de reconhecimento de enzima de restrição primária e secundária relevantes no geno- ma.
Em um décimo sexto aspecto, é fornecido o uso da base de dados de seqüência de
ácidos nucléicos para determinar a posição genômica de cada uma das seqüências captu- radas identificadas.
Em um décimo sétimo aspecto, é fornecido um método ou um agente ou uma base de dados ou um uso substancialmente da maneira aqui descrita e com relação a qualquer
dos exemplos ou figuras.
Modalidades da invenção
Adequadamente, a reação de ligação na etapa (c) ou (f) resulta na formação de cír- culos de DNA.
Adequadamente, a etapa (h) compreende a análise de produtos de ligação entre
seqüências alvos e seqüências reticuladas de interesse por meio de sequenciamento (por exemplo, o sequenciamento de alto desempenho).
Adequadamente, o método é para analisar a frequência de interação de duas ou mais seqüências alvos de nucleotídeos com uma ou mais seqüências de nucleotídeos de interesse, compreendendo o uso de PCR multiplex na etapa (g).
Adequadamente, o método é para analisar a frequência de interação de duas ou
mais seqüências alvos de nucleotídeos com uma ou mais seqüências de nucleotídeos de interesse, compreendendo o agrupamento de alguns ou todos os produtos de PCR obtidos para cada uma das seqüências alvos na etapa (g) e análise simultânea subsequente de su- as interações de DNA.
Adequadamente, duas ou mais seqüências amplificadas são marcadas diferencial-
mente antes do agrupamento e análise por hibridização em um arranjo.
Adequadamente, duas ou mais seqüências amplificadas identicamente marcadas e analisadas por hibridização em um arranjo quando as seqüências estão em cromossomos diferentes.
Adequadamente, duas ou mais seqüências amplificadas são identicamente marca-
das quando as seqüências residem no mesmo cromossomo em uma distância que é grande o suficiente para sobreposição mínima entre sinais de interação DNA-DNA. Adequadamente, sequenciamento de alto desempenho é usado para analisar as junções de ligação formadas entre seqüências alvos e seqüências capturadas de interesse.
Adequadamente, o sequenciamento é direcionado às junções de ligação formadas entre seqüências alvos e seqüências capturadas de interesse pela adição de seqüências 5 adaptadoras exigidas para o sequenciamento nas extremidades das seqüências amplifica- das.
Adequadamente, o sequenciamento é direcionado às junções de ligação formadas entre seqüências alvos e seqüências capturadas de interesse pela adição das seqüências adaptadoras completas, ou parte delas, exigidas para sequenciamento como projeções 5’ nos oligonucleotídeos iniciadores usados para amplificar uma ou mais seqüências de nucle- otídeos de interesse.
Adequadamente, o sequenciamento é direcionado às junções de ligação formadas entre seqüências alvos e seqüências capturadas de interesse pela conjugação de uma substância de biotina ou outra fração nos oligonucleotídeos iniciadores usados para amplifi- car uma ou mais seqüências de nucleotídeos de interesse, seguida por purificação mediada por estreptavidina ou mediada de outra forma do material amplificado por PCR.
Adequadamente, o sequenciamento é direcionado às junções de ligação entre se- qüências alvos e seqüências capturadas de interesse desenhando os oligonucleotídeos ini- ciadores usados para amplificar uma ou mais seqüências de nucleotídeos de interesse em 20 400, 300, 200, 150, 100, 90, 80 70, 60, 50, 40, 30, 20, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 nucleotí- deos do(s) sítio(s) de reconhecimento de enzima de restrição primária e/ou secundária ana- lisados.
Adequadamente, o sequenciamento é direcionado às junções de ligação entre se- qüências alvos e seqüências capturadas de interesse desenhando os oligonucleotídeos ini- ciadores usados para amplificar uma ou mais seqüências de nucleotídeos de interesse, de maneira tal que elas se sobrepõem parcial ou completamente com o sítio de reconhecimen- to de enzima de restrição primária e/ou secundária analisado.
Adequadamente, as seqüências são lidas através da junção de ligação, de maneira tal que, quando as amostras de PCR multiplexadas ou agrupadas são analisadas, é obtida informação da seqüência suficiente (por exemplo, 12 nucleotídeos ou mais) em cada lado da junção de ligação para identificar inambiguamente cada seqüência alvo e cada seqüência capturada de interesse.
Adequadamente, a seqüência de nucleotídeos alvo é selecionada do grupo que consiste em um rearranjo genômico, promotor, um melhorador, um silenciador, um isolante, uma região de anexação de matriz, uma região controle de locus, uma unidade de transcri- ção, uma origem de replicação, um ponto quente de recombinação, um ponto de quebra de translocação, um centrômero, um telômero, uma região densa em gene, uma região pobre em gene, um elemento repetitivo e um sítio de integração (viral). Adequadamente, a seqüência de nucleotídeos alvo é uma seqüência de nucleotí- deos que está associada ou causa uma doença, ou está localizada em até 15 Mb ou mais em um molde de DNA linear de um Iocus que está associado ou causa uma doença.
Adequadamente, a seqüência de nucleotídeos alvo é selecionada do grupo que consiste em: AMU, MLL, MYC, BCL1 BCR, ABLI, IGH, LYLI, TALI, TAL2, LM02, TCRa/δ, TCRfi e HOX ou outros Ioci associados à doença descritos em "Catalogue of Balanced C- hromossome Aberrations in Man" 2nd edition. Albert Schinzel. Berlin: Walter de Gruyter, 2001. ISBN 3-11-011607-3.
Adequadamente, as seqüências alvos são distribuídas ao longo do molde de ge- noma linear, de maneira tal que as seqüências de interação cubram todo um cromossomo ou o genoma.
Adequadamente, a enzima de restrição primária é uma enzima de restrição que re- conhece um sítio de reconhecimento de 6-8 bp.
Adequadamente, a enzima de restrição primária é selecionada do grupo que con- siste em BgRI, Hindlll, BamHI, BamHI, Spel, Pstle Ndel.
Adequadamente, a enzima de restrição primária é selecionada com base na sua ausência ou em representação nas seqüências repetitivas.
Adequadamente, a enzima de restrição secundária é uma enzima de restrição que reconhece um sítio de reconhecimento de seqüência de nucleotídeos de 4 ou 5 bp.
Adequadamente, o sítio de reconhecimento de enzima de restrição secundária está localizado a mais que cerca de 350 bp do sítio de restrição primária na seqüência de nucleo- tídeos alvo.
Adequadamente, uma transição de baixas para altas frequências de interação é in- dicativa do local de um rearranjo genético equilibrado ou desequilibrado.
Adequadamente, um padrão inverso de frequências de interação DNA-DNA para a amostra em questão comparada ao controle é indicativa de uma inversão equilibrada e/ou desequilibrada.
Adequadamente, uma redução na frequência de interação DNA-DNA para a amos- tra em questão comparada ao controle, em combinação com um aumento na frequência de interação DNA-DNA para regiões mais distantes, é indicativa de uma deleção equilibrada e/ou desequilibrada.
Adequadamente, um aumento ou uma diminuição na frequência de interação DNA- DNA para a amostra em questão comparada ao controle é indicativa de uma duplicação ou inserção equilibrada e/ou desequilibrada.
Adequadamente, cariotipagem espectral e/ou FISH são usadas antes de realizar o dito método. Adequadamente, a doença é uma doença genética.
Adequadamente, a doença é câncer.
Adequadamente, seqüências de nucleotídeos que interagem com duas ou mais se- qüências alvos são amplificadas.
Adequadamente, as seqüências alvos estão posicionadas nos Ioci genômicos co-
nhecidos por ser associados a uma condição doente, ou próximos a eles.
Adequadamente, as seqüências alvos são selecionadas sem conhecimento prévio do local de um rearranjo e são espaçadas de maneira tal que as seqüências de interação cubram todo um cromossomo ou o genoma, e em que as seqüências de interação identifi- cadas permitem a reconstrução de mapas cromossômicos lineares e rearranjos genômicos que ocorreram nos cromossomos e entre os mesmos.
Adequadamente, as seqüências amplificadas são marcadas.
Adequadamente, as seqüências amplificadas são marcadas diferencialmente de acordo com sua posição no genoma.
Adequadamente, o método é para a detecção de um rearranjo, translocação, inver-
são, deleção, duplicação ou inserção equilibrados e/ou desequilibrados.
Adequadamente, a etapa de hibridização do arranjo é substituída com uma etapa de sequenciamento.
Adequadamente, tanto a seqüência de nucleotídeos alvo quanto a seqüência de nucleotídeos de interesse são identificadas por sequenciamento.
Adequadamente, seqüências adaptadoras estão ligadas aos produtos de PCR.
Adequadamente, seqüências que interagem com duas ou mais seqüências alvos são cada qual amplificadas em reações de PCR separadas.
Adequadamente, seqüências que interagem com duas ou mais seqüências alvos são cada qual amplificadas em reações de PCR separadas e subsequentemente agrupadas para análise simultânea.
Adequadamente, seqüências que interagem com duas ou mais seqüências alvos são amplificadas por PCR multiplex.
Vantagens
A presente invenção tem inúmeras vantagens. Estas vantagens ficarão aparentes
na seguinte descrição.
A título de exemplo, a tecnologia 4C pode ser multiplexada, de maneira tal que inte- rações com duas ou mais seqüências alvos possam ser analisadas em um experimento úni- co, por exemplo, em um arranjo único.
A título de exemplo adicional, a tecnologia 4C multiplexada pode ser usada para tri-
ar rearranjos no DNA genômico em todo o genoma, em posições desconhecidas.
A título de exemplo adicional, o sequenciamento de alto desempenho pode ser u- sado no lugar de microarranjos para analisar os fragmentos de DNA capturados. As melho- rias na multiplexação e sequenciamento podem ainda ser cominadas.
A título de exemplo adicional, em vez de multiplexação, as seqüências de interesse capturadas por seqüências alvos diferentes podem ser amplificadas para cada seqüência alvo separadamente e, a seguir, agrupadas subsequentemente para serem analisadas si- multaneamente em um microarranjo.
A título de exemplo adicional, em vez de multiplexação, seqüências de interesse capturadas por seqüências alvos diferentes podem ser amplificadas separadamente para cada seqüência alvo e agrupadas subsequentemente para serem analisadas simultanea- mente por sequenciamento de alto desempenho.
A título de exemplo, a presente invenção é vantajosa, uma vez que ela fornece inter alia seqüências de nucleotídeos, processos, sondas e arranjos comercialmente usados.
A título de exemplo adicional, a presente invenção é vantajosa, uma vez que ela permite a análise de alto desempenho da frequência de interação de duas ou mais seqüên- cias de nucleotídeos no espaço nuclear.
A título de exemplo adicional, a presente invenção é vantajosa, uma vez que, usan- do a tecnologia 3C convencional, cada interação DNA-DNA simples tem que ser analisada por uma reação de PCR exclusiva contendo um par exclusivo de iniciadores. Portanto, a análise de alto desempenho é possível apenas se a PCR for automatizada, mas os custos de muitos iniciadores serão muito altos. Dessa maneira, análise de alto desempenho (ge- nômica) de interações DNA-DNA não é viável com a tecnologia 3C convencional. Ao contrá- rio, a presente invenção permite atualmente a triagem simultânea de milhares de interações DNA-DNA. A análise de alto desempenho de interações DNA-DNA, de acordo com a pre- sente invenção aumentarão bastante a escala e resolução de análise.
A título de exemplo adicional, a presente invenção é vantajosa, uma vez que, usan- do a tecnologia 3C convencional, a triagem é tendenciosa para aquelas seqüências de DNA para as quais os oligonucleotídeos iniciadores foram desenhados, ordenados e incluídos na análise.
A escolha de tais oligonucleotídeos iniciadores baseia-se tipicamente no conheci- mento acerca da posição, por exemplo, de melhoradores (distante) e/ou outros elementos regulatórios/sítios hipersensíveis que acredita-se reticularão com a seqüência de nucleotí- deos que está sendo investigada. Assim, 3C convencional é tendenciosa para o desenho de iniciadores de PCR que estão incluídos na etapa de amplificação por PCR, considerando que 4C é não tendenciosa e pode ser usada para pesquisar o genoma completo elementos de DNA interagentes. Isto se dá em virtude de a amplificação de seqüências reticuladas em 4C não basearem-se no conhecimento predito de seqüências que reticulam com a seqüên- cia de nucleotídeos que está sendo investigada. Preferivelmente, em uma modalidade de 4C, seqüências que reticuiam na primeira seqüência de nucleotídeos (alvo) podem ser am- plificadas usando iniciadores de PCR que hibridizam nessa seqüência de nucleotídeos. As- sim, a presente invenção permite uma triagem genômica não tendenciosa para interações DNA-DNA.
A título de exemplo adicional, a presente invenção é vantajosa em decorrência de
que usar a tecnologia 3C convencional permite apenas a amplificação seletiva de uma inte- ração DNA-DNA única. Isto não é informativo durante a hibridização em um arranjo. A tec- nologia foi melhorada de maneira tal que todos os fragmentos que interagem com uma pri- meira seqüência de nucleotídeos (alvo) são amplificados atualmente, por exemplo, amplifi-
cados seletivamente.
A título de exemplo adicional, a presente invenção é vantajosa em decorrência de a tecnologia 4C poder ser usada para detectar aberrações genéticas equilibradas ou desequi- libradas, tais como todos os tipos de translocações, deleções, inversões, duplicações e ou- tros rearranjos genômicos no ácido nucléico, por exemplo, cromossomos. A tecnologia 4C (que mede a proximidade de fragmentos de DNA) pode ainda determinar uma predisposição do sujeito em adquirir certas translocações, deleções, inversões, duplicações e outros rear- ranjos genômicos (por exemplo, translocações, deleções, inversões, duplicações e outros rearranjos genômicos equilibrados ou desequilibrados). Uma vantagem com relação as es- tratégias atuais é que não exige-se conhecer a posição exata da mudança em decorrência de a resolução da tecnologia 4C ser de maneira tal que ela possa ser usada para detectar rearranjos mesmo quando a “isca 4C” (definida pelos sítios de reconhecimento da enzima de restrição primária e secundária que são analisados) é localizada longe (por exemplo, até uma megabase ou ainda mais) da mudança. Uma outra vantagem com relação as estraté- gias atuais é que elas permitem uma pesquisa de genômica não tendenciosa simultânea tanto para rearranjos genômicos equilibrados quanto desequilibrados. Uma outra vantagem é que a tecnologia 4C permite o mapeamento exato de mudanças, uma vez que ela pode ser usada para definir os dois sítios de restrição (primários) entre os quais as mudanças ocorreram. Uma outra vantagem é que células necessitam não ser cultivadas antes da fixa- ção. Assim, por exemplo, tumores sólidos também podem ser analisados por rearranjos ge- nômicos.
A título de exemplo adicional, a presente invenção é vantajosa em decorrência de a tecnologia 4C também poder detectar mudanças (por exemplo, rearranjos) em uma condi- ção pré-maligna, isto é, antes de todas as células conterem estas mudanças. Assim, a tec- nologia pode ser usada não apenas no diagnóstico da doença, mas também no prognóstico da doença.
A título de exemplo adicional, o desenho do arranjo de acordo com a presente in- venção é particularmente vantajoso comparado aos arranjos de Iadrilhamento existentes, tais como arranjos genômicos de Iadrilhamento de Nimblegen, uma vez que o desenho per- mite a representação de uma parte muito maior do genoma por arranjo único.
A título de exemplo, para uma enzima de restrição que reconhece uma seqüência de hexa-nucleotídeos, cerca de 3 arranjos com cerca de 385.000 sondas serão cada qual suficientes para cobrir, por exemplo, o genoma humano ou de camundongo completo. Para uma enzima de restrição que reconhece mais que 6 bp, um arranjo único de cerca de
385.000 sondas pode ser usado para cobrir, por exemplo, o genoma humano ou de camun- dongo completo. As vantagens do desenho do arranjo são que: (1) cada sonda é informati- va, uma vez que cada uma analisa um evento de ligação independente, facilitando bastante a interpretação dos resultados; e (2) uma grande representação do genoma pode ser apon- tada em um arranjo único que é barato.
A tecnologia 4C pode ser usada vantajosamente para o mapeamento fino de rear- ranjos fracamente caracterizados detectados originalmente por abordagens citogenéticas (microscopia ótica, FISH, SKY, etc.).
A tecnologia 4C pode ser usada vantajosamente para a triagem simultânea, em um arranjo único, de combinações de rearranjos que ocorreram próximos aos múltiplos loci.
Descrição resumida das figuras
Figura 1
O princípio da tecnologia 3C
Figura 2
(a) O princípio de uma modalidade da tecnologia 4C. A análise 3C é realizada de maneira usual com, por exemplo, Hindlll (H) como enzima de restrição. Após inversão das reticulações, a mistura de DNA conterá uma primeira seqüência de nucleotídeos (alvos) li- gada a muitos fragmentos diferentes. Estes fragmentos serão amplificados e marcados u- sando métodos de amplificação, tal como PCR inversa, por exemplo, em círculos de DpnW, usando primeiro iniciadores específicos da seqüência de nucleotídeos (alvos). Produtos de amplificação marcados podem ser hibridizados nos arranjos da maneira aqui descrita. Hindl-
Il e Dpnll são fornecidas como exemplos, mas outras combinações de enzimas de restrição, tais como cortadores 6 ou 8, e 4 ou 5, também podem ser usadas, (b) resultados de PCR separados por eletroforese em gel de duas amostras independentes de fígado (L1, L2) e cérebro fetais (B1, B2), (c) Representação esquemática do local das sondas de microarran- jo. As sondas foram desenhadas em 100 bp de sítios HindlII. Assim, cada sonda analisa um possível parceiro de ligação.
Figura 3
A tecnologia 4C detecta o ambiente genômico de Rad23A (cromossomo 8). Razões não processadas são mostradas (sinais de 4C para Rad23A dividido pelo sinal obtido para amostra controle) por sondas localizadas em regiões genômicas -15 Mb ou mais no cro- mossomo de camundongo 10, 11, 12, 14, 15, 7 e 8 (de cima para baixo; as regiões mostra- das estão na mesma distância de cada centrômero correspondente). Note o grande agru- pamento de fortes sinais ao redor da isca (Rad23A) no cromossomo 8 (linha 7), que de- monstra que a tecnologia 4C detecta fragmentos genômicos próximos ao molde do cromos- 5 somo linear (de acordo com o fato de que frequências de interação são inversamente pro- porcionais à separação do sítio genômico). Note que a região ligada em c/s ao redor da isca que mostra altas intensidades de sinal é grande (>5Mb), sugerindo, por exemplo, que trans- locações podem ser detectadas mesmo com iscas maiores que 1MB distante do ponto de quebra.
Figura 4
As interações 4C de /?-globina no cromossomo 7 (-135 Mb) para um tecido de transcrição (fígado fetal) e um tecido de não transcrição (cérebro fetal) (analisados por uma abordagem de média corrida). Note que interações de longo alcance com /?-globina diferem entre tecidos (dependendo provavelmente do estado de transcrição do gene). Independendo do tecido, sinais 4C fortes demarcam uma grande região (>5 Mb) ao redor da isca.
Figura 5
Uros e Eraf interagem com /?-globina em células hepáticas fetais. A abordagem 4C revela que dois genes, Eraf e Uros, interagem mais que >30 Mb com o Iocus de /?-globina localizado -30 Mb distante. Estas duas interações foram previamente percebidas por uma 20 tecnologia (Hibridização in situ por fluorescência) descrita em Osborne et al., Nature Gene- tics 36, 1065 (2004). Este exemplo mostra que interações de longo alcance detectadas por tecnologia 4C podem ser verificadas por FISH e refletem verdadeiramente proximidade nu- clear.
Figura 6
A tecnologia 4C identifica exatamente transições entre regiões genômicas não rela-
cionadas que estão ligadas em cis. Foram usados para estes experimentos camundongos transgênicos que contêm um cassete de região controle de Iocus (LCR) de /?-globina huma- na (-20 kb) inserido (por meio de recombinação homóloga) no Iocus Rad23A no cromosso- mo de camundongo 8. A tecnologia 4C foi realizada em fígados fetais E 14.5 de camundon- 30 gos transgênicos que foram homozigotos para esta inserção. Um fragmento Hind\\\ no cas- sete de integração (HS2) foi usado como “isca 4C”. Os dados mostram que a tecnologia 4C define exatamente ambas as extremidades do cassete transgênico (linha inferior: apenas sondas no LCR humano (~20kb) fornecem sinais de 4C e não as sondas no restante de -380 kb da seqüência de /?-globina humana) e revelam claramente a posição de integração 35 no cromossomo de camundongo 8 (painel superior: sinais de comparação no cromossomo 8 (para posição de integração, ver seta) com sinais nos 6 outros cromossomo de camundon- gos) (cromossomos completos são representados). Este exemplo mostra que a tecnologia 4C pode ser usada para detectar a posição genômica de fragmentos de DNA ectopicamente integrados (vírus, transgene, etc.). Ela mostra que transições entre regiões genômicas não relacionadas que estão ligadas em cis podem ser identificadas exatamente, as quais podem ser usadas para identificar pontos de quebra genômicos e parceiros de translocação.
Figura 7
A tecnologia 4C produz dados reprodutíveis uma vez que os perfis para HS2 e β- globina são muito similares. Quatro experimentos de 4C biologicamente independentes fo- ram realizados em fígados fetais E14.5, usando tanto o gene yS-globina ^-principal (2 linhas superiores) ou /?-globina HS2 (duas linhas inferiores) como o isca. Estas iscas são separa- das -40 kb no molde do cromossomo linear, mas mostrou-se previamente que estavam pró- ximas no espaço nuclear (Tolhuis et al, Molecular Cell 10, 1453 (2002)). É representada uma região de -5 Mb no cromossomo de camundongo 7 que está 20-20 Mb longe do Iocus de /?-globina. Os dados mostram alta reprodutibilidade entre experimentos independentes e demonstram que dois fragmentos próximos no espaço nuclear compartilham parceiros inte- ragentes localizados em outra parte no genoma.
Figura 8
A tecnologia 4C é aplicada para medir frequências de interação DNA-DNA com se- qüência X (no cromossomo A) em células de uma pessoa saudável (topo) e um paciente com translocação (A;B) (fundo). Intensidades de sinal que representam frequências de inte- ração DNA-DNA (eixo Y) são representadas graficamente por sondas ordenadas nos mol- des do cromossomo linear (eixo X). Em células normais, interações DNA-DNA freqüentes são detectadas no cromossomo A ao redor da seqüência X. Em células de pacientes, uma redução em 50 % nas frequências de interação é observada por sondas no cromossomo A localizadas no outro lado do ponto de quebra (BP) (comparar curva cinza (paciente) com linha preta (pessoa saudável). Além disso, a translocação coloca parte do cromossomo B em proximidade física imediata com seqüência X, e interações DNA-DNA freqüentes são observadas atualmente para esta região no cromossomo B. A transição abrupta de baixas para altas frequências de interação neste cromossomo marca o local de seu ponto de que- bra.
Figura 9
(Equilibrado) inversão(s) pode(m) ser detectada(s) por tecnologia 4C. Padrões in- versos de frequências de interação DNA-DNA (medidos por tecnologia 4C como intensida- des de sinal de hibridização) são observados em sujeito doente (curva sólida) comparados ao sujeito não doente (curva pontilhada), o que revela a presença e tamanho da inversão.
Figura 10
Detecção de deleção(s) heterozigota(s) por tecnologia 4C. Sondas com menores frequências de interação DNA-DNA (medidas por tecnologia 4C como intensidades de sinal de hibridização) em sujeitos doentes (curva cinza) comparadas a sujeitos não doentes (cur- va negra), revelam a posição e tamanho da região deletada. Sinais de hibridização residuais na região deletada do sujeito doente vêm do alelo intacto (deleção heterozigota). A deleção é tipicamente acompanhada por um aumento nas intensidades de sinal para sondas Iocali- 5 zadas diretamente além da região deletada (note que a curva cinza está acima da curva negra no lado direito da deleção), uma vez que estas regiões estão em proximidade física mais imediata às seqüência 4C (isca).
Figura 11
Duplicação detectada por tecnologia 4C. Sondas com maiores sinais de hibridiza- 10 ção em um paciente (curva sólida) comparados a um sujeito normal (curva pontilhada) indi- cam a posição e tamanho da duplicação. A duplicação detectada por tecnologia 4C é tipi- camente acompanhada por menores sinais de hibridização em sujeitos doentes versus não doentes para sondas além da região duplicada (a duplicação aumenta sua separação do sítio genômico da seqüência 4C).
Figura 12
Interações de longo alcance com /?-globina reveladas por tecnologia 4C. a, Razões não processadas de 4C com relação a sinais de hibridização controle revelando interações de yS-globina HS2 com cromossomo 7 e dois cromossomos não relacionados (8 e 14). b-c, Dados não processados para duas amostras independente de fígado fetal (topo, em verme- 20 lho) e cérebro fetal (fundo, em azul) representados graficamente ao longo de duas regiões diferentes 1-2 Mb no cromossomo 7. Agrupamentos altamente reprodutíveis de interações são observados tanto nas duas amostras de fígado fetal (b) quanto nas duas amostras de cérebro (c). d-e, Dados de média corrida para as mesmas regiões. A taxa de descoberta falsa foi ajustada em 5% (linha pontilhada), f, Representação esquemática de regiões de 25 interação com /?-globina ativa (fígado fetal, topo) e inativa (cérebro fetal, fundo) no cromos- somo 7.
Figura 13
β-globina ativa e inativa interagem com regiões cromossômicas ativas e inativas, respectivamente, a, Comparação entre interações de longo alcance de /?-globina no fígado 30 fetal (média corrida 4C, topo), análise de expressão de microarranjo no fígado fetal (escala log, meio) e o local dos genes (fundo) representado graficamente ao longo uma região 4 Mb que contém o gene Uros (-30 Mb longe da /?-globina), mostrando que a /?-globina ativa inte- rage preferivelmente com outros genes ativamente transcritos, b, A mesma comparação no cérebro fetal ao redor um agrupamento de gene OR - 38 Mb longe da globina, mostrando 35 que a β- globina inativa interage preferivelmente com regiões inativas, c, Caracterização de regiões que interagem com /?-globina no fígado fetal (esquerda) e no cérebro (direita) em termos de conteúdo e atividade do gene. Figura 14
Rad23A ubiquamente expresso interage com regiões ativas muito similares no fíga- do fetal e cérebro, a, Representação esquemática de regiões no cromossomo 8 que intera- gem com Rad23A ativo no fígado fetal (topo, vermelho) e cérebro (fundo, azul), b, Compara- 5 ção entre interações de longo alcance de Rad23A (média corrida 4C) e análise de expres- são de microarranjo (escala log) no fígado fetal (dois painéis superiores), interações de lon- go alcance de Rad23A (média corrida 4C) e análise de expressão de microarranjo (escala log) no cérebro fetal (painel 3 e 4) e o local dos genes (painel inferior) representado grafica- mente ao longo de uma região 3 Mb do cromossomo 8. c, Caracterização de regiões que 10 interagem com Rad23A no fígado fetal (esquerda) e cérebro (direita) em termos de conteúdo e atividade do gene.
Figura 15
Cryo-FISH confirma que a tecnologia 4C identifica verdadeiramente regiões intera- gentes, a, exemplo de parte de uma seção de cryo (200 nm) mostrando mais de 10 núcleos, alguns dos quais contendo o Iocus de /?-globina (verde) e/ou Uros (vermelho). Em virtude do seccionamento, muitos núcleos não contêm sinais para estes dois loci, b-d, exemplos de sinais sobrepostos completamente (b) e parcialmente (c) e sinais de contato (d), que foram todos pontuados como positivos para interação, e-g, exemplos de núcleos contendo alelos não contactantes (e-f) e um núcleo contendo apenas /?-globina (g), que foram todos pontua- dos como negativos para interação, h-i, Representação esquemática de resultados de cryo- FISH. Porcentagens de interação com /?-globina (h) e Rad23A (i) são indicadas acima dos cromossomos para regiões positivamente identificadas (ponta da seta vermelha) e negati- vamente identificadas (ponta da seta azul) por tecnologia 4C. Os mesmos BACs foram usa- dos para os dois tecidos. Frequências de interação medidas por cryo-FISH entre dois agru- pamentos de genes OR distantes no fígado fetal e cérebro são indicadas abaixo dos cro- mossomos.
Figura 16
A análise 4C de HS2 e /?-principal fornece resultados altamente similares, (a) Da- dos de 4C não processados de quatro amostras de fígado E14.5 independentes mostram um padrão muito similar de interação com HS2 (topo) e ^-principal (fundo), (b) Uma grande sobreposição existe entre sondas pontuadas positivas para interação no experimento HS-2 e sondas que foram pontuadas positivas para interação no experimento ^-principal.
Figura 17
Regiões que interagem com /?-globina também colocam uma em contato com a ou- tra frequentemente. Duas regiões (separadas praticamente 60 Mb), contendo genes ativa- mente transcritos e identificadas por tecnologia 4C interagem com yS-globina no fígado fetal, mostraram frequências de co-localização por cryo-FISH de 5,5%, que foram significativa- mente maiores que frequências de co-iocalização de fundo.
Figura 18
Exemplo de uma deleção heterozigota revelada por 4C multiplex usando um coran- te simples para a marcação de fragmentos de DNA que interagem com múltiplas seqüências alvos. A razão de frequências de interação observada em um paciente (amostra) com rela- ção a pessoa saudável (controle) é representada à direita.
Figura 19
A presença de uma deleção presente em um paciente com leucemia revelada por 4C usando uma seqüência de nucleotídeos alvo que está tanto a 2 Mb (a) quanto a 1,3 Mb 10 (B) à montante (“à esquerda”) do primeiro ponto de quebra. Note que deleções causam uma redução de sinais de interação de DNA na região deletada, mas também causam um au- mento nas frequências de interação DNA:DNA para seqüências diretamente à jusante (“à direita”) do último ponto de quebra. Isto é particularmente óbvio quando interações com se- qüência de nucleotídeos alvo B são examinadas cautelosamente (ver dois gráficos inferio- 15 res). Com base nos dados de 4C, iniciadores foram desenhados em cada lado da região deletada e o ponto de quebra foi identificado por sequenciamento: texto simples é seqüência à montante de deleção, em negrito é indicado um nucleotídeo inserido, sublinhada é a se- qüência à jusante da deleção.
Figura 20
Uma inversão heterozigota revelada por 4C multiplex, usando um corante simples
para a marcação de fragmentos de DNA que interagem com múltiplas seqüências alvos. A razão de frequências de interação observada em paciente (amostra) com relação a pessoa saudável (controle) é descrita à direita. Note que as razões dos pontos de quebra próximos podem ser diferentes quando a posição dos pontos de quebra com relação às seqüências alvos de nucleotídeos é diferente.
Figura 21
As cores alternam entre seqüências de nucleotídeos alvos vizinhas, o que permite a detecção (em vermelho) de uma deleção próxima a uma seqüência de nucleotídeos alvo (em azul) que não consegue detectar a deleção em virtude dos sinais de hibridização satu- rados. Caso a quantidade de sonda no arranjo não esteja saturando, o sinal azul também seria diminuído na deleção.
Figura 22
Cores alternam entre seqüências de nucleotídeos alvos vizinhas, o que permite a detecção (em vermelho) de uma inversão. A razão de frequências de interação observada no paciente (amostra) com relação a pessoa saudável (controle) é descrita à direita. Note que comparado a um experimento de corante simples (ver figura 2), o uso de corantes alter- nantes facilitou a detecção de rearranjos, tais como inversões. Note também que razões próximas aos pontos de quebra podem ser diferentes quando a posição dos pontos de que- bra com relação às seqüências de nucleotídeos alvos é diferente.
Figura 23
Exemplo de uma inversão heterozigota revelada por 4C multiplex usando corantes diferentes para a marcação de fragmentos de DNA que interagem com seqüências alvos diferentes. Os pontos de quebra da inversão são indicados pela posição de sinais vermelho e verde no paciente que estão ausentes na amostra controle. Note que a introdução de mais cores facilita a detecção de rearranjos (compare, por exemplo, figura 4 e 5).
Figura 24
Detecção de translocações equilibradas. Cada cromossomo é marcado com dois corantes exclusivos que são usados de maneira tal que os corantes alternem entre as se- qüências alvos que são vizinhas no molde do cromossomo linear. Se as translocações fo- rem equilibradas, cada um dos dois corantes específicos de cromossomo daria sinais fortes de hibridização em um conjunto mutuamente exclusivo de sondas diretamente vizinhas u- mas com as outras no molde linear do cromossomo não relacionado. O ponto de quebra neste cromossomo não relacionado está localizado entre os dois ajustes de sondas mos- trando sinais positivos de hibridização. Os sinais de cromossomo pai no ponto de quebra e além dele teriam a metade da intensidade do controle (não mostrado na figura)
Figura 25
Demonstração do princípio para a detecção de translocações equilibradas. Detec- ção de translocação t(l;7) descrita em (R. Burnett et al., Blood, Vol 84, No 4 (August 15), 1994: pp 1232-1236). Seqüências de nucleotídeos alvos flanqueiam o Iocus TCRyff no cro- mossomo 7, com os sinais vermelhos que representam interações DNA:DNA com a se- qüência alvo que está localizada à montante do Iocus TCR/?, e os sinais azuis que represen- tam interações DNA.DNA com a seqüência alvo que está localizada à jusante do Iocus TCR/?. São representados os sinais de DNA interagentes encontrados no cromossomo 1. O painel topo mostra a distribuição de sinal teórico. O painel médio e inferior mostra a distribu- ição de sinal atual. O painel inferior mostra sinais em uma resolução de sondas individuais justapostas no cromossomo molde. Note que, no caso de translocação equilibrada, seqüên- cias de nucleotídeos alvos que flanqueiam o ponto de quebra mostrarão um conjunto mutu- amente exclusivo de sinais de interação de DNA intercromossômico que faz limite direta- mente um com o outro no molde do cromossomo linear do cromossomo parceiro de translo- cação. A posição do ponto de quebra sequenciado (descrito em Burnett et al., 1994) é indi- cada por uma seta no painel inferior.
Figura 26
Exemplo teórico para a detecção de translocações desequilibradas. Cada cromos- somo é marcado com dois corantes exclusivos que são usados de maneira tal que os coran- tes alternem entre seqüências alvos são vizinhas no molde do cromossomo linear. Se as translocações ocorreram com perda de DNA nos pontos de quebra (isto é, translocações desequilibradas), cada um dos dois corantes específicos de cromossomo fornecerá sinais fortes de hibridização em um conjunto mutuamente exclusivo de sondas no cromossomo não relacionado que não são diretamente vizinhos um do outro no molde linear do cromos- somo não relacionado. A região deletada é indicada.
Figura 27
Detecção de translocações desequilibradas. A detecção de translocação t(4;7) des- crita em (RJ Galjaard et al., Am J Med Genet A. 2003 Aug 30; 121 (2): 168-73). Seqüências de nucleotídeos alvos localizam-se no cromossomo 7; os sinais de DNA interagentes repre- sentados são localizados no cromossomo 4. Duas seqüências alvos foram usadas, localiza- das à montante (5') e à jusante (31) do ponto de quebra no cromossomo 7. Sinais de DNA interagentes localizados no cromossomo 4 são indicados (para ambas as seqüências alvos em azul). A região entre os agrupamentos de fragmentos de DNA interagentes no cromos- somo 4 foi deletada neste paciente. Topo: sinais para o cromossomo completo 4. Dados de 4C do painel inferior: sinais em uma região 11.5 MB ao redor dos pontos de quebra no cro- mossomo 4. Com base nos dados de 4C, o fragmento de restrição Hind\\\ no cromossomo 4 contendo o ponto de quebra de translocação foi identificado e usado para mapear o ponto de quebra por sequenciamento. A seqüência é fornecida na base da figura, onde a seqüên- cia sublinhada é do cromossomo 4, negrito é observado tanto no cromossomo 7 quanto 4 e a seqüência comum é do cromossomo 7.
Figura 28
Marcação específica para cromossomo de interações de DNA. O sinal azul que a- parece no cromossomo 3 e sinais laranja que aparecem no cromossomo 1 revelam os cro- mossomos parceiros de translocação e a posição aproximada dos pontos de quebra.
Figura 29
Sequenciamento de seqüências de nucleotídeos amplificadas por PCR de interesse (azul: endereço de deslocamento) ligadas a seqüência de nucleotídeos alvo (vermelho: en- dereço domiciliar). A amplificação foi realizada usando iniciadores (vermelho), pelo menos um dos quais é complementar à seqüência de nucleotídeos alvo. Opcionalmente, os adap- tadores (verde) podem ser introduzidos de várias maneiras na extremidade dos produtos de PCR1 da maneira indicada.
Figura 30
4C detecta exatamente uma translocação e inversão equilibrada (A-B). A tecnologia 4C detecta uma translocação t(l;7) equilibrada. (A) Em uma amostra controle saudável, fragmentos alvo a (vermelho) e b (azul) que estão localizados em lados opostos do Iocus TCRB no cromossomo 7 não capturam regiões no cromossomo 1. (B) Na linhagem celular HSB- 2 contendo uma translocação t(l;7) (p35;q35) equilibrada, cada fragmento alvo de TCRB captura uma região no cromossomo 1. As regiões capturadas têm diversos megaba- ses de tamanho (aumento 1), diretamente vizinhas uma da outra (aumento 2) e flanqueiam o ponto de quebra previamente clonado (seta). Ver figura S1 para resultados de outros cro- 5 mossomos. (C-D) 4C detecta uma inversão equilibrada. (C) Em uma amostra controle sau- dável, fragmentos alvo a (vermelho) e b (azul) que estão localizados em lados opostos do Iocus TCRB no cromossomo 7 não capturam grandes regiões em outros locais no cromos- somo 7. (D) Em uma amostra de paciente T-ALL, cada fragmento alvo de TCRB captura uma região adicional em outra extremidade do cromossomo 7. A maior parte do fragmento 10 alvo 5’ (a; vermelho) captura uma região 5' do agrupamento HOXA1 a maior parte do frag- mento alvo 3’ (b: azul) captura uma região 3’ do agrupamento HOXA, demonstrando uma inversão. As regiões capturadas têm diversos megabases de tamanho (aumento 1) e dire- tamente vizinhas uma da outra (aumento 2), mostrando que a inversão é equilibrada. Ambos os fragmentos alvo identificam o ponto de quebra (seta) próximo a HOXA9 em uma região 15 de 6 kb. Dados de média corrida foram representados graficamente, usando um tamanho de janela de ~60kb. Aumentos mostram intensidades de sinal não processadas.
Figura 31
4C detecta exatamente rearranjos desequilibrados, (a) 4C detecta exatamente uma translocação t(4;7)(pl5.2;q35) em combinação com uma microdeleção (isto é, rearranjo de- sequilibrado) em uma linhagem celular de uma criança por nascer com malformação congê- nita. Os fragmentos alvo a (vermelho) e b (azul), que estavam localizados em lados opostos dos pontos de quebra no cromossomo 7, ambos capturam os fragmentos que cobrem diver- sos megabases no cromossomo 4 (para sinais em outros cromossomos, ver figura 35). As duas regiões capturadas com sinais altos não são diretamente vizinhas uma da outra, mos- trando que a translocação é acompanhada por uma deleção no cromossomo 4. (B) A se- qüência de um dos pontos de quebra (seta), com seqüências do cromossomo 7 e 4 em le- tras minúsculas e maiúsculas, respectivamente. (C) 4C identifica exatamente uma deleção homozigota em uma amostra de paciente T-ALL. Um fragmento alvo localizado no cromos- somo 9 em 19,3 Mb identifica uma região (entre setas) que não tem sinais altos na amostra de paciente (inferior) comparados à amostra controle (superior), mostrando uma deleção de ~2 Mb em 9p21. Sinais 3' da deleção são maiores em paciente versus controle, uma vez que esta região está em proximidade mais imediata ao fragmento alvo em virtude da dele- ção. (D) Seqüência através dos pontos de quebra indicada pelas setas em (C), confirmando a deleção. Intensidades de sinal não processadas são representadas graficamente nesta figura. Sinais altos raros em regiões deletadas indicam que estas sondas mostram hibridiza- ção não específica.
Figura 32 Triagem 4C identifica LM03 como um parceiro de translocação inédito de TCRB. Cinco amostras de paciente T-ALL não caracterizadas foram triadas por 4C, usando um fragmento alvo próximo do Iocus TCRB no cromossomo 7. (a) Em uma amostra de paciente, sinais altos apareceram especificamente no cromossomo 12, revelando uma translocação, 5 t(7;12)(q35;pl2.3). Para sinais em todos os outros cromossomos, ver figura S4. Uma deleção está presente em diversos megabases do sítio de translocação (seta) no cromossomo 12 (aumento 1). O sítio de translocação está presente em uma região de 6 kb próxima ao gene LM03 (aumento 2). (B) Seqüências de ambos os pontos de quebra de t(7;12)(q35;pl2.3); nucleotídeos em caixas de maiúsculas são a partir de 12, em caixas de minúsculas a partir 10 de 7 e em itálicos são a partir de origem desconhecida. (C) Representação esquemática do sítio de translocação de t(7;12)(q35;pl2.3). O melhorador de TCRB está posicionado 70 kb à jusante do gene LM03. Dados de média corrida foram representados graficamente, usando um tamanho de janela de ~60kb. Aumentos mostram intensidades de sinal não processa- das.
Figura 33
Sinais de 4C através de todos os cromossomos em um controle saudável e uma amostra que carrega t(l;7)(p35;q35). As pontas das flechas negras indicam a posição das seqüências alvos. A ponta da seta vermelha indica a posição do sítio de translocação. Da- dos de média corrida foram representados graficamente, usando um tamanho de janela de ~60kb. Escala no eixo Y (unidades arbitrárias) é idêntica para todos os cromossomos.
Figura 34
Sequenciamento de extremidade pareada de fragmento de restrição (a) Represen- tação esquemática de sequenciamento de extremidade pareada de fragmento de restrição.
(B) Seqüências de ponto de quebra de uma inversão entre TCRB e HOXA no cromossomo 7 (ver figura 30). A seqüência negra está localizada na posição em HOXA observada com tec- nologia 4C, entre as sondas que marcam a transição dos fragmentos capturados para os não capturados. A seqüência vermelha foi observada com sequenciamento de extremidade pareada de fragmento de restrição da seqüência negra e está localizada no Iocus TCRB.
Figura 35
Sinais de 4C através de todos os cromossomos obtidos com dois fragmentos alvo
de cromossomo 7 diferentes em uma amostra carregando t(4;7)(pl5.2;q35). As pontas das flechas negras indicam posição de seqüências alvos. As pontas das flechas vermelhas indi- cam a posição dos sítios de translocação. Dados de média corrida foram representados gra- ficamente, usando um tamanho de janela de ~60kb. Escala no eixo Y (unidades arbitárias) é idêntica para todos os cromossomos.
Figura 36
Sinais de 4C através de todos os cromossomos obtidos com uma seqüência alvo próxima ao Iocus TCRB no cromossomo 7 em duas amostras de paciente T-ALL, uma das quais carregando uma translocação t(7:12). As pontas das flechas negras indicam a posição de seqüências alvos. A ponta da seta vermelha indica a posição do sítio de translocação. Dados de média corrida foram representados graficamente, usando um tamanho de janela de ~60kb. Escala no eixo Y (unidades arbitárias) é idêntica para todos os cromossomos.
Figura 37
Expressão de LM03 em amostras de paciente T-ALL. A expressão de gene foi me- dida em arranjos de expressão de gene Affymetrix. LM03 é expresso no paciente que carre- ga t(7;12)(q35;pl2.3), mas não em outros pacientes.
Figura 38
Iniciadores e produtos de PCR 4C a ser analisados por sequenciamento Solexa. Seqüências produzidas por Solexa (setas) primeiro Ieram o “iniciador Dpnll” (18 nucleotí- deos, incluindo GATC (isto é, sítio de reconhecimento Dpnll)), seguido pela seqüência cap- turada.
Figura 39
Os resultados de PCR usando iniciadores com projeções 5’ contendo seqüências adaptadoras Solexa. Para comparação, os resultados obtidos com iniciadores padrões (rai- as 1,5,9 da esquerda para a direita; sem projeções) também são conhecidos.
Figura 40
Resultados do sequenciamento 4C.
Figura 41
Ajuste de iniciador 3 (139Mb) captura seqüências de cromossomo 1 através do ponto de quebra na linhagem celular HSB-2 T-ALL (no cromossomo 7 em ~142Mb, isto é, 3Mb longe da isca). Para comparação, são mostrados os resultados de microarranjo. Note que a seqüência alvo (isca) usada para o experimento de microarranjo foi mais próxima (<1 Mb) do ponto de quebra, explicando por que ela mapeia melhor o ponto de quebra no cro- mossomo 1.
Descrição detalhada da invenção
A tecnologia 3C
O método 3C foi descrito em detalhes em Dekker et al. (2002), Tolhuis et al. (2002), Palstra et al. (2003), Splinter et al. (2004) e Drissen et al. (2004). Resumidamente, 3C é rea- lizada digerindo DNA reticulado com uma enzima de restrição primária seguida por ligação em concentrações de DNA muito baixas. Nestas condições, a ligação de fragmentos reticu- lados, que é intramolecular, é fortemente favorecida com relação a ligação de fragmentos aleatórios, que é intermolecular. A reticulação é então invertida e produtos de ligação indivi- duais são detectados e quantificados pela reação em cadeia da polimerase (PCR) usando iniciadores específicos de locus. A frequência de reticulação (X) de dois Ioci específicos é determinada por reações de PCR quantitativas usando moldes controle e reticulado, e X é expresso como a razão da quantidade do produto obtido com o molde reticulado e com o molde controle.
De acordo com a presente invenção, um molde de 3C é preparado usando os mé- todos descritos por Splinter et al, (2004) Methods Enzymol. 375, 493-507. (isto é, fixação de formaldeído, digestão de enzima de restrição (primária), religação de fragmentos de DNA reticulados e purificação de DNA). Resumidamente, uma amostra, tais como células, tecidos ou núcleos, é fixada usando um agente de reticulação, tal como formaldeído. A digestão de enzima de restrição primária é a seguir realizada de maneira tal que o DNA seja digerido no contexto do núcleo reticulado. A ligação intramolecular é a seguir realizada em baixas con- centrações de DNA (por exemplo, cerca de 3,7 ng///L), que favorece a ligação entre frag- mentos de DNA reticulado (isto é, a ligação intramolecular) com relação a ligação entre fragmentos de DNA não reticulado (isto é, ligação intermolecular ou aleatória). A seguir, as reticulações são invertidas e o DNA pode ser purificado. O molde de 3C que é produzido contém fragmentos de restrição que são ligados em decorrência de que eles estavam origi- nalmente próximos no espaço nuclear.
Uma vez que uma enzima de restrição primária é usada para digerir o DNA antes da etapa de ligação intramolecular, um sítio de reconhecimento de enzima para a enzima de restrição primária separará a primeira seqüência de nucleotídeos (alvo) e a seqüência de 20 nucleotídeos que foi ligada. Dessa maneira, o sítio de reconhecimento primário está locali- zado entre a primeira seqüência de nucleotídeos (alvo) e a seqüência de nucleotídeos liga- dos (isto é, a segunda seqüência ligada).
Seqüência de nucleotídeos
A presente invenção envolve o uso de seqüências de nucleotídeos (por exemplo, moldes 3C, moldes 4C, moldes de DNA, moldes de amplificação, fragmentos de DNA e DNA genômico), que podem estar disponíveis na base de dados.
A seqüência de nucleotídeos pode ser DNA ou RNA de origem genômica, sintética ou recombinante, por exemplo, DNAc. Por exemplo, seqüências de nucleotídeos recombi- nantes podem ser preparadas usando técnicas de clonagem de PCR. Isto envolverá prepa- 30 rar um par de iniciadores que flanqueiam uma região da seqüência que deseja-se clonar, colocando os iniciadores em contato com RNAm ou DNAc obtidos, por exemplo, de uma célula de mamífero (por exemplo, célula animal ou humana) ou de não mamífero, realizando uma reação em cadeia da polimerase (PCR) em condições que realizam amplificação da região desejada, isolando o fragmento amplificado (por exemplo, purificando a mistura da 35 reação em um gel de agarose) e recuperando o DNA amplificado. Os iniciadores podem ser desenhados para conter sítios de reconhecimento de enzima de restrição adequados de maneira tal que o DNA amplificado possa ser clonado em um vetor de clonagem adequado. A seqüência de nucleotídeos pode ser de fita dupla ou fita simples, quer represen- tando a fita sentido ou antissentido ou combinações destas.
Para alguns aspectos, é preferível que a seqüência de nucleotídeos seja DNA de fi- ta simples, tais como iniciadores e sondas de fita simples.
Para alguns aspectos, é preferível que a seqüência de nucleotídeos seja DNA de fi- ta dupla, tais como moldes 3C e 4C de fita dupla.
Para alguns aspectos, é preferível que a seqüência de nucleotídeos seja DNA ge- nômico, tais como um ou mais Ioci genômicos.
Para alguns aspectos, é preferível que a seqüência de nucleotídeos seja DNA cro- mossômico.
A seqüência de nucleotídeos pode compreender uma primeira seqüência de nu- cleotídeos (alvo) e/ou uma segunda seqüência de nucleotídeos.
Os sítios de reconhecimento da enzima de restrição primária e secundária serão di- ferentes um do outro e ocorrerão tipicamente apenas uma vez na seqüência de nucleotí- deos.
Em um aspecto, é fornecida uma seqüência de nucleotídeos circularizada compre- endendo uma primeira seqüência de nucleotídeos e (por exemplo, ligada) uma segunda se- qüência de nucleotídeos separada (por exemplo, dividida ou partida) por um sítio de reco- nhecimento de enzima de restrição primária e uma secundária, em que a dita primeira se- qüência de nucleotídeos é uma seqüência de nucleotídeos alvo e a dita segunda seqüência de nucleotídeos é obtenível por DNA genômico de reticulação (por exemplo, in vivo ou in vitro). Os sítios de reconhecimento da enzima de restrição primária e secundária serão dife- rentes um do outro e ocorrerão tipicamente apenas uma vez na seqüência de nucleotídeos.
Em um aspecto adicional, é fornecida uma seqüência de nucleotídeos circularizada compreendendo uma primeira seqüência de nucleotídeos e (por exemplo, ligada a) uma segunda seqüência de nucleotídeos separada (por exemplo, dividida ou partida) por um sítio de reconhecimento de enzima de restrição primária e uma secundária, em que a dita primei- ra seqüência de nucleotídeos é uma seqüência de nucleotídeos alvo e em que as ditas pri- meira e segunda seqüências de nucleotídeos são obteníveis por um processo compreen- dendo as etapas de: (a) DNA genômico de reticulação (por exemplo, in vivo ou in vitro); (b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências de nucleotídeos reticulados; (d) inverter a reticulação; e (e) digerir as seqüências de nucleotí- deos com uma enzima de restrição secundária para circular as seqüências de nucleotídeos.
Preferivelmente, a segunda seqüência de nucleotídeos intercepta (por exemplo, bissecciona) a primeira seqüência de nucleotídeos (alvo). Dessa maneira, a seqüência de nucleotídeos compreende a segunda seqüência de nucleotídeos, que separa a primeira se- qüência de nucleotídeos (alvo) em duas porções ou fragmentos, tais como aproximadamen- te duas porções ou fragmentos igualmente dimensionados. Tipicamente, as porções ou fragmentos serão pelo menos cerca de 16 nucleotídeos de comprimento.
Em um aspecto adicional, é fornecida uma base de dados de seqüências de 6-50 pares de bases que flanqueiam diretamente e, opcionalmente, incluem o sítio de reconheci- mento de enzima de restrição primária de cada seqüência alvo incluída, e que podem ser usadas nos métodos aqui descritos para identificar cada seqüência alvo.
Em um outro aspecto, é fornecida uma base de dados de seqüências de 12-50 pa- res de bases que flanqueiam diretamente todos os sítios de reconhecimento de enzima de restrição primária no genoma e que podem ser usadas nos métodos aqui descritos para de- terminar a posição genômica de cada uma das seqüências capturadas identificadas.
Em um outro aspecto, é fornecida uma base de dados de seqüências de 6-50 pares de bases que flanqueiam diretamente e, opcionalmente, incluem o sítio de reconhecimento de enzima de restrição secundária relevante de cada uma das seqüências alvos incluídas, e que podem ser usadas nos métodos aqui descritos para identificar cada seqüência alvo.
Em um outro aspecto, é fornecida uma base de dados de seqüências de 12-50 pa- res de bases que flanqueiam diretamente todos os sítios de reconhecimento de enzima de restrição secundária relevantes no genoma e que podem ser usadas nos métodos aqui des- critos para determinar a posição genômica de cada uma das seqüências capturadas identifi- cadas.
Primeira seqüência de nucleotídeos
A primeira seqüência de nucleotídeos é uma seqüência de nucleotídeos alvo.
Da maneira aqui usada, o termo "seqüência de nucleotídeos alvo" refere-se à se- qüência que é usada como uma seqüência isca afim de identificar uma ou mais seqüências nas quais ela reticula (por exemplo, uma ou mais seqüências de nucleotídeos de interesse ou uma ou mais seqüências de composição de seqüência de nucleotídeos desconhecida).
A seqüência de nucleotídeos alvo is de seqüência conhecida.
A reticulação é indicativa de que a seqüência de nucleotídeos alvo e a seqüência reticulada nela foram originalmente próximas no espaço nuclear. Determinando a frequência cuja seqüências estão próximas uma da outra, é possível entender, por exemplo, a confor- mação de cromossomos e regiões cromossômicas no contexto espacial do núcleo (por e- xemplo, in vivo ou in vitro). Além disso, é possível entender as organizações estruturais intri- cadas no genoma, por exemplo, quando melhoradores ou outros elementos regulatórios transcricionais comunicam com promotores distantes localizados em cis ou ainda em trans. Além disso, é ainda possível entender o posicionamento de uma dada região genômica com relação às seqüências de nucleotídeos presentes no mesmo cromossomo (em cis), bem como às seqüências de nucleotídeos em outros cromossomos (em trans). Assim, é possível mapear seqüências de nucleotídeos nos cromossomos diferentes que compartilham fre- quentemente sítios no espaço nuclear. Além disso, ainda é possível detectar aberrações genéticas equilibradas e/ou desequilibradas, tais como translocações, deleções, inversões, duplicações e outros rearranjos genômicos equilibrados e/ou desequilibrados (por exemplo, deleções ou translocações em um ou mais cromossomos). Com relação a isso, aberrações 5 genéticas resultam em mudanças nas interações DNA-DNA na posição que a mudança o- correu, que podem ser detectadas.
A primeira seqüência de nucleotídeos (alvo) de acordo com a presente invenção pode ser qualquer seqüência na qual deseja-se determinar a frequência de interação no espaço nuclear com uma ou mais outras seqüências.
Em uma modalidade, a primeira seqüência de nucleotídeos (alvo) será maior que
cerca de 350 bp de comprimento, uma vez que é escolhida uma enzima de restrição secun- dária que corta a primeira seqüência de nucleotídeos (alvo) em cerca de 350 bp ou mais do sítio de restrição primária. Isto pode minimizar uma tendência na formação de círculo em virtude das restrições topológicas (Rippe et al. (2001) Trends in Biochem. Sciences 26, 733- 40).
Adequadamente, a primeira seqüência de nucleotídeos (alvo) após a amplificação compreende pelo menos cerca de 32 bp, em virtude do fato de que o comprimento mínimo de pelo menos dois iniciadores de amplificação usados para amplificar a segunda seqüência de nucleotídeos é cerca de 16 bases cada.
Em uma modalidade preferida, a primeira seqüência de nucleotídeos (alvo) pode
compreender completa ou parcialmente (por exemplo, um fragmento), ou estar perto (por exemplo, nas proximidades), de um promotor, um melhorador, um silenciador, um isolante, uma região de anexação de matriz, uma região controle de locus, uma unidade de transcri- ção, uma origem de replicação, um ponto quente de recombinação, um ponto de quebra de 25 translocação, um centrômero, um telômero, uma região densa em gene, uma região pobre em gene, um elemento repetitivo, um sítio de integração (viral), uma seqüência de nucleotí- deos na qual deleções e/ou mutações estão relacionadas a um efeito (por exemplo, doença, efeito fisiológico, funcional ou estrutural, tal como um SNP (polimorfismo de nucleotídeo simples), ou sequência(s) de nucleotídeos(s) contendo tais deleções e/ou mutações, ou 30 qualquer seqüência na qual deseja-se determinar a frequência de interação no espaço nu- clear com outras seqüências.
Da maneira mencionada anteriormente, a primeira seqüência de nucleotídeos (alvo) pode compreender completa ou parcialmente (por exemplo, um fragmento), ou estar perto (por exemplo, nas proximidades) de uma seqüência de nucleotídeos na qual aberrações 35 genéticas, tais como deleções e/ou mutações, estão relacionadas a um efeito (por exemplo, uma doença). De acordo com esta modalidade da invenção, a primeira (seqüência de nu- cleotídeos alvo) pode ser, portanto, uma seqüência de nucleotídeos (por exemplo, um gene ou um locus), adjacente (no molde de DNA físico), ou na região genômica, na qual mudan- ças foram associadas ou correlacionadas a uma doença, tal como uma doença genética ou congênita. Em outras palavras, a primeira seqüência de nucleotídeos (alvo) pode ser ou po- de ser escolhida com base em sua associação com um fenótipo clínico. Em uma modalida- 5 de preferida, as mudanças são mudanças em um ou mais cromossomos, e a doença pode ser uma conseqüência, por exemplo, de uma ou mais deleções, uma ou mais translocações, uma ou mais duplicações, e/ou uma ou mais inversões, etc. nele. Exemplos não Iimitantes de tais genes/loci são AMLI, MLL, MYC, BCL1 BCR, ABL1, Ioci de imunoglobulina, LYLI, TAL1, TAL2, LM02, TCRalô, TCRjS, HOX e outros Ioci em várias Ieucemias linfoblásticas.
Outros exemplos são descritos na base de dados eletrônica, tais como:
http://www.ncbi.nlrn.nih.aov/entrez/querv.fcqi?db=cancerchromosomes http://caap.nci.nih.aov/Chromossomes/Mitelman
http://www.proqenetix.net/proaenetix/P14603437/ideoqram.html http://www.chanqbioscience.com/cvtoaenetics/cvto1 .pl?auerv=47.xv http://www.possum.net.au/
http://www.1 mdatabases.com/ http://www.wilev.com/leaacv/produtos/suieito/life/borqaonkar/index.html http://www.ncbi.nhn.nih.qov/entrez/auerv.fcqi?db=OMII\/l http://www.sanqer.ac.uk/PostGenornics/decipher/
http://aqserver01.azn.nl:8080/ecaruca/ecaruca.isp
Outros exemplos são descritos em "Catalogue of Unbalanced Chromossome Aber- rations in Man" 2nd edition. Albert Schinzel. Berlin: Walter de Gruyter, 2001. ISBN 3-1 Ι- Ο11607-3.
Em uma modalidade, a palavra "adjacente" significa "diretamente adjacente", de maneira tal que não existam nucleotídeos dispostos entre duas seqüências adjacentes.
Em uma outra modalidade, o termo "adjacente", no contexto da seqüência de ácido nucléico e do sítio de reconhecimento de enzima de restrição primária, significa "diretamente adjacente", de maneira tal que não existam nucleotídeos dispostos entre a seqüência de ácido nucléico e o sítio de reconhecimento de enzima de restrição primária.
Segunda seqüência de nucleotídeos
A segunda seqüência de nucleotídeos é obtenível, obtida, identificada ou identificá- vel por DNA genômico de reticulação (por exemplo, in vivo ou in vitro).
A segunda seqüência de nucleotídeos (por exemplo, seqüência de nucleotídeos de interesse) torna-se ligada à primeira seqüência de nucleotídeos (alvo) após tratar uma a- mostra com um agente de reticulação e digerir/ligar os fragmentos de DNA reticulado. Tais seqüências são reticuladas na primeira seqüência de nucleotídeos (alvo) em decorrência de que elas estavam originalmente próximas no espaço nuclear e ligadas à primeira seqüência de nucleotídeos (alvo), em decorrência das condições de ligação favorecerem a ligação en- tre fragmentos de DNA reticulado (intramolecular) com relação a eventos de ligação aleató- rios.
Doenças com base em alterações, tais como translocações, deleções, inversões, 5 duplicações e outros rearranjos genômicos, são em geral causadas por interações DNA- DNA aberrantes. A tecnologia 4C mede frequências de interação DNA-DNA, que são basi- camente uma função da separação do sítio genômico, isto é, frequências de interação DNA- DNA são inversamente proporcionais à distância linear (em quilobases) entre dois Ioci de DNA presentes no mesmo molde de DNA físico (Dekker et al., 2002). Assim, a(s) altera- 10 ção(s) que cria(m) moldes de DNA fisicamente diferentes e/ou novos é acompanhada por interações DNA-DNA alteradas e isto pode ser medido por tecnologia 4C.
Adequadamente, a segunda seqüência de nucleotídeos tem pelo menos 40 pares de bases.
Agentes de reticulação, tal como formaldeído, podem ser usados para reticular pro- 15 teínas em outras proteínas e ácido nucléico vizinhos. Assim, duas ou mais seqüências de nucleotídeos podem ser reticuladas apenas por meio de ligação de proteínas a (uma de) estas seqüências de nucleotídeos. Agentes de reticulação sem ser formaldeído também podem ser usados de acordo com a presente invenção, incluindo aqueles agentes de reticu- lação que reticulam diretamente as seqüências de nucleotídeos. Exemplos de agentes que 20 reticulam DNA incluem, mas sem limitações, Iuz UV, mitomicina C, nitrogênio mostarda, melfalan, 1,3-butadieno diepoxido, cis diaminadicloroplatina (II) e ciclofosfamida.
Adequadamente, o agente de reticulação formará reticulações que ligam distâncias relativamente pequenas, tal como cerca de 2 A, selecionando por meio disto interações par- ticulares que podem ser revertidas.
A reticulação pode ser realizada, por exemplo, incubando as células em formaldeí-
do a 2% em temperatura ambiente, tal como incubando 1x10 células em 10 ml_ de DMEM- 10% FCS suplementado com formaldeído a 2% por 10 minutos a temperatura ambiente.
Enzima de restrição primária
Da maneira aqui usada, o termo "enzima de restrição primária" refere-se a uma primeira enzima de restrição que é usada para digerir o DNA reticulado.
A enzima de restrição primária será escolhida dependendo do tipo de seqüência al- vo (por exemplo, locus) a ser analisada. É desejável que experimentos preliminares sejam realizados para otimizar as condições de digestão.
A enzima de restrição primária pode ser selecionada de enzimas de restrição que reconhecem pelo menos seqüências de 8 bp ou mais de DNA. A enzima de restrição primá- ria pode ser selecionada de enzimas de restrição que reconhecem pelo menos seqüências de 7 bp ou mais de DNA. A enzima de restrição primária pode ser selecionada de enzimas de restrição que reconhecem pelo menos seqüências de 6 bp ou mais de DNA. Para algu- mas modalidades, a enzima de restrição primária pode ser selecionada de enzimas de res- trição que reconhecem uma seqüência de 4 bp e/ou 5 bp de DNA.
O uso de cortadores menos freqüentes aumentará a distância genômica capturada (coberta) por cada isca.
Enzimas de restrição que reconhecem seqüências de 6 bp de DNA incluem, mas sem limitações, Acll, Hindlll, Sspl, BspLUI II, Agel, Mlul, Spel, Bglll5 Eco47lll, Stul, Seal, Cl- al, Avalll, Vspl, Mfel1 PmaCI, Pvull, Ndel, Ncol, Smal, Sacll, Avrll, Pvul, Xmalll, Spll, Xhol, Pstl, Afl11, BamHI, AatlI, Sad, EcoRV, Sphl, Nael, BsePI, Nhel, BamHI, Narl, Apal, Kpnl, Snal, 10 Sail, ApaLI, Hpal, SnaBI1 BspHI, BspMIIl Nrul, Xbal, Bell, Mstl, Bali, Bsp1407l, Psil, Asull e Ahalll.
Enzimas de restrição que reconhecem mais que uma seqüência de 6 bp de DNA incluem, mas sem limitações BbvC I, Asei, AsiS I, Fse I, Not I, Pac I, Pme I, Sbf I, SgrA I, Swa I, Sap I, Cci NI, FspA I, Mss I, Sgf I, Smi I, Srf I e Sse8387 I.
Para alguns aspectos da presente invenção, no caso de enzimas de restrição que
reconhecem seqüências de 6 bp, BgIU, Hind\U ou EcoBI são preferidas.
Enzimas de restrição que reconhecem seqüências de 4 ou 5 bp de DNA incluem, mas sem limitações, TspEI, Maell, Alui, Nlallll Hpall, FnuDII, Mael, Dpnl, Mbol, Hhal, Haelll, Rsal, Taql, CviRI, Msel, Sthl32l, Acil, Dpnll, Sau3AI e Mnll. Em uma modalidade, a enzima de restrição secundária é Nlalll e/ou Dpnll.
A expressão "sítio de reconhecimento de enzima de restrição primária" refere-se ao sítio em uma seqüência de nucleotídeos que é reconhecida e clivada pela enzima de restri- ção primária.
Para algumas modalidades, a enzima de restrição não digere DNA repetitivo ou DNA que é relativamente sub-representado no DNA repetitivo. Isto pode aumentar o número de leituras interpretáveis.
Enzima de restrição secundária
Da maneira aqui usada, o termo "enzima de restrição secundária" refere-se a uma segunda enzima de restrição que é opcionalmente usada após a digestão da enzima de res- 30 trição primária, ligação de DNA reticulado, desreticulação e (opcional) purificação de DNA. Em uma modalidade, a enzima de restrição secundária é usada para fornecer extremidades de DNA definidas nas seqüências de nucleotídeos de interesse, que permite a ligação de seqüências de composição de nucleotídeo conhecidas nos sítios de reconhecimento de en- zima de restrição secundária que flanqueiam as seqüências de nucleotídeos de interesse.
Em uma modalidade, a ligação de seqüências de composição de nucleotídeo co-
nhecida nos sítios de reconhecimento de enzima de restrição secundária que flanqueiam (por exemplo, estão em cada lado ou extremidade de) as seqüências de nucleotídeos de interesse envolve ligação em condições diluídas para favorecer a ligação intramolecular en- tre os sítios de reconhecimento de enzima de restrição secundária que flanqueiam seqüên- cias de nucleotídeos alvos e as seqüências de nucleotídeos ligados de interesse. Isto resulta efetivamente na formação de círculos de DNA nos quais a seqüência de nucleotídeos alvo conhecida flanqueia a seqüências desconhecidas de interesse.
Em uma outra modalidade, a ligação de seqüências de composição de nucleotídeo conhecida nos sítios de reconhecimento de enzima de restrição secundária que flanqueiam (por exemplo, estão em cada lado ou extremidade de) as seqüências de nucleotídeos de interesse envolve a adição de seqüências de DNA exclusivas de composição de nucleotídeo conhecida, seguida pela ligação em condições que favorecem ligação intermolecular entre os sítios de reconhecimento de enzima de restrição secundária que flanqueiam as seqüên- cias de nucleotídeos de interesse e introduzem seqüências de DNA exclusivas de composi- ção de nucleotídeo conhecida.
Em uma modalidade, a enzima de restrição secundária é escolhida de maneira tal que nenhum dos sítios de enzima de restrição secundária esteja a cerca de 350 bp (por e- xemplo, 350-400 bp) do sítio de restrição primária.
Em uma outra modalidade, a enzima de restrição secundária é escolhida de manei- ra tal que o mesmo sítio de enzima de restrição secundária é provavelmente para ser locali- zado na seqüência de nucleotídeos ligados (isto é, a seqüência reticulada ligada). Uma vez que as extremidades da primeira seqüência de nucleotídeos (alvo) e a seqüência de nucleo- tídeos ligados podem ser extremidades coesivas compatíveis (ou rombas), as seqüências podem ainda estar ligadas a fim de circular o DNA. Dessa maneira, a etapa de digestão é seguida por ligação em condições diluídas que favorecem interações intramoleculares e circulação opcional do DNA por meio de extremidades compatíveis.
Preferivelmente, o sítio de reconhecimento de enzima de restrição secundária é um sítio de reconhecimento de seqüência de nucleotídeos de 4 ou 5 bp. Enzimas que reconhe- cem seqüências de 4 ou 5 bp de DNA incluem, mas sem limitações, TspEI, Maell, Alui, Nlal- II, Hpall, FnuDII, Mael, Dpnl, Mbol, Hhal, Haelll, Rsal, Taql, CviRI, Msel, Sthl 321, Acil, Dpnll, Sau3 Al e Mnll.
Em uma modalidade preferida, a enzima de restrição secundária é Nlalll e/ou Dpnll.
O termo "sítio de reconhecimento de enzima de restrição secundária" refere-se ao sítio na seqüência de nucleotídeos que é reconhecida e clivada pela enzima de restrição secundária.
Após a digestão com a enzima de restrição secundária, uma reação de ligação adi- cional é realizada. Em uma modalidade, esta reação de ligação liga seqüências de DNA de composição de seqüência de nucleotídeos conhecida no sítio de digestão de enzima de res- trição secundária de uma ou mais seqüências que estão ligadas à seqüência de nucleotí- deos alvo.
Para algumas modalidades, o método exclui a etapa de digerir as seqüências de nucleotídeos com uma enzima de restrição secundária.
Para algumas modalidades, o método exclui ligar uma ou mais seqüências de DNA de composição de nucleotídeo conhecida no(s) sítio(s) de digestão de enzima de restrição secundária disponível(s) que flanqueia(m) uma ou mais seqüências de nucleotídeos de inte- resse.
Enzima de restrição terciária
Da maneira aqui usada, o termo "enzima de restrição terciária" refere-se a uma ter- ceira enzima de restrição que pode ser usada opcionalmente após a etapa da enzima de restrição secundária a fim de Iinearizar o DNA circular antes da amplificação.
Preferivelmente, a enzima de restrição terciária é uma enzima que reconhece um sítio de reconhecimento de nucleotídeo de 6 bp ou mais.
Preferivelmente, a enzima de restrição terciária digere a primeira seqüência de nu- 15 cleotídeos (alvo) entre os sítios de reconhecimento da enzima de restrição primária e se- cundária. Da maneira a ser entendida pelos versados na técnica, é desejável que a enzima de restrição terciária não digira a primeira seqüência de nucleotídeos (alvo) tão perto dos sítios de reconhecimento da enzima de restrição primária e secundária, de maneira tal que os iniciadores de amplificação não possam mais hibridizar. Dessa maneira, é preferível que 20 o sítio de reconhecimento de enzima de restrição terciária esteja localizado pelo menos na mesma distância dos sítios de reconhecimento da enzima de restrição primária e secundária que o comprimento do iniciador a ser usado, de maneira tal que o(s) iniciador(s) de amplifi- cação(s) ainda possa(m) hibridizar.
Em uma modalidade preferida, a enzima de restrição terciária é uma que reconhece uma seqüência de 6 bp de DNA.
O termo "sítio de reconhecimento de enzima de restrição terciária" refere-se ao sítio na seqüência de nucleotídeos que é reconhecida e clivada pela enzima de restrição terciá- ria.
Sítio de reconhecimento
Endonucleases de restrição são enzimas que clivam o cerne de fosfato e açúcar do
DNA. Na maioria dos cenários práticos, uma dada enzima de restrição corta ambas as fitas de DNA duplex em um trecho de apenas algumas bases. Os substratos para enzimas de restrição são seqüências de DNA de fita dupla denominados sítios/sequências de reconhe- cimento.
O comprimento dos sítios de reconhecimento de restrição varia, dependendo da
enzima de restrição que é usada. O comprimento da seqüência de reconhecimento dita com que frequência a enzima cortará em uma seqüência de DNA. A título de exemplo, inúmeras enzimas de restrição reconhecem uma seqüência de
4 bp de DNA. As seqüências e a enzima que reconhecem a seqüência de 4 bp de DNA in- cluem, mas sem limitações, AATT (TspEI), ACGT (Maell), AGCT (Alui), CATG (Nlalll), CCGG (Hpall), CGCG (FnuDII)1 CTAG (Mael), GATC (Dpnl, Dpnll, Sau3AI & Mbol), GCGC (Hhal), GGCC (Haelll), GTAC (Rsal), TCGA (Taql), TGCA (CviRI), TTAA (Msel), CCCG (St- hl32I), CCGC (AciI) e CCTC (MnII)
A título de exemplo adicional, inúmeras enzimas de restrição reconhecem uma se- qüência de 6 bp de DNA. As seqüências e a enzima que reconhecem a seqüência de 6 pa- res de bases bp de DNA incluem, mas sem limitações, AACGTT (Acll), AAGCTT (Hindlll), AATATT (Sspl), ACATGT (BspLUIII), ACCGGT (Agel), ACGCGT (Mlul), ACTAGT (Spel), AGATCT (BgIII), AGCGCT (Eco47lll), AGGCCT (Stul), AGTACT (Seal), ATCGAT (Clal), ATGCAT (AvaIII)1 ATTAAT (Vspl), CAATTG (Mfel), CACGTG (PmaCI), CAGCTG (Pvull), CATATG (Ndel), CCATGG (Ncol), CCCGGG (Smal), CCGCGG (Sacll), CCTAGG (Avrll), CGATCG (Pvul), CGGCCG (Xmalll), CGTACG (SpII)1 CTCGAG (Xhol), CTGCAG (Pstl), CTTAAG (AfIII)1 GAATTC (BamHI), GACGTC (Aatll), GAGCTC (Sad), GATATC (EcoRV), GCATGC (Sphl), GCCGGC (Nael), GCGCGC (BsePI), GCTAGC (Nhel), GGATCC (BamHI), GGCGCC (Narl), GGGCCC (Apal), GGTACC (Kpnl), GTATAC (Snal), GTCGAC (Sail), GTGCAC (ApaLI), GTTAAC (Hpal), TACGTA (SnaBI)1 TCATGA (BspHI), TCCGGA (BspMII), TCGCGA (Nrul), TCTAGA (Xbal), TGATCA (Bell), TGCGCA (Mstl), TGGCCA (Bali), TGTACA (Bsp14071), TTATAA (Psil), TTCGAA (AsuII) e TTTAAA (Ahalll).
A título de exemplo adicional, inúmeras enzimas de restrição reconhecem uma se- qüência de 7 bp de DNA. As seqüências e a enzima que reconhecem a seqüência de 7 bp de DNA incluem, mas sem limitações CCTNAGG (Saul), GCTNAGC (Espl), GGTNACC Bs- tEII e TCCNGGA Pfol.
A título de exemplo adicional, inúmeras enzimas de restrição reconhecem uma se-
qüência de 8 bp de DNA. As seqüências e a enzima que reconhecem a seqüência de 8 bp de DNA incluem, mas sem limitações ATTTAAAT (Swal), CCTGCAGG (Sse8387l), CGCCGGCG (Sse232l), CGTCGACG (SgrDI), GCCCGGGC (Srff), GCGATCGC (Sgfl), GCGGCCGC (Notl), GGCCGGCC (Fsel), GGCGCGCC (AscI), GTTTAAAC (PmeI) e TTAATTAA (Pad).
Inúmeras destas enzimas contêm seqüência CG que pode ser metilada in vivo. I- númeras enzimas de restrição são sensíveis a esta metilação e não clivarão a seqüência metilada, por exemplo, Hpall não clivará a seqüência CCmGG considerando que seu isos- quizômero Mspl é insensível a esta modificação e clivará a seqüência metilada. Dessa ma- neira, em alguns exemplos, não são usadas enzimas sensíveis a metilação eucariótica.
Em uma modalidade, um sítio de reconhecimento é um sítio de digestão.
Em uma modalidade, um sítio de reconhecimento de enzima de restrição é um sítio de digestão de enzima de restrição.
Circulação
De acordo com uma modalidade da presente invenção, o material para 4C é prepa- rado criando círculos de DNA digerindo o molde de 3C com uma enzima de restrição secun- dária, seguido por ligação.
Preferivelmente, é escolhida uma enzima de restrição secundária é escolhida que corta a primeira seqüência de nucleotídeos (alvo) em mais que cerca de 350 bp (por exem- plo, 350-400 bp) do sítio de restrição primária. Vantajosamente, isto minimiza uma tendência na formação de círculo em virtude das restrições topológicas (Rippe et al. (2001) Trends in Biochem. Sciences 26, 733-40).
Preferivelmente, a enzima de restrição secundária é um cortador freqüente que re- conhece um sítio de reconhecimento de enzima de restrição de 4 ou um 5 bp. Assim, é pos- sível obter os menores fragmentos de restrição para eficiências de amplificação iguais de todos os fragmentos ligados durante a amplificação.
Antes da digestão e ligação da enzima de restrição secundária, o molde de DNA
compreenderá um sítio de reconhecimento de enzima secundária na primeira seqüência de nucleotídeos (alvo) localizada a mais que cerca de 350-400 bp do sítio de restrição primária e um outro sítio de reconhecimento de enzima secundária localizado na seqüência de nu- cleotídeos que foi ligada (isto é, na segunda seqüência de nucleotídeos).
Preferivelmente, a etapa de digestão de enzima de restrição secundária é realizada
por mais de 1 hora até toda a noite e seguida por inativação pelo calor da enzima.
Preferivelmente, o DNA nesta mistura da reação é purificado usando méto- dos/estojos convencionais que são conhecidos na técnica.
Após a etapa de digestão da enzima de restrição secundária, um sítio de enzima de 25 restrição secundária será localizado em mais que 350-400 bp do sítio de restrição primária na primeira seqüência de nucleotídeos (alvo) e um outro sítio de enzima de restrição secun- dária será localizado na seqüência de nucleotídeos ligados (isto é, a segunda seqüência de nucleotídeos). Uma vez que as extremidades da primeira seqüência de nucleotídeos (alvo) e a seqüência de nucleotídeos ligados têm extremidades compatíveis, as seqüências podem 30 estar ligadas a fim de circular o DNA.
A etapa de digestão é então seguida pela ligação em condições diluídas que favo- recem interações e circulação intramolecular do DNA por meio de extremidades compatí- veis.
Preferivelmente, a reação de ligação é realizada em uma concentração de DNA de cerca de 1 - 5 ng///L.
Preferivelmente, a reação de ligação é realizada por mais de 1 hora (por exemplo, 2, 3, 4 ou mais horas) a cerca de 16-25 °C. Dessa maneira, após a reação de ligação, DNA circular pode ser preparado. O DNA circular compreenderá os sítios de reconhecimento para pelo menos a enzima de restrição secundária ou as enzimas de restrição primária e secundária. No DNA circular contendo a primeira seqüência de nucleotídeos (alvo), o sítio de reconhecimento de enzima de restrição 5 primária e os sítios de reconhecimento de enzima de restrição secundária definirão as ex- tremidades da primeira seqüência de nucleotídeos (alvo) e a seqüência de nucleotídeos li- gados (isto é, a segunda seqüência de nucleotídeos). Dessa maneira, a primeira seqüência de nucleotídeos (alvo) e a seqüência de nucleotídeos ligados dão separadas (por exemplo, divididas) pelo sítio de reconhecimento de enzima de restrição primária e o sítio de reconhe- 10 cimento de enzima de restrição secundária.
Amplificação
Uma ou mais reações de amplificação podem ser realizadas a fim de amplificar os moldes de DNA 4C.
A amplificação de DNA pode ser realizada usando inúmeros métodos diferentes 15 que são conhecidos na técnica. Por exemplo, o DNA podem ser amplificado usando a rea- ção em cadeia da polimerase (Saiki et al., 1988); PCR mediada por ligação, amplificação de replicase de Qb (Cahill, Foster e Mahan, 1991; Chetverin e Spirin, 1995; Katanaev, Kurna- sov e Spirin, 1995); a reação em cadeia da Iigase (LCR) (Landegren et al., 1988; Barany, 1991); o sistema de replicação de seqüência auto-sustentável (Fahy, Kwoh e Gingeras, 20 1991) e amplificação por substituição de fita (Walker et al., 1992).
Adequadamente, o DNA é amplificado usando PCR. "PCR" refere-se ao método de Κ. B. Mullis em patentes U.S. 4.683.195, 4.683.202, e 4.965.188 que descrevem um método para aumentar a concentração de um segmento de uma seqüência de nucleotídeos em uma mistura de DNA genômico sem clonagem ou purificação.
Em uma modalidade, PCR inversa é usada. PCR inversa (IPCR) (descrita por O-
chman et al (1988) Genetics 120(3), 621-3) é um método para a amplificação rápida in vitro de seqüências de DNA que flanqueiam uma região de seqüência conhecida. O método usa a reação em cadeia da polimerase (PCR), mas ele tem os iniciadores orientados na direção reversa da orientação usual. O molde para os iniciadores reversos é um fragmento de restri- 30 ção que foi ligado mediante ele mesmo formar um círculo. PCR inversa tem muitas aplica- ções na genética molecular, por exemplo, a amplificação e identificação de seqüências que flanqueiam elementos transponíveis. Para aumentar a eficiência e reprodutibilidade da am- plificação, é preferível que os círculos de DNA sejam Iinearizados antes da amplificação u- sando uma enzima de restrição terciária. Preferivelmente, uma enzima de restrição terciária 35 que tem um cortador de 6 bp ou mais é usada. Preferivelmente, a enzima de restrição terciá- ria corta a primeira seqüência de nucleotídeos (alvo) entre os sítios de enzima de restrição primária e secundária. A digestão do molde de 3C com a enzima de restrição secundária, circulação op- cional, ligação (por exemplo, ligação em condições diluídas) e linearização opcional da pri- meira seqüência de nucleotídeos (alvo) contendo círculos produzem um molde de DNA para amplificação ("molde de DNA 4C").
Para a etapa de amplificação, pelo menos dois oligonucleotídeos iniciadores são usados, nos quais cada iniciador hibridiza em uma seqüência de DNA que flanqueia as se- qüências de nucleotídeos de interesse. Em uma modalidade preferida, pelo menos dois oli- gonucleotídeos iniciadores são usados, nos quais cada iniciador hibridiza na seqüência alvo que flanqueia as seqüências de nucleotídeos de interesse.
Em uma modalidade, a palavra "flanquear", no contexto da hibridização do inicia- dor, significa que pelo menos um iniciador hibridiza em uma seqüência de DNA adjacente a uma extremidade (por exemplo, a extremidade 5') da seqüência de nucleotídeos de interes- se, e pelo menos um iniciador hibridiza em uma seqüência de DNA na outra extremidade (por exemplo, a extremidade 3') da seqüência de nucleotídeos de interesse. Preferivelmente, pelo menos um iniciador direto hibridiza em uma seqüência de DNA adjacente a uma extre- midade (por exemplo, a extremidade 5') da seqüência de nucleotídeos de interesse e pelo menos um iniciador reverso hibridiza em uma seqüência de DNA na outra extremidade (por exemplo, a extremidade 3') da seqüência de nucleotídeos de interesse.
Em uma modalidade preferida, a palavra "flanquear", no contexto da hibridização do iniciador, significa que pelo menos um iniciador hibridiza em uma seqüência alvo adjacente a uma extremidade (por exemplo, a extremidade 5’) da seqüência de nucleotídeos de inte- resse e pelo menos um iniciador hibridiza em uma seqüência alvo na outra extremidade (por exemplo, a extremidade 3’) da seqüência de nucleotídeos de interesse. Preferivelmente, pelo menos um iniciador direto hibridiza em uma seqüência alvo adjacente a uma extremi- dade (por exemplo, a extremidade 5’) da seqüência de nucleotídeos de interesse e pelo me- nos um iniciador reverso hibridiza em uma seqüência alvo na outra extremidade (por exem- plo, a extremidade 3’) da seqüência de nucleotídeos de interesse.
Da maneira aqui usada, a palavra "iniciador" refere-se a um oligonucleotídeo, quer de ocorrência natural como em uma digestão de restrição purificada quer produzido sinteti- camente, que é capaz de agir como um ponto de iniciação de síntese quando colocado em condições em que a síntese de um produto de extensão de iniciador, que é complementar a uma fita de ácido nucléico, é induzida (isto é, na presença de nucleotídeos e um agente de indução tal como DNA polimerase e em uma temperatura e pH adequados). O iniciador é preferivelmente de fita simples para eficiência máxima na amplificação, mas pode ser de fita dupla. Se for de fita dupla, o iniciador é primeiro tratado para separar suas fitas antes de ser usado para preparar produtos de extensão. Preferivelmente, o iniciador é um oligodesoxirri- bonucleotídeo. O iniciador tem que ser suficientemente longo para iniciar a síntese de pro- dutos de extensão na presença do agente de indução. Os comprimentos exatos dos inicia- dores dependerão de muitos fatores, incluindo temperatura, origem do iniciador e o uso do método.
Adequadamente, os iniciadores terão pelo menos 15, preferivelmente pelo menos 16, 17, 18, 19 ou 20, por exemplo, pelo menos 25, 30 ou 40 nucleotídeos de comprimento. Preferivelmente, os iniciadores de amplificação têm de 16 a 30 nucleotídeos de comprimen- to.
Preferivelmente, os iniciadores são desenhados para estar o mais próximo possível dos sítios de reconhecimento da enzima de restrição primária e secundária que separam a 10 primeira seqüência de nucleotídeos (alvo) e a segunda (capturada) seqüência de nucleotí- deos. Os iniciadores podem ser desenhados de maneira tal que eles estejam em cerca de 100 nucleotídeos, tais como cerca de 90, 80, 70, 60, 50, 40, 30, 20, 10, 9, 8, 7, 6, 5, 4, 3, 2 ou 1 nucleotídeo(s) longe dos sítios de reconhecimento de enzima de restrição primária e secundária.
Adequadamente, os iniciadores podem ser desenhados de maneira tal que eles se
sobreponham parcial ou completamente nos sítios de reconhecimento da enzima de restri- ção primária e secundária.
Adequadamente, os iniciadores de amplificação são desenhados de maneira tal que suas extremidades 3' fiquem voltadas para fora no sentido da segunda seqüência de nucleotídeos.
Em uma modalidade, a amplificação pode ser combinada com a adição de seqüên- cias adicionais às extremidades dos produtos amplificados. Preferivelmente, estas seqüên- cias adicionais são seqüências adaptadoras exigidas para o sequenciamento de alto de- sempenho. Adequadamente, iniciadores contêm uma projeção (por exemplo, uma projeção 25 5’). Adequadamente, a projeção adiciona parte ou a seqüência adaptadora completa exigida para o sequenciamento de alto desempenho. Adequadamente, os iniciadores contêm uma projeção (por exemplo, uma projeção 5') que adiciona parte, ou a seqüência completa usada para iniciar a reação de sequenciamento in o sequenciamento de alto desempenho. Dessa maneira, em uma modalidade, os iniciadores sobrepõem-se parcial ou completamente com 30 os sítios de reconhecimento de enzima de restrição primária e/ou secundária com as se- qüências adaptadoras e de iniciação de seqüência adicionadas como projeções 5’ no inicia- dor. Além do mais, ou alternativamente, os iniciadores contêm uma fração conjugada (por exemplo, biotina) que permite a separação subsequente de produtos de PCR do molde 4C genômico.
Se o método de amplificação que é usado for PCR inversa, então é preferível que
as reações de amplificação sejam realizadas em cerca de 100-400 ng de DNA do molde 4C (por cerca de 50 μί. de reação de mistura de PCR) ou outras quantidades de DNA para as quais PCR reações replicadas fornecem resultados reprodutíveis (ver figura 1) e incluem um número máximo de eventos de ligação por reação de PCR.
Preferivelmente, a reação de amplificação de PCR inversa é realizada usando o Expand Long Molde PCR System (Roche)1 usando tampão 1, de acordo com as instruções do fabricante.
Amostras
O termo "amostra" da maneira aqui usada tem seu significado natural. Uma amos- tra pode ser qualquer entidade física compreendendo DNA que é ou é capaz de ser reticula- do. A amostra pode ser ou pode ser derivada de material biológico.
A amostra pode ser ou pode ser derivada de uma de mais entidades, tais como
uma ou mais células, um ou mais núcleos, ou uma ou mais amostras de tecido. As entida- des podem ser ou podem ser derivadas de quaisquer entidades nas quais o DNA, tal como cromatina, está presente. A amostra pode ser ou pode ser derivada de uma ou mais células isoladas ou uma ou mais amostras de tecido isoladas, ou um ou mais núcleos.
A amostra pode ser ou pode ser derivada de células vivas e/ou células mortas e/ou
Iisados nucleares e/ou cromatina isolada.
A amostra pode ser ou pode ser derivada de sujeitos doentes e/ou não doentes.
A amostra pode ser ou pode ser derivada de um sujeito que suspeita-se estar so- frendo de uma doença.
A amostra pode ser ou pode ser derivada de um sujeito que deve ser testado com
relação a probabilidade que ele sofrerá de uma doença no futuro.
A amostra pode ser ou pode ser derivada de material de paciente viável ou não viá- vel.
A fixação de células e tecidos para uso na preparação do molde de 3C é descrita em detalhes em Splinter et ali, (2004) Methods Enzymol. 375, 493-507.
Marcador
Preferivelmente, as seqüências de nucleotídeos (por exemplo, moldes de DNA 4C amplificados, iniciadores ou sondas etc.) são marcadas a fim de assistir em suas aplicações à jusante, tal como hibridização de arranjo. A título de exemplo, os moldes de DNA 4C po- dem ser marcados usando iniciação aleatória ou tradução com corte.
Uma grande variedade de marcadores (por exemplo, reportadores) pode ser usada para marcar as seqüências de nucleotídeos aqui descritas, particularmente durante a etapa de amplificação. Marcadores adequados incluem radioisótopos, enzimas, agentes fluores- centes, quimiolumínescentes ou cromogênicos, bem como substratos, cofatores, inibidores, 35 partículas magnéticas e similares. Patentes que preceituam o uso de tais marcadores inclu- em US-A-3.817.837, US-A-3.850.752, US-A-3.939.350, US-A-3.996.345, US-A-4.277.437, US-A-4.275.149 e US-A-4.366.241. Marcadores adicionais incluem, mas sem limitações, /?-galactosidase, invertase, proteína verde fluorescente, luciferase, cloranfenicol, acetiltransferase, /?-glucuronidase, exo-glucanase e glicoamilase. Marcadores fluorescentes também podem ser usados, bem como reagentes fluorescentes especificamente sintetizados com propriedades químicas par- 5 ticulares. Uma grande variedade de maneiras de medir fluorescência está disponível. Por exemplo, alguns marcadores fluorescentes exibem uma mudança no espectro de excitação ou emissão, algumas exibem transferência de energia de ressonância onde um reportador fluorescente perde a fluorescência, enquanto um segundo ganha fluorescência, alguns exi- bem uma perda (finalização) ou aparência de fluorescência, enquanto alguns reportam mo- 10 vimentos rotacionais.
A fim de obter material suficiente para marcar, múltiplas amplificações podem ser agrupadas, em vez de aumentar o número de ciclos de amplificação por reação. Alternati- vamente, nucleotídeos marcados podem ser incorporados nos últimos ciclos da reação de amplificação (por exemplo, 30 ciclos de PCR (sem marcador) +10 ciclos de PCR (mais marcador)).
Arranio
Em uma modalidade particularmente vantajosa, os moldes de DNA 4C que são preparados de acordo com os métodos aqui descritos podem ser hibridizados em um arran- jo. Dessa maneira, a tecnologia do arranjo (por exemplo, micro-arranjo) pode ser usada para identificar seqüências de nucleotídeos, tais como fragmentos genômicos, que compartilham frequentemente um sítio nuclear com uma primeira seqüência de nucleotídeos (alvo).
Arranjos existentes, tais como arranjos de expressão e genômicos, podem ser usa- dos de acordo com a presente invenção. Entretanto, a presente invenção também busca fornecer arranjos inéditos (por exemplo, arranjos de DNA) da maneira aqui descrita.
Um "arranjo" é uma coleção intencionalmente criada de ácidos nucléicos que pode
ser preparada tanto sinteticamente quanto biossinteticamente e triada com relação à ativi- dade biológica em uma variedade de formatos diferentes (por exemplo, bibliotecas de molé- culas solúveis; e bibliotecas de oligos presas à microesferas de resina, chipes de sílica ou outros suportes sólidos). Adicionalmente, o termo "arranjo” inclui aquelas bibliotecas de áci- 30 dos nucléicos que podem ser preparadas apontando ácidos nucléicos de essencialmente qualquer comprimento (por exemplo, de 1 a cerca de 1000 monômeros de nucleotídeos de comprimento) em um substrato.
Tecnologia do arranjo e as várias técnicas e aplicações associadas a ela estão descritas em geral em inúmeros livros texto e documentos. Este incluem Lemieux et al, 1998, Molecular Breeding 4, 277-289, Schena e Davis. Parallel Analysis wíth Biological Chips, em PCR Methods Manual (eds. M. Innis, D. Gelfand, J. Sninsky), Schena e Davis, 1999, Genes, Genomas and Chips. In DNA Microarrays: A Practical Approach (ed. M. Sehe- na), Oxford University Press, Oxford, UK, 1999), The Chipping Forecast (Nature Genetics speeial issue; January 1999 Supplement), Mark Sehena (Ed.), Mieroarray Bioehip Technol- ogy, (Eaton Publishing Company), Cortes, 2000, The Scientist 14[17]:25, Gwynne e Page, Microarrays analysis: the next revolution in molecular biology, Science, 1999 August 6; e Eakins e Chu, 1999, Trends in Biotechnology, 17, 217-218.
Tecnologia do arranjo supera as desvantagens com métodos tradicionais em biolo- gia molecular, que trabalham em geral em uma base "um gene em um experimento”, resul- tando em baixo desempenho e na incapacidade de apreciar a "figura total" da função do gene. Simultaneamente, as principais aplicações para tecnologia do arranjo incluem a identi- 10 ficação de seqüência (gene/mutação de gene) e a determinação do nível de expressão (a- bundância) de genes. O perfilamento da expressão de gene pode promover o uso da tecno- logia do arranjo, opcionalmente em combinação com técnicas proteômicas (Celis et al, 2000, FEBS Lett, 480(l):2-16; Lockhart e Winzeler, 2000, Nature 405(6788):827-836; Khan et al., 1999, 20(2):223-9). Outras aplicações de tecnologia do arranjo também são conhecidas na 15 técnica; por exemplo, descoberta de gene, pesquisa de câncer (Marx, 2000, Science 289: 1670-1672; Scherf, et al, 2000, Nat Genet;24(3):236-44; Ross et al, 2000, Nat Genet. 2000 Mar;24(3):227-35), análise SNP (Wang et al, 1998, Science, 280(5366): 1077-82), descober- ta de medicamento, farmacogenômicos, diagnóstico de doença (por exemplo, utilizando dis- positivos de microfluidos: Chemical & Engineering News, February 22, 1999, 77(8):27- 36), 20 toxicologia (Rockett e Dix (2000), Xenobiotica, 30(2): 155-77; Afshari et al., 1999, Câncer Resl;59(19):4759-60) e toxicogenômicos (um híbrido de genômicos funcionais e toxicologia molecular).
Em geral, qualquer biblioteca pode ser arranjada de uma maneira em ordem em um arranjo, separando espacialmente os elementos da biblioteca. Exemplos de bibliotecas ade- 25 quadas para arranjar incluem bibliotecas de ácido nucléico (incluindo bibliotecas de DNA, DNAc, oligonucleotídeo, etc.), bibliotecas de peptídeo, polipeptídeo e proteína, bem como bibliotecas compreendendo quaisquer moléculas, tais como bibliotecas ligantes, entre ou- tras.
As amostras (por exemplo, elementos de uma biblioteca) são em geral fixas ou i- 30 mobilizadas em uma fase sólida, preferivelmente um substrato sólido, para limitar difusão e mistura das amostras. Em uma modalidade preferida, bibliotecas de ligantes de ligação de DNA podem ser preparadas. Em particular, as bibliotecas podem ser imobilizadas em uma fase sólida substancialmente planar, incluindo membranas e substratos não porosos, tais como plástico e vidro. Além disso, as amostras são preferivelmente arranjadas em uma ma- 35 neira tal que esta que a indexação (isto é, referência ou acesso a uma amostra particular) seja facilitada. Tipicamente, as amostras são aplicadas como pontos em uma formação de grade. Sistemas de ensaio comuns podem ser adaptados com este propósito. Por exemplo, um arranjo pode ser imobilizado na superfície de uma microplaca, tanto com múltiplas amos- tras em um poço, quanto com uma única amostra em cada poço. Além disso, o substrato sólido pode ser uma membrana, tal como uma membrana de nitrocelulose ou de náilon (por exemplo, membranas usadas em experimentos de blotting). Substratos alternativos incluem vidro ou substratos a base de sílica. Assim, as amostras são imobilizadas por qualquer mé- todo adequado conhecido na técnica, por exemplo, por interações de carga, ou por acopla- mento químico nas paredes ou fundo dos poços, ou na superfície da membrana. Outros meios de arranjo e fixação podem ser usados, por exemplo, pipetagem, remoção de gota residual com um leve toque, meios piezelétricos, tecnologia jato de tinta e jato de bolha, a- plicação eletrostática, etc. No caso de chipes a base de silício, a fotolitografia pode ser utili- zada para arranjar e fixar as amostras no chipe.
As amostras podem ser arranjadas sendo "apontadas" no substrato sólido; isto po- de ser realizado manualmente ou elaborando o uso de robótica para depositar a amostra. Em geral, os arranjos podem ser descritos como macroarranjos ou microarranjos, a diferen- ça sendo o tamanho dos pontos da amostra. Os macroarranjos contêm tipicamente tama- nhos de ponto de amostra de cerca de 300 microns ou maiores e podem ser facilmente ima- geados por varredores de gel e blot existentes. Os tamanhos de ponto de amostra em mi- croarranjos são tipicamente menores que 200 microns em diâmetro e estes arranjos contêm normalmente milhares de pontos. Assim, microarranjos podem exigir robótica e equipamento de imageamento especializados, que podem necessitar ser feitos sob medida. A instrumen- tação é descrita em geral em uma revisão de Cortese, 2000, O Scientist 14[11]:26.
Técnicas para produzir bibliotecas imobilizadas de moléculas de DNA são descritas na técnica. Em geral, a maioria dos métodos da técnica anterior descreveu como sintetizar bibliotecas de moléculas de ácido nucléico de fita simples usando, por exemplo, técnicas de mascaramento para constituir várias permutas de seqüências nas várias posições discretas no substrato sólido. A patente U.S. 5.837.832 descreve um método melhorado para produzir arranjos de DNA imobilizados em substratos de silício com base na tecnologia de integração de escala muito grande. Em particular, patente U.S. 5.837.832 descreve uma estratégia de- nominada "ladrilhamento" para sintetizar conjuntos específicos de sondas em locais espaci- almente definidos em um substrato que pode ser usado para produzir as bibliotecas de DNA imobilizadas da presente invenção. A patente U.S. 5.837.832 também fornece referências para técnicas anteriores que também podem ser usadas.
Arranjos também pode ser construídos usando química de fotodeposição.
Arranjos de peptídeos (ou peptideomiméticos) também podem ser sintetizados em uma superfície de uma maneira que coloque cada elemento distinto da biblioteca (por e- xemplo, seqüência de peptídeo exclusiva) em um local discreto predefinido no arranjo. A identidade de cada elemento da biblioteca é determinada por seu local espacial no arranjo. Os locais no arranjo onde interações de ligação entre uma molécula predeterminada (por exemplo, um alvo ou sonda) e elementos de biblioteca reativos ocorrem são determinados, identificando por maio disto as seqüências de os elementos de biblioteca reativos com base no local espacial. Estes métodos são descritos na patente U.S. 5.143.854; W090/15070 e W092/10092; Fodor et al. (1991) Science, 251: 767; Dower e Fodor (1991) Ann. Rep. Med. Chem., 26: 271.
Para auxiliar a detecção, marcadores foram tipicamente usados (da maneira discu- tida anteriormente), tal como qualquer reportador facilmente detectável, por exemplo, um reportador fluorescente, bioluminescente, fosforescente, radioativo, etc. Tais reportadores, sua detecção, acoplamento a alvos/sondas, etc. são discutidos em outra parte deste docu- mento. A marcação de sondas e alvos também é discutida em Shalon et al, 1996, Genoma Res 6(7):639-45.
Exemplos específicos de arranjos de DNA são como a seguir:
Formato I: DNAc de sonda (500-5.000 bases de comprimento) é imobilizado em uma superfície sólida, tal como vidro usando apontamento por robô, e exposto em um con- junto de alvos tanto separadamente quanto em uma mistura. Este método, é amplamente considerado como desenvolvido em Stanford University (Ekins e Chu, 1999, Trends in Bio- technology, 1999, 17,217-218).
Formato II: um arranjo de sondas de oligonucleotídeos (ologos de 20-25-mer, prefe- rivelmente, oligos de 40-60 mer) ou ácido nucléico de peptídeo (PNA) é sintetizado tanto in situ (no chipe) quanto por síntese convencional seguido por imobilização no chipe. O arranjo é exposto ao DNA de amostra marcada, hibridizado, e a identidade/abundância de seqüên- cias complementares é determinada. Um chipe de DNA como este é vendido por Affymetrix, Inc., com o nome comercial GeneChip®. Agilent e Nimblegen também fornecem arranjos adequados (por exemplo, arranjos de Iadrilhamento genômico).
Exemplos de alguns formatos de microarranjo comercialmente disponíveis são de- monstrados na tabela 1 a seguir (ver também Marshall e Hodgson, 1998, Nature Biotechno- logy, 16(1), 27-31).
Empresa Nome do Método de arran¬ Etapa de hibridiza¬ Saída produto jo ção Affvmetrix. GeneChio® Síntese fotolito- 10.000-260.000 ca¬ Fluorescência Inc.. Santa gráfica (no chipe) racterísticas oligo Clara, Califór¬ in situ de oligos sondadas com 30-40 nia de ~ 20-25 mer fragmentos de nu¬ em pastilhas de cleotídeo marcados silício, que são de DNAc de amostra cortadas em chi- ou RNA antissentido pes de 1,25 cm2 ou 5,25 cm2 Brax1 Cam- oligo sintético 1.000 oligos em um espectrometria bridge, UK pequeno, sinteti¬ “chipe universal” de massa zado de fora do sondado com ácido chipe nucléico alvejado Gene Loaic. READS™ Inc., Columbia, Maryland Geometrix. Universal Inc.. The Arrays ™ Woodlands, Texas Hvsea Inc.. HyChipIM amostras de DNA pontos de DNAc de Radioisótopo Sunnyvale, de 500-2.000 nt 64 amostras sonda¬ f Califórnia impressas em dos com 8.000 oli¬ fluorescência membranas de gos 7-mer (HyGnos- 0,6 cm2 (HyGnos- tics) ou <= pontos de tics) ou ~ 18 cm2 DNAc de 55.000 (Gene Discovery) amostras sondados 5 oligômeros fa¬ com 300 oligo de 7- bricados impres¬ mer (Gene Disco¬ sos como arran¬ very) jos de 1,15 cm2 Pontos de oligo 1024 em vidro (HyChip) universal sondaram DNAcs de amostra de 10 kb, marcado com oligo 5-mer e Iigase Incvte Phar- GEM Impressão piezo- <=1.000 (eventual¬ fluorescência e maceutica 1s. elétrica para pon¬ mente 10.000) pon¬ radioisótopo Inc., PAIo Alto, tuação de frag¬ tos de oli- Califórnia mentos de PCR e go/fragmento de síntese no chipe PCR sondados com de oligos RNA marcado Molecular Dv- Storm® Flu- DNAcs de 500- pontos de DNAc de fluorescência namics Inc.. orlmager ® 5.000 nt impres¬ ~ 10.000 sondados Sunnyvale, sos à caneta em com DNAcs de a- Califórnia lâmina de vidro mostra marcada de de ~ 10 cm2 200-400 nt Nanogen, San Semicon- Oligos ~20-mer, pontos de oligos 25, fluorescência Diego, Califór¬ ductor Mi- capturados em 64, 400 (e eventual¬ nia crochip pontos eletroatra- mente 10.000) pola¬ tivos em pastilhas rizados para melho¬ de silício, que são rar a hibridização de cortadas em chi- DNAcs de amostra pes <1 cm2 marcados de 200- 400 nt Protogene La¬ Síntese no chipe pontos de oligo < fluorescência boratories, de oligos de 40- 8.000 sondados com Palo Alto, Cali¬ 50 mer em chipe ácidos nucléicos de fórnia de vidro de 9 cm2 amostra marcada de por meio da im¬ 200-400 nt pressão em um arranjo de tensão de superfície Sequenom, MassArray Impressão de 250 localizações por espectroscopia Hamburg, A- SpectroChip arranjo; em torno SpectroChip interro¬ de massa Iemanha e San de oligos de 20- gado por dessorção Diego, Califór¬ 25-mer a laser e espectros- nia copia de massa Svnteni Inc.. UniGEMlM DNAcs de 500- <= pontos de DNAc fluorescência Fremont, Cali¬ 5.000 nt impres¬ de 10.000 sondados fórnia sos pela ponta com DNAcs de a- em chipe de vidro mostra marcada de de ~ 4 cm2 200-400 nt Nimbleaen Homo sapi- 38.000 transcri¬ plataforma de Svstems Inc.. ens Whole- ções com 5 son¬ varredura de 5 Madison Genome das por gene de micron 60mer Mi- 17,4 mm x 13 mm croarray The German macrochipe PNA em torno de 1.000 fluorescênci- Cancer Insti- prototípico com pontos em um chipe a/espectroscopi tute, Heidel- síntese no chipe de 8x12 cm a de massa berg, Ale¬ de sondas usan¬ manha do química f-moc ou t-moc Tabela 1: Exemplos de formatos de microarranjo de hibridização atualmente dispo- níveis
A fim de gerar dados de ensaios baseados em arranjo, é detectado um sinal que significa a presença ou ausência de hibridização entre uma sonda e uma seqüência de nu- 5 cleotídeos. A presente invenção contempla adicionalmente técnicas de marcação direta e indireta. Por exemplo, marcação direta incorpora corantes fluorescentes diretamente nas seqüências de nucleotídeos que hibridizam no arranjo associado a sondas (por exemplo, corantes são incorporados na seqüência de nucleotídeos por síntese enzimática na presen- ça de nucleotídeos marcados ou iniciadores de PCR). Esquemas de marcação direta produ- 10 zem sinais fortes de hibridização, usando tipicamente famílias de corantes fluorescentes com estruturas e características químicas similares e são simples de implementar. Em mo- dalidades preferidas compreendendo marcação direta de ácidos nucléicos, análogos de cia- nina ou alexa são utilizados em análise de arranjo comparativo multiflúor. Em outras modali- dades, esquemas de marcação indireta podem ser utilizados para incorporar epítopos nos 15 ácidos nucléicos tanto antes quanto após a hibridização nas sondas de microarranjo. Um ou mais procedimentos e reagentes de coloração são usados para marcar o complexo hibridi- zado (por exemplo, uma molécula fluorescente que se liga aos epítopos, fornecendo por meio disto um sinal fluorescente em virtude da conjugação de molécula corante no epítopo da espécie hibridizada).
A análise de dados também é uma importante parte de um experimento envolvendo
arranjos. Os dados brutos de um experimento de arranjo são tipicamente imagens que pre- cisam ser transformadas em matrizes, tabelas onde linhas representam, por exemplo, ge- nes, colunas representam, por exemplo, várias amostras tais como tecidos ou condições experimentais, e números em cada célula, por exemplo, caracterizam a expressão de uma 25 seqüência particular (preferivelmente, uma segunda seqüência que foi ligada na primeira seqüência de nucleotídeos (alvo)) na amostra particular. Estas matrizes têm que ser anali- sadas adicionalmente, se qualquer conhecimento sobre os processos biológicos fundamen- tais tiver que ser extraído. Métodos de análise de dados (incluindo análise de dados super- visada e não supervisada, bem como abordagens de bioinformática) são revelados em 30 Brazma e Vilo J (2000) FEBS Lett 480(1): 17-24.
Da maneira aqui descrita, uma ou mais seqüências de nucleotídeos (por exemplo, o molde de DNA) que são marcadas e, subsequentemente hibridizadas em um arranjo, com- preendem uma seqüência de nucleotídeos que é enriquecida por pequenos trechos de se- qüências com uma assinatura distinta, isto é, cobrindo a seqüência de nucleotídeos entre o sítio de reconhecimento de enzima de restrição primária que foi ligado durante o procedi- mento 3C na primeira seqüência de nucleotídeos (alvo), e seus respectivos sítios de reco- nhecimento de enzima de restrição secundária vizinhos.
Um arranjo único pode compreender múltiplas (por exemplo, duas ou mais) se- qüências de iscas.
Mapa cromossômico
É descrito adicionalmente aqui um método envolvendo a caracterização de frag- mentos de DNA reticulados como uma conseqüência de sua proximidade espacial ou física, com o propósito da (re)construção de mapas cromossômicos (por exemplo, mapas cromos- sômicos lineares) e a identificação diagnostica de mudanças nestes mapas cromossômicos.
Vantajosamente, tais técnicas podem ser ampliadas com propósitos diagnósticos, tal como reconstruir mapas cromossômicos físicos e identificar mudanças nestes mapas em decorrência de rearranjos genômicos.
A metodologia também pode ser usada para identificar variação genômica (natural) que não está necessariamente associada com doença, mas pode predispor um sujeito a um certo traço (por exemplo, um traço mental ou comportamental).
Em um aspecto, é fornecido um método para construir pelo menos um mapa cro- mossômico linear de um indivíduo compreendendo as etapas de: (a) fornecer uma amostra de ácido nucléico do dito indivíduo; (b) reticular o ácido nucléico na dita amostra; (c) digerir o ácido nucléico com uma enzima de restrição primária; (d) ligar as seqüências de nucleotí- deos reticulados; (e) reverter a reticulação; (f) analisar os produtos de ligação; (g) construir pelo menos um mapa cromossômico linear; e (h) identificar um ou mais rearranjos genômi- cos no mapa cromossômico linear dos ditos indivíduos.
Em um aspecto adicional, é fornecido um método para diagnosticar uma doença ou identificar um traço causado por um ou mais rearranjos genômicos em um cromossomo compreendendo as etapas de: (a) digerir uma amostra de DNA reticulado com uma enzima de restrição primária; (b) ligar as seqüências de nucleotídeos reticulados; (c) reverter a reti- culação; (d) analisar os produtos de ligação; (e) construir pelo menos um mapa cromossô- mico linear; (f) identificar um ou mais rearranjos genômicos no mapa cromossômico linear; e (g) correlacionar um ou mais rearranjos genômicos com uma doença ou um traço.
Sondas
Da maneira aqui usada, a palavra "sonda" refere-se a uma molécula (por exemplo, um oligonucleotídeo, quer de ocorrência natural como em uma digestão de restrição purifi- cada quer produzido sinteticamente, recombinantemente ou por amplificação de PCR), que é capaz de hibridizar em uma outra molécula de interesse (por exemplo, um outro oligonu- cleotídeo). Quando as sondas são oligonucleotídeos, elas podem ser de fita simples ou fita dupla. As sondas são usadas na detecção, identificação e isolamento de alvos particulares (por exemplo, seqüências de gene). Da maneira aqui descrita, contempla-se que as sondas usadas na presente invenção podem ser marcadas com um marcador, de maneira tal que seja detectável em qualquer sistema de detecção, incluindo, mas sem limitação, sistema de enzima (por exemplo, ELISA, bem como ensaios histoquímicos a base de enzima), fluores- cente, radioativo e luminescente.
Com relação a arranjos e microarranjos, a palavra "sonda" é usada para se referir a qualquer material hibridizável que está fixado ao arranjo com o propósito de detectar uma seqüência de nucleotídeos que foi hibridizada na dita sonda. Preferivelmente, estas sondas têm 25- 60 mers ou mais.
Estratégias para desenho de sonda são descritas em W095/11995, EP 717,113 e W097/29212.
Uma vez que 4C permite uma pesquisa genômica não tendenciosa de interações, é vantajoso preparar um arranjo com sondas que interroguem cada sítio de reconhecimento de enzima de restrição primária (por exemplo, exclusivo/não repetitivo) possível no genoma. Assim, o desenho do arranjo depende apenas da escolha de enzima de restrição primária e não das reais seqüências de nucleotídeos primárias ou secundárias.
Embora arranjos existentes possam ser usados de acordo com a presente inven- ção, é preferível usar configurações alternativas.
Em uma configuração, uma ou mais sondas no arranjo são desenhadas de maneira tal que elas possam hibridizar próximo aos sítios que foram digeridos pela enzima de restri- ção primária. Mais preferivelmente, a(s) sonda(s) estão em cerca de 20 bp do sítio de reco- nhecimento de enzima de restrição primária. Mais preferivelmente, a(s) sonda(s) estão em cerca de 50 bp do sítio de reconhecimento de enzima de restrição primária.
Adequadamente, a(s) sonda(s) estão em cerca de 100 bp (por exemplo, cerca de Ο- Ι 00 bp, cerca de 20-100 bp) do sítio de reconhecimento de enzima de restrição primária.
Em uma configuração preferida, uma sonda única exclusiva é desenhada em 100 bp em cada lado dos sítios que são digeridos pela enzima de restrição primária.
Em uma outra configuração preferida, as posições de sítios digeridos pela enzima de restrição secundária com relação às posições de sítios digeridos pelos sítios de restrição primária são levadas em consideração. Nesta configuração, uma sonda única exclusiva é desenhada apenas em cada Jado dos sítios digeridos pela enzima de restrição primária que tem o sítio de reconhecimento de enzima de restrição secundária mais próximo em um dis- tância longa o suficiente de uma sonda de um dado comprimento a ser desenhada entre o sítio de reconhecimento de enzima de restrição primária e secundária. Nesta configuração, por exemplo, nenhuma sonda é desenhada ao lado de um sítio de reconhecimento de enzi- ma de restrição primária particular que tem um sítio de reconhecimento de enzima de restri- ção secundária em 10 bp naquele mesmo lado.
Em uma outra configuração, as sondas no arranjo são desenhadas de maneira tal que elas possam hibridizar em cada um dos lados dos sítios que são digeridos pela enzima de restrição primária. Adequadamente, uma sonda única em cada lado do sítio de reconhe- cimento de enzima de restrição primária pode ser usada.
Ainda em uma outra configuração, duas ou mais sondas (por exemplo, 3, 4, 5, 6, 7 ou 8 ou mais) podem ser desenhadas em cada lado do sítio de reconhecimento de enzima de restrição primária, que pode então ser usado para investigar o mesmo evento de ligação. Para o número e posição de sondas com relação a cada sítio de reconhecimento de enzima de restrição primária, o local genômico exato de seu sítio de reconhecimento de enzima de restrição secundária vizinho pode ser levado em consideração.
Ainda em uma outra configuração, duas ou mais sondas (por exemplo, 3, 4, 5, 6, 7 ou 8 ou mais) podem ser desenhadas próximas a cada sítio de reconhecimento de enzima de restrição primária sem restrição do sítio de reconhecimento de enzima de restrição se- cundária mais próximo. Nesta configuração, todas as sondas estariam próximas aos sítios de reconhecimento de enzima de restrição primária (preferivelmente em 300 bp do sítio de restrição).
Vantajosamente, o último desenho e também o desenho que usa 1 sonda por sítio de reconhecimento de enzima de restrição primária (ao lado de um) permitem o uso de en- zimas de restrição secundárias diferentes em combinação com uma dada enzima de restri- ção primária.
Vantajosamente, o uso de múltiplas (por exemplo, 2, 3, 4, 5, 6, 7 ou 8 ou mais) sondas por sítio de reconhecimento de enzima de restrição primária pode minimizar o pro- blema de obter resultados falso negativos, em virtude do pouco desempenho das sondas individuais. Além disso, elas também podem aumentar a confiabilidade de dados obtidos com um experimento de chipe único e reduzir o número de arranjos exigidos para tirar con- clusões estatisticamente concretas.
As sondas para uso no arranjo podem ter mais que 40 nucleotídeos de comprimen- to e podem ser isotérmicas.
Preferivelmente, as sondas contendo seqüências repetitivas de DNA são excluídas.
Espera-se que o diagnóstico de sondas para os sítios de restrição que flanqueiam diretamente ou estão próximos da primeira seqüência de nucleotídeos forneça sinais de hi- bridização muito fortes e também possa ser excluído do desenho da sonda.
O arranjo pode cobrir qualquer genoma, incluindo genomas de mamífero (por e- xemplo, humano, camundongo (por exemplo, cromossomo 7)), vertebrado (por exemplo, peixe zebra)), ou invertebrado (por exemplo, bacteriano, levedura, fúngico ou de inseto (por exemplo, Drosofila)).
Em uma modalidade adicional preferida, o arranjo contém 2-6 sondas ao redor de cada único sítio de restrição primária e tão próximo quanto possível do sítio de digestão de enzima de restrição.
Preferivelmente, a distância máxima do sítio de digestão de enzima de restrição é
cerca de 300 bp.
Em uma modalidade adicional preferida da presente invenção, são fornecidos ar- ranjos para enzimas de restrição, tais como Hindlll, BamHI, BgHI e Notl, que cobrem os ge- nomas de mamífero ou não mamífero. Vantajosamente, o desenho dos arranjos aqui descri- tos evitam a necessidade de redesenhar arranjos para cada seqüência alvo, a análise forne- cida é realizada na mesma espécie.
Conjuntos de sondas
Da maneira aqui usada, o termo "conjunto de sondas" refere-se a uma suíte ou uma coleção de sondas que hibridizam em cada um dos sítios de reconhecimento de enzima de restrição primária para uma enzima de restrição primária em um genoma.
Dessa maneira, é fornecido em um aspecto adicional, um conjunto de sondas com- plementares em seqüência à seqüência de ácido nucléico adjacente em cada um dos sítios de reconhecimento de enzima de restrição primária para uma enzima de restrição primária no DNA genômico.
Adequadamente, o conjunto de sondas é complementar em seqüência aos primei-
ros 25-60 (por exemplo, 35-60, 45-60, ou 50-60) ou mais nucleotídeos que são adjacentes a cada um dos sítios de reconhecimento de enzima de restrição primária no DNA genômico. O conjunto de sondas pode ser complementar em seqüência a um (por exemplo, qualquer um) lado ou ambos ou lados do sítio de reconhecimento de enzima de restrição primária. Dessa 25 maneira, as sondas podem ser complementares em seqüência à seqüência de ácido nucléi- co adjacente a cada lado de cada um dos sítios de reconhecimento de enzima de restrição primária no DNA genômico.
Também é possível definir uma janela (por exemplo, 300 bp ou menos, tais como 250 bp, 200 bp, 150 bp ou 100 bp, do sítio de reconhecimento de enzima de restrição primá- 30 ria) na qual uma ou mais sondas podem ser desenhadas para o conjunto. Tais fatores que são importantes na definição da janela na qual o desenho das sondas são, por exemplo, conteúdo de GC1 ausência de seqüências palindrômicas que podem formar estruturas tipo alça, tamanho máximo dos trechos de um único tipo de nucleotídeo. Dessa maneira, o con- junto de sondas pode ser complementar em seqüência à seqüência de ácido nucléico que é 35 menos que 300 bp de cada um dos sítios de reconhecimento de enzima de restrição primá- ria no DNA genômico.
Também é possível definir uma janela de cerca de 100 bp do sítio de reconheci- mento de enzima de restrição primária afim de identificar sondas ideais próximas de cada sítio de restrição.
Em modalidades adicionais da presente invenção, o conjunto de sondas é comple- mentar à seqüência que é menos que 300 bp de cada um dos sítios de reconhecimento de
enzima de restrição primária no DNA genômico, complementar à seqüência que está entre 200 e 300 bp de cada um dos sítios de reconhecimento de enzima de restrição primária no DNA genômico e/ou complementar à seqüência que está entre 100 e 200 bp de cada um dos sítios de reconhecimento de enzima de restrição primária no DNA genômico.
Em modalidades adicionais da presente invenção, o conjunto de sondas é comple- 10 mentar à seqüência que está de 0 a 300 bp de cada um dos sítios de reconhecimento de enzima de restrição primária no DNA genômico, complementar à seqüência que está entre 0 a 200 bp de cada um dos sítios de reconhecimento de enzima de restrição primária no DNA genômico e/ou complementar à seqüência que está entre 0 to 100 bp de cada um dos sítios de reconhecimento de enzima de restrição primária no DNA genômico (por exemplo, cerca 15 de 10, 20, 30, 40, 50, 60, 70, 80 ou 90 bp de cada um dos sítios de reconhecimento de en- zima de restrição primária no DNA genômico).
Podem ainda ser desenhadas duas ou mais sondas que são capazes de hibridizar na seqüência adjacente a cada sítio de reconhecimento de enzima de restrição primária no DNA genômico.
As sondas podem sobrepor-se, ou sobrepõem-se parcialmente. Se as sondas so-
brepõem-se, então a sobreposição é preferivelmente menos que 10 nucleotídeos.
Fragmentos de PCR que representam os primeiros 1-300 nucleotídeos (por exem- plo, 1-20, 1-40, 1-60, 1-80, 1- 100, 1-120, 1-140, 1-160, 1-180, 1-200, 1-220, 1-240, 1-260 ou 1-280 nucleotídeos) que flanqueiam cada sítio de reconhecimento de enzima de restrição primária também podem ser usados.
Fragmentos de PCR também podem ser usados como sondas que correspondem exatamente a cada sítio genômico que é flanqueado pelo sítio de reconhecimento de enzima de restrição primária e o primeiro sítio de reconhecimento de enzima de restrição vizinho do segundo. Dessa maneira, a seqüência de sonda pode corresponder a toda a seqüência ou 30 parte dela entre cada um dos sítios de reconhecimento de enzima de restrição primária e cada um dos primeiros sítios de reconhecimento de enzima de restrição secundária vizi- nhos.
Tipicamente, as sondas, arranjo de sondas ou conjunto de sondas serão imobiliza- dos em um suporte. Os suportes (por exemplo, suportes sólidos) podem ser feitos de uma variedade de materiais, tais como vidro, sílica, plástico, náilon ou nitrocelulose. Os suportes são preferivelmente rígidos e têm uma superfície plana. Os suportes têm tipicamente cerca de 1-10.000.000 regiões endereçáveis espacialmente discretas, ou células. Suportes com cerca de 10-1.000.000 ou cerca de 100-100.000 ou cerca de 1.000-100.000 células são co- muns. A densidade de células é tipicamente pelo menos cerca de 1.000, 10.000, 100.000 ou 1.000.000 células em um centímetro quadrado. Em alguns suportes, todas as células são ocupadas por misturas agrupadas de sondas ou um conjunto de sondas. Em outros supor- 5 tes, algumas células são ocupadas por misturas agrupadas de sondas ou um conjunto de sondas, e outras células são ocupadas, pelo menos no grau de pureza obtenível por méto- dos de síntese, por um único tipo de oligonucleotídeo.
Preferivelmente, o arranjo aqui descrito compreende mais que uma sonda por sítio de reconhecimento de enzima de restrição primária que, no caso de uma enzima de restri- ção que corta de 6 bp, ocorre, por exemplo, aproximadamente 750.000 vezes por genoma humano ou de camundongo.
Para uma enzima de restrição que reconhece uma seqüência de reconhecimento >
6 bp, um arranjo único de cerca de 2 x 750.000 sondas pode ser usado para cobrir, por e- xemplo, o genoma humano ou de camundongo completo, com 1 sonda em cada lado de cada sítio de restrição.
Em um desenho do arranjo preferido, o número total de moléculas de sonda de uma dada seqüência de nucleotídeos presente no arranjo está em grande excesso nos fragmentos homólogos presentes na amostra 4C a ser hibridizada em tal arranjo. Dada a natureza da tecnologia 4C, os fragmentos que representam as regiões genômicas próximas 20 à seqüência de nucleotídeos analisada no molde de cromatina linear estará em grande ex- cesso na amostra de hibridização 4C (descrita na figura 2). Para obter informação quantitati- va sobre eficiências de hibridização de tais fragmentos abundantes, pode ser necessário reduzir a quantidade de amostra a ser hibridizada e/ou aumentar o número de moléculas de uma dada sonda de seqüência de oligonucleotídeos no arranjo.
Assim, para a detecção de elementos de DNA regulatórios que colocam frequente-
mente em contato, por exemplo, um elemento promotor de gene, pode ser necessário usar um arranjo com sondas que representam apenas a região genômica selecionada (por e- xemplo, cerca de 0,5-10 Mb), mas com cada sonda exclusiva presente em múltiplas (por exemplo, cerca de 100, 200, 1.000) posições no arranjo. Tais desenhos também podem ser 30 preferidos com propósitos diagnósticos de detectar rearranjos genômicos locais (por exem- plo, em cerca de 10 Mb), tais como deleções, inversões, duplicações, etc., ao redor de um sítio (por exemplo, gene de interesse).
O arranjo pode compreender cerca de 3 x 750.000 sondas, 4 x 750.000 sondas, 5 x 750.000 sondas, ou preferivelmente, 6 x 750.000 sondas. Mais preferivelmente, o arranjo compreende 6 x 750.000 sondas com 2, 3, 4, 5, 6, 7 ou 8 ou mais sondas em cada lado de cada sítio de restrição. Acima de tudo preferivelmente, o arranjo compreende 6 x 750.000 sondas com 3 sondas em cada lado de cada sítio de restrição. Arranjos de sondas ou conjuntos de sondas podem ser sintetizado de uma maneira etapa por etapa em um suporte ou podem ser anexados na forma pré-sintetizada. Um méto- do de síntese é VLSIPS.TM. (descrito em US 5.143.854 e EP 476,014), que implica o uso da Iuz para direcionar a síntese de sondas de oligonucleotídeo em arranjos de alta densidade
miniaturizados. Algoritmos para desenho de máscaras para reduzir o número de ciclos de síntese são descritos em US 5.571.639 e US. 5.593.839. Os arranjos também podem ser sintetizados em uma maneira combinatória liberando monômeros para as células de um suporte por caminhos de fluxo limitados mecanicamente, descritos em EP 624,059. Os ar- ranjos também pode ser sintetizados apontando reagentes em um suporte usando uma im- 10 pressora jato de tinta (ver, por exemplo, EP 728.520).
No contexto da presente invenção, os termos "substancialmente um conjunto de sondas" e "substancialmente o arranjo de sondas" significam que o conjunto ou o arranjo de sondas compreende pelo menos cerca de 50, 60, 70, 80, 90, 95, 96, 97, 98 ou 99% do con- junto ou arranjo total ou completo de sondas. Preferivelmente, o conjunto ou o arranjo de sondas é um conjunto de sondas total ou completo (isto é, 100%).
Em uma modalidade preferida, o arranjo compreende uma sonda exclusiva única por lado de cada sítio de reconhecimento de enzima de restrição primária que está presente em um dado genoma. Se este número de sondas excede o número de sondas que pode estar contido em um arranjo único, o arranjo pode preferivelmente conter ainda uma repre- 20 sentação do genoma completo de uma dada espécie, mas em resolução menor, por exem- plo, com uma de cada 2, 3, 4, 5, 6, 7, 8, 9, 10, 102, 1031 104 etc. sondas da maneira ordena- da no molde do cromossomo linear presente no arranjo. Tais arranjos que cobrem o genoma completo humano, ou outro, em resolução subideal podem ser preferidos com relação a ar- ranjos de alta resolução que cobrem parte do mesmo genoma, por exemplo, em casos onde 25 observa-se parceiros de translocação.
Preferivelmente, a representação do genoma completo de uma dada espécie menor resolução é obtida por sondas no arranjo em que cada qual representa um único fragmento de restrição obtido após a digestão com uma enzima de restrição primária. Preferivelmente, isto é obtido desconsiderando cada segunda, terceira, quarta, quinta, sexta, sétima, oitava, 30 nona, décima, vigésima, trigésima, quadragésima, quinquagésima, sexagésima, septuagé- sima, octogésima, nonagésima, ou uma centésima sonda, etc. (por exemplo, segunda à centésima sonda) que hibridiza no mesmo fragmento de restrição.
Preferivelmente, a representação do genoma completo de uma dada espécie em menor resolução compreende sondas que são distribuídas igualmente ao longo dos moldes lineares do cromossomo. Preferivelmente, isto é obtido desconsiderando uma ou mais son- das nestas regiões genômicas que mostram maior densidade de sonda.
Hibridização A palavra "hibridização" da maneira aqui usada, pode incluir "o processo pelo qual uma fita de ácido nucléico se liga a uma fita complementar através do pareamento de ba- ses", bem como o processo de amplificação da maneira realizada, por exemplo, em tecnolo- gias da reação em cadeia da polimerase (PCR).
Seqüências de nucleotídeos capazes de hibridização seletiva serão em geral pelo menos 75%, preferivelmente pelo menos 85 ou 90% e mais preferivelmente pelo menos 95% ou 98% homólogas à seqüência de nucleotídeos complementar correspondente com relação a uma região de pelo menos 20, preferivelmente pelo menos 25 ou 30, por exemplo, pelo menos 40, 60 ou 100 ou mais nucleotídeos contíguos.
"Hibridização específica" refere-se à ligação, duplexação ou hibridização de uma molécula apenas em um seqüência particular de nucleotídeos em condições rigorosas (por exemplo, 65 0C e 0,1xSSC {1xSSC = NaCI 0,15 M, citrato de Na 0,015 M pH 7,0}). Condi- ções rigorosas são condições em que uma sonda hibridizará em sua seqüência alvo, mas em nenhuma das outras seqüências. Condições rigorosas são dependentes de seqüência e são diferentes em circunstâncias diferentes. Seqüências maiores hibridizam especificamente em temperaturas maiores. Em geral, condições rigorosas são selecionadas entre cerca de 5 0C abaixo do ponto de fusão (Tm) para a seqüência específica em uma concentração iônica e pH definidos. O Tm é a temperatura (em concentração iônica, pH, e concentração de áci- do nucléico definidos) na qual 50% das sondas complementares a uma seqüência alvo hi- bridizam na seqüência alvo em equilíbrio. (Uma vez que as seqüências alvos estão em geral presentes em excesso, em Tm, 50% das sondas são ocupadas em equilíbrio). Tipicamente, condições rigorosas incluem uma concentração de sal de pelo menos cerca de concentra- ção iônica de Na 0,01 a 1,0 M (ou outros sais) em pH 7,0 a 8,3 e a temperatura é pelo me- nos cerca de 30 0C para sondas curtas. Condições rigorosas também podem ser atingidas com a adição de agentes desestabilizantes, tais como formamida ou sais de amônio de te- tra-alquila.
Da maneira a ser entendida pelos versados na técnica, uma hibridização de rigor máxima pode ser usada para identificar ou detectar seqüências de nucleotídeos idênticas enquanto uma hibridização de rigor intermediário (ou baixa) pode ser usada para identificar ou detectar seqüências de polinucleotídeos similares ou relacionados.
Também são descritos métodos para a hibridização de arranjos de sondas em se- qüências de nucleotídeos marcadas ou não marcadas. As condições de reação de hibridiza- ção particulares podem ser controladas para alterar hibridização (por exemplo, aumento ou diminuição do rigor de ligação de sonda/alvo). Por exemplo, temperatura da reação, concen- trações de ânions e cátions, adição de detergentes e similares, podem todos alterar as ca- racterísticas de hibridização de sondas de arranjo e moléculas alvos.
Frequência de interação A quantificação de frequências de ligação de fragmentos de restrição fornece uma medida de suas frequências de reticulação. Adequadamente, isto pode ser atingido usando PCR da maneira usada na tecnologia 3C convencional descrita por Splinter et al. (2004) (supra). Resumidamente, a formação de produtos de PCR pode ser medida varrendo as intensidades de sinal após a separação em géis de agarose corados com brometo de etídio, usando um imageador Typhoon 9200 (Molecular Dynamics, Sunnyvale, CA). Adequadamen- te, diversos controles são usados para a interpretação correta de dados também descritos em Splinter et al. (2004) (supra).
Uma vez que, a tecnologia 4C aqui descrita proporciona a análise de alto desem- penho da frequência de interação de duas ou mais seqüências de nucleotídeos no espaço nuclear, é preferível que as frequências de ligação de fragmentos de restrição sejam quanti- ficadas usando os arranjos aqui descritos.
Para quantificação, sinais obtidos de uma amostra 4C podem ser normalizados em sinais obtidos para uma amostra controle. A(s) amostra(s) 4C e amostra(s) controle(s) serão marcadas com marcadores diferentes e discerníveis (por exemplo, corantes) e serão simul- taneamente hibridizadas no arranjo. A(s) amostra(s) controle(s) conterão tipicamente todos os fragmentos de DNA (isto é, todas as segundas seqüências de nucleotídeos potenciais que foram ligadas na primeira seqüência de nucleotídeos (alvo)) em quantidades equimola- res e, para excluir uma tendência na eficiência da hibridização, elas devem ser similares em tamanho à(s) segunda(s) sequência(s) de nucleotídeos(s). Assim, o molde controle conterá tipicamente DNA genômico (do mesmo fundo genético, uma vez que é usado para obter o molde 4C), digerido tanto com a enzima de restrição primária quanto a secundária e marca- do pelo mesmo método (por exemplo, iniciação aleatória) como o molde 4C. Tal molde con- trole toma possível corrigir as diferenças sonda a sonda na eficiência da hibridização. A normalização de sinais de arranjo 4C para controlar sinais de arranjo torna possível expres- sar resultados em termos de enriquecimento com relação a eventos aleatórios.
O molde marcado 4C pode ainda ser hibridizada em um arranjo com ou sem uma amostra controle diferencialmente marcada e com ou sem uma ou mais outros moldes 4C diferencialmente marcados. Outros moldes 4C podem não estar relacionados a este molde 4C, por exemplo, eles podem ser obtidos de tecido diferente e/ou obtidos com um conjunto diferente de iniciadores de PCR inversa. Por exemplo, o primeiro molde 4C pode ser materi- al de paciente e o segundo molde 4C pode ser obtido de um sujeito saudável ou de uma amostra controle.
Dados os padrões de hibridização notáveis que são esperados para rearranjos ge- néticos, nem sempre será necessário comparar sujeitos doentes com sujeitos saudáveis. Dessa maneira, múltiplos moldes 4C (por exemplo, dois ou mais), cada qual interrogando um Iocus diferente do mesmo paciente ou sujeito, podem ser hibridizados em um arranjo (por exemplo, um ou mais).
Os moldes 4C podem ser diferencialmente marcados (por exemplo, com hibridiza- ção de duas ou multicores) e/ou podem ser identicamente marcados no caso em que tais Ioci residem normalmente em cromossomos diferentes ou no mesmo cromossomo em uma 5 distância longe o suficiente para sobreposição mínima entre sinais de interação DNA-DNA. Como um exemplo, material de um sujeito com leucemia de célula T pode ser processado para obter moldes 4C para TCRa/ ó (marcado em uma cor, a fim de detectar translocações), e MLL, TALI, HOXII e LM02 (cada qual marcado na mesma segunda cor, a fim de detectar outros rearranjos genéticos). Estes cinco moldes 4C podem ser hibridizados em um arranjo, 10 que permitirá a análise simultânea em múltiplos Ioci para um rearranjo genômico associado à doença.
Para a quantificação de frequências de interação, intensidades de sinal absolutas ou razões com relação à amostra controle também podem ser considerados. Além do mais, sinais de sondas adjacentes no molde do cromossomo linear podem ser usados para identi- 15 ficar regiões cromossômicas interagentes. Tal informação posicionai é analisada preferivel- mente ordenando as sondas no molde do cromossomo linear e analisando as intensidades de sinal absolutas ou razões com relação a sinais de molde controle, por abordagens de janela corrediça, usando, por exemplo, média corrida ou abordagens de média corrida.
A frequência de interação de uma ou mais seqüência de nucleotídeos alvo com 20 uma ou mais seqüências de nucleotídeos de interesse (por exemplo, um ou mais Ioci genô- micos) obtida de acordo com os métodos aqui descritos, pode ser usada para reconstruir partes, ou na íntegra, mapas cromossômicos lineares e identificar rearranjos genômicos equilibrados e desequilibrados que ocorreram nos cromossomos e entre os mesmos, em que tais rearranjos são indicativos de um traço ou doença.
Método de ensaio
Em um aspecto adicional da presente invenção, é fornecido um método de ensaio para identificar um ou mais agentes que modulam uma interação DNA-DNA.
Da maneira aqui usada, a palavra "modular" refere-se a prevenir, diminuir, suprimir, restaurar, elevar, aumentar ou de outra forma afetar a interação DNA-DNA.
Em alguns casos, pode ser desejável avaliar dois ou mais agentes juntos para uso
na modulação da interação DNA-DNA. Nestes casos, os ensaios podem ser facilmente mo- dificados adicionando tal agente(s) adicional(s) tanto simultaneamente quanto subsequen- temente ao primeiro agente.
O método da presente invenção também pode ser uma triagem, por meio da qual inúmeros agentes são testados para modular a atividade da interação DNA-DNA.
Espera-se que os métodos de ensaio da presente invenção sejam adequados tanto para triagem em pequena escala quanto em grande escala de agentes, bem como em en- saios quantitativos.
Usos médicos de tais agentes terapêuticos estão no escopo da presente invenção bem como os próprios programas de desenvolvimento de medicamento e composições far- macêuticas compreendendo tais agentes. Um programa de desenvolvimento de medica- 5 mento, por exemplo, pode envolver preparar um agente identificado ou identificável pelos métodos aqui descritos, modificando-o opcionalmente (por exemplo, modificando sua estru- tura e/ou fornecendo uma composição inédita compreendendo a dita fração) e realizando estudos adicionais (por exemplo, estudos de toxicidade e /ou estudos na atividade, estrutura ou função). Experiências podem ser realizadas em animais não humanos e podem eventu- 10 almente ser realizadas em humanos. Tais experiências incluirão em geral determinar o(s) efeito(s) de níveis de dosagem diferentes. Os programas de desenvolvimento de medica- mento podem utilizar computadores para analisar frações identificadas trinado (por exemplo, para prognosticar estrutura e/ou função, para identificar possíveis agonistas ou antagonis- tas, para pesquisar frações que podem ter estruturas ou funções similares, etc.).
TESTE DE DIAGNÓSTICO
Atualmente, vários rearranjos genômicos permanecem difíceis de detectar pelas técnicas molecular-citogênicas disponíveis. Embora a técnica de hibridização genômica comparativa de arranjo (arranjo-CGH) seja uma técnica recém desenvolvida para a detec- ção de amplificação cromossômica e/ou deleções com uma resolução de 35 a 300 Kb, esta 20 técnica não é adequada para detectar translocações equilibradas e inversões cromossômi- cas. Por outro lado, cariotipagem espectral (SKY) ou cariotipagem convencional é frequen- temente realizada no material do paciente para a detecção de translocações cromossômicas bem como mudanças numéricas, mas a resolução para definir translocação dos pontos de quebra é baixa, normalmente 10a50Mbe5a 10 Mb, respectivamente. Consequentemen- 25 te, resultados obtidos por ambos métodos e especialmente SKY levarão a experimentos de validações demorados e de muita mão de obra do tipo hibridização in situ de fluorescência (FISH) e estratégias de clonagem de ponto de quebra molecular.
Tecnologia 4C envolve um procedimento que pode detectar quaisquer rearranjos cromossômicos com base nas frequências de interação mudadas entre as seqüências de 30 DNA fisicamente ligadas. Tecnologia 4C é portanto usada para a identificação de (recorren- te) rearranjos cromossômicos para a maioria de malignidade/má formações congênitas múl- tiplas humanas ou retardamento mental. Uma vantagem importante de tecnologia 4C é que ela permite o mapeamento muito preciso do ponto de quebra de uma região de apenas di- versos milhares de pares de base. Uma outra vantagem de tecnologia 4C é que não é exigi- 35 do nenhum conhecimento anterior na posição exata do ponto de quebra, uma vez que os pontos de quebra serão detectáveis mesmo quando a seqüência 4C-isca for localizada 1 a 5 Mb distante do ponto de quebra. Isto tem também a vantagem de que a mesma seqüência isca pode ser usada para a detecção de rearranjos cromossômicos específicos cobrindo áreas de ponto de quebra grandes. O mapeamento preciso de rearranjos genômicos pela tecnologia 4C facilitarão enormemente a identificação de doenças de base de gene(s) ex- presso(s) aberrantemente ou distúrbios genéticos, que contribuirão de forma muito importan- 5 te para um melhor entendimento das correlações genótipo-fenótipo, ajudarão na tomada de decisão do tratamento e adicionarão importante informação de prognóstico.
Em uma modalidade da presente invenção, a fim de fornecer uma base para o di- agnóstico ou prognóstico de doença, são estabelecidos valores normais ou padrões de um sujeito. Isto pode ser realizado testando amostras tiradas de sujeitos normais - tais como 10 animais ou humanos. A frequência da interação DNA-DNA pode ser quantificada comparan- do-a com uma série de diluição de controles positivos. Então, valores padrões obtidos de amostras normais podem ser comparados com valores obtidos de amostras de sujeitos afe- tados ou potencialmente afetados por uma doença ou um distúrbio. Desvio entre valores padrões e do sujeito estabelece a presença da condição da doença.
Tais ensaios de diagnóstico podem ser talhados para avaliar a eficácia de um regi-
me de tratamento terapêutico particular e podem ser usados em estudos de animal, em ex- periências clínicas, ou no monitoramento do tratamento de um paciente individual. A fim de fornecer uma base para o diagnóstico de doença, um perfil normal ou padrão para a intera- ção DNA-DNA pode ser estabelecido. Os valores padrões obtidos de amostras normais po- 20 dem ser comparados com os valores obtidos de amostras de sujeitos potencialmente afeta- dos por um distúrbio ou doença. O desvio entre valores padrões e o sujeito estabelece a presença da condição da doença. Se a doença for estabelecida, um agente terapêutico exis- tente pode ser administrado, e perfil ou valores do tratamento podem ser gerados. Finalmen- te, o método pode ser repetido em uma base regular para avaliar se os valores progridem a 25 favor ou contra para o modelo normal ou padrão. Perfis de tratamento sucessivo podem ser usados para mostrar a eficácia de tratamento durante um período de diversos dias ou diver- sos meses.
Tecnologia 4C detecta precisamente pelo menos 5 Mb de DNA genômico ligado em cis com a seqüência de nucleotídeos que é analisada (ver Figura 2-3 e 5). Vantajosamente, 30 a tecnologia 4C pode ser usada para detectar qualquer aberração genômica que é acompa- nhada por uma mudança na separação do sítio genômico entre seqüências rearranjadas e uma seqüência 4C (isca) de escolha. Tal mudança pode ser, por exemplo, um aumento ou diminuição na separação do sítio genômico ou pode ser uma subrepresentação (como em deleções) ou sobrerepresentação (como em duplicações) de seqüências proximais (por e- 35 xemplo, até ou maior que 15 Mb) na seqüência 4C (isca). Tipicamente, tais aberrações ou rearranjos genômicos são uma causa ou são associadas com doenças - tais como câncer (por exemplo, leucemia) e outras doenças genéricas ou congênitas da maneira aqui descri- ta.
Aberrações genéticas (por exemplo, aberrações genômicas ou cromossômicas - tais como aberrações genômicas ou cromossômicas equilibradas e/ou ou não equilibradas) incluem, mas sem limitações, rearranjos, translocações, inversões, inserções, deleções e 5 outras mutações de ácido nucléico (por exemplo, cromossomos) e também perdas ou ga- nhos de parte ou todos os cromossomos. Eles são uma causa que leva a distúrbios genéti- cos ou doenças, incluindo distúrbios congênitos e doenças adquiridas - tais como maligni- dades. Em quaisquer rearranjos, dois cromossomos diferentes são envolvidos. Desta manei- ra, genes (ou fragmentos de genes) são removidos do contexto fisiológico normal de um 10 cromossomo particular e são localizados em um cromossomo do recipiente, adjacente a genes não relacionados ou fragmentos de genes (frequentemente oncogenes ou proto- oncogenes).
Malignidades podem incluir Ieucemias agudas, Iinfomas malignos e tumores sóli- dos. Exemplos não Iimitantes de alterações são t(14;18) que ocorre frequentemente em NHL; t(12;21) que é frequentemente encontrado em precursor-B-ALL infantil; e a presença de Ilq23 (MLL (leucemia mielóide-linfóide ou leucemia de linhagem misturada) gene) aberra- ções em Ieucemias agudas.
O gene MLL na região do cromossomo Ilq23 é envolvido em diversas translocações tanto em ALL quanto em Ieucemias mielóides agudas (AML). Até hoje, pelo menos dez ge- 20 nes parceiros foram identificados. Algumas dessas translocações, - tais como t(4; 11) (q21;q23), t(11; 19) (q23;p13) e t( 1; 11) (p32;q23), ocorrem predominantemente em ALL, on- de como outros, do tipo t(1;11) (q21;q23), t(2; 11) (p21;q23), t(6;11) (q27;q23) e t(9; 11) (p22;q23) são mais frequentemente observados em AML. Rearranjos que envolvem a região Ilq23 ocorrem muito frequentemente em Ieucemias agudas infantis (em torno de 60 a 70 %), 25 e com uma extensão muito menor em Ieucemias infantis e de adultos (cada qual em torno de 5 %).
Rearranjos em malignidades linfóides envolvem frequentemente genes Ig ou TCR. Exemplos incluem os três tipos de translocações (t(8;14), t(2;8), e t(8;22)) que são encontra- dos em Iinfomas de Burkitt, em que o gene MYC é acoplado em segmentos de gene Ig de 30 cadeia pesada Ig (IGH), kappa Ig (IGK)1 ou Iambda Ig (IGL), respectivamente. Um outro tipo comum de translocação nesta categoria é t(14; 18) (q32;q21) que são observados em cerca de 90 % de Iinfomas foliculares, um dos principais tipos de NHL. Nesta translocação, o gene BCL2 é rearranjado nas regiões no Iocus IGH dentro ou adjacente aos segmentos do gene JH. O resultado desta aberração do cromossomo é o sobre-espressão da proteína BCL2, 35 que exerce um papel como um fator de sobrevivência no controle de crescimento inibindo a morte celular programada.
O gene BCL2 consiste em três exons, mas estes são espalhados em uma grande área. Desses, o último exon codifica uma grande região 3' não traduzida (31 UTR). Este UTR 3' é uma das duas regiões nas quais muitos pontos de quebra t(14;18) são agrupados e é chamado a "região de ponto de quebra principal"; a outra região de ponto de quebra envol- vida em translocações t(14; 18), é localizada 20 a 30 kb à jusante do Iocus BCL2 e é chama- 5 da a "região de agrupamento secundário". Uma terceira área de ponto de quebra de BCL2, o VCR (região de agrupamento variante), é localizada no lado 5’ do Iocus BCL2 e está entre outros envolvidos em translocações variantes, isto é, t(2; 18) e t(18;22), na qual os segmen- tos IGK e IGL do gene são os genes parceiros.
Assim, a título de exemplo, a tecnologia 4C pode ser aplicada para a triagem de material do paciente para aberrações genéticas próximas ou em Ioci que foram escolhidos com base na sua freqüente associação com um dado fenótipo clínico. Exemplos não Iimitan- tes adicionais de tal Ioci são AML1, MLL, MYC, BCL, BCR, ABL1, imunoglobulina loci, LYL1, TAL1, TAL2, LM02, TCRctM, TCR/?, HOX e outro Ioci em várias Ieucemias linfoblásticas.
Vantajosamente, se suspeita-se de uma aberração genética, a tecnologia 4C pode ser aplicada como a primeira e única triagem para verificar e mapear a presença da aberra- ção da maneira aqui explicada.
Detecção de rearranjos genômicos
Em uma modalidade particularmente preferida da presente invenção, os métodos aqui descritos podem ser usados para a detecção de rearranjos genômicos.
Atualmente, rearranjos genômicos - tais como pontos de quebra de translocação -
são muito difíceis para detectar. Por exemplo, hibridização genômica comparativa (CGH) micro- arranjos pode detectar diversos tipos de rearranjos mas falta detectar translocações. Se a translocação é suspeita em um paciente mas cromossomos parceiros são desconheci- dos, cariotipagem espectral (SKY) pode ser realizada para encontrar parceiros de transloca- 25 ção e obter uma estimativa aproximada de localização de ponto de quebra. Entretanto, a resolução é muito fraca (normalmente não superior a ~ 50 Mb) e mapeamento fino adicional (que tanto é demorado quanto caro) é normalmente exigido. Isto é normalmente feito usan- do Hibridização in situ de fluorescência (FISH), que novamente fornece resolução limitada. Usando FISH, pontos de quebra podem ser localizados na região +/-50 kb em resolução 30 máxima.
Frequências de interação de DNA-DNA são basicamente uma função da separação do sítio genômico, isto é, frequências de interação de DNA-DNA são inversamente propor- cionais à distância linear (em kilobases) entre dois Ioci de DNA presentes no mesmo molde de DNA físico (Dekker et al., 2002). Assim, uma translocação, que cria um ou mais moldes 35 de DNA físico inéditos, é acompanhada por interações DNA-DNA alteradas próximas aos pontos de quebra, e isto pode ser medido pela tecnologia 4C. Doenças com base em trans- locações são tipicamente causadas por interações DNA-DNA aberrantes, as translocação é o resultado da ligação física (interação) de braços do cromossomo quebrados (DNA).
Consequentemente, para a detecção de translocações, a tecnologia 4C pode ser usada para identificar aquelas interações DNA-DNA que são diferentes entre os sujeitos doentes e não doentes.
A título de exemplo, a tecnologia 4C pode ser aplicada para a triagem de material
do paciente para Ioci próximo a translocações que foram escolhidos com base em sua fre- qüente associação com um dado fenótipo clínico da maneira aqui descrita.
Se houver suspeita de translocação em um paciente, mas os cromossomos parcei- ros forem desconhecidos, um mapeamento inicial pode ser realizado usando métodos atu- 10 almente disponíveis similares a cariotipagem espectral (SKY). Isto pode identificar os parcei- ros de translocação e fornecer uma estimativa muito grosseira de localização de ponto de quebra (normalmente resolução não superior a ~ 50 Mb). Tecnologia 4C pode então ser aplicada, usando seqüências ‘isca’ nesta região localizada por exemplo, em cada 2 Mb, 5 Mb, 10 Mb, 20 Mb (ou outros intervalos da maneira aqui descrita) para mapear bem o ponto 15 de quebra e identificar, por exemplo, o(s) gene(s) que deixam de ser expressos em decor- rência da translocação.
Tipicamente, uma translocação será identificada por meio de uma transição abrupta de frequências baixas para altas de interação em um cromossomo sem ser aquela contendo a seqüência 4C-isca, ou em outro lugar naquele mesmo cromossomo.
Em uma modalidade preferida, a amostra do sujeito é em um estado pré-maligno.
Em uma modalidade preferida, a amostra do sujeito consiste em amniócitos cultiva- dos ou não cultivados obtidos por aminocentese para diagnóstico pré-natal.
Em um desenho de arranjo preferido, sondas apresentadas em um arranjo simples representam o genoma completo de uma dada espécie em resolução máxima. Assim, arran- jos para detectar translocações e similares por tecnologia 4C, contêm sondas da maneira aqui descrita complementares para cada lado de cada sítio de reconhecimento de enzima de restrição primário no genoma de uma dada espécie (por exemplo, humano).
Em um outro projeto preferido, sondas apresentadas em um arranjo simples repre- sentam o genoma completo de uma dada espécie, mas não em resolução máxima. Assim, 30 arranjos para detectar translocações e similares pela tecnologia 4C contêm sondas da ma- neira aqui descrita que são complementares apenas para um lado de cada sítio de reconhe- cimento de enzima de restrição primário no genoma de uma dada espécie (por exemplo, humano).
Em um outro projeto preferido, sondas apresentadas em um arranjo simples repre- sentam o genoma completo de uma dada espécie, mas não em resolução máxima. Assim, arranjos para detectar translocações, deleções, inversões, duplicações e outros rearranjos genômicos pela tecnologia 4C contêm sondas da maneira aqui descrita que são comple- mentares para um lado de cada outro sítio de reconhecimento de enzima de restrição primá- rio da maneira ordenada ao longo do molde linear do genoma de uma dada espécie (por exemplo, humano).
Assim, arranjos para detectar translocações, deleções, inversões, duplicações e ou- tros rearranjos genômicos pela tecnologia 4C contêm sondas da maneira aqui descrita, que cada qual representa um fragmento de restrição simples da maneira obtida após digestão com uma enzima de restrição primária. Preferivelmente, isto é obtido ignorando cada se- gunda, terceira, quarta, quinta, sexta, sétima, oitava, nona, décima, vigésima, trigésima, quadragésima, quinquagésima, sexagésima, septuagésima, octagésima, nonagésima, ou centésima, etc. sonda que hibridiza no mesmo fragmento de restrição. Arranjos para detec- tar translocações, deleções, inversões, duplicações e outros rearranjos genômicos pela tec- nologia 4C podem conter sondas da maneira aqui descrita que são distribuídas igualmente ao longo dos moldes do cromossomo linear. Preferivelmente, isto é obtido ignorando uma ou mais sondas nestas regiões genômicas que apresenta densidade de sonda mais alta.
Em um outro projeto preferido, sondas apresentadas em um arranjo simples repre- sentam o genoma completo de uma dada espécie, mas não em resolução máxima. Assim, arranjos para detectar translocações, deleções, inversões, duplicações e outros rearranjos genômicos pela tecnologia 4C, contêm sondas da maneira aqui descrita complementares para um lado de cada terceiro, quarto, quinto, sexto, sétimo, oitavo, nono, décimo, vigésimo, trigésimo, quadragésimo, quinquagésimo, sexagésimo, septuagésimo, octagésimo, nonagé- simo, ou centésimo, etc. sítio de reconhecimento de enzima de restrição primário da manei- ra ordenada ao longo do molde linear do genoma de uma dada espécie (por exemplo, hu- mano). Arranjos para detectar translocações, deleções, inversões, duplicações e outros re- arranjos genômicos pela tecnologia 4C podem conter sondas da maneira aqui descrita, que representam o genoma completo, mas com uma sonda simples a cada 100 kilobases. Arran- jos para detectar translocações, deleções, inversões, duplicações e outros rearranjos genô- micos pela tecnologia 4C podem conter sondas da maneira aqui descrita que representam cada sítio de reconhecimento de enzima de restrição primário simples no genoma que pode ser representado por uma seqüência de sonda exclusiva.
Em um outro desenho de arranjo preferido, sabe-se que sondas da maneira aqui descrita em um arranjo simples representam regiões genômicas de um dado tamanho - tais como cerca de 50 kb, 100 kb, 200 kb, 300 kb, 400 kb, 500 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb ou 10 Mb - (por exemplo, cerca de 50 kb-10 Mb) em torno de todo Ioci estão envolvidas em translocações, deleções, inversões, duplicações e outros rear- ranjos genômicos.
Em um outro desenho de arranjo preferido, sabe-se que sondas da maneira aqui descrita em um arranjo simples representam regiões genômicas de um dado tamanho - tais como cerca de 50 kb, 100 kb, 200 kb, 300 kb, 400 kb, 500 kb, 1 Mb, 2 Mb5 3 Mb, 4 Mb, 5 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb ou 10 Mb - (por exemplo, cerca de 50 kb-10 Mb) em torno de uma triagem de Ioci estão envolvidas em translocações, deleções, inversões, duplicações e outros rearranjos genômicos. Seleções podem ser feitas em critério educado, por exemplo, elas podem representar apenas os Ioci que são implicados em um dado tipo de doença.
Em um outro desenho de arranjo preferido, sondas da maneira aqui descrita em um arranjo simples representam uma região genômica de interesse de, por exemplo, 100 kb, 200 kb, 300 kb, 400 kb, 500 kb, 600 kb, 700 kb, 800 kb, 900 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb, 10 Mb, 20 Mb, 30 Mb, 40 Mb, 50 Mb, 60 Mb, 70 Mb, 80 Mb, 90 10 Mb, ou 100 Mb (por exemplo, 100 kb- 10 Mb) (parte de) um cromossomo ou múltiplos cro- mossomos, com cada sonda senda representada múltiplas vezes (por exemplo, 10, 100, 1000) para permitir medições quantitativas de intensidades de sinal de hibridização em cada seqüência de sonda.
Em um projeto experimental preferido, ao seqüência 4C (isca) é cerca de 0 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 100 kb, 200 kb, 300 kb, 400 kb, 500 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb1 5 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb 10 Mb, HMb1 12Mb, 13Mb, 14Mb ou 15 Mb (por exemplo, cerca de 0 a 15 Mb) ou mais da seqüência rearranjada real (isto é, ponto de quebra no caso de uma translocação).
Em uma hibridização preferida, dois moldes 4C marcados diferencialmente, obtidos com uma seqüência (4C isca) de um sujeito doente e não doente são hibridizados simulta- neamente no mesmo arranjo. Diferenças nas interações DNA-DNA permitem a detecção do ponto de quebra em eis (no mesmo cromossomo como o 4C-isca) e em trans (no parceiro de translocação).
Em uma hibridização preferida, múltiplos moldes 4C marcados diferencialmente, obtidos com uma seqüência (4C isca) de sujeitos doentes e não doentes são hibridizados simultaneamente no mesmo arranjo. Diferenças nas interações DNA-DNA permite a detec- ção do ponto de quebra em eis (no mesmo cromossomo como o 4C-isca) e em trans (no parceiro de translocação).
Vantajosamente, análise de múltiplas cores, em vez de cores duplas em micro- arranjos pode ser utilizada permitindo a hibridização simultânea de mais que duas amostras em um arranjo simples. Consequentemente, hibridização de múltiplas cores pode ser usada na tecnologia 4C.
Em uma hibridização preferida, múltiplos moldes 4C marcados diferencialmente, obtidos com uma seqüência (4C isca) de sujeitos doentes e um molde 4C marcado diferen- cialmente e um sujeito não doente são hibridizados simultaneamente no mesmo arranjo. Diferenças nas interações DNA-DNA permitem a detecção do ponto de quebra em cis (no mesmo cromossomo como o 4C-isca) e em trans (no parceiro de translocação). Em uma outra hibridização preferida, dois moldes 4C marcados diferencialmente do mesmo sujeito não doente, obtidos com duas diferentes seqüências (4C-iscas) que cada qual representa um outro parceiro de translocação possível, são hibridizados simultanea- mente no mesmo arranjo. Agrupamentos de sinais de hibridização fortes observados no molde linear de cromossomos não relacionados com o cromossomo carregam a seqüência de interesse (4C-isca) identificarão o cromossomo parceiro de translocação e o ponto de quebra no parceiro de translocação.
Em uma outra hibridização preferida, múltiplos moldes 4C marcados diferencial- mente do mesmo sujeito não doente, obtidos com múltiplas seqüências diferentes (4C-iscas) que cada qual representa um outro parceiro de translocação possível, são hibridizados si- multaneamente no mesmo arranjo. Agrupamentos de sinais de hibridização fortes observa- dos no molde linear de cromossomos não relacionados com o cromossomo carregam a se- qüência de interesse (4C-isca) identificarão o cromossomo parceiro de translocação e seu ponto de quebra para a seqüência de interesse.
Material usado para a detecção de translocações, deleções, inversões, duplicações e outros rearranjos genômicos pela tecnologia 4C pode ser obtido por reticulação (e proces- samento adicional, da maneira descrita) de células vivas e/ou células mortas e/ou Iisatos nucleares e/ou cromatina isolada etc. (da maneira aqui descrita) de sujeitos doentes e/ou não doentes.
Detecção de inversões
Inversões (por exemplo, inversões equilibradas) não podem ser detectadas por mé- todos - tais como Técnicas de hibridização genômica comparativas - mas pode ser detecta- das pela tecnologia 4C particularmente quando a inversão (equilibrada) é próxima (por e- xemplo, até cerca de 1 a 15 Mb ou mais) da seqüência 4C (isca).
Detecção de inversões (equilibradas) é baseada na identificação daquelas intera- ções DNA-DNA que foram diferentes entre o sujeito doente e o não doentes. Inversões mu- darão a posição relativa (em kilobases) no molde de DNA físico de todas as seqüências (mas a maioria centralmente localizada) da região rearranjada medido contra uma seqüên- cia próxima do mesmo cromossomo que é considerada a seqüência 4C (isca). Uma vez que frequências de interação de DNA-DNA são inversamente relacionadas à separação do sítio genômico, sujeitos doentes darão padrões invertidos de intensidades de hibridização para todas as sondas localizadas na região genômica rearranjada, comparado com um sujeito não doente. Assim, a tecnologia 4C permite a identificação de posição e tamanho de inver- sões (equilibradas).
De acordo com este aspecto da presente invenção, um desenho de arranjo consa- grado preferido compreende sondas em um arranjo simples representando regiões genômi- cas de um dado tamanho - tais como cerca de 50 kb, 100 kb, 200 kb, 300 kb, 400 kb, 500 kb, 1 Mb1 2 Mb, 3 Mb, 4 Mb1 5 Mb, 6 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb ou 10 Mb) (por exemplo, 50 kb-10 Mb) em torno do Iocus no qual suspeita-se da inversão ou outro rearranjo.
Em um outro desenho de arranjo consagrado preferido, sondas em um arranjo sim- ples representam regiões genômicas de um dado tamanho (50 kb, 100 kb, 200 kb, 300 kb, 5 400 kb, 500 kb, 1 Mb, 2 Mb, etc.) em torno do Iocus no qual suspeita-se da inversão ou outro rearranjo. Para análise quantitativa de confiança de intensidades de sinal, a quantidade de sonda presente no arranjo é tipicamente em grande excesso para a quantidade de cognatos de fragmentos que são hibridizados no arranjo. Portanto, pode ser necessário ter cada son- da presente múltiplas vezes (por exemplo, 10, 20, 50, 100, 1000 vezes, etc.) no arranjo. A- 10 lém do mais, pode ser necessário titular a quantidade de molde que deve ser hibridizada no arranjo.
Detecção de deleções
Detecção de deleções é baseada em identificar aquelas interações DNA-DNA que foram diferentes entre os sujeitos doentes e não doentes. Deleções resultarão na ausência 15 de interações de DNA com uma seqüência 4C (isca) localizada próximo a região deletada (por exemplo, cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ou 15 Mb ou mais). Isto po- de resultar na ausência completa de sinais de hibridização para todas as sondas localizada na região rearranjada se a deleção for presente em ambos alelos (homozigoto), ou uma re- dução para sujeitos doentes versus não doentes de intensidades de sinal se a deleção for 20 presente em apenas um alelo (heterozigoto). Deleção resulta em mais seqüências distais na proximidade imediata no molde de DNA físico para a seqüência 4C (isca) analisada, que resultará em sinais de hibridização mais fortes para sondas localizadas diretamente além da região deletada.
Detecção de duplicação(s)
Detecção de duplicação é tipicamente baseada em identificar aquelas interações
DNA-DNA que são diferentes entre sujeitos doentes e não doentes. As sondas na região duplicada mostrarão maiores sinais de hibridização com uma seqüência 4C (isca) localizada próximo à região rearranjada (por exemplo, cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,
14 ou 15 Mb ou mais), comparado com os sinais de um sujeito não doente de controle. Son- das além da região duplicada são adicionalmente distantes da seqüência 4C e consequen- temente, apresentarão maiores sinais de hibridização comparados com os sinais de um su- jeito não doente de controle.
Preferivelmente, um aumento ou uma diminuição na frequência de interação DNA- DNA para a amostra do sujeito comparado com o controle é indicativo de uma duplicação ou inserção.
Preferivelmente, um aumento na frequência de interação DNA-DNA para a amostra do sujeito comparado com o controle e/ou uma redução na frequência de interação DNA- DNA para regiões mais distantes é indicativo de uma duplicação ou inserção.
Diagnóstico Pré-natal
Vantajosamente, a tecnologia 4C pode também ser usada em diagnóstico pré-
natal.
Ácido nucléico pode ser obtido de um feto usando vários métodos que são conheci-
dos na tecnologia. A título de exemplo, amniocentese pode ser usado para obter fluido am- niótico do qual células fetais em suspensão são extraídas e cultivadas por diversos dias (Mercier & Bresson (1995) Ann. Gnt., 38, 151-157). Ácido nucléico das células pode ser en- tão extraído. A coleta de chorial villi pode tornar possível dispensar a etapa de cultura e evi- 10 tar a coleta de fluido amniótico. Estas técnicas podem ser aplicadas anteriormente (até 7 semanas de gestação para a coleta de chorial villi e 13 a 14 semanas para amniocentese), mas com um risco ligeiramente maior de aborto.
Uma coleta direta de sangue fetal no nível do cordão umbilical pode também ser usada para obter ácido nucléico, mas exige tipicamente uma equipe de clínicos especializa- dos nesta técnica (Dormer et aí. (1996) Fetal Diagn. Ther., 10, 192-199).
Vantajosamente, as aberrações genéticas (por exemplo, aberrações genômicas ou cromossômicas) - tais como rearranjos, translocações, inversões, inserções, deleções e ou- tras mutações em cromossomos e ácido nucléico - podem ser detectadas neste estágio.
Preferivelmente, as aberrações genéticas (por exemplo, aberrações genômicas ou cromossômicas) - tais como rearranjos, translocações, inversões, inserções, deleções e ou- tras mutações em cromossomos 21, 18, 13, X ou Y e também perdas ou ganhos de parte ou todos cromossomos 21, 18, 13, X ou Y podem ser detectadas uma vez que estes são os cromossomos nos quais a maioria de aberrações ocorrem no feto.
Determinação de sítios de integração genômica A tecnologia 4C também permite a determinação de sítios de integração genômica
de vírus e transgenes, etc., também quando múltiplas cópias são inseridas em diferentes posições no genoma (da maneira descrita na Figura 3).
Predisposição determinante de adquirir certas translocações
Vantajosamente, a tecnologia 4C pode também ser aplicada a sujeitos não doentes para medir o ambiente genômico de Ioci frequentemente envolvido em aberrações genéti- cas. Desta maneira, é possível determinar a predisposição de o sujeito adquirir certas aber- rações genéticas.
Assim, além dos usos médicos aqui descritos, a presente invenção pode ser usada em diagnóstico.
4C multiplex
A presente invenção permite a análise simultânea da frequência de interações de múltiplas seqüências de nucleotídeos alvos com uma ou mais seqüências de nucleotídeos de interesse. Amplificação pode ser obtida usando multiplex PCR Tais métodos permitem uma triagem não tendenciosa para rearranjos genômicos equilibrados e não equilibrados isto é, translocações, inversões, deleções e duplicações que podem ter ocorrido em qual- quer lugar no genoma. Os métodos podem ser usados para identificar pontos de quebra de 5 rearranjos em resolução muito alta, tipicamente em vinte kilobases (em média 5 kb). O mé- todo pode ser usado em aplicações de diagnóstico da maneira apresentada a seguir, por exemplo, diagnóstico pré-natal, diagnóstico pós-natal e para a análise de tumor e outras amostras doentes para identificar doenças de base de rearranjos genômicos ou sujeitos com predisposição a doença. Seqüências de nucleotídeos amplificadas de interesse podem ser 10 analisadas em microarranjos 4C feitos sob medida (da maneira descrita anteriormente), ou em micro-arranjos de Iadrilhamentos genômicos, ou por sequenciamento da maneira aqui adicionalmente descrita.
A triagem simultânea de rearranjos em múltiplos Ioci conhecidos por ser associados com uma doença.
Para muitas doenças, síndromes ou fenótipos, múltiplas alterações de DNA causa-
tivas possíveis são conhecidas e os sujeitos precisam ser classificados para identificar o exato rearranjo básico da doença/síndrome/fenótipo. Por exemplo, no caso de rearranjos de Ieucemias linfoblásticas que envolvem AML1, MLL, MYC, BCL, BCR, ABL, imunoglobulina loci, LYL1, TAL1, TAL2, TCRo/ó, TCR/?, HOX e possivelmente outro Ioci frequentemente 20 fundamentam a doença; a tecnologia 4C pode ser aplicada para identificar qual Iocus e rear- ranjo são envolvidos em um paciente com a dada doença.
Nesta modalidade, a tecnologia 4C é direcionada a cada um dos Ioci de interesse. Cada Iocus pode ser analisado separadamente, mas múltiplos Ioci podem também ser anali- sados simultaneamente em um arranjo simples. Assim, uma triagem 4C pode envolver a 25 amplificação de PCR (inversa) de elementos de DNA interagindo com uma ou mais seqüên- cias de nucleotídeos alvos próximas, cada qual dos Ioci que necessita ser analisado para rearranjos. Seqüências alvos em, ou próximas, a esses Ioci são escolhidas com base no critério aqui mencionado.
A amplificação de seqüências de nucleotídeos de interesse pode ser realizada se- 30 paradamente para cada seqüência de nucleotídeos alvo, ou pode ser realizada simultanea- mente em um volume de reação por PCR multiplex (inversa). Prefere-se o último nos casos quando seqüências de nucleotídeos de interesse interagindo com diferentes seqüências de nucleotídeos alvos podem ser identicamente marcadas sem comprometer a análise. Isto pode ser o caso, por exemplo, quando Ioci são localizados em cromossomos diferentes ou 35 quando Ioci são localizados no mesmo cromossomo a uma distância grande o bastante para a sobreposição mínima entre sinais de interação DNA-DNA, ou nos casos quando a sobre- posição entre as interações DNA-DNA amplificada de diferentes seqüências de nucleotídeos alvos não interfere com a detecção de rearranjos genômicos. A amplificação de seqüências de nucleotídeos de interesse interagindo com diferen- tes seqüências de nucleotídeos alvos é preferivelmente realizada separadamente quando cada conjunto de interações DNA-DNA precisa ser marcado diferentemente ou quando a eficiência de amplificação de conjuntos de iniciador de PCR inversa interfere um no outro.
Seqüências diferencialmente ou identicamente marcadas de interesse interagindo com as várias seqüências de nucleotídeos alvos são hibridizadas em micro-arranjos simples ou múltiplos contendo sondas representando o genoma completo (por exemplo, arranjos ou arranjos de Iadrilhamento de alta densidade) ou uma parte selecionada do genoma, da ma- neira descrita anteriormente. Sinais de hibridização serão comparados aos obtidos com uma amostra controle, onde um aumento ou diminuição nas frequências de interação de DNA- DNA medido no teste versus amostra controle é indicativo para um rearranjo de DNA na amostra teste.
Uma triagem 4C genômica não tendencioso para rearranjos em posições desco- nhecidas no genoma.
Em uma segunda modalidade, a tecnologia 4C é aplicada para uma triagem 4C ge- nômica não tendencioso para identificar rearranjos em uma amostra de um sujeito doente (ou não doente), onde os rearranjos são previamente desconhecidos e/ou ocorrem em loca- lizações desconhecidas. Nesta modalidade, as seqüências alvos não podem ser escolhidas para ficar próximas ao rearranjo. As seqüências alvos são assim não conhecidas ou suspei- tas de estarem associadas com a doença. Ao contrário, elas são escolhidas para ser distri- buídas por todo o genoma ou seção de genoma escolhido, para fornecer assim cobertura suficiente da cromatina a ser investigada. Preferivelmente, o genoma total é coberto.
Por exemplo, as seqüências alvos são escolhidas de maneira que suas seqüências de interação de interesse, sendo que maioria as seqüências diretamente em volta da se- qüência alvo (isto é, em 5, 10, 15, 20, 25, 30, 35, 40, ou 45 a 50 Mb da seqüência alvo) co- bre completamente, ou uma parte substancial, do genoma ou um cromossomo ou uma parte de um cromossomo. Isto permitirá reconstruir mapas cromossômicos físicos presentes em qualquer tipo de sujeito ou célula.
Para que duas seqüências alvos adjacentes no molde do cromossomo linear te- nham seqüências de DNA de interação sobrepostas (isto é, ambientes genômicos sobrepos- tos) elas precisam estar, por exemplo, 5, 10, 15, 20, 25, 30, 35, 40, 45, ou 50 a 100 Mb lon- ge uma da outra. Assim, para cobrir o genoma completo (2-3 x 109 bp) com as seqüências alvos separadas - são exigidas 10 Mb, 200-300 seqüências alvo. Para cobrir o genoma completo com as seqüências alvos separadas ~ 50 Mb, 40 a 60 seqüências alvos são exigi- das. Em uma última modalidade, apenas uma seqüência alvo por cromossomo é exigida para cobrir o genoma completo. Todas as seqüências de nucleotídeos de interesse que interagem com as seqüên- cias alvos são amplificadas como em 4C, tanto juntas em um mistura de reação simples (ou um número limitado de misturas da reação) por PCR multiplex (inverso), quanto em reações de PCR separadas (inverso) que podem ser agrupadas posteriormente. Prefere-se PCR 5 Multiplex nos casos quando as seqüências de nucleotídeos de interesse interagindo com diferentes seqüências de nucleotídeos alvos podem ser identicamente marcadas sem com- prometer a análise. A amplificação será feita separadamente para cada seqüência de nucle- otídeos alvo quando cada conjunto de interações DNA-DNA pertencentes a uma dada se- qüência alvo precisar ser marcada diferentemente e/ou quando eficiência de amplificação 10 dos conjuntos de iniciador de PCR inversa interferir um no outro.
Identificação de rearranjos intracromossômicos tais como deleções, inserções e duplicações e inversões (equilibradas e não equilibradas).
Em uma modalidade preferida, todas as seqüências de DNA amplificadas interagin- do com o conjunto de seqüências alvos de uma amostra teste (por exemplo, uma amostra 15 do paciente) são identicamente marcadas e frequências de interação amplas do genoma são comparadas com estas de uma amostra controle (por exemplo, de sujeito saudável). Amostras controle e teste podem ser hibridizadas no mesmo arranjo em diferentes cores, ou elas podem ser hibridizadas nos diferentes arranjos e comparadas. Um aumento ou uma diminuição na frequência de interação DNA-DNA para a amostra teste comparado com a 20 amostra controle é indicativo para uma duplicação/inserção ou uma deleção na amostra tes- te. Pode-se também ser indicativo para uma inversão.
As Figuras 18 e 19 mostram uma deleção identificada por 4C desta maneira.
Em uma outra modalidade preferida, seqüências de DNA amplificadas interagindo com o conjunto de seqüências alvos de uma amostra teste (por exemplo, amostra do paci- ente) são marcadas em duas cores, com cores alternando para seqüências alvos que são vizinhas no molde do cromossomo linear. Seqüências alvos vizinhas são bastante próximas no molde do cromossomo linear para que suas seqüências de interação sejam sobrepostas. Assim, seqüências alvos vizinhas podem estar, por exemplo, 5, 10, 15, 20, 25, 30, 35, 40, 45 a 50 Mb longe uma da outra. Um projeto experimental como esse impede que rearranjos faltem em virtude de sinais de hibridização saturados próximos a uma dada seqüência alvo. As frequências de interação amplas do genoma são comparadas com as de uma amostra controle (por exemplo, de sujeito saudável). Amostras controle e teste podem ser diferenci- almente marcadas e hibridizadas no mesmo arranjo, ou elas podem ser hibridizadas em diferentes arranjos e comparadas. Um aumento ou uma diminuição na frequência de intera- ção DNA-DNA para a amostra teste comparada com a amostra controle é indicativo para um duplicação/inserção ou uma deleção na amostra teste. Pode-se também ser indicativo de uma inversão. Uma análise 4C subsequente direcionada a seqüências alvos que flanqueiam ou fi- cam dentro da parte rearranjada do genoma pode ser realizada para identificar inversões. Um padrão inverso de sinais de hibridização comparado a amostra controle identifica a in- versão na amostra teste. Isto está descrito na Figura 20.
Em uma modalidade preferida adicional, seqüências de nucleotídeos de interesse
interagindo com diferentes seqüências alvos justapostas no molde do cromossomo são marcadas com diferentes corantes. Rearranjos são detectados pelo aparecimento aparência ou desaparecimento de sinais de DNA interagentes na amostra do paciente comparado com a amostra controle. Isto está descrito nas Figuras 21 a 23.
Identificação de translocações equilibradas e não equilibradas.
Em uma modalidade preferida adicional, múltiplos corantes são disponíveis (por e- xemplo, 48 corantes) e cada cromossomo é marcado com dois corantes exclusivos que são usados de maneira que os corantes alternados entre seqüências alvos que são vizinhos no molde do cromossomo linear. Todos os fragmentos de DNA podem ser hibridizados juntos 15 com um arranjo contendo sondas representando o genoma completo. A identificação de interações DNA-DNA entre cromossomos que ocorrem na amostras teste mas não nas a- mostras controle são indicativos de uma translocação e identifica os dois cromossomos rear- ranjados. A transição de sinais baixos para altos em um cromossomo não relacionado identi- fica o sítio de reconhecimento de enzima de restrição primário próximo ao ponto de quebra 20 doDNA.
Se translocações forem equilibradas, cada um dos dois corantes específicos para cromossomo deve dar sinais de hibridização fortes em um conjunto mutuamente exclusivo de sondas diretamente vizinhas umas das outras no molde linear do cromossomo não rela- cionado. O ponto de quebra neste cromossomo não relacionado é localizado entre os dois conjuntos de sondas mostrando sinais positivos de hibridização. Ver Figura 24.
Quando testados em uma amostra do paciente que envolve uma translocação cro- mossomo 1 :cromossomo 7, os resultados mostrados na Figura 25 são obtidos. Nesta amos- tra particular as seqüências alvos no arranjo representado uma triagem de seqüências loca- lizada próximas aos to sítios HindlW (ver anteriormente para a derivação de seqüências al- vo).
Se as translocações ocorrerem com perda de DNA nos pontos de quebra (isto é, translocações não equilibradas), cada um dos dois corantes específicos para cromossomo darão sinais de hibridização fortes em um conjunto mutuamente exclusivo de sondas no cromossomo não relacionado que não é diretamente vizinho um do outro no molde linear do 35 cromossomo não relacionado. As sondas localizadas no cromossomo não relacionado entre os dois conjuntos de sondas apresentando interações DNA-DNA intercromossômicas repre- sentam a região genômica que foi perdida. A maioria sondas externas desta região marca os sítios de restrição próximos aos pontos de quebra no cromossomo não relacionado (ver Figura 26).
Quando testados em uma amostra do paciente que envolve uma translocação cro- mossomo 4:cromossomo 7 com uma quantidade desconhecida de DNA deletado no ponto 5 de quebra, os resultados mostrados na Figura 27 são obtidos. Nesta amostra particular as seqüências alvos no arranjo novamente representaram uma triagem de seqüências localiza- das próximas aos sítios Hind\\\. Os resultados mostram que tanto a translocação quanto a deleção são detectadas (aproximadamente 2 Mb).
Ainda em uma modalidade preferida adicional, múltiplos corantes (por exemplo, 24 10 corantes) são disponíveis e usados para marcar diferencialmente cada cromossomo (Figura 28). Assim, todas as seqüências de DNA que interagem com as seqüências alvos presentes no mesmo cromossomo são marcados identicamente e diferentes daqueles localizados em outros cromossomos. A identificação de interações DNA-DNA entre cromossomos que ocor- rem em amostras teste mas não em amostras controle são indicativos de uma translocação 15 e identifica os dois cromossomos rearranjados.
Uma análise 4C subsequente direcionada especificamente para os cromossomos envolvidos na translocação permite a identificação de pontos de quebra. Aqui, um ou cada um cromossomo é marcado com dois corantes exclusivos que são usados de maneira que eles alternem entre fragmentos de DNA interagindo com as seqüências alvos que vizinhas no molde do cromossomo linear.
Se as translocações forem equilibradas, cada dos dois corantes específicos para cromossomo poderão dar sinais de hibridização fortes em um conjunto mutuamente exclusi- vo de sondas diretamente vizinhas umas das outras no molde linear do cromossomo não relacionado. O ponto de quebra deste cromossomo não relacionado é localizado em entre os dois conjuntos de sondas que apresentam sinais positivos de hibridização.
Se as translocações ocorrerem com perda de DNA nos pontos de quebra (isto é, translocações não equilibradas), cada um dos dois corantes específicos para cromossomo darão sinais de hibridização fortes em um conjunto mutuamente exclusivo de sondas no cromossomo não relacionado que não é diretamente vizinho um do outro no molde linear do 30 cromossomo não relacionado. As sondas localizadas no cromossomo não relacionado entre os dois conjuntos de sondas mostrando interações DNA-DNA intercromossômicas represen- tam a região genômica que foi perdida. A maioria das sondas externas desta região marca os sítios de restrição próximos aos pontos de quebra no cromossomo não relacionado.
Em uma outra modalidade preferida, menos que 24 corantes são disponíveis e ca- da corante é usado para marcar exclusivamente todos os fragmentos de DNA que interagem com as seqüências alvos presentes no mesmo cromossomo. Assim, com 1, 2, 3, 4, 6, 8, 10, 12 etc. corantes, 1, 2, 3, 4, 6, 8, 10, 12 etc. cromossomos podem ser exclusivamente mar- cados. Fragmentos de DNA marcados pertencentes a cada um desses cromossomos po- dem ser hibridizados juntos com um arranjo contendo as sondas representando o genoma completo. A aparência de sinais de hibridização representando interações DNA-DNA em um cromossomo não relacionado identifica este cromossomo como um parceiro de transloca- 5 ção. Uma análise 4C subsequente direcionada especificamente para os cromossomos en- volvidos na translocação permite a identificação de pontos de quebra (da maneira descrita anteriormente).
Em uma outra modalidade preferida, menos que 48 corantes são disponíveis e ca- da cromossomo é marcado com dois corantes exclusivos que são usados de maneira que 10 eles alternem entre os fragmentos de DNA interagindo com as seqüências alvos que vizi- nhas no molde do cromossomo linear. Assim, com 2, 4, 6, 8, 10, 12,14, 16, 18, 20, 22, 24 etc. corantes 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 etc. cromossomos podem ser exclusivamente marcados. Todos os fragmentos de DNA podem ser hibridizados juntos com um arranjo con- tendo as sondas representando o genoma completo. Sinais de hibridização em um cromos- 15 somo não relacionado representam interações DNA-DNA inter- cromossômicas e identificam este cromossomo como um parceiro de translocação. A transição dos sinais baixos para altos em um cromossomo não relacionado identifica o sítio de reconhecimento de enzima de restrição primário próximo ao ponto de quebra do DNA.
Ainda em uma modalidade preferida adicional, menos que 48 corantes são disponí- 20 veis e cada cromossomo é marcado com mais que dois corantes exclusivos que são usados de maneira que eles alternem entre os fragmentos de DNA interagindo com as seqüências alvos que vizinhas no molde do cromossomo linear. Todos os fragmentos de DNA podem ser hibridizados juntos com um arranjo contendo as sondas representando o genoma com- pleto. Sinais de hibridização em um cromossomo não relacionado representam interações 25 DNA-DNA intercromossômicas e identificam este cromossomo como um parceiro de trans- locação. A transição dos sinais baixos para altos em um cromossomo não relacionado iden- tifica o sítio de reconhecimento de enzima de restrição primário próximo ao ponto de quebra do DNA.
Como identificar outros pontos de quebra de translocação Os pontos de quebra identificados em um cromossomo de acordo com quaisquer
das estratégias supramencionadas podem ser usados subsequentemente para identificar os pontos de quebra no cromossomo parceiro de translocação. Isto pode ser feito, por exem- plo, por meio de sequenciamento de produtos obtidos através de PCR de longo alcance nas Junções de DNA ou PCR mediado por ligação (LM) ou PCR inversa em círculos de DNA 35 criados por digestão e religação de enzima de restrição de DNA genômico (não reticulado), usando iniciadores específicos para o cromossomo que lê nas seqüências do outro cromos- somo. Em uma modalidade preferida, cada uma das classificações supramencionadas pa- ra rearranjos genômicos pode ser seguida por um experimento 4C dedicados direcionados contra as seqüências alvos próximas candidatas aos pontos de quebra para identificá-las de forma inequívoca como tal.
Aspectos dos métodos descritos anteriormente para a detecção de diferentes tipos de rearranjos genômicos podem ser combinados para classificar simultaneamente o geno- ma para sua ocorrência.
Se arranjos de Iadrilhamento genômicos forem usados em vez de arranjos 4C, tran- sições em intensidades de sinal para sondas justapostas no molde do cromossomo linear que são observados em paciente, mas não no controle, amostras, indicam a posição de pontos de quebra associados com um rearranjo genômico (em vez do sítio de reconheci- mento de enzima de restrição primário próximo ao ponto de quebra do DNA).
Seauenciamento
Sequenciamento de DNA de alta produção prometem tornar uma alternativa dispo- nível e mais quantitativa para micro-arranjos para analisar grandes coleções de seqüências de DNA. Exemplos de abordagens de sequenciamento de alta produção são listados em E.Y. Chan, Mutation Reseach 573 (2005) 13-40 e incluem, mas sem limitações, abordagens de sequenciamento de termo próximas tais como abordagens de extensão do ciclo, aborda- gens de leitura polimerase e sequenciamento exonuclease, abordagens de sequenciamento revolucionárias tais como varredura de DNA e sequenciamento nanoporo e análise linear direta. Exemplos de métodos de sequenciamento atual de alta produção são (pi- ro)sequenciamento 454, método de sequenciamento de Solexa Genoma Analysis System, Agencourt SOLiD (Biosistemas aplicados), sequenciamento MS-PET (Ng et al., 2006, http ://nar. oxfordjournals.org/cgi/content/full/34/ 12/e84).
Sequenciamento pode substituir hibridização do arranjo em análise de alta produ- ção dos resultados de 4C e outro abordado com base em detecção de interações genômi- cas. A frequência de ocorrência de uma seqüência é indicativa da frequência de associação no genoma, e pode ser analisada da mesma maneira que os resultados de hibridização são analisados anteriormente.
Sequenciamento é realizado no molde da maneira fornecida pelas etapas a-g, des- critas na reivindicação 1. Alternativamente, o sequenciamento pode ser realizado nos produ- tos de PCR obtidos por métodos da maneira descrita por Lomvardas et al., Cell 126, 403- 413, July 28, 2006 ou por Ling et al., Science 312, 14 April 2006, 269-272.
Sequenciamento é iniciado de uma ou ambas extremidades dos produtos de PCR. Ambas extremidades do produto de PCR consistem em seqüências de nucleotídeos de composições de nucleotídeo conhecidas, com pelo menos uma extremidade sendo seqüên- cia de nucleotídeos alvo, e flanqueia uma seqüência de nucleotídeos de interesse que foi interagida e ligada às seqüência de nucleotídeos alvo. Dependendo do método de sequen- ciamento usado, adaptadores podem precisar ser adicionados a uma ou ambas extremida- des dos produtos de PCR. Adaptadores podem ser seqüências de oligonucleotídeo exigidos para o método de sequenciamento de interesse, que pode ou não conter frações, por exem- plo, que permitam que elas sejam capturadas. Adaptadores podem ser ligados aos produtos de PCR diretamente ou após tornar as extremidades dos produtos de PCR rombas. Alterna- tivamente, conjuntos iniciador de PCR, da maneira usada em etapa g (reivindicação 1), po- dem conter projeções que representam seqüências de adaptadores ou podem conter proje- ções que introduzem sítios de clivagem de enzima de restrição que pode ser usada para ligação subsequente de adaptadores específicos ou não específicos para cada extremidade do produto de PCR.
Em experimentos 4C que ajuda identificar as seqüências de DNA interagindo com uma seqüência alvo de nucleotídeo simples, sequenciamento precisa Ier através do evento de ligação primária (etapa c) e/ou o evento de ligação secundária (etapa f) de maneira que informação de seqüência suficiente seja obtida para identificar as seqüências de nucleotí- deos de interesse. Tipicamente, isto exige o sequenciamento e identificação de trechos de minimamente 8-30 nucleotídeos além da junção de ligação na seqüência de nucleotídeos de interesse (ver figura 28).
No sequenciamento 4C multiplex precisa-se Ier no evento de ligação primária (eta- pa c) e/ou no evento de ligação secundária (etapa f) de maneira que informação de seqüên- cia suficiente seja obtida para identificar tanto a seqüência de nucleotídeos alvo quanto a seqüência de nucleotídeos de interesse que juntas formam o produto de ligação. Tipicamen- te, isto exige o sequenciamento e identificação de trechos de 8-30 nucleotídeos em cada lado da junção de ligação. A identificação da seqüência de nucleotídeos alvo fornecerá cada produto de ligação com um “endereço domiciliar”. Iniciadores usados na etapa g que hibridi- zam na seqüência de nucleotídeos alvo precisam ser localizados a uma distância da junção de ligação primária e secundária que seja grande o bastante para o sequenciamento identi- ficar de forma inequívoca este “endereço domiciliar”. Dependendo do método de sequenci- amento, esta distância pode ser minimamente 0, 10, 20 30, 40, 50, 60, 70, 80, 90 ou 100 nucleotídeos longe da junção de ligação.
Em 4C uniplex e multiplex, quando os produtos de PCR consistem em uma se- qüência de nucleotídeos de interesse flanqueados em cada lado pelas seqüências de nucle- otídeos alvo, a leitura de uma extremidade do produto de PCR através da junção de ligação primária, e leitura da outra extremidade do produto de PCR através da junção de ligação secundária, fornece a mesma informação. Assim, as seqüências obtidas de um lado do pro- duto de PCR são suficientes para a análise de interações DNA-DNA. Seqüências obtidas do outro lado do produto de PCR podem ser usadas para complementar ou para verificar os dados. Ver Figura 29. A iniciação das seqüência de reações ideais pode ser feita usando os iniciadores padrões rotineiramente usados pelas plataformas de sequenciamento de alta produção res- pectivas. Eia pode também ser feita com iniciadores de sequenciamento customizados que sobrepõem parcialmente ou completamente os iniciadores de PCR inversa usados para am- plificar as seqüências capturadas por uma dada seqüência alvo. Isto impediria a releitura da seqüência de iniciador de PCR inversa total e permitiria a leitura de mais nucleotídeos do fragmento capturado, que portanto podem ser identificados mais facilmente e mapeados no genoma. Estes iniciadores de sequenciamento customizados podem então também anelar parcialmente nas seqüências de adaptadores normalmente usadas como a fita de DNA complementar ao iniciador de sequenciamento.
Em uma configuração multiplex, múltiplos iniciadores de sequenciamento que so- brepõem tanto com a seqüência de adaptador quanto com as extremidades externas dos produtos de DNA amplificados por PCR inversa podem ser usados simultaneamente, de maneira que cada fragmento alvo incluído na análise tenha seu próprio iniciador de seqüên- cia exclusivo. A sobreposição com as extremidades externas dos produtos de DNA amplifi- cados por PCR inversa (isto é, a seqüência de iniciador de PCR inversa) deve ser de manei- ra que nucleotídeos suficientes da seqüência alvo sejam ainda disponíveis para sequencia- mento e de maneira que cada seqüência alvo (endereço domiciliar) possa ser identificada de forma inequívoca. Dependendo da natureza e número de seqüências alvos analisadas si- multaneamente, isto significa que em uma modalidade, os iniciadores de sequenciamento podem hibridizar 1 a 20 nucleotídeos longe do sítio de restrição que forma a junção entre a seqüência alvo e a seqüência capturada. A identificação de cada combinação de seqüência alvo e seqüência capturada pode também ser feita usando sequenciamento di-tag, que for- nece informação de seqüência de ambas extremidades de cada fragmento de DNA analisa- do.
Em uma outra modalidade, os iniciadores de sequenciamento são desenhados para cada seqüência alvo de maneira que eles sejam próximos aos sítios de reconhecimento de enzima de restrição primários e/ou secundários analisados e podem sobrepor parcialmente ou completamente nos sítios de reconhecimento de enzima de restrição primários e/ou se- cundários analisado.
Em uma modalidade, a tecnologia de sequenciamento de alta produção usada é o sequenciamento Solexa (lllumina).
Em uma modalidade, o sequenciamento pode ser direcionado para o lado do sítio de reconhecimento de enzima de restrição primário. Isto pode impedir a leitura de eventos de ligação aleatórios que ocorrem durante a segunda etapa de ligação.
Em uma modalidade, sequenciamento pode ser direcionada a o lado do sítio de re- conhecimento de enzima de restrição secundário.
Análise dos dados
Produtos de ligação analisados pela tecnologia 4C são compostos de um “endereço domiciliar” (seqüência de nucleotídeos alvo) e uma seqüência de nucleotídeos interagente de interesse (“endereço de deslocamento”). No caso de uniplex 4C este “endereço domicili- ar” é conhecido (sendo a uma seqüência de nucleotídeos alvo analisada).
Nos casos de 4C multiplex, o endereço “domiciliar” é identificado comparando ele- tronicamente a seqüência de nucleotídeos alvo obtida com um biblioteca/base de dados contendo todas as seqüências de nucleotídeos alvos incluídas na análise. O 'endereço de 10 deslocamento' obtido (isto é, seqüência de nucleotídeos de interesse) é identificado compa- rando eletronicamente sua seqüência com um biblioteca/base de dados contendo todos os fragmentos de DNA genômico que são localizados entre um sítio de reconhecimento de en- zima de restrição primário e secundário de escolha.
Para visualizar os dados e facilitar a análise, em uma modalidade preferida cada 15 produto de ligação sequenciado é traçados graficamente ao longo do molde linear dos cro- mossomos, na localização genômica do 'endereço de deslocamento' (seqüência de nucleo- tídeos de interesse). Códigos de cores exclusivas revelam o “endereço domiciliar" de cada produto de ligação e a frequência de detecção de cada produto de ligação é indicada grafi- camente. Rearranjos genômicos podem ser detectados dividindo cada frequência de intera- 20 ção medida em uma amostra (por exemplo, obtida de um paciente) daquelas medidas na outra amostra (por exemplo, de sujeito saudável). Estes valores podem ser colocados i- gualmente em gráfico ao longo dos moldes do cromossomo linear.
Uma diminuição na frequência de interação DNA-DNA na amostra teste é indicativa de uma deleção. Tipicamente, isto coincide com um aumento nas frequências de interação 25 de DNA-DNA para seqüências além do ponto de quebra mais distai medido a partir da se- qüência alvo. Um aumento na frequência de interação DNA-DNA na amostra teste é indica- tivo de uma duplicação. Tipicamente, isto coincide com uma diminuição nas frequências de interação de DNA-DNA para seqüências além do ponto de quebra mais distai medido a par- tir da seqüência alvo. Uma inversão na frequência de interação DNA-DNA na amostra teste 30 é indicativa de uma inversão genômica. A detecção de interações DNA-DNA através dos cromossomos é indicativa de uma translocação. Os pontos de quebra são detectados da maneira descrita para a análise de micro-arranjo.
Biomarcadores
A identificação de rearranjos - tais como translocações, inversões e deleções, que são associados com uma doença permite a identificação de biomarcadores que podem ser usados para diagnosticar a doença. Por exemplo, sondas de hibridização ou iniciadores de PCR que detectam um dado rearranjo podem ser desenhados e usados para diagnosticar a doença em um paciente. Sondas PCR podem ser desenhadas de acordo com as técnicas conhecidas na tecnologia, de maneira que uma região suscetível para rearranjo em uma condição da doença é amplificada usando os iniciadores; a natureza do produto de amplifi- cação será indicativa da presença ou ausência da doença. Alternativamente, podem ser 5 desenhadas sondas de hibridização ou iniciadores que hibridizarão exclusivamente na pre- sença ou ausência do rearranjo. Proteínas de fusão resultantes de rearranjos podem ser detectadas por técnicas tais como detecção de anticorpo com anticorpos desenhados de acordo com as técnicas conhecidas na tecnologia ou espectrometria de massa.
Suieiro
O termo "sujeito" inclui mamíferos - tais como animais e humanos.
Agente
O agente pode ser um composto orgânico ou outra substância química. O agente pode ser um composto, que é obtenível de ou produzido por qualquer fonte adequada, seja natural ou artificial. O agente pode ser uma molécula de aminoácido, um polipeptídeo, ou 15 uma substância química derivada destes, ou uma combinação destes. O agente pode ainda ser uma molécula de polinucleotídeo - que pode ser uma molécula sentido ou um anti- sentido, ou um anticorpo, por exemplo, um anticorpo policlonal, um anticorpo monoclonal ou um anticorpo humanizado monoclonal.
Várias estratégias foram desenvolvidas para produzir anticorpos monoclonais com caráter humano, que desviam o necessário para uma linhagem celular humana de produção de anticorpo. Por exemplo, anticorpos monoclonais de camundongos usados foram "huma- nizados" ligando regiões variáveis de roedor e regiões constantes de humano (Winter, G. e Milstein, C. (1991) Nature 349, 293-299). Isto reduz a imunogenicidade de anticamundongos humano do anticorpo, mas a imunogenicidade residual é retida em virtude da estrutura da região V anterior. Além disso, a especificidade de ligação de antígeno é essencialmente a- quela do doador murino. Enxerto CDR e manipulação da estrutura (EP 0239400) melhora- ram e refinaram a manipulação do anticorpo até o ponto onde é possível produzir anticorpos humanizados murinos que são aceitáveis para o uso terapêutico em humanos. Anticorpos humanizados podem ser obtidos usando outros métodos bem conhecidos na tecnologia (por exemplo, da maneira descrita em US-A-239400).
Os agentes podem ser anexados a uma entidade (por exemplo, uma molécula or- gânica) por um Iigante que pode ser um Iigante bifuncional hidrolisável.
A entidade pode ser desenhada ou obtida de uma biblioteca de compostos, que po- dem compreender peptídeos, bem como outros compostos, tais como pequenas moléculas orgânicas.
A título de exemplo, a entidade pode ser uma substância natural, uma macromolé- cula biológica, ou um extrato feito de materiais biológicos tais como bactéria, fungo, ou célu- I 78
Ias ou tecidos de animal (particularmente mamífero), uma molécula orgânica ou inorgânica, um agente sintético, um agente semi-sintético, um mimético estrutural ou funcional, um pep- tídeo, um peptidomiméticos, um peptídeo clivado de uma proteína total, ou um peptídeo sin- tetizado sinteticamente (tais como, a título de exemplo, tanto usando um sintetizador de pep- 5 tídeo quanto por técnicas recombinantes ou combinações destes, um agente recombinante, um anticorpo, um agente natural ou um não natural, uma proteína de fusão ou equivalente destes e mutantes, derivados ou combinações destes.
Tipicamente, a entidade será um composto orgânico. Para alguns exemplos, os compostos orgânicos compreenderão dois ou mais grupos hidrocarbila. Aqui, o termo "agru- 10 pamento hidrocarbila" significa um agrupamento compreendendo pelo menos CeHe pode compreender opcionalmente um ou mais outros substituintes adequados. Exemplos de tais substituintes podem incluir um agrupamento halo-, alcóxi-, nitro-, alquila, um agrupamento cíclico etc. Além das possibilidades de os substituintes serem um agrupamento cíclico, uma combinação de substituintes pode formar um agrupamento cíclico. Se o agrupamento hidro- 15 carbila compreender mais que um C, então aqueles carbonos não precisam necessariamen- te ser Iigados um no outro. Por exemplo, pelo menos dois dos carbonos podem ser ligados por meio de um elemento ou agrupamento adequado. Assim, o agrupamento hidrocarbila pode conter heteroátomos. Heteroátomos adequados ficarão aparente aos versados na tec- nologia que e incluirão, por exemplo, enxofre, nitrogênio e oxigênio. Para algumas aplica- 20 ções, a entidade preferivelmente compreende pelo menos um agrupamento cíclico. O agru- pamento cíclico pode ser um agrupamento policíclico, tal como um agrupamento policíclico não fundido. Para algumas aplicações, a entidade compreende pelo menos um dos ditos grupos cíclicos ligados a um outro agrupamento hidrocarbila.
A entidade pode conter grupos halo - tais como grupos flúor, cloro, bromo ou iodo. A entidade pode conter um ou mais dos grupos alquila, alcóxi, alquenila, alquileno e
alquenileno - que pode ser de cadeia não ramificada ou ramificada.
Doença
Aspectos da presente invenção podem ser usados para o tratamento e/ou preven- ção e/ou diagnóstico e/ou prognóstico de uma doença - tais como aquelas listadas em WO- A- 98/09985.
Para facilidade de referência, parte desta que lista é agora fornecida: atividade inibi- tória de macrófago e/ou inibitória de célula T e assim, atividade anti-inflamatória; atividade anti-imune, isto é, efeitos inibitórios contra uma resposta imune celular e/ou humoral, inclu- indo uma resposta não associada com inflamação; doenças associadas com vírus e/ou ou- 35 tro patógenos intracelulares; inibir a capacidade de macrófagos e células T de aderir nos componentes da matriz extracelular e fibronectina, bem como expressão do receptor Fas suprarregulado em células T; inibir reação imune e inflamação indesejável incluindo artrite, incluindo artrite reumatóide, inflamação associada com hipersensibilidade, reações alérgi- cas, asma, Iupus eritematoso sistêmico, doenças de colágeno e outras doenças autoimunes, inflamação associada com aterosclerose, arteriosclerose, doença do coração ateroscleróti- co, lesão de reperfusão, parada cardíaca, infarto do miocárdio, distúrbios inflamatórios vas- culares, síndrome de dificuldade respiratória ou outras doenças cardiopulmonares, inflama- ção associada com úlcera péptica, colite ulcerativa e outras doenças do trato gastrintestinal, fibrose hepática, cirrose do fígado ou outras doenças hepáticas, tireoidite ou outras doenças glandulares, glomerulonefrites ou outras doenças renais e urológicas, otite ou outras doen- ças otorrino- laringológica, dermatite ou outras doenças dérmicas, doenças periodontais ou outras doenças dentais, infertilidade orquite ou epidídimoorquite, trauma orquidal ou outras doenças testiculares relacionadas imunes, disfunção da placenta, insuficiência da placenta, aborto habitual, eclampsia, pré-eclâmpsia e outras doenças imune e/ou genicológica rela- cionada inflamatória, uveite posterior, uveite intermediária, uveite anterior, conjuntivite, corio- retinite, uveoretinite, neurite ótica, inflamação intraocular, por exemplo, retinite ou oedema macular cistóide, oftalmia simpatética, esclerite, retinite pigmentosa, componentes imunes e inflamatórios de doença de fundo degenerativo, componentes inflamatórios de trauma ocu- lar, inflamação ocular causada por infecção, vitreoretinopatia proliferativa, neuropatia ótica de isquemia aguda, cicatriz excessiva, por exemplo, após a operação de filtração de glau- coma, reação imune e/ou inflamação contra implantes oculares e outras doenças oftálmicas inflamatória relacionadas imunes e inflamação associada com doenças ou condições ou distúrbios autoimunes onde, tanto no sistema nervoso central (CNS) quanto em qualquer outro órgão, supressão imune e/ou inflamação seria benéfica, doença de Parkinson, compli- cação e/ou efeitos colaterais do tratamento de doença de Parkinson, demência complexa relacionada a AIDS, encefalopatia relacionada a HFIV, doença de Devic, corea de Syde- nham, doença de Alzheimer e outras doenças degenerativas, condições ou distúrbios do CNS, componentes inflamatórios de acidente vascular cerebral, síndrome pós-polio, compo- nentes imunes e inflamatórios de distúrbios psiquiátricos, mielite, encefalite, pan-encefalite de esclerose subaguda, encefalomielite, neuropatia aguda, neuropatia subaguda, neuropatia crônica, síndrome de Guillaim-Barre, corea de Sydenham, miastenia grave, pseudotumor cerebral, Síndrome de Down, doença de Huntington, esclerose lateral amiotrófica, compo- nentes inflamatórios de compressão de CNS ou trauma do CNS ou infecções do CNS, com- ponentes inflamatórios de atrofias e distrofias musculares, e doenças relacionadas imunes e inflamatórias, condições ou distúrbios dos sistemas nervosos central e periférico, inflamação pós-traumática, choque séptico, doenças infecciosos, complicações inflamatórias ou efeitos colaterais de cirurgia, transplante de medula óssea ou outras complicações e/ou efeitos co- laterais de transplante, complicações inflamatórias e/ou imunes e efeitos colaterais de tera- pia de gene, por exemplo, em virtude de infecção com um veículo viral, ou inflamação asso- ciada com AIDS, para suprimir ou inibir uma resposta humoral e/ou imune celular, para tratar ou melhorar doenças proliferativas de monócito ou leucócito, por exemplo, leucemia, redu- zindo a quantidade de monócitos ou linfócitos, para a prevenção e/ou tratamento de rejeição a enxerto no casos de transplante de células naturais ou artificiais, tecido e órgãos tais como córnea, medula óssea, órgãos, lentes, marcapassos, tecido de pele natural ou artificial. Dis- túrbios relacionados a câncer específicos incluem, mas sem limitações, tumores sólidos; tumores carregados no sangue tais como leucemia; metástase tumoral; tumores benignos, por exemplo, hemangiomas, neuromas acústicos, neurofibromas, tracoma, e granulomas piogênícas; artrite reumatóide; psoríase; doenças angiogênicas oculares, por exemplo, reti- nopatia diabética, retinopatia de pré-maturidade, degeneração macular, rejeição a enxerto de córnea, glaucoma neovascular, fibroplasia retrolental, rubeose; síndrome de Osier- Web- ber; angiogênese miocardial; neovascularização de placa; telangiectasia; juntas hemofilícas; angiofibroma; granulação de ferida; colaterais coronárias; colaterais cerebrais; más forma- ções arteriovenosa; angiogênese de elemento isquêmico; glaucoma neovascular; fibroplasia retrolental; neovascularização diabética; doenças relacionadas a Helicobacter, fraturas, vas- culogênese, hematopoiese, ovulação, menstruação e placentação.
Preferivelmente, a doença é câncer - tais como leucemia linfócita aguda (ALL), leu- cemia mielóide aguda (AML), câncer adrenocortical, câncer anal, câncer da bexiga, câncer sanguíneo, câncer ósseo, tumor cerebral, câncer de mama, câncer do sistema genital femi- nino, câncer do genital sistema masculino, Iinfoma do sistema nervoso central, câncer cervi- cal, rabdomiosarcoma infantil, sarcoma infantil, leucemia linfócita crônica (CLL), leucemia mielóide crônica (CML), câncer do cólon e retal, câncer cólon, câncer endométrico, sarcoma endométrico, câncer esofagial, câncer do olho, câncer da vesícula biliar, câncer gástrico, câncer do trato gastrintestinal, leucemia da célula capilar, câncer da cabeça e pescoço, cân- cer hepatocelular, doença de Hodgkin, câncer hipofaringeal, sarcoma de Kaposi, câncer do rim, câncer da laringe, leucemia, câncer do fígado, câncer do pulmão, histiocitoma fibroso maligno, timoma maligno, melanoma, mesotelioma, mieloma múltiplo, mieloma, câncer da cavidade nasal e seio paranasal, nasofaringeal câncer, câncer do sistema nervoso, neuro- blastoma, Iinfoma de não Hodgkin, câncer da cavidade oral, câncer orofaringeal, osteosar- coma, câncer do ovário, câncer pancreático, câncer da paratireóide, câncer do pênis, câncer da faringe, tumor pituitário, neoplasma de célula plasmática, Iinfoma CNS primário, câncer próstata, câncer retal, sistema respiratório, retinoblastoma, câncer da glândula salivar, cân- cer de pele, câncer do intestino delgado, sarcoma do tecido macio, câncer de estômago, câncer testicular, câncer da tireóide, câncer do sistema urinário, sarcoma uterino, câncer vaginal, sistema vascular, macroglobulinemia de Waldenstrom e tumor de Wilms.
Estoios
Os materiais para uso nos métodos da presente invenção são idealmente adequa- dos para a preparação de estojos. Um estojo como este pode compreender recipientes, cada qual com um ou mais dos vários reagentes (tipicamente em forma concentrada) utilizados nos métodos aqui des- critos, incluindo, por exemplo, uma enzima de restrição primária, uma enzima de restrição secundária, um agente de reticulação, uma enzima de ligação (por exemplo, uma ligase) e um agente para reverter a reticulação (por exemplo, proteinase K).
Os oligonucleotídeos podem também ser fornecidos em recipientes que podem ser em qualquer forma, por exemplo, liofilizada, ou em solução (por exemplo, uma água destila- da ou solução tamponada), etc.
Em um aspecto preferido da presente invenção, é fornecido um estojo compreen- dendo um conjunto de sondas da maneira aqui descrita, um arranjo e opcionalmente uma ou mais marcadores.
Um conjunto de instruções será também tipicamente incluído.
Usos
Vantajosamente, a presente invenção pode ser usada a fim de obter informação a cerca da organização espacial de seqüências de nucleotídeos - tais como Ioci genômicos in vitro ou in vivo.
A título de exemplo, a tecnologia 4C pode ser usada para estudar a organização tri- dimensional de um ou mais Ioci do gene. Em particular, esta tecnologia pode ser usada para estudar o papel de um ou mais fatores de transcrição na organização tridimensional de um ou mais Ioci do gene.
A título de exemplo adicional, a tecnologia 4C pode ser usada para estudar o papel de fatores de transação e elementos cis-regulatórios de DNA.
A título de exemplo adicional, a tecnologia 4C pode ser usada para estudar regula- ção do gene de longo alcance in vitro ou in vivo.
A título de exemplo adicional, a tecnologia 4C pode ser usada para estudar proxi- midade e interação intracromossômica.
A título de exemplo adicional, a tecnologia 4C pode ser usada para estudar proxi- midade e interação inter-cromossômica.
A título de exemplo adicional, a tecnologia 4C pode ser usada para identificar se- qüências de nucleotídeos que funcionam com um promotor, melhorador, silenciador, isolan- te, região de controle dos locus, origem de replicação, MAR, SAR, centrômero, telômero ou qualquer outra seqüência de interesse em uma rede regulatória.
A título de exemplo adicional, a tecnologia 4C pode ser usada para identificar genes responsáveis por um fenótipo (doença) nos casos onde acontece de uma mutação e/ou de- leção afetar um elemento regulatório distante e seu mapeamento falta portanto fornecer tal informação. A título de exemplo adicional, a tecnologia 4C pode ser usada para reconstruir e- ventualmente a conformação espacial de Ioci do gene, grandes regiões genômicas ou mes- mo cromossomos completos.
A título de exemplo adicional, a tecnologia 4C pode ser usada para definir sequên- cias âncoras potenciais que mantêm certos cromossomos juntos no espaço nuclear.
A título de exemplo adicional, a tecnologia 4C pode ser usada para reconstruir e- ventualmente em alta resolução o posicionamento de cromossomos uns com relação aos outros.
A título de exemplo adicionai, a tecnologia 4C pode ser usada em diagnóstico (por exemplo, diagnóstico pré-natal) para detectar ou identificar rearranjos genômicos e/ou aber- rações - tais como translocações, deleções, inversões, duplicações.
Técnicas de Metodologia de DNA Recombinante Gerais
A presente invenção emprega, a menos que de outra forma indicada, técnicas con- vencionais de substância química, biologia molecular, microbiologia, DNA recombinante e 15 imunologia, que estão na capacidade de versados na tecnologia. Tais técnicas são explica- das na literatura. Ver, por exemplo, J. Sambrook, E. F. Frítsch, and T. Maniatis, 1989, Mole- cular Cloning: A Laboratory Manual, Second Edition, Books 1-3, Cold Spring Harbor Labora- tory Press; Ausubel, F. M. et al. (1995 and períodic supplements; Current Protocols in Mo- lecular Biology, eh. 9, 13, and 16, John Wiley & Sons, New York, N. Y.); B. Roe, J. Crabtree, 20 and A. Kahn, 1996, DNA Isolation and Sequencing: Essential Techniques, John Wiley & Sons; M. J. Gait (Editor), 1984, Oligonucleotide Synthesís: A Practical Approach, Irl Press; and, D. M. J. Lilley and J. E. Dahlberg, 1992, Methods of Enzymology: DNA Strueture Part A: Synthesis and Physieal Analysis of DNA Methods in Enzymology, Aeademie Press. Cada um destes textos gerais está aqui incorporado pela referência.
A invenção será agora descrita com mais detalhes a título de exemplo, que visa
servir aos versados na tecnologia na realização da invenção e não devem de qualquer ma- neira se limitar ao escopo da invenção.
EXEMPLO 1
Seção Materiais & Métodos que está relacionada com as figuras 2, 13, 14, 15, 16,
17, 19.
Tecnologia 4C
As etapas iniciais do procedimento da tecnologia 3C foram realizadas da maneira descrita previamente (Splinter et al, (2004). Methods Enzymol 375, 493-507 (2004), produ- zindo produtos de ligação entre fragmentos de Mndlll. Este molde 3C ligado a HincM (~ 50 35 /yg) foi digerido por toda a noite a 100 ng///L com 50U de uma enzima de restrição secundá- ria, freqüente de corte, sendo tanto DpnW (HS2, Rad23A) quanto Nlalll (yS-principal). Para evitar restrição na formação de círculo de DNA (Rippe et al. (1995) Trends Biochem Sci 20, 500- 6), tomou-se cuidado para escolher uma enzima de restrição secundária que não cor- tou em cerca de 350 a 400 bp do sítio de restrição HindlU que demarca o fragmento de res- trição de interesse (isto é, a 'isca'). Após digestão da enzima de restrição secundária, o DNA foi extraído com fenol, precipitado com etanol e subsequentemente ligado em baixa concen- tração (amostra de 50 //g em 14 mL usando 200 U Iigase (Roche), 4 horas a 16 0C) para promover formação de círculo Opnll ou DpnU. Produtos de ligação foram extraídos com fe- nol e precipitado com etanol, usando glicogênio (Roche) como um veículo (20 /yg/mL). Os círculos de interesse foram Iinearizados digerindo por toda a noite com um 50U de uma en- zima de restrição terciária que corta a isca entre os sítios de reconhecimento de enzima de restrição primária e secundária, usando as seguintes enzimas de restrição: Spel (HS2), Pstl (Rad23A) e Pflml (^-principal). Esta etapa de linearização foi realizada para facilitar hibridi- zação de iniciador subsequente durante as primeira rodadas de amplificação de PCR. Pro- dutos digeridos foram purificados usando uma coluna de remoção de nucleotídeo QIAquick (250) (Qiagen).
As reações de PCR foram realizadas usando o sistema de PCR Expand Long Mol- de (Roche), usando condições cuidadosamente otimizadas para assegurar a amplificação linear de fragmentos dimensionado até 1,2 kb (80 % de fragmentos de PCR 4C são meno- res que 600 bp). As condições de PCR foram como a seguir: 94 0C por 2 minutos, 30 ciclos de 94 0C por 15 segundos, 55 0C por 1 minuto e 68 0C por 3 minutos, seguido por uma eta- pa final de 68 0C por 7 minutos. Foi determinada a quantidade máxima de molde que ainda mostra faixa linear de amplificação. Para isto, diluições em série de molde foram adiciona- das às reações de PCR, material de DNA amplificado correu em um gel de agarose e produ- tos de PCR foram quantificados usando software ImageQuant. Tipicamente, 100 a 200 ng de molde por 50 μ\. de reação de PCR fornece produtos na faixa linear de amplificação. 16 a 32 reações de PCR foram agrupadas e purificaram este molde 4C usando o sistema de re- moção de nucleotídeo QIAquick (250) (Qiagen). Molde 4C purificado foi marcado e hibridi- zado em arranjos, de acordo com protocolos ChIP-chip padrões (Nimblegen Systems of Ice- land, LLC). DNA genômico marcados diferencialmente, que foi digerido com a enzima primá- ria e secundária usada no procedimento 4C, serviu como um molde controle para corrigir as diferenças nas eficiências de hibridização. Para cada experimento duas amostras indepen- dentemente processadas foram marcadas com orientações de corante alternadas. Seqüências de iniciador 4C usadas:
HS2: Si-Acttcctacacattaacgagcc-S',
5'- GCTGTTATCCCTTTCTCTTCTAC-3'
Rad23A: 5'- TCACACGCGAAGTAGGCC-3',
5'- CCTTCCTCCACC ATGATGA-3'
jff-principal: 5'-AACGCATTTGCTCAATCAACTACTG-3', 5'-GTTGCT CCT CACATTT GCTT CT GAC-3'
Arranjos 4C
Arranjos e análise foram baseados na construção m34 de NCBI. Sondas (60-mers) foram selecionadas das seqüências 100 bp à montante e à jusante de sítios Hind\\\. O con- 5 teúdo de CG foi otimizado no sentido de 50 %, para sinais de hibridização uniformes. Para impedir hibridização cruzada, sondas que tiveram qualquer similaridade com repetições al- tamente abundantes (RepBase 10,09)3 foram removidas do conjunto de sonda. Além do mais, sondas que dão mais que duas colisões BLAST no genoma foram também removidas do conjunto de sonda. Alinhamentos da seqüência foram realizados usando MegaBLAST 10 (Zhang et al. (2000) J Comput Biol 7, 203-14) usando os ajustes padrões. Uma colisão foi definida como um alinhamento de 30 nt ou mais.
Análise dos dados 4C
A razão de sinal amostra 4C-/DNA genômico foi calculada para cada sonda e os dados foram visualizados com software SignaIMap fornecidos por Nimblegen Systems. Os dados foram analisados usando o pacote R (http://www.r-Droiect.ora) Spotfire and Excel. Razões de hibridização não processada apresentaram agrupamentos de 20 a 50 sinais 4C positivos ao longo do molde do cromossomo, Para definir estes agrupamentos, uma média corrida foi aplicada. Vários tamanhos de janela foram usados, variando de 9 a 39 sondas, todos os quais identificaram os mesmos agrupamentos. Os resultados mostrados foram ba- seados em um tamanho de janela de 29 sondas (em média 60 kb) e foram comparados com a média corrida realizada através de dados aleatórios. Isto foi feito para cada arranjo sepa- radamente. Consequentemente, todas as medições foram apreciadas com relação à ampli- tude e ruído de tal arranjo específico. A Taxa de falsa descoberta (FDR), definida como (número de falsos positivos) / (número de falsos positivos + número de positivos verdadei- ros) foi determinada da maneira a seguir: (número de positivos no conjunto aleatório) / (nú- mero de positivos nos dados). O nível do patamar foi determinado usando uma abordagem de cima para baixo para estabelecer o valor mínimo para cada: FDR < 0,05.
Em seguida, experimentos de duplicatas biológicas foram comparados. Janelas que atendem o patamar em ambas duplicatas foram consideradas positivas. Durante a compa- ração dos dados aleatórios, nenhuma janela esteve acima do patamar em ambas duplicatas. Janelas positivas diretamente adjacentes no molde do cromossomo foram unidas (não foi permita nenhuma folga), criando áreas positivas.
Análise de expressão
Para cada tecido, três microarranjos independentes foram realizados de acordo com o protocolo Affymetrix (2 arranjos - 430 camundongos). Dados foram normalizados u- sando RMA cat-ools; www.bioconductor.org) e para cada sonda-conjunto a média das medi- ções foi calculada dos três microarranjos. Além do mais, quando múltiplos sonda-conjuntos representaram o mesmo gene, a média deles foi também calculada. Masõcalls (Affy library: www.bioconductor.org) foi usado para estabelecer chamadas "presentes", "ausentes" e "marginais". Genes com uma chamada "presente" em todos os três arranjos e um valor de expressão maior que 50 foram chamados expressos. "Genes específicos de fígado fetal" 5 foram classificados como genes que atendem seu critério de ser expresso no fígado fetal e teve valores de expressão mais que cinco vezes maior comparados ao cérebro fetal. Para fornecer uma medida da atividade transcricional total em torno de cada gene, uma soma da corrida foi aplicada. Para isso, foram usados valores de expressão log-transformados. Para cada gene foi calculada a soma de expressão de todos os genes encontrados em uma jane- 10 Ia 100 kb à montante do início e 100 kb à jusante do final do gene, incluindo o próprio gene. Valores resultantes para genes ativos de regiões 4C positivas encontradas dentro (n = 124, 123 e 208 respectivamente para HS2 em fígado, Rad23A em cérebro e Rad23A em fígado) foram comparados com os valores obtidos para genes ativos fora das áreas 4C positivas (n= 153, 301 e 186, respectivamente, onde n= 153 corresponde ao número de genes ativos não 15 interagentes, presentes entre a maioria de região interagente centromérica e o telômero do cromossomo 7); os dois grupos foram comparados usando um teste de soma de classifica- ção 4C Wilcoxon de uma cauda.
Sondas FISH
Os clones BAC seguintes (BACPAC Resources Centre) foram usados; RP23- 370E12 para Hbb-1, RP23-317H16 por chr.7a 80,1 Mb (agrupamento de gene OR), RP23- 334E9 para Uros, RP23-32C19 para chr.7 a 118,3 Mb, RP23-143F10 para chr.7 a 130,1 Mb, RP23-470N5 para chr.7 a 73,1 Mb, RP23-247L11 para chr.7 a 135,0 Mb (agrupamento de gene OR), RP23- 136A15 para Rad23A, RP23-307P24 para chr.8 a 21,8 Mb e RP23- 460F21 para chr.8 a 122,4 Mb. Para uma sonda específica do centrômero do cromossomo 7 foi usado clone P1 5279 (Genoma Sistemas Inc.) que anela ao segmento de DNA D7Mit21. Sondas marcadas com iniciador aleatório foram preparadas usando BioPrime Array CGH Genomic Labeling Sistema (Invitrogen). Antes da marcação, o DNA foi digerido com DprtW e purificado com um estojo de DNA clean & concentrator-5 (Zymo research). O DNA digerido (300 ng) foi marcado com SpectrumGreen dUTP (Vysis) ou Alexa fluor 594 dUTP (Molecular Probes) e purificados através de um estojo de purificação GFX PCR DNA e Gel Band (A- mersham Biosciences) para remover nucleotídeos não incorporados. A especificidade das sondas marcadas foi testada em espalhamento de metáfase preparada a partir de células ES murino.
Crvo-FISH
Cryo-FISH foi realizado da maneira descrita antes 5. Resumidamente, E14.5 de fí-
gado e cérebro foram fixados por 20 minutos em paraformaldeído 4 %/HEPES 250 mM, pH 7,5 e cortado em pequenos blocos de tecido, seguido por uma outra etapa de fixação de 2 horas em paraformaldeído 8 % a 4 0C. Blocos de tecido fixados foram imersos em 2,3 M de sacarose por 20 minutos a temperatura ambiente, montados em um suporte de corpo de prova e congelados rápido em nitrogênio líquido. Blocos de tecido foram armazenados em nitrogênio líquido até o seccionamento. Crioseções de Ultrathin de aproximadamente 200 5 mn foram cortados usando um Reichert Ultramicrotome E equipado com crioacessório (Lei- ca). Usando um laço cheio com sacarose, as seções foram transferidas para lamínulas e armazenadas a -20 0C. Para hibridização, as seções foram lavadas com PBS para remover sacarose, tratadas com RNase 250 ng/mL em 2 x SSC por 1 hora a 37 °C, incubadas por 10 minutos em M HCL 0,1, desidratadas em uma série de etanol e desnaturadas por 8 minutos 10 a 80 0C em formamida 70 %/2 x SSC, pH 7,5. Seções foram novamente desidratadas dire- tamente antes da hibridização da sonda. 500 ng de sonda marcada foram co-precipitados com 5 //g de DNA camundongos Cotl (Invitrogen) e dissolvidos em hybmix (formamida 50 %, sulfato de dextrano 10 %, 2 x SSC, tampão de fosfato 50 mM, pH 7,5). As sondas foram desnaturadas por 5 minutos a 95 0C, ré-aneladas por 30 minutos a 37 0C e hibridizadas por 15 pelo menos 40 horas a 37 °C. Após as lavagens de pós-hibridização, os núcleos foram con- tracorados com DAPI 20 ng/mL (Sigma) em PBS/Tween-20 0,05 % e montados em reagente de antidescoloração Prolong Gold (Molecular Probes).
As imagens foram coletadas com um microscópio de epifluorescência Zeiss Axio Imager Zl (x 100 plan apochromat, 1,4 oil objective), equipado com uma câmera CCD e ^ 20 software Isis FISH Imaging System (Metasystems). Um mínimo de alelos 250 /?-globina ou Rad23A foi analisado e pontuado de maneira sobreposta ou não sobreposta com BACs lo- calizados em outro lugar no genoma, por uma pessoa que desconhece a combinação de sonda aplicada às seções. Testes de ajuste replicados (estatística G-) 6 foram realizados para avaliar a significância de diferenças entre valores medidos para regiões 4C positivas 25 versus 4C negativas. O resumo dos resultados é fornecido na Tabela 2.
Embora tenhamos observado diferenças estatisticamente significativas entre fre- quências de interação de fundo (0,4-3,9 %) e verdadeiras (5 a 20,4 %) pode-se ficar claro que frequências medidas por cryo-FISH são menores que aquelas medidas por outros u- sando protocolos FISH diferentes. Seccionamento pode separar alguns Ioci interagentes e 30 crio- medições FISH portanto subestimarão ligeiramente frequências de interação verdadei- ras. Por outro lado, procedimentos FISH 2D e 3D atuais sobrestimarão estas porcentagens por causa da resolução limitada na direção z. No futuro, melhores técnicas de microscopia . em combinação com sondas FISH mais específicas revelarão melhor as frequências de inte-
ração verdadeiras.
35 EXEMPLO 2
A digestão de enzima de restrição do procedimento 3 C (isto é, fixação de formalde- ído, (primário), ré-ligação de fragmentos reticulados de DNA e purificação de DNA) é reali- zada essencialmente da maneira descrita (Splinter et al., (2004) Methods Enzymol. 375: 493-507), produzindo uma mistura de DNA (molde ’3C ') contendo fragmentos de restrição que são ligado em virtude de eles estarem originalmente próximos no espaço nuclear.
PCR inversa é realizado para amplificar todos os fragmentos ligados a um dado fragmento de restrição ('isca'; escolhido em virtude de ele conter um promotor, melhorador, isolante, região de anexação da matriz, origem da replicação ou qualquer outro primeira se- qüência de nucleotídeo(alvo)).
Para isto, círculos de DNA são criados digerindo o molde 3 C com uma enzima de restrição secundária (preferivelmente um cortador freqüente que reconhece a seqüência de 10 tetra ou pentanucleotídeos), seguido por ligação em condições diluídas de maneira que inte- rações intramolecular sejam favorecidas. Para minimizar uma tendência na formação de círculo em virtude da restrição topológica (Rippe et al., (2001) Trends in Biochem. Sciences 26, 733-40), uma enzima de restrição secundária deve ser escolhida que preferivelmente corte a isca a >350-400 bp a partir do sítio de restrição primária. Para aumentar a eficiência 15 de amplificação de PCR inversa e reprodutibilidade, círculos são mais bem Iinearizados an- tes da amplificação de PCR por uma enzima de restrição (por exemplo, um cortador de 6 ou mais bp) que corta a isca entre o sítio de restrição primária e secundária do diagnóstico.
Digestão do molde 3 C com a enzima de restrição secundária, circularização atra- vés da ligação em condições diluídas e linearização de isca contendo círculos são realiza- dos em condições padrões para tais manipulações de DNA para produzir um molde de DNA para amplificação de PCR inversa ('molde 4C1).
Consequentemente, 10 μg de molde 3 C são digeridos em 100 μΙ com 20U da en- zima de restrição secundária (por toda a noite), seguido por inativação térmica da enzima e purificação do DNA. A ligação é realizada em 10 ml_ (1 ng///L DNA) com 50U T4 Iigase (4 25 horas a 16 0C1 30 minutos a RT), seguido por purificação de DNA. Finalmente, linearização dos círculos de interesse é feita em 100 μΐ_ com 20U de enzima de restrição (por toda a noi- te), seguido novamente por purificação do DNA.
Para PCR inversa, dois iniciadores específicos de isca são desenhados, cada qual tão próximo quanto possível do sítio de reconhecimento de enzima de restrição primária e 30 diretamente vizinho à secundária, respectivamente, e cada qual com sua extremidade 3‘ voltada para fora de maneira que a extensão se dê imediatamente através dos sítios de res- trição em um fragmento ligado à isca. PCR inversa com estes iniciadores é preferivelmente realizada em 100 a 400 ng de DNA de molde 4C (por 50 //L de mistura de reação PCR), para incluir um número máximo de eventos de ligação por reação de PCR. Nós realizamos 35 PCR inversa aplicando o Expand Long Molde PCR Sistema (Roche), usando tampão 1 de acordo com os procedimentos do fabricante.
Os ciclos PCR seguinte são realizados: 1. 2 minutos 94 0C
2. 15 segundos 94 0C
3. 1 minuto 55 0C
4. 3 minutos 68 0C
5 5. repetir a etapa 2- 4 29 x (ou algo em torno de 25-40 x)
6. 7 minutos 68 0C
7. extremidade
Eletroforese de gel é realizada para analisar reprodutibilidade entre reações de PCR individuais. Tipicamente, padrões do produto idênticos devem ser obtidos.
10 A fim de obter material suficiente para marcação por iniciação aleatória e hibridiza-
ção do arranjo, múltiplas reações de PCR (cada qual obtida após 30 ciclos de PCR) podem ser agrupadas, (em vez de aumentar o número de ciclos de PCR por reação). Como uma alternativa para marcação iniciada aleatoriamente, nucleotídeos marcados podem ser incor- porados nos últimos ciclos de PCR (por exemplo, 30 ciclos (sem marcação) + 10 ciclos (marcação)).
EXEMPLO 3
Detecção de translocação usando tecnologia 4C
A tecnologia 4C é usada para medir as frequências de interação para uma dada seqüência X presente em um dado cromossomo A em células de um sujeito saudável e em Λ 20 células de um paciente carregando uma translocação simples recíproca entre os cromosso- mos AeB, com o ponto de quebra sendo próximo a seqüência X (da maneira mostrada na Figura 8).
Em células normais esta análise revela sinais elevados de hibridização (isto é, inte- rações freqüentes com X) para (praticamente) cada sonda localizada dentro de 0,2- 10 Mb 25 de seqüência X no cromossomo A (o tamanho real da região cromossômica mostrando for- tes sinais de reticulação depende principalmente da complexidade da amostra que foi hibri- dizada no arranjo). Em outro lugar no mesmo cromossomo A, bem como em outros cromos- somos, não foi observada nenhuma região grande como essa (no molde de DNA linear) de sondas com sinais elevados de hibridização.
30 Em células de paciente entretanto, sinais de hibridização com todas as sondas do
cromossomo A localizadas no outro lado do ponto de quebra são reduzidas por -50 % (uma cópia do cromossomo A está ainda intacta e produzirá sinais normais), enquanto uma con- centração exclusiva (isto é, não presente em células normais) de sinais elevados de hibridi- zação é observada para sondas fazem limite com o ponto de quebra no cromossomo B. De 35 fato, a transição abrupta entre sondas que não mostram sinais fortes de hibridização versus sondas que mostram sinais fortes de hibridização no cromossomo B revela a localização do ponto de quebra no cromossomo B. EXEMPLO 4
Análise dos resultados de tecnologia 4C
A tecnologia 4C foi usada para caracterizar o ambiente genômico da região de con- trole do Iocus β- globina de camundongos (LCR), focando em um fragmento de restrição 5 contendo seu sítio 2 hipersensível (HS2). A LCR é um forte elemento regulatório de transcri- ção específico de eritróide exigido para altos níveis de expressão do gene de /?-globina. O Iocus yS-globina é presente no cromossomo 7 na posição 97 Mb1 onde ele reside em um grande agrupamento de 2,9 Mb dos genes do receptor olfatório que são transcritos apenas em neurônios olfatórios. Interações foram analisadas em dois tecidos: E 14.5 de fígado fetal, 10 onde a LCR é ativa e os genes de /?-globinas são altamente transcritos, e E 14.5 de cérebro fetal, onde a LCR é inativa e os genes de globina são silenciosos. Em ambos tecidos, a grande maioria das interações foi encontrada com as seqüências no cromossomo 7 e muito poucas interações LCR foram detectadas com seis cromossomo não relacionados (8, 10,
11, 12, 13, 14) (Figura 12a). Os sinais mais fortes no cromossomo 7 foram encontrados den- 15 tro de uma região de 5 a 10 Mb centrada em torno da posição cromossômica de /?-globina, de acordo com a idéia de que as frequências de interação são inversamente proporcionais à distância (em pares de base) entre seqüências de DNA ligadas fisicamente. Não foi possível interpretar quantitativamente as interações nesta região. Inferimos que estas seqüências próximas estejam juntas com ^-globina de maneira que frequentemente sua grande sobrer- 20 representação em nossas amostras de hibridização saturou as sondas correspondentes. Isto foi confirmado quando nós realizamos hibridizações com amostras diluídas 1:10 e 1:100 e observamos que a intensidade de sinal foi reduzida nas sondas fora e na borda, mas não dentro desta região (dados não apresentados).
O procedimento 4C produziu altos dados reprodutíveis. A Figura 2b-c razões não processadas de sinais 4C sob sinais de hibridização de controle para duas regiões 1.5 Mb no cromossomo 7, aproximadamente 25 Mb e 80 Mb longe do gene de /?-globina. Neste ní- vel de resolução, os resultados das amostras independentemente processadas foram prati- camente idênticos. Tanto no fígado fetal quanto no cérebro, agrupamentos de sinais positi- vos foram identificados no cromossomo 7, frequentemente em dezenas de localização cro- mossômica de megabases longe da /?-globina. Estes agrupamentos tipicamente consistem em minimamente 20 a 50 sondas com maiores razões de sinal justapostos no molde do cromossomo (Figura 12b-c). Cada sonda no arranjo analisa um evento de ligação indepen- dente. Além disso, apenas duas cópias do fragmento de restrição HS2 estão presentes por célula, cada qual que pode apenas ligar a um outro fragmento de restrição. Portanto, a de- tecção de eventos de ligação independente com 20 ou mais fragmentos de restrição vizi- nhos indica fortemente que o Iocus correspondente fazem contato com a LCR ^-globina em múltiplas células. Para determinar significância estatística destes agrupamentos, dados de experi- mentos individuais foram ordenados em mapas cromossômicos e analisados usando um algoritmo de média corrida com um tamanho de janela de aproximadamente 60 kb. A distri- buição da média corrida de dados embaralhados aleatoriamente foi usada para ajustar um 5 valor do patamar, permitindo uma taxa de falsa descoberta de 5 %. Esta análise identificou 66 grupos no fígado fetal e 45 em cérebro cuja reprodutibilidade foi encontrada em experi- mentos duplicados (Figura 12d-f). Realmente, FISH de alta resolução confirmou que tais agrupamentos representam verdadeiramente os Ioci que interagem frequentemente (ver a seguir).
Assim, a tecnologia 4C identifica Ioci interagentes de longo alcance pela detecção
de eventos de ligação independentes com múltiplos fragmentos de restrição agrupados em uma posição cromossômica.
Uma série completamente independente de experimentos 4C foi realizada com um conjunto de iniciador de PCR inversa diferente que investigou o ambiente genômico do gene 15 β principal, localizado ~ 50 kb à jusante de HS2. No fígado fetal, o gene β principal é alta- mente transcrito e frequentemente colocado em contato pela LCR. Agrupamentos pratica- mente idênticos de interações de longo alcance com β principal como com HS2 foram en- contrados, tanto no fígado fetal quanto em cérebro, substanciando ainda mais que estes Ioci frequentemente fazem contato com o Iocus ^-globina (Figura 16).
EXEMPLO 5
O Iocus β-globina ativo e inativo ocupa ambientes genômicos distintos.
Uma comparação entre os dois tecidos revelou que o Iocus /?-globina ativamente transcrito no fígado fetal interage com um conjunto de Ioci completamente diferente da sua contraparte transcricionalmente silenciosa no cérebro (7=-0,03; correlação de triagem de 25 Spearman) (Figura 12f). Isto excluiu que os resultados tenham sido influenciados pelas composições da seqüência das sondas. No fígado fetal, os segmentos de DNA interagentes foram localizados dentro de uma região 70 Mb centrada em torno do Iocus /?-globina, com a maioria (40/66) localizada em direção ao telômero do cromossomo 7. Em cérebro fetal, os Ioci interagentes foram encontrados em similar ou mesmo grandes distâncias da jff-globina 30 comparada ao fígado fetal e com a grande maioria de interações (43/45) localizadas em di- reção ao centrômero do cromossomo 7. Estes dados demonstraram que o Iocus /?-globina ativo e inativo faz contato com diferentes partes do cromossomo 7.
Seis outros cromossomos (8,10, 11, 12, 13 e 14) foram representados nos microar- ranjos. Sinais de hibridização fortes nestes cromossomos foram raros, apareceram tipica- mente isolado sem o molde de DNA linear e frequentemente foram ausentes dos experimen- tos duplicados. Também, níveis de média corrida através desses cromossomos nunca a reprodutibilidade chegou próximo aos níveis pontuados para cromossomo 7 (Figura 17). Assim, nossos dados mostraram que o Iocus /?-globina principalmente faz contato com os Ioci em outro lugar no mesmo cromossomo, de acordo com a localização preferida deste Iocus dentro do seu próprio território do cromossomo. Notamos que o Iocus σ-globina esteve também presente no arranjo (cromossomo 11) e não pontuou positivo para a interação com 5 /?-globina, de acordo com a recente demonstração pelo FISH que globina a e β de camun- dongos não se encontram frequentemente no espaço nuclear (Brown, J. M. et al. (2006) J CeIIBio1172, 177-87).
A fim de entender melhor a relevância das interações de longo alcance observadas no cromossomo 7, comparamos os Ioci interagentes com as posições cromossômicas dos genes. Além do mais, análise de arranjo de expressão Affymetrix foi realizada para determi- nar a atividade de transcrição nestas posições nos dois tecidos. Embora o tamanho médio de áreas interagentes no fígado fetal e cérebro tenha sido comparável (183 kb e 159 kb, respectivamente), diferenças drásticas foram observadas em seu conteúdo e atividade do gene. No fígado fetal, 80 % dos Ioci interagentes de /?-globina continham um ou mais genes ativamente transcritos, embora no cérebro fetal a grande maioria (87 %) não tenha mostrado nenhuma atividade de gene detectável (Figura 14). Assim, o Iocus /?-globina é embutido em um ambiente genômico muito diferente nos dois tecidos. No cérebro, onde o Iocus não é ativo, ele basicamente faz contato com o Ioci silencioso transcricional localizado em direção ao centrômero do cromossomo 7. No fígado fetal, onde o Iocus é altamente ativo, ele intera- ge preferencialmente com regiões ativamente transcritas localizadas mais proeminentemen- te em direção ao lado telomérico do cromossomo 7. De forma muito importante, a tecnologia 4C identificou tanto Uros quanto Eraf, (~ 30 Mb longe da ^-globina) como genes interagente com o Iocus /?-globina ativo no fígado fetal, de acordo com observações anteriores feitas por FISH (Osborne, C. S. et aí. (2004) Nat Genet 36, 1065-71 (2004)). Interessantemente, em cérebro foram observados dois outros genes do receptor olfatório em contato com os agru- pamentos presentes no cromossomo 7 que foram localizados em cada lado de, e 17 e 37 Mb longe da /?-globina.
Nem todas as regiões transcritas no cromossomo 7 interagem com o Iocus β- globina ativo no fígado fetal. Portanto, pesquisamos um denominador compartilhado exclusi- 30 vãmente pelos Ioci interagentes mas não por outras regiões ativas no fígado fetal. Os genes de /?-globina, Uros e Eraf são todos genes específicos de eritróide que podem ser regulados pelo mesmo conjunto de fatores de transcrição, e é uma idéia atrativa que esses fatores coordenem a expressão de seus genes alvos no espaço nuclear. Comparados os dados do arranjo de expressão Affymetrix de E 14.5 fígado fetal com o do cérebro fetal para identificar 35 genes expressos preferencialmente (>5-vezes mais) no fígado fetal. Como tal, 28 % dos genes ativos no cromossomo 7 foram classificados como "específico de fígado fetal", dos quais 25 % foram encontrados em uma área colocalizada. Assim, não observamos nenhum enriquecimento de genes "específico de fígado fetal" nas áreas colocalizadas. De forma mais muito importante, 49 de 66 (74 %) regiões interagentes não contiveram um "específico de fígado fetal" e conclui-se portanto que nossos dados não mostraram nenhuma evidência para expressão coordenada de genes específicos do tecido no espaço nuclear. Os genes de 5 /?-globina são transcritos em taxas excepcionalmente altas e pergunta-se em seguida se o Iocus preferencialmente interagiu com outras regiões de alta atividade transcricional, sendo tanto genes altamente expressos quanto áreas com uma alta densidade de genes ativos. Usando contagem Affymetrix como uma medida para a atividade do gene, realizamos um algoritmo de soma corrida para medir a atividade transcricional geral dentro de 200 kb regi- 10 ões em torno de genes ativamente transcritos. Esta análise revelou que a atividade transcri- cional em torno de genes interagentes não foi maior que em torno dos genes não interagen- tes ativos no cromossomo 7 (p = 0,9867; soma da triagem 4C Wilcoxon).
EXEMPLO 6
O ambiente genômico de um gene de manutenção é amplamente conservado entre os tecidos
Investigou-se em seguida se um gene que é expresso similarmente em ambos teci- dos também muda seu ambiente genômico. Rad23A é um gene onipresentemente expresso que reside em um agrupamento denso de gene de principalmente de genes manutenção no cromossomo 8. Tanto no E14.5 do fígado fetal quanto no cérebro, este gene e muitos de 20 seus vizinhos diretos são ativo. A análise 4C foi realizada e identificou muitas interações de longo alcance com os Ioci até 70 Mb longe de Rad23A. De forma muito importante, intera- ções com Rad23A foram altamente correlacionadas entre o fígado fetal e cérebro (7=0,73; correlação de triagem de Spearman) (Figura 14a). Uma marca registrada compartilhada desses Ioci foi novamente que eles continham genes ativamente transcritos. Assim, em am- 25 bos tecidos aproximadamente 70 % continham pelo menos um gene ativo (Figura 14b-c). Regiões em torno de genes interagentes apresentaram níveis estatisticamente mais signifi- cativos de atividade do gene comparados com genes ativos em outro lugar no cromossomo, da maneira determinada por um algoritmo de soma corrida (p < 0,001 para ambos tecidos). Assim, diferente do Iocus β-globina, o gene Rad23A que é localizado em uma região rica em 30 gene interage preferencialmente a distância com outras regiões cromossômica de maior atividade transcricional. Observou-se que FISH que a área cromossômica contendo Rad23A reside principalmente na borda (90 %) ou fora (10 %) de seu território de cromossomo (un- published, D. Noordermeer, M. Branco, A. Pombo and W. de Laat). Entretanto, a análise 4C apenas revelou interações intracromossômicas e nenhuma área na reprodutibilidade do 35 cromossomo 7, 10, 11, 12, 13 ou 14 atende nosso critério rigoroso para interação. Assim, Rad23A é principalmente envolvido em interações intra-cromossômica que são similares em dois tecidos muito diferentes. Se Rad23A tem Ioci vizinhos preferidos neste cromossomo não relacionado, ele não interage frequentemente o bastante para ser detectado nas condi- ções usadas aqui para a tecnologia 4C.
EXEMPLO 7
Validação de tecnologia 4C por microscopia de alta resolução
Para validar os resultados obtidos pela tecnologia 4C, experimentos cryo-FISH fo- ram realizados. Cryo-FISH é uma técnica de microscopia recentemente desenvolvida, que tem a vantagem sobre protocolos 3D-FISH atuais que preservam melhor a estrutura ultra nuclear embora ofereça melhor resolução no eixo z pela preparação de crio-seções ultrafi- nas (Branco, M. R. & Pombo, A (2006). PLoS Biol 4, el38). Dados 4C foram verificados me- dindo com que frequência alelos yff-globina ou Rad23A (sempre n > 250) são colocalizados com mais que 15 regiões cromossômica selecionadas em 200 nm de seções ultrafinas pre- paradas de E14.5 de fígado e cérebro. De forma muito importante, todas as frequências de interação medidas por cryo-FISH foram em perfeito acordo com os resultados 4C (Figura 16). Por exemplo, regiões distantes que foram identificadas para interagir com /?-globina pela tecnologia 4C co-localizaram mais frequentemente aquelas áreas intervenientes não detectadas por 4C (7,4 % e 9,7 %, versus 3,6 % e 3,5 %, respectivamente). Também, os dois agrupamentos de gene do receptor olfatório distantes identificados pela tecnologia 4C para interagir com /?-globina no cérebro fetal mas não no fígado pontuou frequências de co- localização respectivamente de 12,9 % e 7 % nas seções no cérebro, versus 3,6 % e 1,9 % no fígado. Em resumo, frequências de colocalização medidas por Ioci positivamente identifi- cados pela tecnologia 4C foram todas significativamente maiores que as frequências medi- das para Ioci de fundo (p<0,05; teste G). Concluímos que a tecnologia 4C identificou fiel- mente Ioci interagentes de DNA. Finalmente, usamos cryo-FISH para demonstrar que Ioci identificados para interagir com ^-globina também frequentemente fazem contato um com o outro. Isto foi verdadeiro para duas regiões ativas separadas por grande distância cromos- sômica no fígado fetal (Figura 17) bem como para dois agrupamentos de genes OR inativos bem separados no cromossomo do cérebro (Figura 16). Interessantemente, contatos fre- qüentes entre estes dois agrupamentos de genes OR distantes foram também encontrados no fígado fetal, onde eles não interagiram com o agrupamento de gene OR que continha o Iocus /?-globina ativamente transcrito. Estes dados indicaram que interações nucleares entre agrupamento de genes OR distintos não foram uma peculiaridade do tecido do cérebro fetal analisado. Tenta-se conjeturar que tais contatos espaciais facilitam a comunicação entre os muitos genes OR exigidos para assegurar que apenas um alelo simples seja transcritos por neurônio olfatório (Shykind, B. (2005) Hum Mol Genet 14 Spec No 1, R33-9.
EXEMPLO 8
Organização nuclear de domínios cromatina ativos e inativos
As observações aqui descritas demonstram que não apenas regiões genômicas ati- vas, mas também inativas formam regiões distintas no espaço nuclear que envolvem muitos contatos de longo alcance, sugerindo fortemente que cada segmento de DNA tenha seu próprio conjunto de interações preferido. Nossos dados sugerem que quando o Iocus /?- globina é mudado, ele abandona um ambiente genômico silencioso transcricional e entra em 5 uma área nuclear onde interações com domínios ativos são favorecidos. Antecipou-se que um reposicionamento drástico como esse mediante ativação transcricional pode bem ser uma marca registrada apenas de genes específicos de tecido que atingem um certo nível de expressão e, de forma muito mais importante, ficam isolados dos outros genes ativos no molde do cromossomo linear, como é o caso de /?-globina. Propõe-se que a rede extensiva 10 de interações de longo alcance que são identificadas tanto entre Ioci genômico inativo quan- to entre ativo, reflete diferenças célula-a-célula nas conformações do cromossomo mais que sendo uma conseqüência de movimentos dinâmicos durante a interfase (Chakalova et al.
(2005) Nat Rev Genet 6, 669-77 (2005). Presumivelmente, diferentes graus de desconden- sação após a divisão celular expulsou as regiões genômicas ativas da cromatina inativa (Gilbert, N. et al. (2004) Célula 118, 555-66 (2004)) e contatos entre Ioci distantes de com- posições de cromatina similares são estabelecidas principalmente através das afinidades entre proteínas ligadas a cromatina. Justaposição espacial entre os Ioci distantes pode ser funcional, mas pode também ser simplesmente a conseqüência do desdobramento padrão de um cromossomo. Embora Ioci individuais possam mover-se em um volume nuclear restri- to, a conformação geral de um cromossomo seria mantida amplamente por todo o ciclo celu- lar e exigiria divisão celular para restabelecimento. Esta idéia está de acordo com estudos de imageamento de célula viva mostrando movimento restrito de Ioci de DNA marcado no interior nuclear (Chubb et al. (2002) Curr Biol 12, 439-45 (2002)) e ajusta bem com estudos mostrando que informação de posição de cromatina nuclear é frequentemente propagada durante a divisão celular sem ser conservada na população de células (Essers, J. et al. Mol Biol Cell 16, 769-75 (2005); Gerlich, D. et al. Cell 112, 751-64 (2003)).
EXEMPLO 9
Demonstração do princípio: tecnologia 4C detecta precisamente deleções em uma amostra do paciente (Figura 19)
A presença de uma deleção presente em um paciente com leucemia da maneira
revelada por 4C usando uma seqüência de nucleotídeos alvo que tanto é em 2 Mb (A) quan- to em 1,3 Mb (B) à montante ('a esquerda') do primeiro ponto de quebra. Note que as dele- ções eausam uma redução de sinais de interação de DNA na região deletada, mas também causam um aumento em frequências de interação DNA:DNA para seqüências diretamente à 35 jusante ('a direita') do último ponto de quebra. Isto é particularmente óbvio quando intera- ções com seqüência de nucleotídeos alvo B são proximamente examinadas (ver gráficos de duas bases). Com base em dados 4C iniciadores foram desenhados em cada lado da região deletada e o ponto de quebra foi identificado por sequenciamento: texto comum é seqüência à montante de deleção, em negrito está indicado um nucleotídeo inserido, grifado é a se- qüência à jusante da deleção.
EXEMPLO 10
Demonstração do princípio: a tecnologia 4C detecta precisamente uma transloca-
ção equilibrada em uma amostra do paciente (Figura 25).
Demonstração de princípios para a detecção de translocações equilibradas. Detec- ção de translocação t(l;7) da maneira descrita em (R. Burnett et al., Blood, Vol 84, No 4 (Au- gust 15), 1994: pp 1232-1236). Seqüências de nucleotídeos alvos flanqueiam o Iocus TCRB no cromossomo 7, com os sinais vermelhos representando interações DNA:DNA com a se- qüência alvo que é localizada à montante do Iocus TCRB, e os sinais azuis representando interações DNA:DNA com a seqüência alvo que é localizada à jusante do Iocus TCRB. São descritos os sinais de DNA interagentes encontrados no cromossomo 1. Painel superior mostra a distribuição de sinal teórico. O painel médio e inferior mostra a distribuição de sinal real. O painel inferior mostra os sinais em uma resolução de sondas justapostas individuais no molde do cromossomo. Note que, no caso de uma translocação equilibrada, seqüências de nucleotídeos alvos que flanqueiam o ponto de quebra apresentarão um conjunto mutua- mente exclusivo de sinais de DNA de interação intercromossômicas que limitam diretamente um do outro no molde do cromossomo linear do cromossomo parceiro de translocação. A „ 20 posição de ponto de quebra sequenciado (descrita em Burnett et al., 1994) é indicada por uma seta no painel inferior.
EXEMPLO 11
Demonstração do princípio: tecnologia 4C detecta precisamente uma translocação não equilibrada em uma amostra do paciente (Figura 27).
25 Detecção de translocações não equilibradas. Detecção de t(4;7) translocação da
maneira descrita em (RJ Galjaard et al., Am J Med Genet Um. 2003 Aug 30;121(2):168-73). Seqüências de nucleotídeos alvos localizada no cromossomo 7; os sinais de DNA interagen- tes descritos são localizados no cromossomo 4. Duas seqüências alvos foram usadas locali- zadas à montante (5') e à jusante (3') do ponto de quebra no cromossomo 7. Sinais de DNA 30 interagentes localizados no cromossomo 4 são indicados (para ambas seqüências alvos em azul). A região entre os agrupamentos de fragmentos de DNA interagentes no cromossomo
4 foi deletada neste paciente. Superior: sinais para o cromossomo 4 completo. Dados 4C do painel inferior: sinais em uma região 11.5 Mb em torno dos pontos de quebra no cromosso- mo 4. Com base nesses dados 4C, o fragmento de restrição Hind\\\ no cromossomo 4 con- 35 tendo o ponto de quebra da translocação foi identificado e usado para mapear o ponto de quebra por sequenciamento. A seqüência é provida no fundo da figura, onde a seqüência sublinhada é do cromossomo 4, em negrito é encontrada tanto no 7 quanto no 4 e sequên- cia comum é do cromossomo 7.
EXEMPLO 12
Identificação de alta resolução rápida de rearranjos genômicos equilibrados pela tecnologia 4C Resumo
Técnicas atuais para estudar na variação genética, não conseguem identificar pre- cisamente rearranjos cromossômicos equilibrados (inversões, translocações), ou não con- seguem identificá-los que precisamente, que frequentemente ocorrem na população huma- na e pode causar doença. Aqui nós demonstramos que tecnologia 4C detecta inversões e 10 translocações equilibradas, bem como translocações e deleções não equilibradas, em uma resolução (~7 kilobases) permitindo sequenciamento imediato dos pontos de quebra. A tec- nologia 4C é usada para caracterizar rearranjos que fundamentam anormalidades congêni- tas e leucemia. O gene LM03 é identificado como um parceiro de translocação inédito do gene β receptor de célula T (TCRB) em leucemia linfoblástica aguda de célula T (T-ALL). 15 Estes resultados estabelecem a tecnologia 4C como uma nova e poderosa ferramenta de pesquisa clínica para a análise precisa de rearranjos genômicos, importante para diagnósti- co de doença, prognóstico e, finalmente, cuidado ideal com o paciente.
Introdução
Rearranjos cromossômicos (deleções, amplificações, inversões, translocações) po- 20 dem ser a causa de doença, particularmente quando eles afetam o gene de expressão em virtude de ganho ou perda de genes, criação de genes de fusão, ou reposicionamento de elementos de DNA regulatórios de transcrição. Rearranjos que surgem na linhagem germi- nal pode dar origem a defeitos congênitos, aqueles no tecido somático podem resultar em neoplasia. Após o término dos projetos de sequenciamento do genoma humano, tem-se 25 agora tornado uma tarefa principal caracterizar variantes estruturais no genoma humano, uma vez que tornou-se cada vez mais claro que a diversidade genômica ocorre naturalmen- te na população humano e pode estar ligada com suscetibilidade a doença (1-6).
Hibridização genômica comparativa com base em microarranjo (arranjo-CGH) é uma abordagem genômica de alta produção amplamente usada que pode detectar amplifi- 30 cações ou deleções cromossômica em uma resolução de poucos kilobases ou ainda menos. CGH baseia-se na medição de mudanças no número de cópia do DNA tais como visto nas deleções ou amplificações e portanto não consegue identificar translocações e inversões que ocorrem sem perda ou ganho de conteúdo de DNA. Desconhece-se com que frequência tais eventos equilibrados ocorrem, mas estima-se que eles constituem até 20 % de todas 35 variações estruturais (7). Atualmente sua detecção depende de grandes abordagens citoge- néticas tais como cariotipagem cromossômica, que tem a desvantagem de que eles omitem eventos (aproximadamente 20 %) e fornecem resolução limitada (máximo 5 a 10 megaba- ses). Isto necessita adicionalmente, de análise de grande mão de obra para identificar a a- berração genética real que fundamenta a doença. Aqui, nós demonstramos que tecnologia de Captura Conformação de Cromatina no Chipe (4C) (8) identifica tanto rearranjos genômi- cos equilibrados quanto não equilibrados em uma resolução (~ 7 kb, ver a seguir) que permi- 5 te clonagem e sequenciamento imediatos dos pontos de quebra cromossômicos. De forma muito importante, esta estratégia de alta resolução exige o uso de um microarranjo simples para triar o genoma total e portanto é barato.
Nossos resultados iniciais com 4C mostraram que qualquer que seja a dobra da cromatina das interações de longo alcance de um dado locus, fragmentos de DNA próximos ao molde do cromossomo linear são sempre capturados mais eficientemente, resultando em sinais de hibridização fortes e frequentemente mesmo saturados para sondas dentro de uma região de pelo menos 5 a 10 megabases em volta da seqüência alvo. Isto é de acordo com a idéia de que os segmentos de DNA localizados muito próximos em uma fibra de cromatina flexível interagirão mais frequentemente (9). Fragmentos locais são também capturados muito mais eficientemente do que segmentos megabases longe que frequentemente laçam em direção à seqüência alvo (8). Captura aleatória de fragmentos de restrição é rara, as demonstrado pela frequência muito baixa de sinais das sondas localizadas nos cromosso- mos não relacionados. Assim, a tecnologia 4C permite reconstruir os mapas físicos de mol- des do cromossomo em torno de seqüências alvos e consequentemente deve também ser capaz de identificar mudanças nesses mapas em decorrência de rearranjos genômicos. Materiais & Métodos Preparação da amostra
Amostra T-ALL dos pacientes e amostras de célula T controle saudável foram ma- nuseados da maneira previamente descrita (Vlierberghe et ah, Leukemia 20, 1245 (Jul, 25 2006); Simonis et ai., Nat Genet 38, 1348 (Nov, 2006)). A linhagem celular transformada por EBV derivada do paciente PAP foi cultivada e manuseada da maneira antes descrita (Simo- nis et al., Nat Genet 38, 1348 (Nov, 2006); Galjaard et al., Am J Med Genet A 121, 168 (Aug 30, 2003).
Desenho do arranjo 4C
As sondas de 60 bp foram desenhadas dentro de 100 bp de um sítio Hind\\\, usan-
do critério descrito previamente que, por exemplo, seleciona apenas seqüências de DNA exclusivas (Simonis et al., Nat Genet 38, 1348 (Nov, 2006)). Para poder cobrir o genoma total com as 400.000 sondas que ajustam no microarranjo NimbIeGen, foi feita uma seleção. Os números de sondas foram primeiramente reduzidos mantendo apenas uma sonda por 35 fragmento Hind\II, em vez de uma em cada lado. Em segundo lugar, as sondas foram sele- cionadas de maneira que o espaçamento das sondas seja tão possível quanto no genoma. análise 4C análise 4C foi realizada da maneira previamente descrita (2), usando as seguintes seqüências iniciadoras:
extremidade 5’ de TCRBCAT G AAG AAACG AG CACCC
CCTT GAT GTTT CT CCCTTT ACC
extremidade 3' de TCRBTGT CAG G CT CTT CT CCT ACAC
GTCGT CCAG AACACT CACC
Centromérico t(4;7)AATCCAGGGCTACTTCCAG CCGTGATGCTATCTGCCA Telomérico t(4;7) TGTTGGAAGACCAGGTGAAG TGTCGTGGAAAGCGAGTG Deleção 9 CAATCCCAGATACATTCCTCATACAAATACTTTCCAAGACTGG AC 3' de TCRAGAATATGTTATGCTTGATCC TTCCATGAGAGAAGTCTAG Os dados 4C foram visualizados usando software SignaIMap. Para criar uma vista do cromossomo total dos dados 4C, uma média corrida com um tamanho de janela de 29 sondas foi calculada usando o pacote R íhttp.7/www.r-proiect.org).xxx
Extremidade pareada de fragmento de restrição-sequenciamento /yg de DNA genômico foi primeiramente digerido em 500 μί. com 10 U de uma enzima que reconhece 6 bases (Hind\\\, Bglll ou EcoRI) (37 0C por 2 horas). As amostras foram purificadas pela extração de fenol-clorofórmio e precipitação de etanol. Subsequen- temente, as amostras foram ligadas em 2 ml_ com 40U de Iigase (Roche) por 4 horas a 16 0C e 30 minutos a 20 0C.
As amostras ligadas foram purificadas por extração de fenol-clorofórmio e precipita- ção de etanol.
Uma segunda digestão foi realizada com uma enzima de restrição que reconhece 4 bases (por exemplo, Nlalll ou DpnU) nas mesmas condições da maneira descrita para a en- zima de reconhecimento 6-base. Ligação subsequente foi também da maneira descrita ante- riormente. As amostras foram purificadas por extração de fenol-clorofórmio e precipitação de etanol. Fragmentos selecionados foram PCR amplificada de 50 a 100 ng de DNA, usando as seguintes condições: 94 0C por 3 minutos, seguido por 30 ciclos de 15 segundos a 94 0C, 1 minuto a 55 0C e 2 minutos a 72 0C e uma etapa final de 7 minutos a 72 0C.
Resultados
Identificação dos pontos de quebra de translocação
Para este teste, a tecnologia 4C foi primeiramente aplicada à linhagem celular HSB- 2 T-ALL, contendo um translocação recíproca t(l;7)(p35;q35) entre o Iocus do receptor β da célula T (TCRB) em 7q35 e o Iocus LCK em Ip35 (10). Dois experimentos 4C independentes foram realizados, cada qual analisando interações com um fragmento de restrição diferente no cromossomo 7 localizado tanto no lado do ponto de quebra no Iocus TCRB quanto a uma distância de 462 kb e 239 kb, respectivamente. Em ambos casos, foram observados sinais de hibridização fortes em torno do Iocus TCRB no cromossomo 7 em uma amostra controle saudável e a amostra HSB-2. A amostra controle não apresentou sinal nem sinal de fundo em todos os outros cromossomos (figura 30A; fig. 33). Ao contrário, a amostra HSB-2 apre- sentou sinais especificamente muito altos adicionais em uma região megabase em Ip35 (fi- gura 30B). Estes sinais representaram os fragmentos de restrição no cromossomo 1 captu- 5 rado pelos dois fragmentos no cromossomo 7 em HSB-2, indicando que partes desses cro- mossomos foram colocadas em proximidade física imediata. A maioria das seqüências alvos de TCRB teloméricos no fragmento de restrições capturado do cromossomo 7 em direção ao lado centromérico do gene LCK no cromossomo 1. Ao contrário, a maioria dos fragmen- tos capturados da seqüência alvo de TCRB centromérico em direção ao lado telomérico de 10 LCK. Isto é de acordo com a orientação da translocação t(l;7). Além disso, os primeiros fragmentos de restrição capturados no cromossomo 1 em ambos experimentos flanqueiam diretamente o ponto de quebra cromossômico previamente identificado. Assim, 4C localiza pontos de quebra de translocação em uma posição entre o par de sondas que representa a transição de fragmentos de restrição não capturados para capturado. Neste caso, os dois 15 experimentos 4C analisando as interações com seqüências alvos de cromossomo 7 identifi- ca cada qual o ponto de quebra no cromossomo 1 envolvido na translocação equilibrada t(l ;7) dentro de 27 kb.
Identificação de inversões
Em seguida, testamos se 4C pode também identificar inversões. Aplicamos a tecno- Iogia 4C a um amostra T-ALL pediátrica do paciente que, com base em estudos de expres- são FISH e microarranjo, foi suspeito de carregar uma inversão no cromossomo 7, inv(7) (pl5q35). Esta anormalidade leva a rearranjo do Iocus TCRB no agrupamento do gene HOXA1 como foi previamente descrito para outros pacientes (11, 12). Novamente dois expe- rimentos foram realizados, usando o mesmo conjunto de fragmento alvos TCRB que identifi- cou a translocação t(l;7) descrita anteriormente. As duas seqüências alvos capturaram efici- entemente muitos fragmentos cobrindo megabases de DNA no outro lado do cromossomo 7 em torno do Iocus HOXA na amostra do paciente 4 apenas (figura. 30C-D). Além disso, ca- da seqüência alvo capturou uma região cromossômica distinta em torno do agrupamento do gene HOXA, indicando que os dois fragmentos são ligados em diferentes partes do cromos- somo 7. A maioria dos fragmentos alvos TCRB 3' capturou a maioria fragmentos HOXA 3', ao passo que a maioria dos fragmentos alvos TCRB 5' capturou a maioria dos fragmentos HOXA 5', revelando assim uma inversão entre os loci. As duas regiões capturadas em torno de HOXA flanqueiam diretamente umas nas outras, mostrando que a inversão foi equilibra- da e não acompanhada por perda (extensiva) de seqüências HOXA. As duas sondas que marcam a transição entre fragmento não capturado e capturado revelaram a posição do ponto de quebra, que localizou uma região de 6 kb próxima ao gene HOXA9 do agrupamen- to HOXA (figura 30D). A confirmação que esta região certamente carrega o ponto de quebra foi obtida por sequenciamento, usando uma abordagem de sequenciamento da extremidade pareada de fragmento de restrição (fig. 34). Concluímos, portanto, que a tecnologia 4C é a primeira abordagem genômica de alta produção que pode detectar translocações e inver- sões equilibradas. A resolução fornecida pela tecnologia 4C permite clonagem imediata dos 5 pontos de quebra. A tecnologia 4C é portanto a primeira técnica que pode detectar eventos genéticos equilibrados em uma alta resolução como essa.
Identificação de translocações não equilibrada
O potencial de tecnologia 4C foi adicionalmente explorado aplicando-o a uma linha- gem celular transformado por EBV derivada de um paciente com Polidactilia pós-axial 10 (PAP). PAP é um distúrbio hereditário dominante autossomal CARACTERIZADO por ulnar extra de dedo fibular. As células do paciente foram previamente CARACTERIZADAS por cariotipagem e FISH para conter uma translocação não equilibrada entre os cromossomos 4 e 7 com uma microdeleção, t(4;7)(pl5.2;q35). Entretanto, a resolução limitada de FISH im- pediu definir a extensão da deleção e as posições exatas dos pontos de quebra (13). Dois 15 experimentos 4G foram realizados, cada qual analisando interações de DNA com um frag- mento alvo localizado em um outro lado da parte rearranjada do cromossomo 7, sendo um dos quais 4 megabases longe do ponto de quebra mais próximo (ver a seguir). Em ambos experimentos, os fragmentos genômicos foram capturados não apenas no cromossomo 7, mas também no cromossomo 4, a 4pl5.2 (figura 31A; fig.35). Ao contrário do que foi encon- 20 trado para a translocação equilibrada, os fragmentos do cromossomo 4 capturados pelas duas seqüências alvos não serão diretamente vizinhos um do outro. Um ponto de quebra foi localizado na posição 17,28 Mb (NCBI 36) e o outro foi encontrado na posição 20,08 Mb do cromossomo 4, mostrando que o translocação t(4;7) foi acompanhada por uma deleção de
2.8 Mb no cromossomo 4. Para verificar que as transições dos fragmentos de restrição de capturados para não capturados de fato marcam as posições dos pontos de quebra, o ponto
de quebra que foi menos óbvio dos dados 4C, localizados a 20,08 Mb, foi clonado e se- quenciado (figura 31B). Isto confirmou a posição do ponto de quebra no cromossomo 4 a
20.08 Mb dentro do o gene SLIT2 e revelou que ele foi rearranjado com uma seqüência in- tergênica no cromossomo 7 que estava 4 Mb longe da seqüência alvo usada para identificar
o ponto de quebra. Isto mostra que seqüências alvos 4C podem capturar fragmentos de DNA e identificar rearranjos mesmo quando os pontos de quebra estão diversos megabases distantes. Quando a análise 4C é direcionada a ambos os lados de um ponto de quebra ge- nômico, ela pode imediatamente identificar se uma translocação ou inversão é equilibrada ou é acompanhada por rearranjos adicionais tais como uma deleção (isto é, não equilibra- 35 da).
Identificação de deleções
Em seguida investigamos se a tecnologia 4C pode identificar uma deleção que não é associada com uma translocação. Para isto, analisamos uma outra amostra de T-ALL pe- driátrica do paciente que, baseado nos dados CGH do arranjo, conteve uma deleção homo- zigota do Ioci p15/p16 em 9p21 de cromossomo 5. O tamanho exato da deleção dos pontos de quebra atuais não foi conhecido. Definimos um fragmento alvo localizado ~2 Mb longe de 5 um dos pontos de quebra estimados. Conforme esperado, foi observada uma região que Iaqueia os sinais da sonda, demarcando a área deletada (figura 31C). Um aumento nos si- nais de hibridização para a região imediatamente à jusante da deleção é observado na a- mostra do paciente versus a amostra controle saudável. Isto se dá em virtude de a região estar em proximidade muito imediata no molde linear do fragmento alvo em virtude da dele- 10 ção. Com base nos dados 4C, foram desenhados os iniciadores de PCR que flanqueiam a região -2Mb deletada que permitiram amplificação nos pontos de quebra; o sequenciamento dos produtos de PCR confirmou as posições dos dois pontos de quebra que flanqueiam a deleção (figura 31 D). Concluímos que a tecnologia 4C pode identificar deleções homozigo- tas. As deleções revelam por si mesmas as regiões contendo menores sinais de hibridiza- 15 ção em combinação com mais seqüências à jusante que mostraram menores sinais de hi- bridização.
Amostra do pacientes não caracterizadas
A tecnologia 4C foi aplicada para a triagem de amostra T-ALL do paciente não ca- racterizada pra rearranjos genéticos associados com o Iocus TCRB ou o Iocus α do receptor de célula T (TCRA). Em T-ALL, frequentemente ocorrem translocações cromossômicas du- rante uma tentativa de recombinação VDJ dos Ioci TCR. As amostras dos cinco pacientes T- ALL, que foram previamente mostradas não carregam qualquer das anormalidades genética recorrentes associadas com T-ALL (dados não apresentados), foram analisada pela tecno- logia 4C, usando um TCRB próximo a seqüência alvo e um TCRA próxima. Nenhuma das amostras apresentaram rearranjos com o Iocus TCRA (dados não apresentados), e quatro das cinco amostras do paciente também não apresentaram nenhum rearranjo com TCRB (fig. 36), que foi subsequentemente confirmado por FISH. Uma amostra do paciente entre- tanto, apresentou uma translocação entre TCRB e o braço p do cromossomo 12 (figura 32 A; fig. 36). Além do mais, observou-se que o paciente carrega uma grande deleção no cro- mossomo 12, que foi confirmado por um experimento oligoarray CGH (dados não apresen- tados). Esta deleção é localizada ~3 Mb distante do ponto de quebra de translocação, no- vamente mostrando que seqüências alvos 4C podem identificar rearranjos em grandes dis- tâncias. A translocação t(7;12)( q35;pl2.3) não foi descrita antes em T-ALL. As duas sondas no cromossomo 12 que marcam a transição entre fragmentos de restrição capturados e não capturados foram 6 kb aparte e localizados logo à jusante apenas do domínio Lim do gene LM03. O sequenciamento da extremidade pareada do fragmento de restrição foi usado para confirmar que estas sondas demarcam a região contendo o ponto de quebra. O sequencia- mento dos pontos de quebra presentes em ambos cromossomos derivados demonstrou que o cromossomo 12 foi rearranjado sem a perda de um nucleotídeo simples, embora a quebra no cromossomo 7 tenha sido acompanhada por um deleção de quase 400 kb de seqüências TCRB (figura 32B). Esta deleção possivelmente se deu em virtude de eventos de deleção 5 associados com a tentativa de recombinação de VDJ do Iocus TCRB. Ambos os pontos de quebra também contiveram pares intervenientes de base de origem desconhecida (4 e 18 bp, respectivamente), que podem representar os nucleotídeos aleatórios que também são normalmente incorporados durante recombinação de VDJ. Interessantemente, a transloca- ção posiciona o melhorador de TCRB 70 kb à jusante do gene LMO-3 (figura 32C), que é 10 comparável a sua posição normal com relação ao TCRB. Dados de expressão do microar- ranjo mostraram que embora LM03 seja normalmente fora da amostra T-ALL do paciente, o gene é altamente expresso nesta amostra T-ALL (figura 37). Os elementos da família de proteína LMO-1 e LMO-2, mas não LM03, foram previamente considerados como parceiros oncogênicos de translocação do TCR Ioci em T-ALL. Interessantemente, observou-se recen- 15 temente que LM03 age como um oncogene em neuroblastoma (14). Assim, a tecnologia 4C aplicada à triagem de amostra do paciente não caracterizada para aberrações genéticas leva a descoberta de uma translocação previamente não detectada e estabeleceu LMO-3 como um oncogene célula T inédito putativo.
Conclusões
Estes dados estabelecem a tecnologia 4C como a primeira abordagem genômica
que pode identificar anormalidades genéticas equilibradas tais como translocações e inver- sões recíprocas. Além do mais, fica claro que a tecnologia 4C pode identificar deleções ho- mozigotas e deleções associadas com translocações. A tecnologia 4C pode também identi- ficar eventos heterozigotos não equilibrados com base em mudanças no número de cópias 25 de DNA capturado. Uma vantagem principal da tecnologia 4C sobre abordagens de sequen- ciamento de extremidade pareada (15) ou mesmo sequenciamento do genoma total (alta produção) é que a identificação de rearranjos equilibrados não se baseia em capturar a se- qüência fragmento simples que carrega o ponto de quebra; em vez disto, a tecnologia 4C identifica rearranjos equilibrados com base na captura de muitos fragmentos cobrindo diver- 30 sas megabases no ponto de quebra. Por exemplo, translocações recíprocas são identifica- das com base na captura de muitos fragmentos que se localizam em uma parte de um cro- mossomo por uma seqüência alvo localizada em um outro cromossomo. Isto torna a tecno- logia mais robusta do que outras abordagens. A resolução de tecnologia 4C é alta e permite a imediata clonagem e sequenciamento dos pontos de quebra genéticos, como foi demons- 35 trado para quatro diferentes rearranjos. Mesmo os pontos de quebra localizados diversos megabases distantes da seqüência alvo podem facilmente ser identificados. A resolução é essencialmente idêntica ao tamanho médio dos fragmentos criados pela enzima de restri- ção. Usando uma enzima que cria menores fragmentos deve ser aumentado ainda mais a resolução desta técnica. A tecnologia 4C pode ser aplicada a todos os tipos celulares tais como células cancerígenas do sangue, tumores sólidos, amniócitos coletados para diagnós- tico pré-natal, etc., desde que células suficientes possam ser isoladas (ou cultivadas) con- 5 tendo DNA intacto. Iniciamos atualmente com cerca de 10 milhões de células, mas esta quantidade pode ser reduzida, uma vez que hibridizamos junções de ligação amplificadas de PCR originando de ~ 0,5 milhões de genomas equivalentes. A tecnologia 4C atual exige triagem de uma seqüência alvo e é portanto particularmente adequada para a triagem de rearranjos próximos dos Ioci frequentemente envolvidos em uma doença, tais como os ge- 10 nes do receptor da célula T em T-ALL ou o receptor de célula B (BCR) Ioci de cadeia pesada e leve em Iinfomas humanos. A técnica é também muito usada para o mapeamento fino de rearranjos fracamente caracterizados, por exemplo, de translocações ou inversões que fo- ram encontradas com base em cariotipagem cromossômica.
Desenho experimental
Este exemplo é com base em uma das diversas tecnologias de sequenciamento de alta produção (Solexa), mas pode ser modificado para ajustar outras plataformas, a fim de usar sequenciamento Solexa (IIIumina) par a análise dos resultados 4C, sequenciamento é
direcionado às junções de ligação. Portanto, os iniciadores de PCR inversa foram desenha- dos para cada seqüência alvo de maneira que eles estejam próximos aos sítios de reconhe- cimento de enzima de restrição primária e secundária analisada. Desenhamos aqui, peque- nos iniciadores de PCR inversa (18-mers) que cada sobreposição parcialmente ou comple- tamente com os sítios de reconhecimento de enzima de restrição primária (HincHW) e secun- 25 dária (DpnW) analisada. O adaptador Solexa e a seqüência de iniciação de seqüências foram adicionados como projeções 5' para os iniciadores de PCR inversa (figura 38).
Três seqüências alvos (iscas) foram selecionadas em cromossomo 7 humano, res- pectivamente na posição 85, 105 e 139 Mb. Os conjuntos iniciadores usados para amplificar os fragmentos capturados por cada uma dessas iscas são da maneira a seguir:
85 Mb:
EXEMPLO 13
15
Sequenciamento Multiplex 4C
iniciador Dpnll-: atgtgactcctctagatc
iniciador
Dpn Il
com
adaptador:
aatgatacggcgaccaccgaacactctttccctacacgacgctcttccgatct- atgtgactcctctagatc
35
iniciador HindUV. ccctgaacctcttgaagct
iniciador HindlW com adaptador: caagcagaagacggcatacga-ccctgaacctcttgaagct 105 Mb:
Iniciador Dpnlh cggcctccaattgtgatc iniciador Dpnll com adaptador:
aatgatacggcgaccaccgaacactctttccctacacgacgctcttccgatct- cggcctccaattgtgatc iniciador HindU- I: gaattgcttttggtaagctt
iniciador Hind\ 11 com adaptador: caagcagaagacggcatacga-gaattgcttttggtaagctt 139 Mb:
Iniciador Dpnll: ttttagccctgacagatc
iniciador DpnII- com adaptador:
aatgatacggcgaccaccgaacactctttccctacacgacgctcttccgatct-ttttagccctgacagatc iniciador H/ndlll-: agtcaaacataagcctaagc
iniciador Hind\ 11- com adaptadores: caagcagaagacggcatacga-agtcaaacataagcctaagc
Cada conjunto de iniciador (com adaptadores) foi usado em uma reação separada de PCR; 3 reações de PCR (usando 200 ng de molde por reação) foram realizadas em con- dições padrões (descritas em Simonis et al., Nature Methods 2007, vol.4, 895-901). O molde 4C foi preparado a partir da linhagem celular HSB-2 T-ALL, contendo uma translocação re- 15 cíproca t(l;7)(p35;q35) entre o Iocus beta receptor de célula T (TCRB) em 7q35 e o Iocus LCK em Ip35 (Burnett, R. C, et al., Blood 84, 1232-6 (1994)). Os produtos de PCR são mos- trados na Figura 39.
Subsequentemente, as reações de PCR foram agrupadas por conjunto de iniciador e purificadas em colunas em branco Amersham. A concentração de DNA foi medida e quan- tidades iguais de material amplificado por cada conjunto de iniciador foram misturadas. Esta mistura foi analisada por sequenciamento Solexa.
Resultados de sequenciamento Solexa
Número total de leituras (uma raia): 4.9 X 10 seqüências.
93 % das seqüências começam com uma das seqüências iniciadoras esperada.
Durante analise dos primeiros 12 pares de base (bp) da junção de ligação Dpnll e
comparando estes 12 pares de base com uma base de dados local contendo todos os frag- mentos genômicos de 12 bp que flanqueiam os sítios Dpnll relevantes no genoma (isto é, aqueles diretamente adjacentes a um sítio HindlU) descobrimos que: 37 % contêm captura exclusivo de 12bp, 34 % contêm captura não exclusivo de 12bp, e 29 % contêm captura não esperado de 12 bp.
De todas as seqüências 4,9 *106: 34 % contiveram iniciador + captura exclusivo, 32% contiveram iniciador + captura não exclusivo. No total portanto 66 % contiveram uma primeira seqüência esperada de* 30 bp.
Por conjunto de iniciador o número total de seqüências e a natureza dessas se- quências são da maneira a seguir: Iniciador do conjunto 1 (85 Mb): Iniciador do conjunto 1
2.23 *106
8.59 *105 captura exclusiva de12bp
(39%)
capturas
diferentes
6.94 *10s captura não exclusiva de12bp
(31%)
4J *104 1.9 *10*
capturas
diferentes
6.78 *105 captura não esperada
(30%)
Iniciadordoconjunto 2 (105 Mb):
Iniciador do conjunto 2:
1.23*10'’
3.48 *10s 5.47 *105 captura captura exclusiva não exclusiva de12bp de12bp
3.35 *10* captura não esperada de12bp
(28%)
(45%) (27%)
2.3 *104 capturas diferentes
1.1 *10*
capturas
diferentes
Iniciadordoconjunto 3 (139 Mb):
Iniciadordoconjunto 3:
1.07 *106
4.75 *1.05 captura
3.10 *105 captura
exclusiva nãoexclusiva de12bp de12bP (44%) (29%)
2.85 *105 captura não esperada de12bp
(27%)
2.7 *104 1.4 "tIO4 capturas capturas diferentes diferentes
Quando seqüências capturadas são colocadas em gráfico nas suas posições cro- mossômicas, os dados são mostrados nas Figuras 40 e 41.
Em resumo, os dados fornecem uma demonstração do princípio para sequencia- mento multiplex-4C. Para cada seqüência, a isca e a seqüência capturada podem ser identi- ficadas. A técnica pode ser adicionalmente melhorada:
1. O sequenciamento pode ser mais bem direcionado para o lado Hind\\\ (em vez de o lado Dpnll); isto impede que eventos de ligação aleatórios a leitura ocorram durante a
segunda etapa de ligação.
2. O uso de menos cortadores de freqüente (7 ou 8 cortadores em vez de 6 corta- dores) aumentaria a distância genômica capturada (coberta) por cada isca.
3. O uso de uma enzima de restrição que não digere o DNA repetitivo (ou é relati- vamente sub-representado em DNA repetitivo) aumentaria o número de leituras interpretá-
veis.
Aspectos Adicionais 1
1. Um método para analisar a frequência de interação de uma seqüência de nucleo- tídeos alvo com uma ou mais seqüências de nucleotídeos (por exemplo, um ou mais Ioci genômicos) compreendendo o uso de uma seqüência de nucleotídeos ou um arranjo de
sondas ou um conjunto de sondas ou um arranjo da maneira aqui descrita.
2. Um método para identificar uma ou mais interações DNA-DNA que são indicati- vos de uma condição da doença particular ou estado do portador compreendendo o uso de uma seqüência de nucleotídeos ou um arranjo de sondas ou um conjunto de sondas ou um arranjo da maneira aqui descrita.
3. Um método de diagnóstico ou prognóstico de uma doença ou síndrome ou esta-
do do portador causados ou associados a uma mudança em um DNA-DNA compreendendo o uso de uma seqüência de nucleotídeos ou um arranjo de sondas ou um conjunto de son- das ou um arranjo da maneira aqui descrita.
4. Um método do ensaio para identificar um ou mais agentes que modulam uma in-
teração DNA-DNA compreendendo o uso de uma seqüência de nucleotídeos ou um arranjo
de sondas ou um conjunto de sondas ou um arranjo da maneira aqui descrita.
5. Um método para detectar a localização de um ponto de quebra (por exemplo, uma translocação) compreendendo o uso de uma seqüência de nucleotídeos ou um arranjo de sondas ou um conjunto de sondas ou um arranjo da maneira aqui descrita.
6. Um método para detectar a localização de uma inversão compreendendo o uso
de uma seqüência de nucleotídeos ou um arranjo de sondas ou um conjunto de sondas ou um arranjo da maneira aqui descrita.
7. Um método para detectar a localização de uma deleção compreendendo o uso de uma seqüência de nucleotídeos ou um arranjo de sondas ou um conjunto de sondas ou
um arranjo da maneira aqui descrita.
8. Um método para detectar a localização de uma duplicação compreendendo o uso de uma seqüência de nucleotídeos ou um arranjo de sondas ou um conjunto de sondas ou um arranjo da maneira aqui descrita.
9. Um método para analisar a frequência de interação de uma seqüência de nucleo- tídeos alvo com uma ou mais seqüências de nucleotídeos de interesse (por exemplo, um ou mais Ioci genômicos) compreendendo a etapa de:
(a) fornecer uma amostra de DNA reticulado;
(b) digerir o DNA reticulado com uma enzima de restrição primária;
(c) ligar as seqüência de nucleotídeos reticuladas
(d) reverter a reticulação;
(e) digerir opcionalmente as seqüências de nucleotídeos com uma enzima de restri-
ção secundária;
(f) ligar opcionalmente a seqüência de nucleotídeos;
(g) amplificar uma ou mais seqüências de nucleotídeos de interesse que são liga- das à seqüência de nucleotídeos alvo usando pelo menos dois oligonucleotídeo iniciadores, em que cada iniciador hibridiza em uma seqüência de DNA conhecida que flanqueia aa se-
quências de nucleotídeos de interesse;
(h) hibridizar a(s) sequência(s) amplificada(s) em um arranjo ou sequenciar as se- qüências amplificadas; e
(i) determinar a frequência de interação entre as seqüências de DNA.
Aspectos Adicionais 2
Ainda adicionalmente os aspectos da presente invenção são apresentados a seguir
nos parágrafos numerados.
1. Um seqüência de nucleotídeos circularizada compreendendo uma primeira e uma segunda seqüência de nucleotídeos separadas pelos sítios de reconhecimento enzima de restrição primária, em que a dita primeira seqüência de nucleotídeos é uma seqüência de
nucleotídeos alvo e a dita segunda seqüência de nucleotídeos é obtenível pela reticulação do DNA genômico.
2. A seqüência de nucleotídeos circularizada de acordo com o parágrafo 1, em que a seqüência de nucleotídeos alvo é selecionada do agrupamento que consiste em um pro- motor, um melhorador, um silenciador, um isolante, uma região de anexação de matriz, uma
região de controle dos locus, uma unidade de transcrição, uma origem de replicação, um ponto quente de recombinação, um ponto de quebra de translocação, um centrômero, um telômero, um região densa em gene, uma região fraca em gene, um elemento repetitivo e um sítio integração (viral).
3. A seqüência de nucleotídeos circularizada de acordo com o parágrafo 1, em que
a seqüência de nucleotídeos alvo é uma seqüência de nucleotídeos que é associada com,
ou causa uma doença, ou é localizada menos que 15 Mb em um molde de DNA linear de um locus que é associado com, ou causa um doença. 4. A seqüência de nucleotídeos circularizada de acordo com os parágrafos 1-3, em que a seqüência de nucleotídeos alvo é selecionada do agrupamento que consiste em: A- MU, MLL1 MYC, BC L, BCR, ABLI, IGH, LYLI, TALI, TAL2, LM02, TCRa/δ, TCRfi e HOX ou outros Ioci associados com doença da maneira descrita em "Catalogue of Unbalanced C-
hromosome Aberrations in Man" 2nd edition. Albert Schinzel. Berlin: Walter de Gruyter, 2001. ISBN 3-11-011607-3.
5. A seqüência de nucleotídeos circularizada de acordo com qualquer dos parágra- fos 1 a 4 em que o sítio de reconhecimento de enzima de restrição primária é um sítio de reconhecimento de 6 a 8 bp, preferivelmente selecionado do agrupamento que consiste em
Bg\\\, HindlU, EcoRI1 fíamlll, Spel, PstI e Ndel.xxx
6. A seqüência de nucleotídeos circularizada de acordo com qualquer dos parágra- fos anteriores, em que o sítio de reconhecimento de enzima de restrição secundária é um sítio de reconhecimento de seqüência de nucleotídeos de 4 ou 5 bp.
7. A seqüência de nucleotídeos circularizada de acordo com qualquer dos parágra- fos anteriores, em que o sítio de reconhecimento de enzima de restrição secundária é locali- zado em mais que cerca de 350bp do sítio de restrição primária.
8. A seqüência de nucleotídeos circularizada de acordo com qualquer dos parágra- fos anteriores, em que a seqüência de nucleotídeos é marcada.
9. Um método para preparar uma seqüência de nucleotídeos circularizada compre- endendo a etapa de:
(a) fornecer uma amostra de DNA reticulado;
(b) digerir o DNA reticulado com uma enzima de restrição primária;
(c) ligar o seqüências de nucleotídeos reticuladas para circularização;
10. Um método de acordo com o parágrafo 9, em que a seqüência de nucleotídeos reticulada é amplificada usando PCR.
11. Um método de acordo com o parágrafo 10, em que a seqüência de nucleotí- deos reticulada é amplificada usando PCR inversa.
12. Um de acordo com o parágrafo 10 ou parágrafo 11, em que o Sistema de PCR Expand Long Molde (Roche) é usado.
Tabela 2
Interação em 4C N % de sobreposi¬ em Cyro- valor de P ção FISH B-globina - C- + 258 7,4 + P < 0,001 hr.7 73,1 Mb B-globina - 254 3,6 Chr.7 80,1 Mb (OR) B-globina - C- 255 3,5 hr.7 118,3 Mb B-globina - C- + 259 6,6 + P <0,001 hr.7 129,9 Mb (Uros) B-globina - C- + 413 9, + P <0,001 hr.7 130,1 Mb B-globina - C- 261 1,9 hr.7 135,0 Mb B-globina - X 258 0,4 D7Mit21 Chr.7 80,1 Mb - X 253 5,9 + P < 0,05 Chr.7 135,0 Mb Chr.7 73,1 Mb - X 254 5,5 + P <0,05 Chr.7 130,1 Mb Rad23A - Chr. 8 + 255 5,9 + P < 0,05 21,8 Mb Rad23A - Chr. 8 + 261 8 + P <0,001 122,4 Mb Interação em 4C N % de sobreposi¬ em Cyro- valor de P ção FISH B-globina - C- 256 3,9 hr.7 73,1 Mb B-globina - + 256 12,9 + P <0,001 Chr.7 80,1 Mb (OR) B-globina - C- 242 4,1 hr.7 118,3 Mb B-globina - C- 263 3 hr.7 130,1 Mb B-globina - C- + 256 7 + P < 0,05 hr.7 135,0 Mb B-globina - 258 6,2 + P < 0,05 D7Mit21 Chr.7 80,1 Mb - 261 5 + P< 0,1 Chr.7 135,0 Mb Rad23A - Chr. 8 260 3,8 21,8 Mb Rad23A - Chr. 8 + 258 8,1 + P < 0,001 122,4 Mb Referências
Blanton J, Gaszner M, Schedl P. 2003. Protein:protein interactions and the pairing of boundary elements in vivo. Genes Dev 17:664-75.
Dekker, J., Rippe, K., Dekker1 M., and Kleckner1 N. 2002. Capturing chromosome
conformation. Science 295: 1306-11.
Drissen R5 Palstra RJ1 Gillemans N, Splinter E1 Grosveld F1 Philipsen S, de Laat W. 2004. The active spatial organization of the beta-globin locus requires the transcription factor EKLF. Genes Dev 18:2485-90.
Horike S, Cai S1 Miyano M1 Cheng JF1 Kohwi-Shigematsu T. 2005. Loss of silent-
chromatin Iooping and impaired imprinting of DLX5 in Rett syndrome. Nat Genet 37:31-40.
Murrell A1 Heeson S1 Reik W. 2004. Interaction between differentially methylated re- gions partitions the imprinted genes Igf2 and Hl 9 into parent-specific chromatin loops. Nat Genet 36:889-93.
Palstra1 R.J., Tolhuis, B., Splinter1 E., Nijmeijer1 R., Grosveld1 F., and de Laat1 W.
2003. The beta-globin nuclear compartment in development and erythroid differentiation. Nat Genet 35: 190-4.
Patrinos1 G.P., de Krom1 M., de Boer1 E., Langeveld1 A., Imam1 A.M.A, Strouboulis, J., de Laat1 W., and Grosveld1 F.G. (2004). Multiple interactions between regulatory regions are required to stabilize an active chromatin hub. Genes & Dev. 18: 1495- 1509.
Spilianakis CG1 Flavell RA. 2004. Long-range intrachromosomal interactions in the T
helpertype 2 cytokine locus. Nat Immunol 5:1017-27.
Tolhuis1 B., Palstra1 R.J., Splinter1 E., Grosveld, F., and de Laat1 W. 2002. Looping and interaction between hypersensitive sites in the active beta-globin locus. Molecular Cell 10: 1453-65.
Vakoc CR5 Letting DL, Gheldof N, Sawado T, Bender MA, Groudine M, Weiss MJ1
Dekker J, Blobel GA. 2005. Proximity among distant regulatory elements at the beta- globin locus requires GATA-I and FOG-I. Mol Cell. 17:453-62
REFERÊNCIAS PARA O EXEMPLO 12
1. Nature 447, 661 (Jun 7, 2007).
2. D. F. Easton et al, Nature 447, 1087 (Jun 28, 2007).
3. L. Feuk1 A. R. Carson, S. W. Scherer1 Nat Rev Genet 7, 85 (Feb, 2006).
4. A. J. Sharp, Z. Cheng, E. E. Eichler, Annu Rev Genomics Hum Genet 7, 407 10
15
- 20
(2006).
5. A. J. Iafrate et al, Nat Genet 36, 949 (Sep, 2004).
6. M. R. Mehan, N. B. Freimer, R. A. Ophoff, Hum Genomics 1, 335 (Aug, 2004).
7. E. E. Eichler et al, Nature 447, 161 (May 10, 2007).
8. M. Simonis et al, Nat Genet 3%, 1348 (Nov, 2006).
9. K. Rippe, Trends Biochem Sei 26, 733 (Dec, 2001).
10. R. C. Burnett, M. J. Thirman, J. D. Rowley, M. O. Diaz, Blood 84, 1232 (Aug 15,
1994).
11. F. Speleman et al, Leukemia 19, 358 (Mar, 2005).
12. J. Soulier et al, Blood 106, 274 (Jul. 1, 2005).
13. R. J. Galjaard etal, Am J Med GenetA 121", 168 (Aug 30, 2003).
14. M. Aoyama et al, Cancer Res 65, 4587 (Jun 1, 2005).
15. E. Tuzun et al, Nat Genet 37, 727 (Jul, 2005).
Todas as publicações mencionadas na especificação anterior estão aqui incorpora- das pela referência. Várias modificações e variações dos métodos e sistemas descritos da invenção serão evidentes aos versados na tecnologia sem fugir do escopo e espírito da in- venção. Embora a invenção tenha sido descrita com relação às modalidades preferidas es- pecíficas, deve-se entender que a invenção reivindicada não deve ser indevidamente limita- da a tais modalidades específicas. De fato, várias modificações dos modos descritos para realizar a invenção que são óbvias aos versados em biologia molecular ou campos relacio- nados estão no escopo das seguintes reivindicações LISTAGEM DE SEQÜÊNCIA <110> Erasmus University Medicai Center
<120> 4C
<130> P031700BR
<140> PCT/IB2008/000625 <141 > 10-01-2008
<150> US 60/999,750
< 151> 11-01-2007
<150> US 60/977,900
<151 > 05-10-2007
<160> 32
<170> Patentln versão 3.4
<210> 1 <211> 22 <212> DNA <213> Artificial
<220>
<223> Iniciador de oligonucleotídeo <400> 1
acttcctaca cattaacgag cc
<210> 2
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo <400> 2
gctgttatcc ctttctcttc tac
<210> 3 <211> 18 <212> DNA <213> Artificial
<220>
<223> Iniciador de oligonucleotídeo <400> 3
tcacacgcga agtaggcc <210> 4 <211> 19
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo
<400> 4
ccttcctcca ccatgatga
<210> 5
<211> 25
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo
<400> 5
aacgcatttg ctcaatcaac tactg
<210> 6
<211> 25
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo
<400 6
gttgctcctc acatttgctt ctgac
<210> 7
<211> 41
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo
<400> 7
catgaagaaa cgagcacccc cttgatgttt ctccctttac
<210> 8 <211> 40 <212> DNA <213> Artificial
<220>
<223> Iniciador de oligonucleotídeo <400> 8 tgtcaggctc ttctcctaca cgtcgtccag aacactcacc
<210> 9 <211> 37
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo
<400> 9
aatccagggc tacttccagc cgtgatgcta tctgcca
<210> 10
<211> 38
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo
<400> 10
tgttggaaga ccaggtgaag tgtcgtggaa agcgagtg
<210> 11
<211> 45
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo
<400> 11
caatcccaga tacattcctc atacaaatac tttccaagac tggac
<210> 12
<211> 39
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo
<400> 12
gaatatgtta tgcttgatcc ttccatgaga gaagtctag
<210> 13 <211> 18 <212> DNA <213> Artificial <220>
<223> Iniciador de oligonucleotídeo <400> 13
atgtgactcc tctagatc 18
<210> 14 <211> 71 <212> DNA <213> Artificial
<220>
<223> Iniciador de oligonucleotídeo <400> 14
aatgatacgg cgaccaccga acactctttc cctacacgac gctcttccga tctatgtgac 60 tcctctagat c 71
<210> 15 <211> 19 <212> DNA <213> Artificial
<220>
<223> Iniciador de oligonucleotídeo <400> 15
ccctgaacct cttgaagct 19
<210> 16 <211> 40 <212> DNA <213> Artificial
<220>
<223> Iniciador de oligonucleotídeo <400> 16
caagcagaag acggcatacg accctgaacc tcttgaagct 40
<210> 17
<211> 18
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo
<400> 17 cggcctccaa ttgtgatc
18 <210> 18 <211> 71 <212> DNA <213> Artificial
<220>
<223> Iniciador de oligonucleotídeo <400> 18
aatgatacgg cgaccaccga acactctttc cctacacgac gctcttccga tctcggcctc 60 caattgtgatc 71
<210> 19
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo
<400> 19
gaattgcttt tggtaagctt 20
<210> 20 <211> 41 <212> DNA <213> Artificial
<220>
<223> Iniciador de oligonucleotídeo <400> 20
caagcagaag acggcatacg agaattgctt ttggtaagct t 41
<210> 21
<211> 18
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo
<400> 21
ttttagccct gacagatc 18
<210> 22 <211> 71 <212> DNA <213> Artificial
<220> <223> Iniciador de oligonucleotídeo <400> 22
aatgatacgg cgaccaccga acactctttc cctacacgac gctcttccga tctttttagc 60 cctgacagat c 71
<210> 23
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Iniciador de oligonucleotídeo <400> 23
agtcaaacat aagcctaagc 20
<210> 24 <211> 41 <212> DNA <213> Artificial
<220>
<223> Iniciador de oligonucleotídeo <400> 24
caagcagaag acggcatacg aagtcaaaca taagcctaag c 41
<210> 25
<211> 157
<212> DNA
<213> Homosapiens
<400> 25
aaggaaaccc catgcccata agacgtcact aatttctgaa ctcttgtttt tttttttttt 60 ttttcaagta gttctcatct aagtagttgt tttttgtcat gagaaaatca gatatgttgc 120 taaaaattca caactattgc aagaaaaaat aaaagac 157
<210> 26
<211> 100
<212> DNA
<213> Homosapiens
<400> 26
ctccaatgta actgtggatt acacctaaaa gagccagaaa acacagactc tctgtggaac 60
catgacacaa cagtgcttgg tattattttt tcctagttag
100 I 7
<210> 27
<211> 60
<212> DNA
<213> Homosapiens
<400> 27
aagagccaga aaacacagac tctctgtgga accatgacac aacagtgctt ggtattattt 60
<210> 28
<211> 50
<212> DNA
<213> Homosapiens
<400> 28
aaaccccatg cccataagac gtcactaatt tctgaactct tgtttttttt 50
<210> 29
<211> 45
<212> DNA
<213> Homosapiens
<400> 29
cgaagaactg ctcattgtag gtcaagtttc aaggtcttga accac 45
<210> 30
<211> 52
<212> DNA
<213> Homosapiens
<400> 30
tctgtgccag cagcttgtgc cgcgagccgg ccgatactct gcctaggact cc 52
<210> 31
<211> 30
<212> DNA
<213> Homosapiens
<400> 31
gaccagggca ttggatttat ttcagagatc 30
<210> 32
<211> 26
<212> DNA
<213> Homosapiens
<400> 32
gatcctgaca ccttagagct aagctt
26

Claims (55)

1. Método para analisar a frequência de interação de duas ou mais seqüências de nucleotídeos alvos com uma ou mais seqüências de nucleotídeos de interesse (por exem- plo, um ou mais Ioci genômicos), CARACTERIZADO pelo fato de que compreendendo as etapas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências de nucleotídeos reticulados; (d) reverter a reticulação; (e) digerir opcionalmente as seqüências de nucleotídeos com uma enzima de restri- ção secundária; (f) ligar opcionalmente uma ou mais seqüências de DNA de composição de nucleo- tídeo conhecida no(s) sítio(s) de digestão de enzima de restrição secundária disponível(s) que flanqueiam uma ou mais seqüências de nucleotídeos de interesse; (g) amplificar uma ou mais seqüências de nucleotídeos de interesse usando pelo menos dois oligonucleotídeos iniciadores, em que cada iniciador hibridiza nas seqüências de DNA que flanqueiam as seqüências de nucleotídeos de interesse usando PCR multiplex; (h) hibridizar a(s) sequência(s) amplificada(s) em um arranjo; e (i) determinar a frequência de interação entre as seqüências de DNA.
2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que a reação de ligação na etapa (c) ou (f) resulta na formação de círculos de DNA.
3. Método, de acordo com a reivindicação 1 ou reivindicação 2, CARACTERIZADO pelo fato de que a etapa (h) compreende a análise de produtos de ligação entre seqüências alvos e seqüências reticuladas de interesse por meio de sequenciamento (por exemplo, o sequenciamento de alto desempenho).
4. Método, de acordo com qualquer das reivindicações anteriores para analisar a frequência de interação de duas ou mais seqüências de nucleotídeos alvos com uma ou mais seqüências de nucleotídeos de interesse, CARACTERIZADO pelo fato de que com- preende o agrupamento de alguns ou todos os produtos de PCR obtidos por cada uma das seqüências alvos na etapa (g) e análise simultânea subsequente de suas interações de DNA.
5. Método, de acordo com a reivindicação 4, CARACTERIZADO pelo fato de que as duas ou mais seqüências amplificadas são marcadas diferencialmente antes do agrupa- mento e análise por hibridização em um arranjo.
6. Método, de acordo com a reivindicação 4 ou reivindicação 5, CARACTERIZADO pelo fato de que as duas ou mais seqüências amplificadas são identicamente marcadas e analisadas por hibridização em um arranjo quando as seqüências residem em cromossomos diferentes.
7. Método, de acordo com a reivindicação 4, CARACTERIZADO pelo fato de que as duas ou mais seqüências amplificadas são identicamente marcadas quando as seqüên- cias residem no mesmo cromossomo em uma distância que é longe o suficiente para sobre- posição mínima entre sinais de interação DNA-DNA.
8. Método, de acordo com qualquer das reivindicações anteriores, CARACTERIZADO pelo fato de que o sequenciamento de alto desempenho é usado para analisar as junções de ligação formadas entre as seqüências alvos e seqüências capturadas de interesse.
9. Método, de acordo com a reivindicação 8, CARACTERIZADO pelo fato de que o sequenciamento é direcionado às junções de ligação formadas entre as seqüências alvos e seqüências capturadas de interesse pela adição de seqüências adaptadoras exigidas para sequenciamento nas extremidades das seqüências amplificadas.
10. Método de acordo com a reivindicação 9, CARACTERIZADO pelo fato de que o sequenciamento é direcionado às junções de ligação formadas entre seqüências alvos e seqüências capturadas de interesse pela adição das seqüências adaptadoras completas ou parte delas exigidas para sequenciamento como projeções 5’ nos oligonucleotídeos iniciado- res usados para amplificar uma ou mais seqüências de nucleotídeos de interesse.
11. Método, de acordo com a reivindicação 9, CARACTERIZADO pelo fato de que o sequenciamento é direcionado às junções de ligação formadas entre seqüências alvos e seqüências capturadas de interesse pela conjugação de uma substância de biotina ou outra fração nos oligonucleotídeos iniciadores usados para amplificar uma ou mais seqüências de nucleotídeos de interesse, seguido por purificação mediada por estreptavidina ou mediada de outra forma do material amplificado por PCR.
12. Método, de acordo com qualquer uma das reivindicações 8 a 11, CARACTERIZADO pelo fato de que o sequenciamento é direcionado às junções de ligação entre seqüências alvos e seqüências capturadas de interesse desenhando os oligonucleotí- deos iniciadores usados para amplificar uma ou mais seqüências de nucleotídeos de inte- resse em 400, 300, 200, 150, 100, 90, 80 70,60, 50, 40, 30, 20, 10, 9, 8, 7, 6 , 5,4, 3, 2, 1 nucleotídeos do(s) sítio(s) de reconhecimento de enzima de restrição primária e/ou secundá- ria analisado(s).
13. Método, de acordo com qualquer uma das reivindicações 8 to 11, CARACTERIZADO pelo fato de que o sequenciamento é direcionado às junções de ligação entre seqüências alvos e seqüências capturadas de interesse desenhado os oligonucleotí- deos iniciadores usados para amplificar uma ou mais seqüências de nucleotídeos de inte- resse, de maneira tal que elas se sobreponham parcial ou completamente com o sítio de reconhecimento de enzima de restrição primária e/ou secundária analisado.
14. Método, de acordo com qualquer uma das reivindicações 8 a 13, CARACTERIZADO pelo fato de que as seqüências são lidas através da junção de ligação de maneira tal que, quando amostras de PCR multiplexadas ou agrupadas são analisadas, seja obtida informação de seqüência suficiente (por exemplo, 12 nucleotídeos ou mais) em qualquer lado da junção de ligação para identificar inambiguamente cada seqüência alvo e cada seqüência capturada de interesse.
15. Método, de acordo com qualquer das reivindicações anteriores, CARACTERIZADO pelo fato de que a seqüência de nucleotídeos alvo é selecionada do grupo que consiste em um rearranjo genômico, promotor, um melhorador, um silenciador, um isolante, uma região de anexação de matriz, uma região de controle de locus, uma uni- dade de transcrição, uma origem de replicação, um ponto quente de recombinação, um pon- to de quebra de translocação, um centrômero, um telômero, uma região densa em gene, uma região pobre em gene, um elemento repetitivo e um sítio de integração (viral).
16. Método, de acordo com qualquer das reivindicações anteriores, CARACTERIZADO pelo fato de que a seqüência de nucleotídeos alvo é uma seqüência de nucleotídeos que está associada ou causa uma doença, ou está localizada em até ou mais que 15 Mb em um molde de DNA linear de um locus que está associado com ou causam uma doença.
17. Método, de acordo com qualquer das reivindicações anteriores, CARACTERIZADO pelo fato de que a seqüência de nucleotídeos alvo é selecionada do grupo que consiste em: AMLI, MLL, MYC, BCL, BCR, ABLI1 IGH1 LYL1, TALI, TAL2, LM02, TCRcr/S, TCR/3 e HOX ou outros Ioci associados com doença descritos em "Catalogue of Unbalanced Chromossome Aberrations in Man" 2nd edition. Albert Schinzel. Berlin: Walter de Gruyter, 2001. ISBN 3-11-011607-3.
18. Método, de acordo com qualquer das reivindicações anteriores, CARACTERIZADO pelo fato de que as seqüências alvos são distribuídas ao longo do mol- de do genoma linear, de maneira tal que as seqüências interagentes cubram um cromosso- mo total ou o genoma.
19. Método, de acordo com qualquer das reivindicações anteriores, CARACTERIZADO pelo fato de que a enzima de restrição primária é uma enzima de restri- ção que reconhece um sítio de reconhecimento de 6-8 bp.
20. Método, de acordo com a reivindicação 19, CARACTERIZADO pelo fato de que a enzima de restrição primária é selecionada do grupo que consiste em Bglll, Hind\\\, BamHI, BamHI, Spa, Pstl e Ndel.
21. Método, de acordo com a reivindicação 19 ou reivindicação 20, CARACTERIZADO pelo fato de que a enzima de restrição primária é selecionada com base em sua ausência ou em representação em seqüências repetitivas.
22. Método, de acordo com qualquer das reivindicações anteriores, CARACTERIZADO pelo fato de que a enzima de restrição secundária é uma enzima de restrição que reconhece um sítio de reconhecimento de seqüência de nucleotídeos de 4 ou bp.
23. Método, de acordo com qualquer das reivindicações anteriores, CARACTERIZADO pelo fato de que o sítio de reconhecimento de enzima de restrição se- cundária está localizado em mais que cerca de 350 bp do sítio de restrição primária na se- qüência de nucleotídeos alvo.
24. Método para analisar a frequência de interação de uma seqüência de nucleotí- deos alvo com uma ou mais seqüências de nucleotídeos (por exemplo, um ou mais Ioci ge- nômicos), CARACTERIZADO pelo fato de que compreende as etapas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências de nucleotídeos reticulados; (d) inverter a reticulação; (e) digerir opcionalmente as seqüências de nucleotídeos com uma enzima de restri- ção secundária; (f) circular as seqüências de nucleotídeos; (g) amplificar uma ou mais seqüências de nucleotídeos que estão ligadas na se- qüência de nucleotídeos alvo; (h) hibridizar opcionalmente as seqüências amplificadas em um arranjo ou analisar as seqüências amplificadas por sequenciamento (por exemplo, o sequenciamento de alto desempenho); e (i) determinar a frequência de interação entre as seqüências de DNA.
25. Método para identificar uma ou mais Interações DNA-DNA que são indicativas de uma condição de doença particular, CARACTERIZADO pelo fato de que compreende as etapa de realizar as etapas (a)-(i) das reivindicações 1-23, em que na etapa (a) uma amos- tra de DNA reticulado é fornecido de uma célula doente e uma não doente, e em que uma diferença entre a frequência de interação entre as seqüências de DNA da células doentes e não doentes indica uma diferença na organização linear dos moldes do cromossomo (por exemplo, um rearranjo genômico), que é indicativo de um traço particular ou condição de doença.
26. Método de diagnose ou prognose de uma doença ou síndrome causada ou as- sociada com uma mudança em uma interação DNA-DNA, CARACTERIZADO pelo fato de que compreende a etapa de realizar as etapas (a)-(i) de acordo com qualquer uma das rei- vindicações 1-23, em que etapa (a) compreende fornecer uma amostra de DNA reticulado de um sujeito; e em que etapa (i) compreende comparar a frequência de interação entre as seqüências de DNA com aquela de um controle não afetado; em que uma diferença entre o valor obtido do controle e o valor obtido do sujeito é indicativa que o sujeito está sofrendo da doença ou síndrome ou é indicativa que o sujeito sofrerá da doença ou síndrome.
27. Método, de acordo com a reivindicação 26, CARACTERIZADO pelo fato de que uma transição de baixas para altas frequências de interação é indicativa do local de um rear- ranjo genético equilibrado e/ou desequilibrado.
28. Método, de acordo com a reivindicação 26, CARACTERIZADO pelo fato de que um padrão inverso de frequências de interação DNA-DNA na amostra em questão compa- rado ao controle é indicativo de uma inversão equilibrada e/ou desequilibrada.
29. Método, de acordo com a reivindicação 26, CARACTERIZADO pelo fato de que uma redução na frequência de interação DNA-DNA na amostra em questão comparada ao controle, em combinação com um aumento na frequências de interação DNA-DNA em regi- ões mais distantes, é indicativa de uma deleção equilibrada e/ou desequilibrada.
30. Método, de acordo com a reivindicação 26, CARACTERIZADO pelo fato de que um aumento ou uma diminuição nas frequências de interação DNA-DNA das amostras em questão comparadas ao controle é indicativo de uma duplicação ou inserção equilibrada e/ou desequilibrada.
31. Método, de acordo com qualquer uma das reivindicações 26-30, CARACTERIZADO pelo fato de que a cariotipagem espectral e/ou FISH é usada antes de realizar o dito método.
32. Método, de acordo com qualquer uma das reivindicações 26-30, CARACTERIZADO pelo fato de que a doença é uma doença genética.
33. Método, de acordo com qualquer uma das reivindicações 26-30, CARACTERIZADO pelo fato de que a doença é câncer.
34. Método de diagnose ou prognose de um doença ou síndrome causada ou asso- ciada com uma mudança em uma interação DNA-DNA, CARACTERIZADO pelo fato de que compreende as etapa de: realizar as etapas (a)-(i) de acordo com qualquer uma das reivin- dicações 1-23, em que etapa (a) compreende fornecer uma amostra de DNA reticulado de um sujeito; e em que o dito método compreende a etapa adicional de: G) identificar um ou mais Ioci que foram submetidos a um rearranjo genômico que está associado com uma do- ença.
35. Método de ensaio para identificar um ou mais agentes que modulam uma inte- ração DNA-DNA, CARACTERIZADO pelo fato de que compreende as etapas de: (a) colocar uma amostra em contato com um ou mais agentes; e (b) realizar as etapas (a) a (i) de acordo com qualquer uma das reivindicações 1-23, em que a etapa (a) compreende fornecer DNA reticulado da amostra; em que uma diferença entre (i) a frequência de interação entre as seqüências de DNA na presença do agente e (ii) a frequência de interação entre as seqüências de DNA na ausência do agente é indicativa de um agente que modula a interação DNA-DNA.
36. Método para detectar o local de um rearranjo equilibrado e/ou desequilibrado (por exemplo, uma translocação), CARACTERIZADO pelo fato de que compreende as eta- pa de: (a) realizar as etapas (a) a (i) de acordo com qualquer uma das reivindicações 1-23; e (b) comparar a frequência de interação entre as seqüências de DNA com aquela de um controle; em que uma transição de altas para baixas frequências de interação DNA-DNA na amostra comparada ao controle é indicativa do local de um ponto de quebra.
37. Método para detectar o local de uma inversão equilibrado e/ou desequilibrado, CARACTERIZADO pelo fato de que compreende as etapas de: (a) realizar as etapas (a) a (i) de acordo com qualquer uma das reivindicações 1-23; e (b) comparar a frequência de interação entre as seqüências de DNA com aquela de um controle; em que um padrão inverso de frequências de interação DNA-DNA da amostra com- parado ao controle é indicativo de uma inversão.
38. Método para detectar o local de uma deleção, CARACTERIZADO pelo fato de que compreende as etapas de: (a) realizar as etapas (a) a (i) de acordo com qualquer uma das reivindicações 1-23; e (b) comparar a frequência de interação entre as seqüências de DNA com aquela de um controle; em que uma redução nas frequências de interação DNA-DNA da amostra compa- rada ao controle é indicativa de deleção.
39. Método para detectar o local de uma duplicação, CARACTERIZADO pelo fato de que compreende as etapas de: (a) realizar as etapas (a) a (i) de acordo com qualquer uma das reivindicações 1-23; e (b) comparar a frequência de interação entre as seqüências de DNA com aquela de um controle; em que um aumento ou uma diminuição nas frequências de interação DNA-DNA da amostra em questão comparado ao controle é indicativo de uma duplicação ou inserção.
40. Método, de acordo com qualquer das reivindicações anteriores, CARACTERIZADO pelo fato de que as seqüências de nucleotídeos interagentes com duas ou mais seqüências alvos são amplificadas.
41. Método, de acordo com a reivindicação 40, CARACTERIZADO pelo fato de que as seqüências alvos estão posicionadas nos Ioci genômicos ou próximas a eles, conhecidos pata estar associados a uma condição de doença.
42. Método, de acordo com a reivindicação 41, CARACTERIZADO pelo fato de que as seqüências alvos são selecionadas sem conhecimento prévio no local de um rearranjo e são espaçadas de maneira tal que as seqüências interagentes cubram um cromossomo completo ou o genoma, e em que as seqüências interagentes identificadas permitem re- construir mapas cromossômicos lineares e rearranjos genômicos que ocorreram nos cro- mossomos e entre eles.
43. Método, de acordo com qualquer uma das reivindicações 40 a 42, CARACTERIZADO pelo fato de que as seqüências amplificadas são marcadas.
44. Método, de acordo com qualquer uma das reivindicações 43, CARACTERIZADO pelo fato de que as seqüências amplificadas são marcadas diferencial- mente de acordo com sua posição no genoma.
45. Método, de acordo com qualquer uma das reivindicações 40 a 44, CARACTERIZADO pelo fato de que é para a detecção de um rearranjo, translocação, in- versão, deleção, duplicação ou inserção equilibrados e/ou desequilibrados.
46. Agente, CARACTERIZADO pelo fato de que é obtido ou obtenível pelo método de ensaio, de acordo com a reivindicação 34.
47. Método para analisar a frequência de interação de uma ou mais seqüências de nucleotídeos alvos com uma ou mais seqüências de nucleotídeos de interesse (por exem- plo, um ou mais Ioci genômicos), CARACTERIZADO pelo fato de que compreende as eta- pas de: (a) fornecer uma amostra de DNA reticulado; (b) digerir o DNA reticulado com uma enzima de restrição primária; (c) ligar as seqüências reticuladas de nucleotídeos; (d) inverter a reticulação; e (e) sequenciar as seqüências de nucleotídeos ligados.
48. Método para determinar a presença de um rearranjo genômico em uma amos- tra, CARACTERIZADO pelo fato de que compreende as etapas de: (a) fornecer uma amostra de ácido nucléico (por exemplo, DNA genômico), em que o dito ácido nucléico compreende uma seqüência de nucleotídeos de seqüência adjacente conhecida no local do rearranjo genômico suspeito; (b) digerir o DNA com uma enzima de restrição primária para formar uma pluralida- de de fragmentos de restrição; (c) purificar opcionalmente os fragmentos de restrição; (d) ligar os fragmentos de restrição para formar DNA circular; (e) purificar opcionalmente o DNA circular; (f) digerir o DNA circular com uma enzima de restrição secundária para formar uma pluralidade de fragmentos de restrição; (g) ligar os fragmentos de restrição para formar DNA circular; (h) amplificar o rearranjo genômico suspeito usando um ou mais iniciadores que hi- bridizam na seqüência de nucleotídeos de seqüência conhecida; e (g) sequenciar o rearranjo genômico suspeito.
49. Método, de acordo com qualquer uma das reivindicações 1 a 45, CARACTERIZADO pelo fato de que a etapa de hibridização etapa pode ser substituída com uma etapa de sequenciamento.
50. Método, de acordo com a reivindicação 47 ou 48, CARACTERIZADO pelo fato de que tanto a seqüência de nucleotídeos alvo quanto a seqüência de nucleotídeos de inte- resse são identificadas por sequenciamento.
51. Método, de acordo com qualquer uma das reivindicações 47 a 50, CARACTERIZADO pelo fato de que as seqüências adaptadoras estão ligadas nos produtos de PCR.
52. Base de dados, CARACTERIZADO pelo fato de que é de seqüências de ácidos nucléicos de cerca de 6-50 pares de bases que flanqueiam diretamente e, opcionalmente, incluem o sítio de reconhecimento de enzima de restrição primária ou o sítio de reconheci- mento de enzima de restrição secundária de cada seqüência alvo.
53. Base de dados, CARACTERIZADO pelo fato de que é de seqüências de ácido nucléico de cerca de 12-50 pares de bases, CARACTERIZADA pelo fato de que flanqueiam diretamente todos os sítios de reconhecimento de enzima de restrição primária relevantes no genoma.
54. Uso da base de dados das seqüências de ácido nucléico da reivindicação 52 ou 53, CARACTERIZADO pelo fato de que é para determinar a posição genômica de cada uma das seqüências capturadas identificadas.
55. Método ou um agente ou uma base de dados ou um uso, CARACTERIZADO pelo fato de que é substancialmente da maneira aqui descrita e com relação a qualquer dos exemplos ou figuras.
BRPI0806565-9A 2007-01-11 2008-01-10 Captura de conformação de cromossomo circular BRPI0806565A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US99975007P 2007-01-11 2007-01-11
US60/999.750 2007-01-11
US97790007P 2007-10-05 2007-10-05
US60/977.900 2007-10-05
PCT/IB2008/000625 WO2008084405A2 (en) 2007-01-11 2008-01-10 Circular chromosome conformation capture (4c)

Publications (1)

Publication Number Publication Date
BRPI0806565A2 true BRPI0806565A2 (pt) 2014-05-06

Family

ID=39609120

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0806565-9A BRPI0806565A2 (pt) 2007-01-11 2008-01-10 Captura de conformação de cromossomo circular

Country Status (10)

Country Link
US (1) US8642295B2 (pt)
EP (1) EP2121977B1 (pt)
JP (1) JP5690068B2 (pt)
CN (1) CN101688237A (pt)
AU (1) AU2008204338B2 (pt)
BR (1) BRPI0806565A2 (pt)
DK (1) DK2121977T3 (pt)
ES (1) ES2634266T3 (pt)
PT (1) PT2121977T (pt)
WO (1) WO2008084405A2 (pt)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1899488B1 (en) * 2005-07-04 2015-09-16 Erasmus University Medical Center Chromosome conformation capture-on-chip (4c) assay
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US9074244B2 (en) * 2008-03-11 2015-07-07 Affymetrix, Inc. Array-based translocation and rearrangement assays
US8825412B2 (en) 2010-05-18 2014-09-02 Natera, Inc. Methods for non-invasive prenatal ploidy calling
DK2496720T3 (da) 2009-11-06 2020-09-28 Univ Leland Stanford Junior Ikke-invasiv diagnose af transplantatafstødning i organ-transplanterede patienter
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
WO2012005595A2 (en) * 2010-07-09 2012-01-12 Wouter Leonard De Laat V3-d genomic region of interest sequencing strategies
CA2826384C (en) 2011-02-04 2020-08-04 The Trustees Of The University Of Pennsylvania A method for detecting chromosome structure and gene expression simultaneously in single cells
US9725765B2 (en) 2011-09-09 2017-08-08 The Board Of Trustees Of The Leland Stanford Junior University Methods for obtaining a sequence
CN108624668B (zh) 2013-02-01 2022-12-02 加利福尼亚大学董事会 用于基因组组装及单体型定相的方法
US9411930B2 (en) 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
EP2971278B1 (en) * 2013-03-15 2022-08-10 The Broad Institute, Inc. Methods for determining multiple interactions between nucleic acids in a cell
KR101672531B1 (ko) * 2013-04-18 2016-11-17 주식회사 젠큐릭스 조기 유방암 예후 예측 진단용 유전자 마커 및 이의 용도
GB2517936B (en) * 2013-09-05 2016-10-19 Babraham Inst Chromosome conformation capture method including selection and enrichment steps
EP3049557B1 (en) 2013-09-27 2021-05-05 University of Washington Methods and systems for large scale scaffolding of genome assemblies
GB201320351D0 (en) * 2013-11-18 2014-01-01 Erasmus Universiteit Medisch Ct Method
RU2717641C2 (ru) 2014-04-21 2020-03-24 Натера, Инк. Обнаружение мутаций и плоидности в хромосомных сегментах
AU2015296029B2 (en) 2014-08-01 2022-01-27 Dovetail Genomics, Llc Tagging nucleic acids for sequence assembly
WO2016053638A1 (en) * 2014-09-30 2016-04-07 Ge Healthcare Bio-Sciences Corp. Method for nucleic acid analysis directly from an unpurified biological sample
WO2016094874A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
WO2016094867A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Protected guide rnas (pgrnas)
WO2016094872A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Dead guides for crispr transcription factors
WO2016106244A1 (en) 2014-12-24 2016-06-30 The Broad Institute Inc. Crispr having or associated with destabilization domains
SG11201706730XA (en) 2015-02-17 2017-09-28 Dovetail Genomics Llc Nucleic acid sequence assembly
GB2554572B (en) 2015-03-26 2021-06-23 Dovetail Genomics Llc Physical linkage preservation in DNA storage
WO2016182893A1 (en) 2015-05-08 2016-11-17 Teh Broad Institute Inc. Functional genomics using crispr-cas systems for saturating mutagenesis of non-coding elements, compositions, methods, libraries and applications thereof
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
WO2016205749A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
EP3666895A1 (en) 2015-06-18 2020-06-17 The Broad Institute, Inc. Novel crispr enzymes and systems
EP3314015A1 (en) 2015-06-24 2018-05-02 Oxford Biodynamics Limited Detection of chromosome interactions
WO2017061861A1 (en) * 2015-10-05 2017-04-13 Koninklijke Nederlandse Akademie Van Wetenschappen Targeted locus amplification using cloning strategies
AU2016341198B2 (en) 2015-10-19 2023-03-09 Dovetail Genomics, Llc Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection
US11492670B2 (en) 2015-10-27 2022-11-08 The Broad Institute Inc. Compositions and methods for targeting cancer-specific sequence variations
US20190233814A1 (en) 2015-12-18 2019-08-01 The Broad Institute, Inc. Novel crispr enzymes and systems
KR20180116377A (ko) 2016-02-23 2018-10-24 더브테일 제노믹스 엘엘씨 게놈 어셈블리를 위한 페이징된 판독 세트의 생성 및 반수체형 페이징
US11286478B2 (en) 2016-04-19 2022-03-29 The Broad Institute, Inc. Cpf1 complexes with reduced indel activity
SG10202010311SA (en) 2016-04-19 2020-11-27 Broad Inst Inc Novel Crispr Enzymes and Systems
IL262946B2 (en) 2016-05-13 2023-03-01 Dovetail Genomics Llc Retrieving long-range grip information from preserved samples
US20210222164A1 (en) 2016-06-29 2021-07-22 The Broad Institute, Inc. Crispr-cas systems having destabilization domain
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
WO2018100381A1 (en) * 2016-12-01 2018-06-07 Oxford Biodynamics Limited Application of epigenetic chromsomal interactions in cancer diagnostics
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
WO2018115802A1 (en) * 2016-12-23 2018-06-28 Oxford Biodynamics Limited Typing method
CN107058484B (zh) * 2016-12-26 2020-06-16 孙涛 一种应用于高通量测序同时检测t细胞和b细胞免疫组库的引物组合及试剂盒
EP3612629A1 (en) 2017-04-18 2020-02-26 The Broad Institute, Inc. Compositions for detecting secretion and methods of use
CA3078675A1 (en) 2017-11-03 2019-05-09 Oxford Biodynamics Limited Genetic regulation
EP3714052A1 (en) 2017-11-21 2020-09-30 Arima Genomics, Inc. Preserving spatial-proximal contiguity and molecular contiguity in nucleic acid templates
CN108804872A (zh) * 2018-06-08 2018-11-13 中国农业科学院农业基因组研究所 利用外切酶组合消除三维基因组学技术噪音的方法及应用
CN109033745A (zh) * 2018-06-08 2018-12-18 中国农业科学院农业基因组研究所 一种消除三维基因组学技术噪音的方法及应用
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
US20210317429A1 (en) 2018-08-20 2021-10-14 The Broad Institute, Inc. Methods and compositions for optochemical control of crispr-cas9
EP3884069A2 (en) 2018-11-20 2021-09-29 Arima Genomics, Inc. Methods and compositions for preparing nucleic acids that preserve spatial-proximal contiguity information
CN109609611A (zh) * 2018-12-26 2019-04-12 上海优甲医疗科技有限公司 一种基于高通量测序技术的基因定量测序方法
US20220205017A1 (en) 2019-05-20 2022-06-30 Arima Genomics, Inc. Methods and compositions for enhanced genome coverage and preservation of spatial proximal contiguity
WO2020236967A1 (en) 2019-05-20 2020-11-26 The Broad Institute, Inc. Random crispr-cas deletion mutant
KR20230016627A (ko) 2020-04-23 2023-02-02 코닌클리즈케 네덜란드세 아카데미 반 베텐샤펜 염색체 근접성 실험에서 구조적 변이 검출
GB202111194D0 (en) * 2021-08-03 2021-09-15 Cergentis B V Method

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL154598B (nl) * 1970-11-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van laagmoleculire verbindingen en van eiwitten die deze verbindingen specifiek kunnen binden, alsmede testverpakking.
US3817837A (en) * 1971-05-14 1974-06-18 Syva Corp Enzyme amplification assay
US3939350A (en) * 1974-04-29 1976-02-17 Board Of Trustees Of The Leland Stanford Junior University Fluorescent immunoassay employing total reflection for activation
US3996345A (en) * 1974-08-12 1976-12-07 Syva Company Fluorescence quenching with immunological pairs in immunoassays
US4275149A (en) * 1978-11-24 1981-06-23 Syva Company Macromolecular environment control in specific receptor assays
US4277437A (en) * 1978-04-05 1981-07-07 Syva Company Kit for carrying out chemically induced fluorescence immunoassay
US4366241A (en) * 1980-08-07 1982-12-28 Syva Company Concentrating zone method in heterogeneous immunoassays
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) * 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) * 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
GB8607679D0 (en) 1986-03-27 1986-04-30 Winter G P Recombinant dna product
US5143854A (en) * 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
ATE244065T1 (de) 1990-12-06 2003-07-15 Affymetrix Inc Verfahren und reagenzien für immobilisierten polymersynthese in sehr grossem masstab
DE69233331T3 (de) 1991-11-22 2007-08-30 Affymetrix, Inc., Santa Clara Kombinatorische Strategien zur Polymersynthese
WO1995011995A1 (en) 1993-10-26 1995-05-04 Affymax Technologies N.V. Arrays of nucleic acid probes on biological chips
US5837832A (en) * 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
US5571639A (en) * 1994-05-24 1996-11-05 Affymax Technologies N.V. Computer-aided engineering system for design of sequence arrays and lithographic masks
US5795716A (en) 1994-10-21 1998-08-18 Chee; Mark S. Computer-aided visualization and analysis system for sequence evaluation
US5599695A (en) 1995-02-27 1997-02-04 Affymetrix, Inc. Printing molecular library arrays using deprotection agents solely in the vapor phase
AU2189397A (en) 1996-02-08 1997-08-28 Affymetrix, Inc. Chip-based speciation and phenotypic characterization of microorganisms
US6126939A (en) 1996-09-03 2000-10-03 Yeda Research And Development Co. Ltd. Anti-inflammatory dipeptide and pharmaceutical composition thereof
CA2481312A1 (en) * 2002-03-08 2003-09-18 The Babraham Institute Tagging and recovery of elements associated with target molecules
EP1899488B1 (en) * 2005-07-04 2015-09-16 Erasmus University Medical Center Chromosome conformation capture-on-chip (4c) assay

Also Published As

Publication number Publication date
PT2121977T (pt) 2017-08-18
WO2008084405A2 (en) 2008-07-17
AU2008204338B2 (en) 2014-03-06
JP2010515449A (ja) 2010-05-13
EP2121977A2 (en) 2009-11-25
US8642295B2 (en) 2014-02-04
WO2008084405A3 (en) 2009-01-29
JP5690068B2 (ja) 2015-03-25
EP2121977B1 (en) 2017-06-21
ES2634266T3 (es) 2017-09-27
AU2008204338A1 (en) 2008-07-17
US20100062947A1 (en) 2010-03-11
AU2008204338A8 (en) 2009-08-06
DK2121977T3 (en) 2017-09-18
CN101688237A (zh) 2010-03-31

Similar Documents

Publication Publication Date Title
BRPI0806565A2 (pt) Captura de conformação de cromossomo circular
DK1899488T3 (en) CHROMOSOM CONFORMATIONS &#34;CAPTURE-ON-CHIP&#34; (4C) -ASSAY
CN116438316A (zh) 用于肿瘤学诊断的无细胞核酸和单细胞组合分析
CN107636169A (zh) 对生物分子进行空间概况分析的方法
JP2016537029A (ja) 三次元dna構造におけるヌクレオチド配列の相互作用を分析する方法
CN108463559A (zh) 肿瘤的深度测序概况分析
WO2007070560A9 (en) Method for identification and monitoring of epigenetic modifications
RU2528247C2 (ru) Способ оценки чувствительности клеток рака легкого к доксорубицину на основании уровней экспрессии маркерных генов и набор для его осуществления
Stanney III et al. Combinatorial action of NF–Y and TALE at embryonic enhancers defines distinct gene expression programs during zygotic genome activation in zebrafish
KR102549013B1 (ko) 췌장암 진단을 위한 메틸화 마커 유전자 및 이의 용도
Class et al. Patent application title: CIRCULAR CHROMOSOME CONFORMATION CAPTURE (4C) Inventors: Wouter De Laat (Rotterdam, NL) Frank Grosveld (Rotterdam, NL) Assignees: Erasmus University Medical Center
JP2009523443A (ja) 癌診断のためのマーカー及び方法
CN101238225A (zh) 染色体构象芯片捕获(4c)测定

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B11B Dismissal acc. art. 36, par 1 of ipl - no reply within 90 days to fullfil the necessary requirements